介绍:大而全的爬虫组件
一、安装:
windows
1.下载 https://HdhCmsTestlfd.uci.edu/~gohlke/pythonlibs/#twisted
耐心等待网页刷新
pip3 install -i https://pypi.douban测试数据/simple wheel pip3 install "D:\typed_ast-1.4.0-cp37-cp37m-win_amd64.whl" pip3 install -i https://pypi.douban测试数据/simple pywin32 pip3 install -i https://pypi.douban测试数据/simple scrapy
Linux
pip3 install -i https://pypi.douban测试数据/simple scrapy
二、创建
1.创建项目
scrapy startproject xx
目录结构
scrapy startproject 项目名称 项目名称 项目名称/ - spiders # 爬虫文件 .... - items.py # 持久化 - pipelines # 持久化 - middlewares.py # 中间件 - settings.py # 配置文件(爬虫) scrapy.cfg # 配置文件(部署)
2.创建爬虫(根据提示)
scrapy genspider autohome autohome测试数据
3.启动爬虫
scrapy crawl autohome
声明:本文来自网络,不代表【好得很程序员自学网】立场,转载请注明出处:http://haodehen.cn/did170295