您的位置：首页 > 其它

scrapy爬虫框架简单实例

2018-10-06 17:36 330 查看

声明：初学scrapy，总结学习内容。

一、安装scrapy

一、安装scrapy

[code]pip install scrapy

二、创建工程

[code]scrapy startproject mySpider                 #创建scrapy工程
cd mySpider                                  #进入工程目录
scrapy genspider itcast "www.itcast.cn"      #创建爬虫（spider名不能与project名相同）

三、编写代码

3.1 item文件编写

items用于存储字段的定义。即爬取的内容存与item类中。

3.1 spider文件编写

3.2 pipeline文件编写

pipeline文件用于存储到文件中。

3.3 setting文件修改

其他配置暂且不用修改，只修改pipeline配置。

四、测试

[code]scrapy crawl itcast                        #运行爬虫

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航