您的位置:首页 > 编程语言 > Python开发

Python之定向爬虫Scrapy

2016-07-23 12:55 302 查看
1.Scrapy介绍

Scrapy,Python开发的一个快速,高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据。Scrapy用途广泛,可以用于数据挖掘、监测和自动化测试。
Scrapy吸引人的地方在于它是一个框架,任何人都可以根据需求方便的修改。它也提供了多种类型爬虫的基类,如BaseSpider、sitemap爬虫等。

[b]2.Scrapy安装[/b]

1)安装libxml2:

输入命令:pip install lxml

2) 安装Zope.Interface

输入命令:pip install zope.interface

3)安装Twisted

输入命令:pip install Twisted

4) 安装pyOpenSSL

输入命令:pip install pyOpenSSL

5)安装pywin32

输入命令:pip install win32py

6)安装Scrapy

输入命令:pip install scrapy

3.创建项目

输入命令:scrapy startproject tutorial

这些文件主要是:

scrapy.cfg: 项目配置文件

tutorial/: 项目python模块, 呆会代码将从这里导入

tutorial/items.py: 项目items文件

tutorial/pipelines.py: 项目管道文件

tutorial/settings.py: 项目配置文件

tutorial/spiders: 放置spider的目录
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: