【python爬虫学习笔记】09 Scrapy爬虫的数据类型及yield关键字
2018-12-14 19:57
621 查看
Yield关键字
yield<—>生成器
生成器是一个不断产生值的函数
包含yield语句的函数是一个生成器
生成器每次产生一个值(yield语句),函数被冻结,被唤醒后再产生一个值
具体使用:
class DemoSpider(scrapy.Spider): name = 'demo' def start_requests(self): urls=[ 'http://python123.io/ws/demo.html' ] for url in urls: yield scrapy.Request(url=url,callback=self.parse) def parse(self, response): fname = response.url.split('/')[-1] with open(fname,'wb') as f: f.write(response.body) self.log('Saved file %s.' % name) pass
Scrapy爬虫的数据类型
Request类
class scrapy.http.Request()
Request对象表示一个HTTP请求
由Spider生成,最终由Downloader执行
Response类
class scrapy.http.Response()
Response对象表示一个HTTP响应
由Downloader生成,由Spider处理
Item类
class scrapy.item.Item()
Item对象表示一个从HTML页面中提取的信息内容
由Spider生成,由Item Pipeline处理
Item类似字典类型,可以按照字典类型操作
Scrapy爬虫提取信息的方法
Scrapy爬虫支持多种HTML信息提取方法
-
BeautifulSoup
-
Ixml
-
re
-
XPath Selector
-
CSS Selector
a:标签名称
href:标签属性
相关文章推荐
- python学习笔记(一)运行,输入输出,数据类型
- Python学习笔记之数据类型
- python爬虫:使用Mongodb数据库存储数据学习笔记
- Python学习笔记之数据类型总结
- Python学习笔记(一)--数据类型
- c语言学习笔记之数据类型、关键字
- python学习笔记4-数据类型-数字
- python爬虫框架scrapy学习笔记
- ★★★★[转载]Python学习笔记一:数据类型转换★★★★
- python 学习笔记1——数据类型、字符串、运算符
- python学习笔记(一) 基本数据类型及运算
- python之数据类型(学习笔记二)
- 【python学习笔记】4.数据类型和变量
- Python学习笔记(二)Python的数据类型和变量
- Python爬虫框架Scrapy 学习笔记 5 ------- 使用pipelines过滤敏感词
- Python学习笔记---变量与数据类型
- 【python学习笔记二】基本数据类型
- python学习笔记(二)——数据类型
- Python学习笔记 数据类型
- 小甲鱼:Python学习笔记001_变量_分支_数据类型_运算符等基础