python scrapy 小白入门笔记(一)
2017-11-14 13:05
267 查看
1.安装
unbuntu 16.04 lts下直接pip3 install scrapy
2.创建项目
scrapy startproject projec_name
3.目录层级
project_name
project_name
__init__.py
items.py(继承scrapy.items类,用于存储item)
middlewares.py(???)
piplines.py(管道,还没用上)
__pycahe__
settings.py(设置,目前没什么卵用)
spiders(爬虫所在)
__init__.py
__pycahe__
scrapy.cfg(配置文件)
4.步骤:
(1):确定爬取目标,a web and web item
(2):修改items.py 属性 = scrapy.Field()
(3):创建爬虫,scrapy genspider spider_name "域名“
(4):填充start url,parse函数处理每个url 返回的 response
(5):scrapy crawl spider_name 执行
5.总结
安装顺利,理解和调用上有一定难度,不知道能否处理动态网页ajax异步等等,慢慢学。QAQ要找个实习做,赶紧补点知识。
unbuntu 16.04 lts下直接pip3 install scrapy
2.创建项目
scrapy startproject projec_name
3.目录层级
project_name
project_name
__init__.py
items.py(继承scrapy.items类,用于存储item)
middlewares.py(???)
piplines.py(管道,还没用上)
__pycahe__
settings.py(设置,目前没什么卵用)
spiders(爬虫所在)
__init__.py
__pycahe__
scrapy.cfg(配置文件)
4.步骤:
(1):确定爬取目标,a web and web item
(2):修改items.py 属性 = scrapy.Field()
(3):创建爬虫,scrapy genspider spider_name "域名“
(4):填充start url,parse函数处理每个url 返回的 response
(5):scrapy crawl spider_name 执行
5.总结
安装顺利,理解和调用上有一定难度,不知道能否处理动态网页ajax异步等等,慢慢学。QAQ要找个实习做,赶紧补点知识。
相关文章推荐
- python 爬虫 学习笔记(一)Scrapy框架入门
- 编程小白的第一本 python 入门书 学习笔记01 第二章 安装Python环境
- 编程小白的第一本 python 入门书 学习笔记02 第三章 变量与字符串
- 编程小白的第一本 python 入门书 学习笔记04 第五章 循环与判断
- 编程小白的第一本 python 入门书 学习笔记05 第六章 数据结构
- Python(编程小白的第一本 Python 入门书) 学习笔记2——代码练习
- python爬虫入门笔记:用scrapy爬豆瓣
- 小白Python入门笔记(2)
- 笔记|《简明Python教程》:编程小白的第一本python入门书
- 笔记|《简明Python教程》:编程小白的第一本python入门书
- Python 之 Scrapy笔记(1)- 入门篇
- python爬虫入门笔记:用scrapy爬豆瓣
- 编程小白的第一本 python 入门书 学习笔记06 第七章 类与可口可乐
- 编程小白的第一本 python 入门书 学习笔记07 第八章 开始使用第三方类库
- python小白入门学习笔记-爬虫入门
- 学习笔记python入门-安装Scrapy
- Python学习笔记2-入门
- Python入门笔记(2)_ 数据类型及取整运算 round,floor,ceil
- Python入门笔记(Python元组、字典和列表)
- Python小白学习笔记(成长之路)