Python快速开发分布式搜索引擎Scrapy精讲—css选择器
2019-09-03 20:21
1346 查看
css选择器
1、
2、
3、
::attr()获取元素属性,css选择器
::text获取标签文本
如果你依然在编程的世界里迷茫,可以加入我们的Python学习扣qun:784758214,看看前辈们是如何学习的。交流经验。从基础的python脚本到web开发、爬虫、django、数据挖掘等,零基础到项目实战的资料都有整理。送给每一位python的小伙伴!分享一些学习的方法和需要注意的小细节,点击加入我们的 python学习者聚集地
举例:
extract_first('')获取过滤后的数据,返回字符串,有一个默认参数,也就是如果没有数据默认是什么,一般我们设置为空字符串
extract()获取过滤后的数据,返回字符串列表
# -*- coding: utf-8 -*- import scrapy class PachSpider(scrapy.Spider): name = 'pach' allowed_domains = ['blog.jobbole.com'] start_urls = ['http://blog.jobbole.com/all-posts/'] def parse(self, response): asd = response.css('.archive-title::text').extract() #这里也可以用extract_first('')获取返回字符串 # print(asd) for i in asd: print(i)
相关文章推荐
- Python快速开发分布式搜索引擎Scrapy精讲—css选择器
- 22、Python快速开发分布式搜索引擎Scrapy精讲—scrapy模拟登陆和知乎倒立文字验证码识别
- Python快速开发分布式搜索引擎Scrapy精讲—Requests请求和Response响应介绍
- Python+Django+Eclipse 在Windows下快速开发自己的网站
- Python开发之快速搭建自动回复微信公众号功能
- 从零开始,使用python快速开发web站点(1)
- 快速搭建python机器学习开发环境(Windows)
- Python+Django+Eclipse 在Windows下快速开发自己的网站
- Python 3网络爬虫开发实战+精通Python爬虫框架Scrapy学习资料
- Python的快速web开发
- window:eclipse+python+pip+Twisted+scrapy配置,开发python项目
- 从零开始,使用python快速开发web站点(1)
- Python自动化开发学习-分布式爬虫(scrapy-redis)
- Python抓取框架Scrapy快速入门教程
- Python快速开发入门重点笔记
- 快速了解Python开发中的cookie及简单代码示例
- 从零开始,使用python快速开发web站点(1)
- python快速开发Web之Django
- Python 爬虫框架 Scrapy 快速使用
- opencv+opencv_contrib 人脸识别和检测 python开发环境快速搭建(30分钟)图文教程