scrapy学习记录0401
2017-04-01 21:02
155 查看
问题:
1.属性中是链接,网页显示是字,如何提取这个字呢?(text()结果如果是网址,可以用string进行转换,如ip.xpath('string(td[5])')[0].extract()?
2.为何我不能再xpath中使用[]的功能?像
td[4]这种
如
ip. xpath('td[4]/text()')[0].extract()
3.爬取的网页浏览器能打开,再cmd里就是403,为没有权限访问此站。 百度股票是403,西刺是500.
待实践:
1.response.css('.stock-bets').css('.bets-name').extract()[0]
历史错误:
1.return scrapy.Request(urls, callback=self.parse_stock)这里的urls不能是列表。
2.忘了写yield也是醉了。用以下代码发现的。
from scrapy.shell import inspect_response inspect_response(response, self)
3.取某标签的值时把标签写错了导致结果为空[].
css/xpath用法总结:
1.区别看清楚了:1)
xpath('//a/@href')与
css('a::attr(href)')
2)
xpath('//title/text()')与
css(title::text)
3)当不只一个属性时,xpath要用contains, css要用*:
1.
xpath('//a[contains(@href,"image")]/@href'</li> <li>2.css(‘a[href*=”image”]::attr(href)’)
</li></ul></li> <li>4)一个属性时:xpath(‘div[@id=”quotesearch”’]/`
相关文章推荐
- scrapy学习记录
- Scrapy学习记录
- 【Scrapy】 Requests 和 Response 学习记录五
- 【Scrapy】 selector 学习记录一(xpath、css)
- 【Scrapy】 Feed exports 学习记录四
- 学习搭建scrapy,记录遇到的问题
- 爬虫框架Scrapy学习记录II--Selector学习
- Scrapy学习系列之Selenium + Chrome + Xpath实践记录
- 【Scrapy】 selector 学习记录三(Selector详细介绍)
- 【Scrapy】学习记录2_爬虫Spider
- 【Scrapy】 selector 学习记录二(re,set)
- 【Scrapy】学习记录1_一个基本的Scrapy项目
- Scrapy爬虫学习中遇到的问题记录
- 【Scrapy】学习记录3_编写简单爬虫
- 【学习记录】利用scrapy爬取论坛图片
- Android Camera 流程学习记录(三)—— Camera hw_get_module() 相关逻辑
- sencha touch权威指南---学习记录1
- CCF计算机软件能力认证试题练习-折点计算(Java参考答案学习记录)
- 《JavaScript权威指南》----第13章 Web浏览器中的JavaScript(1) 学习记录
- 从今天开始记录我的学习