您的位置：首页 > 编程语言 > Python开发

scrapy爬豆瓣电影

2015-06-19 00:04 597 查看

usage:

scrapy crawl first

一、抓取效果

二、源码下载
http://download.csdn.net/detail/wxq714586001/8821149
三、总结

done:

1、解决了将unicode字符串(类似于‘\uxxx\n\t\t’)转换为实际的文字，困扰了很久。

2、用正则表达式替换字符串。

3、scrapy的基本使用方法。

todo:

1、爬了一段时间就被豆瓣禁了。

2、存储了一些无效的链接。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： python scrapy douban

相关文章推荐

新的分享

章节导航

添加评论
分享网址
分享文章
返回顶部