您的位置:首页 > 编程语言 > Python开发

python-09:第一个实践-爬取糗事百科段子

2015-11-24 00:00 369 查看
学到这里我已经迫不及待的想要找一个实例来练练手了,实际上,我们所学的知识已经足够了
接下来就是该选什么实例的问题了,而且这个实例还得满足以下要求
1. 作为第一个实践的实例,我不希望它打击到我的自信心和积极性,所以它不能太难
2. 用我们现在具有的知识能够写出来的,同时又需要加上新的东西来实现更高级的功能
3. 最好有源码对照

网上很多符合条件的实例,大家可以自己去找,我这里采用的是伯乐在线的实例
http://python.jobbole.com/81351/
但是做为我们入门的第一个实例,我觉得它的交互部分太难了,我希望把难度降低,所以我们只需要爬取网页的源码并将发布者,段子内容,点赞数,评论数 这些信息显示出来
那么接下来要做的第一件事就是对这个项目进行分析

实例名称:爬取糗事百科段子

实例目标:
1.抓取糗事百科热门段子
2.显示段子发布人,段子内容,点赞数和评论数的信息

实例分析:
1. 将网页源码爬取下来
2. 因为不能显示图片,我们需要想办法将段子中的图片过滤掉
3. 为了使所有的信息能分类好再输出,所以我们需要对输出做一些操作
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  python 爬虫