python-09:第一个实践-爬取糗事百科段子
2015-11-24 00:00
369 查看
学到这里我已经迫不及待的想要找一个实例来练练手了,实际上,我们所学的知识已经足够了
接下来就是该选什么实例的问题了,而且这个实例还得满足以下要求
1. 作为第一个实践的实例,我不希望它打击到我的自信心和积极性,所以它不能太难
2. 用我们现在具有的知识能够写出来的,同时又需要加上新的东西来实现更高级的功能
3. 最好有源码对照
网上很多符合条件的实例,大家可以自己去找,我这里采用的是伯乐在线的实例
http://python.jobbole.com/81351/
但是做为我们入门的第一个实例,我觉得它的交互部分太难了,我希望把难度降低,所以我们只需要爬取网页的源码并将发布者,段子内容,点赞数,评论数 这些信息显示出来
那么接下来要做的第一件事就是对这个项目进行分析
实例名称:爬取糗事百科段子
实例目标:
1.抓取糗事百科热门段子
2.显示段子发布人,段子内容,点赞数和评论数的信息
实例分析:
1. 将网页源码爬取下来
2. 因为不能显示图片,我们需要想办法将段子中的图片过滤掉
3. 为了使所有的信息能分类好再输出,所以我们需要对输出做一些操作
接下来就是该选什么实例的问题了,而且这个实例还得满足以下要求
1. 作为第一个实践的实例,我不希望它打击到我的自信心和积极性,所以它不能太难
2. 用我们现在具有的知识能够写出来的,同时又需要加上新的东西来实现更高级的功能
3. 最好有源码对照
网上很多符合条件的实例,大家可以自己去找,我这里采用的是伯乐在线的实例
http://python.jobbole.com/81351/
但是做为我们入门的第一个实例,我觉得它的交互部分太难了,我希望把难度降低,所以我们只需要爬取网页的源码并将发布者,段子内容,点赞数,评论数 这些信息显示出来
那么接下来要做的第一件事就是对这个项目进行分析
实例名称:爬取糗事百科段子
实例目标:
1.抓取糗事百科热门段子
2.显示段子发布人,段子内容,点赞数和评论数的信息
实例分析:
1. 将网页源码爬取下来
2. 因为不能显示图片,我们需要想办法将段子中的图片过滤掉
3. 为了使所有的信息能分类好再输出,所以我们需要对输出做一些操作
相关文章推荐
- Python动态类型的学习---引用的理解
- Python3写爬虫(四)多线程实现数据爬取
- 垃圾邮件过滤器 python简单实现
- 下载并遍历 names.txt 文件,输出长度最长的回文人名。
- install and upgrade scrapy
- Scrapy的架构介绍
- Centos6 编译安装Python
- 使用Python生成Excel格式的图片
- 让Python文件也可以当bat文件运行
- [Python]推算数独
- 爬虫笔记
- Python中zip()函数用法举例
- Python中map()函数浅析
- Python将excel导入到mysql中
- Python在CAM软件Genesis2000中的应用
- 使用Shiboken为C++和Qt库创建Python绑定
- python-10:将网页源码爬取下来