爬取糗事百科
2018-01-15 19:17
127 查看
任务:爬取糗事百科发布者和发布内容
实现:
糗事百科的段子还是很不错的,下面上代码啦
结果:
实现:
糗事百科的段子还是很不错的,下面上代码啦
# -*- coding:utf-8 -*- import urllib2 import re import sys reload(sys) sys.setdefaultencoding( "utf-8" )
f = open("c.txt", "ab+") page = 1 for page in range(1, 5): url = 'https://www.qiushibaike.com/hot/page/%s/' % page #糗事百科的url user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)' headers = { 'User-Agent' : user_agent } request = urllib2.Request(url,headers = headers) response = urllib2.urlopen(request) content = response.read().decode('utf-8') pattern1 = re.compile(r'<h2>(.*?)</h2>.+?<span>(.*?)</span>',re.S) #正则匹配源代码 items = re.findall(pattern1,content) for item in items: items=re.sub(r'\s','',item[1]) f.write("发布者:"+item[0]+"发布内容:"+items+'\n') f.close()
结果:
相关文章推荐
- 糗事百科
- 糗事百科一点小总结
- [Python]网络爬虫(八):糗事百科的网络爬虫(v0.2)源码及解析
- 零基础写python爬虫之抓取糗事百科代码分享
- 源码推荐(5.26):【XCode插件】蒲公英iOS测试分发平台助手,仿糗事百科 网络请求数据 具有下拉刷新上提加载
- Python爬虫教程——实战一之爬取糗事百科段子
- 用python 爬糗事百科的段子-1
- 玩转python爬虫之爬取糗事百科段子
- 第一个爬虫:爬糗事百科笑话
- Python *** 爬下糗事百科数据
- Python 制作糗事百科爬虫实例
- python抓取糗事百科段子 图片
- 用正则爬取糗事百科的段子
- python网络爬虫--简单爬取糗事百科
- Android实战——jsoup实现网络爬虫,糗事百科项目的起步
- Python爬虫爬取糗事百科段子
- Python爬虫学习,实战一糗事百科(2017/7/21更新)
- python爬取糗事百科
- python爬取糗事百科
- 爬取糗事百科的脚本