python网络爬虫从入门到实践,第四章第二节测试代码
2019-01-02 10:51
639 查看
这里给出的是这本书第四章第二节,即通过浏览器解析动态网页地址爬取评论的代码
import requests from bs4 import BeautifulSoup import json comment_file=open('./comment.txt','w') #获取内容 link="https://api-zero.livere.com/v1/comments/list?callback=jQuery112403463819624416844_1546351564784&limit=10&repSeq=4272904&requestPath=%2Fv1%2Fcomments%2Flist&consumerSeq=1020&livereSeq=28583&smartloginSeq=5154&_=1546351564786" header={"User-Agent":"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36", "Host":"api-zero.livere.com"} comment=requests.get(link,headers=header) #解析 com_text=comment.text com_extract=com_text[com_text.find('{'):-2] com_json=json.loads(com_extract) com_list=com_json['results']['parents'] for x in com_list: user=x['name'] message=x['content'] print(user+":"+message) #存储数据 for i in range(1,6): link_i="https://api-zero.livere.com/v1/comments/list?callback=jQuery112403463819624416844_1546351564784&limit=10&offset="+str(i)+"&repSeq=4272904&requestPath=%2Fv1%2Fcomments%2Flist&consumerSeq=1020&livereSeq=28583&smartloginSeq=5154&_=1546393421446" comment_i=requests.get(link_i,headers=header) json_com_i=json.loads(comment_i.text[comment_i.text.find('{'):-2]) com_i_list=json_com_i['results']['parents'] comment_file.write("第"+str(i)+"页评论"+':\n') for m in com_i_list: user_x=m['name'] message_i=m['content'] comment_file.write(user_x+":"+message_i+'\n') comment_file.close() file_save=open('./webtxt.txt','w',encoding='utf-8') file_save.write(com_text) file_save.close()
相关文章推荐
- python 编程从入门到实践11章 测试代码 11.2测试类11.2.2 修改
- Python从入门到实践-外星人入侵完整代码
- D-Bus入门(四)——QTDBUS代码,实现ofono代码下的python测试文件activite-context的功能
- python敲得代码(从入门到实践书中代码)
- Python 从入门到实践 试一试 参考代码
- python自动化测试开发利器ulipad最佳实践(可写python测试代码也可编写selenium、Appium等) 推荐
- 移动测试之appium+python 入门代码(三)
- python 从入门到实践第四章习题 (高级编程技术 week2-2)
- 移动测试之appium+python 入门代码(四)
- 第四章.-10 Python从入门到实践
- python自动化测试开发利器ulipad最佳实践(可写python测试代码也可编写selenium、Appium等)
- 【Python编程:从入门到实践】第十一章:测试代码
- Python编程从入门到实践 403页外键代码修正
- python网络爬虫入门(六)—— 30余行代码爬取教务网成绩并存入Excel
- python 编程 入门到实践 第四章 列表操作和元祖 (课后题加原书)
- 【day 9】python编程:从入门到实践学习笔记-测试代码(末附练习答案代码)
- Python编程:从入门到实践 项目《外星人入侵》完整代码
- Python编程 从入门到实践 第四章 作业参考答案 (部分)
- python中的sqlalchemy ORM学习测试代码!
- python数据挖掘入门与实践