通过抓取淘宝评论为例讲解Python爬取ajax动态生成的数据
2017-04-05 18:55
891 查看
import sys import re import json import requests import requests url='https://rate.taobao.com/feedRateList.htm?auctionNumId=538039793643&userNumId=2779992133¤tPageNum=6&pageSize=20&rateType=&orderType=sort_weight&attribute=&sku=&hasSku=false&folded=0&ua=154UW5TcyMNYQwiAiwQRHhBfEF8QXtHcklnMWc%3D%7CUm5Ockt%2FQnpHfktxTXBOdCI%3D%7CU2xMHDJ7G2AHYg8hAS8XKQcnCU8uSDRFaz1r%7CVGhXd1llXGhVbVBpXGZaZ1ljVGlLdUxwRH5GfkZzTHZCd0xxS2Uz%7CVWldfS0TMw05AyMfKwslGScNNwMmAHoQeQQ0BG8Tf1hnQmw6bA%3D%3D%7CVmJCbEIU%7CV2lJGSYaOgI6GiYZLRY2DzsFOhomGCMYOAI5DCwQLhIuDjQNN2E3%7CWGFBET8RMQU7BycbJBAtDTQKPwA9az0%3D%7CWWFBET8RMWFZbFV1SXZCfSsLNBQ6FDQMMQ80AFYA%7CWmNeY0N%2BXmFBfUR4WGZeZER%2BRWVbe09vU2k%2F&_ksTS=1490504947774_2145&callback=jsonp_tbcrate_reviews_list' cont=requests.get(url).content.decode("gbk") print(cont) rex=re.compile(r'\w+[(]{1}(.*)[)]{1}') content=rex.findall(cont)[0] print(content) con=json.loads(content,"gbk") print("@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@") for i in range(len(con['comments'])): print(i+1,con['comments'][i]['content'])
#如果中文编码有错误
换成:
print(i+1)
print(con['comments'][i]['content'])详情参见:http://www.jb51.net/article/73780.htm
相关文章推荐
- 通过抓取淘宝评论为例讲解Python爬取ajax动态生成的数据(经典)
- python爬取ajax动态生成的数据 以抓取淘宝评论为例子
- python爬取ajax动态生成的数据 以抓取淘宝评论为例子
- 通过爬取天猫商品评论实例分析Python爬取ajax动态生成的数据
- Jquery 动态生成表单 并将表单数据 批量通过Ajax插入到数据库
- Jquery 动态生成表单 并将表单数据 批量通过Ajax插入到数据库
- Jquery 动态生成表单 并将表单数据 批量通过Ajax插入到数据库
- python+selenium+PhantomJS抓取ajax动态网页数据
- 【开发日记】马桶识别之数据收集,通过Python抓取京东评论图片
- 通过ajax ------后台为前台动态生成html标签,并将后台数据传输到前台(传参)
- 小猪的Python学习之旅 —— 5.使用Selenium抓取JavaScript动态生成数据的网页
- python网络爬虫抓取ajax动态网页数据:以抓取KFC门店地址为例
- Python抓取京东图书评论数据
- python使用spynner抓取动态页面数据
- JS通过ajax方式从数据库动态获取数据的代码
- python 抓取javascript 动态数据
- 如何抓取Js动态生成数据且以滚动页面方式分页的网页
- python使用threading.Thread和Queue通过urllib2.urlopen抓取数据
- python处理scrapy抓取生成的json数据遇到的问题
- 如何抓取Js动态生成数据且以滚动页面方式分页的网页