天猫淘宝评论数据抓取
2017-12-07 19:13
375 查看
import requests import re,json import pandas class base(): def __init__(self,url): self.url = url def all_url(self): return [self.url + "%s" % i for i in range(1,100)] def loads_jsonp(self,_jsonp): try: return json.loads(re.match(".*?({.*}).*",_jsonp,re.S).group(1)) except: raise ValueError('Invalid Input') def url_req(self,url): content = requests.get(url).text aa = self.loads_jsonp(content) return aa def taobao_comment(self,data): for i in data['comments']: data = {} data['昵称']=i['user']['nick'] data['评论']=i['content'] info_list.append(data) def tianmao_comment(self,data): for i in data['rateList']: data = {} data['昵称']=i['displayUserNick'] data['评论']=i['rateContent'] info_list.append(data) def comment(self,url): data = self.url_req(url) self.tianmao_comment(data) if 'tmall' in url else self.taobao_comment(data) def main(url): data = base(url) for i in data.all_url(): data.comment(i) print(len(info_list)) if __name__ == "__main__": url = 'https://rate.tmall.com/list_detail_rate.htm?itemId=39258348512&spuId=250685252&sellerId=2106913388&order=3¤tPage=' info_list = [] main(url) df =pandas.DataFrame(info_list) df.to_excel('comments.xlsx',index=False)
相关文章推荐
- python爬取ajax动态生成的数据 以抓取淘宝评论为例子
- 通过抓取淘宝评论为例讲解Python爬取ajax动态生成的数据
- 记录一次爬取淘宝/天猫评论数据的过程
- 淘宝评论数据抓取简记
- 通过抓取淘宝评论为例讲解Python爬取ajax动态生成的数据(经典)
- python爬取ajax动态生成的数据 以抓取淘宝评论为例子
- python淘宝爬虫基于requests抓取淘宝商品数据
- 抓取淘宝评论
- 简单的抓取淘宝关键字信息、图片的Python爬虫|Python3中级玩家:淘宝天猫商品搜索爬虫自动化工具(第二篇)
- Python开源爬虫项目代码:抓取淘宝、京东、QQ、知网数据--转
- 关于“淘宝爆款”的数据抓取与数据分析
- 淘宝天猫抓包评论地址
- 网页数据抓取之淘宝数据
- java爬虫抓取天猫商品的价格数据
- java抓取HTML页面的数据(淘宝页面),
- 抓取淘宝数据
- 电商平台技术架构 多用户商城 仿天猫 淘宝 亚马逊 当当 阿里巴巴 大数据模块 低成本运维 高效开发
- 获取页面js动态写入的数据(抓取天猫商品价格)
- chencang-----是使用淘宝API获取数据好,还是利用爬虫去抓取数据好呢
- 介绍几款网页数据抓取软件 分类: 业余 2015-08-07 18:09 5人阅读 评论(0) 收藏