利用jso实现vivo x20手机评论的爬取
2017-12-12 13:45
246 查看
这个比我以前写的那个京东上随意商品的评论简单很多。
# -*- coding:utf-8 -*-
import urllib
import re
import json
def getHtml(url):
page=urllib.urlopen(url)
html=page.read().decode("gbk")
return html
def getItems(html):
reg=re.compile("fetchJSON_comment98vv766\(") #这是重点,这个小程序的核心
data=reg.sub('',html)
reg1=re.compile("\);")
data=reg1.sub('',data)
a=json.loads(data)
for k in a["comments"]:
print k["content"]
print k["referenceName"]
print k["referenceTime"]
f1=open('vivo.txt','a+')
f1.write(k["content"].encode('UTF-8'))
f1.write(k["referenceName"].encode('UTF-8'))
f1.write(k["referenceTime"].encode('UTF-8'))
f1.close()
for i in range(0,10):
url='https://club.jd.com/comment/productPageComments.action?callback=fetchJSON_comment98vv766&productId=5331985&score=0&sortType=5&page='+str(i)+'&pageSize=10&isShadowSku=0&fold=1'
html=getHtml(url)
getItems(html)
这两个大部分的框架是一样的,其中最主要的还是要找到json库,把它存入字典,然后方便我们的调取,舒服很多...
# -*- coding:utf-8 -*-
import urllib
import re
import json
def getHtml(url):
page=urllib.urlopen(url)
html=page.read().decode("gbk")
return html
def getItems(html):
reg=re.compile("fetchJSON_comment98vv766\(") #这是重点,这个小程序的核心
data=reg.sub('',html)
reg1=re.compile("\);")
data=reg1.sub('',data)
a=json.loads(data)
for k in a["comments"]:
print k["content"]
print k["referenceName"]
print k["referenceTime"]
f1=open('vivo.txt','a+')
f1.write(k["content"].encode('UTF-8'))
f1.write(k["referenceName"].encode('UTF-8'))
f1.write(k["referenceTime"].encode('UTF-8'))
f1.close()
for i in range(0,10):
url='https://club.jd.com/comment/productPageComments.action?callback=fetchJSON_comment98vv766&productId=5331985&score=0&sortType=5&page='+str(i)+'&pageSize=10&isShadowSku=0&fold=1'
html=getHtml(url)
getItems(html)
这两个大部分的框架是一样的,其中最主要的还是要找到json库,把它存入字典,然后方便我们的调取,舒服很多...
相关文章推荐
- 利用java实现的一个发送手机短信的小例子
- 利用手机搞破解(二)空实现
- 利用Swipejs轻松实现手机上的图片手势切换
- 利用Sensor实现android手机类似于微信摇一摇
- 利用zip格式实现手机客户端二维码扫描分享识别
- 利用动态加载实现手机淘宝的节日特效
- 利用动态加载实现手机淘宝的节日特效
- 利用Python分析GP服务运行结果的输出路径 & 实现服务输出路径的本地化 分类: Python ArcGIS for desktop ArcGIS for server 2015-08-06 19:49 3人阅读 评论(0) 收藏
- Asp.net利用JQuery AJAX实现无刷新评论思路与代码
- 利用collectionView实现九宫格移动(参照工商银行手机app首页)
- 手机影音第十五天,利用service实现后台播放音乐,在通知栏显示当前音乐信息等
- 利用简易Tomcat服务器结合MysqL实现Android手机注册与登录(客户端部分)
- 不能一刀切,移动创业者如何利用手机预装实现推广?
- 利用BloomFilter算法实现手机号码的判断筛选
- 利用HTML5的一个重要特性 —— DeviceOrientation来实现手机网站上的摇一摇功能
- php利用正则表达式实现手机号码格式验证代码
- 利用chrome实现模拟手机浏览器
- 利用webView实现加载网络图片居中并适应手机屏幕,以及img设置前缀
- ThinkPHP实现二级嵌套评论的查询,利用视图模型
- Asp.net利用JQuery AJAX实现无刷新评论思路与代码