爬取带ajax的网页信息,需要将java script里的内容解析成json的格式
2012-08-26 13:18
489 查看
#-*-coding:utf-8 -*-
import httplib2
import re
import sys
import json
from bs4 import BeautifulSoup
import urllib2
h = httplib2.Http()
url = "http://verified.weibo.com/fame/licaizhuanjia/?rt=0&srt=4&letter=l"
resp,content = h.request(url)
pattern = re.compile('<script>STK && STK.pageletM && STK.pageletM.view\((.*?)\)<\/script>')
result = pattern.findall(content)
jsonResult = json.loads(result[3])
soup = BeautifulSoup(jsonResult['html'])
print soup
resultes = soup('div','select_user')
print resultes
import httplib2
import re
import sys
import json
from bs4 import BeautifulSoup
import urllib2
h = httplib2.Http()
url = "http://verified.weibo.com/fame/licaizhuanjia/?rt=0&srt=4&letter=l"
resp,content = h.request(url)
pattern = re.compile('<script>STK && STK.pageletM && STK.pageletM.view\((.*?)\)<\/script>')
result = pattern.findall(content)
jsonResult = json.loads(result[3])
soup = BeautifulSoup(jsonResult['html'])
print soup
resultes = soup('div','select_user')
print resultes
相关文章推荐
- java读取文件内容,解析Json格式数据
- JAVA生产报表导出成PDF格式(报表中的内容存储在String字符串中,需要解析,业务特殊)
- JavaWeb中Ajax 对 Json 格式的解析
- Java HttpURLConnection 抓取网页内容 解析gzip格式输入流数据并转换为String格式字符串
- 奔五的人学iOS:swift获取网页并解析需要的内容(1)
- JSON格式的字符串-用java解析取出
- java里面json格式解析
- Java解析JSON格式数据二
- ajax 对 json格式字符串解析
- Java 将对象解析成JSON格式 无插件形式
- json_ajax提交json格式数据到servlet并解析
- java处理List<String>的内容将其转换成标准json格式
- String类型的json体转换为json(json嵌套字符串json,嵌套字符串json数组等)转换并解析为需要的json格式
- ajax 对 Json 格式的解析
- java使用正则表达式的方法从json格式的字符串中提取需要的字符串
- java解析json格式的字符串 maven依赖
- ajax传输的数据格式(XML,json)怎么获取解析
- java解析json格式数据
- js 解析java后端的String为json格式并格式化Json格式的时间
- Json数据格式解析示例 (语言:Java 包:org.json.jar)