scrapy处理JSON API
2016-04-07 10:54
507 查看
有时候你会发现你需要的数据在原始的HTML页面上找不到。比如下面这种情况:
右击查看元素会看到一个普通的DOM树,但是用
在这种情况下,可以F12打开开发者工具,选择Network界面,在左边的列表里就能看到浏览器为加载此页面而发出的所有请求。这里有三项:
以上只是一个很简单的JSON API的例子,更复杂的可能要求你登录、使用POST请求或者返回更复杂的数据。JSON格式的数据还是很好解析的,因为不需要写XPath表达式。Python提供了一个解析JSON的库,可以
如果需要使用POST请求或者其他更复杂的操作可以用
右击查看元素会看到一个普通的DOM树,但是用
scrapy shell或右击选择查看源代码的时候,会发现源代码中没有任何信息。
在这种情况下,可以F12打开开发者工具,选择Network界面,在左边的列表里就能看到浏览器为加载此页面而发出的所有请求。这里有三项:
static/已经看过了(URL就是),
jquery.min.js是一个JS框架,这样看来
api.json应该就是数据了。如果点击这一项,然后选择Preview界面,就能看到这些数据。比如:
[{ "id": 0, "title": "better set unique family well" }, ... { "id": 29, "title": "better portered mile" }]
以上只是一个很简单的JSON API的例子,更复杂的可能要求你登录、使用POST请求或者返回更复杂的数据。JSON格式的数据还是很好解析的,因为不需要写XPath表达式。Python提供了一个解析JSON的库,可以
import json后使用
json.loads(response.body)。
start_urls可以这样写:
start_urls = ( 'http://web:9312/properties/api.json', )
如果需要使用POST请求或者其他更复杂的操作可以用
start_requests()方法。
相关文章推荐
- javascript:localStorage的兼容性实现
- JS对JSON的操作总结
- javascript:跨域
- javascript:类的介绍
- javascript:算法笔记
- js 判断一个json里是不是包含某个key
- javascript中的一些常用的数组算法总结
- javascript Array数组常用方法学习与总结
- WEB开发者必备的7个JavaScript函数
- javascript中创建对象的方式总结
- javascript Array学习与使用
- extjs panel add 和remove panel的注意事项
- js 对象属性复制到另一个对象
- jsp页面进度条加载
- 详解Javascript中的Url编码/解码
- ajaxFileUpload返回的json数据带<pre>标签,导致无法执行success后面的代码
- JS日期,JS获取当前日期时间,js日期格式化
- js cookie 的增删改查
- JavaScript构造函数及原型对象
- jsp自动编译机制