JSoup-初步使用
2015-08-21 19:48
549 查看
[b]JSoup好处:可以以选择器的方式获取页面信息,简单方便易学习。[/b]
[b]这里分别介绍下以get方式和post方式发送http请求获取网页[/b]
1、使用get的方式爬信息,以博客园为爬取网页上的标题等信息,爬取200页,通过观察网页可以发现规律,他们有共同的部分“http://www.cnblogs.com/#p”,在使用JSoup的get的方法时,可以通过拼接上页数得到url。具体如下:
2、结合使用Apache的HttpClient的post请求,通过传参获取网页,通过使用Chrome调试发现请求的url是http://www.cnblogs.com/mvc/AggSite/PostList.aspx,也可以查看到传的参数,传递参数时也需要根据页面对参数进行连接。
[b]Chrome调试
[/b]
执行代买如下
[b]
[/b]
[b]这里分别介绍下以get方式和post方式发送http请求获取网页[/b]
1、使用get的方式爬信息,以博客园为爬取网页上的标题等信息,爬取200页,通过观察网页可以发现规律,他们有共同的部分“http://www.cnblogs.com/#p”,在使用JSoup的get的方法时,可以通过拼接上页数得到url。具体如下:
2、结合使用Apache的HttpClient的post请求,通过传参获取网页,通过使用Chrome调试发现请求的url是http://www.cnblogs.com/mvc/AggSite/PostList.aspx,也可以查看到传的参数,传递参数时也需要根据页面对参数进行连接。
[b]Chrome调试
[/b]
执行代买如下
[b]
[/b]
相关文章推荐
- 深入理解JavaScript系列(7):S.O.L.I.D五大原则之开闭原则OCP
- 深入理解JavaScript系列(5):强大的原型和原型链
- JavaScript相关图书推荐
- js流程控制语句(switch语句)
- 深入理解JavaScript系列(2):揭秘命名函数表达式
- js倒计时
- js流程控制语句(判断语句)
- 【 D3.js 入门系列 --- 9.3 】 弦图生产
- curl post json
- js 的一维数组,二维数组
- 在Windows上编译V8 javascript引擎
- js的表达式,运算符,与优先级
- JS效率问题之 str+ ;array.join && arr[i]
- jsp 页面倒计时
- js中的变量
- 【写一个自己的js库】 1.搭个架子先
- input验证是否为有效手机号码-js
- js 数据存入数组
- js对象 函数
- AES加密CBC模式兼容互通四种编程语言平台【PHP、Javascript、Java、C#】