[置顶]Java丨jsoup网络爬虫模拟登录思路解析
2017-02-23 17:29
357 查看
直奔主题:
本篇文章是给有jsoup抓包基础的人看的......
今天小编给大家写一篇对于jsoup抓包时需要输入验证码的解决方法之一。大神就绕道,嘿嘿~
任何抓包的基础都是基于Http协议来进行这个抓包行为的,那么,在我们遇到验证码的时候怎么办呢?别着急,继续看
遇到需要验证码的这种情况怎么办:
例如我们要访问www.xxxxx.com这个网站需要你输入验证码,步骤如下:
1)首先我们二话不说,先访问一下www.xxxxx.com这个网址,目的是什么?
a.获取到cookies
b.为我们下一步获取验证码做好准备
c.利用jsoup对www.xxxxx.com的第一次访问获取到的cookie来进行我们第二次的访问。
2)我们第一次访问完毕后进行第二次访问要做些什么呢?
a.利用jsoup带着cookie去访问www.xxxxx.com/img/verifyCode.gif这个地址获取验证码
b.将获取到的验证码存入到本地(一般获取到的是二进制形式的)
c.利用jsoup带着cookie到www.xxxxx.com/img/verifyCode.gif获取到的验证码我们是不是可以登录了呢?
3)第三次访问我们带入帐号+密码+验证码去登录 重要的是不要把cookie忘带了
a.第三次访问www.xxxx.com/login.html?username=haojieli&password=123456&verifyCode=1234 在后面跟上cookie的值
解析:
重点是cookie ,cookie是会话的首要条件,cookie就相当于你要打电话,你输入的电话要和对方的电话号码对得上才能通上话,所以后面获取验证码和登录都必须带上cookie,这是你访问对方服务器的时候识别你的标准。
反之:你到服务器获取验证码时候的cookie为123456789 ,而你登录的时候的cookie是888888888 ,你打的电话都不是同一个电话 ,接电话的肯定不是同一个人,所以,访问的时候注意保持cookie的一致!
博文到此结束,感谢您的观看,希望对各位读者有所帮助,如果有什么意见以及建议请在评论留言......
======祝各位读者生活愉快======
本篇文章是给有jsoup抓包基础的人看的......
今天小编给大家写一篇对于jsoup抓包时需要输入验证码的解决方法之一。大神就绕道,嘿嘿~
任何抓包的基础都是基于Http协议来进行这个抓包行为的,那么,在我们遇到验证码的时候怎么办呢?别着急,继续看
遇到需要验证码的这种情况怎么办:
例如我们要访问www.xxxxx.com这个网站需要你输入验证码,步骤如下:
1)首先我们二话不说,先访问一下www.xxxxx.com这个网址,目的是什么?
a.获取到cookies
b.为我们下一步获取验证码做好准备
c.利用jsoup对www.xxxxx.com的第一次访问获取到的cookie来进行我们第二次的访问。
2)我们第一次访问完毕后进行第二次访问要做些什么呢?
a.利用jsoup带着cookie去访问www.xxxxx.com/img/verifyCode.gif这个地址获取验证码
b.将获取到的验证码存入到本地(一般获取到的是二进制形式的)
c.利用jsoup带着cookie到www.xxxxx.com/img/verifyCode.gif获取到的验证码我们是不是可以登录了呢?
3)第三次访问我们带入帐号+密码+验证码去登录 重要的是不要把cookie忘带了
a.第三次访问www.xxxx.com/login.html?username=haojieli&password=123456&verifyCode=1234 在后面跟上cookie的值
解析:
重点是cookie ,cookie是会话的首要条件,cookie就相当于你要打电话,你输入的电话要和对方的电话号码对得上才能通上话,所以后面获取验证码和登录都必须带上cookie,这是你访问对方服务器的时候识别你的标准。
反之:你到服务器获取验证码时候的cookie为123456789 ,而你登录的时候的cookie是888888888 ,你打的电话都不是同一个电话 ,接电话的肯定不是同一个人,所以,访问的时候注意保持cookie的一致!
博文到此结束,感谢您的观看,希望对各位读者有所帮助,如果有什么意见以及建议请在评论留言......
======祝各位读者生活愉快======
相关文章推荐
- java模拟登录校内成绩查询网站,将获得的HTML代码用jsoup解析
- Android模拟登陆综合教务系统客户端(java)-jsoup解析数据
- android 的模拟网页登录获取信息和JSOUP解析xml
- Java网络爬虫(四)--使用Jsoup解析html
- Java爬虫(二)-- httpClient模拟Http请求+jsoup页面解析
- Java网络爬虫(三)--如何判断自己的模拟登录是否成功
- Java SSH最新的可行的模拟登录163,126,yeah,tom,sina,sohu等邮箱,并且解析出好友列表
- [置顶] Java代码模拟网站登录
- json-lib-2.4-jdk15.jar所需全部JAR包.rar java jsoup解析开彩网api接口json数据实例
- java模拟登录。不会存在跨域问题
- 用Java模拟网站登录(二)
- 通过jsoup工具实现java解析html
- java爬虫--免登录,通过httpclient模拟登录并获取登录后的信息
- [置顶] JAVA 压缩图片-解析一维码二维码
- 如何实现网页自动登录?或Java模拟Post表单
- [置顶] Java字符编码解析
- java假设模拟请求重新启动路由器(网络爬虫经常使用),还有java怎样下载图片
- Java实现从正方教务系统抓取数据(一)--模拟登录
- Java小程序之集合框架模拟数据库实现用户登录和注册功能
- 【Android+OkHttp3+Jsoup】 模拟登录教务系统 抓取课表和成绩