您的位置:首页 > 编程语言 > Python开发

python-50: 验证码

2015-12-09 17:31 459 查看
好了,到这里这个实例就讲解完了,大致的流程我在上一小节已经写出来了,这里就不重复了

这仅仅是模拟登陆中最最简单的例子,因为你不用面对验证码的机制或者是其他的登陆限制,你可以试着去登录百度帐号或者是淘宝网,你会发现使用前面的代码是登录不上的

即使是这样,模拟登陆也还是比前面两个实例要难一些,这一部分的内容需要慢慢回味,慢慢研究,前面我在写的时候也肯定会有很多遗漏和错误的地方,我也会慢慢去琢磨

我们下一个实例打算讲解带有验证码的模拟登陆过程,为了方便讲解这里面的流程我们同样还是选择验证码里面最简单的一种。

最近有个非常火的事情,就是12306的验证码,为了防止各种黄牛和抢票软件,12306改进了验证码机制,我们来看看比较热门的几组验证码





那么,什么是验证码呢?百度百科里面的解释是这样的

验证码(CAPTCHA)是“Completely Automated Public Turing test to tell Computers and Humans Apart”(全自动区分计算机和人类的图灵测试)的缩写,是一种区分用户是计算机还是人的公共全自动程序。可以防止:恶意破解密码、刷票、论坛灌水,有效防止某个黑客对某一个特定注册用户用特定程序暴力破解方式进行不断的登陆尝试,实际上用验证码是现在很多网站通行的方式,我们利用比较简易的方式实现了这个功能。这个问题可以由计算机生成并评判,但是必须只有人类才能解答。由于计算机无法解答CAPTCHA的问题,所以回答出问题的用户就可以被认为是人类

验证码很常见,而且经过不断的升级变化,验证码已经演变出很多的形式,我曾经很反感验证码,尤其是我输入错误的时候,学习爬虫之后,只能说呵呵
我这里给大家列举一些我遇到过的验证码
1. 验证码是一张图片,需要用户输入图片中的数字或者是文字或者回答问题等等
2. 验证码是一张gif图片,或者是经过扭曲变形了的图片
3. 像微信网页版那样需要手机扫描的二维码
4. 需要拖动验证码中的滑块到指定位置
5. 像12306那样在很多张图片中选出正确的图片
6. 在注册网站的时候可能需要通过短信获取验证码的形式

总之验证码的情况非常复杂,但是很不幸的,我们的爬虫需要应对这种情况,所以就找了一个实例来学习,至于之后如果感兴趣的话也可以继续深入学习,而且现在市面上有很多付费的验证码程序,据说很好用,所以我们没有必要花时间在这里死嗑

好了,我们进入下一个实例吧
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  python 爬虫