您的位置:首页 > 编程语言 > Python开发

基于Python的Selenium自动化(3)— 实现验证码截取并识别

2016-12-18 01:32 931 查看
这些天实在忙的冒烟,一大堆的项目堆在一起,没日没夜的加班。加上有些懒惰,学习进度一直没有太多进展。这篇文章主要介绍前段时间抽空实现的一个功能,希望有需要用到可以得到一点启发。

基于UI层的自动化,有一些坑在里面,几乎几个每个人都会遇到的,其中之一就是注册或登录时需要验证码。由于验证码时动态生成的。每次访问都会不同,这样的话,使用脚本去登录会是一件麻烦的事。

目前有的一些解决方案:

1、针对公司内部的项目有两个方法,

(1)设置一个万能验证码,只要每次填写这个验证码就可以验证通过

(2)将手机号设置为白名单,只要输入特定的手机号,则不校验验证码

2、针对外部项目则可使用下面的方法

(3)截取验证码部分并使用图片识别技术识别

本文主要介绍(3)的实现过程。仅供参考

步骤可分为截取验证码+识别验证码

一、截取验证码

selenium webdriver 的api中直接提供了截图的方法.但是是全屏,要实现对元素的截取,则需要绕一绕弯

1、获取到元素的大小、元素的坐标

2、截取整屏

3、根据元素的坐标和大小,定位要剪裁的区域

4、使用图像库对元素区域进行剪裁

python代码实现:

driver.get_screenshot_as_file('a.jpg')
location = driver.find_element_by_id('validate-img').location
size = driver.find_element_by_id('validate-img').size
left = location['x']
top =  location['y']
right = location['x'] + size['width']
bottom = location['y'] + size['height']
a = Image.open("a.jpg")
im = a.crop((left,top,right,bottom))
im.save('a.jpg')
time.sleep(1)


代码没有注释部分,解释起来就是上面的四个步骤

二、识别验证码

本文不设计如何实现验证码,这部分的任务我选用的是第三方的API来实现的。(如有需要,可以搜索“超级鹰验证码识别”)毕竟术业有专攻,如果要做OCR识别的同学,本文没有任何参考价值,就此略过
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  python 自动化 selenium