您的位置：首页 > 编程语言 > Python开发

基于Python的Selenium自动化(3)— 实现验证码截取并识别

2016-12-18 01:32 931 查看

这些天实在忙的冒烟，一大堆的项目堆在一起，没日没夜的加班。加上有些懒惰，学习进度一直没有太多进展。这篇文章主要介绍前段时间抽空实现的一个功能，希望有需要用到可以得到一点启发。

基于UI层的自动化，有一些坑在里面，几乎几个每个人都会遇到的，其中之一就是注册或登录时需要验证码。由于验证码时动态生成的。每次访问都会不同，这样的话，使用脚本去登录会是一件麻烦的事。

目前有的一些解决方案：

1、针对公司内部的项目有两个方法，

（1）设置一个万能验证码，只要每次填写这个验证码就可以验证通过

（2）将手机号设置为白名单，只要输入特定的手机号，则不校验验证码

2、针对外部项目则可使用下面的方法

（3）截取验证码部分并使用图片识别技术识别

本文主要介绍（3）的实现过程。仅供参考

步骤可分为截取验证码+识别验证码

一、截取验证码

selenium webdriver 的api中直接提供了截图的方法.但是是全屏，要实现对元素的截取，则需要绕一绕弯

1、获取到元素的大小、元素的坐标

2、截取整屏

3、根据元素的坐标和大小，定位要剪裁的区域

4、使用图像库对元素区域进行剪裁

python代码实现：

driver.get_screenshot_as_file('a.jpg')
location = driver.find_element_by_id('validate-img').location
size = driver.find_element_by_id('validate-img').size
left = location['x']
top =  location['y']
right = location['x'] + size['width']
bottom = location['y'] + size['height']
a = Image.open("a.jpg")
im = a.crop((left,top,right,bottom))
im.save('a.jpg')
time.sleep(1)

代码没有注释部分，解释起来就是上面的四个步骤

二、识别验证码

本文不设计如何实现验证码，这部分的任务我选用的是第三方的API来实现的。（如有需要，可以搜索“超级鹰验证码识别”）毕竟术业有专攻，如果要做OCR识别的同学，本文没有任何参考价值，就此略过

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： python 自动化 selenium

相关文章推荐

新的分享

章节导航