python 包的使用 (二)——tesseract识别图片中的文字
2018-06-11 17:27
1286 查看
一、作用
a、Python-tesseract是一个基于google's Tesseract-OCR的独立封装包;
b、Python-tesseract功能是识别图片文件中文字,并作为返回参数返回识别结果;
c、Python-tesseract默认支持tiff、bmp格式图片,只有在安装PIL之后,才能支持jpeg、gif、png等其他图片格式;
二、设计逻辑、、
三、代码实现
#coding:utf8 import Image import pytesseract image=Image.open("image.jpg") image.load() image.show() vcode=pytesseract.image_to_string(image) print vcode安装过程
pytesser 调用了 tesseract,因此需要安装 tesseract,安装 tesseract 需要安装 leptonica,否则编译tesseract 的时候出现 "configure: error: leptonica not found"。
[cpp] view plain copy- sudo apt-get install tesseract-ocr</span>
之后利用pip安装pytesseract的包[cpp] view plain copy
- sudo pip install pytesseract
就可以使用了.
windows系统可以参考https://www.geek-share.com/detail/2657278804.html这篇博客就OK了.
也可以参考https://www.quora.com/How-do-I-use-PyTesser-and-Tesseract-OCR-in-Ubuntu-with-Python
原理:
验证码图像处理
验证码图像识别技术主要是操作图片内的像素点,通过对图片的像素点进行一系列的操作,最后输出验证码图像内的每个字符的文本矩阵。
1、读取图片
2、图片降噪
3、图片切割
4、图像文本输出
(2)验证字符识别
验证码内的字符识别主要以机器学习的分类算法来完成,目前我所利用的字符识别的算法为KNN(K邻近算法)和SVM (支持向量机算法),后面我 会对这两个算法的适用场景进行详细描述。
1、获取字符矩阵
2、矩阵进入分类算法
3、输出结果
要验证的图片如下:
[python] view plain copy
- import pytesseract
- import Image
- image = Image.open('1.jpg')
- print pytesseract.image_to_string(image)
结果如下
[python] view plain copy- Python 2.7.9 (default, Apr 2 2015, 15:33:21)
- [GCC 4.9.2] on linux2
- Type "copyright", "credits" or "license()" for more information.
- ==== No Subprocess ====
- >>>
- 1201
- >>>
也可以使用复杂一点的,上面的只能对一些比较简单的做处理
原理:彩色转灰度,灰度转二值,二值图像识别
- # 验证码识别,此程序只能识别数据验证码
- import Image
- import ImageEnhance
- import ImageFilter
- import sys
- from pytesseract import *
- # 二值化
- threshold = 140
- table = []
- for i in range(256):
- if i < threshold:
- table.append(0)
- else:
- table.append(1)
- #由于都是数字
- #对于识别成字母的 采用该表进行修正
- rep={'O':'0',
- 'I':'1','L':'1',
- 'Z':'2',
- 'S':'8'
- };
- def getverify1(name):
- #打开图片
- im = Image.open(name)
- #转化到灰度图
- imgry = im.convert('L')
- #保存图像
- imgry.save('g'+name)
- #二值化,采用阈值分割法,threshold为分割点
- out = imgry.point(table,'1')
- out.save('b'+name)
- #识别
- text = image_to_string(out)
- #识别对吗
- text = text.strip()
- text = text.upper();
- for r in rep:
- text = text.replace(r,rep[r])
- #out.save(text+'.jpg')
- print text
- return text
- getverify1('1.jpg') #注意这里的图片要和此文件在同一个目录,要不就传绝对路径也行
阅读更多
相关文章推荐
- 使用Tesseract OCR Engine识别图片文字
- 如何使用tesseract-ocr4.0识别图片文字
- python 使用pytesseract图片文字识别
- Java中使用tess4J(Tesseract-OCR)进行图片文字识别(支持中文)
- Python+pytesseract+Tesseract-OCR图片文字识别(只适合新手)
- 如何使用tesseract-ocr4.0识别图片文字
- Python使用OCR技术识别图片中的文字(入门篇)
- python3使用Pillow、tesseract-ocr与pytesseract模块的图片识别
- 在Mac上 python中使用tesseract OCR (Pytesser) 识别图片中的文字
- Python(应用) — Tesseract图片文字识别(一)
- linux系统如何使用tess4j(java)进行ocr图片文字识别
- Tesseract-OCR 进行文字识别 VS2010及不安装opencv,就可以使用opencv
- 使用python在图片中如何添加文字?
- Java使用OpenCV和Tesseract-OCR实现银行卡图片处理与卡号识别
- Python 批量下载验证码图片及切割验证码图片,识别验证码,并以识别的文字重命令验证码
- Python人工智能之图片识别,Python3一行代码实现图片文字识别
- 图片文字识别软件的作用及使用方法
- Android文字识别之tesseract的使用
- 使用Tesseract-OCR训练文字识别记录
- Mac下Tesseract-OCR文字识别新手使用入门