转载-Python图像处理之图片文字识别(OCR)
2018-06-09 11:07
716 查看
点击打开链接 segmentFault_jclian91_Python图像处理之图片文字识别(OCR)
OCR与Tesseract介绍
将图片翻译成文字一般被称为光学文字识别(Optical Character Recognition,OCR)。可以实现OCR 的底层库并不多,目前很多库都是使用共同的几个底层OCR 库,或者是在上面进行定制。
Tesseract 是一个OCR 库,目前由Google 赞助(Google 也是一家以OCR 和机器学习技术闻名于世的公司)。Tesseract 是目前公认最优秀、最精确的开源OCR 系统。
除了极高的精确度,Tesseract 也具有很高的灵活性。它可以通过训练识别出任何字体(只要这些字体的风格保持不变就可以),也可以识别出任何Unicode 字符。
Tesseract的安装与使用
Tesseract的Windows安装包下载地址为: http://digi.bib.uni-mannheim.... ,下载后双击直接安装即可。安装完后,需要将Tesseract添加到系统变量中。在CMD中输入tesseract -v, 如显示以下界面,则表示Tesseract安装完成且添加到系统变量中。
Linux 用户可以通过apt-get 安装:
$sudo apt-get tesseract-ocr用Tesseract可以识别格式规范的文字,主要具有以下特点:• 使用一个标准字体(不包含手写体、草书,或者十分“花哨的”字体)
• 虽然被复印或拍照,字体还是很清晰,没有多余的痕迹或污点
• 排列整齐,没有歪歪斜斜的字
• 没有超出图片范围,也没有残缺不全,或紧紧贴在图片的边缘
下面将给出几个tesseract识别图片中文字的例子。
首先是E://figures/other/poems.jpg, 输入命令 tesseract E://figures/other/poems.jpg E://figures/other/poems.txt, 则会将poems.jpg中的识别文字写入到poems.txt中,如下图:
接着是稍微有点倾斜的文字图片th.jpg,识别情况如下:
可以看到识别的情况不如刚才规范字体的好,但是也能识别图片中的大部分字母。
最后是识别简体中文,需要事先安装简体中文语言包,下载地址为:https://github.com/tesseract-... ,再讲chi_sim.traineddata放在C:Program Files (x86)Tesseract-OCRtessdata目录下。我们以图片timg.jpg为例:
输入命令:
tesseract E://figures/other/timg.jpg E://figures/other/timg.txt -l chi_sim识别结果如下:
只识别错了一个字,识别率还是不错的。
最后加一句,Tesseract对于彩色图片的识别效果没有黑白图片的效果好。
pytesseract
pytesseract是Tesseract关于Python的接口,可以使用pip install pytesseract安装。安装完后,就可以使用Python调用Tesseract了,不过,你还需要一个Python的图片处理模块,可以安装pillow.
输入以下代码,可以实现同上述Tesseract命令一样的效果:
import pytesseract from PIL import Image pytesseract.pytesseract.tesseract_cmd = 'C://Program Files (x86)/Tesseract-OCR/tesseract.exe' text = pytesseract.image_to_string(Image.open('E://figures/other/poems.jpg')) print(text)运行结果如下:
参考文献
- Python网络数据采集 【美】 Ryan Mitchell 人民邮电出版社
- https://blog.csdn.net/dcrmg/a...
- http://www.inimei.cn/archives...
阅读更多
相关文章推荐
- Python图像处理之图片文字识别(OCR)
- python识别图片中的文字处理方法
- Python使用OCR技术识别图片中的文字(入门篇)
- tesseract 4.0 ocr图像识别利器,可识别文字。图片越高清越准确
- 图像识别API Python 指定文件夹图片内容转化为文字
- Python图像处理之识别图像中的文字(实例讲解)
- Python图像处理之识别图像中的文字
- Java中使用tess4J(Tesseract-OCR)进行图片文字识别(支持中文)
- C#调用DLL实现图像文字识别(OCR)
- Python_文字识别引擎试用:tesseract-ocr
- java 图片文字识别 ocr
- python图像文字识别的环境搭建
- Python(1):简单图像处理(图片->二进制->图片)
- 图像处理之相似图片识别(直方图应用篇)
- Java使用OpenCV和Tesseract-OCR实现银行卡图片处理与卡号识别
- python 图像预处理--统一修改图片大小并使图片反色
- python图像处理库PIL高清晰保存缩放图片
- ABBYY FineReader OCR图片文字识别软件安装应用
- 本图片处理类功能非常之强大可以实现几乎所有WEB开发中对图像的处理功能都集成了,包括有缩放图像、切割图像、图像类型转换、彩色转黑白、文字水印、图片水印等功能
- 用python简单处理图片(1):打开\显示\保存图像