python图像识别
2018-06-28 13:58
211 查看
pytesseract库的安装
因为用的win10,就直说windows上面的安装了。其实就是pip安装就完事了。
$ pip install pytesseract安装了这个还不算完,得安装Tesseract-OCR,安装这个软件的时候,因为我们需要识别中文,所以还需要额外安装中文语言包:
点击
Additional language data(download)旁边的加号,勾选中文语言包,然后就一路Next了:
最后,你还可以将tesseract.exe加进系统的
Path里面。
简单使用
pytesseract不仅支持英文,还支持很多其他语言,从上面安装过程中勾选的地方就能看出来,中文,也不例外。
要使用pytesseract,其实很简单:
from PIL import Image import pytesseract image = Image.open('pic2.png') imtext = pytesseract.image_to_string(image,lang='chi_sim') print(imtext)1看起来是没什么问题的,但是一运行。。。。
C:\ProgramData\Anaconda3\python.exe F:/python/pro/Pic_t/test.py Traceback (most recent call last): File "F:/python/pro/Pic_t/test.py", line 5, in <module> imtext = pytesseract.image_to_string(image,lang='chi_sim') File "C:\ProgramData\Anaconda3\lib\site-packages\pytesseract\pytesseract.py", line 125, in image_to_string raise TesseractError(status, errors) pytesseract.pytesseract.TesseractError: (1, 'Error opening data file \\Program Files (x86)\\Tesseract-OCR\\chi_sim.traineddata') Process finished with exit code 12就报错了,这里看来是中文的语言训练集路径不对,google了一下,有大神说使用
config属性:
from PIL import Image import pytesseract image = Image.open('pic2.png') # 指定路径 tessdata_dir_config = '--tessdata-dir "C:\\Program Files (x86)\\Tesseract-OCR\\tessdata"' imtext = pytesseract.image_to_string(image,lang='chi_sim',config=tessdata_dir_config) print(imtext)67运行了一下,成功了。。。
另外,
lang这个属性是指定语言的,要是代码里面不给这个参数,默认是英文,也就是
eng。 阅读更多
相关文章推荐
- 如何用Python和深度神经网络识别图像?
- Python图像处理之验证码识别
- Windows下Python+OpenCV+zbar图像识别二维码识别编译环境安装
- 微信跳一跳python辅助软件思路及图像识别源码解析
- Python 3.6 版本 Pytesseract 图像验证码识别 PyCharm 报错FileNotFoundError
- 基于OpenCV及Python的数独问题识别与求解(二)边框识别与图像矫正
- python实现识别手写数字 python图像识别算法
- Python做图像识别和应用
- [置顶] 【python 百度指数抓取】python 模拟登陆百度指数,图像识别百度指数
- python阴阳师解放双手原理(二)图像识别—模板匹配
- python图像识别--验证码
- 用Python进行简单图像识别(验证码)
- Python与人工神经网络:使用神经网络识别手写图像介绍
- python自动截取需要区域,进行图像识别的方法
- 如何用Python和深度神经网络识别图像?
- 利用Python进行简单的图像识别(验证码)
- 基于Python使用CloudSight API实现简单的图像识别(image Recognition)
- 使用CloudSight API进行图像识别的Python脚本
- Python-OpenCV 处理图像(六)(七)(八):对象识别 图像灰度化处理 图像二值化处理
- python 图像识别