如何使用tesseract-ocr4.0识别图片文字
2018-01-13 19:46
681 查看
首先下载tesseract-ocr安装包,附链接:http://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-4.00.00dev.exe
下载完成后记住安装位置,后面要配置环境变量。简要描述配置环境变量,与Java配置环境变量类似,复制安装路径
C:\Program Files(x86)\Tesseract-OCR 把这个路径添加到系统变量Path里面,键入命令:tesseract -v可以查看安装版本确认是否安装成功;
此时还不能识别中文,需要下载简体中文包https://raw.githubusercontent.com/tesseract-ocr/tessdata/4.00/chi_sim.traineddata
把下载的语言包放到安装路径tessdata目录下
再次配置环境变量 新建系统变量TESSDATA_PREFIX 变量值仍为安装路径C:\Program Files (x86)\Tesseract-OCR
二:识别图片
选择一张图片并建立一个txt文件用于存放识别结果
进入到存放图片的目录
在命令行界面键入命令
格式: tesseract 图片名称 生成的结果文件的名称 字库
例如:tesseract test.jpg result -l chi_sim
打开result.txt即可查看识别结果
下载完成后记住安装位置,后面要配置环境变量。简要描述配置环境变量,与Java配置环境变量类似,复制安装路径
C:\Program Files(x86)\Tesseract-OCR 把这个路径添加到系统变量Path里面,键入命令:tesseract -v可以查看安装版本确认是否安装成功;
此时还不能识别中文,需要下载简体中文包https://raw.githubusercontent.com/tesseract-ocr/tessdata/4.00/chi_sim.traineddata
把下载的语言包放到安装路径tessdata目录下
再次配置环境变量 新建系统变量TESSDATA_PREFIX 变量值仍为安装路径C:\Program Files (x86)\Tesseract-OCR
二:识别图片
选择一张图片并建立一个txt文件用于存放识别结果
进入到存放图片的目录
在命令行界面键入命令
格式: tesseract 图片名称 生成的结果文件的名称 字库
例如:tesseract test.jpg result -l chi_sim
打开result.txt即可查看识别结果
相关文章推荐
- 如何使用tesseract-ocr4.0识别图片文字
- Java中使用tess4J(Tesseract-OCR)进行图片文字识别(支持中文)
- 使用Tesseract OCR Engine识别图片文字
- linux系统如何使用tess4j(java)进行ocr图片文字识别
- 如何识别图片中的文字
- Java使用Tess4J 进行图片文字识别
- Android文字识别之tesseract的使用
- C# 使用Microsoft Office Document Imaging(MODI) 识别 图片中的文字(OCR)
- python 使用pytesseract图片文字识别
- 如何识别图片中的文字
- 使用Tesseract-OCR训练文字识别记录
- 使用DELPHI对图片中的文字进行识别的过程(最简单实现)
- 手机图片如何识别成文字
- 图片文字识别软件的作用及使用方法
- C#中如何使用内嵌资源(文字、图片)
- 如何识别图片中的文字
- 手机图片如何识别成文字
- 使用ORC识别图片的文字
- 如何识别图片中的文字内容
- 使用ORC识别图片的文字