Tesseract-OCR 3.02命令行程序的使用
2016-06-21 20:43
211 查看
OCR(Optical Character Recognition):光学字符识别,是指对图片文件中的文字进行分析识别,获取的过程。最近因为需要看了看OCR的相关知识,这里我看的是谷歌的Tesseract-OCR检测引擎。Tesseract:开源的OCR识别引擎,初期Tesseract引擎由HP实验室研发,后来贡献给了开源软件业,后经由Google进行改进,消除bug,优化,重新发布。当前版本为3.05.
想要使用这个开源引擎,就要先将其源码编译才行。这里给出源码地址:Tesseract。这里我们要说的是对于官方对VS2008平台给出的一个可编译的工程,其版本是3.02,同时官方还给出了一个可安装的命令行执行程序,其地址在tesseract-ocr-setup-3.02.02.exe。下载好是可以直接安装的,其安装界面如下。
按装时候会有一个Tesseract development files 的选项,如果勾选的话,在安装时会自动下载相关的开发文件。但是,由于谷歌在天朝的情况,所以我这里是连接不上的,大家安的时候可以不选,如果有啥要用的到时在去官网那下载就好了。由于安装时程序已将路径加入环境变量:
所以大家在命令提示窗直接运行就好,在命令窗输入tesseract如果出现下面结果就说明安装正确:
这其实就列出了Tesseract3.02的功能选项,出现这样的输出就说明程序安装正确,下面就试验一下最基本的字符识别功能,因为我这里没有下载其他的中文字库,所以就识别一下下图中的英文就好:
图片我放在D盘。所以先把当前路径换到D盘:>D:就行然后如入识别指令,其格式是:
>tesseract imagemane outputname
imagemane是图片名字, outputname是输出文件名字,以.txt文件形式保存。比如,这里我们测试图片名字是test.png,然后命令为:tesseract test.png test 如下图:
这样就识别成功了,然后早D盘下会有一个test.txt,打开后就可以看到检测结果了:
这就是Tesseract-ocr 3.02命令行的基本使用过程。
虽然可以直接使用,但是版本太低,且没发让开发者去DIY,所以下次我会写一下怎么对最新源码进行编译,得到Tesseract的库文件。
想要使用这个开源引擎,就要先将其源码编译才行。这里给出源码地址:Tesseract。这里我们要说的是对于官方对VS2008平台给出的一个可编译的工程,其版本是3.02,同时官方还给出了一个可安装的命令行执行程序,其地址在tesseract-ocr-setup-3.02.02.exe。下载好是可以直接安装的,其安装界面如下。
按装时候会有一个Tesseract development files 的选项,如果勾选的话,在安装时会自动下载相关的开发文件。但是,由于谷歌在天朝的情况,所以我这里是连接不上的,大家安的时候可以不选,如果有啥要用的到时在去官网那下载就好了。由于安装时程序已将路径加入环境变量:
所以大家在命令提示窗直接运行就好,在命令窗输入tesseract如果出现下面结果就说明安装正确:
这其实就列出了Tesseract3.02的功能选项,出现这样的输出就说明程序安装正确,下面就试验一下最基本的字符识别功能,因为我这里没有下载其他的中文字库,所以就识别一下下图中的英文就好:
图片我放在D盘。所以先把当前路径换到D盘:>D:就行然后如入识别指令,其格式是:
>tesseract imagemane outputname
imagemane是图片名字, outputname是输出文件名字,以.txt文件形式保存。比如,这里我们测试图片名字是test.png,然后命令为:tesseract test.png test 如下图:
这样就识别成功了,然后早D盘下会有一个test.txt,打开后就可以看到检测结果了:
这就是Tesseract-ocr 3.02命令行的基本使用过程。
虽然可以直接使用,但是版本太低,且没发让开发者去DIY,所以下次我会写一下怎么对最新源码进行编译,得到Tesseract的库文件。
相关文章推荐
- 图片识别工具Tesseract初探
- OCR / Vote disk Maintenance Operations: (ADD/REMOVE/REPLACE/MOVE) (Doc ID 428681.1)
- tesseract-ocr3.02字符识别过程操作步骤
- OCR SDK开发者平台推荐:OCR图像智能字符识别技术
- OCR SDK开发者平台解决智能读取身份证信息问题
- 扫描银行卡自动识别,第三方技术API接口介绍
- 提供银行卡识别API免费接入的OCR SDK开发者平台
- ABBYY FineReader 12完整功能列表汇总(二)
- ABBYY FineReader 12完整功能列表说明(四)
- 怎样实现ABBYY FineReader Pro for Mac的具体运用(一)
- 藏文识别 维文识别
- 关于 文字识别技术 OCR 最近的开发情况
- 文通视频文字识别亮相国际广播电影电视设备展览会
- OCR将成为政府舆情监测的创新元素
- OCR 集成开发包
- 什么?只有中英文识别?你真是弱爆了!
- ocr
- linux+tesseract+ruby 识别网站验证码
- ABBYY PDF Transformer+中怎样添加书签
- Tesseract OCR API:Tess4J