您的位置:首页 > 其它

如何在windows上编译Tesseract OCR

2015-01-08 14:40 351 查看
获取Tesseract源码的方式有很多。可以直接从repo获取,也可以下载压缩包。不过编译的时候往往也会出现各种奇怪的问题。这里介绍如何简单的配置和编译源码。

参考原文:How to Build Tesseract OCR Library
on Windows


编译Tesseract


下载

Windows installer of tesseract-ocr 3.02.02


安装

安装过程中勾选Tesseract development files:






编译

在安装目录中找到vs2008到工程目录:





找到所有编译相关的库:





打开Visual Studio 2008(没有的可以去官网下载express版本),导入工程编译。最后生成DEBUG和RELEASE两个版本的DLL:libtesseract302d.dll ,libtesseract302.dll

在README中注意这段话:



Tesseract依赖Leptonica库,所以再看下Leptonica是怎么编译的。


编译Leptonica

Leptonica是C语言编写的一个图像处理库,支持JPEG, PNG, TIFF,GIF。


下载

源码:leptonica-1.68.tar.gz

VS工程:vs2008-1.68.zip 

相关头文件和库:leptonica-1.68-win32-lib-include-dirs.zip 


编译

把三个包解压,并按照下面的结构组建编译环境:



BuildFolder\leptonica-1.68 contents:



打开Visual Studio 2008,导入工程编译。最后生成DEBUG和RELEASE两个版本的DLL:liblept168d.dll,liblept168.dll


参考

Leptonica
Leptonica & Visual Studio 2008
Tesseract-ocr
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  OCR tesseract leptonica