您的位置:首页 > 运维架构 > Linux

服务端 CentOS6.5 编译安装最新版 tesseract 4

2017-04-28 00:00 197 查看
前几天在服务器上安装了 tesseract3.05,发现识别效果不是太满意,

然后在本机Windows上下载最新版 tesseract 4安装后,发现识别率比3.X版本要高很多。

于是果断把服务器上版本升级到最新版。

1、先说安装前的准备,先更新依赖

yum -y update
yum -y install libstdc++ autoconf automake libtool autoconf-archive pkg-config gcc gcc-c++ make libjpeg-devel libpng-devel libtiff-devel zlib-devel

2、Autoconf 需要2.64以上版本支持。从官网下载源码编译

查询当前版本并移除。参考下面的帖子

http://blog.csdn.net/knowledgeaaa/article/details/50667870

3、安装GCC4.8以支持C++11。从官网下载源码编译

参考下面的帖子

http://www.centoscn.com/image-text/config/2015/0206/4643.html

4、下载并安装依赖程序leptonica,版本1.74以上版本。从官网下载源码编译

这个我上一篇帖子有详细流程

https://my.oschina.net/u/2328100/blog/882777

5、下载并安装最新版tesseract 4

./autogen.sh
PKG_CONFIG_PATH=/usr/local/lib/pkgconfig LIBLEPT_HEADERSDIR=/usr/local/include ./configure --with-extra-includes=/usr/local/include --with-extra-libraries=/usr/local/lib
LDFLAGS="-L/usr/local/lib" CFLAGS="-I/usr/local/include" make
make install
ldconfig

6、下载语言包到目录/usr/local/share/tessdata

到下面的地址下载需要的语言包。

https://github.com/tesseract-ocr/tesseract/wiki/Data-Files#data-files-for-version-400
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息