Linux CentOS环境下安装图像识别工具Tesseract教程
2017-10-24 14:51
253 查看
最近在进行Python数据爬虫方向的研究,使用到了与图像识别相关的一些功能,这样就会使用到图像识别的重要工具Tesseract。下面就在CentOS环境下安装和配置Tesseract的工作环境进行讲解。查阅了网上很多资料,现将自己的安装和测试过程记录如下:
1. 安装依赖库leptioncal库
1.1 进入供存放下载文件库的目录:执行wget http://www.leptonica.com/source/leptonica-1.72.tar.gz ,出现如下图所示软件下载界面:
后顺序执行下面四个指令:
1.2 执行解压指令 tar -xvf leptonica-1.72.tar.gz;
1.3 进入leptonica-1.72目录,执行配置指令 ./configure
1.4 执行编译指令 make
1.5 执行安装指令 make install
至此,leptonica安装完毕
2. 安装Tesseract编译要用的automake和libtool
2.1 yum install automake
2.2 yum install libtool
3. 安装tesseract
3.1 下载Tesseract 3.04版本
wget https://github.com/tesseract-ocr/tesseract/archive/3.04.00.tar.gz
3.2 下载完成后,修改下安装包的名字以作区分
mv 3.04.00.tar.gz Tesseract3.04.tar.gz
3.3 参考上面的leptonica安装步骤,首先解压Tesseract3.04.tar.gz
tar -xvf Tesseract3.04.tar.gz
3.4 进入解压后的目录:tesseract-3.04.00 cd tesseract-3.04.00,进入目录后发现目录下有一个autogen.sh,执行之,结果如下图:
3.5 执行配置指令 ./configure
在执行过程中,出现如下图所示错误:
表明缺少了缺少c++编译器,执行下面命令安装:
yum install gcc-c++
然后再次执行./configure命令,成功。
3.6 执行编译指令 make
3.7 执行安装指令 make install
4 下载安装英文,中文繁体,中文简体 识别库
wget --no-check-certificate https://github.com/tesseract-ocr/tessdata/raw/master/eng.traineddata
wget --no-check-certificate https://github.com/tesseract-ocr/tessdata/raw/master/chi_sim.traineddata
wget --no-check-certificate https://github.com/tesseract-ocr/tessdata/raw/master/chi_tra.traineddata
1. 安装依赖库leptioncal库
1.1 进入供存放下载文件库的目录:执行wget http://www.leptonica.com/source/leptonica-1.72.tar.gz ,出现如下图所示软件下载界面:
后顺序执行下面四个指令:
1.2 执行解压指令 tar -xvf leptonica-1.72.tar.gz;
1.3 进入leptonica-1.72目录,执行配置指令 ./configure
1.4 执行编译指令 make
1.5 执行安装指令 make install
至此,leptonica安装完毕
2. 安装Tesseract编译要用的automake和libtool
2.1 yum install automake
2.2 yum install libtool
3. 安装tesseract
3.1 下载Tesseract 3.04版本
wget https://github.com/tesseract-ocr/tesseract/archive/3.04.00.tar.gz
3.2 下载完成后,修改下安装包的名字以作区分
mv 3.04.00.tar.gz Tesseract3.04.tar.gz
3.3 参考上面的leptonica安装步骤,首先解压Tesseract3.04.tar.gz
tar -xvf Tesseract3.04.tar.gz
3.4 进入解压后的目录:tesseract-3.04.00 cd tesseract-3.04.00,进入目录后发现目录下有一个autogen.sh,执行之,结果如下图:
3.5 执行配置指令 ./configure
在执行过程中,出现如下图所示错误:
表明缺少了缺少c++编译器,执行下面命令安装:
yum install gcc-c++
然后再次执行./configure命令,成功。
3.6 执行编译指令 make
3.7 执行安装指令 make install
4 下载安装英文,中文繁体,中文简体 识别库
wget --no-check-certificate https://github.com/tesseract-ocr/tessdata/raw/master/eng.traineddata
wget --no-check-certificate https://github.com/tesseract-ocr/tessdata/raw/master/chi_sim.traineddata
wget --no-check-certificate https://github.com/tesseract-ocr/tessdata/raw/master/chi_tra.traineddata
相关文章推荐
- Linux CentOS 6 64位系统安装Git工具环境教程
- 扫描识别工具Dynamic Web TWAIN使用教程:如何使用图像编辑器
- UNIX 环境模拟工具Cygwin安装及使用图文教程
- UNIX 环境模拟工具Cygwin安装及使用图文教程
- kscope安装教程 (linux环境下的代码阅读、编辑工具)
- 扫描识别工具Dynamic Web TWAIN使用教程:如何使用图像编辑器
- [树莓派(raspberry pi)] 02、PI3安装openCV开发环境做图像识别(详细版)
- 【OpenCV图像处理入门学习教程一】OpenCV2 + 3的安装教程与VS2013的开发环境配置 + JPEG压缩源码分析与取反运算修改
- 史上最简单的erlang环境和rabbitMQ-server 管理工具(控制台)的安装教程
- Windows下Python+OpenCV+zbar图像识别二维码识别编译环境安装
- 【OpenCV人脸识别入门教程之一】安装OpenCV及Windows系统环境配置
- TensorFlow怎么安装?哪里下载安装包?安装教程、图像识别应用(附安装包/指南)
- [置顶] 图像标注工具labelImg安装教程 Ubuntu16.04和win7
- 扫描识别工具Dynamic Web TWAIN使用教程:如何将本地图像加载到查看器中
- TensorFlow介绍、安装教程、图像识别应用(附安装包/指南)
- 扫描识别工具Dynamic Web TWAIN使用教程:图像操作
- 扫描识别工具Dynamic Web TWAIN使用教程:如何将本地图像加载到查看器中
- 扫描识别工具Dynamic Web TWAIN使用教程:图像操作