您的位置：首页 > 其它

OCR字符识别

2015-08-25 16:40 183 查看

首先要说的是：我使用的是tesseract+emguCV进行字符识别，并没有从底层写算法来实现。

1.emguCV的介绍

因为我做的项目是在C#中使用，而对于图像处理基础我并没有太多准备知识。所以就想到了强大的计算机视觉库：opencv。届于opencv是用C和C++开发的，这就导致其在C#中使用受阻。emguCV正是opencv在C#中的封装，可以方便地在C#中使用。故选用这个工具对需要字符识别的图像进行预处理。

图像处理大致包括：图像灰度化，二值化，平滑去噪等。相应的函数可以在emguCV的使用手册中查找。

2.tesseract OCR

这是Google开源的OCR引擎。其实在emguCV中已经封装了，拿来用十分方便。也可以训练自己的心的语言。训练过程中主要注意：可以使用jTessBoxEditor进行修改，我主要是根据下面的链接训练的。
http://www.cnblogs.com/ShineTan/archive/2013/04/15/3021523.html
有什么问题可以与我交流。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航