您的位置:首页 > 其它

OCR字符切割实例

2016-06-05 00:01 162 查看
接着上一篇

我们来看个字符切割的实例吧

如图我们能看到字符与线粘连



text-based captcha推荐的方法:

1. 水平或垂直投影的直方图分析  对于细小直线

 J. Yan and A.S.E. Ahmad. Breaking visual captchas with

naive pattern recognition algorithms. In ACSAC 2007, 2007.


A Projection-based Segmentation Algorithm forBreaking MSN and YAHOO CAPTCHAs 

2. Canny 或Hough transform    对于长直线

上面两篇文章没有讲具体投影细节

survey in charactor segmentation 

SEGMENTATION OF TOUCHING CHARACTERS IN PRINTEDDOCUMENT RECOGNITION

投影:





我选择了HoughLinesP 来检测过长的直线

并通过line函数删除直线

然后根据投影进行分割,   是用一条水平线垂直方向扫描,  设置条件提取字符.

想看效果? 避免有人说我作弊......特意重截的图,  因为调试用的waitKey按任意键就会变化, 改代码还太麻烦也没必要



整个过程有些简单, 感觉难点在怎么去噪,  即去除与字符粘连的部分,  腐蚀的话参数怎么选择?

MRF
aka Gibbs algorithm这个算法怎么用?

解决后再更新吧

关于字符切割的其他算法,  用到之后再截图吧

上一篇文章提到的经典切割方法,  其他两种应该不难应用吧.  固定距离切割,  比投影切割还简单

关于connected- component,  用findContours怎么样? bounding box 直接用boundingRect

其他方法用到再更新
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息