OCR字符切割实例
2016-06-05 00:01
162 查看
接着上一篇
我们来看个字符切割的实例吧
如图我们能看到字符与线粘连
text-based captcha推荐的方法:
1. 水平或垂直投影的直方图分析 对于细小直线
J. Yan and A.S.E. Ahmad. Breaking visual captchas with
naive pattern recognition algorithms. In ACSAC 2007, 2007.
A Projection-based Segmentation Algorithm forBreaking MSN and YAHOO CAPTCHAs
2. Canny 或Hough transform 对于长直线
上面两篇文章没有讲具体投影细节
survey in charactor segmentation
SEGMENTATION OF TOUCHING CHARACTERS IN PRINTEDDOCUMENT RECOGNITION
投影:
我选择了HoughLinesP 来检测过长的直线
并通过line函数删除直线
然后根据投影进行分割, 是用一条水平线垂直方向扫描, 设置条件提取字符.
想看效果? 避免有人说我作弊......特意重截的图, 因为调试用的waitKey按任意键就会变化, 改代码还太麻烦也没必要
整个过程有些简单, 感觉难点在怎么去噪, 即去除与字符粘连的部分, 腐蚀的话参数怎么选择?
MRF
aka Gibbs algorithm这个算法怎么用?
解决后再更新吧
关于字符切割的其他算法, 用到之后再截图吧
上一篇文章提到的经典切割方法, 其他两种应该不难应用吧. 固定距离切割, 比投影切割还简单
关于connected- component, 用findContours怎么样? bounding box 直接用boundingRect
其他方法用到再更新
我们来看个字符切割的实例吧
如图我们能看到字符与线粘连
text-based captcha推荐的方法:
1. 水平或垂直投影的直方图分析 对于细小直线
J. Yan and A.S.E. Ahmad. Breaking visual captchas with
naive pattern recognition algorithms. In ACSAC 2007, 2007.
A Projection-based Segmentation Algorithm forBreaking MSN and YAHOO CAPTCHAs
2. Canny 或Hough transform 对于长直线
上面两篇文章没有讲具体投影细节
survey in charactor segmentation
SEGMENTATION OF TOUCHING CHARACTERS IN PRINTEDDOCUMENT RECOGNITION
投影:
我选择了HoughLinesP 来检测过长的直线
并通过line函数删除直线
然后根据投影进行分割, 是用一条水平线垂直方向扫描, 设置条件提取字符.
想看效果? 避免有人说我作弊......特意重截的图, 因为调试用的waitKey按任意键就会变化, 改代码还太麻烦也没必要
整个过程有些简单, 感觉难点在怎么去噪, 即去除与字符粘连的部分, 腐蚀的话参数怎么选择?
MRF
aka Gibbs algorithm这个算法怎么用?
解决后再更新吧
关于字符切割的其他算法, 用到之后再截图吧
上一篇文章提到的经典切割方法, 其他两种应该不难应用吧. 固定距离切割, 比投影切割还简单
关于connected- component, 用findContours怎么样? bounding box 直接用boundingRect
其他方法用到再更新
相关文章推荐
- javascript里绝对用的上的字符分割函数总结
- Firefox下提示illegal character并出现乱码的原因
- Python UnicodeEncodeError: 'gbk' codec can't encode character 解决方法
- GP数据库笔记--数据类型转换,杀掉进程的方法
- GP数据库关于行列转换
- GP数据库笔记—表结构查询,表占用空间查询
- apache日志分析
- C语言回顾与再学习——setbuf
- UNIX I/O subsystem(file system,buffer)
- 数据类型转换
- 查看修改mysql编码方式
- Linux上删除空行的方法
- C语言 isdigit
- Python错误: SyntaxError: Non-ASCII character eclipse pydev 下
- sybase字符集配置与转化
- MYSQL 命令行显示乱码 解决方案
- 日志分析(shell脚本)
- 关于Segmentation fault (core dumped)
- Deep learning for CWD, POS and NER