您的位置:首页 > 编程语言 > Java开发

小白的tesseract-ocr经验

2017-09-04 08:58 127 查看
由于项目需要最近花2天时间研究了一下tesseract-ocr。好像用不了2天可能是我拖延症又犯了。
网上关于文字识别的中文资料不多,关于tesseract-ocr的就更少。原因后面讲。我安装并使用了一下使劲挤点干货:
1.识别率。最重要的先说,算了光说算个屁。上个小图。我需要识别的图形,直接截屏的,全英文。
-----------------------------------------------------------------------



-------------------------上面是图片-------------------------------
识别粗来的内容是什么?
-------------------------------------------------------------
> catch (loixcepcxon 2) (
3 .Pr1ncSca<:l’l'racc(
---------------------上面是识别出来的内容-----------------
我终于知道为什么tesseract-ocr那么少人用了。你是不是不想往下看了?
2.既然忙活了2天还是把我从网上下载的资料打个包分享给各位。我朝苦逼翻山越岭down点东西不容易,不敢独享。要的全免费取用。源代码99%是网上抄的加了一些注释还有一些小修改。如果,有侵犯别人的权益希望通知我,我马上删除。下载地址如下。我本意是免费的可是csdn要求至少要1个积分。希望大家谅解。 http://download.csdn.net/download/jstaxi/9962829
3.貌似可以通过训练提高识别率,我还没研究。大家可以讨论。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息