您的位置：首页 > 编程语言 > Java开发

小白的tesseract-ocr经验

2017-09-04 08:58 127 查看

由于项目需要最近花2天时间研究了一下tesseract-ocr。好像用不了2天可能是我拖延症又犯了。
网上关于文字识别的中文资料不多，关于tesseract-ocr的就更少。原因后面讲。我安装并使用了一下使劲挤点干货：
1.识别率。最重要的先说，算了光说算个屁。上个小图。我需要识别的图形，直接截屏的，全英文。
-----------------------------------------------------------------------

-------------------------上面是图片-------------------------------
识别粗来的内容是什么？
-------------------------------------------------------------
> catch (loixcepcxon 2) (
3 .Pr1ncSca<:l’l'racc(
---------------------上面是识别出来的内容-----------------
我终于知道为什么tesseract-ocr那么少人用了。你是不是不想往下看了？
2.既然忙活了2天还是把我从网上下载的资料打个包分享给各位。我朝苦逼翻山越岭down点东西不容易，不敢独享。要的全免费取用。源代码99%是网上抄的加了一些注释还有一些小修改。如果，有侵犯别人的权益希望通知我，我马上删除。下载地址如下。我本意是免费的可是csdn要求至少要1个积分。希望大家谅解。 http://download.csdn.net/download/jstaxi/9962829
3.貌似可以通过训练提高识别率，我还没研究。大家可以讨论。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： tesseract chi_sim 文字识别图象识别 Java 免费

相关文章推荐

新的分享

章节导航