您的位置：首页 > 其它

怎样使用OneNote的COM组件，来实现OCR功能？下面详解

2016-08-31 17:50 218 查看

背景

　　在业务系统开发的过程中，很多情况下会去识别图片中的相关信息，并且把信息录入到系统中。现在希望通过自动化的方式录入，就有了以下的工作。在对比了几个OCR软件在中文识别方面的准确率后，决定使用微软的OneNote开发相应的功能。

　　准备工作

　　安装OneNote 2010;(注：在 Microsoft Office 2003 中的工具组件中有一个“ Microsoft Office Document Imaging”的组件包，之后的Office版本将这个功能集成到OneNote中了)

　　查询网上相关OneNote的资料，真是少得可怜，即使找到现有的代码也是各种坑。

　　在OneNote中的图片识别功能如下图，把图片放到一个tab中，右键图片就会出现红框所标注的功能，这个是我需要在程序中来调用的：

　　代码实现的逻辑

　　获取图片的Base64编码;

　　开启OneNote程序，在一个空的newfile.one中，生成一个新的page;

　　此时，新的page页中，会有一个固定格式的xml，把图片的Base64编码，更新到对应的节点上;

　　更新节点后，会自动调用OCR的功能，把识别出来的文字，放入到固定节点上;

　　从识别出来的文字节点上，取出相应的文字就可以了;

　　彻底销毁当前的页面(如果不是彻底的话，这个newfile.one会越来越大);

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航