如何创建可搜索的PDF文档
2017-10-27 10:01
288 查看
创建可搜索的PDF文档,目前主要有两种方法:一是利用精益的可搜索PDF数字化解决方案直接将纸质文件转成可搜索的PDF文档,另一种则是利用专业的制作软件来执行,这些软件主要是利用光学文字识别(OCR)技术来达成转换可搜索PDF格式的目的。ABBYY FineReader Pro for Mac作为一款专业的 OCR文字识别软件,可以将图像转换成可搜索的PDF文档。
在FineReader Pro for Mac里,可以使用快速任务将图像转换为PDF格式,只需要导入需要转换的图像,并根据需要自定义输出参数,FineReader将会完成其它所有工作。
但是,无法通过快速任务功能来执行某些为改善OCR质量而执行的操作,编辑结果图像或区域标记。处理复杂的多页文档或者转换对开页时,最好执行手动操作,不要使用快速任务功能。
步骤二:分析、识别图像。
默认情况下,软件会自动分析文档结构,并开始识别过程。如果禁用了默认处理选项或者调整了程序检测到的区域,则需要手动开始识别流程。要执行此操作,请单击主工具栏中的“读取”按钮。
步骤三:选择所需的PDF文档导出模式,导出结果。
关于上述操作的详细步骤,请参阅ABBYY FineReader文档处理的主要步骤。
提示:很多因素都会影响OCR的质量,如果处理的是复杂的多页文档,应考虑原始图像的特征并进行正确设置,这样才能大大提高识别结果的质量。
更多关于ABBYY FineReader的使用问题,请点击访问ABBYY中文网站
,了解更多内容。
在FineReader Pro for Mac里,可以使用快速任务将图像转换为PDF格式,只需要导入需要转换的图像,并根据需要自定义输出参数,FineReader将会完成其它所有工作。
但是,无法通过快速任务功能来执行某些为改善OCR质量而执行的操作,编辑结果图像或区域标记。处理复杂的多页文档或者转换对开页时,最好执行手动操作,不要使用快速任务功能。
将图像转换为可搜索的PDF文档时,执行以下操作:
步骤一:导入图像。步骤二:分析、识别图像。
默认情况下,软件会自动分析文档结构,并开始识别过程。如果禁用了默认处理选项或者调整了程序检测到的区域,则需要手动开始识别流程。要执行此操作,请单击主工具栏中的“读取”按钮。
步骤三:选择所需的PDF文档导出模式,导出结果。
关于上述操作的详细步骤,请参阅ABBYY FineReader文档处理的主要步骤。
提示:很多因素都会影响OCR的质量,如果处理的是复杂的多页文档,应考虑原始图像的特征并进行正确设置,这样才能大大提高识别结果的质量。
更多关于ABBYY FineReader的使用问题,请点击访问ABBYY中文网站
,了解更多内容。
相关文章推荐
- C# 如何在PDF文档中创建表格
- 在Foxit PDF Editor里面创建一份A4新文档,如何设置页面?
- C# 如何在PDF文档中创建表格
- 如何使用ABBYY FineReader 14创建PDF文档
- 使用PHP创建和修改PDF文档
- 如何在MFC单文档中创建多视图
- 如何不让Doc/View框架不创建新文档
- Java如何操作Word, Excel, PDF文档
- 如何使用看板(kanban)创建更好的文档 | Linux 中国
- 告诉大家如何将pdf转换成word文档格式
- 如何在网页上显示doc/pdf文档
- sharepoint 2010 如何创建文档库内容类型content type
- 专业性的PDF文档创建组件Spire.PDF for .NET控件
- 如何在查看PDF文档时使用金山词霸自动取词查询功能
- Quartz 2D编程指南(3)- PDF文档的创建、显示及转换
- 如何在Web页面上直接打开、编辑、创建Office文档
- .Net中,如何在页面上显示PDF文档
- 多个pdf如何转换成word文档
- PDF编辑之加密的PDF文档如何解除密码和进行编辑
- PPT幻灯片如何转换成PDF文档格式