文档识别
FineReader Sprint 使用光学字符识别技术将文档图像转换为可编辑的文本。在执行 OCR 前,程序会分析整个文档的结构,并检测包含文本、条码、图像和表格的区域。有关区域相关的详细信息,请参见“处理区域”。
在默认情况下,FineReader Sprint 会自动识别文档。在此种情况下,程序会使用其当前设置。
提示:您可以在“首选项”对话框中,禁用新添加图像的自动分析与识别功能。详情请参见“自动识别”。
所获取的文本的质量取决于您是否正确选择了文档语言、原始文档图像和文档结构布局。若要了解如何考虑文档的初始特性并获得最佳的识别效果,请参见如何改善识别结果。
在某些情况下,您可以手动开始识别流程。这些情况包括:
- 禁用了自动识别功能;
- 更改了原始文档布局、区域和文本属性;
- 手动选择了图像区域;
- 更改了文档语言。
要执行此操作,请单击主工具栏中的“识别”按钮。
如果您更改了文档的部分布局,则您可以开始识别文档中的一个或多个已选页面。
- 如果页面为一页,请选择页面 > 读取页面,或者在页面的快捷菜单中选择“读取页面”命令。
- 如果页面为多页,请选择所需页面,然后选择页面 > 读取页面,或者在某一所选页面的快捷菜单中选择“读取页面”命令。
提示:FineReader Sprint 有很多用于处理多页文档的功能。详情请参见“处理 FineReader 文档”。
© 2013 ABBYY Production LLC.保留所有权利。