处理区域
FineReader Sprint 在开始识别之前,会自动分析文档的逻辑结构,并突出显示各类区域,如文本、图像、背景图像、表格和条码。每一个区域都通过特定颜色的边框来表示。这些区域会告知系统应识别的各部分图像以及识别顺序。这有助于重建文档的原始格式。
通常,FineReader Sprint 可以正确分析文档布局。但是,如果您需要调整区域,您可以使用程序在“图像”窗口、“区域”检查器和“区域”菜单提供的特殊功能与工具来进行调整。
单击某一区域,使其激活。若要激活某一区域,只需要单击该区域。程序读取各区域的顺序取决于各区域的顺序编号。您可以在“区域”检查器的“顺序编号”框内了解各区域的顺序编号。
重要!调整完区域后,请重新启动 OCR 处理。
如何编辑原始布局
在默认情况下,FineReader Sprint 会在您打开文档时自动分析文档。但是,格式太过复杂可能导致某些区域的检测错误。只校正问题区域比起手动绘制所有区域要快得多。
可以使用以下工具和菜单命令来调整布局检测结果:- “图像”窗口内工具栏中的区域绘制工具
- 区域内的区域绘制命令 > 绘制区域
- 区域检查器内的工具
如何添加/删除区域
要绘制区域:
- 在“图像”窗口内的工具栏中,选择所需的区域绘制工具:
可以绘制识别区域
可以绘制文本区域
可以绘制图片区域
可以绘制背景图像区域
可以绘制表格区域
- 或者,您也可以选择区域 > 绘制区域,然后选择某一区域绘制命令。
- 使用鼠标绘制图像中的某一区域。
注:在为某一类型的区域选择一个绘制工具之后,光标将会发生变化。
您可以更改区域类型,方法为在“更改区域类型”快捷菜单中选择所需类型。
要删除区域:
- 选择需要删除的区域
- 在“图像”窗口的工具栏内,选择
。或者,您也可以选择区域 > 删除区域。
如要删除多个区域,应首先选择删除工具,然后逐个单击各区域。在选择删除工具时,光标将会变为。
提示:如要从头开始绘制区域,应先删除图像中标出的所有区域。方法为:在某一区域的“页面”菜单或快捷菜单中选择“删除所有区域”。如要重返自动检测的区域,应在“页面”菜单中选择“分析页面”或“分析所有页面”命令。
如何选择多个区域
如要执行群组操作,您可能需要选择多个区域。例如,如果您希望一次更改多个区域的类型或者移动原始布局。
选择多个区域:
- 在按住“命令”键时单击这些区域,或者,
- 选择“选择区域”工具,然后使用鼠标在需要选择的区域周围绘制边框。
如何编辑区域边框
您可以更改某一区域的大小,以便该区域适应其边框内的文本、图像、表格或条码。
方法为:将光标置于某一区域的边框上,然后在按住鼠标左键的同时朝所需方向拖动光标。您也可以同时移动纵向边框和横向边框,方法为:将光标置于某一区域的一角上。
如何添加/删除区域的矩形部分
- 在“图像”窗口的工具栏内,选择
,可以将某一部分添加到区域,或者选择
,可以删除区域的某一部分。
- 将鼠标指针放在区域内并选择某一矩形部分。此矩形部分可以添加至区域,也可以从区域中被删除,具体取决于您所选的工具。
- 如果需要,调整区域边框。
注:这些工具只能用于“文本”、“图像”和“背景图像”区域。您不能在表格区域或条码区域添加/删除某一部分。
如何移动区域
在按住“Command”键时选择一个区域并移动该区域。如果您选择了多个区域,则此操作会移动所有被选中的区域。
如何更改区域编号
文档页面的每一个区域都有一个编号,这些编号显示在“区域”检查器的“顺序编号”框内。程序读取这些区域的顺序和这些区域在输出文档内的顺序均取决于这些编号。
注:仅当您在带格式文本和纯文本模式下输出结果时,区域编号才会影响区域在输出文档内的位置。详细信息,请参见“文档格式输出模式”。
- 如要更改图像中的区域的顺序编号,请单击“区域”菜单中的“区域排序”,或者,单击“区域”检查器中的“区域排序”,然后选中区域。您选择区域的顺序即是区域在输出文档中出现的顺序。
- 如要更改某一区域的编号,请选中该区域,然后在“区域”检查器的“顺序编号”字段内指定一个新编号。
注:程序在自动分析布局时,会按照从左到右的顺序自动为区域编号,编号时不会考虑文本方向。
如何编辑区域的文本属性
您可以在“区域”检查器内或区域的快捷菜单内指定区域的下列属性:
- 文本功能:定义区域内文本的“角色”。文本片段可能是文档内的页眉、页脚、标题或正文等。如果程序无法识别某一文本片段(如页眉/页脚),您可以手动更改文本属性(如更改为页眉/页脚)。
注:此参数仅适用于“文本”区域。 - 反向:规定文本是否反转。
- 方向:规定文本方向。
- 类型:规定条码区域。
如果程序无法识别多个文本或表格区域内的文本属性,您可以通过手动方式规定文本的属性。
处理表格
如果 FineReader Sprint 未能自动检测表格的行和列,您可以手动调整布局并再次运行 OCR 处理。
复杂表格的示例:
编辑表格:
- 使用某一区域的“区域”菜单或快捷菜单:
- 分析表格结构:可以分析表格,这样您便无须手动绘制表格内的垂直与水平分隔线。
- 拆分单元格:可以拆分表格单元格。
- 合并单元格:可以合并表格内被选中的单元格。
- 合并行:可以合并表格内被选中的行。
要合并或拆分表格单元格或行,请先选中单元格或行,然后选取相应的工具或菜单命令。
- 您可以使用“图像”窗口内工具栏中的下列工具:
:可以添加垂直分隔线。
:可以添加水平分隔线。
:可以删除分隔线。
:可以合并被选中的单元格。
:可以拆分被选中的单元格。
注意:
- 单元格拆分命令仅可应用于先前合并过的表格单元格。
- 如果表格包含竖排文本单元格,可能需要先更改文本属性。
- 如果表格内的单元格仅包含一幅图片,请选中“区域”检查器内的“将单元格作为图片处理”。
使用区域模板
如果您处理多页文档,且很多页面的结构相似,则您可以使用区域模版功能。
您可以将区域布局另存为模版,然后将此模版应用到相似页面。
- 若要为当前文档的各页创建区域模版,请选择区域 > 保存布局。此操作会将模版保存为文件。
- 若要应用区域模版,请选择区域 > 加载布局,然后选择所需的区域模版。
© 2013 ABBYY Production LLC.保留所有权利。