导出参数
您可以将已识别文本保存到文件中,也可以用电子邮件发送输出格式受 FineReader Sprint 支持的已识别文本。
- PDF 导出参数
-
本面板包括下列选项:
- 导出模式
- 仅文本和图片
:此模式可以保存已识别文本和图片。可对页面进行全文搜索,PDF 文件的大小也将变小。生成文档的外观可能与原始文档略有不同。 - 页面图像上的文本
:该选项可保存原始文档的背景和图片,并将已识别的文本置于其上。通常,该 PDF 类型比“仅文本和图片”需要更多的磁盘空间。可对生成的 PDF 文档进行全文搜索。在某些情况下,生成文档的外观可能与原始文档略有不同。 - 页面图像下的文本
:该选项可以保存整个页面图像,并将已识别的文本置于其下。使用该选项创建可进行全文搜索的文档,且该文档看上去几乎与原始文档相同。 - 仅页面图像
:该选项可精确保存页面上的图像。用户几乎很难区分这类 PDF 文档和原始文档的差别,但不能对其进行搜索。
注:PDF 导出参数取决于您选择的导出模式。因此,在某些模式下部分参数可能无法使用。
- 仅文本和图片
- 保留布局
- 保留页码、页眉和页脚
:选中此选项之后,将可以保存页眉、页脚文本和页码。如果禁用了此选项,则页眉、页脚和页码将不会被保存。 - 保留图片
:选中此选项之后,将可以保存已识别文本中的图片。图片质量和结果文件的大小取决于您在“图像质量”面板中所做的选择。 - 使用 MRC 压缩图像
:选中此选项之后,将可以在高度压缩的文档中保留文本和图片的显示质量。因此,目标文件将是较小的高质量文本与图片。
- 保留页码、页眉和页脚
- 图像质量
如果已识别文本包含众多图片,或者您选择了保存页面图像的模式,那么结果文件可能会非常大。您可以调整输出图片的质量,以减小输出文件的大小。
- 低
:如果您希望 PDF 文档很小,请选中此选项。页面图像和图片的分辨率将减至 150 dpi,这会影响它们的质量。 - 平衡
:如果您既希望文件较小,同时又希望页面图像和图片的质量较高,请选中此选项。 - 高
:选中此选项之后,页面图像和图片将保持原始质量。
提示:如果您不需要已识别文本中的图片,请取消选中“保留图片”。
- 低
- 纸张尺寸
在将结果导出至 PDF 时,您可以设置所用纸张的尺寸。请从下拉列表中选择一个系统支持的纸张尺寸;或者选中“自定义尺寸”,然后输入一个自己定义的尺寸。
- 文本设置
- 保留文本和背景颜色
:选择该选项可在以 PDF 格式保存文档时,保留字体颜色和背景。
- 保留文本和背景颜色
- PDF 选项
- 使文档与 PDF/A 兼容
:选择该选项创建可进行全文搜索的 PDF 文档,这些文档看上去与原始文档相同,可用于存档。 - 创建轮廓
:选中此选项之后,可以创建一个 PDF 文档章节标题目录。 - 启用 PDF 标记
:选中此选项之后,可以将 PDF 标记添加到输出 PDF 文档中。除了文字和图示,PDF 文件还可包含有关文档结构的信息,如逻辑部分、照片和表格。这些信息用 PDF 标记编码。有 PDF 标记的 PDF 文档可重新载入以适合各种屏幕尺寸,在手持设备上显示效果也很好。
重要!如果已识别的文档包含希伯来语或意第续语文本,不能创建带标记的 PDF 文件。
- 嵌入字体
:选中此选项之后,可以将字体嵌入到 PDF 文档中。
- 使文档与 PDF/A 兼容
- 导出模式
- DOCX/RTF/ODT 导出参数
-
本面板包括下列选项:
- 保留布局
- 精确副本
:生成格式与原始格式相同的文档。建议对布局复杂的文档使用该选项,如广告手册。但是,该选项会限制更改输出文档文本和格式的功能。 - 可编辑的副本
:生成格式可能与原始格式略微不同的文档。以这种模式生成的文档易于编辑。 - 带格式文本
:保留字体、字体大小和段落,但不会保留页面上对象的确切间距或位置。将生成左对齐的文本。以从右至左语言编写的文本将会在右侧对齐。注:在该模式下竖排文本将变为横排文本。
- 纯文本
:该模式不保留文本格式。
- 精确副本
- 高级设置
您还可以使用其它保存选项,具体取决于您在“保留布局”下拉列表中所做的选择:
- 保留页码、页眉和页脚
:选中此选项之后,将可以保存页眉、页脚文本和页码。如果禁用了此选项,则页眉、页脚和页码将不会被保存。 - 保留换行符和连字符
:已识别文本中的换行符和连字符将会与原始图像中的相同。 - 保留分页符
:已保存的已识别文本中的分页符将会与原始图像中的相同。 - 保留图片
:选中此选项之后,将可以保存已识别文本中的图片。图片质量和结果文件的大小取决于您在“图像质量”面板中所做的选择。
- 保留页码、页眉和页脚
- 图像质量
如果已识别文本包含众多图片,或者您选择了保存页面图像的模式,那么结果文件可能会非常大。您可以调整输出图片的质量,以减小输出文件的大小。
- 低
:选中此选项之后,输出文件将会很小。页面图像和图片的分辨率将减至 150 dpi,这会影响它们的质量。 - 平衡
:如果您既希望文件较小,同时又希望页面图像和图片的质量较高,请选中此选项。 - 高
:选中此选项之后,页面图像和图片将保持原始质量。
- 低
- 纸张尺寸
在将结果导出至 DOCX/RTF/ODT 时,您可以设置所用纸张的尺寸。请从下拉列表中选择一个系统支持的纸张尺寸;或者选中“自定义尺寸”,然后输入一个自己定义的尺寸。
- 文本设置
- 保留文本和背景颜色
:字体颜色和背景将被保留。 - 突出显示不确定的字符
:如果您希望在 Microsoft Word 中编辑已识别文本,请选中此选项。Microsoft Word 窗口中将突出显示所有不确定的已识别字符。 - 保留行号
:将在已识别文本中保留原始文档的所有行号。行号将被保存为侧条,在进行文本编辑时,该侧条不会发生变化。
注:仅当选中了“精确副本”或“可编辑的副本”时,此功能才可用。
- 保留文本和背景颜色
- 保留布局
- XLSX 导出参数
-
本面板包括下列选项:
- 保留布局
- 保留页码、页眉和页脚
:选中此选项之后,将可以保存页眉、页脚文本和页码。如果禁用了此选项,则页眉、页脚和页码将不会被保存。 - 忽略表格外内容
:选中此选项之后,程序仅会导出表格。 - 保留图片
:选中此选项之后,将可以保存已识别文本中的图片。图片质量和结果文件的大小取决于您在“图像质量”面板中所做的选择。
- 保留页码、页眉和页脚
- 图像质量
如果已识别文本包含众多图片,或者您选择了保存页面图像的模式,那么结果文件可能会非常大。您可以调整输出图片的质量,以减小输出文件的大小。
- 低
:选中此选项之后,输出文件将会很小。页面图像和图片的分辨率将减至 150 dpi,这会影响它们的质量。 - 平衡
:如果您既希望文件较小,同时又希望页面图像和图片的质量较高,请选中此选项。 - 高
:选中此选项之后,页面图像和图片将保持原始质量。
- 低
- 文本设置
- 将数字值转换为数字
:所有数字值都会转换为数字。Excel 采用此格式对数字单元格进行算数运算。
- 将数字值转换为数字
- 保留布局
- PPTX 导出参数
-
本面板包括下列选项:
- 保留布局
- 保留页码、页眉和页脚
:选中此选项之后,将可以保存页眉、页脚文本和页码。如果禁用了此选项,则页眉、页脚和页码将不会被保存。 - 保留换行符和连字符
:已识别文本中的换行符和连字符将会与原始图像中的相同。 - 保留图片
:选中此选项之后,将可以保存已识别文本中的图片。图片质量和结果文件的大小取决于您在“图像质量”面板中所做的选择。
- 保留页码、页眉和页脚
- 图像质量
如果已识别文本包含众多图片,或者您选择了保存页面图像的模式,那么结果文件可能会非常大。您可以调整输出图片的质量,以减小输出文件的大小。
- 低
:选中此选项之后,输出文件将会很小。页面图像和图片的分辨率将减至 150 dpi,这会影响它们的质量。 - 平衡
:如果您既希望文件较小,同时又希望页面图像和图片的质量较高,请选中此选项。 - 高
:选中此选项之后,页面图像和图片将保持原始质量。
- 低
- 文本设置
- 文本换行
:已识别文本将会发生变化,以适应演示幻灯片内文本框的宽度。
- 文本换行
- 保留布局
- EPUB/FB2 导出参数
-
本面板包括下列选项:
- 文档属性
您可以在此处提供文件信息,如标题、作者姓名、关键字和注释。
- 保留布局
- 带格式文本
:保留字体、字体大小和段落,但不会保留页面上对象的确切间距或位置。将生成左对齐的文本。以从右至左语言编写的文本将会在右侧对齐。注:在该模式下竖排文本将变为横排文本。
- 纯文本
:该模式不保留文本格式。 - 保留图片
:选中此选项之后,将可以保存已识别文本中的图片。图片质量和结果文件的大小取决于您在“图像质量”面板中所做的选择。
- 带格式文本
- 图像质量
如果已识别文本包含众多图片,或者您选择了保存页面图像的模式,那么结果文件可能会非常大。您可以调整输出图片的质量,以减小输出文件的大小。
- 低
:选中此选项之后,输出文件将会很小。页面图像和图片的分辨率将减至 150 dpi,这会影响它们的质量。 - 平衡
:如果您既希望文件较小,同时又希望页面图像和图片的质量较高,请选中此选项。 - 高
:选中此选项之后,页面图像和图片将保持原始质量。
- 低
- 高级设置
- 使用第一页作为封面图像
:选中此选项之后,第一页将被用作图书的封面图像。 - 嵌入字体
:选中此选项之后,可以将字体嵌入到 ePub 文件中。(您需要先选中“保存字体和字号”选项。)
- 使用第一页作为封面图像
- 文档属性
- 图像导出参数
-
- 格式
有关所支持格式的完整列表,请参见支持的图像格式。
- 颜色
如果您需要保存彩色页面图像,请选中“全彩色”选项。如果您不需要保存彩色页面图像,且希望文件变小,请选中“灰度”选项。
注意:当图像保存为 JBIG2 格式时,“颜色”参数将不可用。
- 压缩
将图像保存为 TIFF 格式时,您可以选择某种图像压缩方法来减小文件。在选择压缩方法时,应考虑以下两种因素:输出文件需要达到的质量和所期望的输出文件的大小。
如何选择图像压缩方法
- ZIP 压缩 — 不会造成数据丢失,适合单一颜色面积较大的图像,例如:屏幕截图。此方法也适用于黑白图像。
- JPEG 压缩 — 用于灰度和彩色图像,例如用于压缩照片。此方法可大幅度减小输出文件,但是会造成数据丢失、降低图像质量(例如:轮廓模糊、色度变差)。
- Packbits — 不会造成数据丢失,适合扫描的黑白图像。
- LZW 压缩 — 不会造成数据丢失,适合图表和灰度图像。
- CCIT Group 4 — 不会造成数据丢失。通常用于在图形程序中创建的黑白图像或扫描图像。CCITT Group 4 压缩方法被广泛应用于所有图像。
- 格式
- TXT 导出参数
-
本面板包括下列选项:
- 保留布局
- 带格式文本
:保留字体、字体大小和段落,但不会保留页面上对象的确切间距或位置。将生成左对齐的文本。以从右至左语言编写的文本将会在右侧对齐。注:在该模式下竖排文本将变为横排文本。
- 纯文本
:该模式不保留文本格式。 - 保留页码、页眉和页脚
:选中此选项之后,将可以保存页眉、页脚文本和页码。如果禁用了此选项,则页眉、页脚和页码将不会被保存。 - 保留换行符和连字符
:已识别文本中的换行符和连字符将会与原始图像中的相同。
- 带格式文本
- 文本设置
- 用空白行分隔段落
:段落将通过空白行分隔。 - 插入换页字符作为换页
:保留原始分页方式。
- 用空白行分隔段落
- 字符编码
FineReader Sprint 会自动检测代码页。您也可以在“编码”下拉列表中手动选择相应的代码页。
- 保留布局
- HTML 导出参数
-
本面板包括下列选项:
- 保留布局
- 灵活布局
:保留原始图像的格式和外观。 - 带格式文本
:保留字体、字体大小和段落,但不会保留页面上对象的确切间距或位置。将生成左对齐的文本。以从右至左语言编写的文本将会在右侧对齐。注:在该模式下竖排文本将变为横排文本。
- 纯文本
:该模式不保留文本格式。
- 灵活布局
- 高级设置
您还可以使用其它保存选项,具体取决于您在“保留布局”下拉列表中所做的选择:
- 保留页码、页眉和页脚
:选中此选项之后,将可以保存页眉、页脚文本和页码。如果禁用了此选项,则页眉、页脚和页码将不会被保存。 - 保留换行符和连字符
:已识别文本中的换行符和连字符将会与原始图像中的相同。 - 保留图片
:选中此选项之后,将可以保存已识别文本中的图片。图片质量和结果文件的大小取决于您在“图像质量”面板中所做的选择。
- 保留页码、页眉和页脚
- 图像质量
如果已识别文本包含众多图片,或者您选择了保存页面图像的模式,那么结果文件可能会非常大。您可以调整输出图片的质量,以减小输出文件的大小。
- 低
:选中此选项之后,输出文件将会很小。页面图像和图片的分辨率将减至 150 dpi,这会影响它们的质量。 - 平衡
:如果您既希望文件较小,同时又希望页面图像和图片的质量较高,请选中此选项。 - 高
:选中此选项之后,页面图像和图片将保持原始质量。
- 低
- 字符编码
FineReader Sprint 会自动检测代码页。您也可以在“编码”下拉列表中手动选择相应的代码页。
- 文本设置
- 保留文本和背景颜色
:字体颜色和背景将被保留。 - 使用层叠样式表 (CSS)
:选中此选项之后,程序将以 HTML 4 格式保存文件,允许使用 HTML 文件中整合的样式表保留文档布局。
- 保留文本和背景颜色
- 生成目录并根据此目录创建文件
FineReader Sprint 会自动将图书各章保存到单独的 HTML 文件,且会恢复目录中各章的链接。您也可以根据 1 级和 2 级标题将文档拆分为单独的 HTML 文件。
- 保留布局
- CSV 导出参数
-
本面板包括下列选项:
保留布局
忽略表格外文本:仅保存表格。
插入页面分隔符:保留原始分页格式。
字符编码
FineReader Sprint 会自动检测代码页。您也可以在“编码”下拉列表中手动选择相应的代码页。
字段分隔符
选择在 CSV 文件中分隔数据列的字符。
© 2013 ABBYY Production LLC.保留所有权利。