FineReader Sprint 导出参数

您可以将已识别文本保存到文件中,也可以用电子邮件发送输出格式受 FineReader Sprint 支持的已识别文本。

PDF 导出参数

本面板包括下列选项:

  1. 导出模式
    • 仅文本和图片
      :此模式可以保存已识别文本和图片。可对页面进行全文搜索,PDF 文件的大小也将变小。生成文档的外观可能与原始文档略有不同。
    • 页面图像上的文本
      :该选项可保存原始文档的背景和图片,并将已识别的文本置于其上。通常,该 PDF 类型比“仅文本和图片”需要更多的磁盘空间。可对生成的 PDF 文档进行全文搜索。在某些情况下,生成文档的外观可能与原始文档略有不同。
    • 页面图像下的文本
      :该选项可以保存整个页面图像,并将已识别的文本置于其下。使用该选项创建可进行全文搜索的文档,且该文档看上去几乎与原始文档相同。
    • 仅页面图像
      :该选项可精确保存页面上的图像。用户几乎很难区分这类 PDF 文档和原始文档的差别,但不能对其进行搜索。

    注:PDF 导出参数取决于您选择的导出模式。因此,在某些模式下部分参数可能无法使用。

  2. 保留布局
    • 保留页码、页眉和页脚
      :选中此选项之后,将可以保存页眉、页脚文本和页码。如果禁用了此选项,则页眉、页脚和页码将不会被保存。
    • 保留图片
      :选中此选项之后,将可以保存已识别文本中的图片。图片质量和结果文件的大小取决于您在“图像质量”面板中所做的选择。
    • 使用 MRC 压缩图像
      :选中此选项之后,将可以在高度压缩的文档中保留文本和图片的显示质量。因此,目标文件将是较小的高质量文本与图片。
  3. 图像质量

    如果已识别文本包含众多图片,或者您选择了保存页面图像的模式,那么结果文件可能会非常大。您可以调整输出图片的质量,以减小输出文件的大小。


    • :如果您希望 PDF 文档很小,请选中此选项。页面图像和图片的分辨率将减至 150 dpi,这会影响它们的质量。
    • 平衡
      :如果您既希望文件较小,同时又希望页面图像和图片的质量较高,请选中此选项。

    • :选中此选项之后,页面图像和图片将保持原始质量。

    提示:如果您不需要已识别文本中的图片,请取消选中“保留图片”。

  4. 纸张尺寸

    在将结果导出至 PDF 时,您可以设置所用纸张的尺寸。请从下拉列表中选择一个系统支持的纸张尺寸;或者选中“自定义尺寸”,然后输入一个自己定义的尺寸。

  5. 文本设置
    • 保留文本和背景颜色
      :选择该选项可在以 PDF 格式保存文档时,保留字体颜色和背景。
  6. PDF 选项
    • 使文档与 PDF/A 兼容
      :选择该选项创建可进行全文搜索的 PDF 文档,这些文档看上去与原始文档相同,可用于存档。
    • 创建轮廓
      :选中此选项之后,可以创建一个 PDF 文档章节标题目录。
    • 启用 PDF 标记
      :选中此选项之后,可以将 PDF 标记添加到输出 PDF 文档中。

      除了文字和图示,PDF 文件还可包含有关文档结构的信息,如逻辑部分、照片和表格。这些信息用 PDF 标记编码。有 PDF 标记的 PDF 文档可重新载入以适合各种屏幕尺寸,在手持设备上显示效果也很好。

      重要!如果已识别的文档包含希伯来语或意第续语文本,不能创建带标记的 PDF 文件。

    • 嵌入字体
      :选中此选项之后,可以将字体嵌入到 PDF 文档中。
DOCX/RTF/ODT 导出参数

本面板包括下列选项:

  1. 保留布局
    • 精确副本
      :生成格式与原始格式相同的文档。建议对布局复杂的文档使用该选项,如广告手册。但是,该选项会限制更改输出文档文本和格式的功能。
    • 可编辑的副本
      :生成格式可能与原始格式略微不同的文档。以这种模式生成的文档易于编辑。
    • 带格式文本
      :保留字体、字体大小和段落,但不会保留页面上对象的确切间距或位置。将生成左对齐的文本。以从右至左语言编写的文本将会在右侧对齐。

      注:在该模式下竖排文本将变为横排文本。

    • 纯文本
      :该模式不保留文本格式。
  2. 高级设置

    您还可以使用其它保存选项,具体取决于您在“保留布局”下拉列表中所做的选择:

    • 保留页码、页眉和页脚
      :选中此选项之后,将可以保存页眉、页脚文本和页码。如果禁用了此选项,则页眉、页脚和页码将不会被保存。
    • 保留换行符和连字符
      :已识别文本中的换行符和连字符将会与原始图像中的相同。
    • 保留分页符
      :已保存的已识别文本中的分页符将会与原始图像中的相同。
    • 保留图片
      :选中此选项之后,将可以保存已识别文本中的图片。图片质量和结果文件的大小取决于您在“图像质量”面板中所做的选择。
  3. 图像质量

    如果已识别文本包含众多图片,或者您选择了保存页面图像的模式,那么结果文件可能会非常大。您可以调整输出图片的质量,以减小输出文件的大小。


    • :选中此选项之后,输出文件将会很小。页面图像和图片的分辨率将减至 150 dpi,这会影响它们的质量。
    • 平衡
      :如果您既希望文件较小,同时又希望页面图像和图片的质量较高,请选中此选项。

    • :选中此选项之后,页面图像和图片将保持原始质量。
  4. 纸张尺寸

    在将结果导出至 DOCX/RTF/ODT 时,您可以设置所用纸张的尺寸。请从下拉列表中选择一个系统支持的纸张尺寸;或者选中“自定义尺寸”,然后输入一个自己定义的尺寸。

  5. 文本设置
    • 保留文本和背景颜色
      :字体颜色和背景将被保留。
    • 突出显示不确定的字符
      :如果您希望在 Microsoft Word 中编辑已识别文本,请选中此选项。Microsoft Word 窗口中将突出显示所有不确定的已识别字符。
    • 保留行号
      :将在已识别文本中保留原始文档的所有行号。行号将被保存为侧条,在进行文本编辑时,该侧条不会发生变化。
      注:仅当选中了“精确副本”或“可编辑的副本”时,此功能才可用。
XLSX 导出参数

本面板包括下列选项:

  1. 保留布局
    • 保留页码、页眉和页脚
      :选中此选项之后,将可以保存页眉、页脚文本和页码。如果禁用了此选项,则页眉、页脚和页码将不会被保存。
    • 忽略表格外内容
      :选中此选项之后,程序仅会导出表格。
    • 保留图片
      :选中此选项之后,将可以保存已识别文本中的图片。图片质量和结果文件的大小取决于您在“图像质量”面板中所做的选择。
  2. 图像质量

    如果已识别文本包含众多图片,或者您选择了保存页面图像的模式,那么结果文件可能会非常大。您可以调整输出图片的质量,以减小输出文件的大小。


    • :选中此选项之后,输出文件将会很小。页面图像和图片的分辨率将减至 150 dpi,这会影响它们的质量。
    • 平衡
      :如果您既希望文件较小,同时又希望页面图像和图片的质量较高,请选中此选项。

    • :选中此选项之后,页面图像和图片将保持原始质量。
  3. 文本设置
    • 将数字值转换为数字
      :所有数字值都会转换为数字。Excel 采用此格式对数字单元格进行算数运算。
PPTX 导出参数

本面板包括下列选项:

  1. 保留布局
    • 保留页码、页眉和页脚
      :选中此选项之后,将可以保存页眉、页脚文本和页码。如果禁用了此选项,则页眉、页脚和页码将不会被保存。
    • 保留换行符和连字符
      :已识别文本中的换行符和连字符将会与原始图像中的相同。
    • 保留图片
      :选中此选项之后,将可以保存已识别文本中的图片。图片质量和结果文件的大小取决于您在“图像质量”面板中所做的选择。
  2. 图像质量

    如果已识别文本包含众多图片,或者您选择了保存页面图像的模式,那么结果文件可能会非常大。您可以调整输出图片的质量,以减小输出文件的大小。


    • :选中此选项之后,输出文件将会很小。页面图像和图片的分辨率将减至 150 dpi,这会影响它们的质量。
    • 平衡
      :如果您既希望文件较小,同时又希望页面图像和图片的质量较高,请选中此选项。

    • :选中此选项之后,页面图像和图片将保持原始质量。
  3. 文本设置
    • 文本换行
      :已识别文本将会发生变化,以适应演示幻灯片内文本框的宽度。
EPUB/FB2 导出参数

本面板包括下列选项:

  1. 文档属性

    您可以在此处提供文件信息,如标题、作者姓名、关键字和注释。

  2. 保留布局
    • 带格式文本
      :保留字体、字体大小和段落,但不会保留页面上对象的确切间距或位置。将生成左对齐的文本。以从右至左语言编写的文本将会在右侧对齐。

      注:在该模式下竖排文本将变为横排文本。

    • 纯文本
      :该模式不保留文本格式。
    • 保留图片
      :选中此选项之后,将可以保存已识别文本中的图片。图片质量和结果文件的大小取决于您在“图像质量”面板中所做的选择。
  3. 图像质量

    如果已识别文本包含众多图片,或者您选择了保存页面图像的模式,那么结果文件可能会非常大。您可以调整输出图片的质量,以减小输出文件的大小。


    • :选中此选项之后,输出文件将会很小。页面图像和图片的分辨率将减至 150 dpi,这会影响它们的质量。
    • 平衡
      :如果您既希望文件较小,同时又希望页面图像和图片的质量较高,请选中此选项。

    • :选中此选项之后,页面图像和图片将保持原始质量。
  4. 高级设置
    • 使用第一页作为封面图像
      :选中此选项之后,第一页将被用作图书的封面图像。
    • 嵌入字体
      :选中此选项之后,可以将字体嵌入到 ePub 文件中。(您需要先选中“保存字体和字号”选项。)
图像导出参数
  1. 格式

    有关所支持格式的完整列表,请参见支持的图像格式

  2. 颜色

    如果您需要保存彩色页面图像,请选中“全彩色”选项。如果您不需要保存彩色页面图像,且希望文件变小,请选中“灰度”选项。

    注意:当图像保存为 JBIG2 格式时,“颜色”参数将不可用。

  3. 压缩

    将图像保存为 TIFF 格式时,您可以选择某种图像压缩方法来减小文件。在选择压缩方法时,应考虑以下两种因素:输出文件需要达到的质量和所期望的输出文件的大小。

    如何选择图像压缩方法

    • ZIP 压缩 — 不会造成数据丢失,适合单一颜色面积较大的图像,例如:屏幕截图。此方法也适用于黑白图像。
    • JPEG 压缩 — 用于灰度和彩色图像,例如用于压缩照片。此方法可大幅度减小输出文件,但是会造成数据丢失、降低图像质量(例如:轮廓模糊、色度变差)。
    • Packbits — 不会造成数据丢失,适合扫描的黑白图像。
    • LZW 压缩 — 不会造成数据丢失,适合图表和灰度图像。
    • CCIT Group 4 — 不会造成数据丢失。通常用于在图形程序中创建的黑白图像或扫描图像。CCITT Group 4 压缩方法被广泛应用于所有图像。
TXT 导出参数

本面板包括下列选项:

  1. 保留布局
    • 带格式文本
      :保留字体、字体大小和段落,但不会保留页面上对象的确切间距或位置。将生成左对齐的文本。以从右至左语言编写的文本将会在右侧对齐。

      注:在该模式下竖排文本将变为横排文本。

    • 纯文本
      :该模式不保留文本格式。
    • 保留页码、页眉和页脚
      :选中此选项之后,将可以保存页眉、页脚文本和页码。如果禁用了此选项,则页眉、页脚和页码将不会被保存。
    • 保留换行符和连字符
      :已识别文本中的换行符和连字符将会与原始图像中的相同。
  2. 文本设置
    • 用空白行分隔段落
      :段落将通过空白行分隔。
    • 插入换页字符作为换页
      :保留原始分页方式。
  3. 字符编码

    FineReader Sprint 会自动检测代码页。您也可以在“编码”下拉列表中手动选择相应的代码页。

HTML 导出参数

本面板包括下列选项:

  1. 保留布局
    • 灵活布局
      :保留原始图像的格式和外观。
    • 带格式文本
      :保留字体、字体大小和段落,但不会保留页面上对象的确切间距或位置。将生成左对齐的文本。以从右至左语言编写的文本将会在右侧对齐。

      注:在该模式下竖排文本将变为横排文本。

    • 纯文本
      :该模式不保留文本格式。
  2. 高级设置

    您还可以使用其它保存选项,具体取决于您在“保留布局”下拉列表中所做的选择:

    • 保留页码、页眉和页脚
      :选中此选项之后,将可以保存页眉、页脚文本和页码。如果禁用了此选项,则页眉、页脚和页码将不会被保存。
    • 保留换行符和连字符
      :已识别文本中的换行符和连字符将会与原始图像中的相同。
    • 保留图片
      :选中此选项之后,将可以保存已识别文本中的图片。图片质量和结果文件的大小取决于您在“图像质量”面板中所做的选择。
  3. 图像质量

    如果已识别文本包含众多图片,或者您选择了保存页面图像的模式,那么结果文件可能会非常大。您可以调整输出图片的质量,以减小输出文件的大小。


    • :选中此选项之后,输出文件将会很小。页面图像和图片的分辨率将减至 150 dpi,这会影响它们的质量。
    • 平衡
      :如果您既希望文件较小,同时又希望页面图像和图片的质量较高,请选中此选项。

    • :选中此选项之后,页面图像和图片将保持原始质量。
  4. 字符编码

    FineReader Sprint 会自动检测代码页。您也可以在“编码”下拉列表中手动选择相应的代码页。

  5. 文本设置
    • 保留文本和背景颜色
      :字体颜色和背景将被保留。
    • 使用层叠样式表 (CSS)
      :选中此选项之后,程序将以 HTML 4 格式保存文件,允许使用 HTML 文件中整合的样式表保留文档布局。
  6. 生成目录并根据此目录创建文件

    FineReader Sprint 会自动将图书各章保存到单独的 HTML 文件,且会恢复目录中各章的链接。您也可以根据 1 级和 2 级标题将文档拆分为单独的 HTML 文件。

CSV 导出参数

本面板包括下列选项:

  1. 保留布局

    • 忽略表格外文本:仅保存表格。

    • 插入页面分隔符:保留原始分页格式。

  2. 字符编码

    FineReader Sprint 会自动检测代码页。您也可以在“编码”下拉列表中手动选择相应的代码页。

  3. 字段分隔符

    选择在 CSV 文件中分隔数据列的字符。