FineReader Sprint Параметры экспорта в различные форматы

Результаты распознавания можно сохранить в файл или отправить по электронной почте в любом из поддерживаемых программой FineReader Sprint форматов экспорта.

Параметры экспорта в формат PDF

При экспорте результатов распознавания в формат PDF вы можете настроить следующие параметры:

  1. Режим экспорта

    Выбор режима сохранения зависит от того, как вы будете использовать созданный документ в дальнейшем:

    • Только текст и картинки
      В данном режиме сохраняются распознанный текст и иллюстрации. PDF-файл такого типа имеет относительно небольшой размер, и в нем возможен полнотекстовый поиск. Внешний вид документа может незначительно отличаться от оригинала.
    • Текст поверх изображения страницы
      В данном режиме сохраняются фон и иллюстрации исходного документа, на них накладывается распознанный текст. Обычно размер такого PDF-файла больше, чем файла, получаемого при сохранении в режиме Только текст и картинки. В PDF-документе этого типа есть возможность полнотекстового поиска, однако внешний вид документа может незначительно отличаться от оригинала.
    • Текст под изображением страницы
      В данном режиме сохраняется изображение страницы, распознанный текст помещается на невидимый слой под изображением. Таким образом, получается документ с возможностью поиска по тексту, при этом внешний вид PDF-документа практически неотличим от оригинала.
    • Только изображение
      В данном режиме сохраняется изображение страницы. Внешний вид полученного PDF-документа будет не отличим от оригинала, однако в таком документе невозможен поиск по тексту.

    Замечание. Параметры экспорта в формат PDF напрямую зависят от выбранного режима экспорта. Поэтому для различных режимов некоторые параметры могут быть недоступны.

  2. Оформление
    • Сохранять номера страниц и колонтитулы
      Отметьте эту опцию, если вы хотите, чтобы текст колонтитулов и номера страниц документа были сохранены. Если данная опция отключена, текст колонтитулов и номера страниц сохраняться не будут.
    • Сохранять картинки
      Отметьте эту опцию, если вы хотите сохранить иллюстрации в распознанном тексте. Качество картинок и размер полученного файла зависят от выбранного опции Качество изображения.
    • Использовать смешанное растровое содержание
      Отметьте эту опцию, если вы хотите, чтобы при сильном сжатии документа сохранилось высокое качество текста и изображений. В результате размер конечного файла будет небольшим, а качество текста и иллюстраций будет высоким.
  3. Качество изображения

    Если распознанный текст содержит большое количество иллюстраций или вы выбрали режим, в котором сохраняется изображение страницы, то размер конечного файла может быть очень большим. Регулируя качество экспортируемых иллюстраций, вы можете повлиять на размер конечного файла.

    • Низкое
      Отметьте эту опцию, если вы хотите получить PDF-документ небольшого размера. Разрешение изображения страницы и иллюстраций будет уменьшено до 150 dpi, что повлияет на их качество.
    • Сбалансированное
      Отметьте эту опцию, чтобы уменьшить размер документа по сравнению с исходным, но при этом сохранить достаточно высокое качество изображения страницы или иллюстраций.
    • Высокое
      Отметьте эту опцию, если вам важно сохранить качество изображения страницы или иллюстраций. Они будут сохранены с разрешением исходного изображения.

    Совет. Если вы не хотите сохранять иллюстрации в распознанном тексте, убедитесь, что опция Сохранить картинки не отмечена.

  4. Размер бумаги

    Вы можете указать размер бумаги, который будет использован при экспорте результатов распознавания в формат PDF. Выберите один из поддерживаемых форматов бумаги из раскрывающегося списка или задайте свои размеры, выбрав пункт Пользовательский размер бумаги....

  5. Параметры текста
    • Сохранять цвет фона и букв
      Указывает, что при экспорте текста в формат PDF будет сохранен цвет букв и фона.
  6. Настройки PDF
    • Создать документ совместимый с PDF/A
      Отметьте эту опцию, если вы хотите создать PDF документ с возможностью поиска по тексту и без потери визуального качества, и если данный документ в дальнейшем будет храниться в архиве.
    • Создать оглавление
      Отметьте эту опцию, если вы хотите создать в PDF-документе оглавление из заголовков.
    • Разрешить теги PDF
      Указывает, что при сохранении распознанного текста в формате PDF будут автоматически сохранены теги PDF.

      Помимо текста и иллюстраций PDF-файлы могут содержать информацию о структуре документа: логических частях, иллюстрациях и таблицах. Эта информация хранится в виде тегов PDF. Теги PDF обеспечивают удобство просмотра документа на экранах различного размера, например, на экранах карманных компьютеров.

      Внимание! Если распознанный текст содержит иврит или идиш, создание PDF-документа с тегами невозможно. Данная функциональность не поддерживается.

    • Встраивать шрифты
      Отметьте эту опцию, чтобы встроить используемые шрифты в создаваемый PDF документ.
      Внимание! Если опция встраивания шрифтов отключена, это может стать причиной некорректного отображения документа в некоторых программах для просмотра PDF.
Параметры экспорта в форматы DOCX/RTF/ODT

Выбор параметров экспорта зависит от того, как вы будете использовать созданный документ в дальнейшем. Закладки экспорта в форматы DOC/RTF/ODT содержат следующие группы настроек:

  1. Режим экспорта оформления документа

    К выбору режима экспорта оформления следует отнестись внимательно. От этого напрямую зависит конечный результат и часть других параметров.

    • Точная копия
      Позволяет получить документ, оформление которого будет полностью соответствовать оригиналу. Рекомендуется использовать для документов сложного оформления, например, рекламных брошюр. Однако данный режим не предполагает внесения значительных правок в текст и оформление.
    • Редактируемая копия
      Позволяет получить документ, оформление которого может незначительно отличаться от оригинала. Документ, полученный с помощью данного режима, легко редактируется.
    • Форматированный текст
      В полученном документе сохранятся начертание и размер шрифта, разбиение на абзацы, но не сохранится расположение объектов на странице и межстрочные интервалы. Таким образом, будет получен сплошной текст с выравниванием по левому краю. Для текста, в котором порядок чтения справа налево, выравнивание будет по правому краю.

      Замечание. Любой текст с вертикальной ориентацией в данном режиме будет отображаться горизонтально.

    • Простой текст
      В данном режиме форматирование текста не сохранится.

    В зависимости от выбранного режима сохранения могут быть доступны следующие опции:

    • Сохранять номера страниц и колонтитулы
      Отметьте эту опцию, если вы хотите, чтобы текст колонтитулов и номера страниц документа были сохранены. Если данная опция отключена, текст колонтитулов и номера страниц сохраняться не будут.
    • Сохранять деление на строки и переносы
      Указывает, что при сохранении распознанного текста в форматы RTF/DOC/ODT разделение на строки и переносы будут такими же, как на исходном изображении.
    • Сохранять деление на страницы
      Указывает, что при сохранении распознанного текста в форматы RTF/DOC/ODT разделение на страницы будет таким же, как на исходном изображении.
    • Сохранять картинки
      Отметьте эту опцию, если вы хотите сохранить иллюстрации в распознанном тексте. Качество картинок и размер полученного файла зависят от выбранного опции Качество изображения.
  2. Качество изображения

    Если распознанный текст содержит большое количество иллюстраций или вы выбрали режим, в котором сохраняется изображение страницы, то размер конечного файла может быть очень большим. Регулируя качество сохраняемых иллюстраций, вы можете повлиять на размер конечного файла.

    • Низкое
      Отметьте эту опцию, если вы хотите получить конечный файл небольшого размера. Разрешение изображения страницы и иллюстраций будет уменьшено до 150 dpi, что повлияет на их качество.
    • Сбалансированное
      Отметьте эту опцию, чтобы уменьшить размер документа по сравнению с исходным, но при этом сохранить достаточно высокое качество изображения страницы или иллюстраций.
    • Высокое
      Отметьте эту опцию, если вам важно сохранить качество изображения страницы или иллюстраций. Они будут сохранены с разрешением исходного изображения.
  3. Размер бумаги

    Вы можете указать размер бумаги, который будет использован при сохранении результатов распознавания в форматы RTF/DOC/ODT. Вы можете выбрать один из поддерживаемых форматов бумаги из списка или задать свои размеры, выбрав пункт Пользовательский размер бумаги.

  4. Параметры текста
    • Сохранять цвет фона и букв
      Указывает, что при сохранении текста в форматы RTF/DOC/ODT будет сохранен цвет букв и фона.
    • Выделять неуверенно распознанные символы
      Отметьте эту опцию, если вы собираетесь редактировать распознанный текст в Microsoft Word. Если эта опция отмечена, все неуверенно распознанные символы будут выделены цветом в программе Microsoft Word.
    • Сохранять номера строк
      Указывает, что нумерация строк в распознанном тексте будет сохранена, если она была в исходном документе. Номера строк сохраняются в виде врезки, которая не изменяется при редактировании текста.
      Замечание. Данная функция доступна только в режимах сохранения оформления Точная копия и Редактируемая копия.
Параметры экспорта в формат XLSX

Данная закладка содержит параметры экспорта результата распознавания в формат XLS.

  1. Оформление документа
    • Сохранять номера страниц и колонтитулы
      Отметьте эту опцию, если вы хотите, чтобы текст колонтитулов и номера страниц документа были сохранены. Если данная опция отключена, текст колонтитулов и номера страниц сохраняться не будут.
    • Игнорировать содержимое вне таблицы
      Отметьте эту опцию, чтобы экспортировать в файл только таблицы.
  2. Качество изображения

    Если распознанный текст содержит большое количество иллюстраций или вы выбрали режим, в котором сохраняется изображение страницы, то размер конечного файла может быть очень большим. Регулируя качество сохраняемых иллюстраций, вы можете повлиять на размер конечного файла.

    • Низкое
      Отметьте эту опцию, если вы хотите получить конечный файл небольшого размера. Разрешение изображения страницы и иллюстраций будет уменьшено до 150 dpi, что повлияет на их качество.
    • Сбалансированное
      Отметьте эту опцию, чтобы уменьшить размер документа по сравнению с исходным, но при этом сохранить достаточно высокое качество изображения страницы или иллюстраций.
    • Высокое
      Отметьте эту опцию, если вам важно сохранить качество изображения страницы или иллюстраций. Они будут сохранены с разрешением исходного изображения.
  3. Параметры текста
    • Сохранять числовые данные в формате "Цифры"
      Указывает, что при сохранении распознанного текста в формате XLS числа будут сохранены в формате «Цифры». Этот формат в Excel используется для выполнения арифметических операций над ячейками, содержащими числа.
Параметры экспорта в формат PPTX
  1. Оформление документа
    • Сохранять номера страниц и колонтитулы
      Отметьте эту опцию, если вы хотите, чтобы текст колонтитулов и номера страниц документа были сохранены. Если данная опция отключена, текст колонтитулов и номера страниц сохраняться не будут.
    • Сохранять деление на строки и переносы
      Указывает, что при сохранении распознанного текста в формате PPTX разделение на строки и переносы будут такими же, как на исходном изображении.
    • Сохранять картинки
      Отметьте эту опцию, если вы хотите сохранить иллюстрации в распознанном тексте. Качество картинок и размер полученного файла зависят от выбранного опции Качество изображения.
  2. Качество изображения

    Если распознанный текст содержит большое количество иллюстраций или вы выбрали режим, в котором сохраняется изображение страницы, то размер конечного файла может быть очень большим. Регулируя качество сохраняемых иллюстраций, вы можете повлиять на размер конечного файла.

    • Низкое
      Отметьте эту опцию, если вы хотите получить конечный файл небольшого размера. Разрешение изображения страницы и иллюстраций будет уменьшено до 150 dpi, что повлияет на их качество.
    • Сбалансированное
      Отметьте эту опцию, чтобы уменьшить размер документа по сравнению с исходным, но при этом сохранить достаточно высокое качество изображения страницы или иллюстраций.
    • Высокое
      Отметьте эту опцию, если вам важно сохранить качество изображения страницы или иллюстраций. Они будут сохранены с разрешением исходного изображения.
  3. Параметры текста
    • Переносить по словам
      Распознанный текст будет умещен по ширине текстового блока слайда.
Параметры экспорта в форматы ePub/FB2

С помощью этой группы вы можете настроить экспорт результата распознавания в форматы ePub/FB2 для создания электронной книги.

  1. Свойства документа

    Вы можете указать подробные сведения о файле: название, имена авторов, ключевые слова, комментарий.

  2. Оформление документа
    Выбор режима оформления зависит от того, как вы будете использовать созданный файл в дальнейшем:
    • Форматированный текст
      В полученном документе сохранится разбиение на абзацы, но не сохранится расположение объектов на странице и межстрочные интервалы. Таким образом, будет получен сплошной текст с выравниванием по левому краю. Для текста, в котором порядок чтения справа налево, выравнивание будет по правому краю.

      Замечание. Любой текст с вертикальной ориентацией в данном режиме будет отображаться горизонтально.

    • Простой текст
      В данном режиме форматирование текста не сохранится.
  3. Качество изображения

    Если распознанный текст содержит большое количество иллюстраций или вы выбрали режим, в котором сохраняется изображение страницы, то размер конечного файла может быть очень большим. Регулируя качество сохраняемых иллюстраций, вы можете повлиять на размер конечного файла.

    • Низкое
      Отметьте эту опцию, если вы хотите получить конечный файл небольшого размера. Разрешение изображения страницы и иллюстраций будет уменьшено до 150 dpi, что повлияет на их качество.
    • Сбалансированное
      Отметьте эту опцию, чтобы уменьшить размер документа по сравнению с исходным, но при этом сохранить достаточно высокое качество изображения страницы или иллюстраций.
    • Высокое
      Отметьте эту опцию, если вам важно сохранить качество изображения страницы или иллюстраций. Они будут сохранены с разрешением исходного изображения.
  4. Дополнительные опции оформления документа:
    • Использовать первую страницу в качестве обложки
      Выберите эту опцию, чтобы использовать первую страницу документа в качестве обложки книги.
    • Сохранять размер и начертание шрифтов
      Выберите эту опцию, чтобы сохранить размер и начертание шрифтов в создаваемой электронной книге.
    • Встраивать шрифты
      Выберите эту опцию, чтобы встроить используемые шрифты в создаваемую электронную книгу.
Параметры экспорта изображений
  1. Формат

    Подробнее о том, в какие форматы можно сохранять изображения, см. «Поддерживаемые графические форматы».

  2. Цветность

    Если вам важно сохранить цвета изображения страницы, выберите Цветной. Чтобы уменьшить размер конечного файла, вы можете сохранить изображение страницы в режиме Серый.

    Замечание. Параметр Цветность недоступен при сохранении изображений в формат JBIG2.

  3. Сжатие

    При сохранении в формат TIFF вы можете выбрать метод сжатия изображения, что позволит уменьшить размер файла. На выбор метода влияют два фактора: качество получаемого изображения и размер файла.

    Как выбрать метод сжатия изображения:

    • ZIP — не приводит к потере данных и применяется для изображений, содержащих большие участки одного цвета. Например, для снимков экрана. Также этот метод подходит для черно-белых изображений.
    • JPEG — применяется для серых и цветных изображений, например, для фотографий. Данный метод позволяет значительно уменьшить размер получаемого файла, но приводит к потере данных и, как следствие, к ухудшению качества изображения, например, размыванию контуров и потере оттенков цветов.
    • Packbits — не приводит к потере данных и подходит для отсканированных черно-белых изображений.
    • LZW — не приводит к потере данных и подходит для графики и серых изображений.
    • CCIT Group 4 — не приводит к потере данных и применяется для черно-белых изображений, созданных в графических редакторах или полученных со сканера. Сжатие CCITT Group 4 является широко используемым методом сжатия и применимо практически ко всем изображениям.
Параметры экспорта в формат TXT
  1. Режим оформления

    Выбор режима сохранения оформления зависит от того, как вы будете использовать создаваемый файл в дальнейшем:

    • Форматированный текст
      В полученном документе сохранится разбиение на абзацы, но не сохранится расположение объектов на странице и межстрочные интервалы. Кроме того, сохранятся внешний вид таблиц и отступы параграфов за счет форматирования пробелами. Таким образом, будет получен сплошной текст с выравниванием по левому краю. Для текста, в котором порядок чтения справа налево, выравнивание будет по правому краю.

      Замечание. Любой текст с вертикальной ориентацией в данном режиме будет отображаться горизонтально.

    • Простой текст
      В данном режиме форматирование текста не сохранится.
  2. Параметры экспорта оформления
    • Сохранять номера страниц и колонтитулы
      Отметьте эту опцию, если вы хотите, чтобы текст колонтитулов и номера страниц документа были сохранены. Если данная опция отключена, текст колонтитулов и номера страниц сохраняться не будут.
    • Сохранять деление на строки и переносы
      Указывает, что при экспорте распознанного текста в формате TXT разделение на строки и переносы будут такими же, как на исходном изображении.
  3. Настройки текста
    • Разделять абзацы пустыми строками
      При сохранении в формате TXT абзацы распознанного текста разделяются пустыми строками.
    • Разделять страницы символом конца страницы
      При сохранении в формате TXT распознанный текст будет разбит на страницы так же, как и исходное изображение.
  4. Кодировка символов

    Программа FineReader Sprint автоматически подбирает кодовую страницу. Если вы хотите изменить кодовую страницу, выберите нужное значение в выпадающем списке в секции Кодировка символов.

Параметры экспорта в формат HTML
  1. Режим оформления

    Выбор режима сохранения оформления зависит от того, как вы будете использовать создаваемый файл в дальнейшем:

    • Гибкая копия
      В выходном документе сохраняются форматирование и оформление оригинала.
    • Форматированный текст
      В полученном документе сохранится разбиение на абзацы, но не сохранится расположение объектов на странице и межстрочные интервалы. Кроме того, сохранятся внешний вид таблиц и отступы параграфов за счет форматирования пробелами. Таким образом, будет получен сплошной текст с выравниванием по левому краю. Для текста, в котором порядок чтения справа налево, выравнивание будет по правому краю.

      Замечание. Любой текст с вертикальной ориентацией в данном режиме будет отображаться горизонтально.

    • Простой текст
      В данном режиме форматирование текста не сохранится.
  2. В зависимости от выбранного режима экспорта оформления могут быть доступны следующие опции
    • Сохранять номера страниц и колонтитулы
      Отметьте эту опцию, если вы хотите, чтобы текст колонтитулов и номера страниц документа были сохранены. Если данная опция отключена, текст колонтитулов и номера страниц сохраняться не будут.
    • Сохранять деление на строки и переносы
      Указывает, что при сохранении распознанного текста в формате HTML разделение на строки и переносы будут такими же, как на исходном изображении.
    • Сохранять картинки
      Отметьте эту опцию, если вы хотите сохранить иллюстрации в распознанном тексте. Качество картинок и размер полученного файла зависят от выбранного опции Качество изображения.
  3. Качество изображения

    Если распознанный текст содержит большое количество иллюстраций или вы выбрали режим, в котором сохраняется изображение страницы, то размер конечного файла может быть очень большим. Регулируя качество сохраняемых иллюстраций, вы можете повлиять на размер конечного файла.

    • Низкое
      Отметьте эту опцию, если вы хотите получить конечный файл небольшого размера. Разрешение изображения страницы и иллюстраций будет уменьшено до 150 dpi, что повлияет на их качество.
    • Сбалансированное
      Отметьте эту опцию, чтобы уменьшить размер документа по сравнению с исходным, но при этом сохранить достаточно высокое качество изображения страницы или иллюстраций.
    • Высокое
      Отметьте эту опцию, если вам важно сохранить качество изображения страницы или иллюстраций. Они будут сохранены с разрешением исходного изображения.
  4. Кодировка символов

    Программа FineReader Sprint автоматически подбирает кодовую страницу. Если вы хотите изменить кодовую страницу, выберите нужное значение в выпадающем списке в секции Кодировка символов.

  5. Параметры текста
    • Сохранять цвет фона и букв
      Указывает, что при сохранении текста в формат HTML будет сохранен цвет букв и фона.
    • Использовать CSS
      Выберите эту опцию для записи файла в формате HTML 4, что позволит точно передать оформление документа, используя при этом таблицу стилей, встраиваемую в HTML-файл.
  6. Параметры создания содержания

    Если вы переводите бумажную книгу в электронный вид программа автоматически сохранит главы книги в отдельные HTML-файлы и восстановит в содержании ссылки на соответствующие главы. Вы также можете разбить документ на отдельные HTML-файлы по заголовкам первого или второго уровня.

Параметры экспорта в формат CSV
  1. Оформление документа
    • Игнорировать текст вне таблицы
      Указывает, что в файл будут сохранены только таблицы.
    • Разделять страницы символом конца страницы
      Указывает, что при сохранении распознанного текста в формате CSV деление на страницы будет таким же, как и в исходном документе.
  2. Кодировка символов

    Программа FineReader Sprint автоматически подбирает кодовую страницу. Если вы хотите изменить кодовую страницу, выберите нужное значение в выпадающем списке в секции Кодировка символов.

  3. Разделитель
    Указывает символ, который будет разделять столбцы данных в файле формата CSV.