FineReader Sprint Что такое OCR-системы?

Системы оптического распознавания символов (Optical Character Recognition - OCR) предназначены для того, чтобы преобразовывать отсканированные копии печатных документов или их цифровые фотографии, а также документы в формате PDF в электронные редактируемые файлы.

Представьте, что у вас есть бумажный документ, например, журнальная статья. Для того, чтобы перевести эту статью в электронный формат и внести изменения в текст, недостаточно отсканировать и открыть изображение. Вам понадобится OCR-система, позволяющая извлечь данные из отсканированных документов, фотоизображений или PDF-файлов. Такая система выделит на изображении буквы, соберет их в слова, а слова – в предложения. В результате, вы получите электронный документ, в котором сможете редактировать текст и осуществлять по нему поиск.