Как фотографировать книгу: распознавание текста – вторая часть статьи о том, как перенести полиграфический текстовый материал на электронные носители в удобной для чтения форме.
После фотографирования текста у нас имеются изображения, как правило, в формате JPEG и, теперь, их необходимо преобразовать в такой вариант документа, который можно было бы редактировать и использовать в электронных устройствах.
Самая известная для этого случая программа от Abbyy — FineReader. Но эта программа платная и довольно дорогая. Если же вы не намерены тратить деньги, то стоит обратить внимание на бесплатную программу - CuneiForm. Скачать ее можно на сайте разработчиков: http://www.cuneiform.ru/downloads/index.html
Распаковать файл и установить программу несложно, надо лишь следовать инструкциям — все на русском языке, поэтому перейдем сразу к ее использованию. Интерфейс у CuneiForm простой и практически не требует настроек.
Откройте файл с фото и произведите разметку материала на блоки с текстом (синяя рамка), рисунками (зеленая рамка) или таблицами (оранжевая рамка) – на панели управления это третья кнопка.
Полученные блоки уже можно распознавать – для этого используется кнопка « Распознавание». В настройках этого режима установите язык — русский.
Полученный текст тут же можно исправлять, корректировать с помощью простого текстового редактора.
Последняя кнопка панели инструментов используется для сохранения документов ( форматы RTF, HTML,TXT)
Сохранить текст можно также в Word, нажав кнопку «Распознавание» верхней части панели управления.