Программа Djvu OCR предназначена для внедрения текстового OCR слоя в djvu книги. Текстовый слой позволяет использовать поиск по документу и копировать текст из djvu в doc (word) или txt.
Djvu OCR работает совместно с программой FineReader 7/8/9 версий, предназначенной для распознавания текста.
Оцифровка происходит в три этапа:
- Djvu OCR конвертирует документ в формат tiff;
- FineReader распознает текст в полученных изображениях;
- Djvu OCR обрабатывает рабочий проект Finereader, извлекает необходимую информацию и интегрирует текстовый слой в djvu.
Кроме интеграции программа может извлекать уже существующий текстовый слой из djvu файла (режим Извлечь OCR Слой). Можно указать диапазон страниц для извлечения текста или обработать весь документ. Выходной формат: txt, html.
Программа не требует установки. В архиве 4 исполняемых файла:
- DjvuOCR – Win32 GUI версия
- FRFGrab – консольная версия
- Djvused – стандартная утилита пакета djvulibre
- cvthtml2 – конвертация OCR слоя в HTML (UTF8)
Продвинутые пользователи могут использовать консольную версию программы (подробное описание команд есть в файле справки), остальным же достаточно запустить DjvuOCR.exe, который имеет привычный интерфейс.
Для чтения Djvu книг вам пригодится DjVuReader, небольшая программа с минимальным необходимым набором функций для навигации по документу.