Распознавание текста в ОС Linux с поддержкой кириллицы возможно с помощью OCR-системы CuneiForm, которая служит для преобразования графических файлов в редактируемый текст. CuneiForm работает только из консоли, что существенно ограничивает круг людей, которые могут использовать данную программу.
Чтобы это исправить была разработана графическая оболочка — YAGF.
Плюсы:
- Абсолютно бесплатно.
- Довольно неплохие результаты распознования текста.
- Результаты распознавания текста можно сохранить в формат html или text.
- Есть возможность автоматической проверки орфографии при установленоном пакете aspell.
- Большое количество поддерживаемых языков.
- Поддержка кириллицы.
- Работа со сканером организована посредством Sane + XSane.
Минусы:
- Не поддерживает форматирование текста.
Перед установкой самих прграмм сначало нужно установить дополнительные пакеты:
# sudo apt-get install libmagick++1 aspell aspell-ru sane xsane sane-utils quiteinsane
Программы доступны в rpm-пакетах (исходники само собой).
deb-пакеты можно скачать на странице - http://www.mediafire.com/alexp - выбираем Вашу версию дистрибутива и скачиваем два пакета: cuneiform и yagf.
Комментариев нет:
Отправить комментарий