ПИШУ ПРО ВСЕ

22 сент. 2009 г.

Распознование текста в линукс

Распознавание текста в ОС Linux с поддержкой кириллицы возможно с помощью OCR-системы CuneiForm, которая служит для преобразования графических файлов в редактируемый текст. CuneiForm работает только из консоли, что существенно ограничивает круг людей, которые могут использовать данную программу.

Чтобы это исправить была разработана графическая оболочка — YAGF.

Плюсы:

  • Абсолютно бесплатно.
  • Довольно неплохие результаты распознования текста.
  • Результаты распознавания текста можно сохранить в формат html или text.
  • Есть возможность автоматической проверки орфографии при установленоном пакете aspell.
  • Большое количество поддерживаемых языков.
  • Поддержка кириллицы.
  • Работа со сканером организована посредством Sane + XSane.

Минусы:

  • Не поддерживает форматирование текста.
YAGF - http://symmetrica.net/cuneiform-linux/yagf-ru.html
CuneiForm - http://www.cuneiform.ru/

Установка.

Перед установкой самих прграмм сначало нужно установить дополнительные пакеты:

# sudo apt-get install libmagick++1 aspell aspell-ru sane xsane sane-utils quiteinsane

Программы доступны в rpm-пакетах (исходники само собой).

deb-пакеты можно скачать на странице - http://www.mediafire.com/alexp - выбираем Вашу версию дистрибутива и скачиваем два пакета: cuneiform и yagf.

Комментариев нет:

Отправить комментарий