ПИШУ ПРО ВСЕ

22 сент. 2009 г.

Распознование текста в линукс

Распознавание текста в ОС Linux с поддержкой кириллицы возможно с помощью OCR-системы CuneiForm, которая служит для преобразования графических файлов в редактируемый текст. CuneiForm работает только из консоли, что существенно ограничивает круг людей, которые могут использовать данную программу.

Чтобы это исправить была разработана графическая оболочка — YAGF.

Плюсы:

  • Абсолютно бесплатно.
  • Довольно неплохие результаты распознования текста.
  • Результаты распознавания текста можно сохранить в формат html или text.
  • Есть возможность автоматической проверки орфографии при установленоном пакете aspell.
  • Большое количество поддерживаемых языков.
  • Поддержка кириллицы.
  • Работа со сканером организована посредством Sane + XSane.

Минусы:

  • Не поддерживает форматирование текста.
YAGF - http://symmetrica.net/cuneiform-linux/yagf-ru.html
CuneiForm - http://www.cuneiform.ru/

Установка.

Перед установкой самих прграмм сначало нужно установить дополнительные пакеты:

# sudo apt-get install libmagick++1 aspell aspell-ru sane xsane sane-utils quiteinsane

Программы доступны в rpm-пакетах (исходники само собой).

deb-пакеты можно скачать на странице - http://www.mediafire.com/alexp - выбираем Вашу версию дистрибутива и скачиваем два пакета: cuneiform и yagf.

6 сент. 2009 г.

Импорт wxPython в программах

В большинстве програм на питоне импортируют wxPython простой командой:

import wx

Такое импортирование имеет некоторые неприятные последствия. Представим что в системе установлены две версии библиотеки wxPython например 2.6 и 2.8, по умолчанию выбрана 2.6, а для программытребуется версия 2.8. При простом импорте будет загружена версия 2.6 и программа вылетит с ошибкой ... (кстати по умолчанию в ubuntu хоть и выбрана версия 2.8 но из-за небольшого недочета грузится 2.6. Смотрите прошлую статью Выбор версии wxPython по умолчанию в Ubuntu Jaunty ).

Правильнее будет импортировать wxPython с указанием минимальной требуемой версии, дабы не смущать пользователя (а то он не будет разбираться, а просто удалит вашу програму и найдет другую такую же):

import wxversion
wxversion.ensureMinimal('2.8')
import wx

Вот теперь при иморте будет загружена требуемая версия! А если таковой нет то будет выведено окно пользователю с предложением загрузить с сайта требуемую версию.