На главную страницу На главную страницу Помоги больным детям! Их можно спасти!
 
Справочные материалы ←

Как распознать текст отсканированного документа?

В Ульяновск.BSD для распознавания текстов можно использовать tesseract. Это движок оптического распознавания символов (OCR) с открытым исходным кодом, который является одной из самых популярных и качественных OCR-библиотек. Его установка достаточно проста:

pkg install -r latest tesseract

Tesseract – это консольное приложение. Поэтому для удобства работы с ним лучше использовать какой-либо GUI-интерфейс. Одним из таких интерфейсов является приложение VietOCR. С помощью VietOCR можно не только распознавать текст на единичных страницах или в выбранных блоках изображения, но и производить пакетное распознавание текста во множестве изображений, находящихся в одном каталоге. Актуальную версию приложения в виде zip-файла можно скачать со страницы VietOCR на SourceForge. На момент создания данного документа это был файл VietOCR-5.6.1.zip. Для установки приложения достаточно просто распаковать скачанный zip-архив в каталог /usr/local:

unzip -d /usr/local VietOCR-5.6.1.zip

VietOCR – это Java-приложение. Поэтому для его запуска необходимо установить Java-машину:

pkg install -r latest openjdk8-jre

После этого можно запускать VietOCR из командной строки в Терминале:

env _JAVA_OPTIONS='-Dawt.useSystemAAFontSettings=on' java -jar /usr/local/VietOCR3/VietOCR.jar

Или скачайте файл VietOCR.desktop и сохраните его на рабочем столе и в каталоге /usr/local/share/applications/. В результате этого на рабочем столе и в меню появится ярлык для запуска VietOCR.

Примечание 1:

Для возможности проверки орфографии необходимо скачать языковой пакет. Сделать это можно через меню «Настройки» → «Загрузить языковые данные...».

Примечание 2:

Функция сканирования в VietOCR в настоящее время не работает. Поэтому сканирование и подготовку изображений для распознавания необходимо производить с помощью других приложений. Например, skanlite или xsane.

 

Последнее изменение: 13.07.2020 19:28:22
Комментарии
Добавляя комментарий, убедитесь, что он соответствует теме. Подумайте, будет ли он интересен другим. Спам, умышленная реклама и личная переписка не допускаются. Соблюдайте правила русского языка. Комментарии публикуются после проверки модератором и могут быть удалены без объяснения причин. Ответы на заданные в комментариях вопросы могут исходить от любого пользователя и являются неофициальными.
Импортозамещение
Об авторе: Игорь Фетисов, министр информационных технологий, связи и цифрового развития Челябинской области Министерство информационных технологий, связи и цифрового развития Челябинской области обеспечивает развитие сферы цифровых технологий региона, внедрение электронных государственных сервисов, направленных на улучшение качества жизни людей и ведение предпринимательской деятельности, создаёт благоприятные условия для развития конкурентной среды для организаций, предоставляющих услуги в сфере […] Сообщен... 
С 21 по 23 мая 2026 года в Нижнем Новгороде пройдёт второй городской технологический фестиваль «Тех-Френдли Викенд», организованный в рамках конференции ЦИПР, сообщает оргкомитет мероприятия. Центральной темой фестиваля станет разговор о будущем — и о том, как его контуры формируются уже сегодня. Эксперты обсудят долгосрочные технологические тренды с горизонтом в несколько десятилетий: как изменения в […] Сообщение Объявлена программа проводящегося в ходе ЦИПР фестиваля «Тех-Френдли Викенд» появились сначал... 
Мессенджер Max начал тестировать создание стикеров вместе с авторами публичных каналов – блогерами, звёздами и СМИ, сообщает пресс-служба Max в среду. Присоединиться к тестированию могут авторы категории «А+» с помощью чат-бота «Стикеры в МАХ». Для создания набора стикеров в МАХ необходимо: открыть чат-бот и нажать на кнопку «Начать»; нажать на кнопку «Открыть» в левом нижнем […] Сообщение Max разрешил пользователям создавать свои стикеры появились сначала на Digital Russia. 
Обновлена единая цифровая стратегия госкорпорации «Росатом», которая будет определять цифровую трансформацию компании до 2027 года включительно, сообщила компания во вторник. Обновлённый документ согласован с Минцифры РФ и Минэнерго РФ. Его необходимость обусловлена обновленными методическими рекомендациями по цифровой трансформации государственных корпораций и компаний с государственным участием, сказано в сообщении. Обновлённая стратегия базируется на достижениях «Росатома» в […] Сообщение «Росатом» сообщ... 
Московский инновационный кластер открыл первый в России испытательный центр полного цикла, предназначенный для тестирования коммунальных, складских, логистических, транспортных, мониторинговых, строительных и многих других беспилотных роботизированных систем, сообщает мэр Москвы Сергей Собянин. Подать заявку на проведение испытаний можно на сайте i.moscow. Основная площадка испытательного центра расположена в инновационном центре «Сколково», также будет использоваться полигон Федерального центра […] Сообщен... 
Новые нормативные и экономические реалии и возможные точки роста обсуждали во вторник на пресс-конференции ассоциации «Руссофт» в Москве с участием представителей IT-компаний. Там побывала и корреспондент D-Russia.ru. Как следует из обсуждения, на IT-бизнес в настоящее время более всего влияют новые налоги, сокращение инвестиций, тренд на внутреннюю разработку ПО крупными заказчиками, развитие ИИ-технологий (государство и бизнес […] Сообщение Рост налогов и сокращение инвестиций – что 2026 год преподнёс оте... 
Региональная индустриальная лаборатория микроэлектроники и радиофизики официально открылась на базе Челябинского государственного университета, сообщает Минцифры Челябинской области во вторник. Лаборатория призвана стать центром развития микроэлектроники, приборостроения и Интернета вещей (IoT). Ключевые направления: подготовка кадров через практико-ориентированное обучение (студенты будут осваивать полный цикл разработки электронных изделий на промышленном оборудовании, работая с реальными запросами бизнес... 
Пользователям Max стала доступна англоязычная версия приложения, сообщает пресс-служба национального мессенджера во вторник. Для того, чтобы сменить версию интерфейса на английскую, необходимо обновить приложение и изменить языковые настройки. Пользователи операционной системы Android могут сделать это в профиле мессенджера в разделе «Язык приложения». Пользователям iOS необходимо изменить язык в настройках смартфона. См. также: Зарегистрироваться в Max […] Сообщение Национальному мессенджеру Max сделали ан... 
Об авторе: Анатолий Шалыто, профессор, д.т.н., Университет ИТМО Третьего января 2026 года я, наконец-то, увидел дело рук своих: «Зачётную квалификационную книжку спортсменов первого разряда, кандидатов в мастеров России, мастеров спорта в России, мастеров спорта России международного класса», а также соответствующий книжке почётный знак. В книжке указано, что Руслану Белькову (Иннополис) присвоено звание «Кандидат в мастера […] Сообщение Возможно, им надоест… появились сначала на Digital Russia. 
Об авторе: Дмитрий Ухов, министр цифрового развития государственного управления, информационных технологий и связи Донецкой Народной Республики Подвижная радиотелефонная связь В 2025 году на территории ДНР тремя операторами подвижной радиотелефонной связи — ГУП ДНР «РОС», ООО «Миранда-Медиа» и ООО «К-Телеком» — запущено в работу 1619 базовых станций при плановом показателе 1080 базовых станций. Фактическое выполнение плана […] Сообщение Итоги работы Минцифры Донецкой Народной Республики за 2025 год появилис... 
    Наверх       На главную страницу       Адрес электропочты Рейтинг@Mail.ru
Данный интернет-сайт носит исключительно информационный характер, и ни при каких условиях информационные
материалы и цены, размещенные на сайте, не являются публичной офертой, определяемой положениями Статьи 437 ГК РФ.

Сергей Волков – эксперт в области информационных технологий © 2011−2026
Работает система управления сайтом «Публикатор 1.9» © 2004−2026