На главную страницу На главную страницу Помоги больным детям! Их можно спасти!
 
Справочные материалы ←

Как распознать текст отсканированного документа?

В Ульяновск.BSD для распознавания текстов можно использовать tesseract. Это движок оптического распознавания символов (OCR) с открытым исходным кодом, который является одной из самых популярных и качественных OCR-библиотек. Его установка достаточно проста:

pkg install -r latest tesseract

Tesseract – это консольное приложение. Поэтому для удобства работы с ним лучше использовать какой-либо GUI-интерфейс. Одним из таких интерфейсов является приложение VietOCR. С помощью VietOCR можно не только распознавать текст на единичных страницах или в выбранных блоках изображения, но и производить пакетное распознавание текста во множестве изображений, находящихся в одном каталоге. Актуальную версию приложения в виде zip-файла можно скачать со страницы VietOCR на SourceForge. На момент создания данного документа это был файл VietOCR-5.6.1.zip. Для установки приложения достаточно просто распаковать скачанный zip-архив в каталог /usr/local:

unzip -d /usr/local VietOCR-5.6.1.zip

VietOCR – это Java-приложение. Поэтому для его запуска необходимо установить Java-машину:

pkg install -r latest openjdk8-jre

После этого можно запускать VietOCR из командной строки в Терминале:

env _JAVA_OPTIONS='-Dawt.useSystemAAFontSettings=on' java -jar /usr/local/VietOCR3/VietOCR.jar

Или скачайте файл VietOCR.desktop и сохраните его на рабочем столе и в каталоге /usr/local/share/applications/. В результате этого на рабочем столе и в меню появится ярлык для запуска VietOCR.

Примечание 1:

Для возможности проверки орфографии необходимо скачать языковой пакет. Сделать это можно через меню «Настройки» → «Загрузить языковые данные...».

Примечание 2:

Функция сканирования в VietOCR в настоящее время не работает. Поэтому сканирование и подготовку изображений для распознавания необходимо производить с помощью других приложений. Например, skanlite или xsane.

 

Последнее изменение: 13.07.2020 19:28:22
Комментарии
Добавляя комментарий, убедитесь, что он соответствует теме. Подумайте, будет ли он интересен другим. Спам, умышленная реклама и личная переписка не допускаются. Соблюдайте правила русского языка. Комментарии публикуются после проверки модератором и могут быть удалены без объяснения причин. Ответы на заданные в комментариях вопросы могут исходить от любого пользователя и являются неофициальными.
Импортозамещение
Подписано постановление о правилах предоставления субсидии на реализацию проектов по созданию зарядных хабов для электромобилей, использующих постоянный электрический ток (быстрые зарядки, позволяющие заряжать аккумулятор электромобиля до 80% за 20–30 минут). Средства будет распределять госкорпорация развития «ВЭБ.РФ» для возмещения недополученных доходов по кредитам, выдаваемым по льготной ставке на поддержку таких проектов. Благодаря субсидированию льготная ставка по […] Сообщение Как будет субсидироватьс... 
Мэр Москвы Сергей Собянин объявил о старте отбора компаний для размещения в креативном кластере «Сколково». Первая очередь этой площадки — кластер видеоигр и анимации — была запущена в конце прошлого года. В этом году планируется открыть кластер медиатехнологий, сообщил мэр Москвы. Заявки на резидентство принимает московский инновационный кластер по направлениям: иммерсивные технологии; виртуальное производство; цифровые […] Сообщение Стартовал отбор компаний для размещения в креативном кластере «Сколково» ... 
Центральная роль Тайваня в глобальной цепочке поставок полупроводников сделала сохранение его статус-кво стратегическим приоритетом для США и их союзников; это так называемая идея «кремниевого щита», пишет CNBC, оценивая соглашение, заключённое на прошлой неделе между США и Тайванем. Соглашение направлено на расширение мощностей для производства микросхем в США, но вряд ли в ближайшее время оно обеспечит […] Сообщение «Кремниевый щит» Тайваня – как полупроводниковые фабрики обеспечивают безопасность острова... 
Институт статистических исследований и экономики знаний Национального исследовательского университета «Высшая школа экономики» (НИУ ВШЭ) опубликовал аналитическую статью «Усиление глобального технологического протекционизма в сфере ИИ». В статье анализируется противостояние США и Китая в сфере технологий: попытки Штатов замедлить технологическое продвижение своего основного конкурента в сфере искусственного интеллекта, ставшие катализатором для создания КНР собственных чипов; новая позиция […] Сообщение ВШЭ... 
Ассоциация разработчиков программных продуктов «Отечественный софт» (АРПП) сформулировала претензии к проекту постановления правительства, определяющего условия, при которых IT-компании с преимущественным участием РФ и органы государственной власти смогут получить государственную аккредитацию и доступ к соответствующим налоговым льготам, сообщает председатель правления АРПП, президент ГК InfoWatch Наталья Касперская. Очень странно, говорится в сообщении, что органам власти предлагается предоставить […] Сооб... 
Год только начался, а IT-отрасль уже cтолкнулась с «неоднозначными законодательными инициативами», констатирует президент ассоциации производителей ПО «Руссофт» Валентин Макаров. Речь о проекте постановления правительства (подробности здесь), которое предусматривает новые категории IT-компаний, имеющих право на государственную аккредитации, а именно – IT-компании с преимущественным участием РФ и органы государственной власти. Такие компании действительно широко практикуют так называемый […] Сообщение Прирав... 
Для общественного обсуждения опубликован разработанный Минцифры проект постановления правительства, определяющего условия, при которых IT-компании с преимущественным участием РФ и органы государственной власти смогут получить государственную аккредитацию и доступ к соответствующим налоговым льготам. Как писал D-Russia.ru, председатель правительства Михаил Мишустин по итогам форума ЦИПР-2025 поручил подготовить предложения по внесению изменений в Налоговый кодекс и порядок аккредитации […] Сообщение Минцифры... 
«Ростелеком» завершил программу импортозамещения и обновил ИТ-ландшафт системы мониторинга до целевой архитектуры. Программа стартовала в 2022 году и включала создание собственных систем для сбора, фильтрации и анализа данных о работе сети, сообщила компания. По итогам внедрения производительность службы мониторинга выросла в 2,9 раза, а время информирования и обработки аварий сократилось в 5 раз. Все решения […] Сообщение «Ростелеком» сообщил об окончании импортозамещения систем сбора, фильтрации и анализа... 
Генеральный партнёр ОАО «РЖД», «РЖД цифровой», сообщил о «цифровых итогах» 2025 года – на отечественное ПО переведены восемь IT-систем, из них пять разработаны внутри самого ОАО «РЖД». На отечественное программное обеспечение переведены и включены в реестр российского ПО: Система пономерного учёта локомотивов (ЕС ПУЛ) – разработчик ООО «ОЦРВ». Система управления инфраструктурой (ЕАМ) – разработчик ООО […] Сообщение В 2025 году 60% отечественных программных продуктов ОАО «РЖД» разработаны собственными силами... 
Распоряжением правительства утверждён перечень видов экономической деятельности Общероссийского классификатора видов экономической деятельности (ОКВЭД) для целей применения единого пониженного тарифа страховых взносов. Как поясняет Минфин (разработчик документа), в список вошли отрасли, приоритетные для поддержки малого и среднего предпринимательства (МСП) и развития экономики страны. В том числе в перечне содержатся следующие виды деятельности: деятельность в сфере телекоммуникаций […] Сообщение Правительс... 
    Наверх       На главную страницу       Адрес электропочты Рейтинг@Mail.ru
Данный интернет-сайт носит исключительно информационный характер, и ни при каких условиях информационные
материалы и цены, размещенные на сайте, не являются публичной офертой, определяемой положениями Статьи 437 ГК РФ.

Сергей Волков – эксперт в области информационных технологий © 2011−2026
Работает система управления сайтом «Публикатор 1.9» © 2004−2026