На главную страницу На главную страницу Помоги больным детям! Их можно спасти!
 
Справочные материалы ←

Как распознать текст отсканированного документа?

В Ульяновск.BSD для распознавания текстов можно использовать tesseract. Это движок оптического распознавания символов (OCR) с открытым исходным кодом, который является одной из самых популярных и качественных OCR-библиотек. Его установка достаточно проста:

pkg install -r latest tesseract

Tesseract – это консольное приложение. Поэтому для удобства работы с ним лучше использовать какой-либо GUI-интерфейс. Одним из таких интерфейсов является приложение VietOCR. С помощью VietOCR можно не только распознавать текст на единичных страницах или в выбранных блоках изображения, но и производить пакетное распознавание текста во множестве изображений, находящихся в одном каталоге. Актуальную версию приложения в виде zip-файла можно скачать со страницы VietOCR на SourceForge. На момент создания данного документа это был файл VietOCR-5.6.1.zip. Для установки приложения достаточно просто распаковать скачанный zip-архив в каталог /usr/local:

unzip -d /usr/local VietOCR-5.6.1.zip

VietOCR – это Java-приложение. Поэтому для его запуска необходимо установить Java-машину:

pkg install -r latest openjdk8-jre

После этого можно запускать VietOCR из командной строки в Терминале:

env _JAVA_OPTIONS='-Dawt.useSystemAAFontSettings=on' java -jar /usr/local/VietOCR3/VietOCR.jar

Или скачайте файл VietOCR.desktop и сохраните его на рабочем столе и в каталоге /usr/local/share/applications/. В результате этого на рабочем столе и в меню появится ярлык для запуска VietOCR.

Примечание 1:

Для возможности проверки орфографии необходимо скачать языковой пакет. Сделать это можно через меню «Настройки» → «Загрузить языковые данные...».

Примечание 2:

Функция сканирования в VietOCR в настоящее время не работает. Поэтому сканирование и подготовку изображений для распознавания необходимо производить с помощью других приложений. Например, skanlite или xsane.

 

Последнее изменение: 13.07.2020 19:28:22
Комментарии
Добавляя комментарий, убедитесь, что он соответствует теме. Подумайте, будет ли он интересен другим. Спам, умышленная реклама и личная переписка не допускаются. Соблюдайте правила русского языка. Комментарии публикуются после проверки модератором и могут быть удалены без объяснения причин. Ответы на заданные в комментариях вопросы могут исходить от любого пользователя и являются неофициальными.
Импортозамещение
Год только начался, а IT-отрасль уже cтолкнулась с «неоднозначными законодательными инициативами», констатирует президент ассоциации производителей ПО «Руссофт» Валентин Макаров. Речь о проекте постановления правительства (подробности здесь), которое предусматривает новые категории IT-компаний, имеющих право на государственную аккредитации, а именно – IT-компании с преимущественным участием РФ и органы государственной власти. Такие компании действительно широко практикуют так называемый […] Сообщение Прирав... 
Для общественного обсуждения опубликован разработанный Минцифры проект постановления правительства, определяющего условия, при которых IT-компании с преимущественным участием РФ и органы государственной власти смогут получить государственную аккредитацию и доступ к соответствующим налоговым льготам. Как писал D-Russia.ru, председатель правительства Михаил Мишустин по итогам форума ЦИПР-2025 поручил подготовить предложения по внесению изменений в Налоговый кодекс и порядок аккредитации […] Сообщение Минцифры... 
«Ростелеком» завершил программу импортозамещения и обновил ИТ-ландшафт системы мониторинга до целевой архитектуры. Программа стартовала в 2022 году и включала создание собственных систем для сбора, фильтрации и анализа данных о работе сети, сообщила компания. По итогам внедрения производительность службы мониторинга выросла в 2,9 раза, а время информирования и обработки аварий сократилось в 5 раз. Все решения […] Сообщение «Ростелеком» сообщил об окончании импортозамещения систем сбора, фильтрации и анализа... 
Генеральный партнёр ОАО «РЖД», «РЖД цифровой», сообщил о «цифровых итогах» 2025 года – на отечественное ПО переведены восемь IT-систем, из них пять разработаны внутри самого ОАО «РЖД». На отечественное программное обеспечение переведены и включены в реестр российского ПО: Система пономерного учёта локомотивов (ЕС ПУЛ) – разработчик ООО «ОЦРВ». Система управления инфраструктурой (ЕАМ) – разработчик ООО […] Сообщение В 2025 году 60% отечественных программных продуктов ОАО «РЖД» разработаны собственными силами... 
Распоряжением правительства утверждён перечень видов экономической деятельности Общероссийского классификатора видов экономической деятельности (ОКВЭД) для целей применения единого пониженного тарифа страховых взносов. Как поясняет Минфин (разработчик документа), в список вошли отрасли, приоритетные для поддержки малого и среднего предпринимательства (МСП) и развития экономики страны. В том числе в перечне содержатся следующие виды деятельности: деятельность в сфере телекоммуникаций […] Сообщение Правительс... 
Институт статистических исследований и экономики знаний НИУ ВШЭ опубликовал отчёт о тенденциях развития сектора информационно-коммуникационных технологий (ИКТ) и его сегментов (IT-отрасли, телекоммуникаций, производства ИКТ-оборудования, оптовой торговли ИКТ-товарами) по итогам девяти месяцев 2025 года. Как следует из отчёта, сектор ИКТ наращивает реализацию товаров, работ, услуг кратно быстрее, чем экономика в целом (как по итогам девяти месяцев, […] Сообщение Отечественная индустрия IT и телеком – итоги д... 
Правительство отменило полномочия Минцифры по осуществлению централизованной закупки лицензий офисного программного обеспечения (ПО) и ПО в сфере информационной безопасности для федеральных органов исполнительной власти (ФОИВ). В 2018 году Минцифры назначили ответственной за закупку офисного ПО и ПО в сфере ИБ. По результатам проведённого в 2020 году анализа исполнения Минцифры постановления № 658 было установлено, что […] Сообщение Постановлением правительства прекращаются централизованные закупки Минцифры... 
Победителей XII ежегодного открытого республиканского конкурса компьютерных проектов «КИТ-2025» наградили в Симферополе – крымские школьники и студенты получили дипломы и ценные призы, сообщает министерство внутренней политики, информации и связи Республики Крым. В этом году на конкурс было подано более 100 работ из всех уголков Крыма. Первые места в номинациях заняли: «Компьютерный дизайн и 3D моделирование» […] Сообщение В Симферополе наградили победителей республиканского конкурса компьютерных проектов «... 
Компания Yadro (входит в «ИКС Холдинг») в партнерстве с Центром информационных технологий (ЦИТ) Республики Дагестан реализовала проект по созданию современной масштабируемой IT-инфраструктуры на основе комплексного решения отечественного производства, сообщает компания. Yadro поставила систему хранения данных и сетевые коммутаторы, что позволило значительно повысить производительность, надёжность и безопасность цифровой среды для государственных и социальных сервисов региона. В […] Сообщение Yadro и ЦИТ Даг... 
«Роскосмос» заключил государственный контракт с НПО им. С.А. Лавочкина на выполнение до 2036 работ года по созданию российской лунной электростанции, сообщает госкорпорация в среду. Как сказано в сообщении, назначение лунной электростанции – долговременное энергоснабжение потребителей (луноходы, обсерватория) российской лунной программы, а также объектов инфраструктуры Международной научной лунной станции (в том числе объектов зарубежных партнёров). Проект […] Сообщение Заключён госконтракт на создание росс... 
    Наверх       На главную страницу       Адрес электропочты Рейтинг@Mail.ru
Данный интернет-сайт носит исключительно информационный характер, и ни при каких условиях информационные
материалы и цены, размещенные на сайте, не являются публичной офертой, определяемой положениями Статьи 437 ГК РФ.

Сергей Волков – эксперт в области информационных технологий © 2011−2026
Работает система управления сайтом «Публикатор 1.9» © 2004−2026