На главную страницу На главную страницу Помоги больным детям! Их можно спасти!
 
Справочные материалы ←

Как распознать текст отсканированного документа?

В Ульяновск.BSD для распознавания текстов можно использовать tesseract. Это движок оптического распознавания символов (OCR) с открытым исходным кодом, который является одной из самых популярных и качественных OCR-библиотек. Его установка достаточно проста:

pkg install -r latest tesseract

Tesseract – это консольное приложение. Поэтому для удобства работы с ним лучше использовать какой-либо GUI-интерфейс. Одним из таких интерфейсов является приложение VietOCR. С помощью VietOCR можно не только распознавать текст на единичных страницах или в выбранных блоках изображения, но и производить пакетное распознавание текста во множестве изображений, находящихся в одном каталоге. Актуальную версию приложения в виде zip-файла можно скачать со страницы VietOCR на SourceForge. На момент создания данного документа это был файл VietOCR-5.6.1.zip. Для установки приложения достаточно просто распаковать скачанный zip-архив в каталог /usr/local:

unzip -d /usr/local VietOCR-5.6.1.zip

VietOCR – это Java-приложение. Поэтому для его запуска необходимо установить Java-машину:

pkg install -r latest openjdk8-jre

После этого можно запускать VietOCR из командной строки в Терминале:

env _JAVA_OPTIONS='-Dawt.useSystemAAFontSettings=on' java -jar /usr/local/VietOCR3/VietOCR.jar

Или скачайте файл VietOCR.desktop и сохраните его на рабочем столе и в каталоге /usr/local/share/applications/. В результате этого на рабочем столе и в меню появится ярлык для запуска VietOCR.

Примечание 1:

Для возможности проверки орфографии необходимо скачать языковой пакет. Сделать это можно через меню «Настройки» → «Загрузить языковые данные...».

Примечание 2:

Функция сканирования в VietOCR в настоящее время не работает. Поэтому сканирование и подготовку изображений для распознавания необходимо производить с помощью других приложений. Например, skanlite или xsane.

 

Последнее изменение: 13.07.2020 19:28:22
Комментарии
Добавляя комментарий, убедитесь, что он соответствует теме. Подумайте, будет ли он интересен другим. Спам, умышленная реклама и личная переписка не допускаются. Соблюдайте правила русского языка. Комментарии публикуются после проверки модератором и могут быть удалены без объяснения причин. Ответы на заданные в комментариях вопросы могут исходить от любого пользователя и являются неофициальными.
Импортозамещение
Об авторе: Григорий Прохватилов, министр цифрового развития, массовых коммуникаций и связи Запорожской области Мобильная связь и проводной Интернет В 2025 году мы продолжили наращивать инфраструктуру связи. За прошедший год мобильные операторы «+7Телеком», «Миранда» и «Феникс» построили и запустили в Запорожской области 448 базовых станций. Теперь их общее количество в регионе приближается к 3400. Конечно, инфраструктура, […] Сообщение Результаты работы Минцифры Запорожской области в 2025 году появились сна... 
Официальным партнёром номинации «Легенды инфобеза» в рамках премии «ЦИПР Диджитал-2026» стал «Кибердом» — проект, который объединяет кибербез-комьюнити, общество, бизнес и государство, сообщают организаторы мероприятия. Компания окажет поддержку оргкомитету премии при отборе проектов в области информационной безопасности, а также сформирует специальное жюри номинации из ведущих представителей отрасли и государственных регуляторов. Номинация «Легенды инфобеза» направлена на развитие […] Сообщение «Кибердом» ... 
Об авторе: Максим Бартыков, исполняющий обязанности министра цифрового развития Ярославской области Ярославская область продолжает системное внедрение цифровых технологий в ключевые отрасли экономики. С 2025 года эта деятельность осуществляется в рамках нового национального проекта «Экономика данных и цифровая трансформация государства», что подчёркивает статус цифровой трансформации как одной из приоритетных национальных целей Российской Федерации. Особое внимание уделяется […] Сообщение Итоги цифровизации... 
Об авторе: Игорь Фетисов, министр информационных технологий, связи и цифрового развития Челябинской области Министерство информационных технологий, связи и цифрового развития Челябинской области обеспечивает развитие сферы цифровых технологий региона, внедрение электронных государственных сервисов, направленных на улучшение качества жизни людей и ведение предпринимательской деятельности, создаёт благоприятные условия для развития конкурентной среды для организаций, предоставляющих услуги в сфере […] Сообщен... 
С 21 по 23 мая 2026 года в Нижнем Новгороде пройдёт второй городской технологический фестиваль «Тех-Френдли Викенд», организованный в рамках конференции ЦИПР, сообщает оргкомитет мероприятия. Центральной темой фестиваля станет разговор о будущем — и о том, как его контуры формируются уже сегодня. Эксперты обсудят долгосрочные технологические тренды с горизонтом в несколько десятилетий: как изменения в […] Сообщение Объявлена программа проводящегося в ходе ЦИПР фестиваля «Тех-Френдли Викенд» появились сначал... 
Мессенджер Max начал тестировать создание стикеров вместе с авторами публичных каналов – блогерами, звёздами и СМИ, сообщает пресс-служба Max в среду. Присоединиться к тестированию могут авторы категории «А+» с помощью чат-бота «Стикеры в МАХ». Для создания набора стикеров в МАХ необходимо: открыть чат-бот и нажать на кнопку «Начать»; нажать на кнопку «Открыть» в левом нижнем […] Сообщение Max разрешил пользователям создавать свои стикеры появились сначала на Digital Russia. 
Обновлена единая цифровая стратегия госкорпорации «Росатом», которая будет определять цифровую трансформацию компании до 2027 года включительно, сообщила компания во вторник. Обновлённый документ согласован с Минцифры РФ и Минэнерго РФ. Его необходимость обусловлена обновленными методическими рекомендациями по цифровой трансформации государственных корпораций и компаний с государственным участием, сказано в сообщении. Обновлённая стратегия базируется на достижениях «Росатома» в […] Сообщение «Росатом» сообщ... 
Московский инновационный кластер открыл первый в России испытательный центр полного цикла, предназначенный для тестирования коммунальных, складских, логистических, транспортных, мониторинговых, строительных и многих других беспилотных роботизированных систем, сообщает мэр Москвы Сергей Собянин. Подать заявку на проведение испытаний можно на сайте i.moscow. Основная площадка испытательного центра расположена в инновационном центре «Сколково», также будет использоваться полигон Федерального центра […] Сообщен... 
Новые нормативные и экономические реалии и возможные точки роста обсуждали во вторник на пресс-конференции ассоциации «Руссофт» в Москве с участием представителей IT-компаний. Там побывала и корреспондент D-Russia.ru. Как следует из обсуждения, на IT-бизнес в настоящее время более всего влияют новые налоги, сокращение инвестиций, тренд на внутреннюю разработку ПО крупными заказчиками, развитие ИИ-технологий (государство и бизнес […] Сообщение Рост налогов и сокращение инвестиций – что 2026 год преподнёс оте... 
Региональная индустриальная лаборатория микроэлектроники и радиофизики официально открылась на базе Челябинского государственного университета, сообщает Минцифры Челябинской области во вторник. Лаборатория призвана стать центром развития микроэлектроники, приборостроения и Интернета вещей (IoT). Ключевые направления: подготовка кадров через практико-ориентированное обучение (студенты будут осваивать полный цикл разработки электронных изделий на промышленном оборудовании, работая с реальными запросами бизнес... 
    Наверх       На главную страницу       Адрес электропочты Рейтинг@Mail.ru
Данный интернет-сайт носит исключительно информационный характер, и ни при каких условиях информационные
материалы и цены, размещенные на сайте, не являются публичной офертой, определяемой положениями Статьи 437 ГК РФ.

Сергей Волков – эксперт в области информационных технологий © 2011−2026
Работает система управления сайтом «Публикатор 1.9» © 2004−2026