На главную страницу На главную страницу Помоги больным детям! Их можно спасти!
 
Справочные материалы ←

Как распознать текст отсканированного документа?

В Ульяновск.BSD для распознавания текстов можно использовать tesseract. Это движок оптического распознавания символов (OCR) с открытым исходным кодом, который является одной из самых популярных и качественных OCR-библиотек. Его установка достаточно проста:

pkg install -r latest tesseract

Tesseract – это консольное приложение. Поэтому для удобства работы с ним лучше использовать какой-либо GUI-интерфейс. Одним из таких интерфейсов является приложение VietOCR. С помощью VietOCR можно не только распознавать текст на единичных страницах или в выбранных блоках изображения, но и производить пакетное распознавание текста во множестве изображений, находящихся в одном каталоге. Актуальную версию приложения в виде zip-файла можно скачать со страницы VietOCR на SourceForge. На момент создания данного документа это был файл VietOCR-5.6.1.zip. Для установки приложения достаточно просто распаковать скачанный zip-архив в каталог /usr/local:

unzip -d /usr/local VietOCR-5.6.1.zip

VietOCR – это Java-приложение. Поэтому для его запуска необходимо установить Java-машину:

pkg install -r latest openjdk8-jre

После этого можно запускать VietOCR из командной строки в Терминале:

env _JAVA_OPTIONS='-Dawt.useSystemAAFontSettings=on' java -jar /usr/local/VietOCR3/VietOCR.jar

Или скачайте файл VietOCR.desktop и сохраните его на рабочем столе и в каталоге /usr/local/share/applications/. В результате этого на рабочем столе и в меню появится ярлык для запуска VietOCR.

Примечание 1:

Для возможности проверки орфографии необходимо скачать языковой пакет. Сделать это можно через меню «Настройки» → «Загрузить языковые данные...».

Примечание 2:

Функция сканирования в VietOCR в настоящее время не работает. Поэтому сканирование и подготовку изображений для распознавания необходимо производить с помощью других приложений. Например, skanlite или xsane.

 

Последнее изменение: 13.07.2020 19:28:22
Комментарии
Добавляя комментарий, убедитесь, что он соответствует теме. Подумайте, будет ли он интересен другим. Спам, умышленная реклама и личная переписка не допускаются. Соблюдайте правила русского языка. Комментарии публикуются после проверки модератором и могут быть удалены без объяснения причин. Ответы на заданные в комментариях вопросы могут исходить от любого пользователя и являются неофициальными.
Импортозамещение
Компания РВБ (объединённая компания Wildberries & Russ) ввела в эксплуатацию второй собственный центр обработки данных, расположенный в особой экономической зоне «Дубна» в Московской области, сообщают «Ведомости». Первый ЦОД был запущен в подмосковной Электростали в 2023 году. Новый объект расширит вычислительную инфраструктуру маркетплейса Wildberries и других цифровых сервисов компании,. ЦОД в Дубне построен по модульному принципу. […] Сообщение Wildberries запустила второй собственный ЦОД в Подмосковье п... 
В чате искусственного интеллекта (ИИ) «Яндекс.Карт» стало возможно подбирать места по наличию позиции меню или услуги, пишут «Ведомости». При запросе с просьбой посоветовать ресторан с конкретной позицией в меню нейросеть изучит описание места, отзывы пользователей, меню и фотографии в карточке организации. После анализа всех источников чат объяснит свой выбор, покажет цену на позицию и оценку. […] Сообщение В «Яндекс.Картах» появились ИИ-рекомендации появились сначала на Digital Russia. 
Новый отбор особо значимых проектов (ОЗП), претендующих на гранты РФРИТ, начался в четверг, заявки принимаются до 27 апреля, решение о поддержке будет вынесено до конца мая, сообщает Минцифры. Заявки могут подать только заказчики, дорабатывающие и внедряющие ПО, а также группы заказчиков в форме консорциума. Прошедшие отбор проекты получат государственный грант до 50% от своей стоимости. […] Сообщение Начался новый грантовый отбор особо значимых IT-проектов появились сначала на Digital Russia. 
Искусственный интеллект чаще всего применяется IT-специалистами в рабочих процессах для написания кода (59,1%), разработки документации (51,1%), создания прототипов (43,7%), тестирования (35,3%) и дебаггинга (34,7%), свидетельствуют результаты опроса, проведённого компанией K2 Cloud и «Хабром» среди 872 айтишников. Топ инструментов: ChatGPT (59,1%), Deepseek (51,1%), Gemini (43,7%), Claude (35,3%), Cursor (34,7%). Каждый пятый специалист признался, что приукрашивал результаты […] Сообщение IT-специалисты ча... 
Об авторе: Маслеников Юрий Александрович, родился в 1937 году в Ленинграде, окончил ЛЭТИ по специальности инженер-электрик, с 1965 года сотрудник конструкторско-технологического бюро «Светлана-Микроэлектроника» (начальник отдела программного обеспечения управляющих систем, с 1994 – заместитель директора по научно-техническому развитию, с 1992 года главный конструктор описываемой в тексте разработки БИУС). С 2006 по 2015 годы начальник отдела НПО […] Сообщение Зачем нам своя микроэлектроника? появились снача... 
С двух недель до пяти дней сокращён срок сообщения в военный комиссариат об увольнении граждан, работающих в аккредитованных IT-организациях и пользующихся отсрочкой. «Отсрочка предоставляется призывной комиссией на основании списков, которые формируют и направляют работодатели через Единый портал. Основание для отсрочки связано с фактом работы в аккредитованной организации; при прекращении работы основание прекращается. Поэтому сведения об […] Сообщение Срок уведомления военкомата об увольнении сотрудника ... 
Деловая программа XI конференции «Цифровая индустрия промышленной России» (ЦИПР), которая пройдёт в этом году с 18 по 21 мая 2026 года в Нижнем Новгороде, будет посвящена промышленной конкурентоспособности России, основу которой составляет системное внедрение собственных комплексных цифровых продуктов в различные отрасли экономики, сообщает оргкомитет ЦИПР. Дискуссии затронут тему цифровой трансформации промышленности и развитие технологических систем […] Сообщение Сформирована деловая программа «ЦИПР-2026»... 
Законопроект о развитии и внедрении искусственного интеллекта необходимо внести в Госдуму до конца весенней сессии (19 июля 2026 – ред.), такая задача поставлена в среду правительством перед Минцифры. Текст законопроекта был опубликован для общественного обсуждения на прошлой неделе. В такие же сроки Минцифры должно внести в Госдуму проект федерального закона, направленного на стабилизацию финансового состояния […] Сообщение Правительство поставило Минцифры задачу внести в Госдуму законопроекты об ИИ и «Поч... 
Перечень маршрутизаторов, поддерживающих возможность организации сервиса гостевого Wi-Fi с авторизацией расширен за счёт интеграции собственной Wi-Fi платформы с оборудованием российских производителей, сообщает «Ростелеком» во вторник. Клиенты компании в сегменте малого бизнеса, которые уже пользуются базовой услугой «Интернет для бизнеса», смогут организовать сеть Wi-Fi для своих гостей/покупателей без дополнительных затрат на покупку или аренду отдельной Wi-Fi-точки […] Сообщение «Ростелеком» расширил пе... 
Об авторе: Наталья Фёдорова, директор продукта GEMS ГК Gems Универсальная региональная витрина данных (УРВД) — центральный технологический компонент, создаваемый в рамках развития Национальной системы управления данными (НСУД). Задача УРВД — изменить логику межведомственного взаимодействия при оказании государственных услуг. Вместо множественных запросов в закрытые информационные системы различных ведомств витрина предоставляет заранее подготовленные и согласованные данные, которые […] Сообщение Региональны... 
    Наверх       На главную страницу       Адрес электропочты Рейтинг@Mail.ru
Данный интернет-сайт носит исключительно информационный характер, и ни при каких условиях информационные
материалы и цены, размещенные на сайте, не являются публичной офертой, определяемой положениями Статьи 437 ГК РФ.

Сергей Волков – эксперт в области информационных технологий © 2011−2026
Работает система управления сайтом «Публикатор 1.9» © 2004−2026