На главную страницу На главную страницу Помоги больным детям! Их можно спасти!
 
Справочные материалы ←

Как распознать текст отсканированного документа?

В Ульяновск.BSD для распознавания текстов можно использовать tesseract. Это движок оптического распознавания символов (OCR) с открытым исходным кодом, который является одной из самых популярных и качественных OCR-библиотек. Его установка достаточно проста:

pkg install -r latest tesseract

Tesseract – это консольное приложение. Поэтому для удобства работы с ним лучше использовать какой-либо GUI-интерфейс. Одним из таких интерфейсов является приложение VietOCR. С помощью VietOCR можно не только распознавать текст на единичных страницах или в выбранных блоках изображения, но и производить пакетное распознавание текста во множестве изображений, находящихся в одном каталоге. Актуальную версию приложения в виде zip-файла можно скачать со страницы VietOCR на SourceForge. На момент создания данного документа это был файл VietOCR-5.6.1.zip. Для установки приложения достаточно просто распаковать скачанный zip-архив в каталог /usr/local:

unzip -d /usr/local VietOCR-5.6.1.zip

VietOCR – это Java-приложение. Поэтому для его запуска необходимо установить Java-машину:

pkg install -r latest openjdk8-jre

После этого можно запускать VietOCR из командной строки в Терминале:

env _JAVA_OPTIONS='-Dawt.useSystemAAFontSettings=on' java -jar /usr/local/VietOCR3/VietOCR.jar

Или скачайте файл VietOCR.desktop и сохраните его на рабочем столе и в каталоге /usr/local/share/applications/. В результате этого на рабочем столе и в меню появится ярлык для запуска VietOCR.

Примечание 1:

Для возможности проверки орфографии необходимо скачать языковой пакет. Сделать это можно через меню «Настройки» → «Загрузить языковые данные...».

Примечание 2:

Функция сканирования в VietOCR в настоящее время не работает. Поэтому сканирование и подготовку изображений для распознавания необходимо производить с помощью других приложений. Например, skanlite или xsane.

 

Последнее изменение: 13.07.2020 19:28:22
Комментарии
Добавляя комментарий, убедитесь, что он соответствует теме. Подумайте, будет ли он интересен другим. Спам, умышленная реклама и личная переписка не допускаются. Соблюдайте правила русского языка. Комментарии публикуются после проверки модератором и могут быть удалены без объяснения причин. Ответы на заданные в комментариях вопросы могут исходить от любого пользователя и являются неофициальными.
Импортозамещение
Перечень маршрутизаторов, поддерживающих возможность организации сервиса гостевого Wi-Fi с авторизацией расширен за счёт интеграции собственной Wi-Fi платформы с оборудованием российских производителей, сообщает «Ростелеком» во вторник. Клиенты компании в сегменте малого бизнеса, которые уже пользуются базовой услугой «Интернет для бизнеса», смогут организовать сеть Wi-Fi для своих гостей/покупателей без дополнительных затрат на покупку или аренду отдельной Wi-Fi-точки […] Сообщение «Ростелеком» расширил пе... 
Об авторе: Наталья Фёдорова, директор продукта GEMS ГК Gems Универсальная региональная витрина данных (УРВД) — центральный технологический компонент, создаваемый в рамках развития Национальной системы управления данными (НСУД). Задача УРВД — изменить логику межведомственного взаимодействия при оказании государственных услуг. Вместо множественных запросов в закрытые информационные системы различных ведомств витрина предоставляет заранее подготовленные и согласованные данные, которые […] Сообщение Региональны... 
Рынок искусственного интеллекта (ИИ) переживает фазу стремительного роста, однако инфраструктурная база для его масштабирования остается ограниченной: только 9% организаций в России полностью обеспечены вычислительной инфраструктурой для ИИ, свидетельствуют результаты исследования IT-холдинга «Т1» «Рынок ИИ-ускорителей: обзор российского рынка GPU для задач в области ИИ». Больше половины отечественных компаний (51%) при этом нуждаются в вычислительных ресурсах, ещё […] Сообщение Вычислительной инфраструктур... 
Бесплатная акселерационная программа «Горький.Акселератор» от АНО «Горький Тех» стартовала для IT-компаний в Нижнем Новгороде, сообщает региональное Минцифры. Участие в программе принимают 15 нижегородских IT-компаний, имеющих собственный продукт и прошедших экспертный отбор. Программа акселератора предполагает смешанный формат обучения. На онлайн-вебинарах представителям IT-компаний расскажут, как масштабировать свой продукт. На очных встречах будут разбирать реальные задачи — от […] Сообщение В Нижнем Нов... 
Более восьми миллионов юридических лиц и индивидуальных предпринимателей получили возможность интегрировать бизнес в национальный мессенджер через «Платформу для партнёров Max», сообщает пресс-служба приложения. Напомним, Max открыл «Платформу для партнёров» в октябре 2025 года. На первых этапах присоединиться к платформе смогли зарегистрированные в России компании, которые разместили приложение в RuStore или зарегистрировались на платформе МСП.РФ. Теперь […] Сообщение Max распространил возможности для авто... 
Об авторе: Григорий Прохватилов, министр цифрового развития, массовых коммуникаций и связи Запорожской области Мобильная связь и проводной Интернет В 2025 году мы продолжили наращивать инфраструктуру связи. За прошедший год мобильные операторы «+7Телеком», «Миранда» и «Феникс» построили и запустили в Запорожской области 448 базовых станций. Теперь их общее количество в регионе приближается к 3400. Конечно, инфраструктура, […] Сообщение Результаты работы Минцифры Запорожской области в 2025 году появились сна... 
Официальным партнёром номинации «Легенды инфобеза» в рамках премии «ЦИПР Диджитал-2026» стал «Кибердом» — проект, который объединяет кибербез-комьюнити, общество, бизнес и государство, сообщают организаторы мероприятия. Компания окажет поддержку оргкомитету премии при отборе проектов в области информационной безопасности, а также сформирует специальное жюри номинации из ведущих представителей отрасли и государственных регуляторов. Номинация «Легенды инфобеза» направлена на развитие […] Сообщение «Кибердом» ... 
Об авторе: Максим Бартыков, исполняющий обязанности министра цифрового развития Ярославской области Ярославская область продолжает системное внедрение цифровых технологий в ключевые отрасли экономики. С 2025 года эта деятельность осуществляется в рамках нового национального проекта «Экономика данных и цифровая трансформация государства», что подчёркивает статус цифровой трансформации как одной из приоритетных национальных целей Российской Федерации. Особое внимание уделяется […] Сообщение Итоги цифровизации... 
Об авторе: Игорь Фетисов, министр информационных технологий, связи и цифрового развития Челябинской области Министерство информационных технологий, связи и цифрового развития Челябинской области обеспечивает развитие сферы цифровых технологий региона, внедрение электронных государственных сервисов, направленных на улучшение качества жизни людей и ведение предпринимательской деятельности, создаёт благоприятные условия для развития конкурентной среды для организаций, предоставляющих услуги в сфере […] Сообщен... 
С 21 по 23 мая 2026 года в Нижнем Новгороде пройдёт второй городской технологический фестиваль «Тех-Френдли Викенд», организованный в рамках конференции ЦИПР, сообщает оргкомитет мероприятия. Центральной темой фестиваля станет разговор о будущем — и о том, как его контуры формируются уже сегодня. Эксперты обсудят долгосрочные технологические тренды с горизонтом в несколько десятилетий: как изменения в […] Сообщение Объявлена программа проводящегося в ходе ЦИПР фестиваля «Тех-Френдли Викенд» появились сначал... 
    Наверх       На главную страницу       Адрес электропочты Рейтинг@Mail.ru
Данный интернет-сайт носит исключительно информационный характер, и ни при каких условиях информационные
материалы и цены, размещенные на сайте, не являются публичной офертой, определяемой положениями Статьи 437 ГК РФ.

Сергей Волков – эксперт в области информационных технологий © 2011−2026
Работает система управления сайтом «Публикатор 1.9» © 2004−2026