Ульяновск.BSD (ULBSD) - операционная система для персонального компьютера. Как распознать текст отсканированного документа? -

Общая информация | Частным клиентам | Корпоративным клиентам | Справочные материалы | Обратная связь

Справочные материалы ←

Как распознать текст отсканированного документа?

В Ульяновск.BSD для распознавания текстов можно использовать tesseract. Это движок оптического распознавания символов (OCR) с открытым исходным кодом, который является одной из самых популярных и качественных OCR-библиотек. Его установка достаточно проста:

pkg install -r latest tesseract

Tesseract – это консольное приложение. Поэтому для удобства работы с ним лучше использовать какой-либо GUI-интерфейс. Одним из таких интерфейсов является приложение VietOCR. С помощью VietOCR можно не только распознавать текст на единичных страницах или в выбранных блоках изображения, но и производить пакетное распознавание текста во множестве изображений, находящихся в одном каталоге. Актуальную версию приложения в виде zip-файла можно скачать со страницы VietOCR на SourceForge. На момент создания данного документа это был файл VietOCR-5.6.1.zip. Для установки приложения достаточно просто распаковать скачанный zip-архив в каталог /usr/local:

unzip -d /usr/local VietOCR-5.6.1.zip

VietOCR – это Java-приложение. Поэтому для его запуска необходимо установить Java-машину:

pkg install -r latest openjdk8-jre

После этого можно запускать VietOCR из командной строки в Терминале:

env _JAVA_OPTIONS='-Dawt.useSystemAAFontSettings=on' java -jar /usr/local/VietOCR3/VietOCR.jar

Или скачайте файл VietOCR.desktop и сохраните его на рабочем столе и в каталоге /usr/local/share/applications/. В результате этого на рабочем столе и в меню появится ярлык для запуска VietOCR.

Примечание 1:

Для возможности проверки орфографии необходимо скачать языковой пакет. Сделать это можно через меню «Настройки» → «Загрузить языковые данные...».

Примечание 2:

Функция сканирования в VietOCR в настоящее время не работает. Поэтому сканирование и подготовку изображений для распознавания необходимо производить с помощью других приложений. Например, skanlite или xsane.

Последнее изменение: 13.07.2020 19:28:22

Комментарии

Добавляя комментарий, убедитесь, что он соответствует теме. Подумайте, будет ли он интересен другим. Спам, умышленная реклама и личная переписка не допускаются. Соблюдайте правила русского языка. Комментарии публикуются после проверки модератором и могут быть удалены без объяснения причин. Ответы на заданные в комментариях вопросы могут исходить от любого пользователя и являются неофициальными.

Импортозамещение

Китай сообщил о модернизации своей системы спутниковой навигации

Китайская навигационная спутниковая система «Бэйдоу» (BeiDou) модернизирована на орбите, сообщает Синьхуа. Группировка «Бэйдоу» состоит из 50 спутников, она способна обеспечивать точность глобального позиционирования до 10 м, точность измерения скорости до 0,2 м/с и точность синхронизации времени в пределах 20 наносекунд. Благодаря модернизации, точность горизонтального позиционирования системы повысилась до 0,3 м, вертикального – до 0,6 м. […] Сообщение Китай сообщил о модернизации своей системы спутниково... →

Китай начал массовое производство литографических DUV-машин — СМИ

Китайская госкомпания Aishengna Electronic Technology Group, о которой мало что известно, приступила к серийному производству установок иммерсионной литографии в глубоком ультрафиолете (DUV) собственной разработки — технологии, критически важной для производства чипов, сообщает asia.nikkei.com. Рынок таких машин принадлежит фактически одной компании, голландской ASML. Успешное внедрение собственного DUV-оборудования обеспечит китайским производителям чипов независимость от зарубежных литографических DUV-сис... →

В США запретили китайских роботов

Администрация президента США Дональда Трампа объявила во вторник о запрете на импорт новых китайских роботов и инверторов, позволяющих возобновляемым источникам энергии и батареям подключаться к электросетям и оборудованию центров обработки данных, пишет Reuters. «Эти устройства создают уязвимости в цепочках поставок, что может подорвать экономическую и национальную безопасность США, а также создать угрозу кибербезопасности для критически […] Сообщение В США запретили китайских роботов появились сначала на ... →

Технологии изготовления микросхем на TSMC – цифры

Всего 3% выручки главного мирового лидера в производстве микросхем, тайванской TSMC, приходится на чипы, изготовленные по новейшему 2-нм техпроцессу (2N), сообщает techpowerup.com в понедельник – несмотря на то, что компания нарастила выпуск до 20 тысяч 2-нм пластин в месяц. Техпроцесс 3-нм даёт TSMС 30% выручки, а 5-нм техпроцесс – 33%. Освоение N2 по сравнению с […] Сообщение Технологии изготовления микросхем на TSMC – цифры появились сначала на Digital Russia. →

Незрелые SCADA и открытые АСУ ТП: две стороны одной проблемы

Об авторе: Станислав Павловский, коммерческий директор «Атомик Софт», участник АРПП «Отечественный софт» В отечественной промышленной автоматизации сегодня идут два спора, которые не встречаются в одной аудитории. В первом инженеры эксплуатации выясняют с вендорами, доросли ли российские SCADA (Supervisory Control And Data Acquisition – ПО для сбора данных об объектах наблюдения и их мониторинга состояния – […] Сообщение Незрелые SCADA и открытые АСУ ТП: две стороны одной проблемы появились сначала на Digit... →

Рынок отечественных ПАК вырос, но зависит от иностранной инфраструктуры – исследование

Российский рынок программно-аппаратных комплексов (ПАК) обработки данных вырос с 4,1 миллиарда рублей в 2022 году до 12,6 миллиарда рублей в 2025 году, однако его развитие пока во многом обеспечивается ранее внедрённой зарубежной инфраструктурой, следует из аналитического отчёта «Импортозамещение программно-аппаратных комплексов обработки данных: история, динамика, перспективы», подготовленного АНО «Цифровая экономика» совместно с компаниями J’son & Partners […] Сообщение Рынок отечественных ПАК вырос, но з... →

Анализировать IT

Во вторник состоялось мероприятие «Аналитический MeetUp «Портрет российского IT-рынка: тренды, аудитория, инструменты»; присутствовали аналитические агентства и их контрагенты, IT-компании и их ассоциации – АПКИТ, АРПП. Сведения от аналитиков «Митап» значит «встреча профессионалов, не так чтобы формальная». Что организаторам мешало обойтись без английского, не знаем, но вынуждены потратить абзац на это объяснение, потому что читатель про […] Сообщение Анализировать IT появились сначала на Digital Russia. →

Подробности о Шанхайском соглашении по ИИ

Подписанное в Китае 16 июля международное соглашение в области искусственного интеллекта не включает обязательств по использованию странами-участниками конкретных моделей ИИ и не регулирует передачу технологий между ними, однако предусматривает совместные исследования и пилотные проекты стран, подписавших соглашение, сообщает «Коммерсант» со ссылкой на полученную от Минцифры информацию. Напомним, соглашение об учреждении Всемирной организации сотрудничества в области […] Сообщение Подробности о Шанхайском с... →

«Ростелеком» выпустил новую версию медицинской информационной системы «Медиалог»

«Пост Модерн Текнолоджи» («П.М.Т.», входит в кластер «Ростелеком Здоровье») представил первый релиз новой отечественной медицинской информационной системы (МИС) «Медиалог 2.0», сообщает «Ростелеком» в среду. Система обеспечивает гибкую настройку функциональных модулей и автоматизацию деятельности медицинских организаций любого масштаба и специализации. По данным разработчика, «Медиалог» — одна из самых распространенных медицинских информационных систем России, предназначенная для комплексной […] Сообщение «... →

Демо-центр московской технологической платформы «МосТех» доступен в «Сколково» — ДИТ Москвы

Посетителям делового пространства «МосХаб.Сколково» доступен демо-центр городской технологической платформы «МосТех», которая включает в себя инструменты разработки, оборудование, операционные системы, офисные приложения и решения для организации работы центров обработки данных, сообщает департамент информационных технологий (ДИТ) Москвы во вторник. В демо-центре представлено оборудование под брендом «МосТех»: ноутбуки, моноблоки и мультимедийные панели, которые поставляются в органы власти и […] Сообщение ... →

Общая информация | Частным клиентам | Корпоративным клиентам | Справочные материалы | Обратная связь

Данный интернет-сайт носит исключительно информационный характер, и ни при каких условиях информационные
материалы и цены, размещенные на сайте, не являются публичной офертой, определяемой положениями Статьи 437 ГК РФ.
Сергей Волков – эксперт в области информационных технологий © 2011−2026
Работает система управления сайтом «Публикатор 1.9» © 2004−2026