Справочные материалы ←
Как распознать текст отсканированного документа?
В Ульяновск.BSD для распознавания текстов можно использовать tesseract. Это движок оптического распознавания символов (OCR) с открытым исходным кодом, который является одной из самых популярных и качественных OCR-библиотек. Его установка достаточно проста:
pkg install -r latest tesseract
Tesseract – это консольное приложение. Поэтому для удобства работы с ним лучше использовать какой-либо GUI-интерфейс. Одним из таких интерфейсов является приложение VietOCR. С помощью VietOCR можно не только распознавать текст на единичных страницах или в выбранных блоках изображения, но и производить пакетное распознавание текста во множестве изображений, находящихся в одном каталоге. Актуальную версию приложения в виде zip-файла можно скачать со страницы VietOCR на SourceForge. На момент создания данного документа это был файл VietOCR-5.6.1.zip. Для установки приложения достаточно просто распаковать скачанный zip-архив в каталог /usr/local:
unzip -d /usr/local VietOCR-5.6.1.zip
VietOCR – это Java-приложение. Поэтому для его запуска необходимо установить Java-машину:
pkg install -r latest openjdk8-jre
После этого можно запускать VietOCR из командной строки в Терминале:
env _JAVA_OPTIONS='-Dawt.useSystemAAFontSettings=on' java -jar /usr/local/VietOCR3/VietOCR.jar
Или скачайте файл VietOCR.desktop и сохраните его на рабочем столе и в каталоге /usr/local/share/applications/. В результате этого на рабочем столе и в меню появится ярлык для запуска VietOCR.
Примечание 1:
Для возможности проверки орфографии необходимо скачать языковой пакет. Сделать это можно через меню «Настройки» → «Загрузить языковые данные...».
Примечание 2:
Функция сканирования в VietOCR в настоящее время не работает. Поэтому сканирование и подготовку изображений для распознавания необходимо производить с помощью других приложений. Например, skanlite или xsane.
Последнее изменение:
13.07.2020 19:28:22
Комментарии
Добавляя комментарий, убедитесь, что он соответствует теме.
Подумайте, будет ли он интересен другим. Спам, умышленная реклама и личная
переписка не допускаются. Соблюдайте правила русского языка. Комментарии
публикуются после проверки модератором и могут быть удалены без объяснения
причин. Ответы на заданные в комментариях вопросы могут исходить от любого
пользователя и являются неофициальными.
|
');
// document.write('');
// document.write('');
//}
//-->
Импортозамещение
Перечень маршрутизаторов, поддерживающих возможность организации сервиса гостевого Wi-Fi с авторизацией расширен за счёт интеграции собственной Wi-Fi платформы с оборудованием российских производителей, сообщает «Ростелеком» во вторник. Клиенты компании в сегменте малого бизнеса, которые уже пользуются базовой услугой «Интернет для бизнеса», смогут организовать сеть Wi-Fi для своих гостей/покупателей без дополнительных затрат на покупку или аренду отдельной Wi-Fi-точки […]
Сообщение «Ростелеком» расширил пе... →
Об авторе: Наталья Фёдорова, директор продукта GEMS ГК Gems Универсальная региональная витрина данных (УРВД) — центральный технологический компонент, создаваемый в рамках развития Национальной системы управления данными (НСУД). Задача УРВД — изменить логику межведомственного взаимодействия при оказании государственных услуг. Вместо множественных запросов в закрытые информационные системы различных ведомств витрина предоставляет заранее подготовленные и согласованные данные, которые […]
Сообщение Региональны... →
Рынок искусственного интеллекта (ИИ) переживает фазу стремительного роста, однако инфраструктурная база для его масштабирования остается ограниченной: только 9% организаций в России полностью обеспечены вычислительной инфраструктурой для ИИ, свидетельствуют результаты исследования IT-холдинга «Т1» «Рынок ИИ-ускорителей: обзор российского рынка GPU для задач в области ИИ». Больше половины отечественных компаний (51%) при этом нуждаются в вычислительных ресурсах, ещё […]
Сообщение Вычислительной инфраструктур... →
Бесплатная акселерационная программа «Горький.Акселератор» от АНО «Горький Тех» стартовала для IT-компаний в Нижнем Новгороде, сообщает региональное Минцифры. Участие в программе принимают 15 нижегородских IT-компаний, имеющих собственный продукт и прошедших экспертный отбор. Программа акселератора предполагает смешанный формат обучения. На онлайн-вебинарах представителям IT-компаний расскажут, как масштабировать свой продукт. На очных встречах будут разбирать реальные задачи — от […]
Сообщение В Нижнем Нов... →
Более восьми миллионов юридических лиц и индивидуальных предпринимателей получили возможность интегрировать бизнес в национальный мессенджер через «Платформу для партнёров Max», сообщает пресс-служба приложения. Напомним, Max открыл «Платформу для партнёров» в октябре 2025 года. На первых этапах присоединиться к платформе смогли зарегистрированные в России компании, которые разместили приложение в RuStore или зарегистрировались на платформе МСП.РФ. Теперь […]
Сообщение Max распространил возможности для авто... →
Об авторе: Григорий Прохватилов, министр цифрового развития, массовых коммуникаций и связи Запорожской области Мобильная связь и проводной Интернет В 2025 году мы продолжили наращивать инфраструктуру связи. За прошедший год мобильные операторы «+7Телеком», «Миранда» и «Феникс» построили и запустили в Запорожской области 448 базовых станций. Теперь их общее количество в регионе приближается к 3400. Конечно, инфраструктура, […]
Сообщение Результаты работы Минцифры Запорожской области в 2025 году появились сна... →
Официальным партнёром номинации «Легенды инфобеза» в рамках премии «ЦИПР Диджитал-2026» стал «Кибердом» — проект, который объединяет кибербез-комьюнити, общество, бизнес и государство, сообщают организаторы мероприятия. Компания окажет поддержку оргкомитету премии при отборе проектов в области информационной безопасности, а также сформирует специальное жюри номинации из ведущих представителей отрасли и государственных регуляторов. Номинация «Легенды инфобеза» направлена на развитие […]
Сообщение «Кибердом» ... →
Об авторе: Максим Бартыков, исполняющий обязанности министра цифрового развития Ярославской области Ярославская область продолжает системное внедрение цифровых технологий в ключевые отрасли экономики. С 2025 года эта деятельность осуществляется в рамках нового национального проекта «Экономика данных и цифровая трансформация государства», что подчёркивает статус цифровой трансформации как одной из приоритетных национальных целей Российской Федерации. Особое внимание уделяется […]
Сообщение Итоги цифровизации... →
Об авторе: Игорь Фетисов, министр информационных технологий, связи и цифрового развития Челябинской области Министерство информационных технологий, связи и цифрового развития Челябинской области обеспечивает развитие сферы цифровых технологий региона, внедрение электронных государственных сервисов, направленных на улучшение качества жизни людей и ведение предпринимательской деятельности, создаёт благоприятные условия для развития конкурентной среды для организаций, предоставляющих услуги в сфере […]
Сообщен... →
С 21 по 23 мая 2026 года в Нижнем Новгороде пройдёт второй городской технологический фестиваль «Тех-Френдли Викенд», организованный в рамках конференции ЦИПР, сообщает оргкомитет мероприятия. Центральной темой фестиваля станет разговор о будущем — и о том, как его контуры формируются уже сегодня. Эксперты обсудят долгосрочные технологические тренды с горизонтом в несколько десятилетий: как изменения в […]
Сообщение Объявлена программа проводящегося в ходе ЦИПР фестиваля «Тех-Френдли Викенд» появились сначал... →
|