Справочные материалы ←
Как распознать текст отсканированного документа?
В Ульяновск.BSD для распознавания текстов можно использовать tesseract. Это движок оптического распознавания символов (OCR) с открытым исходным кодом, который является одной из самых популярных и качественных OCR-библиотек. Его установка достаточно проста:
pkg install -r latest tesseract
Tesseract – это консольное приложение. Поэтому для удобства работы с ним лучше использовать какой-либо GUI-интерфейс. Одним из таких интерфейсов является приложение VietOCR. С помощью VietOCR можно не только распознавать текст на единичных страницах или в выбранных блоках изображения, но и производить пакетное распознавание текста во множестве изображений, находящихся в одном каталоге. Актуальную версию приложения в виде zip-файла можно скачать со страницы VietOCR на SourceForge. На момент создания данного документа это был файл VietOCR-5.6.1.zip. Для установки приложения достаточно просто распаковать скачанный zip-архив в каталог /usr/local:
unzip -d /usr/local VietOCR-5.6.1.zip
VietOCR – это Java-приложение. Поэтому для его запуска необходимо установить Java-машину:
pkg install -r latest openjdk8-jre
После этого можно запускать VietOCR из командной строки в Терминале:
env _JAVA_OPTIONS='-Dawt.useSystemAAFontSettings=on' java -jar /usr/local/VietOCR3/VietOCR.jar
Или скачайте файл VietOCR.desktop и сохраните его на рабочем столе и в каталоге /usr/local/share/applications/. В результате этого на рабочем столе и в меню появится ярлык для запуска VietOCR.
Примечание 1:
Для возможности проверки орфографии необходимо скачать языковой пакет. Сделать это можно через меню «Настройки» → «Загрузить языковые данные...».
Примечание 2:
Функция сканирования в VietOCR в настоящее время не работает. Поэтому сканирование и подготовку изображений для распознавания необходимо производить с помощью других приложений. Например, skanlite или xsane.
Последнее изменение:
13.07.2020 19:28:22
Комментарии
Добавляя комментарий, убедитесь, что он соответствует теме.
Подумайте, будет ли он интересен другим. Спам, умышленная реклама и личная
переписка не допускаются. Соблюдайте правила русского языка. Комментарии
публикуются после проверки модератором и могут быть удалены без объяснения
причин. Ответы на заданные в комментариях вопросы могут исходить от любого
пользователя и являются неофициальными.
|
');
// document.write('');
// document.write('');
//}
//-->
Импортозамещение
Цифровой кластер «X.Технологии» компании «Ростелеком» запустил специализированный сайт для технологических компаний, сообщает оператор в среду. Платформа предлагает широкий спектр сотрудничества: от привлечения инвестиций до интеграции готовых цифровых продуктов. На сайте представлена полная информация о направлениях деятельности цифрового кластера «Х.Технологии», включая практические решения действующих портфельных команд (13 технологических компаний). Решения кластера направлены на автоматизацию банковско... →
Поддержка мессенджера «ТамТам» будет прекращена, авторизация по номеру телефона в сервисе станет недоступна с 27 февраля, пишет РБК со ссылкой на сообщение VK. Мессенджер был запущен в июле 2016 года под названием «ОК сообщения». В мае 2017 приложение переименовали в «ТамТам», а в августе 2018 его стало возможно использовать независимо от «Одноклассников». В апреле 2018 […]
Сообщение Объявлено о закрытии мессенджера «ТамТам» 27 февраля появились сначала на Digital Russia. →
Более миллиона «приватных» каналов создали пользователи Max за неделю, их совокупная аудитория превысила десять миллионов человек, сообщает пресс-служба мессенджера во вторник. В среднем пользователи создают 145 тысяч приватных каналов в сутки. Рекордный показатель был зафиксирован 12 февраля — в этот день было создано 276 тысяч приватных каналов. Аудитория одного из авторов выросла с нуля до […]
Сообщение Пользователи Мах создали более миллиона приватных каналов за неделю появились сначала на Digital Russi... →
«Северсталь» и «Сибур» собираются тестировать «китайский аналог SAP», пишет РБК во вторник. Этой новости предшествовало намерение «Северстали», тоже с «Сибуром», самостоятельно разработать ERP-систему (результат был понятен заранее). Предшествовали словесные игры в «национальную ERP» и в «СУР» («систему управления ресурсами»). Много чего ещё, включая 10+ лет импортозамещения ПО и предательскую закупку SAP для единого расчётного центра […]
Сообщение Нет ERP в своём отечестве, или Полумера появились сначала н... →
Об авторе: Илья Начвин, министр цифрового развития государственного управления, информационных технологий и связи Республики Татарстан Блок экономики отрасли В 2025 году валовая выручка выросла и составила 269,7 миллиарда рублей (против 256,7 миллиарда в 2024). Наибольший рост выручки отмечен в категории «Издание программного обеспечения» (153%). Наиболее масштабными сегментами IT-сферы по-прежнему остаются разработка компьютерного программного обеспечения (52,3%) […]
Сообщение Минцифры Татарстана: итоги ра... →
Об авторе: Анатолий Петров, директор по продукту «Аврора Центр» Один из фундаментальных элементов построения современной безопасной IT-инфраструктуры — это платформы управления корпоративными устройствами: MDM-решения (Mobile Device Management, управляющие мобильными устройствами) и UEM-решения (Unified Endpoint Management, более широкое понятие, предполагающие контроль над любыми пользовательскими устройствами, в том числе стационарными, IOT и др.). Такие решения закрывают два […]
Сообщение Почему важно вы... →
Практически все общеиспользуемые функции офисных пакетов на текущий момент реализованы в российских продуктах в полной мере, свидетельствуют результаты сравнительного анализа иностранных и российских офисных пакетов из реестра российского ПО, сообщает АНО «ЦКИТ». «Российские офисные пакеты по своим характеристикам в значительной степени приблизились к зарубежным аналогам, прежде всего к показателям MS Office, продемонстрировав за последние три […]
Сообщение Российские офисные пакеты практически сравнялись п... →
Для общественного обсуждения опубликован проект постановления, которым полномочия в сфере технологической политики передаются от Минэкономразвития Минпромторгу. Как сказано в пояснительной записке, решение о целесообразности определения министерства промышленности и торговли РФ федеральным органом исполнительной власти (ФОИВ), уполномоченным правительством в области технологической политики, принято по итогам совещания у председателя правительства РФ Михаила Мишустина от 1 декабря 2025 […]
Сообщение Уполном... →
Пользователи Мах из России и Белоруссии получили возможность создавать каналы, названные «приватными», для публикации фото, видео, текстов и голосовых сообщений, сообщает пресс-служба мессенджера во вторник. В «приватном канале» можно выбрать или отключить реакции на участников и управлять заявками на вступление. Для создания «приватного канала» в Мах необходимо обновить приложение до последней версии, затем перейти в […]
Сообщение В Мах появились частные каналы появились сначала на Digital Russia. →
Подмосковному городу Долгопрудному присвоен статус наукограда Российской Федерации, распоряжение об этом подписал председатель правительства Михаил Мишустин. Новый статус позволит Долгопрудному получать федеральное финансирование на обеспечение работы и модернизацию научно-производственных комплексов, а также на реализацию стратегии социально-экономического развития города. Согласно действующему законодательству статус наукограда присваивается на 15 лет. Таким образом, принятое решение будет действовать до ... →
|