Справочные материалы ←
Как распознать текст отсканированного документа?
В Ульяновск.BSD для распознавания текстов можно использовать tesseract. Это движок оптического распознавания символов (OCR) с открытым исходным кодом, который является одной из самых популярных и качественных OCR-библиотек. Его установка достаточно проста:
pkg install -r latest tesseract
Tesseract – это консольное приложение. Поэтому для удобства работы с ним лучше использовать какой-либо GUI-интерфейс. Одним из таких интерфейсов является приложение VietOCR. С помощью VietOCR можно не только распознавать текст на единичных страницах или в выбранных блоках изображения, но и производить пакетное распознавание текста во множестве изображений, находящихся в одном каталоге. Актуальную версию приложения в виде zip-файла можно скачать со страницы VietOCR на SourceForge. На момент создания данного документа это был файл VietOCR-5.6.1.zip. Для установки приложения достаточно просто распаковать скачанный zip-архив в каталог /usr/local:
unzip -d /usr/local VietOCR-5.6.1.zip
VietOCR – это Java-приложение. Поэтому для его запуска необходимо установить Java-машину:
pkg install -r latest openjdk8-jre
После этого можно запускать VietOCR из командной строки в Терминале:
env _JAVA_OPTIONS='-Dawt.useSystemAAFontSettings=on' java -jar /usr/local/VietOCR3/VietOCR.jar
Или скачайте файл VietOCR.desktop и сохраните его на рабочем столе и в каталоге /usr/local/share/applications/. В результате этого на рабочем столе и в меню появится ярлык для запуска VietOCR.
Примечание 1:
Для возможности проверки орфографии необходимо скачать языковой пакет. Сделать это можно через меню «Настройки» → «Загрузить языковые данные...».
Примечание 2:
Функция сканирования в VietOCR в настоящее время не работает. Поэтому сканирование и подготовку изображений для распознавания необходимо производить с помощью других приложений. Например, skanlite или xsane.
Последнее изменение:
13.07.2020 19:28:22
Комментарии
Добавляя комментарий, убедитесь, что он соответствует теме.
Подумайте, будет ли он интересен другим. Спам, умышленная реклама и личная
переписка не допускаются. Соблюдайте правила русского языка. Комментарии
публикуются после проверки модератором и могут быть удалены без объяснения
причин. Ответы на заданные в комментариях вопросы могут исходить от любого
пользователя и являются неофициальными.
|
');
// document.write('');
// document.write('');
//}
//-->
Импортозамещение
Об авторе: Игорь Фетисов, министр информационных технологий, связи и цифрового развития Челябинской области Министерство информационных технологий, связи и цифрового развития Челябинской области обеспечивает развитие сферы цифровых технологий региона, внедрение электронных государственных сервисов, направленных на улучшение качества жизни людей и ведение предпринимательской деятельности, создаёт благоприятные условия для развития конкурентной среды для организаций, предоставляющих услуги в сфере […]
Сообщен... →
С 21 по 23 мая 2026 года в Нижнем Новгороде пройдёт второй городской технологический фестиваль «Тех-Френдли Викенд», организованный в рамках конференции ЦИПР, сообщает оргкомитет мероприятия. Центральной темой фестиваля станет разговор о будущем — и о том, как его контуры формируются уже сегодня. Эксперты обсудят долгосрочные технологические тренды с горизонтом в несколько десятилетий: как изменения в […]
Сообщение Объявлена программа проводящегося в ходе ЦИПР фестиваля «Тех-Френдли Викенд» появились сначал... →
Мессенджер Max начал тестировать создание стикеров вместе с авторами публичных каналов – блогерами, звёздами и СМИ, сообщает пресс-служба Max в среду. Присоединиться к тестированию могут авторы категории «А+» с помощью чат-бота «Стикеры в МАХ». Для создания набора стикеров в МАХ необходимо: открыть чат-бот и нажать на кнопку «Начать»; нажать на кнопку «Открыть» в левом нижнем […]
Сообщение Max разрешил пользователям создавать свои стикеры появились сначала на Digital Russia. →
Обновлена единая цифровая стратегия госкорпорации «Росатом», которая будет определять цифровую трансформацию компании до 2027 года включительно, сообщила компания во вторник. Обновлённый документ согласован с Минцифры РФ и Минэнерго РФ. Его необходимость обусловлена обновленными методическими рекомендациями по цифровой трансформации государственных корпораций и компаний с государственным участием, сказано в сообщении. Обновлённая стратегия базируется на достижениях «Росатома» в […]
Сообщение «Росатом» сообщ... →
Московский инновационный кластер открыл первый в России испытательный центр полного цикла, предназначенный для тестирования коммунальных, складских, логистических, транспортных, мониторинговых, строительных и многих других беспилотных роботизированных систем, сообщает мэр Москвы Сергей Собянин. Подать заявку на проведение испытаний можно на сайте i.moscow. Основная площадка испытательного центра расположена в инновационном центре «Сколково», также будет использоваться полигон Федерального центра […]
Сообщен... →
Новые нормативные и экономические реалии и возможные точки роста обсуждали во вторник на пресс-конференции ассоциации «Руссофт» в Москве с участием представителей IT-компаний. Там побывала и корреспондент D-Russia.ru. Как следует из обсуждения, на IT-бизнес в настоящее время более всего влияют новые налоги, сокращение инвестиций, тренд на внутреннюю разработку ПО крупными заказчиками, развитие ИИ-технологий (государство и бизнес […]
Сообщение Рост налогов и сокращение инвестиций – что 2026 год преподнёс оте... →
Региональная индустриальная лаборатория микроэлектроники и радиофизики официально открылась на базе Челябинского государственного университета, сообщает Минцифры Челябинской области во вторник. Лаборатория призвана стать центром развития микроэлектроники, приборостроения и Интернета вещей (IoT). Ключевые направления: подготовка кадров через практико-ориентированное обучение (студенты будут осваивать полный цикл разработки электронных изделий на промышленном оборудовании, работая с реальными запросами бизнес... →
Пользователям Max стала доступна англоязычная версия приложения, сообщает пресс-служба национального мессенджера во вторник. Для того, чтобы сменить версию интерфейса на английскую, необходимо обновить приложение и изменить языковые настройки. Пользователи операционной системы Android могут сделать это в профиле мессенджера в разделе «Язык приложения». Пользователям iOS необходимо изменить язык в настройках смартфона. См. также: Зарегистрироваться в Max […]
Сообщение Национальному мессенджеру Max сделали ан... →
Об авторе: Анатолий Шалыто, профессор, д.т.н., Университет ИТМО Третьего января 2026 года я, наконец-то, увидел дело рук своих: «Зачётную квалификационную книжку спортсменов первого разряда, кандидатов в мастеров России, мастеров спорта в России, мастеров спорта России международного класса», а также соответствующий книжке почётный знак. В книжке указано, что Руслану Белькову (Иннополис) присвоено звание «Кандидат в мастера […]
Сообщение Возможно, им надоест… появились сначала на Digital Russia. →
Об авторе: Дмитрий Ухов, министр цифрового развития государственного управления, информационных технологий и связи Донецкой Народной Республики Подвижная радиотелефонная связь В 2025 году на территории ДНР тремя операторами подвижной радиотелефонной связи — ГУП ДНР «РОС», ООО «Миранда-Медиа» и ООО «К-Телеком» — запущено в работу 1619 базовых станций при плановом показателе 1080 базовых станций. Фактическое выполнение плана […]
Сообщение Итоги работы Минцифры Донецкой Народной Республики за 2025 год появилис... →
|