Справочные материалы ←
Как распознать текст отсканированного документа?
В Ульяновск.BSD для распознавания текстов можно использовать tesseract. Это движок оптического распознавания символов (OCR) с открытым исходным кодом, который является одной из самых популярных и качественных OCR-библиотек. Его установка достаточно проста:
pkg install -r latest tesseract
Tesseract – это консольное приложение. Поэтому для удобства работы с ним лучше использовать какой-либо GUI-интерфейс. Одним из таких интерфейсов является приложение VietOCR. С помощью VietOCR можно не только распознавать текст на единичных страницах или в выбранных блоках изображения, но и производить пакетное распознавание текста во множестве изображений, находящихся в одном каталоге. Актуальную версию приложения в виде zip-файла можно скачать со страницы VietOCR на SourceForge. На момент создания данного документа это был файл VietOCR-5.6.1.zip. Для установки приложения достаточно просто распаковать скачанный zip-архив в каталог /usr/local:
unzip -d /usr/local VietOCR-5.6.1.zip
VietOCR – это Java-приложение. Поэтому для его запуска необходимо установить Java-машину:
pkg install -r latest openjdk8-jre
После этого можно запускать VietOCR из командной строки в Терминале:
env _JAVA_OPTIONS='-Dawt.useSystemAAFontSettings=on' java -jar /usr/local/VietOCR3/VietOCR.jar
Или скачайте файл VietOCR.desktop и сохраните его на рабочем столе и в каталоге /usr/local/share/applications/. В результате этого на рабочем столе и в меню появится ярлык для запуска VietOCR.
Примечание 1:
Для возможности проверки орфографии необходимо скачать языковой пакет. Сделать это можно через меню «Настройки» → «Загрузить языковые данные...».
Примечание 2:
Функция сканирования в VietOCR в настоящее время не работает. Поэтому сканирование и подготовку изображений для распознавания необходимо производить с помощью других приложений. Например, skanlite или xsane.
Последнее изменение:
13.07.2020 19:28:22
Комментарии
Добавляя комментарий, убедитесь, что он соответствует теме.
Подумайте, будет ли он интересен другим. Спам, умышленная реклама и личная
переписка не допускаются. Соблюдайте правила русского языка. Комментарии
публикуются после проверки модератором и могут быть удалены без объяснения
причин. Ответы на заданные в комментариях вопросы могут исходить от любого
пользователя и являются неофициальными.
|
');
// document.write('');
// document.write('');
//}
//-->
Импортозамещение
Депутаты Госдумы приняли во втором и третьем чтении изменения в Кодекс РФ об административных правонарушениях, касающиеся ответственности за нарушение правил применения рекомендательных технологий и правил авторизации на онлайн-ресурсах. Напомним, закон о регулировании рекомендательных интернет-технологий действует в России с октября 2023 года. Порядок взаимодействия Роскомнадзора с владельцами сайтов, страниц и приложений, применяющих «технологии предоставления информации на […]
Сообщение Госдума установил... →
Доля российских производителей на рынке радиоэлектроники выросла с 12–12,5% в 2020 году до 62% в 2025; совокупная ёмкость этого сегмента по итогам прошлого года оценивается в 3–4 триллиона рублей, из которых около 1–1,2 триллиона пришлось на госзаказ, пишут «Ведомости» со ссылкой на заявление Минпромторга. Под рынком радиоэлектроники, как правило, понимают всё телекоммуникационное оборудование, серверы, системы […]
Сообщение Объём российского рынка радиоэлектроники официально оценили в 4 трлн руб появились ... →
На «ПМЭФ-2026» президент «Ростелекома» Михаил Осеевский и глава Республики Тыва Владислав Ховалыг подписали пятилетнее соглашение о сотрудничестве по развитию региональной цифровой инфраструктуры, сообщает оператор. В частности, рассматривается проект создания единого контура информационной безопасности органов государственной власти Тувы. Стороны намерены развивать IT-системы правительства за счёт внедрения моделей искусственного интеллекта и построения отказоустойчивой вычислительной инфраструктуры на осн... →
Оценки нашего рынка информационных технологий всегда сильно отличались в зависимости от того, кто считал, но в 2025 году они стали разниться совсем уж неприлично. ВШЭ, например, считает, что объём рынка ИКТ – 9,4 триллиона (+12,6% год к году), из них на IT приходится не менее 4,8 триллиона. Минцифры даёт только на IT-услуги 4,8 триллиона (рост […]
Сообщение Ложь и правда об объёме отечественного IT-рынка появились сначала на Digital Russia. →
Эксперимент по роботизированной уборке общественных пространств начался в Уфе – улицы подметают автономные роботы АО «168роботикс», сообщает администрация города. В эксперименте задействованы компактная модель «БРО 2.1» и многофункциональная роботизированная платформа «БРО 3.0» (наиболее производительная, со сменными аккумуляторными батареями и инновационным высокоманевренным шасси). Производительность роботов-уборщиков достигает 100 тысяч кв. м в сутки. Роботы обладают следующими возможностями: […]
Сообщен... →
На Петербургском международном экономическом форуме (ПМЭФ) «Бюро 1440» и «Федеральная пассажирская компания» согласовали план по внедрению спутниковой связи на поездах дальнего следования, говорится в опубликованном четверг сообщении разработчика таких систем. Испытания специального абонентского терминала «Бюро 1440» в составах намечены на текущий год, опытная эксплуатация и постепенное оснащение поездов спутниковым оборудованием – на 2027. На первоначальном […]
Сообщение «Бюро 1440» сообщило о планах обесп... →
Приложение мессенджера «Макс» на текущий момент недоступно в App Store, в Apple направлен запрос о предоставлении разъяснений, сообщили разработчики национального мессенджера в четверг. «В связи с исключением МАХ из App Store уведомления о новых сообщениях и звонках не будут приходить на ваш смартфон. При этом сами сообщения будут доставляться, и все функции МАХ останутся доступными. […]
Сообщение Apple удалила мессенджер «Макс» из своего магазина приложений появились сначала на Digital Russia. →
Круг компаний, которые смогут получить IT-аккредитацию, расширен решением правительства на организации с госучастием. Получить госаккредитацию и воспользоваться пониженными страховыми взносами на уровне 15% (7,6% свыше единой предельной величины базы) смогут в том числе участники рынка, имеющие долю прямого или косвенного госучастия не менее 50%. Сотрудники указанных компаний также смогут претендовать на профильные меры поддержки для […]
Сообщение Правительство расширило круг компаний для получения IT-аккре... →
Республика Беларусь готова обеспечить энергоснабжением центры обработки данных (ЦОД) российских компаний и проработать вопрос перемещения целых кластеров ЦОДов для борьбы с энергодефицитом на территорию страны, заявил генеральный директор белорусской Ассоциации высоких технологий и цифровой инфраструктуры Алексей Свентицкий в рамках круглого стола «Евразийский диалог отрасли ЦОД», который прошел в Минске в четверг, пишут «Ведомости». Совместно с […]
Сообщение Белоруссия предложила снабжать российские ЦОДы э... →
С 18 по 21 мая в Нижнем Новгороде прошла XI конференция ЦИПР, подтвердившая статус одной из ключевых международных площадок для диалога по цифровой экономике и технологиям: в этом году в мероприятии приняли участие более 300 иностранных делегатов из 46 стран, включая Индию, Сербию, Аргентину, Китай, Филиппины и другие страны Юго-Восточной Азии, а также страны Африки […]
Сообщение Более 300 делегатов из 46 стран приняли участие в «ЦИПР-2026» появились сначала на Digital Russia. →
|