Справочные материалы ←
Как распознать текст отсканированного документа?
В Ульяновск.BSD для распознавания текстов можно использовать tesseract. Это движок оптического распознавания символов (OCR) с открытым исходным кодом, который является одной из самых популярных и качественных OCR-библиотек. Его установка достаточно проста:
pkg install -r latest tesseract
Tesseract – это консольное приложение. Поэтому для удобства работы с ним лучше использовать какой-либо GUI-интерфейс. Одним из таких интерфейсов является приложение VietOCR. С помощью VietOCR можно не только распознавать текст на единичных страницах или в выбранных блоках изображения, но и производить пакетное распознавание текста во множестве изображений, находящихся в одном каталоге. Актуальную версию приложения в виде zip-файла можно скачать со страницы VietOCR на SourceForge. На момент создания данного документа это был файл VietOCR-5.6.1.zip. Для установки приложения достаточно просто распаковать скачанный zip-архив в каталог /usr/local:
unzip -d /usr/local VietOCR-5.6.1.zip
VietOCR – это Java-приложение. Поэтому для его запуска необходимо установить Java-машину:
pkg install -r latest openjdk8-jre
После этого можно запускать VietOCR из командной строки в Терминале:
env _JAVA_OPTIONS='-Dawt.useSystemAAFontSettings=on' java -jar /usr/local/VietOCR3/VietOCR.jar
Или скачайте файл VietOCR.desktop и сохраните его на рабочем столе и в каталоге /usr/local/share/applications/. В результате этого на рабочем столе и в меню появится ярлык для запуска VietOCR.
Примечание 1:
Для возможности проверки орфографии необходимо скачать языковой пакет. Сделать это можно через меню «Настройки» → «Загрузить языковые данные...».
Примечание 2:
Функция сканирования в VietOCR в настоящее время не работает. Поэтому сканирование и подготовку изображений для распознавания необходимо производить с помощью других приложений. Например, skanlite или xsane.
Последнее изменение:
13.07.2020 19:28:22
Комментарии
Добавляя комментарий, убедитесь, что он соответствует теме.
Подумайте, будет ли он интересен другим. Спам, умышленная реклама и личная
переписка не допускаются. Соблюдайте правила русского языка. Комментарии
публикуются после проверки модератором и могут быть удалены без объяснения
причин. Ответы на заданные в комментариях вопросы могут исходить от любого
пользователя и являются неофициальными.
|
');
// document.write('');
// document.write('');
//}
//-->
Импортозамещение
Ежегодная XIII научно-практическая конференция «OS DAY. Встроенные ОС, реальное время» пройдёт 4-5 июня на базе РЭУ им. Г.В. Плеханова; центральными на OS DAY 2026 станут вопросы, касающиеся операционных систем для встроенных устройств и ОС реального времени, сообщают организаторы мероприятия. Необходимость создания собственных локализованных автоматических систем управления технологическими процессами и сопутствующей им инфраструктуры становится сегодня вопросом […]
Сообщение Встроенные операционные систем... →
Институт космических исследований РАН и компания «Геоскан» представили совместный проект первой распределённой космической солнечной обсерватории на базе микроспутников, сообщает компания в четверг. Обсерватория предназначена для непрерывного мониторинга солнечной активности и создания открытых цифровых сервисов с информацией о протекающих процессах на Солнце и состоянии космической погоды. Обсерватория будет работать на базе малых космических аппаратов (МКА) типа […]
Сообщение Представлен проект первой рас... →
Экскурсию по МИРЭА, где во вторник собиралась АРПП (у ассоциации с МИРЭА соглашение), корреспондент D-Russia.ru проигнорировал, возможно, зря. Встретившийся первым Дмитрий Завалишин поделился впечатлениями едва ли не восторженными – оборудование лабораторий выдающееся, «можно 50-слойные платы печатать». Мероприятие состояло из закрытой части и той, на которой корреспондент присутствовал. На закрытой Рената Лашина переизбрали исполнительным директором АРПП. […]
Сообщение О чём говорят разработчики появились ... →
Компания «Базальт СПО» подала заявку для регистрации в реестре российского ПО программного комплекса «Свободный офис», в состав которого входят офисный пакет, веб-браузер, почтовый клиент и программа электронной подписи, сообщила компания в среду. Компоненты программного комплекса «Свободный офис» уже находятся в других реестровых продуктах «Базальт СПО». Решение создать отдельный продукт в компании приняли по просьбам заказчиков. […]
Сообщение «Базальт СПО» сообщила о выпуске офисного ПО появились сначала ... →
ПАО «Вымпелком» и ОАО «РЖД» совместно с разработчиком высокотехнологичных средств защиты информации, компанией «ИнфоТеКС», провели успешные пилотные испытания технологии квантового распределения ключей для организации высокозащищенной корпоративной сети; результаты позволят обеспечить принципиально новый уровень защиты передачи данных для корпоративных клиентов «Билайна», сообщает оператор. Квантовое распределение ключей (КРК) — это метод организации защищенных коммуникаций на основе криптографического […]
... →
Национальный мессенджер Max был переименован в «Макс» в магазинах приложений RuStore и Google Play, заметили «Ведомости». Новое наименование также указано на официальном сайте платформы. В десктопной версии и на иконке Android-приложения название мессенджера остаётся на латинице. Обновить программу не предлагается, убедился корреспондент D-Russia.ru. Ранее, отмечает издание, руководитель Мах Фарит Хуснояров говорил в интервью, что в […]
Сообщение Название мессенджера Max русифицировали появились сначала на ... →
Третья флагманская кросс-отраслевая конференция «АКПО-Конф», организованная Ассоциацией крупнейших потребителей программного обеспечения и оборудования (Ассоциацией КП ПОО), прошла 20 апреля в инновационном кластере «Ломоносов», сообщает пресс-служба конференции. Мероприятие собрало более двух тысяч участников. Деловая программа включила два пленарных заседания, 20 экспертных сессий и демонстрацию реальных технологических кейсов, а в выставочной зоне свои стенды и оборудование представили […]
Сообщение «АКП... →
В 2023 году в Удмуртии начался масштабный проект по замене иностранного ПО на отечественные решения. Инициатором выступила региональная команда Министерства цифрового развития. В проекте участвовали Центр Цифровых Технологий, компания АйТи-Опт и разработчик решения — РЕД СОФТ. Проект по импортозамещению системного программного обеспечения в органах государственной власти Удмуртии предполагал миграцию рабочих мест на отечественную операционную систему […]
Сообщение Как правительство Удмуртии переводило IT-ин... →
Холдинг «Росэл» госкорпорации Ростех приступил к серийному производству более 30 типономиналов буферных усилителей. Изделия востребованы в радиоаппаратуре различного назначения, системах сбора и хранения данных, космических аппаратах. Российские комплектующие смогут заместить американские аналоги. Образцы представлены на стенде «Росэл» в рамках выставки «ЭкспоЭлектроника-2026». Буферные усилители позволяют увеличивать значения тока и сохранять высокую стабильность сигнала без увеличения напряжения. […]
Сооб... →
Депутаты внесли в Госдуму законопроект с изменениями в 22-ФЗ «О навигационной деятельности», согласно которым обработка и хранение навигационной информации о движении автотранспорта должна осуществляться исключительно на территории РФ. В пояснительной записке сказано, что на протяжении многих лет ведущей системой мониторинга автомобильного транспорта в РФ являлась система Wialon литовской компании Gurtam. Компания располагает свои серверы на […]
Сообщение Внесён законопроект о запрете хранить и обрабатывать... →
|