Справочные материалы ←
Как распознать текст отсканированного документа?
В Ульяновск.BSD для распознавания текстов можно использовать tesseract. Это движок оптического распознавания символов (OCR) с открытым исходным кодом, который является одной из самых популярных и качественных OCR-библиотек. Его установка достаточно проста:
pkg install -r latest tesseract
Tesseract – это консольное приложение. Поэтому для удобства работы с ним лучше использовать какой-либо GUI-интерфейс. Одним из таких интерфейсов является приложение VietOCR. С помощью VietOCR можно не только распознавать текст на единичных страницах или в выбранных блоках изображения, но и производить пакетное распознавание текста во множестве изображений, находящихся в одном каталоге. Актуальную версию приложения в виде zip-файла можно скачать со страницы VietOCR на SourceForge. На момент создания данного документа это был файл VietOCR-5.6.1.zip. Для установки приложения достаточно просто распаковать скачанный zip-архив в каталог /usr/local:
unzip -d /usr/local VietOCR-5.6.1.zip
VietOCR – это Java-приложение. Поэтому для его запуска необходимо установить Java-машину:
pkg install -r latest openjdk8-jre
После этого можно запускать VietOCR из командной строки в Терминале:
env _JAVA_OPTIONS='-Dawt.useSystemAAFontSettings=on' java -jar /usr/local/VietOCR3/VietOCR.jar
Или скачайте файл VietOCR.desktop и сохраните его на рабочем столе и в каталоге /usr/local/share/applications/. В результате этого на рабочем столе и в меню появится ярлык для запуска VietOCR.
Примечание 1:
Для возможности проверки орфографии необходимо скачать языковой пакет. Сделать это можно через меню «Настройки» → «Загрузить языковые данные...».
Примечание 2:
Функция сканирования в VietOCR в настоящее время не работает. Поэтому сканирование и подготовку изображений для распознавания необходимо производить с помощью других приложений. Например, skanlite или xsane.
Последнее изменение:
13.07.2020 19:28:22
Комментарии
Добавляя комментарий, убедитесь, что он соответствует теме.
Подумайте, будет ли он интересен другим. Спам, умышленная реклама и личная
переписка не допускаются. Соблюдайте правила русского языка. Комментарии
публикуются после проверки модератором и могут быть удалены без объяснения
причин. Ответы на заданные в комментариях вопросы могут исходить от любого
пользователя и являются неофициальными.
|
');
// document.write('');
// document.write('');
//}
//-->
Импортозамещение
ВТБ тестирует собственную метавселенную — трехмерное интерактивное пространство для виртуального взаимодействия пользователей; демонстрация метавселенной состоялась в рамках Data Fusion 2024: в ней прошла одна из сессий конференции, сообщает банк в среду. Проект обладает потенциалом для реализации нового формата предоставления услуг, в том числе открытия банковских киберофисов, говорится в сообщении. Сегодня платформа насчитывает несколько виртуальных локаций, […]
Сообщение ВТБ объявил о тестировании собств... →
Правительство утвердило положение о коммуникационных сервисах (КС) автоматизированного рабочего места (АРМ) госслужащего, соответствующее постановление опубликовано на официальном портале правовой информации во вторник. Напомним, эксперимент по переводу информационных систем и информационных ресурсов в государственную единую облачную платформу (ГЕОП, «Гособлако»), а также по оборудованию АРМ в федеральных органах исполнительной власти и государственных внебюджетных фондах проводится в России […]
Сообщение У... →
Крупнейший российский производитель микроэлектроники «Микрон» (входит в Группу компаний «Элемент»), резидент ОЭЗ «Технополис Москва», в течение 2023 года освоил в серийном производстве 59 новых изделий для промышленного применения, сообщает компания в среду. Среди новинок – микросхемы управления питанием для использования в силовой электронике, изделия общепромышленного применения, в том числе микросхемы логики, транзистора Дарлингтона с большой […]
Сообщение «Микрон» сообщил о 59 новых изделиях, выпущенных... →
Во вторник «Яндекс» сообщил о сервисе ИИ-поиска, названном «Нейро», в нём, как говорится в сообщении компании, объединились «возможности поиска и больших генеративных моделей». «Нейро» доступен в приложении «Яндекс с Алисой» и в «Яндекс.Браузере». Чтобы воспользоваться сервисом, нужно авторизоваться в «Яндексе» и переключить тумблер около поисковой строки. После этого можно задавать вопросы, на которые «Нейро» станет […]
Сообщение «Яндекс» сообщил о новом ИИ-поисковике появились сначала на Digital Russia. →
В связи с перспективным ростом зарядных станций для электромобилей в ближайшие несколько лет необходимо проработать вопрос создания цифровой среды, которая позволит сделать использование электромобилей максимально эффективным и доступным – такое поручение дал первый заместитель председателя правительства Андрей Белоусов в ходе совещания по развитию зарядной инфраструктуры для электромобилей, сообщает сайт правительства в понедельник. «В ближайшие шесть […]
Сообщение Создать «цифровую среду» для зарядных ста... →
Нижегородская IT-компания «Фрактал» разработала на средства IT-гранта правительства региона комплекс фотовидеофиксации нарушений правил дорожного движения (ПДД) «Аргентум» с использованием искусственного интеллекта, сообщает министерство цифрового развития и связи Нижегородской области в пятницу. Программно-аппаратный комплекс (ПАК) установлен на улице Новикова-Прибоя в Нижнем Новгороде в среду, говорится в сообщении. Как отмечают в министерстве, в 2022 году компания «Фрактал» […]
Сообщение Получатель грант... →
Компания «Авроид», разрабатывающая программные продукты для российских операционных систем, выпустила новый релиз Tavro – мобильный клиент мессенджера Telegram для ОС «Аврора», сообщает разработчик в пятницу. Приложение выполняет основные функции мессенджера: отображает списки чатов, может отправлять текстовые сообщения, изображения и видео, эмодзи, файлы, совершать звонки между пользователями Telegram, поддерживает различные системные уведомления в чатах, позволяет работать […]
Сообщение Представлен обновл... →
Власти Китая предписали крупнейшим телеком-операторам страны избавиться от процессоров зарубежного производства к 2027 году, сообщает в пятницу Reuters со ссылкой на данные The Wall Street Journal. Пекин стремится снизить зависимость от западных продуктов на фоне технологического противостояния с Вашингтоном и проводит политику импортозамещения в области микроэлектроники. Решение об отказе от иностранных процессоров бьёт по экономическим […]
Сообщение КНР предписала ведущим телеком-компаниям избавиться от и... →
Центр технической IT-поддержки (ЦТИТП) объявил о запуске Центра компетенций по миграции с IBM DB2 на СУБД Tantor, сообщает «Группа Астра» в пятницу. Данное решение обеспечит заказчикам бесперебойную эксплуатацию IT-систем, построенных на зарубежном программном обеспечении, и, как итог, органичный процесс импортозамещения ПО. IBM DB2 представляет собой семейство ПО для управления реляционными базами данных. В программных продуктах […]
Сообщение Объявлено об открытии Центра компетенций по миграции с IBM DB2 н... →
Компания J’son & Partners Consulting подготовила результаты регулярного исследования российского рынка офисного программного обеспечения (ПО) за 2023 год, сообщает компания в пятницу. По итогам 2023 года объём российского рынка офисного программного обеспечения вырос на 12% и достиг 64 миллиардов рублей, в то время как в 2022 году этот показатель составлял 56,9 миллиарда рублей. Основная доля […]
Сообщение Российский рынок офисного ПО: итоги 2023 года и прогноз до 2030 года – версия J’son & Partners появили... →
|