На главную страницу На главную страницу Помоги больным детям! Их можно спасти!
 
Справочные материалы ←

Как распознать текст отсканированного документа?

В Ульяновск.BSD для распознавания текстов можно использовать tesseract. Это движок оптического распознавания символов (OCR) с открытым исходным кодом, который является одной из самых популярных и качественных OCR-библиотек. Его установка достаточно проста:

pkg install -r latest tesseract

Tesseract – это консольное приложение. Поэтому для удобства работы с ним лучше использовать какой-либо GUI-интерфейс. Одним из таких интерфейсов является приложение VietOCR. С помощью VietOCR можно не только распознавать текст на единичных страницах или в выбранных блоках изображения, но и производить пакетное распознавание текста во множестве изображений, находящихся в одном каталоге. Актуальную версию приложения в виде zip-файла можно скачать со страницы VietOCR на SourceForge. На момент создания данного документа это был файл VietOCR-5.6.1.zip. Для установки приложения достаточно просто распаковать скачанный zip-архив в каталог /usr/local:

unzip -d /usr/local VietOCR-5.6.1.zip

VietOCR – это Java-приложение. Поэтому для его запуска необходимо установить Java-машину:

pkg install -r latest openjdk8-jre

После этого можно запускать VietOCR из командной строки в Терминале:

env _JAVA_OPTIONS='-Dawt.useSystemAAFontSettings=on' java -jar /usr/local/VietOCR3/VietOCR.jar

Или скачайте файл VietOCR.desktop и сохраните его на рабочем столе и в каталоге /usr/local/share/applications/. В результате этого на рабочем столе и в меню появится ярлык для запуска VietOCR.

Примечание 1:

Для возможности проверки орфографии необходимо скачать языковой пакет. Сделать это можно через меню «Настройки» → «Загрузить языковые данные...».

Примечание 2:

Функция сканирования в VietOCR в настоящее время не работает. Поэтому сканирование и подготовку изображений для распознавания необходимо производить с помощью других приложений. Например, skanlite или xsane.

 

Последнее изменение: 13.07.2020 19:28:22
Комментарии
Добавляя комментарий, убедитесь, что он соответствует теме. Подумайте, будет ли он интересен другим. Спам, умышленная реклама и личная переписка не допускаются. Соблюдайте правила русского языка. Комментарии публикуются после проверки модератором и могут быть удалены без объяснения причин. Ответы на заданные в комментариях вопросы могут исходить от любого пользователя и являются неофициальными.
Импортозамещение
ВТБ тестирует собственную метавселенную — трехмерное интерактивное пространство для виртуального взаимодействия пользователей; демонстрация метавселенной состоялась в рамках Data Fusion 2024: в ней прошла одна из сессий конференции, сообщает банк в среду. Проект обладает потенциалом для реализации нового формата предоставления услуг, в том числе открытия банковских киберофисов, говорится в сообщении. Сегодня платформа насчитывает несколько виртуальных локаций, […] Сообщение ВТБ объявил о тестировании собств... 
Правительство утвердило положение о коммуникационных сервисах (КС) автоматизированного рабочего места (АРМ) госслужащего, соответствующее постановление опубликовано на официальном портале правовой информации во вторник. Напомним, эксперимент по переводу информационных систем и информационных ресурсов в государственную единую облачную платформу (ГЕОП, «Гособлако»), а также по оборудованию АРМ в федеральных органах исполнительной власти и государственных внебюджетных фондах проводится в России […] Сообщение У... 
Крупнейший российский производитель микроэлектроники «Микрон» (входит в Группу компаний «Элемент»), резидент ОЭЗ «Технополис Москва», в течение 2023 года освоил в серийном производстве 59 новых изделий для промышленного применения, сообщает компания в среду. Среди новинок – микросхемы управления питанием для использования в силовой электронике, изделия общепромышленного применения, в том числе микросхемы логики, транзистора Дарлингтона с большой […] Сообщение «Микрон» сообщил о 59 новых изделиях, выпущенных... 
Во вторник «Яндекс» сообщил о сервисе ИИ-поиска, названном «Нейро», в нём, как говорится в сообщении компании, объединились «возможности поиска и больших генеративных моделей». «Нейро» доступен в приложении «Яндекс с Алисой» и в «Яндекс.Браузере». Чтобы воспользоваться сервисом, нужно авторизоваться в «Яндексе» и переключить тумблер около поисковой строки. После этого можно задавать вопросы, на которые «Нейро» станет […] Сообщение «Яндекс» сообщил о новом ИИ-поисковике появились сначала на Digital Russia. 
В связи с перспективным ростом зарядных станций для электромобилей в ближайшие несколько лет необходимо проработать вопрос создания цифровой среды, которая позволит сделать использование электромобилей максимально эффективным и доступным – такое поручение дал первый заместитель председателя правительства Андрей Белоусов в ходе совещания по развитию зарядной инфраструктуры для электромобилей, сообщает сайт правительства в понедельник. «В ближайшие шесть […] Сообщение Создать «цифровую среду» для зарядных ста... 
Нижегородская IT-компания «Фрактал» разработала на средства IT-гранта правительства региона комплекс фотовидеофиксации нарушений правил дорожного движения (ПДД) «Аргентум» с использованием искусственного интеллекта, сообщает министерство цифрового развития и связи Нижегородской области в пятницу. Программно-аппаратный комплекс (ПАК) установлен на улице Новикова-Прибоя в Нижнем Новгороде в среду, говорится в сообщении. Как отмечают в министерстве, в 2022 году компания «Фрактал» […] Сообщение Получатель грант... 
Компания «Авроид», разрабатывающая программные продукты для российских операционных систем, выпустила новый релиз Tavro – мобильный клиент мессенджера Telegram для ОС «Аврора», сообщает разработчик в пятницу. Приложение выполняет основные функции мессенджера: отображает списки чатов, может отправлять текстовые сообщения, изображения и видео, эмодзи, файлы, совершать звонки между пользователями Telegram, поддерживает различные системные уведомления в чатах, позволяет работать […] Сообщение Представлен обновл... 
Власти Китая предписали крупнейшим телеком-операторам страны избавиться от процессоров зарубежного производства к 2027 году, сообщает в пятницу Reuters со ссылкой на данные The Wall Street Journal. Пекин стремится снизить зависимость от западных продуктов на фоне технологического противостояния с Вашингтоном и проводит политику импортозамещения в области микроэлектроники. Решение об отказе от иностранных процессоров бьёт по экономическим […] Сообщение КНР предписала ведущим телеком-компаниям избавиться от и... 
Центр технической IT-поддержки (ЦТИТП) объявил о запуске Центра компетенций по миграции с IBM DB2 на СУБД Tantor, сообщает «Группа Астра» в пятницу. Данное решение обеспечит заказчикам бесперебойную эксплуатацию IT-систем, построенных на зарубежном программном обеспечении, и, как итог, органичный процесс импортозамещения ПО. IBM DB2 представляет собой семейство ПО для управления реляционными базами данных. В программных продуктах […] Сообщение Объявлено об открытии Центра компетенций по миграции с IBM DB2 н... 
Компания J’son & Partners Consulting подготовила результаты регулярного исследования российского рынка офисного программного обеспечения (ПО) за 2023 год, сообщает компания в пятницу. По итогам 2023 года объём российского рынка офисного программного обеспечения вырос на 12% и достиг 64 миллиардов рублей, в то время как в 2022 году этот показатель составлял 56,9 миллиарда рублей. Основная доля […] Сообщение Российский рынок офисного ПО: итоги 2023 года и прогноз до 2030 года – версия J’son & Partners появили... 
    Наверх       На главную страницу       Адрес электропочты Рейтинг@Mail.ru
Данный интернет-сайт носит исключительно информационный характер, и ни при каких условиях информационные
материалы и цены, размещенные на сайте, не являются публичной офертой, определяемой положениями Статьи 437 ГК РФ.

Сергей Волков – эксперт в области информационных технологий © 2011−2024
Работает система управления сайтом «Публикатор 1.9» © 2004−2024