На главную страницу На главную страницу Помоги больным детям! Их можно спасти!
 
Справочные материалы ←

Как распознать текст отсканированного документа?

В Ульяновск.BSD для распознавания текстов можно использовать tesseract. Это движок оптического распознавания символов (OCR) с открытым исходным кодом, который является одной из самых популярных и качественных OCR-библиотек. Его установка достаточно проста:

pkg install -r latest tesseract

Tesseract – это консольное приложение. Поэтому для удобства работы с ним лучше использовать какой-либо GUI-интерфейс. Одним из таких интерфейсов является приложение VietOCR. С помощью VietOCR можно не только распознавать текст на единичных страницах или в выбранных блоках изображения, но и производить пакетное распознавание текста во множестве изображений, находящихся в одном каталоге. Актуальную версию приложения в виде zip-файла можно скачать со страницы VietOCR на SourceForge. На момент создания данного документа это был файл VietOCR-5.6.1.zip. Для установки приложения достаточно просто распаковать скачанный zip-архив в каталог /usr/local:

unzip -d /usr/local VietOCR-5.6.1.zip

VietOCR – это Java-приложение. Поэтому для его запуска необходимо установить Java-машину:

pkg install -r latest openjdk8-jre

После этого можно запускать VietOCR из командной строки в Терминале:

env _JAVA_OPTIONS='-Dawt.useSystemAAFontSettings=on' java -jar /usr/local/VietOCR3/VietOCR.jar

Или скачайте файл VietOCR.desktop и сохраните его на рабочем столе и в каталоге /usr/local/share/applications/. В результате этого на рабочем столе и в меню появится ярлык для запуска VietOCR.

Примечание 1:

Для возможности проверки орфографии необходимо скачать языковой пакет. Сделать это можно через меню «Настройки» → «Загрузить языковые данные...».

Примечание 2:

Функция сканирования в VietOCR в настоящее время не работает. Поэтому сканирование и подготовку изображений для распознавания необходимо производить с помощью других приложений. Например, skanlite или xsane.

 

Последнее изменение: 13.07.2020 19:28:22
Импортозамещение
В Шанхае официально введён в эксплуатацию научно-исследовательский центр Huawei — Lianqiu Lake R&D Center — работать в котором будут около 35 тысяч учёных и инженеров, сообщил в воскресенье tomshardware.com. Стоимость проекта составила 10 миллиардов юаней, на его реализацию ушло три года. Центр, отмечает издание, больше штаб-квартиры Microsoft и Apple вместе взятых и занимает площадь свыше […] Сообщение Huawei официально открыла гигантский исследовательский центр в Шанхае появились сначала на Digital Russia... 
Российский производитель офисного ПО «МойОфис» внедрил в мобильное приложение «МойОфис Документы» GigaChat API для быстрой и эффективной работы с текстовым контентом, сообщает компания в понедельник. До 31 августа функциональность доступна всем пользователям в режиме бета-тестирования, по его итогам наиболее востребованные сценарии будут включены в продукт на постоянной основе. Технология расширяет возможности «МойОфис Документы», позволяя оперативно […] Сообщение «МойОфис» запустил тестирование функциональ... 
Нидерландская компания Yandex N.V. закрыла сделку по продаже бизнеса «Яндекса» и полностью вышла из состава акционеров группы, сообщает международная компания акционерное общество (МКАО) «Яндекс» в понедельник. Как уже объявлялось ранее, до 31 июля 2024 года Yandex N.V. сменит название и прекратит использовать бренды «Яндекса», говорится в сообщении. Напомним, МКПАО «Яндекс» стала новым владельцем основного юридического […] Сообщение «Яндекс» объявил о завершении реструктуризации появились сначала на Digita... 
Ряд крупных российских разработчиков потеряли доступ к облачному сервису американского разработчика систем автоматизированного проектирования (САПР), а вместе с этим и доступ к своей проектной документации, которая там хранилась, т.е. к рабочим материалам проектирования объектов строительства, сообщает РБК со ссылкой на источники среди застройщиков. Напомним, Autodesk официально объявила о приостановке работы в России ещё в марте […] Сообщение Autodesk начала выборочное отключение пользователей из РФ – СМИ ... 
Разработчик российской офисной среды с расширенным функционалом для совместной работы и коммуникации «Р7-Офис» выпустил обновление десктопных редакторов для работы с документами, сообщает компания в пятницу. Основные изменения коснулись редактора таблиц. Добавлены опции для пользователей, которые взаимодействуют с таблицами на профессиональном уровне. Новый релиз понравится продвинутым пользователям, которые много работают со сложными таблицами и формулами. Появилась […] Сообщение «Р7-Офис» объявил о разраб... 
С начала запуска программы субсидирования высокотехнологичных компаний Подмосковья, стартовавшей в июне 2022 года, правительство региона подписало 21 соглашение с IT-компаниями, а общая сумма грантов превысила 1,5 миллиарда рублей, сообщает министерство государственного управления, информационных технологий и связи Московской области в пятницу. Благодаря грантам IT-компаниям Подмосковья удалось нанять более 3,5 тысячи новых сотрудников, говорится в сообщении. Напомним, […] Сообщение Общая сумма выданных IT-... 
Стратегическая сессия по национальным проектам «Эффективная транспортная система» и «Беспилотные авиационные системы» (БАС) прошла в правительстве в понедельник. Как сообщил председатель правительства Михаил Мишустин, в 2030 году количество беспилотной техники, произведённой в России, должно вырасти более чем в пять раз. Глава правительства подчеркнул, что при этом важно активно внедрять собственные передовые технологии, энергетические и силовые […] Сообщение Правительство опубликовало планы развития беспил... 
Компания «Открытая мобильная платформа», разработчик защищённой отечественной мобильной платформы «Аврора», объявила в понедельник о выходе пятой версии «Аврора Центр» – платформы единого управления корпоративными устройствами на базе различных ОС. Платформа удалённого управления «Аврора Центр» 5.0 — это отечественное решение, заменяющее VMWare AirWatch, MobileIron, Citrix или SOTI и предназначенное для упрощения и централизации управления корпоративными мобильными […] Сообщение Объявлено о выходе новой вер... 
Компания Postgres Professional, разработчик российской СУБД Postgres Pro, выпустила обновление утилиты pg_probackup – приложения для резервного копирования и восстановления кластеров баз данных, сообщает компания в понедельник. Новая версия 2.8.2 содержит ряд важных изменений. Исправлена ошибка парсинга oid, в результате чего базы и табличные пространства с relfilenode больше одного миллиарда не попадали в резервную копию. Исправлена […] Сообщение Обновлена утилита для резервного копирования СУБД Postgres P... 
Глава правительства РФ Михаил Мишустин дал поручения по итогам IX конференции «Цифровая индустрия промышленной России» (ЦИПР), сообщается на сайте government.ru, сами поручения при этом пока не опубликованы. Конференция проходила в Нижнем Новгороде с 21 по 24 мая 2024 года. Правительство планирует снизить расходы предприятий и компаний при реализации комплексных проектов по внедрению российского программного обеспечения […] Сообщение Председатель правительства дал поручения по итогам ЦИПР 2024 появились сна... 
    Наверх       На главную страницу       Адрес электропочты Рейтинг@Mail.ru
Данный интернет-сайт носит исключительно информационный характер, и ни при каких условиях информационные
материалы и цены, размещенные на сайте, не являются публичной офертой, определяемой положениями Статьи 437 ГК РФ.

Сергей Волков – эксперт в области информационных технологий © 2011−2024
Работает система управления сайтом «Публикатор 1.9» © 2004−2024