На главную страницу На главную страницу Помоги больным детям! Их можно спасти!
 
Справочные материалы ←

Как распознать текст отсканированного документа?

В Ульяновск.BSD для распознавания текстов можно использовать tesseract. Это движок оптического распознавания символов (OCR) с открытым исходным кодом, который является одной из самых популярных и качественных OCR-библиотек. Его установка достаточно проста:

pkg install -r latest tesseract

Tesseract – это консольное приложение. Поэтому для удобства работы с ним лучше использовать какой-либо GUI-интерфейс. Одним из таких интерфейсов является приложение VietOCR. С помощью VietOCR можно не только распознавать текст на единичных страницах или в выбранных блоках изображения, но и производить пакетное распознавание текста во множестве изображений, находящихся в одном каталоге. Актуальную версию приложения в виде zip-файла можно скачать со страницы VietOCR на SourceForge. На момент создания данного документа это был файл VietOCR-5.6.1.zip. Для установки приложения достаточно просто распаковать скачанный zip-архив в каталог /usr/local:

unzip -d /usr/local VietOCR-5.6.1.zip

VietOCR – это Java-приложение. Поэтому для его запуска необходимо установить Java-машину:

pkg install -r latest openjdk8-jre

После этого можно запускать VietOCR из командной строки в Терминале:

env _JAVA_OPTIONS='-Dawt.useSystemAAFontSettings=on' java -jar /usr/local/VietOCR3/VietOCR.jar

Или скачайте файл VietOCR.desktop и сохраните его на рабочем столе и в каталоге /usr/local/share/applications/. В результате этого на рабочем столе и в меню появится ярлык для запуска VietOCR.

Примечание 1:

Для возможности проверки орфографии необходимо скачать языковой пакет. Сделать это можно через меню «Настройки» → «Загрузить языковые данные...».

Примечание 2:

Функция сканирования в VietOCR в настоящее время не работает. Поэтому сканирование и подготовку изображений для распознавания необходимо производить с помощью других приложений. Например, skanlite или xsane.

 

Последнее изменение: 13.07.2020 19:28:22
Импортозамещение
В Новосибирске в пятницу начался пятый окружной хакатон проекта «Цифровой прорыв. Сезон: Искусственный интеллект», входящего в президентскую платформу «Россия – страна возможностей»; он закончится 1 октября, сообщают организаторы мероприятия. Более 1000 IT-специалистов будут соревноваться за призовой фонд 3 миллиона рублей. Командам программистов от трёх до пяти человек предстоит решить пять задач (кейсов) на основе методов […] Сообщение Окружной хакатон по ИИ с призовым фондом 3 млн руб стартовал в Новосиб... 
Отечественная автоматизированная информационная система оформления воздушных перевозок «Леонардо» подверглась массированной DDoS-атаке из-за рубежа, сообщает РИА Новости со ссылкой на Telegram-канал «Ростеха». Сообщение было опубликовано в 11.44 мск. В 12.08 «Ростех» написал, что «работоспособность системы бронирования авиабилетов «Леонардо» полностью восстановлена. DDoS-атака успешно отбита». СМИ отмечали, что из-за атаки в аэропортах была затруднена регистрация на рейсы. Напомним, […] Сообщение На отечест... 
Столичная компания «Рокор» организует массовое производство пластин из оксида галлия; изделие представляет собой полупроводниковый материал современного поколения, сообщает mos.ru во вторник. Компания находится на последней стадии подготовки к производству монокристаллических пластин оксида галлия, говорится в сообщении. В течение полутора лет планируется вывести пластины из оксида галлия на внешний рынок. Инновационность московской технологии получения оксида галлия […] Сообщение Инновационная технология п... 
«Бюро 1440», разработчик отечественных низкоорбитальных спутников связи, сообщило во вторник об успешном вводе в эксплуатацию двигательных установок космических аппаратов «Рассвет-1». Напомним, в начале июля с космодрома «Восточный» были запущены три отечественных низкоорбитальных спутника связи, разработанные «Бюро 1440» (входит в «ИКС-холдинг»). Практическая демонстрация технологии успешно прошла в середине августа. В сообщении компании говорится о надёжной работе системы […] Сообщение Успешно введены в э... 
Компания Directum выпустила интеграционный модуль к сервису «Контур.Доверенность» – узлу распределенной блокчейн-сети; теперь пользователи Directum RX могут в едином информационном пространстве выпускать машиночитатемые доверенности (МЧД) и управлять их жизненным циклом, сообщает Directum в среду. Интеграция поддерживается с версии 4.6 Directum RX. Решение подходит компаниям, которые планируют создавать МЧД прямо в корпоративной системе, где хранятся данные […] Сообщение В системе Directum RX появилась подд... 
Президент России поручил обновить Национальную стратегию развития искусственного интеллекта (ИИ) до 2030 года, сообщил председатель правительства Михаил Мишустин во время стратегической сессии по ИИ. Правительству необходимо внести в стратегию изменения, которые предусматривают в том числе реализацию комплекса мер, направленных на повсеместное внедрение таких технологий в отраслях экономики и социальной сферы и в системе государственного управления, […] Сообщение Правительству поручено обновить Национальную... 
Проект приказа Минцифры, вносящего изменения в структуру единого реестра отечественного и евразийского программного обеспечения (ПО), опубликован для общественного обсуждения во вторник. Наименование раздела «Офисные приложения» предложено заменить на «Офисное программное обеспечение». Делается это «в целях оптимизации структуры» реестров, а также для облегчения заказчикам поиска необходимых программных решений в реестрах. Также для уточнения требований к ПО, […] Сообщение Минцифры предложило переименовать ... 
Во время презентации новых продуктов на мероприятии Huawei Connect в Шанхае Huawei не стала раскрывать технические характеристики своего флагмана Mate 60 Pro, сообщил в понедельник телеканал CNN. Презентованы многие новые изделия, в частности, разрабатывавшийся 10 лет «самый лёгкий и тонкий в мире» планшет, заявлено об электромобиле, который «по всем параметрам» превосходит Tesla Model S (машина […] Сообщение Huawei презентовала новые продукты – электромобиль вошёл, сенсационный смартфон без подробностей по... 
Системный интегратор «Инфосистемы Джет» и Directum заключили соглашение о сотрудничестве: главным направлением совместной работы станет поддержка бизнеса при переходе на отечественное ПО, сообщают компании в понедельник. Вместе компании готовы предложить рынку передовые программные продукты для цифровизации бизнес-процессов. Обе компании обладают многолетним опытом развития IT-технологий, разработки и внедрения прогрессивных решений, бизнес-консультирования и аналитики. Задача импортозамещения зарубежного [... 
В Хабаровске наградили победителей четвертого окружного хакатона проекта «Цифровой прорыв. Сезон: Искусственный интеллект», сообщает президентская платформа «Россия – страна возможностей». По итогам соревнования 12 команд-победителей разделили призовой фонд в 2 400 000 рублей. Напомним, организатором проекта является Минэкономразвития. Хакатон проводится в рамках федерального проекта «Искусственный интеллект» национального проекта «Цифровая экономика». Участники хакатона по искусственному интеллекту […] Соо... 
    Наверх       На главную страницу       Адрес электропочты Рейтинг@Mail.ru
Данный интернет-сайт носит исключительно информационный характер, и ни при каких условиях информационные
материалы и цены, размещенные на сайте, не являются публичной офертой, определяемой положениями Статьи 437 ГК РФ.

Сергей Волков – эксперт в области информационных технологий © 2011−2023
Работает система управления сайтом «Публикатор 1.9» © 2004−2023