Справочные материалы ←
Как распознать текст отсканированного документа?
В Ульяновск.BSD для распознавания текстов можно использовать tesseract. Это движок оптического распознавания символов (OCR) с открытым исходным кодом, который является одной из самых популярных и качественных OCR-библиотек. Его установка достаточно проста:
pkg install -r latest tesseract
Tesseract – это консольное приложение. Поэтому для удобства работы с ним лучше использовать какой-либо GUI-интерфейс. Одним из таких интерфейсов является приложение VietOCR. С помощью VietOCR можно не только распознавать текст на единичных страницах или в выбранных блоках изображения, но и производить пакетное распознавание текста во множестве изображений, находящихся в одном каталоге. Актуальную версию приложения в виде zip-файла можно скачать со страницы VietOCR на SourceForge. На момент создания данного документа это был файл VietOCR-5.6.1.zip. Для установки приложения достаточно просто распаковать скачанный zip-архив в каталог /usr/local:
unzip -d /usr/local VietOCR-5.6.1.zip
VietOCR – это Java-приложение. Поэтому для его запуска необходимо установить Java-машину:
pkg install -r latest openjdk8-jre
После этого можно запускать VietOCR из командной строки в Терминале:
env _JAVA_OPTIONS='-Dawt.useSystemAAFontSettings=on' java -jar /usr/local/VietOCR3/VietOCR.jar
Или скачайте файл VietOCR.desktop и сохраните его на рабочем столе и в каталоге /usr/local/share/applications/. В результате этого на рабочем столе и в меню появится ярлык для запуска VietOCR.
Примечание 1:
Для возможности проверки орфографии необходимо скачать языковой пакет. Сделать это можно через меню «Настройки» → «Загрузить языковые данные...».
Примечание 2:
Функция сканирования в VietOCR в настоящее время не работает. Поэтому сканирование и подготовку изображений для распознавания необходимо производить с помощью других приложений. Например, skanlite или xsane.
Последнее изменение:
13.07.2020 19:28:22
|
Импортозамещение
В Новосибирске в пятницу начался пятый окружной хакатон проекта «Цифровой прорыв. Сезон: Искусственный интеллект», входящего в президентскую платформу «Россия – страна возможностей»; он закончится 1 октября, сообщают организаторы мероприятия. Более 1000 IT-специалистов будут соревноваться за призовой фонд 3 миллиона рублей. Командам программистов от трёх до пяти человек предстоит решить пять задач (кейсов) на основе методов […]
Сообщение Окружной хакатон по ИИ с призовым фондом 3 млн руб стартовал в Новосиб... →
Отечественная автоматизированная информационная система оформления воздушных перевозок «Леонардо» подверглась массированной DDoS-атаке из-за рубежа, сообщает РИА Новости со ссылкой на Telegram-канал «Ростеха». Сообщение было опубликовано в 11.44 мск. В 12.08 «Ростех» написал, что «работоспособность системы бронирования авиабилетов «Леонардо» полностью восстановлена. DDoS-атака успешно отбита». СМИ отмечали, что из-за атаки в аэропортах была затруднена регистрация на рейсы. Напомним, […]
Сообщение На отечест... →
Столичная компания «Рокор» организует массовое производство пластин из оксида галлия; изделие представляет собой полупроводниковый материал современного поколения, сообщает mos.ru во вторник. Компания находится на последней стадии подготовки к производству монокристаллических пластин оксида галлия, говорится в сообщении. В течение полутора лет планируется вывести пластины из оксида галлия на внешний рынок. Инновационность московской технологии получения оксида галлия […]
Сообщение Инновационная технология п... →
«Бюро 1440», разработчик отечественных низкоорбитальных спутников связи, сообщило во вторник об успешном вводе в эксплуатацию двигательных установок космических аппаратов «Рассвет-1». Напомним, в начале июля с космодрома «Восточный» были запущены три отечественных низкоорбитальных спутника связи, разработанные «Бюро 1440» (входит в «ИКС-холдинг»). Практическая демонстрация технологии успешно прошла в середине августа. В сообщении компании говорится о надёжной работе системы […]
Сообщение Успешно введены в э... →
Компания Directum выпустила интеграционный модуль к сервису «Контур.Доверенность» – узлу распределенной блокчейн-сети; теперь пользователи Directum RX могут в едином информационном пространстве выпускать машиночитатемые доверенности (МЧД) и управлять их жизненным циклом, сообщает Directum в среду. Интеграция поддерживается с версии 4.6 Directum RX. Решение подходит компаниям, которые планируют создавать МЧД прямо в корпоративной системе, где хранятся данные […]
Сообщение В системе Directum RX появилась подд... →
Президент России поручил обновить Национальную стратегию развития искусственного интеллекта (ИИ) до 2030 года, сообщил председатель правительства Михаил Мишустин во время стратегической сессии по ИИ. Правительству необходимо внести в стратегию изменения, которые предусматривают в том числе реализацию комплекса мер, направленных на повсеместное внедрение таких технологий в отраслях экономики и социальной сферы и в системе государственного управления, […]
Сообщение Правительству поручено обновить Национальную... →
Проект приказа Минцифры, вносящего изменения в структуру единого реестра отечественного и евразийского программного обеспечения (ПО), опубликован для общественного обсуждения во вторник. Наименование раздела «Офисные приложения» предложено заменить на «Офисное программное обеспечение». Делается это «в целях оптимизации структуры» реестров, а также для облегчения заказчикам поиска необходимых программных решений в реестрах. Также для уточнения требований к ПО, […]
Сообщение Минцифры предложило переименовать ... →
Во время презентации новых продуктов на мероприятии Huawei Connect в Шанхае Huawei не стала раскрывать технические характеристики своего флагмана Mate 60 Pro, сообщил в понедельник телеканал CNN. Презентованы многие новые изделия, в частности, разрабатывавшийся 10 лет «самый лёгкий и тонкий в мире» планшет, заявлено об электромобиле, который «по всем параметрам» превосходит Tesla Model S (машина […]
Сообщение Huawei презентовала новые продукты – электромобиль вошёл, сенсационный смартфон без подробностей по... →
Системный интегратор «Инфосистемы Джет» и Directum заключили соглашение о сотрудничестве: главным направлением совместной работы станет поддержка бизнеса при переходе на отечественное ПО, сообщают компании в понедельник. Вместе компании готовы предложить рынку передовые программные продукты для цифровизации бизнес-процессов. Обе компании обладают многолетним опытом развития IT-технологий, разработки и внедрения прогрессивных решений, бизнес-консультирования и аналитики. Задача импортозамещения зарубежного [... →
В Хабаровске наградили победителей четвертого окружного хакатона проекта «Цифровой прорыв. Сезон: Искусственный интеллект», сообщает президентская платформа «Россия – страна возможностей». По итогам соревнования 12 команд-победителей разделили призовой фонд в 2 400 000 рублей. Напомним, организатором проекта является Минэкономразвития. Хакатон проводится в рамках федерального проекта «Искусственный интеллект» национального проекта «Цифровая экономика». Участники хакатона по искусственному интеллекту […]
Соо... →
|