Справочные материалы ←
Как распознать текст отсканированного документа?
В Ульяновск.BSD для распознавания текстов можно использовать tesseract. Это движок оптического распознавания символов (OCR) с открытым исходным кодом, который является одной из самых популярных и качественных OCR-библиотек. Его установка достаточно проста:
pkg install -r latest tesseract
Tesseract – это консольное приложение. Поэтому для удобства работы с ним лучше использовать какой-либо GUI-интерфейс. Одним из таких интерфейсов является приложение VietOCR. С помощью VietOCR можно не только распознавать текст на единичных страницах или в выбранных блоках изображения, но и производить пакетное распознавание текста во множестве изображений, находящихся в одном каталоге. Актуальную версию приложения в виде zip-файла можно скачать со страницы VietOCR на SourceForge. На момент создания данного документа это был файл VietOCR-5.6.1.zip. Для установки приложения достаточно просто распаковать скачанный zip-архив в каталог /usr/local:
unzip -d /usr/local VietOCR-5.6.1.zip
VietOCR – это Java-приложение. Поэтому для его запуска необходимо установить Java-машину:
pkg install -r latest openjdk8-jre
После этого можно запускать VietOCR из командной строки в Терминале:
env _JAVA_OPTIONS='-Dawt.useSystemAAFontSettings=on' java -jar /usr/local/VietOCR3/VietOCR.jar
Или скачайте файл VietOCR.desktop и сохраните его на рабочем столе и в каталоге /usr/local/share/applications/. В результате этого на рабочем столе и в меню появится ярлык для запуска VietOCR.
Примечание 1:
Для возможности проверки орфографии необходимо скачать языковой пакет. Сделать это можно через меню «Настройки» → «Загрузить языковые данные...».
Примечание 2:
Функция сканирования в VietOCR в настоящее время не работает. Поэтому сканирование и подготовку изображений для распознавания необходимо производить с помощью других приложений. Например, skanlite или xsane.
Последнее изменение:
13.07.2020 19:28:22
Комментарии
Добавляя комментарий, убедитесь, что он соответствует теме.
Подумайте, будет ли он интересен другим. Спам, умышленная реклама и личная
переписка не допускаются. Соблюдайте правила русского языка. Комментарии
публикуются после проверки модератором и могут быть удалены без объяснения
причин. Ответы на заданные в комментариях вопросы могут исходить от любого
пользователя и являются неофициальными.
|
');
// document.write('');
// document.write('');
//}
//-->
Импортозамещение
Рост производительности вычислительной техники не обязан сопровождаться увеличением плотности элементов в микросхемах, следует из поступающих в понедельник сообщений о заявлении главы подразделения полупроводников Huawei Хэ Тиньбо. Huaweicentral.com сообщает, что Huawei разработала нетрадиционный метод увеличения производительности интегральных микросхем без увеличения плотности транзисторов и других элементов – за счёт многоуровневой комплексной оптимизации работы чипов. От совершенствования технологическо... →
Петербургский международный экономический форум (ПМЭФ) пройдёт в Санкт-Петербурге 3–6 июня 2026 года – мы выделили из программы мероприятия, относящиеся к IT. Выдержки из программы форума по состоянию на 25 мая 2026. 3 июня 11:45–13:00 — Искусственный интеллект в креативных индустриях: национальные стратегии развития и границы применения 13:30–14:45 — В борьбе за экономику и умы в […]
Сообщение Какие IT-секции состоятся на ПМЭФ появились сначала на Digital Russia. →
С 18 по 21 мая в Нижнем Новгороде прошло главное деловое событие в сфере цифровой экономики и технологий — XI международная конференция «Цифровая индустрия промышленной России»: за четыре дня мероприятие посетило более 13 тысяч участников из всех регионов России и 46 стран мира, включая Китай, Индию, Бразилию, Сербию, Аргентину, Филиппины и другие государства, сообщает пресс-служба […]
Сообщение Главные итоги «ЦИПР-2026»: более 13 тысяч участников, 350 подписаний, полсотни стран появились сначала на Digital... →
На конференции «ЦИПР-2026» представлены результаты реализации особо значимых проектов, разработку которых координирует индустриальный центр компетенций (ИЦК) «Мобильная связь», сообщает «Ростелеком». По решениям ИЦК было определено четыре ОЗП по импортозамещению телеком-оборудования и решений: разработка и внедрение отечественного ядра мобильной связи 4G: решение запущено в промышленную эксплуатацию в 27 регионах с возможностью обслуживания более десяти миллионов абонентов; […]
Сообщение ИЦК «Мобильная связ... →
На «ЦИПР 2026» продемонстрирована новая версия Postgres Pro Enterprise для «1С», которая решает самые острые проблемы производительности «1С», а также повышает стабильность её работы и снижает требования к инфраструктуре, сообщает Postgres Professional. Решение опирается на результаты эксплуатации у крупных заказчиков из сегментов промышленности, ретейла, финансовой сферы, а также на независимое тестирование партнёра «ИТ-Экспертиза», подтвердившее стабильную […]
Сообщение Postgres Professional представила н... →
Компания «Открытая мобильная платформа» в ходе конференции «Цифровая индустрия промышленной России» в Нижнем Новгороде представила на отечественном планшете KVADRA_T (бренд клиентских устройств Yadro) новую версию доверенной операционной системы «Аврора» 5.2.1, сообщает ОМП в среду. Одним из ключевых изменений является поддержка PWA-приложений (прогрессивное веб-приложение — сайт, который благодаря специальным технологиям работает как полноценное мобильное приложение). Теперь […]
Сообщение Представлена нова... →
Абсолютное большинство российских интернет-пользователей, а именно 95% опрошенных, пользуются хотя бы одним видеосервисом для просмотра «длинных» видео (обзоры, интервью, фильмы и пр.), сообщил аналитический центр ВЦИОМ в среду; большинство (61%) выбирает платформу «VK Видео». На втором месте Rutube с показателем 49%, на третьем – YouTube (44%). Если оценивать регулярность использования видеосервисов, раз в неделю и […]
Сообщение Отечественные видеохостинги стали популярнее YouTube – ВЦИОМ появились сначала... →
Ассоциация производителей программных продуктов «Отечественный софт», Ассоциация «Руссофт» и Ассоциация российских разработчиков и производителей электроники (АРПЭ) подписали в ходе конференции «ЦИПР-2026» соглашение о сотрудничестве в области медицинских технологий (медтех) и цифрового здравоохранения, направленное на развитие отечественных IT- и электронных решений для медицины и координацию отраслевого взаимодействия, сообщает АРПП в среду. Ключевым элементом соглашения стало формирование […]
Сообщение А... →
В ходе XI конференции «Цифровая индустрия промышленной России» состоялась церемония награждения победителей премии «ЦИПР Диджитал-2026», сообщает пресс-служба ЦИПР. На участие в премии было подано 630 заявок, 60 из них вошли в шорт-лист. В рамках церемонии были объявлены 12 лидеров цифровой трансформации. Победителей определяло жюри, куда входят ведущие государственные деятели, ответственные за развитие цифровых технологий, руководители […]
Сообщение Объявлены победители премии «ЦИПР Диджитал-2026» появилис... →
На конференции ЦИПР-2026 компании «Аквариус», «Байкал Электроникс» и «Группа Астра» объявили о намерении совместно создавать и развивать целостную экосистему полностью российских программно-аппаратных комплексов на базе процессоров семейства Baikal для корпоративных заказчиков и объектов критической информационной инфраструктуры. Результатом совместной разработки станет появление на российском рынке унифицированного инфраструктурного стека, объединяющего аппаратную платформу, процессорное ядро и системное п... →
|