Справочные материалы ←
Как распознать текст отсканированного документа?
В Ульяновск.BSD для распознавания текстов можно использовать tesseract. Это движок оптического распознавания символов (OCR) с открытым исходным кодом, который является одной из самых популярных и качественных OCR-библиотек. Его установка достаточно проста:
pkg install -r latest tesseract
Tesseract – это консольное приложение. Поэтому для удобства работы с ним лучше использовать какой-либо GUI-интерфейс. Одним из таких интерфейсов является приложение VietOCR. С помощью VietOCR можно не только распознавать текст на единичных страницах или в выбранных блоках изображения, но и производить пакетное распознавание текста во множестве изображений, находящихся в одном каталоге. Актуальную версию приложения в виде zip-файла можно скачать со страницы VietOCR на SourceForge. На момент создания данного документа это был файл VietOCR-5.6.1.zip. Для установки приложения достаточно просто распаковать скачанный zip-архив в каталог /usr/local:
unzip -d /usr/local VietOCR-5.6.1.zip
VietOCR – это Java-приложение. Поэтому для его запуска необходимо установить Java-машину:
pkg install -r latest openjdk8-jre
После этого можно запускать VietOCR из командной строки в Терминале:
env _JAVA_OPTIONS='-Dawt.useSystemAAFontSettings=on' java -jar /usr/local/VietOCR3/VietOCR.jar
Или скачайте файл VietOCR.desktop и сохраните его на рабочем столе и в каталоге /usr/local/share/applications/. В результате этого на рабочем столе и в меню появится ярлык для запуска VietOCR.
Примечание 1:
Для возможности проверки орфографии необходимо скачать языковой пакет. Сделать это можно через меню «Настройки» → «Загрузить языковые данные...».
Примечание 2:
Функция сканирования в VietOCR в настоящее время не работает. Поэтому сканирование и подготовку изображений для распознавания необходимо производить с помощью других приложений. Например, skanlite или xsane.
Последнее изменение:
13.07.2020 19:28:22
Комментарии
Добавляя комментарий, убедитесь, что он соответствует теме.
Подумайте, будет ли он интересен другим. Спам, умышленная реклама и личная
переписка не допускаются. Соблюдайте правила русского языка. Комментарии
публикуются после проверки модератором и могут быть удалены без объяснения
причин. Ответы на заданные в комментариях вопросы могут исходить от любого
пользователя и являются неофициальными.
|
');
// document.write('');
// document.write('');
//}
//-->
Импортозамещение
Об авторе: Виталий Прокудин, министр цифрового развития и связи Тульской области На протяжении 2025 года развитие цифровой инфраструктуры и поддержка IT-отрасли в Тульской области оставались ключевыми направлениями работы министерства. Наша цель неизменна: каждый проект должен приносить пользу жителям региона и повышать их благополучие. Мы не просто внедряем технологии — мы создаём условия для роста качества […]
Сообщение Итоги работы Министерства цифрового развития и связи Тульской области в 2025 году появ... →
Льготная ставка по IT-ипотеке (до 6%) сохранится для сотрудников компаний-резидентов «Сколково», оформивших кредит до 31 декабря 2025 года, Минцифры подготовило соответствующий проект решения (такое решение принимает распорядитель бюджета — ред.), сообщает министерство в четверг. Напомним, в конце 2025 года был подписан закон, согласно которому вводится запрет на применение IT-льгот (льготная ставка по налогу на прибыль […]
Сообщение Минцифры решило помочь резидентам «Сколково» сохранить IT-ипотеку появилис... →
Начался приём заявок на ежегодную премию «ЦИПР Диджитал», проходящую в рамках конференции «ЦИПР-2026»; подать заявку можно до 10 апреля, сообщает оргкомитет мероприятия. Принять участие в премии могут компании, ведомства, субъекты РФ и персоны, создающие цифровые продукты и сервисы, а также реализующие проекты в области экономики данных. Оценивать проекты будут лидеры отрасли и ключевые эксперты в […]
Сообщение Стартовал приём заявок на премию «ЦИПР Диджитал-2026» появились сначала на Digital Russia. →
Об авторе: Андрей Сытник, председатель комитета цифрового развития Ленинградской области Ленинградская область активно внедряет современные цифровые технологии во всех ключевых сферах, системно создаёт условия для ускорения экономического роста региона и повышения качества жизни населения. В ноябре 2025 года 47-й регион получил высокую награду – почётную грамоту «За значительный вклад в цифровое развитие страны и высокие […]
Сообщение Цифровое развитие Ленинградской области в 2025 году и основные приоритеты... →
Об авторе: Ренат Лашин, исполнительный директор Ассоциации разработчиков программных продуктов (АРПП) «Отечественный софт» 2025 год для Ассоциации разработчиков «Отечественный софт» стал годом системного укрепления и расширения зон GR-влияния. В состав Ассоциации вошли 35 новых IT-компаний, общее число участников достигло 304. Совокупная выручка членов Ассоциации сегодня равняется 570 миллиардам рублей, это порядка 30% всей индустрии ПО, […]
Сообщение Результаты работы АРПП в 2025 году появились сначала на ... →
Об авторе: Михаил Степанов, министр цифрового развития, информационной политики и массовых коммуникаций Чувашской Республики Цифровая трансформация – одна из семи национальных целей Российской Федерации на период до 2030 года и на перспективу до 2036 года, определённая указом президента Российской Федерации от 7 мая 2024 г. № 309 «О национальных целях развития Российской Федерации на период […]
Сообщение Минцифры Чувашской Республики – итоги 2025 года и планы на 2026 год появились сначала на Digital Russia. →
Распоряжением правительства Минфину поручено в 2026 году выделить Минпромторгу 300 миллионов рублей на предоставление субсидии на государственную поддержку проектов создания, развития и (или) модернизации объектов инфраструктуры промышленных технопарков в сфере электронной промышленности. Промышленные парки и технопарки предназначены для быстрого запуска производства, тестирования новых технологий и выведения товаров на рынок. В августе 2023 года вышло постановление […]
Сообщение Дополнительные 300 млн руб ... →
Отправлять сообщения и совершать звонки в мессенджере Мax теперь смогут пользователи из стран Азии, Африки, Ближнего Востока и Латинской Америки, сообщила компания-разработчик в четверг. Для регистрации в мессенджере необходимо скачать приложение, выбрать страну, ввести номер телефона и проверочный код из SMS. Зарегистрироваться в Мax можно с SIM-картой операторов в том числе Вьетнама, Индонезии, ОАЭ, Таиланда, […]
Сообщение Зарегистрироваться в Max теперь можно с SIM-картами 40 дружественных стран появилис... →
Минэкономразвития и Роспатент разрабатывают механизм, позволяющий передавать в управление интеллектуальную собственность зарубежных компаний, которые покинули наш рынок по политическим мотивам, но при этом продолжают поддерживать защиту своих прав, сообщил на коллегии Роспатента вице-премьер Александр Новак, пишет «Интерфакс». По словам вице-премьера, речь об иностранных производителях из недружественных стран. Механизм предполагает временное управление интеллектуальными правами таких компаний. […]
Сообщени... →
Четвёртого марта, во Всемирный день инженерии, вход в Музей криптографии в Москве будет бесплатным для инженеров, их родных и друзей, сообщает «ИКС Холдинг» во вторник. Как работают шифры, которые скрывают переписку в мессенджерах? Кто и когда придумал защищать данные? Как скрывали содержание дипломатических переписок и военных приказов до появления электроники? Уникальная коллекция шифровальной техники и […]
Сообщение Во Всемирный день инженерии Музей криптографии сделал вход для инженеров бесплатным появи... →
|