TGTGInsighttelegram intelligenceLIVE / telegram public index
← The Digi Doodles
The Digi Doodles avatar

TGINSIGHT POST

Post #340

@Digi_doodles

The Digi Doodles

Views6Post view count
PostedNov 1211/12/2024, 10:32 AM
Post content

Post content

#AI Релиз открытой системы распознавания текста Tesseract 5.5.0. По информации OpenNET, проект Tesseract включает в себя консольную утилиту и библиотеку libtesseract для встраивания функций распознавания текста в другие приложения. Из поддерживающих Tesseract сторонних GUI-интерфейсов можно отметить gImageReader, VietOCR и YAGF. Предлагается два движка распознавания: классический, распознающий текст на уровне шаблонов отдельных символов, и новый, базирующийся на применении системы машинного обучения на базе рекуррентной нейронной сети LSTM, оптимизированной для распознавания целиком строк и позволяющей добиться существенного увеличения точности. Готовые натренированные модели опубликованы для 123 языков. Для оптимизации производительности предлагаются модули, использующие OpenMP и SIMD-инструкции AVX2, AVX, AVX512F, NEON или SSE4.1.