TGTGInsightаналитика telegramLIVE / telegram public index
← [404] — программирование

TGINSIGHT SIMILAR POSTS

Найти похожее

Источник @procode404 · Post #3910 · 9 янв.

​🐍Распознавание текста с изображения —[8:50] Python часто используют при разработке искусственного интеллекта, который, в свою очередь, умеет в компьютерное зрение. Это самое зрение позволяет программе искать и идентифицировать объекты на изображении (люди, животные или даже текст), без чего, естественно, никак не обойтись. В этом видео автор на практике показал, как с использованием EasyOCR считывать текст русского и английского языка с изображения, а после — записать его в файл. Перейти к просмотру #видео#python

Результаты

Найдено 1 похожих постов

Поиск: #omniembed

当前筛选 #omniembed清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #8801 · 17.10.2025, 10:13

⚡️ Omni-Embed-Nemotron - новая единая модель от NVIDIA для поиска по тексту, изображениям, аудио и видео Модель обучена на разнообразных мультимодальных данных и может объединять разные типы входных сигналов в общее векторное представление. - Поддержка всех типов данных: текст, изображение, аудио, видео. - Основана на архитектуре Qwen Omni (Thinker-модуль, без генерации текста). - Контекст - до 32 768 токенов, размер embedding — 2048. - Оптимизирована под GPU, поддерживает FlashAttention 2. Это делает её идеальной для: - кросс-модального поиска (поиск текста по видео или изображению); - улучшения RAG-проектов; - систем мультимодального понимания контента. Просто, быстро и эффективно - всё в одном открытом решении. 🌐 Открытая модель: https://huggingface.co/nvidia/omni-embed-nemotron-3b @ai_machinelearning_big_data #crossmodal#retrieval#openAI#NVIDIA#OmniEmbed#multimodal#AIModels#OpenSource#Search#UnifiedEmbedding