TGTGInsighttelegram intelligenceLIVE / telegram public index
← GitHub Trends

TGINSIGHT SIMILAR POSTS

Find similar content

Source channel @githubtrending · Post #15554 · Mar 12

#cplusplus LiteRT is Google's free framework for running fast machine learning and generative AI on phones, computers, and web without cloud help. It uses GPU and NPU for up to 2x speed boosts, zero-copy data handling, and async execution on Android, iOS, Linux, and more, plus easy PyTorch model conversion. You benefit by building quick, private apps like real-time image editing or chatbots that work offline on everyday devices, saving battery and boosting performance. https://github.com/google-ai-edge/LiteRT

Hashtags

Results

2 similar posts found

Search: #visionlanguage

当前筛选 #visionlanguage清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #8742 · 10/10/2025, 02:45 PM

🚀Qwen выпустили гайд по работе с Qwen3-VL! Это подборка интерактивных ноутбуков, демонстрирующих возможности Qwen3-VL - как при локальном запуске, так и через API. Внутри - десятки реальных примеров с разборами: ▪ Работа с изображениями и рассуждение по ним ▪ Агент для взаимодействия с интерфейсами (Computer-Use Agent) ▪ Мультимодальное программирование ▪ Распознавание объектов и сцен (Omni Recognition) ▪ Продвинутое извлечение данных из документов ▪ Точное определение объектов на изображении ▪ OCR и извлечение ключевой информации ▪ 3D-анализ и привязка объектов ▪ Понимание длинных документов ▪ Пространственное рассуждение ▪ Мобильный агент ▪ Анализ и понимание видео 🟠GitHub: https://github.com/QwenLM/Qwen3-VL/tree/main/cookbooks 🟠API-документация: https://alibabacloud.com/help/en/model-studio/user-guide/vision/ 🟠Попробовать: https://chat.qwen.ai/?models=qwen3-vl-plus 🟠Qwen3-VL: https://github.com/QwenLM/Qwen3-VL/blob/main/cookbooks @ai_machinelearning_big_data #Qwen#Qwen3VL#AI#VisionLanguage#Multimodal#LLM

Machinelearning

@ai_machinelearning_big_data · Post #8792 · 10/16/2025, 02:10 PM

📄PaddleOCR-VL (0.9B) — компактная Vision-Language модель нового поколения Команда Baidu AI представила PaddleOCR-VL (0.9B) — сверхлёгкую VLM-модель, которая достигает SOTA-точности в задачах распознавания: - текстов, - таблиц, - формул, - графиков 💡Под капотом: - NaViT - динамический vision-энкодер - ERNIE - облегчённая языковая модель от Baidu ⚡️ Поддержка 109 языков. 🟠GitHub: https://github.com/PaddlePaddle/PaddleOCR) 🟠HuggingFace: https://huggingface.co/PaddlePaddle/PaddleOCR-VL 🟠Docshttps://paddleocr.ai/latest/en/index.html @ai_machinelearning_big_data #BaiduAI#PaddlePaddle#Ernie#PaddleOCR#VisionLanguage#AI#OCR