TGTGInsightаналитика telegramLIVE / telegram public index
Содержимое поста
Содержимое
⚡️ LMMs Engine - единый движок для обучения мультимодальных моделей Простой, гибкий и мощный фреймворк от LMMs-Lab для обучения моделей, которые понимают текст, изображения, аудио и видео, всё в одном месте. Что внутри: • Поддержка 19+ архитектур, включая: • Qwen3-VL - обработка изображений в native-разрешении, контекст до 10 000+ токенов • Qwen2.5-Omni - единая модель для текста, изображений и аудио • WanVideo - генерация видео из текста/изображений (T2V, I2V, V2V) • dLLM - диффузионные языковые модели • LLaVA-OneVision, Bagel, SiT, RAE-SigLip и другие 📜 Лицензия: Apache 2.0 (можно использовать даже в коммерческих проектах) 🔗 GitHub: https://github.com/EvolvingLMMs-Lab/lmms-engine @ai_machinelearning_big_data #llm#opensource