TGTGInsightаналитика telegramLIVE / telegram public index
← Machinelearning
Machinelearning avatar

TGINSIGHT POST

Post #9626

@ai_machinelearning_big_data

Machinelearning

Просмотры23,900Количество просмотров
Опубликован5 мар.05.03.2026, 15:11
Содержимое поста

Содержимое

🔥 Опубликованы веса и код Green-VLA — модели для управления роботами общего назначения. Сбер открыл доступ к своей Vision-Language-Action модели. В феврале эта работа стала лучшей статьей недели на Hugging Face, а сейчас всё выложили в open-source. 🔘Главное о технической части: - В основе лежит Qwen3-VL-4B и трансформер, который с помощью flow-matching предсказывает действия робота в реальном времени - Модель обучалась в пять этапов, от мультимодальных веб-данных до примеров с реальных роботов - Унификация робототехнических данных позволяет модели лучше обобщаться и работать на разных роботах Благодаря такому подходу, модель получает лучшие метрики на робототехнических бенчмарках Fractal и Bridge. 🔘Состав релиза: - исходный код для обучения и инференса на GitHub; - предобученные веса на платформе Hugging Face; 🔜 Релиз может быть важен для всех, кто занимается робототехникой. Базовую модель можно быстро дообучить под конкретного робота и использовать ее для решения реальных задач, например на производствах или складах. @ai_machinelearning_big_data #ai#ml#sber