⚙️ Сбер опубликовал веса и код GigaChat 3.1 Ultra & Lightning под лицензией MIT
Теперь готовые модели можно инсталлировать в собственную инфраструктуру. Флагман на 702B параметров (36B активных) в тестах на reasoning и математику обходит DeepSeek-V3 и Qwen3-235B.
Архитектура использует MoE, MTP и MLA. Для высокой скорости работы предусмотрена облегченная Lightning-версия на 10B параметров. Модели совместимы с популярными стеками: HuggingFace, vLLM, SGLang, llama.cpp. При обучении с нуля команда даже зарепортила критический баг в SGLang.
Прочитать об обновлении
#opensource#ml
A light morning stretch to wake up the body and mind. ☀️
Stretched, smiled, ready for a new day.
Лёгкая утренняя разминка, чтобы проснуться телом и мыслями. ☀️
Потянулась, улыбнулась, готова к новому дню.
#LunaEverly#Morning#Stretch#Wellness#DayMindset
A mini picnic in the park. 🧺
Just being here and now is the best plan for the day.
Мини-пикник в парке. 🧺
Просто быть здесь и сейчас — лучший план на день.
#LunaEverly#Picnic#DayMindset#Park#Simplicity