⚙️ Сбер опубликовал веса и код GigaChat 3.1 Ultra & Lightning под лицензией MIT
Теперь готовые модели можно инсталлировать в собственную инфраструктуру. Флагман на 702B параметров (36B активных) в тестах на reasoning и математику обходит DeepSeek-V3 и Qwen3-235B.
Архитектура использует MoE, MTP и MLA. Для высокой скорости работы предусмотрена облегченная Lightning-версия на 10B параметров. Модели совместимы с популярными стеками: HuggingFace, vLLM, SGLang, llama.cpp. При обучении с нуля команда даже зарепортила критический баг в SGLang.
Прочитать об обновлении
#opensource#ml
🚀🚀#B/USDT delivered quick profits for our premium members in just 19 Minutes — proof of why we're among the best in the game!
👁🗨 Want to trade smarter and faster? Contact @cripexperts to join our premium group and trade with top-tier experts.
✅✅ 126% profit on #B/USDT for our premium members on Binance Futures, ByBit USDT, KuCoin Futures & OKX Futures
✔️✔️Trade has been exited in great profit
👁🗨Contact @primemod to enter the Premium Group for high quality SPOT & FUTURES Signals