⚙️ Сбер опубликовал веса и код GigaChat 3.1 Ultra & Lightning под лицензией MIT
Теперь готовые модели можно инсталлировать в собственную инфраструктуру. Флагман на 702B параметров (36B активных) в тестах на reasoning и математику обходит DeepSeek-V3 и Qwen3-235B.
Архитектура использует MoE, MTP и MLA. Для высокой скорости работы предусмотрена облегченная Lightning-версия на 10B параметров. Модели совместимы с популярными стеками: HuggingFace, vLLM, SGLang, llama.cpp. При обучении с нуля команда даже зарепортила критический баг в SGLang.
Прочитать об обновлении
#opensource#ml
251126 || DispatchJapan 𝕏 UPDATE
Every member slayed in their own way. who caught your eye first? 👀🔥
#IDLE#아이들#kpop#dispatch
Get a Free K-pop Postcard :👉https:// http://www.dipebeta.app/
–🦋
── @GIDLE_UPDATE ──
🇬🇧Dispatch #1-2
🇷🇺Диспетчер #1-2
Серия из четырех цифровых комиксов, выпущенных AdHoc Studio в составе Deluxe Edition игры Dispatch
🗣еще 2 выпуска заливать или не нравится такое❓
#комикс#comics#диспетчер#dispatch
#adhoc_studio
https://www.python.org/dev/peps/pep-0443/
This PEP proposes a new mechanism in the #functools standard library module that provides a simple form of generic programming known as #single_dispatch#generic functions.
A generic function is composed of multiple functions implementing the same operation for different types. Which implementation should be used during a call is determined by the #dispatch algorithm. When the implementation is chosen based on the type of a single argument, this is known as #single_dispatch .
#overloading