TGTGInsightаналитика telegramLIVE / telegram public index
← [404] — программирование

TGINSIGHT SIMILAR POSTS

Найти похожее

Источник @procode404 · Post #3996 · 25 мар.

⚙️ Сбер опубликовал веса и код GigaChat 3.1 Ultra & Lightning под лицензией MIT Теперь готовые модели можно инсталлировать в собственную инфраструктуру. Флагман на 702B параметров (36B активных) в тестах на reasoning и математику обходит DeepSeek-V3 и Qwen3-235B. Архитектура использует MoE, MTP и MLA. Для высокой скорости работы предусмотрена облегченная Lightning-версия на 10B параметров. Модели совместимы с популярными стеками: HuggingFace, vLLM, SGLang, llama.cpp. При обучении с нуля команда даже зарепортила критический баг в SGLang. Прочитать об обновлении #opensource#ml

Результаты

Найдено 1 похожих постов

Поиск: #sourcecraft

当前筛选 #sourcecraft清除筛选
Venture Village Wall 🦄

@venturevillagewall · Post #4349 · 09.03.2025, 22:00

Weekly AI Digest: Key Developments 🔹 Anthropic raises $3.5B through incremental funding rounds. Read more 🔹 QwQ 32B launched, slightly trailing top performers. Details here 🔹 Wan 2.1 remains a top open-source model amid competition. Learn more 🔹 Hunyuan Image2Video: Tencent's response to Alibaba's offering. Explore here 🔹 SourceCraft introduces cloud-based team development as VM replacement. More info 🔹 Apple's Mac Studio handles demanding models and LLMs. Discover more 🔹 SpeechSense analyzes customer conversations using LLM technology. Details 🔹 RL wins Turing Award, recognized with a $1M prize. Full story 🔹 Bitcoin drops to $82,223; Ethereum to $1,998, with $243M in liquidations. Read market update. #AI#Crypto#VC#Anthropic#Bitcoin#Ethereum#Hunyuan#Tencent#AIModels#OpenSource#MacStudio#SpeechSense#Investments#Funding#TuringAward#Liquidations#QwQ#SourceCraft#SmartTech