TGTGInsightаналитика telegramLIVE / telegram public index
← [404] — программирование

TGINSIGHT SIMILAR POSTS

Найти похожее

Источник @procode404 · Post #3996 · 25 мар.

⚙️ Сбер опубликовал веса и код GigaChat 3.1 Ultra & Lightning под лицензией MIT Теперь готовые модели можно инсталлировать в собственную инфраструктуру. Флагман на 702B параметров (36B активных) в тестах на reasoning и математику обходит DeepSeek-V3 и Qwen3-235B. Архитектура использует MoE, MTP и MLA. Для высокой скорости работы предусмотрена облегченная Lightning-версия на 10B параметров. Модели совместимы с популярными стеками: HuggingFace, vLLM, SGLang, llama.cpp. При обучении с нуля команда даже зарепортила критический баг в SGLang. Прочитать об обновлении #opensource#ml

Результаты

Найдено 1 похожих постов

Поиск: #envoyproxy

当前筛选 #envoyproxy清除筛选
GitHub Trends

@githubtrending · Post #15521 · 25.02.2026, 11:30

#rust#ai_gateway#ai_gateway_support#envoy#envoyproxy#gateway#generative_ai#llm_gateway#llm_inference#llm_proxy#llm_routing#llmops#llms#openai#prompt#proxy#proxy_server#routing Plano is an AI-native proxy server that handles key tasks for agentic apps like routing between agents, smart LLM model selection, safety guardrails, and automatic traces for observability. Define agents in simple YAML, write basic HTTP code in any language, and start Plano to run multi-agent systems without custom plumbing or framework lock-in. You benefit by building and shipping reliable agents to production much faster, focusing on core logic while gaining safety, low latency, and easy scaling. https://github.com/katanemo/plano