#lmsys 相似帖子 — Python Заметки

@ai_machinelearning_big_data · Post #9053 · 23.11.2025 г., 07:14

🌟RL-фреймворк для обучения MoE-моделей от создателей Chatbot Arena. Miles - фреймворк для RL-обучения от команды LMSYS ORG, ориентированный на энтерпрайз-уровень. Если вы следите за опенсорс разработками, вы наверняка слышали о предшественнике этой системы, проекте slime. Это легкий инструмент, который используют во многих современных пайплайнов пост-трейна. На нем, кстати, запускали GLM-4.6. Slime доказал, что легковесный дизайн работает, и Miles делает следующий шаг - масштабное обучение архитектур MoE и поддержка тяжелых промышленных нагрузок. 🟡Технические детали. Miles предлагает то, что называют "True On-Policy". Раньше между тренировкой и инференсом часто возникало расхождение. Теперь же, благодаря инфраструктурному подходу, LMSYS добилась нулевой дивергенции. Это стало возможным благодаря использованию Flash Attention 3, библиотеки DeepGEMM и ядер от Thinking Machines Lab, работающих в связке с torch.compile. Вторая особенность - в использовании спекулятивного декодирования. Обычно в RL черновая модель замораживается, что мешает ей следовать политике целевой модели. LMSYS добавили онлайн-обучение черновой модели. Результаты на тестах положительные: ускорение генерации более чем на 25%, особенно на поздних стадиях обучения. 🟡Стабильность. Для энтерпрайза память - это деньги. В Miles включили механизмы, предотвращающие падение системы при некритичных ошибках OOM и исправили чрезмерное потребление памяти в FSDP. В дорожной карте проекта обещают поддержку мультимодального обучения, совместимость со SGLang v2 и расширенное спекулятивное декодирование. 🟡Статья 🖥Github @ai_machinelearning_big_data #AI#ML#RL#Miles#LMSYS

Hashtags

#ai #ml #rl #miles #lmsys

小众机场测评

@sstrojan · Post #756 · 20.11.2025 г., 14:31

Најди слично Погледај

🔥推荐一个可能是目前最强的 AI 聚合平台：LMSYS Chatbot Arena。 1. 模型库最新最全：刚刚发布的 Gemini 3 已经上线了！此外还集成了全球（包括国产）最顶尖的 LLM，可以同台竞技。 2. 支持 Artifacts 级编程体验：现在的竞技场不仅仅是对话，它支持实时代码渲染。写 HTML/JS/Python 数据分析，直接出图表和网页预览，交互体验对标 Claude。 3. 完全免费：对于开发者来说，这是一个极佳的“模型体检中心”。 🙅‍♂️ 不想花钱订阅各种会员，又想体验 Gemini 3 和实时代码能力的，直接冲这里：https://lmarena.ai/ #AI#Gemini3#LMSYS#ChatbotArena#大模型#免费资源#编程#黑科技#生产力工具

Hashtags

#ai #gemini3 #lmsys #chatbotarena #大模型 #免费资源 #编程 #黑科技 #生产力工具

Најди сличен содржај

Пронајдени 2 слични објави