TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #275 · 2 авг.

А вы ждёте выхода Python 4? Ну зря ждёте😭 По словам Гвидо, ему хватило проблем с переходом со 2го на 3й) Лучше постепенно развивать имеющийся функционал с полной совместимостью кодовой базы чем делать такие резкие изменения. Велика вероятность что выше 3 мажорная версия более не поднимется. А как же обещания про невероятные ускорения в Python 4? Очевидно, что теперь они все будут добавляться в 3ю ветку. Вот здесь можно почитать про планы ускорения где Гвидо обещает скорость 2х уже в 3.11 и х5 через 4 года! Здесь можно посмотреть следующие шаги по оптимизации. #offtop#2to3

Hashtags

Резултати

Пронајдени 2 слични објави

Пребарај: #lmsys

当前筛选 #lmsys清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #9053 · 23.11.2025 г., 07:14

🌟RL-фреймворк для обучения MoE-моделей от создателей Chatbot Arena. Miles - фреймворк для RL-обучения от команды LMSYS ORG, ориентированный на энтерпрайз-уровень. Если вы следите за опенсорс разработками, вы наверняка слышали о предшественнике этой системы, проекте slime. Это легкий инструмент, который используют во многих современных пайплайнов пост-трейна. На нем, кстати, запускали GLM-4.6. Slime доказал, что легковесный дизайн работает, и Miles делает следующий шаг - масштабное обучение архитектур MoE и поддержка тяжелых промышленных нагрузок. 🟡Технические детали. Miles предлагает то, что называют "True On-Policy". Раньше между тренировкой и инференсом часто возникало расхождение. Теперь же, благодаря инфраструктурному подходу, LMSYS добилась нулевой дивергенции. Это стало возможным благодаря использованию Flash Attention 3, библиотеки DeepGEMM и ядер от Thinking Machines Lab, работающих в связке с torch.compile. Вторая особенность - в использовании спекулятивного декодирования. Обычно в RL черновая модель замораживается, что мешает ей следовать политике целевой модели. LMSYS добавили онлайн-обучение черновой модели. Результаты на тестах положительные: ускорение генерации более чем на 25%, особенно на поздних стадиях обучения. 🟡Стабильность. Для энтерпрайза память - это деньги. В Miles включили механизмы, предотвращающие падение системы при некритичных ошибках OOM и исправили чрезмерное потребление памяти в FSDP. В дорожной карте проекта обещают поддержку мультимодального обучения, совместимость со SGLang v2 и расширенное спекулятивное декодирование. 🟡Статья 🖥Github @ai_machinelearning_big_data #AI#ML#RL#Miles#LMSYS

小众机场测评

@sstrojan · Post #756 · 20.11.2025 г., 14:31

🔥推荐一个可能是目前最强的 AI 聚合平台:LMSYS Chatbot Arena。 1. 模型库最新最全: 刚刚发布的 Gemini 3 已经上线了!此外还集成了全球(包括国产)最顶尖的 LLM,可以同台竞技。 2. 支持 Artifacts 级编程体验: 现在的竞技场不仅仅是对话,它支持实时代码渲染。写 HTML/JS/Python 数据分析,直接出图表和网页预览,交互体验对标 Claude。 3. 完全免费: 对于开发者来说,这是一个极佳的“模型体检中心”。 🙅‍♂️ 不想花钱订阅各种会员,又想体验 Gemini 3 和实时代码能力的,直接冲这里:https://lmarena.ai/ #AI#Gemini3#LMSYS#ChatbotArena#大模型#免费资源#编程#黑科技#生产力工具