TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #620 · 30.10

История из жизни. В начальной школе у нас проводили конкурс моделей из Лего, участвовать мог каждый, у кого был этот конструктор. Требовалось заявить одну любую модель. Я тогда был под впечатлением от просмотра Фантомаса — той серии, где Фантомас улетает на автомобиле с крыльями, поэтому потратил много дней, чтобы собрать такой автомобиль. С виду совершенно обычный, но внутри был спрятан хитрый механизм на рычагах. Нужно было нажать на определённое место на крыше, чтобы из боков выдвинулись крылья. Я очень гордился этой поделкой и с радостью принёс её на конкурс, будучи уверенным, что выиграю. — Нет, — сказали мне на месте, — с готовыми моделями нельзя. Вы должны были принести конструктор и собирать модель для конкурса на месте. Так что собирай что-то другое. Это была катастрофа. У меня не было с собой всего конструктора, только те детали, которые использовались в автомобиле Фантомаса. Совсем небольшая часть весьма специфических деталей, из которых не особенно то соберёшь что-то принципиально другое. Я запаниковал. Я видел, что некоторые участники принесли с собой инструкции и собирают коробочные наборы — это было запрещено, но следили слабо, а пожилая учительница начальных классов, скорее всего, не особо понимала, что это у них за книжечки цветные такие. Ну собирают же дети что-то. Я начал по памяти воспроизводить свой коробочный набор LEGO 6550, многие детали которого были в машине Фантомаса, но быстро понял, что, во-первых, деталей всё-таки не особо хватает, а, во-вторых, не хотелось быть нарушителем и представлять не свою модель. К этому моменту я перестал нервничать и успокоился. Подумав, на что похож корпус вот этой машинки, я остановился на такой идее: пусть это будет голова динозавра. Добавил тело, хвост, лапы, челюсти. Получилось что-то вроде тирекса-робота, похожего на трансформеров-динозавров из мультика. Никаких интересных механизмов не было, вроде чуть-чуть двигались лапы, кажется даже челюсть не закрывалась. Мы расставили наши модельки на общем столе. Пригласили комиссию из учителей и... сразу отвели их к столу оценивать. Не дали презентовать модель или как-то показать её в действии, не дали ничего о ней рассказать, мы вообще стояли в стороне и не видели, что там учителя делают. Практически все модельки были автомобилями. Если бы мне разрешили оставить автомобиль Фантомаса, то для жюри это был бы просто обычный автомобиль, они никак не узнали бы, что там внутри механизм с крыльями. Зато динозавр был единственным и привлекал своим внешним видом. Выиграли в итоге двое: я и ещё один парень с космическим кораблём (тоже единственным). В награду получили по книжке-раскраске с автомобилями :) Мораль, думаю, вывести совсем не сложно: 1. Иногда проблемы это действительно новые возможности. 2. Нежелание мухлевать и сокращать путь сделает твои результаты более интересными, чем у других. 3. Всегда носи с собой все детали своего Lego :) #life

Hashtags

Резултати

Намерени 2 подобни публикации

Търсене: #miles

当前筛选 #miles清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #9053 · 23.11.2025 г., 07:14

🌟RL-фреймворк для обучения MoE-моделей от создателей Chatbot Arena. Miles - фреймворк для RL-обучения от команды LMSYS ORG, ориентированный на энтерпрайз-уровень. Если вы следите за опенсорс разработками, вы наверняка слышали о предшественнике этой системы, проекте slime. Это легкий инструмент, который используют во многих современных пайплайнов пост-трейна. На нем, кстати, запускали GLM-4.6. Slime доказал, что легковесный дизайн работает, и Miles делает следующий шаг - масштабное обучение архитектур MoE и поддержка тяжелых промышленных нагрузок. 🟡Технические детали. Miles предлагает то, что называют "True On-Policy". Раньше между тренировкой и инференсом часто возникало расхождение. Теперь же, благодаря инфраструктурному подходу, LMSYS добилась нулевой дивергенции. Это стало возможным благодаря использованию Flash Attention 3, библиотеки DeepGEMM и ядер от Thinking Machines Lab, работающих в связке с torch.compile. Вторая особенность - в использовании спекулятивного декодирования. Обычно в RL черновая модель замораживается, что мешает ей следовать политике целевой модели. LMSYS добавили онлайн-обучение черновой модели. Результаты на тестах положительные: ускорение генерации более чем на 25%, особенно на поздних стадиях обучения. 🟡Стабильность. Для энтерпрайза память - это деньги. В Miles включили механизмы, предотвращающие падение системы при некритичных ошибках OOM и исправили чрезмерное потребление памяти в FSDP. В дорожной карте проекта обещают поддержку мультимодального обучения, совместимость со SGLang v2 и расширенное спекулятивное декодирование. 🟡Статья 🖥Github @ai_machinelearning_big_data #AI#ML#RL#Miles#LMSYS

SAMSON-BUKET.RU

@samsonbuket · Post #1354 · 24.11.2022 г., 16:33

Яркая Пятница с «Аэрофлот Бонус» Только 4 дня! Получайте в три раза больше миль «Аэрофлот Бонус» за покупки в салоне и интернет-магазине «Самсон Букет». Подарите себе и близким яркие эмоции в Яркую Пятницу с тройной выгодой! Условия акции: - 3 мили за каждые потраченные 30 ₽; - период акции: 24.11.2022 – 27.11.2022. #АэрофлотБонус#мили#AeroflotBonus#miles