TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #323 · 9 авг.

Приветствую подписчиков. Я даже несколько удивлён как это вы еще не разбежались 😻)) Многие мне пишут в личку с вопросом "Где брать курсы если сайт закрылся?". Отвечаю — сайт не закрылся❗️ Ввиду некоторой обстановки 💣⚔️🚓💥 мой хостинг (Украинский кстати) немножко "закончился". Мой хороший знакомый, админ данного хостинга, включил мой сервер на пару часов и я скачал все данные. После чего создал новый сервер в Европе и поднял там сайт. На данный момент я закончил настройку и теперь сайт снова доступен. А так же добавил домен COM, для тех у кого RU блокируют. Теперь сайт доступен по адресам: https://cgninjas.ru/ https://cgninjas.com/ (возможно на com почта не будет работать) Также просят выложить всё на Youtube или на Torrent. Да я не против, только исходники у меня пропали вместе с HDD, так что надо потратить немало времени чтобы скачать, систематизировать и залить. Если вдруг выкрою недельку на это, то обязательно сделаю))) ▫️Погодите, а что с каналом? он тоже всё? Нет, ввиду всё тех же событий 💥 потух творческий запал, и мотивация пропала... Но идеи есть, заготовки тем тоже. Возможно, я жду хороших новостей. Обязательно продолжу серию заметок... надеюсь скоро. А до тех пор я не хочу вас раздражать глупой рекламой глупых каналов (которые запрудили телеграм и предложения которой приходят регулярно) а лучше просто помолчу. "Благодарим за понимание ©" ЗЫ. Не пишите пжлст в личку, есть чат для этого ➡️CGNinjasChat #offtop

Hashtags

Резултати

Пронајдени 1 слични објави

Пребарај: #ssm

当前筛选 #ssm清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #8750 · 13.10.2025 г., 15:05

⚡️Mamba-3 тихо и без объявления вышла на ICLR - и это может стать началом конца эпохи Transformers. Новая архитектура Mamba-3 делает модели быстрее, стабильнее и эффективнее при работе с длинными контекстами. Главная идея - не в слоях внимания, а в state-space моделях, где модель хранит и обновляет внутреннее состояние во времени. 📘Краткие эускурс: - Mamba-1 ввела непрерывную динамику и выборочное обновление памяти - помнила эффективно без высокой цены attention. - Mamba-2 показала, что обновления состояния и attention - это две стороны одной математики, что ускорило вычисления на GPU. - Mamba-3 довела концепцию до зрелости: теперь внутренняя память развивается плавнее и устойчивее за счёт перехода от простого шага Эйлера к трапецеидальному интегрированию. Вместо простого шага Эйлера, как в Mamba-2, Mamba-3 аппроксимирует интеграл обновления состояния не только по правому концу интервала, но усреднением между началом и концом, с коэффициентом λ, зависящим от данных. Это даёт более точное приближение (второго порядка) и делает динамику состояния более выразительной. 🧠Что изменилось под капотом: - Память стала «ритмичной»: теперь модель может хранить повторяющиеся и периодические паттерны (например, структуры языка или музыки). - Новый multi-input-multi-output дизайн позволяет обрабатывать несколько потоков параллельно — идеально для современных GPU. ⚙️Что это даёт на практике: - Эффективная работа с длинными последовательностями: документы, геномы, временные ряды. - Линейное время выполнения и стабильная задержка делают её идеальной для реального времени: чат-ботов, перевода, речи. - Энергоэффективность и масштабируемость открывают путь к on-device AI, где большие модели работают локально, без облака. Mamba-3 - это не просто ускоренная альтернатива Transformers. Это новая архитектура, которая объединяет глубокое понимание контекста, скорость и устойчивость, от серверных систем до умных устройств. 🟢Подробности: https://openreview.net/pdf?id=HwCvaJOiCj @ai_machinelearning_big_data #ssm#mamba3#llm,#architecture#ai