Најди сличен содржај

Изворен канал @cryptoattack · Post #20249 · 30 ное.

🎧Главное за сегодня: 🗽Хроники#BTC#ETH#ETF: - Grayscale представила поправки к Трастовому соглашению #GBTC - Hashdex встретились с SEC - SEC подтвердила заявку на спот ETH-ETF 🔥#BTC MicroStrategy приобрела 16 130 BTC 🏦#BNB Binance запустили пилотную программу банковского хранения залога 🇬🇧#HOOD Robinhood снова пробует запуститься в Великобритании 🇮🇳#ALGO Фонд Algorand расширяет свое присутствие в Индии 🇧🇷 Бразилия введет 15% налог на криптодоходы, хранящиеся на оффшорных биржах 🇰🇿 Canaan возобновляет добычу #BTC в Казахстане 🇧🇷#GLMR Moonbeam, DUX и Grupo RÃO запустили программу лояльности Web3 в Бразилии 🇦🇪 Fasset получили лицензию VASP в Дубае 🇺🇸#макроСША: - PCE Price index (окт): - м/м: 0% (пред: +0.4%) - г/г: +3% (пред +3.4%); - Initial Jobless Claims: 218 тыс (пред 209 тыс) 🏴‍☠#KNC Хакер KyberSwap хочет получить полный контроль над протоколом 🆕 UPBIT листит#ID🚀 💰#HOOK Hooked запустит экосистемный фонд на 50 млн $ 🏴‍☠Взломан горячий кошелёк Nobitex 🙋‍♂#ARB RARI запустил L2 RARI Chain на Arbitrum 🥳#SXP Solar Banking и Solar Card готовы к тестированию 🦾 AntPool возместит рекордную комиссию в размере 3 млн $ в #BTC 🙋‍♂ CoinList открыл регистрацию для BitsCrunch 🙅‍♂#WHITE Whiteheart закрывается 🔄#INJ Injective скоро выпустит "крупнейшее обновление" основной сети 🥳#FOREзапустили свою платформу прогнозирования 📱#GAL Мобильное приложение Galxe доступно на Android и TestFlight 🥳#COTIзапустили COTI Foundation 🙋‍♂#YFI#MAIC Yearn v3 запущена на Polygon 👀#STORJанонсировали Storj Select 🥳#DATA Streamr принят в программу запуска Web3 Google Cloud 🤝Партнёрства: - #ACH Alchemy Pay запартнёрились с SEPA🚀 - #ALGO Algorand запартнёрились с ПРООН и URECA🇲🇳 - #UNI Uniswap Labs запартнёрились с Talos - #MNT#GAL Galxe сотрудничает с Mantle - #EURSсотрудничает с Stellar #XLM - #QUICK#MANTA QuickSwap интегрирует Steer Protocol (Manta Pacific) - #NEARзапартнёрились с #PYTH #CPOOL#OKB#OKT Web3 Wallet OKX интегрирован с Clearpool - #SEIзапустили Bug Bounty Program в партнерстве с Immunefi - #LINK SAO запартнёрились с Chainlink 🕵‍♂Активность китов и SmartMoney: - На Coinbase заводят#BTC на сотни млн $ - новый кошелёк накопил 10 796 #BTC - 100 000 #ETHвывели с Coincheck и 30 000 #ETHвывели с BitDao - Cumberland перевели 1,8 млн #OP на CEX - кит выводит свою крипту с Binance - команда #HOOKзаводит токены на Binance - кошельки выводят#ID с бирж для подготовки к депозиту на Upbit - мультиподписной адрес участника #MEMEперевел на новый адрес 1,034 млрд MEME - ARK закупает акции Robinhood #HOOD и продаёт #COIN 📊Графики: - топ-100 кошельков #TUSDпродали 28% своих холдингов - киты активно накапливают#MATIC🐳 - более 75% игр Web3 оказались неудачными🎮 - ТОП проектов по росту TVL в ноябре 💰Сборы средств: - #POKTGrove - 7,9 млн $ - MITH - 3,5 млн $ ✏️События на завтра: 🔓 Разлок: 1inch (#1INCH) - 9,48% of Circ.Supply ($35,52m) - Hedera (#HBAR) - 0,54% of M.Cap ($11,51m) - SKALE (#SKL) - 2,81% of M.Cap ($6,65m) - Vulcan Forged (#PYR) - 0,84% of M.Cap ($1,34m) - Aurory (#AURY) - 1,63% of M.Cap ($1,11m) - Solend (#SLND) - 6% of M.Cap ($1,99m) - StakeWise (#SWISE) - 4,87% of M.Cap ($1,51m) - Immutable (#IMX) - 2,94% of M.Cap ($50,68m) - Hooked (#HOOK) - 27,07% of M.Cap ($15,53m) - Acala (#ACA) - 3,31% of Circ.Supply ($1,62m) - Dydx (#DYDX) - 81.63% of Cir. Supply ($505.5M) 🥳 Arbitrum (#ARB) финальный клейм NFT Arbitrum Odyssey 🥳 Radiant Capital (#RDNT) готовит анонс (или 3 декабря) 🔛 Obol Network - Запуск открытой бета-версии основной сети - UBXS (#UBXS) - Запуск рынка недвижимости Bixos 🔄 BNB Chain (#BNB) - Хард-форк 🧯 Ternoa (#CAPS) - Сжигание токенов - SaitaRealty (#SRLTY) - Сжигание токенов - Platform of meme coins (#PAYU) - Сжигание токенов 🍿#ETH#BTCПятничная экспирация 🔁 Medibloc (#MED) - Миграция токенов 🇩🇪 Manufacturing (PMI) (нояб) - 11:55мск 🇪🇺 Manufacturing (PMI) (нояб) - 12:00мск 🇬🇧 Manufacturing (PMI) (нояб) - 12:30мск 🇺🇸 Manufacturing (PMI) (нояб) - 16:45мск - ISM Manufacturing (PMI) (нояб) - 17:00мск - Выступление главы ФРС Пауэлла - 19:00мск

Резултати

Пронајдени 2 слични објави

Пребарај: #mamba3

当前筛选 #mamba3清除筛选

Machinelearning

@ai_machinelearning_big_data · Post #9701 · 20.03.2026 г., 12:51

Најди слично Погледај

🌟Mamba3 Mamba2 делала ставку на быстрое обучение. Ради этого механизм рекуррентных обновлений упрощали: матрицу переходов состояний свели к скаляру, умноженному на единичную матрицу. Обучение ускорилось, но при декодировании GPU большую часть времени не считает, а гоняет данные между уровнями памяти. Архитектура оказалась с нюансом - вычислительные ядра простаивают. С тех пор ландшафт изменился. RL с верифицируемыми наградами для кода и математики, агентные пайплайны - все это генерирует прорву токенов на инференсе. Команда Mamba3 задалась вопросом: как выглядела бы SSM-архитектура, если сделать ее с приоритетом на инференс, а не на обучение? Так родились 3 главных изменения в ядре Mamba. 🟡Новая схема дискретизации. SSM в базе - это обыкновенное дифференциальное уравнение, которое нужно перевести в дискретную рекуррентную формулу. Mamba1 и Mamba2 использовали комбинацию двух методов (ZOH и Эйлера), подобранную эмпирически. В Mamba3 реализовали экспоненциально-трапецеидальный метод: вместо одной точки для аппроксимации интеграла берутся обе границы интервала с обучаемым коэффициентом смешивания. В результате рекуррентная формула неявно применяет свёртку к входу скрытого состояния, что делает динамику выразительнее без дополнительных компонентов. 🟡Комплекснозначная SSM. Ранние модели семейства S4 работали с комплексными числами, но Mamba1 от них отказалась. Из-за этого модель не справляется даже с простейшими задачами отслеживания состояний (например, определением четности последовательности). Решение нашли во вращении в двумерном пространстве: вместо комплексных вычислений авторы разложили переход на масштабирование и поворот, а затем применили фишку из RoPE - встроили вращения в матрицы через кумулятивную сумму углов. Переписывать ядра для поддержки комплексной арифметики не пришлось. Модель решает задачи на чётность и другие бенчмарки, недоступные предыдущим версиям. 🟡Переход от SISO к MIMO. В стандартной SSM каждый хэд содержит набор независимых систем (один вход - один выход). При декодировании арифметическая интенсивность составляет около 2,5 операций на байт при пороге вычислительной загруженности на H100 в районе 300. Mamba3 расширяет матрицы, превращая внешние произведения в матричные умножения. Арифметическая интенсивность растет пропорционально. При этом размер скрытого состояния не увеличивается, а значит, латентность декодирования почти не меняется. Обучение, конечно, дорожает, но это сознательный компромисс. Еще из архитектуры убрали короткую каузальную свёртку, присутствовавшую с первой Mamba - новая рекуррентная формула и смещения выполняют ту же функцию. Добавили нормализацию BCNorm по аналогии с QKNorm в трансформерах, перешли на чередование SSM- и MLP-слоев. Ядра написаны на Triton (prefill SISO), TileLang (prefill MIMO) и CuTe DSL (decode). 🟡Тесты Mamba-3 SISO при 1,5B параметров показывает лучшую суммарную латентность prefill + decode на всех длинах последовательностей по сравнению с Mamba2, Gated DeltaNet и Llama-3.2-1B под vLLM на одном H100. MIMO-вариант сопоставим по скорости с Mamba2, но заметно точнее. При анализе Парето-фронта Mamba-3 показывает тот же уровень качества при вдвое меньшем состоянии. @ai_machinelearning_big_data #AI#ML#LLM#Mamba3#TogetherAI

Hashtags

#ai #ml #llm #mamba3 #togetherai

Machinelearning

@ai_machinelearning_big_data · Post #8750 · 13.10.2025 г., 15:05

Најди слично Погледај

⚡️Mamba-3 тихо и без объявления вышла на ICLR - и это может стать началом конца эпохи Transformers. Новая архитектура Mamba-3 делает модели быстрее, стабильнее и эффективнее при работе с длинными контекстами. Главная идея - не в слоях внимания, а в state-space моделях, где модель хранит и обновляет внутреннее состояние во времени. 📘Краткие эускурс: - Mamba-1 ввела непрерывную динамику и выборочное обновление памяти - помнила эффективно без высокой цены attention. - Mamba-2 показала, что обновления состояния и attention - это две стороны одной математики, что ускорило вычисления на GPU. - Mamba-3 довела концепцию до зрелости: теперь внутренняя память развивается плавнее и устойчивее за счёт перехода от простого шага Эйлера к трапецеидальному интегрированию. Вместо простого шага Эйлера, как в Mamba-2, Mamba-3 аппроксимирует интеграл обновления состояния не только по правому концу интервала, но усреднением между началом и концом, с коэффициентом λ, зависящим от данных. Это даёт более точное приближение (второго порядка) и делает динамику состояния более выразительной. 🧠Что изменилось под капотом: - Память стала «ритмичной»: теперь модель может хранить повторяющиеся и периодические паттерны (например, структуры языка или музыки). - Новый multi-input-multi-output дизайн позволяет обрабатывать несколько потоков параллельно — идеально для современных GPU. ⚙️Что это даёт на практике: - Эффективная работа с длинными последовательностями: документы, геномы, временные ряды. - Линейное время выполнения и стабильная задержка делают её идеальной для реального времени: чат-ботов, перевода, речи. - Энергоэффективность и масштабируемость открывают путь к on-device AI, где большие модели работают локально, без облака. Mamba-3 - это не просто ускоренная альтернатива Transformers. Это новая архитектура, которая объединяет глубокое понимание контекста, скорость и устойчивость, от серверных систем до умных устройств. 🟢Подробности: https://openreview.net/pdf?id=HwCvaJOiCj @ai_machinelearning_big_data #ssm#mamba3#llm,#architecture#ai

Hashtags

#ssm #mamba3 #llm #architecture #ai