TGTGInsighttelegram intelligenceLIVE / telegram public index
← КриптоАтака 👀

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @cryptoattack · Post #20708 · 23 дек.

😨Главное за сегодня: 🇺🇸США (крипто-#ETF): - Трамп назначил Бо Хайнса главой "Криптосовета", а CEO a16z назначен старшим советником по вопросам #AI - Налоговая США (IRS) утверждает, что стейкинг криптовалют облагается налогом - Phoenix Group планирует листинг на Nasdaq в 2025 году 🇰🇵#HYPE В HyperLiquid наблюдается рекордный отток на фоне опасений пользователей, что северокорейские хакеры могут искать уязвимости (несколько кошельков северокорейских хакеров имеют потери >700 000$ от торговли на бирже). #HYPE Hyperliquid Labs опровергают, что их взломали 🇰🇷 Новый комитет Южной Кореи разрабатывает санкции против манипуляторов крипторынка 🇸🇻#BTC Правительство Сальвадора продолжает накопление#BTC 🇯🇵 Gate Group приобрели Coin Master и официально вышли на японский рынок 🔥 MicroStrategy приобрели ещё 5,262 #BTC 🥳#BNB Binance Alpha выпустили новую партию проектов 🥳#TONПавел Дуров: Общая выручка Telegram в 2024 году превысила 1 млрд $, и мы завершаем год с более чем 500 млн $ денежных резервов, не считая криптоактивов 🙋‍♂ Nokia подали патент на «устройство, метод и компьютерную программу», которые могут шифровать цифровые активы 🥳#CRO Crypto .com запускает регулируемую службу хранения цифровых активов для клиентов из США и Канады 🙋‍♂ Moonpay ведет переговоры о приобретении Helio за ~150 млн $ 🚫 Регулятор Малайзии запретили Atomic Wallet работать в стране 🔮#CGX#RON Community Gaming запустит свой рынок прогнозов Forkast, ориентированный на игры, в сети #RONIN ✅ Paraswap DAO одобрила внедрение нового токена для замены #PSP 🙋‍♂#LDO#ETH Lido запустили Ethereum SDK 🆕Листинги: - Binance добавляет фьючерсы на #HIVE - Binance Launchpool добавляет#BIO 🕵️‍♂️Активность китов и SmartMoney: - С адреса команды Pendle перевели 625 000 #PENDLE на Binance - транзакции китов 📊Графики и отчёты: - #FUD Новые трейдеры, которые присоединились к рынку за последние 2-3 месяца, активно распродают#BTC и #ETH - WhaleMap: Уровень 98 133$ остаётся важным, учитывая китовые накопления #BTC - за последние 2 года наблюдался значительный рост числа держателей криптовалют 📈 - #UNI Общий объем #USDC на Uniswap превысил 1 трлн $ 📈 - DropsTab: новые токены в стадии накопления, поддерживаемые топовыми венчурными инвесторами - ТОП#AI-агентов по росту цен за последние 7 дней - отчёт CoinShares по фин потокам - отчет BNB Chain за 2024 год #BNB 💰Сборы средств: - Avalon Labs - 10 млн $ - #USUALUsual - 10 млн $ от Binance и Kraken ✏️События на завтра: 🔓 Разлоки: Ribbon Finance (#RBN) - 1,06% ($4,18m) 🎁#AGI Delysium запустят программу вознаграждений 🇺🇸 Durable Goods Orders (MoM) (Nov) - 16:30 мск - Redbook (YoY) - 16:55 мск - New Home Sales (Nov) - 18:00 мск

Резултати

Пронајдени 2 слични објави

Пребарај: #zyphra

当前筛选 #zyphra清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #9082 · 26.11.2025 г., 11:35

🌟ZAYA1: первая MoE-модель, полностью обученная на стеке AMD. Есть устойчивое мнение, что серьезное обучение нейросетей возможно только на чипах одной известной компании. В Zyphra решили доказать обратное, и, в сотрудничестве с AMD и IBM провели эксперимент, который на практике доказал, что есть альтернатива. Стартап опубликовал техотчет и результат - модель ZAYA1. Это первая модель архитектуры MoE, обученная полностью на платформе AMD. Сеттинг проекта был действительно "красным": графические процессоры AMD Instinct, сетевые интерфейсы AMD Pensando и программный стек ROCm. ZAYA1 получилась довольно интересной. У неё 8.3 млрд. общих параметров, из которых активных всего 800 миллионов. Несмотря на компактность, в тестах она выглядит бодро. В ризонинге, математике и программирование ZAYA1 обошла Llama-3-8B и OLMoE. А по общим показателям встала в один ряд с Qwen3-4B и гугловской Gemma3-12B. Обучение проходило на кластере IBM Cloud, где модель переварила 14 трлн. токенов. Но дело не только в железе, в папйплайне использовали архитектурные инновации: 🟢Новый механизм внимания - Compressed Convolutional Attention. Он использует свертки внутри блока внимания, это снизило нагрузку на вычисления и память. 🟢Переделали маршрутизатор MoE. Вместо стандартного линейного роутера, ZAYA1 использует сложную последовательность операций, что заставляет "экспертов" внутри нейросети специализироваться гораздо лучше. 🟢Residual Scaling. Добавили обучаемые скалярные гейты в остаточный стрим на выходы каждого блока, чтобы модель контролировала степень забывания. ⚠️ Для запуска инференса потребуется ветка zaya форка transformers из репозитория Zyphra. 📌Лицензирование: Apache 2.0 License. 🟡Статья 🟡Модель 🟡Arxiv @ai_machinelearning_big_data #AI#ML#LLM#MoE#Zyphra

Machinelearning

@ai_machinelearning_big_data · Post #9490 · 09.02.2026 г., 06:10

📌OVQA: прощай, KV-cache offloading. В Zyphra придумали как усидеть на двух стульях сразу, когда хочется резиновый контекст, но под рукой нет тонны памяти. То. что они предложили, называется Online Vector-Quantized Attention - это модификация векторного квантования, которая учит словарь думать на лету. В классическом VQ ключи заменяются ближайшими центроидами из статичного словаря. Это бустит вычисления, но создает проблему: словарь обучен на одних данных, а во время генерации модель видит совсем другое распределение ключей. Ошибка квантования растет, внимание теряет точность и как итог: VQ начинает плавать. Так вот, модификация в том, чтобы отказаться от статического словаря в пользу адаптивного к текущей последовательности: каждый новый токен обновляет только один центроид - тот, к которому ближе всего. Это разреженное обновление работает как защита от катастрофического забывания: старая информация не вымывается новой волной токенов, а аккуратно перезаписывается по мере необходимости. Плюс есть хард-лимит на размер состояния, после достижения которого объем памяти перестает расти, а вычисления становятся строго линейными. 🟡Результаты тестовых экспериментов 🟢Модель, обученная на 4К токенах, уверенно справлялась с контекстом до 64К без деградации качества; 🟢На внутриконтекстном поиске OVQ почти не отставала от полноценного самовнимания, потребляя при этом в 4 раза меньше памяти; 🟢На In-Context Learning VQ провалился, а OVQ вышла на уровень классического внимания, используя всего ~4К центроидов; 🟢Сравнения с линейными альтернативами (Mamba2 и дельта-сети) тоже в пользу OVQ: она стабильнее держит долгий контекст без просадок точности; 🟠В задачах Positional ICR OVQA работает чуть хуже, чем классическое внимание но все равно достойно. Очень хочется надеяться, что OVQ - это предтеча настоящего непрерывного обучения, где в светлом будущем вместо бесконечно пухнущего KV-кэша появится компактная, но живая память, способная удерживать важные детали без потерь. 🟡Статья 🟡Arxiv @ai_machinelearning_big_data #AI#ML#LLM#OVQA#Zyphra