TGTGInsighttelegram intelligenceLIVE / telegram public index
← КриптоАтака 👀

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @cryptoattack · Post #20708 · 23 дек.

😨Главное за сегодня: 🇺🇸США (крипто-#ETF): - Трамп назначил Бо Хайнса главой "Криптосовета", а CEO a16z назначен старшим советником по вопросам #AI - Налоговая США (IRS) утверждает, что стейкинг криптовалют облагается налогом - Phoenix Group планирует листинг на Nasdaq в 2025 году 🇰🇵#HYPE В HyperLiquid наблюдается рекордный отток на фоне опасений пользователей, что северокорейские хакеры могут искать уязвимости (несколько кошельков северокорейских хакеров имеют потери >700 000$ от торговли на бирже). #HYPE Hyperliquid Labs опровергают, что их взломали 🇰🇷 Новый комитет Южной Кореи разрабатывает санкции против манипуляторов крипторынка 🇸🇻#BTC Правительство Сальвадора продолжает накопление#BTC 🇯🇵 Gate Group приобрели Coin Master и официально вышли на японский рынок 🔥 MicroStrategy приобрели ещё 5,262 #BTC 🥳#BNB Binance Alpha выпустили новую партию проектов 🥳#TONПавел Дуров: Общая выручка Telegram в 2024 году превысила 1 млрд $, и мы завершаем год с более чем 500 млн $ денежных резервов, не считая криптоактивов 🙋‍♂ Nokia подали патент на «устройство, метод и компьютерную программу», которые могут шифровать цифровые активы 🥳#CRO Crypto .com запускает регулируемую службу хранения цифровых активов для клиентов из США и Канады 🙋‍♂ Moonpay ведет переговоры о приобретении Helio за ~150 млн $ 🚫 Регулятор Малайзии запретили Atomic Wallet работать в стране 🔮#CGX#RON Community Gaming запустит свой рынок прогнозов Forkast, ориентированный на игры, в сети #RONIN ✅ Paraswap DAO одобрила внедрение нового токена для замены #PSP 🙋‍♂#LDO#ETH Lido запустили Ethereum SDK 🆕Листинги: - Binance добавляет фьючерсы на #HIVE - Binance Launchpool добавляет#BIO 🕵️‍♂️Активность китов и SmartMoney: - С адреса команды Pendle перевели 625 000 #PENDLE на Binance - транзакции китов 📊Графики и отчёты: - #FUD Новые трейдеры, которые присоединились к рынку за последние 2-3 месяца, активно распродают#BTC и #ETH - WhaleMap: Уровень 98 133$ остаётся важным, учитывая китовые накопления #BTC - за последние 2 года наблюдался значительный рост числа держателей криптовалют 📈 - #UNI Общий объем #USDC на Uniswap превысил 1 трлн $ 📈 - DropsTab: новые токены в стадии накопления, поддерживаемые топовыми венчурными инвесторами - ТОП#AI-агентов по росту цен за последние 7 дней - отчёт CoinShares по фин потокам - отчет BNB Chain за 2024 год #BNB 💰Сборы средств: - Avalon Labs - 10 млн $ - #USUALUsual - 10 млн $ от Binance и Kraken ✏️События на завтра: 🔓 Разлоки: Ribbon Finance (#RBN) - 1,06% ($4,18m) 🎁#AGI Delysium запустят программу вознаграждений 🇺🇸 Durable Goods Orders (MoM) (Nov) - 16:30 мск - Redbook (YoY) - 16:55 мск - New Home Sales (Nov) - 18:00 мск

Резултати

Пронајдени 1 слични објави

Пребарај: #rys

当前筛选 #rys清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #9783 · 31.03.2026 г., 12:03

📌Нейроанатомия LLM: улучшаем модель без дообучения. Дэвид Ноэль, независимый исследователь из Мюнхена, в середине 2024 года занял 1 место на HuggingFace Open LLM Leaderboard методом, который не требует ни новых данных, ни файнтюна. Он взял 80-слойную Qwen2-72B, продублировал блок из 7 средних слоёв (45–51) и получил модель RYS-XLarge, где каждый добавленный параметр - копия уже существующего. На 5 из 6 бенчмарков лидерборда результаты выросли: MuSR прибавил 17,7%, MATH - 8,2%. Позже ByteDance предложила Looped Language Models (ноябрь 2025), но Дэвид пришёл к своим выводам независимо на основе 2 наблюдений: LLM способны вести связный диалог в Base64 - модель декодирует вход, рассуждает и перекодирует ответ обратно. Если это работает, то получается, что ранние слои транслируют входные данные в абстрактное внутреннее представление, поздние переводят его обратно в текст, а средние занимаются рассуждением в формате, не привязанном к конкретному языку. Модель Goliath-120B, где слои двух разных 70B-моделей были перемешаны так, что выход поздних слоёв подавался на вход ранних. По всем канонам обучения это не должно было работать, но работало. Внутренние представления трансформеров оказались куда однороднее, чем предполагалось. Для поиска оптимальной конфигурации Дэвид построил «сканер мозга» трансформера: берется блок слоёв (с 20-го по 35-й), затем он вставляется повторно и на инференсе замеряется, стала модель лучше или хуже. Так перебираются все возможные начала и концы блока (3241 конфигурация). Каждую конфигурацию Дэвид прогонял через 2 быстрых теста: арифметику без CoT и EQ-Bench. Тепловые карты сканера показали, что средние слои можно дублировать с пользой, а вот крайние - нельзя. При этом повтор только одного слоя почти всегда ухудшает результат. Cредние слои работают как цельные функциональные контуры, и вырванный из цепочки шаг бесполезен. Буквально на днях Дэвид опубликовал продолжение, но уже с Qwen3.5-27B. Эксперимент с косинусным сходством скрытых состояний для текстовых запросов на 8 языках впервые показал трёхфазную архитектуру напрямую: к 10 слою фразы с одинаковым смыслом на разных языках оказывались ближе друг к другу, чем на одном языке с разным смыслом. Модель думает не на каком-то из человеческих языков, а в собственном внутреннем представлении. В Qwen3.5-27B архитектура модели иная. После 2 млн. конфигураций через суррогатную модель оптимальным решением на Pareto-фронте стало простейшее - продублировать один слой из середины стека. 1,5% дополнительных вычислений и... модель становится заметно сильнее. Метод ортогонален файнтюнингу и квантованию: модель получает дополнительное время на размышление, используя контуры, которые у нее уже есть. 🟡Статья ч.1ч.2 🟡Набор RYS-моделей 🖥Github @ai_machinelearning_big_data #AI#ML#LLM#RYS