TGTGInsighttelegram intelligenceLIVE / telegram public index
← КриптоАтака 👀

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @cryptoattack · Post #20607 · 2 окт.

😨Главное за сегодня: 🇺🇸США (крипто-#ETF): - Заявка Bitwise на запуск #XRP-#ETFпопала на сайт SEC - притоки/оттоки #BTC/#ETH #ETF 🍿#FTT FTX выставили на аукцион 22,3 млн заблокированных #WLD (~38 млн $) со скидкой от 40% до 75% 💰#WLD#AI OpenAI закрыли раунд финансирования на сумму 6,5 млрд $ при оценке >150 млрд $ 🇷🇺#BTCCEO BitRiver: Российские майнеры могут выйти в лидеры, оставив США позади, на горизонте 2-3 лет 🆕 Upbit листит#W (Wormhole) 🚀 💰 Трейдер превратил 368$ в 2 млн $ на #HIPPO (sudeng) всего за 3 дня 🚀 🥳#APT Franklin Templeton добавили блокчейн Aptos для поддержки токенизированного фонда денежного рынка 😨#TONПавел Дуров уточняет: Telegram может раскрывать властям IP-адреса и номера телефонов преступников с 2018 года 🔮 Апелляционный суд постановил, что рынок прогнозов Kalshi может продолжать работу и заключать контракты, разрешающие делать ставки на выборы 🙅‍♂ Kraken прекращает поддержку Monero (#XMR) в Европейской экономической зоне 🗣#BTCQCP Capital: Влияние ситуации на Ближнем Востоке носит краткосрочный характер, готовность рынка покупать рискованные активы остается сильной 📈#SUI#SCA Общая сумма кредитования Scallop превысила 100 млрд $ 🥊 COPA и Unified Patents начали кампанию против криптовалютных «патентных троллей» 🙋‍♂#EIGEN#ZRO LayerZero и Eigen Labs представили децентрализованную верификационную сеть CryptoEconomic (DVN) Framework 🤝Партнёрства: - #LINK Taurus и Chainlink сотрудничают для стимулирования внедрения токенизированных активов #RWA - #AVA Ava Protocol интегривались с Soneium от Sony 🕵️‍♂️Активность китов и SmartMoney: - Джастин Сан, вероятно, продал все свои #EIGEN - участник ICO Ethereum перевёл 6000 #ETH (~14,71 млн $) на Kraken - кит, который получил >32 млн $ прибыли от #ETH с сентября 2023 года, перевёл на Binance 1500 ETH - Animoca Brands внесли на Binance 8 млн #PIXEL - Ceffu вывели 3 372 #BTC (211,33 млн $) с Binance за последние 2 дня 📊Графики и отчёты: - #DOGEдостиг 7-месячного максимума по активности адресов и 4-месячного максимума по транзакциям китов 🐶 - наблюдается всплеск перемещения #BTC на OTC площадки, на которых в настоящее время находится ~410 000 BTC - недельный объем торгов DEX на #SOLпревзошел#ETH впервые за 43 дня - #ARBUniswap: Arbitrum - первый L2, объем свопов которого превысил 200 млрд $ 📈 - ТОП токенов по рыночной капитализации, выпущенных в Q3 2024 года - ТОП проектов по размытой рыночной капитализации (FDV), запущенных в Q3 - ТОП блокчейнов по росту TVL в третьем квартале 2024 года - ТОП лаунчпадов по объему привлеченных средств в Q3 2024 года - отчёт Glassnode ✏️События на завтра: 🔓Разлок: Decentralized Games (#DG) - 2,38% of M.Cap ($113,5m) 🆕#ASI#FET Coinbase International добавит поддержку фьючерсов на Artificial Superintelligence Alliance (ASI) 🍿#AXL Анонс от Axelar 🇪🇺 Services/Composite PMI (сент) - 11:00 МСК - проминфляция PPI (авг) - 12:00 МСК - минутки с прошлого заседания ЕЦБ - 14:30 МСК 🇺🇸 Initial Jobless Claims - 15:30 МСК - S&P Services/Composite PMI (сент) - 16:45 МСК - ISM Services PMI (сент) - 17:00 МСК - Factory Orders (авг) - 17:00 МСК

Резултати

Пронајдени 2 слични објави

Пребарај: #kvcache

当前筛选 #kvcache清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #8027 · 11.07.2025 г., 12:05

🌟LMCache: умное кэширования для LLM-инференса. LMCache - проект, который предлагает решение по сохранению KV-кэша на CPU, диске или даже в специализированной памяти NIXL. По сути, это инструмент, который превращает одноразовые вычисления в многократно используемые блоки, экономя время и ресурсы. Представьте, что в чат-боте пользователи часто ссылаются на один и тот же системный промпт или историю диалога. Обычно модель заново обрабатывает эти данные, но LMCache просто загружает готовый кэш. Выгрузка KV-кэшей освобождает GPU для новых задач, уменьшая TTFT (время до первого токена) вплоть до 10 раз. 🟡LMCache гибкий. Кэши можно не только выгружать, но и делиться между разными инстансами LLM. Проще говоря, если два пользователя одновременно обращаются к разным копиям модели с одинаковым запросом, система не будет дублировать работу: результаты одного prefill’а станут доступны всем. Это работает даже для неполных префиксов, например, при частичном совпадении входных данных. 🟡LMCache умеет в раздельную предобработку. Prefill и decode, которые обычно выполняются на одном GPU, теперь могут быть разнесены: первый этап обрабатывается на мощных узлах, а второй на оптимизированных для генерации. Для распределенных систем такая техника повысит пропускную способность. Тесты разработчиков проекта показывают, что в реальных задачах задержка снижается в 3–10 раз, а GPU-циклы экономятся на повторных вычислениях. Проект тесно интегрируется с vLLM, в репозитории есть большой набор с примерами, документация и советы по установке и настройке. ⚠️Калькулятор KV-кеша с выбором модели, ее типа данных и количества токенов, который поможет прикинуть, сколько VRAM можно сэкономить. 📌Лицензирование: Apache 2.0 License. 🖥Github @ai_machinelearning_big_data #AI#ML#LLM#LMCache#KVCache#Github

Machinelearning

@ai_machinelearning_big_data · Post #8010 · 10.07.2025 г., 11:37

⚡️ Китайские исследователи из Shanghai Jiao Tong и Zhejiang University представили MemOS — первую в мире "операционную систему памяти" для ИИ. Обычные LLM быстро забывают информацию, а дообучать их — долго и дорого. В новой работе предлагают радикально другой подход: MemOS превращает память в часть операционной системы. 🟢Память как файлы: Модель может *записывать, перемещать и удалять* знания, как будто работает с файлами, и делать это прямо во время работы, а не только на этапе обучения. 🟢MemCube — контейнер знаний: Каждое знание упаковывается в кубик с метками времени и авторства. Планировщик сам решает, где хранить этот "куб" — в тексте, GPU‑кэше или в виде маленького патча весов. 🟢Умная экономия: MemOS работает с 1500 токенами памяти, но достигает такой же точности, как если бы модель загружала весь контекст. При этом скорость — как у облегчённых моделей. 🟢Мгновенная подгрузка: На тестах с Qwen2.5‑72B переключение нужных "кубов" в кэш снижает задержку первого токена на 91.4%, *без изменения ответа*. 🟢Результаты: MemOS набрал 73.31 балла по LLM‑Judge на LOCOMO-бенчмарке — почти на 9 баллов больше ближайшего конкурента. Особенно хорошо работает на сложных задачах с несколькими шагами и временными зависимостями. 💡 Итог: память как ОС — это не просто удобно, это ускоряет модель, повышает точность и даёт контроль над знаниями. Установка: pip install MemoryOS 🟠GitHub 🟠Проект @ai_machinelearning_big_data #MemoryOS#agentmemory#rag#kvcache