Намери подобно съдържание

Изходен канал @clockstackwheels · Post #198 · 1.02

Ровно месяц пишу посты в ВК и в Телеграм каждый день. Заметил, что: — в ВК очень много активности людей, сильно больше, чем в Телеграме: комментарии, лайки, репосты, прямо активизировалось; — но в Телеграме хоть и скудно, однако подписчики приходят, а в ВК с этим всё очень плохо. Вывод пока такой: ВК, судя по охватам, периодически крутит меня на широкую аудиторию, но этой аудитории пофигу. Ей либо не интересно, либо уже никто не воспринимает подписку ВК как существующее действие. Просто не знают люди, что это значит — подписаться на чью-то личную страницу ВК. Однако та аудитория, которая уже меня читает, с удовольствием вступает в диалоги, лайкает, репостит, и вообще явно скучает по какой-то такой сетевой активности. Это приятно, встречается прям очень много классных обсуждений, и даже на скользкие темы люди говорят в основном без перехода границ вежливости. В Телеграме же народ в среднем пассивнее, но зато подписка воспринимается нормально. Возможно как раз эта самая читающая аудитория из ВК потихоньку перетекает в Телеграм, но пока ещё не привыкла активно комментировать там. Хотя, надо признать, что механизм комментариев к каналам в Телеграме сделана очень плохо и неудобно, это тоже может останавливать. Ещё за этот месяц я поучаствовал в одном обсуждении у знакомой в ВК, и там прям параллельная вселенная — люди примерно моего возраста на полном серьёзе утверждали, что активность среди пишущих друзей у них ВК не упала за последние годы, а что такое этот наш Телеграм они знать не хотят. Впрочем, там же были фразы типа «Каналы это неудобно, потому что в них нет обсуждений», то есть да, народ из прошлого. Но сам факт, что есть ещё где-то подобные пузыри, удивил. Эксперимент продолжаем. #web

Hashtags

#web

Резултати

Намерени 2 подобни публикации

Търсене: #kvcache

当前筛选 #kvcache清除筛选

Machinelearning

@ai_machinelearning_big_data · Post #8027 · 11.07.2025 г., 12:05

Намери подобни Прегледай

🌟LMCache: умное кэширования для LLM-инференса. LMCache - проект, который предлагает решение по сохранению KV-кэша на CPU, диске или даже в специализированной памяти NIXL. По сути, это инструмент, который превращает одноразовые вычисления в многократно используемые блоки, экономя время и ресурсы. Представьте, что в чат-боте пользователи часто ссылаются на один и тот же системный промпт или историю диалога. Обычно модель заново обрабатывает эти данные, но LMCache просто загружает готовый кэш. Выгрузка KV-кэшей освобождает GPU для новых задач, уменьшая TTFT (время до первого токена) вплоть до 10 раз. 🟡LMCache гибкий. Кэши можно не только выгружать, но и делиться между разными инстансами LLM. Проще говоря, если два пользователя одновременно обращаются к разным копиям модели с одинаковым запросом, система не будет дублировать работу: результаты одного prefill’а станут доступны всем. Это работает даже для неполных префиксов, например, при частичном совпадении входных данных. 🟡LMCache умеет в раздельную предобработку. Prefill и decode, которые обычно выполняются на одном GPU, теперь могут быть разнесены: первый этап обрабатывается на мощных узлах, а второй на оптимизированных для генерации. Для распределенных систем такая техника повысит пропускную способность. Тесты разработчиков проекта показывают, что в реальных задачах задержка снижается в 3–10 раз, а GPU-циклы экономятся на повторных вычислениях. Проект тесно интегрируется с vLLM, в репозитории есть большой набор с примерами, документация и советы по установке и настройке. ⚠️Калькулятор KV-кеша с выбором модели, ее типа данных и количества токенов, который поможет прикинуть, сколько VRAM можно сэкономить. 📌Лицензирование: Apache 2.0 License. 🖥Github @ai_machinelearning_big_data #AI#ML#LLM#LMCache#KVCache#Github

Hashtags

#ai #ml #llm #lmcache #kvcache #github

Machinelearning

@ai_machinelearning_big_data · Post #8010 · 10.07.2025 г., 11:37

Намери подобни Прегледай

⚡️ Китайские исследователи из Shanghai Jiao Tong и Zhejiang University представили MemOS — первую в мире "операционную систему памяти" для ИИ. Обычные LLM быстро забывают информацию, а дообучать их — долго и дорого. В новой работе предлагают радикально другой подход: MemOS превращает память в часть операционной системы. 🟢Память как файлы: Модель может *записывать, перемещать и удалять* знания, как будто работает с файлами, и делать это прямо во время работы, а не только на этапе обучения. 🟢MemCube — контейнер знаний: Каждое знание упаковывается в кубик с метками времени и авторства. Планировщик сам решает, где хранить этот "куб" — в тексте, GPU‑кэше или в виде маленького патча весов. 🟢Умная экономия: MemOS работает с 1500 токенами памяти, но достигает такой же точности, как если бы модель загружала весь контекст. При этом скорость — как у облегчённых моделей. 🟢Мгновенная подгрузка: На тестах с Qwen2.5‑72B переключение нужных "кубов" в кэш снижает задержку первого токена на 91.4%, *без изменения ответа*. 🟢Результаты: MemOS набрал 73.31 балла по LLM‑Judge на LOCOMO-бенчмарке — почти на 9 баллов больше ближайшего конкурента. Особенно хорошо работает на сложных задачах с несколькими шагами и временными зависимостями. 💡 Итог: память как ОС — это не просто удобно, это ускоряет модель, повышает точность и даёт контроль над знаниями. Установка: pip install MemoryOS 🟠GitHub 🟠Проект @ai_machinelearning_big_data #MemoryOS#agentmemory#rag#kvcache

Hashtags

#memoryos #agentmemory #rag #kvcache