Find similar content

Source channel @olddriverGDstudy · Post #14 · Mar 17

由于前段时间群里发生了买资源之间的掐架事件，记录一些话。无忌说：无论有些伙计是卖资源还是什么，车队也管不着反正车队的资源是免费获取的不过，就算是卖资源不要护逼，不要为了那所谓的标签故意推不靠谱的资源，还不允许别人反映，就算卖资源，也要卖靠谱的资源，不靠谱的资源给别人卖了别人会寒心，赚那几十块钱倒了牌子有意思吗？做人做事都要凭良心，不要纠缠什么利益，单纯的做一个修车人，不快乐吗？彩虹（少妇小专家）说：修车就是修车你以为你是柳永？你以为你是李白？公益大队我们要的是什么我们要的是性爱的欢愉？我们要的灵魂的交流？我们要的是水乳交融的感受？我们要的是洒脱感？都错了我们要的是整片森林我们要的是广阔天地我们要的是雄鹰展翅在这片土地上空我们用几辆碎银要的是什么女人御姐嫩妹淑女熟女环肥燕瘦各有各的滋味各有各的感觉各有各的微笑各有各的呻吟各有各的美好各有各的回忆要的是什么问问你自己爱情肉体灵魂是统一的吗是矛盾的吗是对立而统一的吗是螺旋前进的吗曾经志在四方的我们甘心被推广被卖资源被鸡头被黑车左右自己的情感吗影响自己的勇气吗不大队要的是杀伐的乐趣要的是勇做先锋的勇气要的是山无棱才敢与君绝的决心要的是踏破铁鞋无觅处，得来全不费功夫的洒脱要的是待从头，收拾旧山河的豪迈要的是怒发冲冠，凭栏处，潇潇雨歇的悲壮要的是手接飞猱搏雕虎，侧足焦原未言苦的勇气悲痛啊可悲啊大队狂客落魄尚如此啊愿我们风云感会起屠钓吧要继承先人的意志啊要有原则啊幼女未成年龙女都不能去搞加油吧，各位（彩虹（少妇小专家）是无锡车队的管理，无忌的朋友，纯粹的出击者）作者：无忌标签：#原创，#杂谈

Hashtags

#原创 #杂谈

Results

2 similar posts found

Search: #kvcache

当前筛选 #kvcache清除筛选

Machinelearning

@ai_machinelearning_big_data · Post #8027 · 07/11/2025, 12:05 PM

Find similar View

🌟LMCache: умное кэширования для LLM-инференса. LMCache - проект, который предлагает решение по сохранению KV-кэша на CPU, диске или даже в специализированной памяти NIXL. По сути, это инструмент, который превращает одноразовые вычисления в многократно используемые блоки, экономя время и ресурсы. Представьте, что в чат-боте пользователи часто ссылаются на один и тот же системный промпт или историю диалога. Обычно модель заново обрабатывает эти данные, но LMCache просто загружает готовый кэш. Выгрузка KV-кэшей освобождает GPU для новых задач, уменьшая TTFT (время до первого токена) вплоть до 10 раз. 🟡LMCache гибкий. Кэши можно не только выгружать, но и делиться между разными инстансами LLM. Проще говоря, если два пользователя одновременно обращаются к разным копиям модели с одинаковым запросом, система не будет дублировать работу: результаты одного prefill’а станут доступны всем. Это работает даже для неполных префиксов, например, при частичном совпадении входных данных. 🟡LMCache умеет в раздельную предобработку. Prefill и decode, которые обычно выполняются на одном GPU, теперь могут быть разнесены: первый этап обрабатывается на мощных узлах, а второй на оптимизированных для генерации. Для распределенных систем такая техника повысит пропускную способность. Тесты разработчиков проекта показывают, что в реальных задачах задержка снижается в 3–10 раз, а GPU-циклы экономятся на повторных вычислениях. Проект тесно интегрируется с vLLM, в репозитории есть большой набор с примерами, документация и советы по установке и настройке. ⚠️Калькулятор KV-кеша с выбором модели, ее типа данных и количества токенов, который поможет прикинуть, сколько VRAM можно сэкономить. 📌Лицензирование: Apache 2.0 License. 🖥Github @ai_machinelearning_big_data #AI#ML#LLM#LMCache#KVCache#Github

Hashtags

#ai #ml #llm #lmcache #kvcache #github

Machinelearning

@ai_machinelearning_big_data · Post #8010 · 07/10/2025, 11:37 AM

Find similar View

⚡️ Китайские исследователи из Shanghai Jiao Tong и Zhejiang University представили MemOS — первую в мире "операционную систему памяти" для ИИ. Обычные LLM быстро забывают информацию, а дообучать их — долго и дорого. В новой работе предлагают радикально другой подход: MemOS превращает память в часть операционной системы. 🟢Память как файлы: Модель может *записывать, перемещать и удалять* знания, как будто работает с файлами, и делать это прямо во время работы, а не только на этапе обучения. 🟢MemCube — контейнер знаний: Каждое знание упаковывается в кубик с метками времени и авторства. Планировщик сам решает, где хранить этот "куб" — в тексте, GPU‑кэше или в виде маленького патча весов. 🟢Умная экономия: MemOS работает с 1500 токенами памяти, но достигает такой же точности, как если бы модель загружала весь контекст. При этом скорость — как у облегчённых моделей. 🟢Мгновенная подгрузка: На тестах с Qwen2.5‑72B переключение нужных "кубов" в кэш снижает задержку первого токена на 91.4%, *без изменения ответа*. 🟢Результаты: MemOS набрал 73.31 балла по LLM‑Judge на LOCOMO-бенчмарке — почти на 9 баллов больше ближайшего конкурента. Особенно хорошо работает на сложных задачах с несколькими шагами и временными зависимостями. 💡 Итог: память как ОС — это не просто удобно, это ускоряет модель, повышает точность и даёт контроль над знаниями. Установка: pip install MemoryOS 🟠GitHub 🟠Проект @ai_machinelearning_big_data #MemoryOS#agentmemory#rag#kvcache

Hashtags

#memoryos #agentmemory #rag #kvcache