TGTGInsightаналитика telegramLIVE / telegram public index
← Machinelearning

TGINSIGHT SIMILAR POSTS

Найти похожее

Источник @ai_machinelearning_big_data · Post #8010 · 10 июл.

⚡️ Китайские исследователи из Shanghai Jiao Tong и Zhejiang University представили MemOS — первую в мире "операционную систему памяти" для ИИ. Обычные LLM быстро забывают информацию, а дообучать их — долго и дорого. В новой работе предлагают радикально другой подход: MemOS превращает память в часть операционной системы. 🟢Память как файлы: Модель может *записывать, перемещать и удалять* знания, как будто работает с файлами, и делать это прямо во время работы, а не только на этапе обучения. 🟢MemCube — контейнер знаний: Каждое знание упаковывается в кубик с метками времени и авторства. Планировщик сам решает, где хранить этот "куб" — в тексте, GPU‑кэше или в виде маленького патча весов. 🟢Умная экономия: MemOS работает с 1500 токенами памяти, но достигает такой же точности, как если бы модель загружала весь контекст. При этом скорость — как у облегчённых моделей. 🟢Мгновенная подгрузка: На тестах с Qwen2.5‑72B переключение нужных "кубов" в кэш снижает задержку первого токена на 91.4%, *без изменения ответа*. 🟢Результаты: MemOS набрал 73.31 балла по LLM‑Judge на LOCOMO-бенчмарке — почти на 9 баллов больше ближайшего конкурента. Особенно хорошо работает на сложных задачах с несколькими шагами и временными зависимостями. 💡 Итог: память как ОС — это не просто удобно, это ускоряет модель, повышает точность и даёт контроль над знаниями. Установка: pip install MemoryOS 🟠GitHub 🟠Проект @ai_machinelearning_big_data #MemoryOS#agentmemory#rag#kvcache

Результаты

Найдено 3 похожих постов

🚀 20 августа 2025 Стартует RRNCB – Russian RAG Normative – Corporate Benchmark, первый российский открытый бенчмарк для оценки RAG-решений при работе с нормативной, правовой и технической документацией компаний. Почему это важно? ✅ На рынке десятки RAG-решений, но нет методики и инструмента оценки и сопоставления характеристик RAG сервисов, оценить их качество очень трудно. ✅RRNCB – это первый продуктовый бенчмарк, цель которого провести комплексную оценку Retrieval augmented generation продуктов для работы с корпоративной и технической документацией. ✅ Специально создан для оценки систем, работающих с русскоязычными нормативами, кодексами, ГОСТами и корпоративными документами. ✅ Открытость и прозрачность: методики оценки и данные будут в открытом доступе. Сравнение проходит по ключевым метрикам (ROUGE, LLM-судья, скорость, качество уточняющих вопросов). Участие. 📋Приглашаем ИИ компании к участию в бенчмарке RRNCB со своими RAG-решениями и продуктами. Заполните заявку на участие. В вашем распоряжении будут: • Независимый лидерборд. • Управление сабмитами. • Возможность тестировать сабмиты до отправки в лидерборд. • Разделение сабмитов на категории cloud и on-prem. 🗓Даты проведения: Запуск: 20 августа Регистрация RAG решений участников: до 3го сентября Результаты: 20 сентября. Почему стоит участвовать. • Участие в открытом бенчмарке — это стратегическая инвестиция для владельца продукта. Вы перестаете просто говорить, что ваш продукт «лучший». Вы доказываете это на объективных метриках в сложных, приближенных к реальности условиях. Это самый мощный аргумент для сомневающихся клиентов, который резко повышает доверие. • Попадание в топ лидерборда — это готовый повод для PR. • Реальные запросы и строгая оценка бенчмарка действуют как мощный стресс-тест. Выявляются проблемы, которые можно было не заметить на внутренних тестах. • Результаты бенчмарка — это не просто цифры, а конкретные данные для вашей R&D-команды. • Экономия ресурсов на собственном тестировании. Бенчмарк предоставляет инфраструктуру и датасеты готовыми, вместе с продуманной методологией оценки. Подробнее о бенчмарке:https://fractalagents.ai/rrncb-rag-benchmark/ Инициатор проведения бенчмарка - ООО Аватар Машина. #RAG#AI#RRNCB#Benchmark#ИскусственныйИнтеллект#OpenSource

Отличная новость для всех, кто работает с документами! 🚀 На платформе Hugging Face появилась полезная и автономная модель для OCR и анализа документов: NuMarkdown-8B-Thinking. Что интересного: Это первая в мире Reasoning OCR VLM (Vision-Language Model), которая умеет "думать". В чём прорыв? Модель специально обучена превращать сложные документы (PDF, сканы, скриншоты) в идеально структурированные Markdown-файлы. Она идеально подходит для систем RAG (Retrieval-Augmented Generation), особенно если у Вас много неструктурированных данных в виде сканов... Ключевая фишка — "рассуждения": Перед тем как выдать ответ, модель генерирует внутренние "токены размышления" (<think>), чтобы проанализировать структуру документа: заголовки, таблицы, списки, сложное форматирование. Это позволяет ей блестяще справляться с нестандартными макетами. Результаты: В независимых тестах модель обходит GPT-4o и специализированные OCR-решения, а по качеству работы с документами конкурирует с гигантами вроде Gemini 2.5 Pro. При этом модель распространяется по лицензии MIT, что означает минимальные ограничения в использовании, в том числе в коммерческих целях. Попробовать демо и узнать технические детали можно здесь: hugging face Хороший шаг для автоматизации обработки документов. Технология "рассуждающего" ИИ добралась и до OCR. Что думаете? Где бы вы применили такую модель? #ИскусственныйИнтеллект#AI#OCR#Документы#RAG#HuggingFace#ВизуальныеМодели https://t.me/semasci

↗️Карта российского рынка GenAI: свежее исследование red_mad_robot от ноября 2025 Кратко: рынок GenAI в России выходит из стадии экспериментов и переходит к стратегическомувнедрению. 👇Оригинал в комментариях ________ Вышел крайне полезный материал по рынку GenAI от крутейшей студии ИИ-разработки red_mad_robot. Никакой рекламы, чисто уважение и большая любовь к их работе и отчетам, презентациям, статьям — всегда очень стараются в понятный, четкий и красивый минимализм. Сам придерживаюсь такого подхода в подаче информации. В общем, вот ключевые тезисы из статьи: 1️⃣В B2B-сегменте 70% российских компаний уже используют GenAI. Они фокусируются на сценариях с быстрой окупаемостью: клиентская поддержка, управление внутренними базами знаний и рост производительности труда. 2️⃣Крупный бизнес в России готов к AI-трансформации на уровнеруководства, но ему часто не хватает инфраструктуры и компетенций для масштабирования пилотных проектов. 3️⃣Рынок испытывает острый кадровый дефицит (около 10 тыс. специалистов) и нехватку венчурных инвестиций. Это вынуждает крупные корпорации выкупать экспертизу через M&A-сделки и инвестировать во внутреннее обучение. 4️⃣В B2C-сегменте наблюдается высокая осведомленность о возможностях AI (84%)и смена пользовательских привычек. 29% россиян, включая 47% молодежи, уже используют LLM в качестве поисковых систем. 5️⃣ Российский рынок «зреет» именно в части промышленного внедрения AI. В отличие от стран Запада, где часто покупают подписки на готовые сервисы, российские корпорации строят собственные R&D-центры и инфраструктуру. Санкции создают «окновозможностей», из-за которого российский рынок в практическом применении AI может стать более продвинутым, чем мировой, на горизонте 3-5 лет. ________ 👍 Ни убавить, ни прибавить. Примерно те же выводы делаю я весь 2025 год, а проблему из тезиса 2️⃣ я вообще освещал в своих комментариях на РБК, только в рамках строительной сферы (и с другого ракурса) 😎 Вообще, если интересуетесь темой или работаете с GenAI — советую и их аналитический канал почитывать. Подача та же, пользы — море. ИИ в РФ в 2030 — паровозик, который смог или всё же нет?Давайте обсудим, пишите в комменты ваши мысли🫵 Хэштеговая: #AI#ИИ#нейросети#GenAI#аналитика#redmadrobots#B2B#LLM#tech#тренды2025#RAG