⚡️ Китайские исследователи из Shanghai Jiao Tong и Zhejiang University представили MemOS — первую в мире "операционную систему памяти" для ИИ.
Обычные LLM быстро забывают информацию, а дообучать их — долго и дорого.
В новой работе предлагают радикально другой подход: MemOS превращает память в часть операционной системы.
🟢Память как файлы: Модель может *записывать, перемещать и удалять* знания, как будто работает с файлами, и делать это прямо во время работы, а не только на этапе обучения.
🟢MemCube — контейнер знаний: Каждое знание упаковывается в кубик с метками времени и авторства. Планировщик сам решает, где хранить этот "куб" — в тексте, GPU‑кэше или в виде маленького патча весов.
🟢Умная экономия: MemOS работает с 1500 токенами памяти, но достигает такой же точности, как если бы модель загружала весь контекст. При этом скорость — как у облегчённых моделей.
🟢Мгновенная подгрузка: На тестах с Qwen2.5‑72B переключение нужных "кубов" в кэш снижает задержку первого токена на 91.4%, *без изменения ответа*.
🟢Результаты: MemOS набрал 73.31 балла по LLM‑Judge на LOCOMO-бенчмарке — почти на 9 баллов больше ближайшего конкурента. Особенно хорошо работает на сложных задачах с несколькими шагами и временными зависимостями.
💡 Итог: память как ОС — это не просто удобно, это ускоряет модель, повышает точность и даёт контроль над знаниями.
Установка: pip install MemoryOS
🟠GitHub
🟠Проект
@ai_machinelearning_big_data
#MemoryOS#agentmemory#rag#kvcache
🚀 20 августа 2025
Стартует RRNCB – Russian RAG Normative – Corporate Benchmark,
первый российский открытый бенчмарк для оценки RAG-решений при работе с нормативной,
правовой и технической документацией компаний.
Почему это важно?
✅ На рынке десятки RAG-решений, но нет методики и инструмента оценки и сопоставления характеристик RAG сервисов, оценить их качество очень трудно.
✅RRNCB – это первый продуктовый бенчмарк, цель которого провести комплексную оценку Retrieval augmented generation продуктов для работы с корпоративной и технической документацией.
✅ Специально создан для оценки систем, работающих с русскоязычными нормативами, кодексами, ГОСТами и корпоративными документами.
✅ Открытость и прозрачность: методики оценки и данные будут в открытом доступе.
Сравнение проходит по ключевым метрикам (ROUGE, LLM-судья, скорость, качество уточняющих вопросов).
Участие.
📋Приглашаем ИИ компании к участию в бенчмарке RRNCB со своими RAG-решениями и продуктами. Заполните заявку на участие.
В вашем распоряжении будут:
• Независимый лидерборд.
• Управление сабмитами.
• Возможность тестировать сабмиты до отправки в лидерборд.
• Разделение сабмитов на категории cloud и on-prem.
🗓Даты проведения:
Запуск: 20 августа
Регистрация RAG решений участников: до 3го сентября
Результаты: 20 сентября.
Почему стоит участвовать.
• Участие в открытом бенчмарке — это стратегическая инвестиция для владельца продукта.
Вы перестаете просто говорить, что ваш продукт «лучший». Вы доказываете это на объективных метриках в сложных, приближенных к реальности условиях. Это самый мощный аргумент для сомневающихся клиентов, который резко повышает доверие.
• Попадание в топ лидерборда — это готовый повод для PR.
• Реальные запросы и строгая оценка бенчмарка действуют как мощный стресс-тест. Выявляются проблемы, которые можно было не заметить на внутренних тестах.
• Результаты бенчмарка — это не просто цифры, а конкретные данные для вашей R&D-команды.
• Экономия ресурсов на собственном тестировании. Бенчмарк предоставляет инфраструктуру и датасеты готовыми, вместе с продуманной методологией оценки.
Подробнее о бенчмарке:https://fractalagents.ai/rrncb-rag-benchmark/
Инициатор проведения бенчмарка - ООО Аватар Машина.
#RAG#AI#RRNCB#Benchmark#ИскусственныйИнтеллект#OpenSource
Отличная новость для всех, кто работает с документами! 🚀
На платформе Hugging Face появилась полезная и автономная модель для OCR и анализа документов: NuMarkdown-8B-Thinking.
Что интересного: Это первая в мире Reasoning OCR VLM (Vision-Language Model), которая умеет "думать".
В чём прорыв?
Модель специально обучена превращать сложные документы (PDF, сканы, скриншоты) в идеально структурированные Markdown-файлы. Она идеально подходит для систем RAG (Retrieval-Augmented Generation), особенно если у Вас много неструктурированных данных в виде сканов...
Ключевая фишка — "рассуждения":
Перед тем как выдать ответ, модель генерирует внутренние "токены размышления" (<think>), чтобы проанализировать структуру документа: заголовки, таблицы, списки, сложное форматирование. Это позволяет ей блестяще справляться с нестандартными макетами.
Результаты:
В независимых тестах модель обходит GPT-4o и специализированные OCR-решения, а по качеству работы с документами конкурирует с гигантами вроде Gemini 2.5 Pro.
При этом модель распространяется по лицензии MIT, что означает минимальные ограничения в использовании, в том числе в коммерческих целях.
Попробовать демо и узнать технические детали можно здесь: hugging face
Хороший шаг для автоматизации обработки документов. Технология "рассуждающего" ИИ добралась и до OCR.
Что думаете? Где бы вы применили такую модель?
#ИскусственныйИнтеллект#AI#OCR#Документы#RAG#HuggingFace#ВизуальныеМодели
https://t.me/semasci
↗️Карта российского рынка GenAI: свежее исследование red_mad_robot от ноября 2025
Кратко: рынок GenAI в России выходит из стадии экспериментов и переходит к стратегическомувнедрению.
👇Оригинал в комментариях
________
Вышел крайне полезный материал по рынку GenAI от крутейшей студии ИИ-разработки red_mad_robot.
Никакой рекламы, чисто уважение и большая любовь к их работе и отчетам, презентациям, статьям — всегда очень стараются в понятный, четкий и красивый минимализм. Сам придерживаюсь такого подхода в подаче информации.
В общем, вот ключевые тезисы из статьи:
1️⃣В B2B-сегменте 70% российских компаний уже используют GenAI. Они фокусируются на сценариях с быстрой окупаемостью: клиентская поддержка, управление внутренними базами знаний и рост производительности труда.
2️⃣Крупный бизнес в России готов к AI-трансформации на уровнеруководства, но ему часто не хватает инфраструктуры и компетенций для масштабирования пилотных проектов.
3️⃣Рынок испытывает острый кадровый дефицит (около 10 тыс. специалистов) и нехватку венчурных инвестиций. Это вынуждает крупные корпорации выкупать экспертизу через M&A-сделки и инвестировать во внутреннее обучение.
4️⃣В B2C-сегменте наблюдается высокая осведомленность о возможностях AI (84%)и смена пользовательских привычек. 29% россиян, включая 47% молодежи, уже используют LLM в качестве поисковых систем.
5️⃣ Российский рынок «зреет» именно в части промышленного внедрения AI. В отличие от стран Запада, где часто покупают подписки на готовые сервисы, российские корпорации строят собственные R&D-центры и инфраструктуру. Санкции создают «окновозможностей», из-за которого российский рынок в практическом применении AI может стать более продвинутым, чем мировой, на горизонте 3-5 лет.
________
👍 Ни убавить, ни прибавить. Примерно те же выводы делаю я весь 2025 год, а проблему из тезиса 2️⃣ я вообще освещал в своих комментариях на РБК, только в рамках строительной сферы (и с другого ракурса) 😎
Вообще, если интересуетесь темой или работаете с GenAI — советую и их аналитический канал почитывать. Подача та же, пользы — море.
ИИ в РФ в 2030 — паровозик, который смог или всё же нет?Давайте обсудим, пишите в комменты ваши мысли🫵
Хэштеговая:
#AI#ИИ#нейросети#GenAI#аналитика#redmadrobots#B2B#LLM#tech#тренды2025#RAG