Марк Уве-Клинг, «Страна качества».
Уве-Клинг в первую очередь стендап-комик и автор комедийных скетчей, что сильно повлияло на книгу. Лично мне не хватило какой-то сюжетной целостности: весь текст это как бы склейка отдельных сценок в общем мире с общими героями. Персонажи, кстати, очень архетипичны, а главный герой, наоборот, сравнительно безликий наблюдатель. Я бы даже сказал, что главный герой тут — вы, тот, кто читает произведение.
Тем не менее, в едкости и интересных идеях автору не занимать. «Страна качества» это сатирическая антиутопия об обществе потребления, причем, совсем не такая, как, например, «О дивный новый мир». Если у Хаксли за основу взяты глубинные соблазны людей, и на их основе смоделировано общество, то Уве-Клинг просто взял текущие реальные тренды и выкрутил в них все ручки на максимум.
Не столь далёкое будущее, центром действия становится государство под названием Qualityland. Всех людей тут зовут именем + профессией родителя того же пола в момент зачатия. Например, главный герой Петер Безработный, хотя у него самого есть работа, но у его отца в момент его зачатия не было. Есть ещё, допустим, Мартин Управляющий, Конрад Повар, Мелисса Проститутка и другие. Конечно же, не обошлось без упоминания человека с именем Ганнибал Лектор. Вообще, у автора прекрасное чувство юмора с кучей пасхалок и отсылок.
В Qualityland гипертрофированное до абсурда общество потребления, а люди в основном тупы, инертны и ленивы. В большинстве модальных окон в интерфейсах есть только кнопка ОК, даже если там задан вопрос, подразумевающий возможность отказа («Хотите посмотреть рекламу?»). Ещё в этом мире было посчитано, что уникальный рисунок губ более точен, чем отпечатки пальцев, поэтому люди оплачивают покупки, целуя экран своего гаджета — очень символично. Что касается товаров, то их доставляют дроны из магазина, даже если ты сам ничего не заказывал, потому что умные алгоритмы автоматически вычисляют, что именно тебе нужно, списывают с твоего счёта деньги за это и оформляют покупку без твоего участия. Это кажется диким, если не вспоминать, что у нас в нашей объективной реальности примерно такие же взаимоотношения с информацией: соцсети и алгоритмы корпораций решают за нас, какую информацию мы хотим потреблять, и доставляют её к нам.
Вообще, читая эту книгу, я сначала пребывал в слезах от абсурдности и нереалистичности происходящего, а потом пребывал в слезах от осознания того, насколько близка наша реальная жизнь к чему-то подобному. Хоть центральный сюжет, на мой взгляд, вышел у автора беззубым и скомканным, острые и едкие детали в отдельных сценах и в описании мира можно пересказывать часами.
Сквозь сатиру и гротеск иногда проглядывают любопытные размышления автора о неизбежном вреде человечеству от ИИ, исторические вставки с реальными фактами и вполне правдоподобные объяснения некоторых экономических эффектов.
В общем, скорее рекомендую, чем не, но читать нужно с осторожностью, заранее воспринимая роман не совсем как обычное художественное произведение. Уже есть вторая книга, начну её сегодня.
#fiction
#Вакансия#RAG
Всем привет! На связи команда Sprint Labs 🚀
Мы в поисках AI-инженера / Специалиста по RAG для проекта по созданию интеллектуального ассистента для психотерапевта на основе RAG-архитектуры.
✨Краткий обзор:✨
Мы ищем опытного AI-инженера для разработки прототипа интеллектуальной системы-ассистента, предназначенной для когнитивно-поведенческих терапевтов. Цель системы — автоматизировать процесс анализа данных из диагностических опросников и генерировать на их основе релевантные терапевтические гипотезы и рекомендации по применению конкретных техник.
⚡️Основная задача:⚡️
Разработать end-to-end RAG-пайплайн, который реализует следующий двухэтапный воркфлоу:
- На вход система получает структурированные данные из заполненного пациентом диагностического бланка в формате JSON.
- На выходе система генерирует структурированный отчет для терапевта, который включает:
- Краткий диагностический анализ.
- Список ключевых терапевтических мишеней.
- Рекомендации по конкретным техникам с обоснованием их применимости.
🚀Ключевые технические и интеллектуальные вызовы:🚀
- Качество сегментации: От вас потребуется не просто техническая реализация, а продуманный подход к разбиению узкоспециализированных текстов на осмысленные единицы.
- Логика цепочки вызовов: Необходимо грамотно спроектировать передачу данных между двумя RAG-шагами, где вывод одного является входом для поиска другого.
- Точность и надежность: Система должна быть максимально точной и основываться исключительно на предоставленных источниках. Это не чат-бот общего назначения, а экспертная система.
⚡️Требуемые навыки и квалификация:⚡️
Обязательно:🔗
-Глубокое понимание и практический опыт построения RAG-систем.
- Сильные навыки в Python и NLP.
- Продвинутый промпт-инжиниринг.
Крайне желательно:🔗
Опыт работы с фреймворками LangChain или LlamaIndex.
Опыт построения многоэтапных (multi-step) или агентских LLM-воркфлоу.
Будет плюсом:🔗
-Интерес к психологии или опыт работы с экспертными системами в других областях.
⚡️Условия⚡️
- Ставка в час от 1.500р
- Проект с возможностью дальнейших совместных задач
🚀Ожидаемые результаты:🚀
- Рабочий прототип системы.
- Документация с описанием архитектуры, выбранных моделей, стратегии сегментации и структуры промптов.
- Исходный код с комментариями.
Если тебя заинтересовала эта задача- отправляй резюме и пару слов о себе и своем опыте @NikaFromSL✅
🌟Amazon встроила векторную базу данных прямо в хранилище S3.
Amazon анонсировала S3 Vectors - нативную поддержку векторного поиска прямо внутри своего вездесущего объектного хранилища. Заявлено, что это может снизить затраты на хранение и обработку векторов до 90%.
По сути, AWS предлагает не отдельный сервис, а новый тип бакета vector bucket. Внутри него вы создаете векторные индексы, указывая размерность векторов и метрику расстояния (косинусную или евклидову).
🟡Дальше все работает как магия
Вы просто загружаете в индекс свои эмбеддинги вместе с метаданными для фильтрации, а S3 берет на себя всю грязную работу по хранению, автоматической оптимизации и обеспечению субсекундного ответа на запросы. Никакого управления инфраструктурой.
Один бакет может содержать до 10 тысяч индексов, а каждый индекс, в свою очередь, десятки миллионов векторов.
🟡Главная сила этого решения - в экосистеме.
S3 Vectors бесшовно интегрируется с Bedrock Knowledge Bases. Теперь при создании базы знаний для RAG-приложения можно просто указать S3-бакет в качестве векторного хранилища.
Процесс создания RAG-пайплайна для тех, кто уже живет в облаке AWS, упрощается до нескольких кликов. То же самое касается и SageMaker Unified Studio, где эта интеграция тоже доступна из коробки.
🟡"One more thing" анонса - умная интеграция с сервисом OpenSearch.
AWS предлагает гибкую, многоуровневую стратегию. Нечасто используемые или «холодные» векторы можно экономично хранить в S3 Vectors. А когда для части данных потребуется максимальная производительность и низкая задержка в реальном времени, например, для системы рекомендаций, их можно быстро экспортировать в OpenSearch.
Это очень прагматичный инженерный подход, позволяющий балансировать между стоимостью и производительностью.
Пока сервис находится в статусе превью и доступен в регионах US East (N. Virginia), US East (Ohio), US West (Oregon), Europe (Frankfurt), and Asia Pacific (Sydney) Regions.
Попробовать S3 Vectors можно в Amazon S3 console.
🟡Статья
🖥Github
@ai_machinelearning_big_data
#AI#ML#RAG#Amazon
🙂 RAG — важная аббревиатура современного машинного обучения
🎁 RAG — retrieval-augmented generation или генерация, дополненная поиском, — подход, при котором генерация ответа большой языковой модели (LLM) осуществляется на основе данных, полученных в результате поиска по внешним ресурсам (это могут быть файлы, базы данных, веб-архивы и другие источники).
🧑💻 14 августа в 12:00 (Мск) Яндекс.Cloud приглашает на вебинар, посвящённый сценарию RAG на YDB (СУБД Яндекса) и тому, как реализовать семантический поиск, обогащая ответы LLM-моделей в ИИ-решениях, которые работают с текстовыми массивами знаний.
🔜Регистрация
👩💻 28 августа в 11:00 (Мск) провайдет Cloud.ru (в прошлом SberCloud) приглашает на вебинар о том, как с помощью Evolution Managed RAG избавить AI-агента от галлюцинаций, предоставляя релевантную информацию из ваших документов, как подготовить документы, где их хранить и как правильно настроить обработку данных для улучшения качества ответа LLM без дообучения.
🔜Регистрация
Ещё по теме RAG:
🙂Размышление о пользе RAG для цифровой истории
😉Что такое RAG? — простыми словами рассказывает СБъ
Иллюстрация от fusionbrain.ai по промту «retrieval-augmented generation или генерация, дополненная поиском»
#ии#ai#ml#rag#термины
#other#agent#llm#rag
Happy-LLM is a free, open-source learning project that helps you deeply understand large language models (LLMs) from basics to advanced training and applications. It teaches you key concepts like NLP, Transformer architecture, pretraining, and how to build and train your own LLaMA2 model step-by-step. You also learn practical skills like fine-tuning and using cutting-edge techniques such as Retrieval-Augmented Generation (RAG) and intelligent agents. This project is ideal if you know some Python and deep learning, and it offers both theory and hands-on code to help you master LLM development and apply it in real-world AI tasks. This can boost your skills and confidence in AI model building and research.
https://github.com/datawhalechina/happy-llm
#python#agent#llm#rag#tutorial
You can learn to build smart AI agents from scratch with a free, open-source tutorial called Hello-Agents by Datawhale. It covers everything from basic concepts and history to hands-on projects like creating your own AI agent framework and multi-agent systems. The course includes practical skills such as memory, context handling, communication protocols, and training large language models. By following it, you gain deep understanding and real coding experience, moving from just using AI models to designing intelligent systems yourself. This helps you develop advanced AI skills useful for jobs, research, or building innovative AI applications. The materials are online and easy to access anytime.
https://github.com/datawhalechina/hello-agents
#вакансия#fulltime#remote#senior#dataengineer#llm#rag
Компания Centicore💙 находится в поисках Senior Data Engineer (LLM / RAG).
Мы занимаемся продуктовой и платформенной разработкой под ключ для крупных заказчиков. В рамках проекта команда строит промышленную data-платформу для работы с большими языковыми моделями (LLM) и Retrieval-Augmented Generation (RAG).
Формат работы: Удаленка по РФ
Вилка: 350–380k на руки (в зависимости от опыта и пожеланий кандидата)
Уровень: Senior
🔷 Требования:
Отличное знание Python: структуры данных, итераторы, декораторы,
асинхронное и параллельное программирование, OOP и FP
Уверенное владение SQL: сложные запросы, CTE, оконные функции
Опыт работы с vector DB: OpenSearch, Qdrant
Опыт построения batch и streaming-сервисов для расчёта embeddings и загрузки их в векторные хранилища
Понимание принципов RAG и обогащения LLM контекстными данными
Опыт разработки промышленных ETL-сервисов на Python
Опыт оркестрации пайплайнов: Apache Airflow, Argo Workflows
Хорошее знание Apache Spark / PySpark (производительность, отладка, Spark History Server)
Опыт асинхронного взаимодействия с веб-сервисами по REST API (aiohttp, httpx)
Опыт работы с PostgreSQL, Oracle
Опыт работы с Big Data-хранилищами: Hadoop/HDFS, S3, Hive, Iceberg
Опыт работы в JupyterLab / JupyterHub
🔷 Будет плюсом:
Опыт потоковой обработки данных
Опыт работы в AI / ML / LLM-проектах
Понимание требований к данным для обучения и эксплуатации ML-моделей
Опыт построения отказоустойчивых data-сервисов в enterprise-среде
🔷 Обязанности:
Разработка сервисов пакетной и потоковой обработки данных для вычисления векторных представлений (embeddings)
Загрузка и сопровождение данных в векторных хранилищах для использования в RAG-сценариях
Разработка и поддержка ETL-пайплайнов под управлением Airflow / Argo
Оптимизация SQL-запросов и Spark-приложений
Взаимодействие с командами Data Science, ML/LLM и инфраструктуры
Участие в развитии data-платформы для LLM-решений
💌 Для откликов и вопросов — писать в лс @ktvsk_d
Будем рады знакомству! ❤️
🌟 VimRAG: мультимодальный RAG-агент, который держит контекст в виде графа памяти.
Tongyi Lab (Alibaba Group) опубликовала VimRAG - фреймворк агентного RAG для работы с текстом, изображениями и видео.
Проект развивает прошлогодний VRAG-RL и решает проблему мультимодального RAG: визуальные данные тяжелые по токенам, но семантически разрежены, а классическая ReAct-история забивает контекст шумом и провоцирует повторные бесполезные запросы к поиску.
Вместо журнала наблюдений VimRAG моделирует рассуждение как динамический направленный ацикличный граф. Каждая вершина хранит подзапрос, действие агента, текстовое саммари и банк визуальных токенов.
Ребра фиксируют логические зависимости между шагами. Такой граф позволяет агенту отличать тупиковую ветку от новой гипотезы и не уходить в циклы повторных поисков.
🟡Поверх графа работает Graph-Modulated Visual Memory Encoding.
Бюджет визуальных токенов распределяется с учетом исходящей степени в графе, экспоненциального временного затухания (имитация забывания) и рекурсивной обратной связи от потомков.
Ключевым фрагментам достается высокое разрешение, а второстепенные кадры сжимаются или отбрасываются. Для видео задействована способность VLM привязывать содержимое к временной шкале (извлечение ключевых кадров по таймкодам).
🟡Третий компонент - Graph-GPO.
GGPO строит критический путь от корня к ответу и накладывает градиентную маску, исключая тупиковые узлы из положительных примеров, а ценные ретривы - из отрицательных.
По графикам обучения это дает более быструю сходимость, чем базовый GSPO без прунинга.
🟡Тесты
🟢VimRAG обходит Vanilla RAG, ReAct, VideoRAG, UniversalRAG, MemAgent и Mem1 на 9 бенчмарках (HotpotQA и SQuAD до SlideVQA, MMLongBench, LVBench и XVBench).
🟢На Qwen3-VL-8B-Instruct средний скор поднимается с 43,6 до 50,1, на 4B-версии - с 40,6 до 45,2.
При этом средняя длина траектории ниже, чем у ReAct и Mem1: структурированная память съедает меньше действий на ответ.
В репозитории доступны:
🟠тренировочный фреймворк VRAG-RL, демо VRAG на тестовой Qwen2.5-VL-7B-VRAG через vLLM (нужна A100 80GB);
🟠демо на API Qwen3.5-Plus через DashScope (с визуализацией DAG рассуждения и расширенным ризонингом).
Поисковый движок построен на FAISS и поддерживает эмбеддинги GVE-3B/7B и Qwen3-VL-Embedding-2B/8B. Индексировать можно изображения, PDF (через конвертацию) и нарезанное на чанки видео.
Код трейна самого VimRAG обещают выложить после внутреннего ревью Alibaba.
🟡Arxiv
🟡Модель
🖥GitHub
@ai_machinelearning_big_data
#AI#ML#RAG#VRAG#TongyiLab
🚀 20 августа 2025
Стартует RRNCB – Russian RAG Normative – Corporate Benchmark,
первый российский открытый бенчмарк для оценки RAG-решений при работе с нормативной,
правовой и технической документацией компаний.
Почему это важно?
✅ На рынке десятки RAG-решений, но нет методики и инструмента оценки и сопоставления характеристик RAG сервисов, оценить их качество очень трудно.
✅RRNCB – это первый продуктовый бенчмарк, цель которого провести комплексную оценку Retrieval augmented generation продуктов для работы с корпоративной и технической документацией.
✅ Специально создан для оценки систем, работающих с русскоязычными нормативами, кодексами, ГОСТами и корпоративными документами.
✅ Открытость и прозрачность: методики оценки и данные будут в открытом доступе.
Сравнение проходит по ключевым метрикам (ROUGE, LLM-судья, скорость, качество уточняющих вопросов).
Участие.
📋Приглашаем ИИ компании к участию в бенчмарке RRNCB со своими RAG-решениями и продуктами. Заполните заявку на участие.
В вашем распоряжении будут:
• Независимый лидерборд.
• Управление сабмитами.
• Возможность тестировать сабмиты до отправки в лидерборд.
• Разделение сабмитов на категории cloud и on-prem.
🗓Даты проведения:
Запуск: 20 августа
Регистрация RAG решений участников: до 3го сентября
Результаты: 20 сентября.
Почему стоит участвовать.
• Участие в открытом бенчмарке — это стратегическая инвестиция для владельца продукта.
Вы перестаете просто говорить, что ваш продукт «лучший». Вы доказываете это на объективных метриках в сложных, приближенных к реальности условиях. Это самый мощный аргумент для сомневающихся клиентов, который резко повышает доверие.
• Попадание в топ лидерборда — это готовый повод для PR.
• Реальные запросы и строгая оценка бенчмарка действуют как мощный стресс-тест. Выявляются проблемы, которые можно было не заметить на внутренних тестах.
• Результаты бенчмарка — это не просто цифры, а конкретные данные для вашей R&D-команды.
• Экономия ресурсов на собственном тестировании. Бенчмарк предоставляет инфраструктуру и датасеты готовыми, вместе с продуманной методологией оценки.
Подробнее о бенчмарке:https://fractalagents.ai/rrncb-rag-benchmark/
Инициатор проведения бенчмарка - ООО Аватар Машина.
#RAG#AI#RRNCB#Benchmark#ИскусственныйИнтеллект#OpenSource
#вакансия#remote#AIengineer#LLM#RAG#hiring
AI Engineer в амбициозную команду, которая строит не «очередной ИИ-инструмент», а систему, переосмысляющую принятие решений в условиях высокой неопределенности.
Проект, в который идёт найм, он не из разряда "сделаем стартап и посмотрим". Это масштабный пивот для одного из самых интересных VC-фондов с глобальным охватом.
Мы небольшая венчурная студия, которая помогает существующим компаниям резко наращивать капитализацию через точечные, но радикальные расширения и изменения, часто для переизобретения и пересборки смыслов. И когда такие изменения срабатывают, это уже не продукт, а настоящая "сюжетная арка" с эффектом hockey stick.
Сейчас как раз тот самый момент. Команда собрана. Рынок подвижен. Вопрос только в том, кто будет собирать логику новой интеллектуальной системы.
🌍 Формат: удаленно
🧠 Уровень: Middle / Senior / Deep Thinker
💸 ЗП (gross, annual): ~$55K Middle / ~$85K Senior / ~$120K Deep Thinker
📍 Гео: неважно, главное -- мышление
О проекте
На фоне всех этих DeepSeek'ов 3.1, Llama 4 (и мы еще не успели увидеть ризонинг версию), Gemini 2.5 pro/Gemma 3, GPT 4.5 и даже сильно поумневшего ChatGPT 4o, и ожидания o3/o4/GPT 5/Qwen3 и многого-многого другого, самая сложная задача всё ещё та же: понять, когда ты неправ.
Проблема не в доступе к данным, а в том, какие 5% контекста действительно важны. Всё остальное это только шум и самоуспокоение.
Мы строим не чат-бот и не дашборд. И точно не RAG на изоленте и скотче. Это интеллектуальная система, которая помогает VC и инвестиционным командам
выявлять слепые зоны, переосмысливать уверенность и точнее различать ценное и бесполезное. Она не заменяет человека, а помогает ему постоянно оставаться в тонусе. И еще иногда бьёт по самоуверенности, но очень фелигранно и аккуратно, только для повышения эффективности.
🔧 Технологический стек:
[ ] LangChain, LlamaIndex
[ ] Реализация высоконадежного Retrieval-Augmented Generation
[ ] RAG, который работает в условиях реального давления, а не в демке
[ ] Валидация источников и данных в реальном времени
[ ] Python (FastAPI, Flask, Django), OpenAI, Claude, Gemini, Grok и друзья
👀 Мы ищем человека, который:
[ ] Знает, что такое инженерия рассуждений, а не просто промпты
[ ] Понимает, что эпистемология важнее вайрфреймов
[ ] Может строить пайплайны, которые думают, а не просто индексируют
[ ] Работал с AI в чувствительных или высокоответственных системах (финансы, безопасность, анализ рисков)
Если хочется строить то, что действительно имеет значение, напиши в личку @ssmetyukh
⚡️ Китайские исследователи из Shanghai Jiao Tong и Zhejiang University представили MemOS — первую в мире "операционную систему памяти" для ИИ.
Обычные LLM быстро забывают информацию, а дообучать их — долго и дорого.
В новой работе предлагают радикально другой подход: MemOS превращает память в часть операционной системы.
🟢Память как файлы: Модель может *записывать, перемещать и удалять* знания, как будто работает с файлами, и делать это прямо во время работы, а не только на этапе обучения.
🟢MemCube — контейнер знаний: Каждое знание упаковывается в кубик с метками времени и авторства. Планировщик сам решает, где хранить этот "куб" — в тексте, GPU‑кэше или в виде маленького патча весов.
🟢Умная экономия: MemOS работает с 1500 токенами памяти, но достигает такой же точности, как если бы модель загружала весь контекст. При этом скорость — как у облегчённых моделей.
🟢Мгновенная подгрузка: На тестах с Qwen2.5‑72B переключение нужных "кубов" в кэш снижает задержку первого токена на 91.4%, *без изменения ответа*.
🟢Результаты: MemOS набрал 73.31 балла по LLM‑Judge на LOCOMO-бенчмарке — почти на 9 баллов больше ближайшего конкурента. Особенно хорошо работает на сложных задачах с несколькими шагами и временными зависимостями.
💡 Итог: память как ОС — это не просто удобно, это ускоряет модель, повышает точность и даёт контроль над знаниями.
Установка: pip install MemoryOS
🟠GitHub
🟠Проект
@ai_machinelearning_big_data
#MemoryOS#agentmemory#rag#kvcache