Telegram изъял 70% адресов каналов, которые не проявляли активность год или более (то есть отобрал у них короткое имя, как например моё @clockstackwheels). Дуров заявил, что, дескать, эти адреса принадлежали иранским киберсквоттерам. Хотя, зная его любовь к выдаче желаемого за действительное, могу предположить, что 70% каналов просто были заброшены. И у меня даже есть идеи, почему, но, думаю, вы и сами догадываетесь.
Тем не менее, независимо от истинных причин, чистить неактивные адреса я считаю правильным. Каналы созданы для того, чтобы быть живым фидом какой-то информации. Не обязательно блогом, это может быть даже технический канал с логом вашего CI/CD по работе.
Издание Telegram Info запустило петицию с требованием вернуть эти адреса. Вот что они пишут: Зачастую каналы используются авторами как личные визитные карточки, каталоги, энциклопедии и публичные архивы..
Я тоже так могу: Зачастую микроскопы используются владельцами как подставки для книг, линзы для поджига костра и инструмент забивания гвоздей!.
Думаю, то же самое (экспроприацию адресов) сделали бы с ботами, если бы на платформу ботов не положили огромный болт ещё несколько лет назад.
#web
#Вакансия#RAG
Всем привет! На связи команда Sprint Labs 🚀
Мы в поисках AI-инженера / Специалиста по RAG для проекта по созданию интеллектуального ассистента для психотерапевта на основе RAG-архитектуры.
✨Краткий обзор:✨
Мы ищем опытного AI-инженера для разработки прототипа интеллектуальной системы-ассистента, предназначенной для когнитивно-поведенческих терапевтов. Цель системы — автоматизировать процесс анализа данных из диагностических опросников и генерировать на их основе релевантные терапевтические гипотезы и рекомендации по применению конкретных техник.
⚡️Основная задача:⚡️
Разработать end-to-end RAG-пайплайн, который реализует следующий двухэтапный воркфлоу:
- На вход система получает структурированные данные из заполненного пациентом диагностического бланка в формате JSON.
- На выходе система генерирует структурированный отчет для терапевта, который включает:
- Краткий диагностический анализ.
- Список ключевых терапевтических мишеней.
- Рекомендации по конкретным техникам с обоснованием их применимости.
🚀Ключевые технические и интеллектуальные вызовы:🚀
- Качество сегментации: От вас потребуется не просто техническая реализация, а продуманный подход к разбиению узкоспециализированных текстов на осмысленные единицы.
- Логика цепочки вызовов: Необходимо грамотно спроектировать передачу данных между двумя RAG-шагами, где вывод одного является входом для поиска другого.
- Точность и надежность: Система должна быть максимально точной и основываться исключительно на предоставленных источниках. Это не чат-бот общего назначения, а экспертная система.
⚡️Требуемые навыки и квалификация:⚡️
Обязательно:🔗
-Глубокое понимание и практический опыт построения RAG-систем.
- Сильные навыки в Python и NLP.
- Продвинутый промпт-инжиниринг.
Крайне желательно:🔗
Опыт работы с фреймворками LangChain или LlamaIndex.
Опыт построения многоэтапных (multi-step) или агентских LLM-воркфлоу.
Будет плюсом:🔗
-Интерес к психологии или опыт работы с экспертными системами в других областях.
⚡️Условия⚡️
- Ставка в час от 1.500р
- Проект с возможностью дальнейших совместных задач
🚀Ожидаемые результаты:🚀
- Рабочий прототип системы.
- Документация с описанием архитектуры, выбранных моделей, стратегии сегментации и структуры промптов.
- Исходный код с комментариями.
Если тебя заинтересовала эта задача- отправляй резюме и пару слов о себе и своем опыте @NikaFromSL✅
🌟Amazon встроила векторную базу данных прямо в хранилище S3.
Amazon анонсировала S3 Vectors - нативную поддержку векторного поиска прямо внутри своего вездесущего объектного хранилища. Заявлено, что это может снизить затраты на хранение и обработку векторов до 90%.
По сути, AWS предлагает не отдельный сервис, а новый тип бакета vector bucket. Внутри него вы создаете векторные индексы, указывая размерность векторов и метрику расстояния (косинусную или евклидову).
🟡Дальше все работает как магия
Вы просто загружаете в индекс свои эмбеддинги вместе с метаданными для фильтрации, а S3 берет на себя всю грязную работу по хранению, автоматической оптимизации и обеспечению субсекундного ответа на запросы. Никакого управления инфраструктурой.
Один бакет может содержать до 10 тысяч индексов, а каждый индекс, в свою очередь, десятки миллионов векторов.
🟡Главная сила этого решения - в экосистеме.
S3 Vectors бесшовно интегрируется с Bedrock Knowledge Bases. Теперь при создании базы знаний для RAG-приложения можно просто указать S3-бакет в качестве векторного хранилища.
Процесс создания RAG-пайплайна для тех, кто уже живет в облаке AWS, упрощается до нескольких кликов. То же самое касается и SageMaker Unified Studio, где эта интеграция тоже доступна из коробки.
🟡"One more thing" анонса - умная интеграция с сервисом OpenSearch.
AWS предлагает гибкую, многоуровневую стратегию. Нечасто используемые или «холодные» векторы можно экономично хранить в S3 Vectors. А когда для части данных потребуется максимальная производительность и низкая задержка в реальном времени, например, для системы рекомендаций, их можно быстро экспортировать в OpenSearch.
Это очень прагматичный инженерный подход, позволяющий балансировать между стоимостью и производительностью.
Пока сервис находится в статусе превью и доступен в регионах US East (N. Virginia), US East (Ohio), US West (Oregon), Europe (Frankfurt), and Asia Pacific (Sydney) Regions.
Попробовать S3 Vectors можно в Amazon S3 console.
🟡Статья
🖥Github
@ai_machinelearning_big_data
#AI#ML#RAG#Amazon
🙂 RAG — важная аббревиатура современного машинного обучения
🎁 RAG — retrieval-augmented generation или генерация, дополненная поиском, — подход, при котором генерация ответа большой языковой модели (LLM) осуществляется на основе данных, полученных в результате поиска по внешним ресурсам (это могут быть файлы, базы данных, веб-архивы и другие источники).
🧑💻 14 августа в 12:00 (Мск) Яндекс.Cloud приглашает на вебинар, посвящённый сценарию RAG на YDB (СУБД Яндекса) и тому, как реализовать семантический поиск, обогащая ответы LLM-моделей в ИИ-решениях, которые работают с текстовыми массивами знаний.
🔜Регистрация
👩💻 28 августа в 11:00 (Мск) провайдет Cloud.ru (в прошлом SberCloud) приглашает на вебинар о том, как с помощью Evolution Managed RAG избавить AI-агента от галлюцинаций, предоставляя релевантную информацию из ваших документов, как подготовить документы, где их хранить и как правильно настроить обработку данных для улучшения качества ответа LLM без дообучения.
🔜Регистрация
Ещё по теме RAG:
🙂Размышление о пользе RAG для цифровой истории
😉Что такое RAG? — простыми словами рассказывает СБъ
Иллюстрация от fusionbrain.ai по промту «retrieval-augmented generation или генерация, дополненная поиском»
#ии#ai#ml#rag#термины
#other#agent#llm#rag
Happy-LLM is a free, open-source learning project that helps you deeply understand large language models (LLMs) from basics to advanced training and applications. It teaches you key concepts like NLP, Transformer architecture, pretraining, and how to build and train your own LLaMA2 model step-by-step. You also learn practical skills like fine-tuning and using cutting-edge techniques such as Retrieval-Augmented Generation (RAG) and intelligent agents. This project is ideal if you know some Python and deep learning, and it offers both theory and hands-on code to help you master LLM development and apply it in real-world AI tasks. This can boost your skills and confidence in AI model building and research.
https://github.com/datawhalechina/happy-llm
#python#agent#llm#rag#tutorial
You can learn to build smart AI agents from scratch with a free, open-source tutorial called Hello-Agents by Datawhale. It covers everything from basic concepts and history to hands-on projects like creating your own AI agent framework and multi-agent systems. The course includes practical skills such as memory, context handling, communication protocols, and training large language models. By following it, you gain deep understanding and real coding experience, moving from just using AI models to designing intelligent systems yourself. This helps you develop advanced AI skills useful for jobs, research, or building innovative AI applications. The materials are online and easy to access anytime.
https://github.com/datawhalechina/hello-agents
#вакансия#fulltime#remote#senior#dataengineer#llm#rag
Компания Centicore💙 находится в поисках Senior Data Engineer (LLM / RAG).
Мы занимаемся продуктовой и платформенной разработкой под ключ для крупных заказчиков. В рамках проекта команда строит промышленную data-платформу для работы с большими языковыми моделями (LLM) и Retrieval-Augmented Generation (RAG).
Формат работы: Удаленка по РФ
Вилка: 350–380k на руки (в зависимости от опыта и пожеланий кандидата)
Уровень: Senior
🔷 Требования:
Отличное знание Python: структуры данных, итераторы, декораторы,
асинхронное и параллельное программирование, OOP и FP
Уверенное владение SQL: сложные запросы, CTE, оконные функции
Опыт работы с vector DB: OpenSearch, Qdrant
Опыт построения batch и streaming-сервисов для расчёта embeddings и загрузки их в векторные хранилища
Понимание принципов RAG и обогащения LLM контекстными данными
Опыт разработки промышленных ETL-сервисов на Python
Опыт оркестрации пайплайнов: Apache Airflow, Argo Workflows
Хорошее знание Apache Spark / PySpark (производительность, отладка, Spark History Server)
Опыт асинхронного взаимодействия с веб-сервисами по REST API (aiohttp, httpx)
Опыт работы с PostgreSQL, Oracle
Опыт работы с Big Data-хранилищами: Hadoop/HDFS, S3, Hive, Iceberg
Опыт работы в JupyterLab / JupyterHub
🔷 Будет плюсом:
Опыт потоковой обработки данных
Опыт работы в AI / ML / LLM-проектах
Понимание требований к данным для обучения и эксплуатации ML-моделей
Опыт построения отказоустойчивых data-сервисов в enterprise-среде
🔷 Обязанности:
Разработка сервисов пакетной и потоковой обработки данных для вычисления векторных представлений (embeddings)
Загрузка и сопровождение данных в векторных хранилищах для использования в RAG-сценариях
Разработка и поддержка ETL-пайплайнов под управлением Airflow / Argo
Оптимизация SQL-запросов и Spark-приложений
Взаимодействие с командами Data Science, ML/LLM и инфраструктуры
Участие в развитии data-платформы для LLM-решений
💌 Для откликов и вопросов — писать в лс @ktvsk_d
Будем рады знакомству! ❤️
🌟 VimRAG: мультимодальный RAG-агент, который держит контекст в виде графа памяти.
Tongyi Lab (Alibaba Group) опубликовала VimRAG - фреймворк агентного RAG для работы с текстом, изображениями и видео.
Проект развивает прошлогодний VRAG-RL и решает проблему мультимодального RAG: визуальные данные тяжелые по токенам, но семантически разрежены, а классическая ReAct-история забивает контекст шумом и провоцирует повторные бесполезные запросы к поиску.
Вместо журнала наблюдений VimRAG моделирует рассуждение как динамический направленный ацикличный граф. Каждая вершина хранит подзапрос, действие агента, текстовое саммари и банк визуальных токенов.
Ребра фиксируют логические зависимости между шагами. Такой граф позволяет агенту отличать тупиковую ветку от новой гипотезы и не уходить в циклы повторных поисков.
🟡Поверх графа работает Graph-Modulated Visual Memory Encoding.
Бюджет визуальных токенов распределяется с учетом исходящей степени в графе, экспоненциального временного затухания (имитация забывания) и рекурсивной обратной связи от потомков.
Ключевым фрагментам достается высокое разрешение, а второстепенные кадры сжимаются или отбрасываются. Для видео задействована способность VLM привязывать содержимое к временной шкале (извлечение ключевых кадров по таймкодам).
🟡Третий компонент - Graph-GPO.
GGPO строит критический путь от корня к ответу и накладывает градиентную маску, исключая тупиковые узлы из положительных примеров, а ценные ретривы - из отрицательных.
По графикам обучения это дает более быструю сходимость, чем базовый GSPO без прунинга.
🟡Тесты
🟢VimRAG обходит Vanilla RAG, ReAct, VideoRAG, UniversalRAG, MemAgent и Mem1 на 9 бенчмарках (HotpotQA и SQuAD до SlideVQA, MMLongBench, LVBench и XVBench).
🟢На Qwen3-VL-8B-Instruct средний скор поднимается с 43,6 до 50,1, на 4B-версии - с 40,6 до 45,2.
При этом средняя длина траектории ниже, чем у ReAct и Mem1: структурированная память съедает меньше действий на ответ.
В репозитории доступны:
🟠тренировочный фреймворк VRAG-RL, демо VRAG на тестовой Qwen2.5-VL-7B-VRAG через vLLM (нужна A100 80GB);
🟠демо на API Qwen3.5-Plus через DashScope (с визуализацией DAG рассуждения и расширенным ризонингом).
Поисковый движок построен на FAISS и поддерживает эмбеддинги GVE-3B/7B и Qwen3-VL-Embedding-2B/8B. Индексировать можно изображения, PDF (через конвертацию) и нарезанное на чанки видео.
Код трейна самого VimRAG обещают выложить после внутреннего ревью Alibaba.
🟡Arxiv
🟡Модель
🖥GitHub
@ai_machinelearning_big_data
#AI#ML#RAG#VRAG#TongyiLab
🚀 20 августа 2025
Стартует RRNCB – Russian RAG Normative – Corporate Benchmark,
первый российский открытый бенчмарк для оценки RAG-решений при работе с нормативной,
правовой и технической документацией компаний.
Почему это важно?
✅ На рынке десятки RAG-решений, но нет методики и инструмента оценки и сопоставления характеристик RAG сервисов, оценить их качество очень трудно.
✅RRNCB – это первый продуктовый бенчмарк, цель которого провести комплексную оценку Retrieval augmented generation продуктов для работы с корпоративной и технической документацией.
✅ Специально создан для оценки систем, работающих с русскоязычными нормативами, кодексами, ГОСТами и корпоративными документами.
✅ Открытость и прозрачность: методики оценки и данные будут в открытом доступе.
Сравнение проходит по ключевым метрикам (ROUGE, LLM-судья, скорость, качество уточняющих вопросов).
Участие.
📋Приглашаем ИИ компании к участию в бенчмарке RRNCB со своими RAG-решениями и продуктами. Заполните заявку на участие.
В вашем распоряжении будут:
• Независимый лидерборд.
• Управление сабмитами.
• Возможность тестировать сабмиты до отправки в лидерборд.
• Разделение сабмитов на категории cloud и on-prem.
🗓Даты проведения:
Запуск: 20 августа
Регистрация RAG решений участников: до 3го сентября
Результаты: 20 сентября.
Почему стоит участвовать.
• Участие в открытом бенчмарке — это стратегическая инвестиция для владельца продукта.
Вы перестаете просто говорить, что ваш продукт «лучший». Вы доказываете это на объективных метриках в сложных, приближенных к реальности условиях. Это самый мощный аргумент для сомневающихся клиентов, который резко повышает доверие.
• Попадание в топ лидерборда — это готовый повод для PR.
• Реальные запросы и строгая оценка бенчмарка действуют как мощный стресс-тест. Выявляются проблемы, которые можно было не заметить на внутренних тестах.
• Результаты бенчмарка — это не просто цифры, а конкретные данные для вашей R&D-команды.
• Экономия ресурсов на собственном тестировании. Бенчмарк предоставляет инфраструктуру и датасеты готовыми, вместе с продуманной методологией оценки.
Подробнее о бенчмарке:https://fractalagents.ai/rrncb-rag-benchmark/
Инициатор проведения бенчмарка - ООО Аватар Машина.
#RAG#AI#RRNCB#Benchmark#ИскусственныйИнтеллект#OpenSource
#вакансия#remote#AIengineer#LLM#RAG#hiring
AI Engineer в амбициозную команду, которая строит не «очередной ИИ-инструмент», а систему, переосмысляющую принятие решений в условиях высокой неопределенности.
Проект, в который идёт найм, он не из разряда "сделаем стартап и посмотрим". Это масштабный пивот для одного из самых интересных VC-фондов с глобальным охватом.
Мы небольшая венчурная студия, которая помогает существующим компаниям резко наращивать капитализацию через точечные, но радикальные расширения и изменения, часто для переизобретения и пересборки смыслов. И когда такие изменения срабатывают, это уже не продукт, а настоящая "сюжетная арка" с эффектом hockey stick.
Сейчас как раз тот самый момент. Команда собрана. Рынок подвижен. Вопрос только в том, кто будет собирать логику новой интеллектуальной системы.
🌍 Формат: удаленно
🧠 Уровень: Middle / Senior / Deep Thinker
💸 ЗП (gross, annual): ~$55K Middle / ~$85K Senior / ~$120K Deep Thinker
📍 Гео: неважно, главное -- мышление
О проекте
На фоне всех этих DeepSeek'ов 3.1, Llama 4 (и мы еще не успели увидеть ризонинг версию), Gemini 2.5 pro/Gemma 3, GPT 4.5 и даже сильно поумневшего ChatGPT 4o, и ожидания o3/o4/GPT 5/Qwen3 и многого-многого другого, самая сложная задача всё ещё та же: понять, когда ты неправ.
Проблема не в доступе к данным, а в том, какие 5% контекста действительно важны. Всё остальное это только шум и самоуспокоение.
Мы строим не чат-бот и не дашборд. И точно не RAG на изоленте и скотче. Это интеллектуальная система, которая помогает VC и инвестиционным командам
выявлять слепые зоны, переосмысливать уверенность и точнее различать ценное и бесполезное. Она не заменяет человека, а помогает ему постоянно оставаться в тонусе. И еще иногда бьёт по самоуверенности, но очень фелигранно и аккуратно, только для повышения эффективности.
🔧 Технологический стек:
[ ] LangChain, LlamaIndex
[ ] Реализация высоконадежного Retrieval-Augmented Generation
[ ] RAG, который работает в условиях реального давления, а не в демке
[ ] Валидация источников и данных в реальном времени
[ ] Python (FastAPI, Flask, Django), OpenAI, Claude, Gemini, Grok и друзья
👀 Мы ищем человека, который:
[ ] Знает, что такое инженерия рассуждений, а не просто промпты
[ ] Понимает, что эпистемология важнее вайрфреймов
[ ] Может строить пайплайны, которые думают, а не просто индексируют
[ ] Работал с AI в чувствительных или высокоответственных системах (финансы, безопасность, анализ рисков)
Если хочется строить то, что действительно имеет значение, напиши в личку @ssmetyukh
⚡️ Китайские исследователи из Shanghai Jiao Tong и Zhejiang University представили MemOS — первую в мире "операционную систему памяти" для ИИ.
Обычные LLM быстро забывают информацию, а дообучать их — долго и дорого.
В новой работе предлагают радикально другой подход: MemOS превращает память в часть операционной системы.
🟢Память как файлы: Модель может *записывать, перемещать и удалять* знания, как будто работает с файлами, и делать это прямо во время работы, а не только на этапе обучения.
🟢MemCube — контейнер знаний: Каждое знание упаковывается в кубик с метками времени и авторства. Планировщик сам решает, где хранить этот "куб" — в тексте, GPU‑кэше или в виде маленького патча весов.
🟢Умная экономия: MemOS работает с 1500 токенами памяти, но достигает такой же точности, как если бы модель загружала весь контекст. При этом скорость — как у облегчённых моделей.
🟢Мгновенная подгрузка: На тестах с Qwen2.5‑72B переключение нужных "кубов" в кэш снижает задержку первого токена на 91.4%, *без изменения ответа*.
🟢Результаты: MemOS набрал 73.31 балла по LLM‑Judge на LOCOMO-бенчмарке — почти на 9 баллов больше ближайшего конкурента. Особенно хорошо работает на сложных задачах с несколькими шагами и временными зависимостями.
💡 Итог: память как ОС — это не просто удобно, это ускоряет модель, повышает точность и даёт контроль над знаниями.
Установка: pip install MemoryOS
🟠GitHub
🟠Проект
@ai_machinelearning_big_data
#MemoryOS#agentmemory#rag#kvcache