TGTGInsightаналитика telegramLIVE / telegram public index
К списку каналов
Machinelearning avatar

TGINSIGHT CHAT

Machinelearning

@ai_machinelearning_big_data

Технологии

Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

Подписчики31.3万Текущее число подписчиков
Постов1,009Проиндексировано постов
Охват411,400Просмотры последних постов
Последние посты

Последние посты

Тег: #agents · 12 постов

当前筛选 #agents清除筛选

Опубликован 12 мар.

🌟ByteDance перезапустила DeerFlow. DeerFlow 2.0 - проект, переписанный с нуля, который не имеет ничего общего с первой версией. Там был фреймворк для глубокого ресерча, а здесь полноценный рантайм для агентов. 🟡В основе лежит связка LangGraph и LangChain. Главный агент получает задачу, разбивает ее на подзадачи и порождает суб-агентов на лету. Каждый из них работает в изолированном контексте: не видит данные других агентов и главного процесса. Суб-агенты запускаются параллельно, когда это возможно, и возвращают структурированные результаты, а главный агент собирает из них финальный вывод. Сессия живет в изолированном Docker-контейнере с полноценной файловой системой, главный агент и суб-агенты работают в ней совместно. Агент читает и пишет файлы, выполняет bash-команды, работает с изображениями. Между сессиями нет никакой взаимной путаницы. 🟡Навыки и инструменты Возможности агента определяются через Skills. Из коробки есть исследование, генерация отчетов, создание слайдов, веб-страниц, изображений и видео. Навыки загружаются по мере необходимости, только когда задача их требует. Это снижает нагрузку на контекстное окно и позволяет работать с моделями, чувствительными к расходу токенов. Инструменты - по той же логике: базовый набор (веб-поиск, fetch, работа с файлами, bash), плюс поддержка MCP-серверов и произвольных Python-функций. Все можно заменить или расширить. 🟡Память и контекст DeerFlow помнит пользователя между сессиями. Накапливается профиль: стиль письма, технический стек, повторяющиеся сценарии. Данные хранятся локально. Внутри длинной сессии система сама управляет контекстом: завершенные подзадачи суммируются, промежуточные результаты уходят на диск. Контекстное окно не раздувается. 🟡Интеграции Поддерживаются Telegram, Slack и Feishu. Из Claude Code можно взаимодействовать с запущенным инстансом DeerFlow напрямую через специальный skill: отправлять задачи, управлять тредами и выбирать режим выполнения. 🟡Модели и деплой Система работает с любой моделью через OpenAI API, включая локальные через Ollama. ByteDance рекомендует использовать модели, которые поддерживают длинный контекст (100k+ токенов), ризонинг, мультимодальность и надежный tool-use. DeerFlow также встраивается как Python-библиотека без запуска HTTP-сервисов: from src.client import DeerFlowClient client = DeerFlowClient() response = client.chat("Analyze this paper", thread_id="my-thread") 📌Лицензирование: MIT License. 🟡Demo 🖥GitHub @ai_machinelearning_big_data #AI#ML#Agents#DeerFlow#ByteDance

31,500 views

Опубликован 1 дек.

🚀GELab-Zero - первый полноценный open-source стек “Model + Infra” для GUI-агентов. Это открытая альтернатива закрытым системам уровня GUI Agent MCP: готовая модель, готовая инфраструктура и новый бенчмарк, собранный под реальные задачи. Что внутри: • SOTA-модель 4B - лёгкая, быстрая, запускается локально. • One-Click инфраструктура - без ADB и сложных зависимостей. • AndroidDaily - новый бенчмарк, основанный на рабочих пользовательских сценариях. Производительность: • Лучшие результаты на открытых тестах - модель обходит гораздо более крупные системы вроде GUI-Owl-32B на ScreenSpot, AndroidWorld и OSWorld. • 73.4% точности на AndroidDaily - существенно выше, чем UI-TARS-1.5 (47%), Gemini-2.5-pro-thinking (36.6%) и GPT-4o (19.6%). Идея простая: скачивайте, запускайте локально, ломайте, улучшайте. Открытый стек для GUI-агентов наконец доступен. 🟠HuggingFace: https://huggingface.co/stepfun-ai/GELab-Zero-4B-preview 🟠GitHub: https://github.com/stepfun-ai/gelab-zero 🟠Blog: https://opengelab.github.io/index.html @ai_machinelearning_big_data #AI, #Agents, #GUIAgents, #GELabZero, #OpenSource, #MachineLearning, #DeepLearning

31,400 views

Опубликован 10 нояб.

✔️Google выпустил новый 50-страничный документ о том, как создавать AI-агентов, которые реально работают в практических задачах Это понятное и структурированное введение в основы агентных систем. В гайде рассматриваются: - архитектура агента и его основные компоненты - роль LLM как «мозга» агента - подключение и использование инструментов - оркестрация нескольких агентов - подходы к деплою и продакшн-интеграции - метрики и способы оценки работы - как создаются самообучающиеся и эволюционирующие агенты - пример архитектуры AlphaEvolve 📌Гайд: https://drive.google.com/file/d/1C-HvqgxM7dj4G2kCQLnuMXi1fTpXRdpx/view @ai_machinelearning_big_data #AI#Agents#Google#LLM#MachineLearning#AIResearch

34,500 views

Опубликован 1 нояб.

🆕 Новый сильный GUI-агент: UI-Ins от TongyiLab и RUC Это модель, которая уверенно работает с мобильными интерфейсами и лучше понимает намерения пользователя. Она рассматривает команду как цепочку рассуждений, а не как одно действие, поэтому справляется со сложными задачами стабильнее. Результаты UI-Ins показал 74.1% успешных действий в AndroidWorld. Для сравнения: Gemini 2.5 Computer Use - 69.7%. То есть модель чаще правильно выполняет задачи в реальных интерфейсах. Модель: - пытается понять цель, а не только текст команды - строит несколько вариантов рассуждений - выбирает подходящую стратегию перед действием - адаптируется, если состояние приложения меняется Идет в двух версиях: 7B и 32B. Если вы работаете над агентами, которые должны нажимать кнопки, заполнять формы, открывать приложения и следовать шагам в интерфейсе - UI-Ins стоит добавить в список моделей для тестов. 🤖 UI-Ins-7B: https://modelscope.cn/models/Tongyi-MiA/UI-Ins-7B UI-Ins-32B: https://modelscope.cn/models/Tongyi-MiA/UI-Ins-32B 📄arXiv: https://modelscope.cn/papers/2510.20286 @ai_machinelearning_big_data #AI#Agents#GUI#MobileAgents#AndroidWorld#LLM

39,700 views

Опубликован 3 окт.

⚡️ Релиз Agent S3 - продвинутый агент для работы с компьютером, который приближается к человеческому уровню. Вместо того, чтобы усложнять одну модель, авторы запускают несколько агентов параллельно и затем выбирают лучший результат. Метод назвили **Behavior Best-of-N (bBoN). Как работает: - Каждый агент пробует решить задачу. - Его действия переводятся в поведенческий нарратив - короткое описание, что реально изменилось на экране. - Специальный судья сравнивает эти нарративы и выбирает лучший. Результаты: - GPT-5 с 10 параллельными агентами → 69.9% успеха - Для примера у GPT-5 Mini → 60.2% - Agent S3* набирает на +10% выше предыдущей SOTA 📄Paper: http://arxiv.org/abs/2510.02250 💻Code: http://github.com/simular-ai/Agent-S 📝Blog: http://simular.ai/articles/agent-s3 @ai_machinelearning_big_data #AI#Agents#AgentS3#OSWorld#SimularAI#LLM

31,600 views

Опубликован 25 сент.

🤖 Kimi представила новый агентный режим OK Computer Что он может: ✨ Генерирует сайты, дашборды приложения и презентации ✨ Работает с файлами, браузером и терминалом ✨ Большой встроенный набор инструментов K2 получил полезный агентский функционал. 🟢Попробовать: https://kimi.com @ai_machinelearning_big_data #AI#Agents#Kimi#K2#OKComputer

36,300 views

Опубликован 13 сент.

🧠 mem-agent — агент с памятью в стиле Obsidian Лёгкая LLM-модель, которая умеет хранить знания в человеко-читаемой памяти (Markdown-файлы) и использовать их для ответов. Агент не просто отвечает на запросы, а действительно «помнит» факты и обновляет их по ходу работы. Это агент на 4B с локальной, совместимой памятью для Claude, ChatGPT и LM Studio. Как работает память: - Вся информация лежит в Markdown: memory/user.md и отдельные файлы для сущностей. - Связи между файлами сделаны как в Obsidian: [[entity]]. - Агент может извлекать факты, обновлять их или задавать уточняющие вопросы, если запрос неполный. Вместо огромных контекстов и упора в лимиты, Mem-Agent извлекает нужные фрагменты из локальных документов, сжимает их и передаёт агенту. Как обучали: - Базовая модель: Qwen3-4B-Thinking-2507. - Использовали метод онлайн-RL (GSPO). - Тестировали на md-memory-bench. Результаты: - mem-agent уверенно решает задачи памяти, близко к уровню больших моделей. - Даже в сжатых версиях (4-bit и 8-bit) сохраняет почти то же качество. Чем хорош: - Память можно читать и редактировать вручную. - Агент работает быстро и эффективно, даже в маленьком размере. - Удобен как компонент в более крупных системах (например, через MCP). 🟠Model: https://huggingface.co/driaforall/mem-agent 🟠Blog: https://huggingface.co/blog/driaforall/mem-agent 🟠Repo: https://github.com/firstbatchxyz/mem-agent-mcp @ai_machinelearning_big_data #LLM#AI#Agents#MemAgent#Dria#MCP#LocalAI

36,900 views

Опубликован 3 сент.

🔥 Бесплатная книга от инженера Google — Agentic Design Patterns 400 страниц про всё, что нужно знать об агентных системах. Автор — senior engineer в Google, выложил драфт для открытого ревью. 📖 В книге: - продвинутые техники промптинга - паттерны для мульти-агентов - использование инструментов и MCP - практические примеры с кодом ⚡ По сути, это полный справочник по построению умных агентов. Must-read для разработчиков AI. 📚Читать @ai_machinelearning_big_data #AI#Agents#Google#OpenSource#freebook

55,800 views

Опубликован 21 авг.

📌Как создавали RL-агент AutoGLM-OS, который выбил SOTA на OSWorld, обогнав OpenAI и Anthropic. Автономные агенты, способные управлять рабочим столом - это Грааль современного HCI. Но их обучение сопряжено с трудностями: GUI созданы для людей, а не для машин, а масштабирование RL упирается в неэффективность и нестабильность сред. В Z.ai сделали фреймворк COMPUTERRL, который лег в основу агента AutoGLM-OS. Результат - state-of-the-art на бенчмарке OSWorld: 48.1% успешных выполнений и это лучше, чем у OpenAI CUA 03 (42.9%), UI-TARS-1.5 (42.5%) и Claude 4.0 Sonnet (30.7%). OSWorld — это крупный бенчмарк из 369 заданий для проверки многомодальных ИИ-агентов в реальных условиях. Он работает в Ubuntu, Windows и macOS. В нем ИИ выполняет открытые задачи: работает с веб- и десктопными приложениями, управляет файлами, запускает процессы. Каждое задание имеет четкие начальные условия и скрипты для оценки, чтобы результаты можно было воспроизвести. Такие высокие показатели - результат комбинации 3-х инноваций. 🟡Новая парадигма взаимодействия API-GUI. Фреймворк объединяет GUI-взаимодействия с быстрыми и точными API-вызовами образуя систему, которая через LLM автоматически анализирует примеры задач, генерирует необходимый API-код для стандартных приложений Ubuntu и даже создает для него базовые тесты. Таким образом, агент использует быстрые API там, где это возможно, и переключается на GUI для общих задач, что повышает и скорость, и надежность. Абляция показала, что переход от GUI-only к API-GUI поднимает средний показатель успеха с 11.2% до 26.2%. 🟡Масштабируемая распределенная RL-инфраструктура. OSWorld крайне ресурсоемок, и запуск множества его экземпляров на одном узле это тот еще квест. Z.ai полностью переработали эту среду, используя qemu-in-docker для легковесного развертывания VM, gRPC для связи между узлами и полностью асинхронный фреймворк AgentRL. Это позволило создать кластер из тысяч параллельных виртуальных сред, к котором онлайн-обучение RL-агентов стало максимально эффективным. 🟡Стратегия обучения Entropulse. Entropulse решает проблему коллапса энтропии, чередуя фазы RL с периодическими сессиями SFT. Во время RL-фазы собираются все успешные траектории, и на их основе формируется новый SFT-датасет. Затем модель дообучается на этом датасете, что позволяет восстановить её исследовательскую способность без потери производительности. После этого запускается вторая, более эффективная фаза RL. Эта стратегия позволила AutoGLM-OS, построенному на базе 9B GLM-4, достичь финального результата в 48.1%, в то время как после первой RL-фазы показатель был 42.0%. 🟡Arxiv @ai_machinelearning_big_data #AI#ML#Agents#AutoGLM#Zai

34,500 views

Опубликован 17 авг.

📌Подборка материалов по оптимизации агентных систем. Awesome-Self-Evolving-Agents - подборка материалов по теме оптимизации агентов в концепции саморазвивающихся систем, в которой собраны работы с 2023 по 2025 год по 3-м направлениям: оптимизация одиночного агента, оптимизация мультиагентных систем и методы их оценки. Содержание 🟡Оптимизация одного агента 🟢Оптимизация поведения LLM 🟢Оптимизация промпта 🟢Оптимизация памяти 🟢Инструменты 🟡Мультиагентная оптимизация 🟡Оценка 🟠LLM-судья 🟠Агент-судья 🟠Безопасность и элайнмент саморазвивающихся агентов @ai_machinelearning_big_data #AI#ML#LLM#Agents#AwesomeList#Github

27,900 views

Опубликован 9 июл.

🌟NXTscape: браузер с локальными ИИ-агентами для Mac. NXTscape - опенсорсный браузер для Mac OS на базе Chromium, где ИИ-агенты работают у вас на устройстве, а не в облаке ИТ-гигантов. Самое важное: ключи API, история и данные никогда не покидают локальную систему. Подключаете OpenAI, Anthropic или локальные модели через Ollama и автоматизируете рутину действий в интернете. Проект прост в переходе с Chrome: миграция занимает пару кликов, все расширения работают, его код открыт, можно форкнуть или проверить каждую строчку. В планах на будущее: MCP Store, магазин ИИ-агентов, в нем обещают запуск прямо из адресной строки. Плюс встроенный ИИ-блокировщик рекламы, который планируют сделать умнее аналогов. Теперь ваши 70+ вкладок могут управляться агентами, а не вы ими, достаточно скачать стабильный релиз с Github. 📌Лицензирование: AGPL-3.0 License. 🟡Сообщество в Discord 🖥GitHub @ai_machinelearning_big_data #AI#ML#Agents#Github#NXTscape

32,500 views

Опубликован 30 июн.

🌟Self-Hosted AI Package: комплексное решение для локального развертывания ИИ. Self-Hosted AI Package - это готовый шаблон на основе Docker Compose, который позволяет быстро развернуть полнофункциональную локальную среду с использованием ИИ и low-code инструментов. Основная цель проекта: предложить разработчикам удобный и быстрый способ для начала работы с локальными ИИ-системами. ✔️ Поддерживаемые инструменты и сервисы: 🟢Self-hosted n8n - Low-code платформа с более 400 вариантами интеграций; 🟢Supabase - База данных с открытым исходным кодом, популярная для агентов ИИ; 🟢Ollama - кросс-платформенный бэкэнд для локального запуска LLM; 🟢Open WebUI - ChatGPT-подобный интерфейс для взаимодействия с моделями и агентами n8n; 🟢Flowise - No/low code конструктор ИИ-агентов, который очень хорошо сочетается с n8n; 🟢Qdrant - Высокопроизводительное векторное хранилище с открытым исходным кодом и обширным API. 🟢Neo4j - Движок для создания графов знаний, на котором работают GraphRAG, LightRAG и Graphiti. 🟢SearXNG - Метапоисковая система с открытым исходным кодом, объединяющая результаты с 229 поисковыми сервисами; 🟢Caddy - Управляемый HTTPS/TLS для пользовательских доменов; 🟢Langfuse - Инженерная платформа с открытым исходным кодом для наблюдаемости агентов. Проект активно развивается, авторы даже запустили публичную Kanban-доску, где отслеживаются внедрение новых функций и исправление ошибок. ⚠️ Перед запуском служб необходимо настроить переменные окружения для Supabase, следуя их руководству. ⚠️ Основным компонентом набора является файл docker compose, предварительно сконфигурированный с сетью и диском, поэтому больше ничего устанавливать не нужно. После установки нужно будет выполнить действия из Quick start and usage, чтобы начать работу. ▶️Установка: # Clone repo git clone -b stable https://github.com/coleam00/local-ai-packaged.git cd local-ai-packaged # For Nvidia GPU python start_services.py --profile gpu-nvidia # For AMD GPU users on Linux python start_services.py --profile gpu-amd # For Mac Run fully on CPU python start_services.py --profile cpu #For everyone else python start_services.py --profile cpu 📌Лицензирование: Apache 2.0 License. 🖥GitHub @ai_machinelearning_big_data #AI#ML#Agents#Github

18,800 views