TGTGInsightаналитика telegramLIVE / telegram public index
К списку каналов
Machinelearning avatar

TGINSIGHT CHAT

Machinelearning

@ai_machinelearning_big_data

Технологии

Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

Подписчики31.3万Текущее число подписчиков
Постов1,009Проиндексировано постов
Охват336,000Просмотры последних постов
Последние посты

Последние посты

Стр. 63 из 85 · 1,009 постов

Опубликован 16 сент.

🚨 Очень интересная идея в новой работе Google DeepMind - как справиться с ростом ИИ-агентов, которые начинают действовать как самостоятельные игроки в экономике. Если оставить процесс без контроля, такие агенты могут создать собственную экономику, напрямую связанную с человеческой. Это сулит и выгоды, и риски. Авторы предлагают концепцию «песочницы» (sandbox economy) - контролируемого пространства, где агенты могут торговать и координироваться, не нанося вреда рынкам. Вместо выполнения одной задачи, такие агенты могут: ▪ торговать, вести переговоры и заключать сделки без участия человека, ▪ переключаться между индустриями, формировать временные альянсы, ▪ координировать ресурсы в реальном времени. Первые стандарты вроде Agent2Agent и Model Context Protocol уже соединяют агентов между собой, закладывая основу глобальной экономики «машина-машина». Персональные AI-ассистенты вскоре смогут конкурировать и сотрудничать на этих рынках: торговаться за вычислительные мощности, доступ к данным или бронирование поездок - всё в интересах пользователей. Расчёты будут обеспечиваться цифровыми валютами и системами кредитов. 🟢Экономисты предупреждают: такие рынки будут развиваться быстрее человеческой реакции. Цены, сделки и бизнес-модели могут меняться не за месяцы, а за минуты. 🟢Предложения авторов - Использовать рынки и аукционы для честного распределения ресурсов. ▪Вводить миссионные цели — коллективные задачи, согласованные обществом. ▪Создавать систему удостоверений и репутации для агентов. ▪Применять смарт-контракты, аудит и прозрачные вычисления для доверия и контроля над ии. ▪Разрабатывать гибридное регулирование - сочетание технических протоколов и институциональных мер. Если внедрение будет продумано, триллионы машинных часов можно будет направить на решение глобальных задач - от лечения болезней до строительства инфраструктуры. ⚡️Статья: https://arxiv.org/pdf/2509.10147 @ai_machinelearning_big_data #AI#AgentEconomy#DeepMind#AutonomousAgents

25,900 views

Опубликован 16 сент.

✔️ OpenAI выпустила Codex-CLI 0.36 с новым GPT-5-Codex Теперь система динамически выбирает время «размышлений»: на простые запросы отвечает почти мгновенно, а на сложных проектах может работать часами — вплоть до 7 часов подряд, выполняя рефакторинг, исправляя ошибки и доводя решение до финала. Одним из главных нововведений стала функция codex resume, позволяющая возобновлять старые сессии. Также обновили интерфейс: появилось анимированное онбординг-руководство, улучшены отображение статусов и обработка прерываний. Важным изменением стала и новая система авторизации с более надёжной работой API-ключей и кастомных провайдеров. По производительности GPT-5-Codex показывает заметный скачок. На бенчмарке SWE-bench модель набирает 74,5%, обгоняя GPT-5 high. На внутренних тестах по рефакторингу результат вырос с 34% до 51%, что говорит о серьёзном улучшении качества работы с большими кодовыми базами. OpenAi ✔️ Релиз TimesFM 2.5 от Google Google Research представила TimesFM 2.5 — обновлённую версию Time Series Foundation Model для прогнозирования временных рядов. В версии 2.5 разработчики улучшили точность по сравнению с 2.0 и значительно расширили максимальную длину контекста, что позволяет обрабатывать более сложные и длинные временные зависимости. Особое достижение — первое место в рейтинге GiFT-Eval: TimesFM 2.5 заняла лидирующую позицию сразу по всем метрикам среди zero-shot foundation-моделей, подтвердив статус одной из самых точных систем для анализа временных рядов. Github ✔️ OpenAI и Anthropic: инструменты используются по-разному и приносят разные результаты Согласно новому анализу от TipRanks, компании OpenAI и Anthropic показали, что их ИИ-инструменты применяются в существенно разных контекстах — и дают разные эффекты. OpenAI в основном используется для создания контента, разработки кода и поддержки творческих задач, где гибкость и масштабируемость — ключевые аргументы. Его модели помогают пользователям генерировать текст, автоматизировать рабочие процессы и решать задачи, требующие воображения и нестандартного подхода. Anthropic, напротив, чаще применяют в областях, где особенно важны точность, контроль бессознательных смещений и высокая надёжность — например, в юридических, медицинских или регулируемых средах. В таких сценариях делают упор на безопасность, на минимизацию ошибок и на возможность аудита и объяснений того, как пришёл к решению ИИ. Отчёт подчёркивает: разные компании и пользователи выбирают OpenAI или Anthropic не просто на основе производительности, но и в зависимости от ценностей — что важнее: скорость и творческий потенциал или строгие гарантии и прозрачность. Эксперты TipRanks полагают, что оба подхода — сильны в своих нишах. Поскольку спрос на ИИ-решения растёт, смешанные и гибридные модели применений, вероятно, станут всё более популярными: когда часть задач решается с помощью гибкого и креативного ИИ, а часть — с помощью инструментов повышенной эмпатии и осторожности. Отчет ✔️ Reve выпустили свой нейрофотошоп Reve представили AI-редактор изображений, который уже окрестили «текстовым фотошопом». В отличие от конкурентов, здесь почти нет цензуры, а ограничения на генерацию трудно заметить. Функция Image creator & remixer позволяет создавать и перерабатывать изображения на основе текстовых подсказок. Интерактивный drag-and-drop редактор даёт возможность перемещать, масштабировать и изменять объекты прямо мышкой — так, как в привычных графических редакторах. Вместо стандартного поля для ввода появился чат-ассистент, превращающий взаимодействие в диалог, что облегчает настройку и доработку картинок. Reve ✔️Alphabet впервые достигла рыночной капитализации в $3 трлн Компании Alphabet, материнской структуры Google, впервые удалось преодолеть отметку в $3 трлн стоимости на бирже. Акции выросли на 4 % на фоне судебного решения по антимонопольному делу, по которому не потребовалось разделение бизнеса (Chrome и Android). Сильный рост показали облачная служба и заинтересованность инвесторов в AI-продуктах, особенно модели Gemini. Новость @ai_machinelearning_big_data #news#ai#ml

28,700 views

Hashtags

Опубликован 15 сент.

🚀Совет, который спас OpenAI: “Всегда делай API” В первые годы OpenAI балансировала на грани: фундаментальные модели становились всё дороже, а продукта, который мог бы оплачивать эти расходы, так и не появлялось. GPT-3 выглядел впечатляюще, но в реальности был слишком «сырой», чтобы построить вокруг него работающий сервис. Сэм Альтман вспоминает: «Я поднимал градус срочности - нам нужен был продукт, а идей не было». И тогда в памяти всплыл совет Пола Грэма, основателя Y Combinator: 👉«Всегда делай API. Что бы ни происходило - сделай API. Хорошие вещи придут сами». OpenAI без особых ожиданий открыла доступ к GPT-3 через API. «Может, кто-то найдёт применение», - подумали в компании. И действительно: первыми успехами стали сервисы для копирайтинга - Jasper, Copy.ai. Но самое любопытное оказалось в другом: часть пользователей начинала просто разговаривать с моделью часами напролёт. Это не было мейнстримом, но сигнал оказался настолько сильным, что команда поняла — вот он, настоящий продукт. 📅 30 ноября 2022 года OpenAI запустила ChatGPT как «исследовательский превью» на базе GPT-3.5. Всего за 5 дней им воспользовались более миллиона человек. 🔥 Из скучного API родился продукт, который изменил представление об искусственном интеллекте. И всё началось с одного простого совета. @ai_machinelearning_big_data #OpenAI#СэмАльтман#ChatGPT#стартапы

29,800 views

Опубликован 15 сент.

⚡️Александр Мордвинцев, исследователь из Google, создал цифровые системы на основе клеточных автоматов, где каждая клетка взаимодействует только со своими соседями. Эти нейронные клеточные автоматы (Neural Cellular Automata) способны самособираться в заданные формы и даже восстанавливаться после повреждений. В *Quanta Magazine* рассказали о том, как учёные научились обучать искусственные "клетки" собираться в заданные формы. Это похоже на игру «Жизнь» (*Game of Life*), но наоборот. 🧩 Что такое Game of Life? Это простая компьютерная модель: есть сетка из клеток, у каждой клетки всего два состояния — «жива» или «мертва». Жизнь клетки зависит от соседей (например, если вокруг слишком много соседей, клетка умирает). Обычно мы задаём правила и просто смотрим, что получится. А теперь учёные сделали наоборот: сначала задаём цель (например, фигуру), а потом подбираем правила так, чтобы клетки сами в неё собрались. ⚙️ Что изменили учёные? 1. Непрерывные состояния - клетка не просто «вкл/выкл», а может быть наполовину активна. Это как лампочка с плавным регулятором яркости. 2. Скрытые переменные - у каждой клетки есть «внутренние параметры», которые влияют на её поведение. Представь, что у клетки есть «настроение» или «память», которое не видно исследователю напрямую. 3. Асинхронное обновление — клетки меняются в случайное время, а не все сразу. Это ближе к реальной жизни, где всё развивается не идеально синхронно. 💡 Зачем это нужно? - Восстановление после повреждений: если часть фигуры «сломать», клетки могут достроить её заново. - Децентрализация: нет главного управляющего - каждая клетка действует локально, но вместе они формируют систему. - Устойчивость к шуму: клетки учатся справляться с хаосом и случайностями, а не просто повторяют выученный рисунок. 🟠Какие есть ограничения? - Пока это работает для картинок и форм, но не для сложных живых организмов. - Чтобы система умела «регенерировать», её нужно специально тренировать. - Перенести эту идею в настоящие биологические клетки или роботов сложно — там много физических ограничений. 🟠 Где это можно применить? - Медицина - модели самовосстановления тканей. - Робототехника - рой роботов, которые без команды сверху сами собираются в нужную конструкцию. - Материалы будущего — «умные» кирпичики или детали, которые сами подстраиваются под окружение. - Новые вычислительные системы - компьютеры без центрального процессора, где решения рождаются распределённо. Учёные показали, что нейронные клеточные автоматы можно рассматривать как модель эволюции: геном не задаёт форму напрямую, а запускает процесс её построения, что делает системы гибкими и адаптивными. Главное отличие от природы в том, что эволюция не имеет цели, а автоматы обучают под задачу. Эти модели предлагают новый тип вычислений: каждая клетка взаимодействует только с соседями, что делает архитектуру распределённой и потенциально энергоэффективной. Уже есть впечатляющие результаты — от распознавания цифр и умножения матриц до решения задач вроде IQ-тестов и управления роями роботов, которые начинают вести себя как единый организм. В итоге работы Мордвинцева соединяют биологию, компьютеры и робототехнику, возвращая к идее, что жизнь и вычисления — две стороны одного процесса. 🟢 Полная статья: https://www.quantamagazine.org/self-assembly-gets-automated-in-reverse-of-game-of-life-20250910/ @ai_machinelearning_big_data #evolution#machinelearning#neuralnetworks#biology

29,800 views

Опубликован 14 сент.

🤖 Robbyant R1 — конкурент Tesla Optimus из Китая Ant Group показала своего первого гуманоида - R1. Это двуручный робот на колёсах, созданный для реальной работы: от готовки до экскурсовода. ⚙️Характеристики: - вес — 110 кг - рост — 1.6–1.75 м - скорость — до 1.5 м/с - 34 степени свободы 🛠Особенность подхода Ant не просто продаёт робота, а сразу упаковывает его в готовые сценарии для применения: «железо + софт + инструменты + сервисные команды». Это снижает сложности внедрения и обслуживания. Разрабы показали демку, как R1 готовит еду и водит экскурсии. Первые внедрения — например, в историческом музее. 🧠 За интеллект отвечает Bailing LLM - 300B mixture-of-experts модель, которая планирует действия для физического тела работа. Обучение идёт в симуляции, а затем переносится в реальный мир. Главная проблема таких роботов остаётся прежней: надёжный и безопасный embodied AI, который сможет справляться с хаотичными ситуациями - от грязной кухни до неожиданных взаимодействий с людьми. Ant Group вошла в гонку за роботов нового поколения, где уже играют Unitree и Tesla. @ai_machinelearning_big_data #ai#robots

26,900 views

Hashtags

Опубликован 14 сент.

📌xAI уволила 500 универсальных аннотаторов и вместо них в 10 раз увеличивает число специализированных AI-туторов. xAI меняет стратегию обучения Grok. Вместо сотен универсальных аннотаторов компания делает ставку на специалистов-экспертов и увеличивает их команду в 10 раз. Это означает переход от широкой разметки «на все темы» к глубокой проработке сложных областей — математики, кода, финансов и безопасности. 👉 Grok постепенно перестаёт быть универсальным чат-ботом и превращается в экспертного ассистента, ориентированного на критические задачи, где особенно важна точность и надёжность. Плюс - рост качества там, где ошибки недопустимы. Минус - возможное снижение качества в бытовых и повседневных темах. 🟠Источник: Business Insider businessinsider.com/elon-musk-xai-layoffs-data-annotators-2025-9 🟠Вакансия в Х: https://x.com/i/jobs/1845336351098667008 @ai_machinelearning_big_data #xAI#Grok#AI#DataAnnotation#AITutors#ElonMusk

26,300 views

Опубликован 13 сент.

🧠 mem-agent — агент с памятью в стиле Obsidian Лёгкая LLM-модель, которая умеет хранить знания в человеко-читаемой памяти (Markdown-файлы) и использовать их для ответов. Агент не просто отвечает на запросы, а действительно «помнит» факты и обновляет их по ходу работы. Это агент на 4B с локальной, совместимой памятью для Claude, ChatGPT и LM Studio. Как работает память: - Вся информация лежит в Markdown: memory/user.md и отдельные файлы для сущностей. - Связи между файлами сделаны как в Obsidian: [[entity]]. - Агент может извлекать факты, обновлять их или задавать уточняющие вопросы, если запрос неполный. Вместо огромных контекстов и упора в лимиты, Mem-Agent извлекает нужные фрагменты из локальных документов, сжимает их и передаёт агенту. Как обучали: - Базовая модель: Qwen3-4B-Thinking-2507. - Использовали метод онлайн-RL (GSPO). - Тестировали на md-memory-bench. Результаты: - mem-agent уверенно решает задачи памяти, близко к уровню больших моделей. - Даже в сжатых версиях (4-bit и 8-bit) сохраняет почти то же качество. Чем хорош: - Память можно читать и редактировать вручную. - Агент работает быстро и эффективно, даже в маленьком размере. - Удобен как компонент в более крупных системах (например, через MCP). 🟠Model: https://huggingface.co/driaforall/mem-agent 🟠Blog: https://huggingface.co/blog/driaforall/mem-agent 🟠Repo: https://github.com/firstbatchxyz/mem-agent-mcp @ai_machinelearning_big_data #LLM#AI#Agents#MemAgent#Dria#MCP#LocalAI

36,900 views

Опубликован 13 сент.

🖥 Nvidia меняет стратегию и уходит от универсальных GPU. Теперь каждый чип будет заточен под конкретный этап LLM-инференса. Инференс делится на два шага: - Prefill - первая стадия. Требует огромной вычислительной мощности, но почти не использует память. - Decode - вторая стадия. Наоборот, сильно нагружает память, но вычислений нужно меньше. Раньше, например, R200 объединял в одном GPU и мощные вычислительные блоки, и много памяти. В итоге это было дорого и неэффективно: - при Prefill простаивает память, - при Decode — простаивают вычислительные блоки. 🟢Новый подход Nvidia — разные GPU под разные задачи: - Rubin CPX - оптимизирован для Prefill • 20 PFLOPS вычислений • 128 GB GDDR7 • 2 TB/s пропускная способность - R200 — GPU под Decode • 288 GB HBM4 • 20.5 TB/s памяти 📆 Планы компании: - **2024–2025**-— линейка Blackwell (B200, GB300): рост вычислений и памяти. - 2026–2027 - Rubin разделится: • VR200 — для Decode (максимум HBM). • CPX — для Prefill (много вычислений, дешёвая память). - 2027 — VR300 Ultra: 66.7 PFLOPS и 1024 GB HBM4E. Nvidia перестраивает линейку так, чтобы каждый GPU работал максимально эффективно именно под свой этап инференса. #Nvidia#GPU#AI#Blackwell#Rubin#LLM

26,000 views

Опубликован 13 сент.

📕 Свежий гайд от Anthropic: Writing effective tools for agents — with agents Anthropic описывает, как правильно создавать инструменты (tools) для AI-агентов: так, чтобы они были максимально полезными, эффективными и надёжными. Особый акцент сделан на том, как использовать самих агентов для прототипирования, тестирования и оптимизации инструментов. Как писать эффективные инструменты для агентов - Делай быстрые прототипы и сразу проверяй, как агент с ними работает. - Тестируй на реальных сценариях, а не на абстрактных примерах. - Анализируй логи и поведение агента, чтобы находить ошибки и непонятные места. - Избегай дублирования: один инструмент должен выполнять одну чёткую задачу. - Используй понятные имена и структуры (`machinelearning_create_task`, `mla_list_users`). - Возвращай только нужные данные, не перегружай ответ лишним. Добавляй фильтрацию и пагинацию. - Пиши описания так, чтобы их понял даже человек, который не в теме: чётко, без двусмысленностей, с примерами входа и выхода. Что это дает: - Улучшает способность AI-агентов решать реальные задачи. - Минимизирует ошибки: неверное использование инструментов, лишние токены, избыточные вызовы. - Повышает надёжность и предсказуемость поведения агентов. - Упрощает масштабирование — добавление новых инструментов и задач. 🟠Полный гайд:https://www.anthropic.com/engineering/writing-tools-for-agents @ai_machinelearning_big_data #Anthropic#claude#aiagents#ai

25,900 views

Опубликован 13 сент.

⚡️В Москве прошла Big Tech Night — квартирник для разработчиков, инженеров и исследователей. Сбер стал ключевым партнёром и одним из самых активных участников. Хард-трек открыл Андрей Белевцев, старший вице-президент, руководитель блока «Технологическое развитие» Сбера. Он рассказал про последние тренды в генеративном искусственном интеллекте, Top of Mind-решения для бизнеса на основе GigaChat и AI-инструменты для разработчиков. А после — самое главное: живое общение! 🤝 До самого вечера гости нетворкили, спорили об AI-агентах и архитектуре интеллектуальных систем. Говорили по душам — о профессии, культуре и о том, о чём обычно молчат в презентациях.

23,200 views

Опубликован 12 сент.

🖥HunyuanImage 2.1 теперь доступна в квантизованной версии! Это text-image модель, которая может генерировать изображения в 2K. Теперь модель можно запускать локально. Для этого необходимо минимум 24GB VRAM. 🟢Hugging Face: https://huggingface.co/tencent/HunyuanImage-2.1) 🟢Подробнее про модель: https://t.me/machinelearning_interview/2161 @ai_machinelearning_big_data #AI#HunyuanImage#StableDiffusion#ImageGeneration

26,900 views

Опубликован 12 сент.

⚡Speculative Cascades — как ускорить работу LLM Google Research придумали новый способ сделать большие языковые модели быстрее и дешевле. Что это такое: 🔹Каскады Сначала отвечает маленькая модель. Если задача слишком сложная - подключается большая. Так экономятся ресурсы, но качество может прыгать. 🔹Спекулятивная декодировка Маленькая модель угадывает сразу несколько слов вперёд. Большая быстро проверяет данные и подтверждает. Скорость выше, но большая модель всё равно тратит много ресурсов. 🟢Speculative Cascades Это комбинация: маленькая модель иногда отвечает полностью сама, а иногда используется как ускоритель для большой. В итоге получаем меньше затрат, больше скорости и то же качество. 🔥Что показали тесты (тестили на Gemma, T5): - быстрее, чем обычная спекулятивная декодировка - дешевле и качественнее, чем каскады - удобнее настраивать баланс «скорость ↔ качество» При том же уровне качества, что и у спекулятивной декодировки, новый метод работает быстрее (генерирует больше токенов за один вызов большой модели). А в задачах математических рассуждений получен явный апгрейд по скорости при сохранении или даже улучшении качества. LLM всё чаще используются в поиске, чатах, ассистентах. Чтобы они реально были полезными, их нужно ускорять и удешевлять. *Speculative cascades* помогают это сделать без потери качества. 🔗Подробнее: https://research.google/blog/speculative-cascades-a-hybrid-approach-for-smarter-faster-llm-inference/ @ai_machinelearning_big_data #AI#LLM#Inference#SpeculativeDecoding#Cascades#GoogleResearch

29,700 views
12•••5•••10•••15•••20•••25•••30•••35•••40•••45•••50•••55•••606162636465•••70•••75•••80•••8485