Post #582

@MachineLearningResearch

AML

Views67Post view count

PostedJan 101/01/2026, 06:23 PM

Post content

Рассказывают о самых важных событиях в мире Ml за прошедший год С Новым годом вас, дорогие подписачники! Языковые модели научили «‎рассуждать«» Осенью 2024 года компания OpenAI представила языковую модель o1 Вместо мгновенного ответа o1 сначала формируовала рассуждения, а потом выдавала финальный результат Механизм рассуждений позволяет моделям реже допускать фактологические ошибки, успешнее справляться с задачами, требующими долгосрочного планирования, и эффективнее работать с внешними инструментами, вроде поиска в интернете или среды выполнения кода Во многом благодаря этому LLM смогли победить в олимпиадах по программированию и по математике Появление механизма рассуждений также предложило выход из кризиса развития LLM — подробнее об этом и о рассуждающих моделях можно почитать в нашем материале, а узнать про модели DeepSeek можно здесь От чат-ботов к ИИ-агентам В этом году LLM использовали не только для чат-ботов, но и для Ml-агентов — программ, способных автономно выполнять многоэтапные задачи в цифровой среде Агент может искать информацию в интернете и выделять главное,планировать путешествия от покупки билетов до развлекательной программы, создавать сайты и приложения с нуля, готовить презентации и отчёты LLM не выполняет действия сама, а описывает, что нужно сделать При составлении обзора литературы модель генерирует команду «Совершить поиск по запросу X» Команда передаётся среде (например, браузеру), которая выполняет действие и возвращает результат в LLM для дальнейших шагов Доступные действия называют инструментами (от англ. tool), действия выполняются в среде Средой может выступать любое приложение По сути, LLM является «мозгом» агента, планирующим решение задачу и пошагово управляющим выполнение этого плана Значимость агентов — в росте продуктивности за счёт автоматизации Агенты на базе современных моделей показывают результаты, сравнимые с экспертными, во многих практических задачах Уже сейчас агенты способны использовать десятки разных инструментов, кооперироваться друг с другом и автономно работать в течение нескольких часов Восприятие LLM пользователями и их разработчиками изменилось С момента выхода ChatGPT-3.5 — первой широко известной LLM — прошло чуть больше трёх лет За это время приложение ChatGPT стало самым быстрорастущим в истории, обогнав TikTok, и вошло в повседневную жизнь сотен миллионов людей Благодаря непрерывному развитию больших языковых моделей грань между общением с человеком и чат-ботом становится всё менее заметной Пользователям важно не только какую пользу приносит LLM, но и как она взаимодействует с ними Всё больше людей воспринимает Ml-ботов как друзей, романтических партнёров или психологов Показательный пример этого сдвига — выход GPT-5 После обновления OpenAI сделала недоступной предыдущую модель GPT-4o, что вызвало волну жалоб Главное недовольство было связано с изменением стиля общения: GPT-5 отвечает более нейтрально. Некоторые пользователи описывали потерю доступа к GPT-4o как личную утрату, поскольку привыкли к её «личности» Реакция оказалась настолько сильной, что компания вернула доступ к GPT-4o Крупные разработчики LLM всё лучше осознают, что создают не просто инструмент для повышения продуктивности, а продукт, к которому люди могут эмоционально привязываться Это можно эксплуатировать для наращивания аудитории и монетизации, но безответственный подход чреват серьезными репутационными потерями Уже известны случаи, когда общение с ИИ-ботом могло привести к трагическим последствиям Другая лидирующая компания, Anthropic, в этом году начала позиционировать свою модель Claude как «Thinking Partner» — не замену человека, а помощника, наиболее эффективного в коллаборации с ним Также у компании вышло интервью со штатной профессиональной философиней, которая занимается разработкой идентичности и поведенческих паттернов Claude Более подробный обзор главных новостей читайтена сайте