Митап про ИИ и машинное обучение — VK Education Talks
Эксперты VK помогают Илье Куручу разобраться в основах ML — комик слушает лекции и сдает экзамен.
Из видео вы узнаете какими бывают задачи классификации и методы решения, как оценить качество построенной модели, а также где и чему учиться, чтобы стать ML-специалистом.
Перейти к просмотру
#видео#ИИ
Задачи для тестирования способностей ИИ в математике заканчиваются.
Теперь для тестирования дают реальные научные проблемы и там пока 0% решёных задач – такие бенчмарки мы любим.
Epoch.AI (это своего рода НИИ изучения ИИ;) год за годом увеличивал сложность экзаменов для проверки способностей GPT к математике. Бенчмарк FrontierMath дошёл до Tier 4, где модели решают исследовательские математические задачи. Но вместо ожидаемого Tier 5 Epoch выпустил трек Open Problems.
Что это:
— Задачи, которые не решены профессиональными математиками
— Выбраны такие, в которых можно автоматически проверить решение
— Если какая-то модель их решит — это не просто спортивный результат, это реальный вклад в науку
Текущий статус (январь 2026):
— Tier 4: решено 17 из 48 задач
— Open Problems: пока 0 решений
Следующими за математикой будут алгоритмы и информатика, а потом посыпятся и все остальные науки
epoch.ai/frontiermath
#ИИ
99% проблем с Cursor и Claude Code — это Windows!
Консультирую людей по AI-инструментам и вижу закономерность. Проблемы с установкой Cursor, Claude Code возникают на этапах:
– Оплата зарубежных сервисов (нет карты)
– VPN (медленный, нестабильный, или вообще нет)
– Windows (король проблем, начиная от кодировок в Powershell и заканчивая еще тысячей мелочей)
База: Mac + нормальный VPN + способ оплаты (виртуальная карта, криптокарта).
С таким пакетом всё работает из коробки.
#ИИ
Per-Seat не эффективен.
SaaS-бизнесу надо срочно найти новую модель монетизации
Классический SaaS построен на формуле:
$50/юзер × 100 сотрудников = $5,000 выручки
Что происходит при внедрении AI-агентов:
— Компания сокращает штат со 100 до 5 операторов
— Операторы управляют роем ботов
— $50 × 5 = $250 выручки (–95%)
Для SaaS-вендора это катастрофа. Ценность продукта выросла (работа 24/7, быстрее), а выручка упала.
Выход: перестать брать деньги за людей, начать брать за выполненную работу.
Брать деньги не за дрели, а за дырки, если следовать классической аналогии
Смена модели уже идёт:
— Salesforce запустил Agentforce с usage-based pricing
— GitHub Copilot переходит на оплату за completions
— Intercom тестирует per-resolution модель
2026 — год пересборки SaaS-экономики. Кто не адаптируется — рискует потеряет рынок.
#ИИ
Минимальный ИИ-стек
для личного использования
в 2026 году
Четыре основных экосистемы, из которых надо выбирать:
– ChatGPT (+Sora, Codex, Image 1.5)
– Claude (+Claude Code)
– Gemini (+NotebookLM, nano-banana, Veo. Лучший выбор на сегодня и по качеству и по количеству включённых инструментов, но слабо доступен в России)
– Perplexity (лучший выбор в России, потому что доступен без VPN и имеет весь необходимый функционал)
Входной билет: 20 долларов в месяц
Инструменты для продвинутых:
– Cursor — работа с ИИ + кодинг. Пробовать можно бесплатно. Нормальный объём 20 долларов в месяц
– n8n — автоматизация и свои сервисы в облаке. Может быть ненужен при уверенном владении Cursor
– Gamma — презентации. Пока незаменим, но планируем отказаться от него в пользу генерации фронтенд-инструментами
LLM — это новая операционная система. Выбор конкретной системы так же не критичен как выбор между iOS и Android, но споры будут продолжаться бесконечно)
#ИИ
Лучший язык программирования для Агентов
Сейчас это почти всегда Python или Node.js из-за их массовости в обучающих выборках. Но на деле нейросети неплохо пишут на чем угодно.
При этом есть наблюдение, что ИИ лучше всего помогает там, где код изначально был понятным. Коротким и лаконичным, чтобы не забивать контекст и не отвлекать внимание модели лишними деталями.
В эту концепцию идеально ложатся Ruby on Rails:
– Краткость: меньше токенов, меньше мусора в контексте.
– Convention over Configuration: жесткие договоренности языка снижают число вариантов, модели не нужно «угадывать».
– Domain-first: код читается как описание бизнес-задачи.
– Плотность смысла: высокая информативность при минимуме символов. «Болтливость» языка сегодня стоит дорого, буквально, в токенах.
Но оптимальность НЕ РАВНО популярность.
Мой прогноз: В 2026 году появится новый язык программирования, нативно оптимизированный под ИИ. Не только на уровне синтаксиса, но и на уровне развёртывания:
— код сразу с тестами, логами и деплоем;
— встроенная интеграция в CI/CD;
— domain-first подход.
Имхо, высока вероятность, что создателем станет Microsoft (им есть что переписывать, кстати;), а экосистема будет построена вокруг GitHub.
#ИИ
GPT-5.2 Pro подступает к решению задач исследовательского уровня по математике
Ребята из Epoch.AI (занимается изучением развития ИИ) протестировали GPT-5.2 Pro на FrontierMath Tier 4.
Результат: 14 решённых задач из 48.
– Tier 4 появился полгода назад, потому что на первых трёх уровнях сложности модели уже дошли почти до максимума
– Tier 4 — это задачи исследовательского уровня, над которыми работают профессиональные математики. Задачи ещё не опубликованы — модели не могли на них обучиться
Что это значит:
– Приходится быстро придумывать более сложные задачи, а борьба идёт за задачи, по которым сейчас пишут научные статьи
– В Tier 5, видимо, включат только задачи без известного способа решения
За год модели сделали колоссальный прорыв в математике. Уже находятся на границе значимого вклада в реальных исследованиях.
Следующие кандидаты на подобные прорывы: программирование, химия, биология, здоровье.
https://epoch.ai/frontiermath
#ИИ
Доедая оливье, мы входим в эпоху гиперперсонализированного ПО
Конкретно сегодня до обеда команда отказалась от подписки на Linear (самый AI friendly task-manager), потому что за три дня один человек сделал нам такой же, но кастомный. По сути это индивидуальный пошив по цене массового производства.
Теперь думаем написать свою CRM и вообще подписка на ИИ – это теперь последняя подписка.
Год будет турбулентным.
---
a16z: что изменит AI-рынок в 2026 году
(Andreessen Horowitz — один из самых влиятельных венчурных фондов Кремниевой долины)
1. Интерфейсы уйдут в тень. CRM и ERP станут фоновым слоем хранения. Взаимодействие — через агентов. Продукт будут оценивать по результату, не по экранному времени.
(ровно то же самое говорю и я выше👆)
2. Первый AI-нативный университет. Среда адаптируется под каждого студента. Преподаватели — архитекторы процессов. Оценивать будут умение использовать AI, а не избегать его.
(вот именно такой я и делаю: 2030ai.ru)
3. Мультиагентные бизнес-процессы. AI-агенты разных сторон будут вести переговоры без участия человека.
4. Инфраструктура не справится. Нужны агент-нативные платформы: массовая параллельная обработка, координация тысяч задач в миллисекунды.
(и с серверами для ИИ будут перманентные проблемы, цены могут подрасти)
5. Организованные данные — новый bottleneck. Большинство корпоративных знаний в PDF, скриншотах, видео, а важнейшие знания вообще в головах. Структурирование данных для AI станет отдельной категорией продуктов.
(как минимум – начните записывать тотально все встречи в компании)
#ИИ
https://www.a16z.news/p/big-ideas-2026-part-1
Железо становится лучше, а софт делает его ещё лучше
Иногда кажется, что рынок AI-железа слишком сильно ускорился: новые чипы выходят чаще, чем я могу обновить ноутбук.
Но настоящее ускорение приходит после релиза.
Почему так?
– Само «железо» – это первая половина истории. Вторая половина начинается, когда под новое железо перестраиваются компиляторы, распределение экспертов в MoE и прочий обслуживающий софт.
– Оптимизации первого года после релиза дают иногда больше прироста, чем разница между поколениями чипов.
– Особенно видно сейчас: архитектуры типа MoE подключают ровно тех «экспертов», кто нужен – и железо внезапно раскрывается на 8–10× быстрее, как будто просто дождалось обновления драйверов.
Почему это важно?
– Инфраструктура будет становится дешевле, услуги – быстрее, а качество моделей будет расти, даже если сами модели формально не будут меняться (а они будут меняться)
– Ощущение, что «всё уже оптимально», каждый раз оказывается иллюзией.
– Улучшения скорости и качества нас ждут ещё значительные – и это чуть пугает, но в хорошем смысле.
В общем, фронтир ИИ пока даже не близко к плато. И самое интересное мы увидим не когда выйдет новое железо, а когда под него оптимизируют всё остальное.
https://www.reuters.com/world/china/nvidia-servers-speed-up-ai-models-chinas-moonshoot-ai-others-tenfold-2025-12-03/
#ИИ
Путин вчера выступил на большой конференции по ИИ.
Озвучил довольно продуманный и последовательный план широкого внедрения искусственного интеллекта.
Кратко: Штаб управления отраслью, атомная энергетика и open source
Штаб вместо «рабочей группы»
У правительства уже есть аналитический центр по ИИ – около 50 человек под Минцифрой. Но у него нет главного – административного ресурса. Поэтому предлагается штаб управления всей деятельностью в сфере ИИ, который сможет ставить задачи, добиваться исполнения и контролировать результат – по отраслям, регионам, министерствам и ведомствам.
ИИ как KPI для регионов и ведомств
К марту следующего года правительство, министерства и субъекты должны показать, где и как у них применяется ИИ – в экономике, социальной сфере, управлении. Темпы внедрения ИИ технологий станут отдельным показателем в рейтинге цифровой трансформации регионов уже по итогам 2026 года. ИИ‑проекты из «инициативы энтузиастов» превращаются в формальный KPI.
Регуляторика: не пережать, но развивать свои технологии
Отдельный акцент – не повторять опыт стран, где жёсткая регуляция задушила развитие ИИ (привет, Европа). Ставка на экспериментальные правовые режимы и «мягкое право» вроде кодекса этики. Но есть зоны, где курс на жёсткий суверенитет: госуправление, силовые структуры, спецслужбы – использовтаь только собственные базовые разработки.
ЦОДы на атомной энергии
Под все эти планы нужно расширять генерацию энергии под ИИ. От угольной генерации в Кузбассе до малых атомных станций рядом с потребителем данных – идея в том, чтобы обеспечить дата‑центры стабильной мощной энергией. За ближайшие два десятилетия планируется построить 38 новых атомных энергоблоков на Урале, в Сибири и на Дальнем Востоке, фактически удвоив текущую атомную генерацию под новые вычислительные мощности.
Свой open source как ускоритель прогресса в моделях и снижения рисков использования чужих моделей
Сбер планирует выложить: GigaChat Ultra, GigaChat Lightning, новое поколение GigaAM для речи, Kandinsky 5.0 для картинок и видео обещают выложить в open source со всеми весами, часть – с возможностью коммерческого использования.
Общая картинка
Если сложить всё вместе, получается архитектура: государство создаёт спрос и инфраструктуру (штаб, рейтинги, энергию и ЦОДы), корпорации приносят модели и витрины (open source, роботы, платформы), а всем остальным предлагается встроиться – от стартапов до региональных команд. Для тех, кто строит продукты и процессы в окологосударственных организациях, ИИ из опциональной темы превращается в обязательный пункт стратегии.
В общем: кому нужна стратегия по ИИ или надо на стратегической сессии рассказать про ИИ, чтобы правильно включить в планы на 2026 год – обращайтесь @zvasilpublic
#ИИ
Утро с Pulse: персональный брифинг вместо ленты
Снова на богатом, про функцию Pulse, которая доступна в GPT-5 Pro.
Каждый день читаю подборку новостей, которые готовит ChatGPT на базе моих интересов. Анализируется почта, календарь предыдущие разговоры + оставляешь конкретные запросы, о чем тебе подготовить статьи.
ChatGPT придумывает тему, собирает материал и готовит на этиу темы небольшие рефераты, пробует составлять планы на день и давать советы.
Запросы на темы надо оставлять 22:00 – тогда попадёт в утренний выпуск, работает по московскому времени
Доступ: сейчас только Pro; работает в веб‑версии и на iOS/Android; в десктоп‑приложениях пока нет.
Ограничения: один выпуск в сутки; карточки показываются только один день, после чего исчезают. Не смог заставить его писать на русском языке, менять язык интерфейса с английского не хочу.
Стимулирует заходить в ChatGPT каждый день, думаю в этом была основная задумка;
Ссылка: https://chatgpt.com/pulse
#ИИ
Обновление GPT-5 Pro интерфейса
В самом дорогом 200 долларов/в месяц режиме ChatGPT-5 Pro появилась кнопка Update.
Кстати, этот тариф всё больше насыщают функциями, которых нет на более дешёвых тарифах. На самом деле ничего критичного, но разница есть. Завтра расскажу про функцию Pulse
Теперь можно докидывать новые вводные прямо во время долгих размышлений модели без перезапуска. У меня рекорд ожидания был ~28 минут, и какие-то новые мысли по поводу задачи за эти полчаса приходили, только вписать их было некуда. А теперь есть.
Что-то подобное есть в Claude Code, там тоже можно докидывать уточнения в процессе размышлений.
Когда полезно
– Забыл уточнить формат: «выгрузи ещё и CSV», «добавь TL;DR», «добавь промпт, который в Cursor создаст приложение по этой идее»
– Видно, что размышления уходят не туда: «не трать время на скрипты, они мне нужны» (хотя я обычно не читаю ход размышлений модели – не вижу в этом пользы).
– Нужно приоритизировать: «важнее использовать научные данные, а не мнения людей в соцсетях».
Как использовать
– Запускаю запрос в GPT‑5 Pro.
– Справа появляется колонка с размышлениями
– Нажимаю Update и дабавляю правки.
– Жду. Модель «перестраивает» план постепенно, мгновенной реакции не будет
Полезно ли? Иногда да. Изменение небольшое, а даёт ощущение контроля над ситуацией.
#ИИ
WEB WAR III: в киберпространстве готовятся к нападению на Империю добра
The Verge объявляет «третью веб-войну» (https://www.theverge.com/tech/813944/browser-wars-chatgpt-gemini-chrome). И это похоже на правду: ИИ-агенты лезут в самое ценное – в браузер, в котором мы проводим 90% времени.
«Браузер – операционная система твоей жизни», говорил продакт из ChatGPT. Чтобы захватить это окно в Интернет OpenAI сделал ChatGPT Atlas; Perplexity – Comet; The Browser Company – Dia; Я.Браузер, Edge и Chrome ускоренно «переобуваются» в AI-режим.
Что уже умеют AI-браузеры:
– Видеть вкладку, стягивать данные с нескольких табов и заполнять формы
– Резюмировать видео, прибирать почту и оформлять покупку (Amazon даже подаёт в суд на Comet за это)
– Прямо сейчас полезность под вопросом. Агентные ИИ пока часто бестолковы. И откзываются делать многое ради безопасности. Ждём выхода на рынок китайцев и Grok – они заставляют более острожных двигаться намного быстрее.
Что влияет кроме ИИ-революции:
– Регуляторы давят Google антимонопольными делами
– Любой стартап теперь может отпочковаться на Chromium и дальше развиваться сам.
Ощущение такое, что сейчас идёт подготовка – настоящая смена правил игры случится позже, когда агенты станут надёжными. Пока я бы ставил на то, что Google удержится на вершине, они уделяют отдельное внимание browser use инструментарию своих моделей: https://blog.google/technology/google-deepmind/gemini-computer-use-model/
#ИИ