TGINSIGHT CHAT
ИИволюция 👾
@ai_volution
ТехнологииАвторский канал Сергея Пахандрина про AI, нейросети, AI-разработку, ChatGPT (и другие LLM). Строю AI-first компанию. Рассказываю о своём опыте и экспериментах с AI. По всем вопросам: @pakhandrin РКН: https://clck.ru/3QJLiL В ВП и папках не участвую
Последние посты
Стр. 2 из 84 · 1,006 постов
Опубликован 31 мар.
Даю наставление агенту: Не делай ошибок. Никаких галлюцинаций. Проверяй дважды. Изучи лучшие мировые практики в сети.Ты senior developer и эксперт мирового уровня.А теперь сделай мне кнопку “Продолжить” не красную, а зелёную! 😡
Опубликован 31 мар.
OpenAI сделали плагин для вызова Codex в Claude Code АААА! И Codex работает конечно же в рамках вашей ChatGPT подписки. Какой кайф! Добавляем в CC маркетплейс плагинов от OpenAI: /plugin marketplace add openai/codex-plugin-cc Ставим плагин: /plugin install codex@openai-codex Перезапускаем плагины, чтобы не прерывать сессию в СС: /reload-plugins И далее запускаем сетап: /codex:setup В общем, как установите, можно в СС призывать Codex, делегировать ему задачи или например, делать ревью кода, который написан в СС. Все детали по плагину на гитхабе.
Опубликован 31 мар.
В Claude Code CLI добавили Computer Use Теперь в СС пишем код и тут же запускаем тестирование приложений без всяких доп. инструментов. Claude получает контроль по управлению вашим компьютером, бегает, нажимает кнопочки и всё, что вам необходимо (или ему). До этого такая возможность была в Claude Code десктоп приложении, а теперь прям в CLI доступно. Вот это подарок! Все детали тут
Опубликован 30 мар.
Забавно, что таких скриншотов в Твиттере все больше. Больше конечно на фейк походит. Хайп нарастает. Но ясно одно — Капибара грядёт!
Опубликован 30 мар.
AGI отменяется На прошлой неделе Дженсен Хуанг на подкасте у Фридмана заявил, что AGI уже здесь. А через день вышел бенчмарк, где все топовые модели мира набрали меньше процента. Какая ирония, тайминг просто идеален! ARC-AGI — это серия бенчмарков, которые пытаются измерить способность разбираться в новом с нуля. Первые две версии были статичными головоломками: вот тебе цветная сетка, вот паттерн, найди правило, примени к новому входу. AI к текущему моменту щёлкает их на раз-два: Opus 4.6 набирает 93% на первой версии, Gemini Deep Think 85% на второй. Казалось, вот-вот догонят людей. И тут 24 марта выходит третья версия. И отодвигает AGI куда подальше! ARC-AGI-3 — это 135 игровых окружений с тысячами уровней. Каждое окружение — отдельная игра, где ты делаешь ход, видишь результат, делаешь следующий, со своей логикой и своими правилами. Никаких инструкций и подсказок не дается. Вообще никаких намёков что вообще считается победой. Агент видит текущее состояние, делает действие, видит что изменилось, и должен сам разобраться в этом и что тут вообще происходит. Результаты: — Gemini 3.1 Pro: 0.37% — GPT-5.4: 0.26% — Claude Opus 4.6: 0.25% — Grok-4.20: 0.00%. Grok набрал ноль! Буквально не понял, что от него хотят. Люди при этом прошли все 135 окружений. Правда, тестировали не случайных прохожих, 500 человек в контролируемых условиях, и за baseline взяли не среднего игрока, а почти лучшего из группы. Плюс оценивают не просто "прошёл / не прошёл", а сколько ходов потратил. Формула жёсткая: если модель тратит в 10 раз больше ходов — ей засчитывают не 10%, а 1%. Так что цифры намеренно драматичные. Но даже без этого усиления — разрыв чудовищный. А самое обидное: пара простых алгоритмов без всяких LLM набрала 6-12%. Против 0.25% у Opus и 0.26% у GPT-5.4. Триллионы параметров проиграли алгоритмам, которые просто методично брутфорсят (перебирают) варианты. 25 игр можно пройти тут. Призовой фонд ARC Prize 2026 аж $2M. Все решения обязаны быть open-source. Дедлайн — 2 ноября. В общем, AGI отменяется. Работаем дальше 😅
Опубликован 30 мар.
Капибара! На днях в сеть утекла информация о следующей моделе Anthropic. Модель называется Claude Mythos, а кодовое имя Capybara. Это новый тир модели, выше чем Opus. Haiku → Sonnet → Opus → Capybara. Из утечек: значительно превосходит Opus 4.6 в кодинге и рассуждениях. Конкретных бенчмарков нет, но Anthropic подтвердили что модель существует и назвали её “step change”. В Твиттере конечно сразу пошли домысли ради хайпа “10 триллионов параметров, $10 млрд на обучение”. Параллельно ходят слухи про IPO Anthropic в октябре 2026, не исключено что Mythos придерживают к нему. Официальной даты релиза конечно же нет, говорят будут выкатывать очень не спеша. А ещё есть вероятность, что это не слив, а контролиуемый маркетинговый ход, как часто бывает в таких историях. Конкуренция нарастает и нужно приковывать к себе внимания больше чем конкуренты. Когда-то Сэм Альтман хайпил на AGI, а теперь Дарио решил хайпануть капибарой, и что она “значительно превосходит” опус.
Опубликован 27 мар.
И немного про Codex Там завезли поддержку плагинов https://developers.openai.com/codex/plugins В помощь для создания своих плагинов, можно использовать встроенный скилл @plugin-creator
Опубликован 27 мар.
Мужчина из Сиднея вылечил собаку от рака с помощью ChatGPT, Grok и AlphaFold. Ну, почти. Как-то мимо меня прошла такая интересная история. Рассказываю: Пол Конингам, data scientist, 17 лет в ML, никаких знаний в биологии. Его собака Рози заболела мастоцитомой. Ветеринар сначала сказал “просто бородавки”, но оказался рак поздней стадии. Химия не помогла, хирургия не помогла, собаке предрекли от месяца до шести 😭 Пол конечно погрустил, но взял себя в руки и вспомнил, что он data scientist. Вышел на учёных из университета UNSW, причём ChatGPT независимо посоветовал того же специалиста, к которому Пола уже направил знакомый. Конингам заплатил $2,000 за секвенирование, ему расшифровали ДНК здоровых клеток Рози и ДНК опухоли, чтобы сравнить и найти мутации, которые можно атаковать вакциной. Далее скормил данные в AlphaFold (нейросеть от Google DeepMind, предсказывает 3D-структуру белков), та смоделировала 3D-структуру белка, который “двигает” опухоль. Правда, биологи оценили и сказали, что результат вышел так себе. А финальную формулу mRNA-вакцины, по словам самого Пола, рассчитал Grok. Дальше за дело взялись настоящие учёные. Профессор Тордарсон из университета UNSW собрал вакцину в лаборатории по той же технологии, что и ковидные вакцины Pfizer. Реальная стоимость сотни тысяч долларов, университет взял на себя. Но самое сложно оказалось не это! А бюрократия! Вакцина готова, а колоть нельзя, в Австралии даже на своей собаке нельзя тестировать экспериментальный препарат без одобрения этического комитета. Пол три месяца писал 100-страничную заявку, по два часа каждый вечер. А потом проехал 10 часов до Квинсленда, единственный ветеринар с нужным разрешением оказался только там. Опухоль на лапе уменьшилась на 75% за месяц. Через шесть недель после первого укола Рози прыгнула через забор за кроликом. Конингам написал в Твиттере: “Она увидела кролика и перемахнула через забор за ним.” Правда, университет сразу уточнил: рак у Рози никуда не делся, одна из опухолей вообще не отреагировала. Плюс вакцину кололи вместе с дорогущим иммунопрепаратом, и что именно помогло — вакцина, препарат или всё вместе, никто не знает. Один случай, одна собака. PhD из Стэнфорда прямо сказал: “Роль AI в этой истории раздута, всё это можно было сделать и без ChatGPT”. И всё-таки, профессор Тордарсон назвал это первым в истории персонализированным дизайном противораковой вакцины для собаки. Мартин Смит из лаборатории UNSW задал вопрос, от которого мурашки: “Если мы смогли сделать это для собаки, почему мы не делаем то же самое для всех людей с раком?” Кстати, первые странные уплотнения у Рози появились ещё в 2022 году. Работу с AI Пол начал в ноябре 2024-го, больше года от первого промпта до первого укола. А вирусным это стало только сейчас, когда появились результаты, и эта история завирусилась, поддержали и Маск и топы OpenAI и множество СМИ. $2,000 (правда опустим затраты на производство вакцины), 3 нейросети (хотя вроде еще и Gemini участовала), упрямый data scientist без знаний в биологии, и собака, которая снова прыгает через забор. Да, рак не вылечен, но Рози жива!
Опубликован 27 мар.
Кто сказал «мяу»? ИТ-компания «Криптонит» приглашает на дататон «Криптонит.Тембр», гденужно распознать, кто говорит! Тебе предстоит обучить Speaker Recognition модель, устойчивую к искажениям аудио, возникающим в реальных сценариях эксплуатации речевых интерфейсов и систем обработки звука: 🔹искажения, вносимые акустической средой; 🔹посторонние шумы; 🔹реверберация; 🔹большое расстояние до микрофона; 🔹искажения каналов связи. Участвуй, и ты сможешь: 🟦получить шанс разделить призовой фонд в 600 000 рублей; 🟦разработать решения в области Audio/Speech ML; 🟦прокачать скиллы в Speaker Recognition и Deep Learning. 👆Регистрируйтесь до 10 апреля включительно!
Опубликован 26 мар.
На гитхабе завирусился скилл для Claude Code, который “шерстит” за тебя весь интернет Скилл “last30days”, пишешь /last30days [тема] и агенты параллельно идут в Reddit, X, YouTube, Hacker News, TikTok, Instagram, Bluesky, Polymarket и веб, собирают что обсуждалось по теме за последние 30 дней и выдают сводку с цитатами. Работает в два прохода. Сначала широкий поиск по всем источникам одновременно. Потом из результатов вытаскивает конкретные хэндлы, сабреддиты, имена и делает по ним второй более глубокий проход. Так скилл находит посты и информацию, которые по ключевым словам поверхностно не найдёшь. А если тема всплывает сразу в нескольких местах, помечается как сильный сигнал. Всё сохраняется в SQLite, потом можно по этим данным уже любые запросы запускать в СС. На гитхабе указано как его настроить, какие в идеальном варианте подключить API ключи, но даже если ключей нет, скилл может использовать фолбэки на бесплатные альтернативы. https://github.com/mvanhorn/last30days-skill Я себе уже взял в работу
Опубликован 26 мар.
Сэм Альтман в догоняющих, а Дарио ведет этот танец OpenAI закопала Sora, перетряхнула всю команду и готовит новую модель с кодовым именем Spud (“картошка” на британском сленге). Вчера слили детали (The Information) из внутреннего письма Альтмана команде. Пре-трейнинг новой модели завершён, релиз через несколько недель. Цитата Сэма: «very strong model that can really accelerate the economy». GPT-6 это или GPT-5.5 пока не ясно, информации нигде нет. И как мы помним, OpenAI с декабря в режиме “Code Red”. Причина конечно же в давлении от конкурентов. По данным Axios от 18 марта, Anthropic отжимает уже 73% новых корп-клиентов (было 50/50 ещё в декабре). В кодинге разрыв ещё больше: Claude 54% рынка против 21% у OpenAI (а вы еще говорите мне, почему я мало про Codex рассказываю). ChatGPT второй месяц подряд теряет трафик, уже меньше 5.8 млрд визитов А позавчера убили Sora. Сделка с Disney на $1 млрд так и не закрылась. GPU, которые жрала Sora, перенаправили на Spud. В тот же день, когда закопали Sora, подняли ещё $10 млрд к февральскому раунду, итого $120 млрд. Фиджи Симо, которая пришла из Instacart руководить продуктами OpenAI ещё в прошлом году (вроде как возглавила “AGI Deployment”), на прошлой неделе написала команде: side quests на паузу, фокус на кодинге и корп-пользователях. А ещё строят суперапп, ChatGPT + Codex + браузер Atlas сливают в единое десктопное приложение. Вот и прямой ответ на Claude Code. Про сам Spud пока только утечки: нативная мультимодальность, усиленный reasoning, real-time речь, долгосрочная память (Альтман назвал «любимой фичей») и агентные возможности, но ни бенчмарков, ни размера модели пока нет. Получается какой-то огород у OpenAI с их кодовыми именами — Strawberry, Garlic, Spud. Интересно какое следующее название будет? Капусту хочу, она многослойная). В твиттере шутят: «Dario made Sam dance». Посмотрим, что за картошку они посадили, главное чтобы колорадский жук не съел урожай 😅
Опубликован 25 мар.
Новость дня: OpenAI закрывает Sora Возможно, готовят что-то более мощное и решили таким образом хайпануть перед релизом, а возможно, решили сосредоточиться на текущих растущих направлениях и укрепить свои позиции там, где проседает. А Sora так и не зашла, а угнаться за конкурентами не хватает ресурсов и кадров.