TGINSIGHT CHAT
ИИволюция 👾
@ai_volution
ТехнологииАвторский канал Сергея Пахандрина про AI, нейросети, AI-разработку, ChatGPT (и другие LLM). Строю AI-first компанию. Рассказываю о своём опыте и экспериментах с AI. По всем вопросам: @pakhandrin РКН: https://clck.ru/3QJLiL В ВП и папках не участвую
Последние посты
Стр. 37 из 84 · 1,006 постов
Опубликован 23 апр.
OpenAI готовы купить Chrome браузер Минюст обвиняет Google в монополии: она контролирует не только поиск (с долей >90%), но и крупнейший браузер — Chrome. Именно эта связка даёт Google преимущество, которое власти считают нечестным. На слушаниях по антимонопольному делу OpenAI неожиданно заявила: “Если Google продаст Chrome — мы купим”. Если суд решит, что Google нужно “разделить” — продажа Chrome может стать реальным сценарием. Браузер помог бы OpenAI запустить свой “AI-first” опыт — без поиска Google, с собственным индексом и нейросетевыми фишками. Ранее OpenAI пыталась договориться с Google об интеграции поиска, но получила отказ. Сейчас компания работает над собственным поисковым индексом, но прогресс идёт медленнее, чем ожидалось. ИИволюция
Опубликован 22 апр.
У ваших детей мало травмирующих воспоминаний? Самое время добавить ещё парочку, оживив их рисунки 😅
Опубликован 21 апр.
Битва сильнейших - o3: включаю эксперта уровня PhD. Пользователь просит меня сделать такое, возможно он имел сякое, а может он имел ввиду совсем другое. Займусь этим не знаю чем…. Спустя 5 минут: ваш запрос нарушает правила и я не могу вам помочь. - grok: г*вно вопрос, лови, мой AGI никогда не подводит 😅 ИИволюция
Опубликован 21 апр.
На днях обновили Grok 3 mini – Быстрая и доступная модель с полноценным reasoning. Цепочку рассуждений отдают в каждом API-ответе. – Цены: инпут $0.30 и $0.50 аутпут. В 5 раз дешевле аналогов! – На тестах как будто тоже всё красиво. Ценовые войны в AI идут вразнос. Только говорили, что Gemini 2.5 Flash уделал по ценам o4-mini, как вышел Grok 3 mini и уронил цены вообще в 5 раз. Скоро корпы будут нам доплачивать за использование именно их моделей 😬 Кстати, а кто-нибудь уже использует Grok через API в проектах? ИИволюция
Опубликован 20 апр.
"ИИ КАК БАЗОВОЕ ТРЕБОВАНИЕ": НОВАЯ ЭРА В SHOPIFY Тобиас Лютке, CEO Shopify,написал письмо команде о том как он видит работу с ИИ. Письмо моментально улетело в сеть. О чём письмо Тобиаса своей команде: Тобиас Лютке объявил, что использование искусственного интеллекта становится обязательным навыком для всех сотрудников Shopify. Это не просто рекомендация — это новая корпоративная культура. Ключевые идеи: ИИ как фундаментальное ожидание: Использование ИИ теперь базовое требование для всех в Shopify. Отказ от освоения этого навыка — путь к стагнации ("Если ты не поднимаешься, ты скатываешься"). ИИ в прототипировании: Искусственный интеллект должен стать обязательной частью фазы прототипирования всех проектов GSD. Это радикально ускоряет процесс обучения и создания. Оценка использования ИИ: Компания вводит вопросы об использовании ИИ в анкеты производительности и обзоры сотрудников. Самообучение и обмен опытом: Сотрудникам предоставляется доступ к различным ИИ-инструментам (chat.shopify.io, Copilot, Cursor, Claude code). Компания будет выделять время на интеграцию ИИ в рабочие процессы. Новый подход к ресурсам: Перед запросом дополнительных ресурсов команды должны показать, почему нельзя достичь целей с помощью ИИ. Правило распространяется на всех: Включая руководство и исполнительную команду. Взгляд в будущее: Лютке утверждает, что ИИ полностью изменит Shopify, рабочие процессы и жизнь в целом. Миссия компании — определить, как будет выглядеть предпринимательство в мире, где ИИ общедоступен. Философия CEO: Как Лютке ранее описывал Shopify — это "гонка Красной Королевы" (отсылка к "Алисе в Стране чудес"): нужно постоянно бежать, чтобы оставаться на месте. В компании, растущей на 20-40% ежегодно, каждый должен совершенствоваться хотя бы на столько же. Мои размышления: Прочитал тезисы Тобиа Лутке и вижу, что в крупных IT-компаниях интеграция ИИ в рабочие процессы действительно становится стандартом. Это драматично ускоряет создание новых продуктов: если раньше программист тратил на спринт две недели, то с ИИ — условно три дня. Такое ускорение в разы создает неконкурентное преимущество, которое может выделить компанию на конкурентном поле. Однако я наблюдаю, как предприниматели бездумно погружаются в тему ИИ, перекладывая всё больше принимаемых решений на алгоритмы. На мой взгляд, это рискованно: в какой-то момент компания может стать слишком предсказуемой, когда решения принимаются не людьми, а алгоритмами. Компания может начать ухудшать свои продукты ради повышения прибыльности. Я вижу и другую ключевую проблему: для внедрения ИИ нужно сначала добиться связности и целостности команды, чтобы все понимали, как применять подобные сервисы на своем уровне. На самом деле речь идет о том, чтобы внутри команды была максимально выстроенная система петель обратной связи, чтобы информация собиралась внутри и между командами. Только обмен информацией позволяет ускорить развитие бизнеса. ИИ – это просто один из инструментов, который можно использовать внутри командообразования. Поэтому сейчас на первое место выходят вопросы командообразования и формирования не иерархических, а децентрализованных команд. Похоже, что мир бизнеса входит в эпоху, когда граница между "использующими ИИ" и "не использующими ИИ" станет такой же фундаментальной, как когда-то была граница между цифровыми и аналоговыми компаниями. Как бы сказал Уильям Гибсон: "Будущее уже здесь, просто оно неравномерно распределено".
Опубликован 18 апр.
OpenAI на флексе, да и мы тоже! Теперь в API появился Flex Processing — режим для тех, кто никуда не торопится и кайфует от процесса. Суть простая: чуть медленнее ответы — зато и чек меньше. В два раза меньше! Хочешь сэкономить — просто шепни в конфиге "usage_mode": "flex". И всё, можно откинуться в шезлонг и ждать магию. Идеально для: — Генерации текстов и картинок без гонки — Бэкенд-задач, где важен результат, а не спринтерская скорость — Всех, кто живет по принципу “лучше медленно, но за копейки” Серьезно, пятница создана для флекса. Работать на расслабоне. Писать код на расслабоне. Жить на расслабоне. А теперь вдохнули… выдохнули… И перевели своих ботов на флекс. Всем плюс вайб. Детали тут: https://platform.openai.com/docs/guides/flex-processing ИИволюция
Опубликован 18 апр.
Надеюсь, что последние 2-3 месяца осталось посмеиваться над сложившейся ситуацией 😬 А потом мы увидим 4.2 и o4.1 🙂 ИИволюция
Опубликован 18 апр.
Google выкатили Gemini 2.5 Flash Preview – Это гибридная модель с "гибким" режимом ризонинга (размышлений). Теперь модель сама решает, насколько глубоко нужно подумать, но в API можно задать лимит размышлений вручную — от 0 до 24 576 токенов! Чем больше лимит — тем умнее ответы. – Молниеносная скорость и низкая цена, как у старого Flash 2.0, но теперь с куда более продуманными ответами. По тестам: – На Hard Prompts в LMArena Gemini 2.5 Flash уверенно обходит Claude Sonnet 3.5, Sonnet 3.7 и R1. – На уровне o4-mini и Grok-3, но при этом существенно дешевле. Цены просто ниже не бывают: – Инпут: $0.15 за миллион токенов – Аутпут: $0.6 за миллион токенов – С полным ризонингом — около $3.5 за миллион. На фоне конкурентов: – Sonnet 3.7 и R1 — уже не тянут по качеству. – Grok-3 и o4-mini выглядят чуть сильнее в тяжелых задачах, но по соотношению цена/качество Flash 2.5 явно лидер. Можно уже тестить через Google AI Studio, Vertex AI, в Gemini API и конечно в Gemini app через выбор моделей. Мне вообще нравится, как Google включился в гонку и просто заливает нас релизами. Хорошая ритмичность и наконец-то есть чем отвечать OpenAI и Anthropic. Они правда ухватились сразу за все направления, и даже конкурента AI-редакторам кода делают. Получится ли все направления усиливать и не сливаться, не понятно. Подробнее: в блоге Google. ИИволюция
Опубликован 17 апр.
⚡OpenAI собирается купить Windsurf за $3 млрд! Если сделка состоится, она станет самая крупная для OpenAI. И еще прикол в том, что OpenAI уже инвестировали в Cursor через свой фонд OpenAI Startup Fund. Windsurf - AI редактор для разработки (скачать тут). Конкуренция обретает новые краски и новый размах! 🍿 ИИволюция
Опубликован 17 апр.
Не без ложки дёгтя для OpenAI в свежем тесте Aider polyglot coding benchmark: – o3 дал 79,6% правильных ответов — выше, чем Gemini 2.5 Pro (72,9%), но стоит в 17 раз дороже — $111 против $6.32. – o4-mini набрал 72%, то есть чуть хуже Gemini 2.5 Pro, и при этом оказался в 3 раза дороже — $19.64 против $6.32. Выводы: по балансу цена/качество Gemini 2.5 Pro по-прежнему выглядит сильнее и интереснее для разработчиков, несмотря на крутость новых моделей OpenAI. При этом Google вроде как готовит новую модель заточенную на разработку - Night Whisper и думаю, вполне могут прыгнуть выше по качеству сохранив при этом доступные цены. ИИволюция
Опубликован 17 апр.
OpenAI представила новые модели o3 и o4-mini! Сегодня вышли o3 и o4-mini — самые умные модели OpenAI на данный момент. Их главное отличие: они обучены агентно использовать ВСЕ инструменты ChatGPT — веб-поиск, код на Python, работу с файлами и графикой, создание изображений и даже мультимодальное мышление через картинки. Теперь модель сама решает, какой инструмент ей нужен для решения задачи, и делает это за считанные секунды. Что умеет o3? – Новый лидер в кодинге, математике, науке и визуальных задачах. – Установил рекорды на бенчмарках Codeforces, SWE-bench, MMMU без специальных костылей. – Модель анализирует изображения, графики и диаграммы лучше всех предшественников. – Делает на 20% меньше крупных ошибок, чем o1, особенно в сложных реальных задачах (программирование, консалтинг, креатив). – При этом стала куда разговорчивее и естественнее в диалогах — ощущение, будто общаешься с реальным человеком. Что умеет o4-mini? – Компактная, быстрая и дешёвая альтернатива для сложных задач. – Рвёт все рекорды на AIME 2024/2025 по математике. – Идеальна для массовых запросов: высокая пропускная способность + разумная стоимость. – И да, она доступна даже бесплатным пользователям ChatGPT! Тесты и бенчмарки: – o3 и o4-mini обошли даже топовые версии Gemini 2.5 Pro Experimental. – На задачах типа GPQA (PhD-уровень) и CharXiv (научные графики) — огромный прирост точности. – Особенно впечатляет мультиформатная работа: модели понимают фото с доски, чертежи, даже если они размыты или плохо сняты. И могут на лету их обрабатывать и исправлять. 🖼️ Цены в API: – o3 — $10/$40 за миллион токенов (на треть дешевле o1). – o4-mini — $1.1/$4.4 за миллион (заменит собой o3-mini). o1 и o3-mini скоро уберут из выбора — они полностью уступили новым моделям в эффективности и цене. Модели уже доступны в ChatGPT для Plus, Pro и Team пользователей. Для Enterprise и Edu — через неделю. В бесплатной версии можно будет попробовать o4-mini через режим «Think». В ближайшие недели обещают выпустить ещё более продвинутую версию — o3-pro с поддержкой всех инструментов. И новости из зоопарка: пообещали позже в этом году навести порядок в зоопарке моделей и объединить GPT и o-модели в одно, более мощное семейство моделей. GPT-5? Официальная новость: в блоге OpenAI ИИволюция
Опубликован 16 апр.
Сегодня покажут полноценную o3 и o4-mini. Смотреть трансляцию: тут ИИволюция