TGTGInsightаналитика telegramLIVE / telegram public index
К списку каналов
ИИволюция 👾 avatar

TGINSIGHT CHAT

ИИволюция 👾

@ai_volution

Технологии

Авторский канал Сергея Пахандрина про AI, нейросети, AI-разработку, ChatGPT (и другие LLM). Строю AI-first компанию. Рассказываю о своём опыте и экспериментах с AI. По всем вопросам: @pakhandrin РКН: https://clck.ru/3QJLiL В ВП и папках не участвую

Подписчики1.1万Текущее число подписчиков
Постов1,006Проиндексировано постов
Охват39,410Просмотры последних постов
Последние посты

Последние посты

Стр. 51 из 84 · 1,006 постов

Опубликован 4 февр.

Классный твит от Андрея Карпатого (в переводе на русский). Сообщение Андрея: “Есть новый стиль программирования, который я называю "вайб-кодинг" (vibe coding) — когда просто плывёшь по течению, смиряешься с экспоненциальным разрастанием кода и вообще забываешь, что он существует. Это возможно, потому что LLM'ы (например, Cursor Composer с Sonnet) уже слишком хороши. Я почти не трогаю клавиатуру — просто разговариваю с Composer через SuperWhisper. Прошу его делать самые ленивые вещи, типа "уменьши паддинг у сайдбара в два раза", потому что мне лень искать, где это исправить. Всегда жму "Accept All", даже не смотрю диффы. Если появляются ошибки, просто копирую их обратно без комментариев — и обычно это почему-то помогает. Код растёт сам по себе, я уже не совсем понимаю, как он устроен, и чтобы в нём разобраться, пришлось бы реально сесть и читать. Иногда LLM'ы не могут починить баг, тогда я либо просто обхожу его, либо прошу случайные изменения, пока он каким-то образом не исчезнет. Для одноразовых проектов на выходных это не так уж и плохо, но всё равно довольно забавно. Сейчас я делаю какой-то проект или веб-приложение, но это уже даже не совсем программирование — я просто смотрю на код, говорю, что надо сделать, запускаю, копирую какие-то куски, вставляю другие, и в целом всё работает.” И вот теперь я однозначно могу сказать, что это супер подход для запуска MVP. Ты просто на вайбе фигачишь что-то и оно работает. А если не работает, то просто говоришь: “Оно не работает и нейросеть пытается починить”. Пофиг на качество кода на старте, мы на вайбе пилим стартапы! ИИволюция

4,830 views

Опубликован 4 февр.

Видимо сейчас начнут клепать франкинштейнов, типа — DeepClaude, который уже бьет мономодели на бенчмарках (картинка). DeepClaude - это API для работы с языковыми моделями, который объединяет возможности двух различных моделей: DeepSeek R1 и Anthropic Claude. Принцип работы: 1. DeepSeek R1 отвечает за логические рассуждения и решение сложных задач, используя так называемую "цепочку размышлений" (Chain of Thought) 2. Claude 3.5 Sonnet дополняет систему своими сильными сторонами - генерацией кода, креативностью и навыками ведения диалога

3,150 views

Опубликован 4 февр.

OpenAI Deep Research Я выше писал про Gemini Deep Research, вот и ответ OpenAI с таким же названием o__O Попробовал на той же задаче с конкурентным анализом + на задаче поиска subscription бизнесов, о которой также писал недавно - мои впечатления: 1) В Google мне понравилось, что перед стартом он показывает план ресерча и позволяет тебе скорректировать. OpenAI же этого не делает, но уточняет детали: а ля бизнесы в какой локации искать или по какому аспекту сравнивать конкурентов. 2) Я понимаю все про загрузку и тп, но у Google все работало гораздо быстрее и без ограничений а-ля "ваш ресерч поставлен в очередь" 3) Результат OpenAI мне очень понравился, вышло сильно глубже и качественнее, чем Gemini. Думаю, что это потому что он реально "прочитывает" страницы. Google наверняка берет из своего индекса. Правда, при экспорте в CSV он почему-то потерял 2/3 результатов по задаче с поиском бизнесов, ну это проблема уже не DeepResearch. Конечно, экспорт у Gemini сразу в Google Docs сильно удобнее 4) Gemini быстрее решал такие же задачи раза в 3-4, но, опять же, возможно из за пункта про "прочитывание". В общем, это хорошо, но не вау имхо. Все это в той или иной степени уже было у конкурентов или open source; даже в o3-mini + web search можно было получить схожие результаты

3,360 views

Опубликован 3 февр.

А вот сейчас было больно! Я понимал, что лимиты для o3-mini-high на Plus есть и думал в рамках суток они как обычно, а они какие-то очень злые получается!? Какие в итоге ограничения по кол-ву запросов то? Х запросов в неделю получается? UPD: видимо 50 запросов в неделю. Так что расходуйте осторожней 🎩 ИИволюция

3,150 views

Опубликован 3 февр.

o3-mini-high неожиданно в рамках текущего чата начала рассуждать на корейском. Хотя до этого все рассуждения в этом же чате были на английском. Своего рода ответочка китайцам, чтобы запутать? 😆 ИИволюция

3,130 views

Опубликован 2 февр.

С вас 200$. Спасибо.

3,160 views

Опубликован 2 февр.

Доверяй, но проверяй и дипсикам не доверяй! Парень конечно заморочился 😅 ИИволюция

3,670 views

Опубликован 1 февр.

Ух ты, Сэм что-то припас для нас. Думаю, что это Canvas для o3-mini, чтобы удобнее работать с кодом. А вы что думаете? ИИволюция

3,100 views

Опубликован 1 февр.

- OpenAI выкатывает новую модель с доступом по API. - Китай: challenge accepted! Ждем DeepSeek R3 😅 ИИволюция

3,130 views

Опубликован 1 февр.

Кажется пора сказать “Sonnet 3.5 – давай до свидания!” o3-mini-high на LiveBench просто вырвалась далеко вперед и значительно опережает остальные модели в написании кода, набрав аж 82.74. Ух! ИИволюция

3,090 views

Опубликован 1 февр.

OpenAI релизнули модель o3-mini - Модель заточена под решением математических задач, для разработки кода и аналитики. - В чатике доступно 2 версии: o3-mini (medium) и o3-mini-high. В режиме high поддерживается поиск в интернете, чтобы получать свежую информацию. - Режим влияет на длительность размышлений (чем дольше, тем точнее и качественнее ответ). - Модель уже доступна в API (не для всех) с тремя режимами: low, medium, high. Разработчики могут выбирать режим исходя из потребностей в ризонинге и времени на ответ (нужно быстро или можно подождать, но получить более качественный ответ). - Вау фактор: o3-mini-high уделывает o1 в разработке. Судя по бенчмаркам, произошел значительный рывок в качестве. Прочитал мнение разных людей в твиттере, кто уже попробовал o3-mini-high в разработке и сравнили. Они в восторге! - Приятное (ответочка китайцам): o3-mini доступна в бесплатных тарифах (но есть ограничение, вроде как 10 сообщений за несколько часов, хотя нигде об этом толком не пишут официально). - В Plus тарифе лимит выше, 150 сообщений в сутки, в Pro за $200 безлимит. - У модели нет зрения (vision). - Очень приятное: цены в API по сравнению с o1-mini рухнули на 63%. Чем дальше прогресс, тем дешевле становится применение AI в различных областях, сервисах и задачах. Почитать официальный релиз: тут ИИволюция

2,740 views

Опубликован 31 янв.

О, вчера в ChatGPT раскатали возможность (для европейских пользователей/впн) включать камеру в режиме Advanced Voice Mode. Это возможность была выпущена еще до НГ, но в Европе не была доступна. Теперь чатик сможет видеть контекст с камеры и общаться с вами о нём. Налетайте! ИИволюция

2,900 views
12•••5•••10•••15•••20•••25•••30•••35•••40•••45•••4950515253•••55•••60•••65•••70•••75•••80•••8384