Содержимое
Цитата с Reddit Анекдотические доказательства. Дал такую же подсказку Sonnet 4.5 (Claude Code) и GPT-5-Codex (Codex CLI). У меня есть веб-приложение с ~200k LoC. «внедрить нечеткий поиск разговоров и отчетов либо при выборе «Перейти к разговору» или «Перейти к отчету» и вводе заголовка, либо когда пользователь вводит заголовок в основном поле ввода, и ни один из стандартных элементов не совпадает, поиск начинается с задержкой в 2 с» Сонет 4.5 прошел очень быстро за ~3 минуты. Но то, что он построил, было сломанным и поверхностным. Коду даже не удалось повторно использовать уже существующую аутентификацию и начал перестроить аутентификацию на стороне сервера вместо того, чтобы искать, как это делают другие конечные точки API. Даже повторная подсказка и рассказ о том, как все пошло не так, не очень помогло. Никаких тестов не было написано (несмотря на то, что требовали этого правила проекта). GPT-5-Codex требуется НАМНОГО дольше ~20 минут. Внесенные изменения были гораздо более глубокими, но он реализовал надлежащую обработку ошибок, много крайних случаев и написал тесты без моего предложения сделать это (правила проекта уже требуют этого). Вызовы API прошли гладко. Вся функция работала отлично. Мой вывод ясен: GPT-5-Codex - явный победитель, даже не близкий. Я буду брать 20 минут каждый раз, зная, что проделанная работа похожа на работу, проделанную старшим разработчиком. 3 минуты меня очень удивили, и я надеялся увидеть отличные результаты за такой короткий промежуток времени. Но, конечно, быстрая и грязная, глючная реализация без тестов - это не то, что я хотел. https://www.reddit.com/r/Anthropic/comments/1ntnwb8/sonnet_45_is_available_now/