TGTGInsightаналитика telegramLIVE / telegram public index
← Системный сдвиг
Системный сдвиг avatar

TGINSIGHT POST

Post #410

@systemswing

Системный сдвиг

Просмотры2,850Количество просмотров
Опубликован9 июл.09.07.2024, 12:55
Содержимое поста

Содержимое

А вот Claude 3.5 — другая LLM, в некоторых случаях срабатывает лучше, чем ChatGPT, даже 4o. Промпт такой же, но посмотрите на результат: — есть обобщение до "пациента" и "родственника"; — действия, порядок которых не важен, нарисованы как параллельные (не все, я бы опрос тоже распараллелил); — есть заход на обобщение тестов ("измерение жизненных показателей"); — нет вопроса про тревожную кнопку; — правда, нет и условия про проверку наличия карты, но тут вопрос — может, оно и правда не очень принципиально, нужно подумать; В общем, мне результат Claude понравился больше. Сравнить выдачу разных моделей можно на https://llmarena.ru/, я рекомендую выбирать именно GPT 4o и Claude 3.5 Sonnet — они сейчас лучшие. Остальное так себе — например, ГигаЧат мне вместо кода начал пытаться генерировать картинку, да так и не смог.