Содержимое
И в продолжение конструирования постов — где-то на просторах Reddit'a я нашел настоящий царь-промпт для улучшения собственных промптов. То есть, Царь-Мета-Промпт, Ваше Величество. Он настолько большой, что не влезет в пост, поэтому даю на него ссылку. А мы попробуем проанализировать, какие приемы тут применялись, то есть проведем мета-анализ Царь-Мета-Промпта. Промпт содержит 35 критериев проверки, что само по себе очень круто. Человекам трудно удерживать более 5 критериев, поэтому фреймворки из предыдущего поста все из 4-5 букв (кроме КОМПОЗИТОРа, который, конечно, очень сложно запомнить, несмотря на мнемонику). Но 35! Это уже слишком. Критерии вот такие: 1. Ясность и конкретность 2. Предоставленный контекст/бэкграунд 3. Чёткое определение задачи 4. Реализуемость в рамках ограничений модели 5. Избегание двусмысленности или противоречий 6. Соответствие модели/целесообразность сценария 7. Желаемый формат/стиль вывода 8. Использование роли или персоны 9. Стимулирование пошагового рассуждения 10. Структурированные/пронумерованные инструкции 11. Баланс краткости и детализации 12. Потенциал итерации/уточнения 13. Примеры или демонстрации 14. Обработка неопределённости/пробелов 15. Минимизация галлюцинаций 16. Осознание границ знаний 17. Спецификация аудитории 18. Эмуляция или имитация стиля 19. Запоминание (многоходовые системы) 20. Триггеры метапознания 21. Управление дивергентным и конвергентным мышлением 22. Гипотетическое переключение рамок 23. Безопасный режим отказа 24. Постепенная сложность 25. Соответствие метрикам оценки 26. Запросы на калибровку 27. Зацепки для проверки вывода 28. Запрос на оценку времени/усилий 29. Этическая согласованность или смягчение предвзятости 30. Раскрытие ограничений 31. Способность к сжатию/резюмированию 32. Междисциплинарное взаимодействие 33. Калибровка эмоционального резонанса 34. Категоризация рисков вывода 35. Циклы самовосстановления Выглядит впечатляюще. Сразу скажу, что модели не делают и половину из этого, ну или относятся очень поверхностно к оценке. Но тут всегда можно попросить уточнить и углубиться. Что с этим предлагается сделать для каждого критерия (напоминаю — мы оцениваем поданный на вход промпт): — присвой оценку от 1 (Плохо) до 5 (Отлично) — укажи одно явное достоинство — предложи одно конкретное улучшение — предоставь краткое обоснование оценки (1–2 предложения) Это уже очень неплохой подход для оценки чего бы то ни было. В конце, понятно, считается общий балл. Дальше тоже интересно, про проверки: Проверь свою оценку: - Случайно проверь 3–5 своих оценок на предмет согласованности. - Внеси изменения, если обнаружены расхождения. Смоделируй противоположную точку зрения: - Кратко представь, как критически настроенный рецензент мог бы оспорить твои оценки. - Внеси корректировки, если появятся убедительные альтернативные точки зрения. Выяви предположения: - Отметь любые скрытые предубеждения, предположения или пробелы в контексте, которые ты заметил во время оценки. Совет по калибровке: Для любого критерия кратко объясни, как выглядит оценка 1/5 по сравнению с 5/5. Мне кажется, тут хороший подход к составлению промпта для оценивания. Скажу сразу, модели не делают многих вещей, которые в нём заданы. Я попробовал DeepSeek, Qwen и ChatGPT. DeepSeek самый ленивый и непонятливый — он единственный заленился с первого раза анализировать все критерии, сказал "ну и так далее", а вместо оптимизированного промпта выдал сразу упрощенный ответ, как будто он исполняет это промпт. На удивление хорошо отработал Qwen, у него, похоже, лучше получается отвечать на формализованные запросы, нужно запомнить. ChatGPT тоже немного поленился, но я использовал бесплатную версию, она недавно деградировала и теперь зажимает качество. Дальше мы применяем промпт для улучшения по результатам анализа. Я попробовал загнать написанный мной промпт (для составления концепции системы по краткому описанию) и попросить улучшить — исходник на картинке, а вот результат уже приходится приложить в виде ссылки — он стал очень подробным.