TGTGInsightаналитика telegramLIVE / telegram public index
Содержимое поста
Содержимое
OpenAI разработала метод «Иерархия инструкций» для повышения безопасности своих языковых моделей Метод, впервые примененный в GPT-4o Mini, предотвращает манипуляции недобросовестных пользователей, отдавая приоритет исходным инструкциям разработчика. Руководитель платформы API Оливье Годеман отметил, что это защитит от инъекций промтов и атак типа “игнорировать все предыдущие инструкции”. Исследователи OpenAI планируют разрабатывать дополнительные средства защиты для ИИ-агентов. Мы из будущего