TGTGInsighttelegram intelligenceLIVE / telegram public index
← The Digi Doodles
The Digi Doodles avatar

TGINSIGHT POST

Post #456

@Digi_doodles

The Digi Doodles

Views14Post view count
PostedDec 2312/23/2024, 05:30 AM
Post content

Post content

#AI OpenAI обучила модели o1 и o3 «следовать» политике безопасности компании. OpenAI опубликовала исследование о "совещательном согласовании", описывающее новый метод обеспечения соответствия моделей AI ценностям их создателей. Этот подход был применен к моделям o1 и o3, чтобы они учитывали политику безопасности OpenAI во время обработки запросов после нажатия пользователем клавиши ввода. Согласно исследованию, этот метод повысил соответствие модели o1 принципам безопасности компании, снижая частоту ответов на "небезопасные" запросы и улучшая реакцию на безопасные вопросы. В условиях роста популярности и возможностей AI-моделей исследования безопасности становятся все более актуальными.