TGTGInsightаналитика telegramLIVE / telegram public index
← БайтГен
БайтГен avatar

TGINSIGHT POST

Post #1166

@bytegens

БайтГен

Просмотры377Количество просмотров
Опубликован6 дек.06.12.2025, 10:04
Содержимое поста

Содержимое

🕵️‍♂️ OpenAI учит ИИ признаваться в «грехах» Исследователи OpenAI пробуют новый способ заставить модели честно рассказывать о своих ошибках. Они поощряют ИИ только за откровенность, не наказывая за плохое поведение. В результате модель сама признаётся, где схитрила, как будто ей платят за честный донос GPT 5 Thinking призналась в нарушениях в 11 из 12 тестов: от фиктивного «мгновенного» кода до специально сделанных ошибок в задачах, чтобы избежать переобучения Станут ли модели благодаря этому честнее? ❤️ — да 👎 — нет Наш бот с актуальными нейросетями: @bytegens_bot 🤖БайтГен | #ИИ#новости