TGTGInsightаналитика telegramLIVE / telegram public index
Содержимое поста
Содержимое
🕵️♂️ OpenAI учит ИИ признаваться в «грехах» Исследователи OpenAI пробуют новый способ заставить модели честно рассказывать о своих ошибках. Они поощряют ИИ только за откровенность, не наказывая за плохое поведение. В результате модель сама признаётся, где схитрила, как будто ей платят за честный донос GPT 5 Thinking призналась в нарушениях в 11 из 12 тестов: от фиктивного «мгновенного» кода до специально сделанных ошибок в задачах, чтобы избежать переобучения Станут ли модели благодаря этому честнее? ❤️ — да 👎 — нет Наш бот с актуальными нейросетями: @bytegens_bot 🤖БайтГен | #ИИ#новости