TGTGInsightаналитика telegramLIVE / telegram public index
Содержимое поста
Содержимое
Специалисты компании NeuralTrust сообщили о новой опасной методике обхода защит нейросетей, получившей название Echo Chamber. Этот способ позволяет незаметно склонять крупные языковые модели к генерации запрещённого или вредоносного контента, несмотря на встроенные ограничения и фильтры. Об этом пишет SecurityLab. В ходе тестирования специалистами NeuralTrust на популярных продуктах OpenAI и Google атака срабатывала в 80-90% случаев. NeuralTrust подчёркивает, что такая уязвимость — это прямое следствие стремления разработчиков создавать модели с развитыми способностями к рассуждению. 👉Подробнее по ссылке