Содержимое
🥸 Откуда у ИИ-моделей предрассудки? Оказалось, что обученные на тоннах человеческого контента ИИ-модели естественным образом впитывают из него предрассудки, стереотипы и шаблоны — и воспроизводят предубеждения в ответах. Так называемый AI Bias проявляется по-разному. Например, генератор картинок Stable Diffusion считает, что генеральные директора, политики и юристы, врачи и другие представители престижных профессий — белые мужчины. Если модель попросить нарисовать преступника, нейросеть значительно чаще выдаст изображение чернокожего мужчины. Кассиры в понимании ИИ — женщины, а все террористы — с бородой. Аналогичный эффект замечала и команда Midjourney, и создатели чат-ботов. Языковые модели, в свою очередь, значительно чаще предлагают женщинам более низкие зарплаты, чем мужчинам, при прочих равных. 🙈 С этим можно бороться? Универсального решения нет. Можно тщательнее фильтровать данные, но их сокращение негативно скажется на качестве. Можно генерировать данные искусственно, но есть риск, что в этом случае нейросети только глубже закрепят стереотипы. Другой подход, на этапе пост-тренировки компенсировать «перекосы» в данных наградой модели за «толерантные» ответы, но в этом случае появляется риск сделать нейросеть слишком снисходительной. При этом в самом крайнем случае через чур «усредненная» нейросеть может оказаться банально неинтересной как собеседник и ассистент, лишившись этой обратной стороны «человечности». А вы доверяете мнению нейросетей? ❤️ — да, ИИ объективен 🔥 — нет, ИИ все искажает 👀 — зависит от вопроса... #теория@EDU4Telegrambot