Содержимое
Появилась технология «машинного забывания», которая позволяет удалять конкретные данные из уже обученных ИИ-моделей без их полного переобучения. Сейчас, если правообладатель обнаруживает, что его произведение использовалось для обучения ИИ без разрешения, единственный способ исправить ситуацию — полностью переобучить модель. Это стоит миллионы долларов и занимает месяцы, поэтому компании предпочитают судиться или выплачивать компенсации. Новая технология позволяет «стереть» из памяти ИИ конкретные книги, статьи или другие произведения без ущерба для общей производительности модели. Масштаб проблемы показывает недавнее соглашение Anthropic с авторами на $1,5 млрд за использование сотен тысяч книг при обучении Claude. С новым методом такие конфликты можно было бы решать не через суды, а техническим путем — просто удаляя спорный контент. Пока технология протестирована только на простых моделях. Применение к ChatGPT и аналогичным системам потребует серьезной доработки.