Содержимое
Появились новые доказательства в спорах о fair use для ИИ. Американские суды спрашивали: может ли обучение на книгах писателя создать конкурента его произведениям? Свежее исследование отвечает — да, может. ИИ, обученный на всех произведениях конкретного автора, генерирует тексты, которые читатели предпочитают работе студентов литературных магистратур. Эксперты в 8 раз чаще выбирали ИИ-тексты по стилю и почти вдвое чаще — по качеству. Детектор Pangram распознал 97% обычных ИИ-текстов, но только 3% дообученных. В слепом тесте участвовали 159 человек — 28 выпускников ведущих литературных программ США и 131 обычный читатель. Они оценивали отрывки в стиле 50 авторов — от нобелевских лауреатов до дебютантов. Объём данных для обучения не коррелировал с качеством имитации — модели одинаково успешно копировали и плодовитых авторов с десятками книг, и начинающих с парой произведений. Хотя некоторые стили оказались устойчивее к имитации. Параллельно разворачиваются скандалы с ИИ-компаниями. Ключевой момент для fair use — если читатели предпочитают ИИ-имитации оригинальным текстам, это прямой ущерб рынку автора. В недавних делах судьи признали теорию «размывания рынка», когда ИИ-книги вытесняют человеческие даже без прямого копирования. Но требовали доказательств такого вытеснения. Теперь они есть. 💡 Исследователи предлагают разделить два типа моделей. Универсальные (обученные на миллионах книг для общих задач) могут претендовать на fair use. Персонализированные (заточенные под конкретного автора) — вряд ли.