Содержимое
Можно ли анализировать музыку как текст? Этим вопросом задались ученые СПбГУ, ИТМО и Университета Виктории (Канада). В ноябре вышло исследование, в котором методы лингвистической стилометрии были применены к музыкальным данным – прежде всего для решения задач классификации и определения авторства произведений. В качестве материала исследователи использовали корпус классической музыки MusicNet. Произведения в формате MIDI они представили как последовательности токенов и протестировали два подхода: 1) статистический анализ частот токенов (методы delta) 2) статистические векторные эмбеддинги (Word2Vec и Doc2Vec). Результат: инструменты, привычные для лингвистов, действительно работают на музыкальном материале – пусть и не идеально. Частотные модели демонстрируют устойчивые результаты в задачах классификации, а эмбеддинги оказываются перспективными для кластеризации. Отдельно отмечается, что лемматизация аккордов повышает качество анализа. DH-специалисты расширяют рамки: применять лингвистические методы анализа можно не только к музыке, но и, например, к шахматам. Препринт Бориса Орехова, в котором записи шахматных партий рассматриваются как тексты (последовательности «слов»), стал победителем DH AWARDS 2024 в номинации «DH SHORT PUBLICATION». Иллюстрация: Nano Banana