21 российских музыкантов уехали в 2022 году. Мы посмотрели, что изменилось в их текстах.
Пятая волна
В феврале 2022 года из России начали уезжать музыканты. Не гастрольным туром. Насовсем.
Некоторые уехали без объяснений. Другие высказались прямо. Несколько месяцев спустя большинство из них оказались в реестре иностранных агентов Минюста.
Угадывать по интервью неудобно. Мы посчитали.
N = min(треков «до», треков «после») самых новых по дате выпуска. Иначе «до» охватывало бы 15 лет карьеры, а «после» только три.
Данные: только тексты с Genius, которые сами артисты или фанаты туда загрузили. Не все треки представлены, не все с точными датами. Это не полная дискография — архив того, что попало в публичный доступ.
Методы
Три инструмента. Читать необязательно: данные работают без этого. Но если интересно, как именно мы считали:
Дело ведётся на 21 человека
Что говорят числа
Тональность в обоих периодах «в минусе»
Тексты и до, и после отъезда слегка «в минусе».
Средний индекс тональности по корпусу: минус несколько тысячных на слово. Не признак депрессии. Рэп, рок и инди тяготеют к напряжению в текстах по умолчанию. Словарь фиксирует «война», «боль», «ненависть» чаще, чем «радость» и «счастье».
После отъезда средняя тональность почти не изменилась.
В среднем по 21 артисту сдвига нет
Статистический тест не находит значимой разницы: p = 0,53 (словарь), p = 0,76 (нейросеть). Cohen's d около нуля.
Это не значит «точно ничего не изменилось». Данных просто не хватает, чтобы утверждать обратное.
Если изменение и есть, оно меньше жанрового шума.
Но у отдельных людей разброс
Среднее по корпусу ровное. Картина по артистам нет.
У четверых из 21 словарный метод фиксирует значимый сдвиг. У четверых других то же показала нейросеть.
У Бориса Гребенщикова (иноагент) и Максима Покровского (иноагент) тональность сдвинулась к негативу. У Арсения Морозова к позитиву.
Один и тот же переезд у разных людей означал разное.
d — размер эффекта; d < 0,2 считается малым
О чём стали петь иначе
Тональность почти не сдвинулась. Темы изменились.
Статистический тест на распределение доминирующих тем между «до» и «после» показывает значимое различие: p ≈ 0,008. Это устойчивее, чем разница в «настроении».
Алгоритм нашёл 10 повторяющихся словесных кластеров. Мы назвали каждый по самым характерным словам, насколько это возможно при таком жанровом разнообразии.
Что изменилось
Доля каждой темы: среднее по всем трекам периода. Названия тем наша интерпретация топ-слов, не машинная маркировка. Наведите для деталей.
Структура текстов
Доля треков, где тема была доминирующей. Наведите для выделения.
После отъезда в текстах становится меньше тем, связанных со временем и деньгами. Растут кластеры с более прямолинейными обращениями и личными историями.
Интерпретация осторожная: тематический сдвиг устойчивый, но в разных жанрах он значит разное.
Тональность по годам
График использует все треки корпуса, не только сбалансированные, чтобы показать тренд во времени. Год по дате выпуска, а не по дате переезда.
Календарное деление (до/с 2022) используется только для визуализации тренда. Статистические тесты использовали индивидуальные даты релокации каждого артиста.
Итого
Тексты российских музыкантов и до, и после 2022 года в среднем «в минусе» по тональности. Это жанровая норма, не следствие эмиграции.
На сбалансированной выборке общего сдвига тональности нет. Словарный метод: p = 0,53; нейросеть: p = 0,76. Размер эффекта около нуля.
У части артистов личный сдвиг есть, причём в разные стороны. Четыре из 21 показали значимое изменение по словарю, ещё четыре по нейросети. У одних к негативу, у других к позитиву.
Тематический состав текстов меняется значимее, чем «настроение». χ²-тест: p ≈ 0,008. После отъезда одни словесные кластеры редеют, другие растут.
Разделение на «с особым статусом» и «без» не даёт устойчивого группового различия в тональности (p > 0,7 в обеих группах). Траектории внутри групп расходятся.
Переезд не сделал тексты единообразно мрачнее. По этим данным он связан скорее со сменой того, о чём пишут, чем с универсальным потемнением.
Ограничения исследования
Данные: только публичные тексты с Genius. Часть треков не загружена или загружена без дат. Это не полные дискографии.
Метод 1 не обрабатывает мат, жаргон и отрицания корректно. Метод 3 обучен на отзывах, не на художественных текстах. Оба приближения.
Размер корпуса небольшой: 21 артист, ~1 600 треков. Статистические выводы работают для этой выборки, а не для «всей российской музыки».
Имена артистов с официальным статусом «иностранный агент» употребляются в исследовательских целях с указанием их правового статуса в соответствии с законодательством Российской Федерации. Работа носит академический и информационный характер.
Методология подробно: METHODOLOGY_LEXICAL.md / METHODOLOGY_TOPIC_MODELING.md / METHODOLOGY_TRANSFORMERS.md
Данные и код: github.com/SlartyG/A-Study-of-Music-in-Exile
Автор: Веселов Александр




















