Содержимое
📊Как оценить эффект воздействия, если в эксперименте нет интересуемого исхода? В новой статье Сьюзан Эйти (Stanford University), Радж Четти (Harvard University) и Хидо Имбенс (Stanford University, лауреат Нобелевской премии по экономике 2021 года) предлагают новый метод — Experimental Selection Correction (ESC), или экспериментальная коррекция селекции(Athey et al., 2025) Представьте, что вы хотите понять, влияет ли обучение в меньшем классе в начальной школе на вероятность того, что ученик в будущем закончит школу: 🟤У вас есть экспериментальные данные из проекта STAR в Теннесси: там детей случайным образом распределяли по классам разного размера, и вы наблюдаете их тесты в младших классах (Krueger, 1999). Но выпуск из школы (главный исход) в этих данных не фиксировался, потому что за детьми не следили до старших классов 🟤Также у вас есть административные данные (наблюдаемые) по школам Нью-Йорка, где видно, в каком классе учился ученик, какие у него были тесты и закончил ли он школу. Но здесь размер класса не случайный: он может зависеть от академических проблем, языка, инвалидности, решений школы 🟤В результате в одних данных есть случайность, но нет нужного исхода; в других — есть всё, но нет надёжной причинной идентификации ⏮Что делали раньше: суррогатные переменные Когда главный результат (например, выпуск) недоступен, исследователи часто использовали суррогаты (surrogate index method) — промежуточные переменные, реагирующие на воздействие и предсказывающие интересующий исход (Athey et al., 2019) Использование суррогатов предполагает, что: 🟤Весь эффект воздействия проходит только через суррогат (Prentice, 1989) 🟤Нет скрытых переменных между суррогатом и главным исходом 🟤Эта связь стабильна между выборками ❗️Но на практике эти условия почти всегда нарушаются (Heckman et al., 2006;Chetty et al., 2011), что приводит к смещённым оценкам ⏮Новый подход: экспериментальная коррекция селекции (ESC) Метод ESC состоит из нескольких этапов: 🟤Использует эксперимент, чтобы оценить «чистый» эффект воздействия на суррогат 🟤Сравнивает его с наблюдаемым эффектом в реальных данных 🟤Интерпретирует разницу как селекцию 🟤Добавляет её как корректирующий компонент при оценке главного эффекта 🔥 Методологически это очень похоже на коррекцию Хекмана (Heckman, 1979), где сначала моделируется механизм селекции, а затем в основное уравнение добавляется корректирующий член 🔥 А еще ESC можно рассматривать как контрольную функцию в духе (Imbens, Newey, 2009), только построенную на эксперименте ⏮ Главное допущение ESC — латентная несмещённость 🟤Латентная несмещённость (latent unconfoundedness) — это допущение о том, что все скрытые (латентные) факторы, влияющие как на суррогатный исход, так и на главный интересующий результат, уже проявляют себя в поведении суррогата 🟤Если два ученика похожи по результатам теста (суррогат), то они также в среднем будут похожи и по вероятности выпускa из школы (главный исход) — даже если у нас нет полной информации об их бэкграунде, мотивации или семье 🟤Это немного напоминает условную независимость (conditional independence assumption), которую мы обычно предполагаем в мэтчинге 🟤Но это допущение намного слабее, чем то, что требует суррогатный подход (Athey et al., 2025) ⏮ Так что там со школьниками? 🟤В наблюдаемых данных Нью-Йорка наивная МНК-регрессия показывает: меньший класс снижает вероятность выпускa из школы на 1.76 п.п. — результат явно смещён из-за селекции (например, дети с особыми потребностями чаще учатся в маленьких классах) 🟤После применения ESC оценка становится +0.69 п.п., что согласуется с экспериментальными эффектами на тесты (Chetty et al., 2011) и указывает на положительное влияние меньших классов 🟤Авторы показали, что даже расширенный контроль по наблюдаемым переменным не устраняет смещение — а ESC справляется Обычно эксперименты — штука долгая, дорогая и ресурсоемкая, а использование наблюдаемых данных вместе с такими корректирующими методами, как ESC, позволяет делать надежные каузальные выводы без увеличения издержек #канал_обозревает @causal_channel