Содержимое
ЯКОБЫ ЭКСПЕРИМЕНТ В подходе causal inference (причинно-следственный вывод) наилучшим дизайном для идентификации причинности является рандомизированное контролируемое исследование (или эксперимент). Благодаря рандомизации соблюдается предположение о взаимозаменяемости, исключается конфаундинг (безусловность), а значит мы можем получить оценку (estimate) ATE. Всё классно и прекрасно (конечно тут ещё есть и другие аспекты). А если РКИ нельзя провести? Такое может быть? Например, - для выявления факторов, которые негативно влияют на здоровье (как этично рандомизировать пациента в группу вредного/опасного вмешательства?); - изучения образа жизни (как заставить и контролировать занятия бегом/употребление кофе и т.п.?); - дорого (где взять деньги размером с бюджет страны?); - орфанные заболевания (как прожить 100 лет, чтобы набрать 700 пациентов с болезнью Хатчинсона); - беременные и другие уязвимые группы (а давайте изучим тератогенный эффект у...); И другие (про другие сферы и говорить не буду) [1, 2, 3] Если для нас важно оставаться в указанном выше подходе, то вместо эксперимента нам желательно использовать квази-эксперимент 😱 Квази-экспериментальный дизайн (quasi-experimental design) применяется в условиях, когда эксперимент недоступен, и использует разные методы для повышения внутренней валидности [3, 4]. В медицине более привычен термин "нерандомизированные исследования", который, на мой взгляд, шире. Рассматривать подробно все методы не будем (мне кажется даже в рамках книги это невозможно), а лишь ответим общие черты. Считаю важным нюансом отметить, что в них мы оцениваем не ATE, а другие эффекты (условные, локальные, синтетической выборки и т.п.), и больше говорим об ассоциации (слишком смело про условную причинность, однако мне кажется тут много "но") [5, 6]. С квазиэкспериментами работать сложнее, т.к. нарушается много предположений (SUTVA, unconditional, positivity и прочие), нужны дополнительные знания из области о взаимосвязях, нужно учитывать имеющиеся данные (а значит всегда есть риск ненаблюдаемых конфаундеров или residual confounding), понимать и учитывать гетерогенность, строить сложные модели, будет требоваться большая выборка. Но есть и ряд преимуществ, которые они дают. Возможность оценивать эффект в подвыборках/группах (гетерогенных, уязвимых), изучать долгосрочные/отдаленные события, негативные предикторы, редкие явления или исходы, сложные взаимосвязи/воздействия. В них также можно достаточно гибко подходить к анализу. Но очень важно подходить к квазиэкспериментам обдуманно, как и ко всему в медицинских исследованиях. @Ebm_base