Содержимое
ДОВЕРЯТЬ ВАЖНО ⠀ Исследователи стараются оценить данные каким-то точечным параметром (среднее, медиана, частота). Это удобно, понятно и хорошо интерпретируется. Но конкретные показатели отличаются между людьми (межгрупповая изменчивость), что создает определенные трудности – смещаемость (при выбросах) и неопределенность (неизвестна истинная точная оценка в популяции) 👨👩👧👦 ⠀ Поэтому при анализе выборки мы используем интервальные оценки, включающие поправку на неопределенность. Наиболее популярная – доверительный интервал 🤖 ⠀ Самое дискутабельное и сложное – это его определение и интерпретация 🙄 ⠀ ❗️Доверительный интервал (ДИ, confidence interval, CI) – это интервал, сгенерированный процедурой, которая при многократных повторах выборок с вероятностью n% содержит/включает/"покрывает" истинное значение популяции (классическое определение Неймана)❗️ ⠀ Более понятно это отражено на рис.1 ⠀ Наиболее часто встречается 95% ДИ, при этом 95% выбрано путем соглашения (как и пороговый р = 0,05). Однако можно выбрать и 90% (уже), и 99% (шире) – рис.2 ⚠️ ⠀ 🟢 Самое интересное, что классическое определение работает до расчета ДИ, а после частота, с которой наблюдаемый интервал содержит истинный эффект, равна либо 100%, если он находится в его пределах, либо 0%, если нет (пациент либо жив, либо мертв) ⠀ 🔴 Зачем это знать? чтобы понимать ошибочность утверждения "конкретный 95% ДИ, представленный в исследовании, с вероятностью 95% содержит истинный размер эффекта", которое часто используется как интерпретация Но можно вычислить байесовский достоверный (апостериорный) интервал (credible interval), к которому такое утверждение применимо ⠀ 🔴 Так же ошибочно предполагать, что наблюдаемый 95% ДИ предсказывает, что 95% оценок, полученных в будущих исследованиях, будут находиться внутри этого интервала Как видно на рис. 1 они могут иметь (или не иметь в 5% случаев) пересечения ⠀ 🟢 Однако, если два 95% ДИ не перекрываются, то для разницы точной оценки с 95% ДИ мы найдем р<0,05; и соотвественно если один из интервалов содержит точечную оценку другого, для разницы мы найдем р>0,05 ⠀ 🟢 Еще интересно, что при увеличении размера выборки, ДИ будет становится уже. Т.к. наша оценка приближается к популяционной и снижается ошибка (SE) – рис.3 Сейчас практически в каждом исследовании встречаются ДИ, но часто их интерпретируют неверно. Важно помнить о его смысле, допущениях и ошибках, которые можно допустить 🙇🏻♂️ #biostatistics#биостатистика#ebm_статистика