Содержимое
ТОЧНОСТЬ ИСТИНЫ ⠀ Что вы знаете о слове "bias"? Что оно означает? Когнитивную ошибку, предвзятость или смещение? Из какой оно области? Возможно вы начали что-то подозревать, потому что в статистике есть свой Bias 😱 ⠀ Но сначала вспомним (или узнаем): 🔸в генеральной совокупности (ГС) существует истинное значение параметра (true value / estimand) 🔸мы анализируем выборку каким-то статистическим методом (estimator) 🔸в результате получаем оценку параметра (estimated value / estimate) ⠀ ❗Смещение (Bias of estimator) - разница между истинным значением и нашей оценкой параметра (формула на рис.1)❗ ⠀ Если разница = 0, то оценка (а значит и метод) является несмещенной (unbiased). И соответственно наоборот. ⠀ Например (условно, рис.2), в ГС средний рост мужчин 177 см (estimand). Мы набрали выборку мужчин (n = 1000) и посчитали средний рост (estimator). Получили значение 180 см (estimate). Смещение нашей оценки 3 см или на 1,7% (bias). 🤔 ⠀ Но есть очень важный нюанс. Мы не знаем истинное значение... 🤯 Ведь для этого надо проанализировать ГС (слишком много, невозможно собрать данные, может меняться во времени). Поэтому от смещения оценки нам никуда не деться. 🤬 ⠀ Что влияет на смещение: 📍репрезентативность и размер выборки 📍пропущенные значения 📍технические способности измерения параметра 📍трансформация переменных 📍дизайн исследования (тут много аспектов) 📍выбор и настройка статистического метода ⠀ Есть различные приемы для минимизации bias, но о них надо думать и знать. ⠀ И слепо не верить точечным оценкам (estimate), а интересоваться еще оценками неопределенности (самая известная - доверительный интервал) 🫨 @ebm_base