Post #653

@ebm_base

Ebm_base

Просмотры815Количество просмотров

Опубликован12 окт.12.10.2024, 12:40

Содержимое поста

Содержимое

а здесь все те же самые симуляции, как и описанные прежде, но с одним изменением! Тут данные взяты из популяции с экспоненциальным распределением признака, т.е. распределение не соответсвует нормальному. И тут уже на 1 и 2 рисунке можно увидеть новый интересный момент. MW чаще отклоняет Н0 (Expected value1 = Expected value2), которая верна. Но зато быстрее обнаруживает ситуации, когда она неверна. И случайные выбросы в двух выборках эту картину не меняют. А вот на 3 рисунке мы четко начинаем видеть, что MW начинает лучше видеть разницу. Особенно на графике A. Где граница уже «неверности» Н0 из-за выбросов в одной группе? Не находит ли он различия слишком рано? Или мб t-тест находит слишком поздно? В общем вопросов прибавилось)) Но! Важный поинт: даже при распределении, не соответсвующем нормальному, t-тест остается достаточно устойчивым при верной Н0, но слабее в сравнении с MW при неверной Н0. А в каком мире живем на самом деле, мы не знаем 🤷‍♂️ Надеюсь это поможет понять, что «простые» статистические тесты не так просты, как кажутся А вообще надо изучать свои данные (EDA), изучать предположения о данных в популяции (распределение, механизм генерации), проверять на ошибки, формулировать гипотезы заранее и подбирать тесты с учетом всех вышеизложенных факторов А не потому что на схемке нарисована стрелочка.