Post #796

@ebm_base

Ebm_base

Просмотры6,440Количество просмотров

Опубликован17 мар.17.03.2025, 20:59

Содержимое поста

Содержимое

ЕЩЕ! ЕЩЕ! ЕЩЕ! ДОВОЛЬНО! ПОЩАДИ... "А вот у меня n пациентов в группах, этого достаточно?" Те, кто отвечают на вопросы в чатах по статистике, вы уже закатили глаза? Этот вопрос не редкость (чаще только вопросы про нормальность и пинки Матвея, кстати рекомендую подписаться на его канал) Почему же такой "простой" вопрос вызывает так много трудностей? Для ответа на него нужно много нюансов и предположений (формулу затем посчитать не сложно, в большинстве случаев). [1] Разделим их на методологические, клинические и статистические (классификация имени клоуна Никиты, но мне кажется так удобнее объяснить или нет...) Стоит признать, что большая часть исследований в медицине это тестирование гипотез, т.е. формулируются нулевая и альтернативные гипотезы, тестируется нулевая на основе данных (насколько они согласуются с ней), делается решение отклонить или не отклонить Н0, вывод. Это ни хорошо, ни плохо. Скорее это подходит для узкого круга задач (но эти философские рассуждения оставим для комментаторов, в чате тут как раз можно прочитать). Получается, что внутри методологии любого такого исследования должна стоять гипотеза. Формулируется она определенным образом на основе клинической и статистической составляющих (в зависимости от этого могут возникать разные альтернативы), и "простые" гипотезы преимущественно встречаются в РКИ (но не всегда). Мне кажется, одной только теме гипотез и их определению можно посвятить целые книги и уроки. [2, 3] Клинически нам надо определить группы, вмешательства, срок и какой исход мы смотрим. Мы можем оценивать общую выживаемость, количество летальных исходов, интенсивность боли по ВАШ, АД и т.п. При этом необходимо предполагать/иметь какой-то базовый/референсный результат для контрольной группы, и какой клинический эффект (его размер) мы ожидаем увидеть (можно его предположить из пилотного исследования). [4, 5] Затем нужно определить какая вероятность ошибок I и II рода для нас будет достаточной. [6] Согласны ли мы со стандартным уровнем ложно-положительного результата в 5%? Мб нам лучше меньше? Потом нужно не забыть, что % доверительного интервала станет больше (если выберем ошибку I рода меньше 5%), и порог для отклонения Н0 для p-value станет меньше. А если планируем эффект измерять в относительных величинах (RR, OR, HR), то верно определить его, перевести клиническую идею в статистический показатель (снижение относительного риска на 40% = RR 0,6). Затем разобраться как его будем получать (через таблицы 2х2 или вид модели). [7] А в конце вмещается суровая реальность. Это наши ресурсы: сколько вообще возможно набрать пациентов за установленный срок, можем ли расширить срок набора, можно ли расширить количество центров, сколько необходимо финансовых затрат и т.п. И начинаются коррекции... Мб попробуем найти более выраженный эффект? А мб мы смиримся с ошибкой I рода в 10%? И т.д. [8] А если кто-то пропадет/исключится/потеряется из исследования? Надо заложить и под это ожидаемую потерю (drop out rate)... Чтобы был небольшой запас. Почему же такой "простой" вопрос вызывает так много трудностей? Оказывается, чтобы выбрать формулу и вставить в нее какие-то значения, необходимо знать нюансы и сделать достаточно предположений (иногда мне кажется, что нужно изучить всю статистику прежде, чем считать размер выборки) При этом если у вас несколько первичных конечных точек, то желательно провести расчет на каждую и выбрать наибольшую... Есть альтернативы? - Можно попробовать сделать симуляцию механизма генерации данных и посмотреть на какой примерно уровне будет достигнута необходимая для нас мощность [9] - Можно не считать, а исходить из того, что получится собрать (одобрят ли вам такой подход, особенно при финансировании?) [10] - Можно попробовать байесовские подходы [11, 12] @ebm_base