TGINSIGHT CHAT
Ebm_base
@ebm_base
МедицинаАльтернативное, дополнительное, неэкологичное пространство для рассказов о доказательной медицине, статистике, эпидемиологии и прочим ужасам 👀 Клоун, автор и организатор журнального клуба @Nik_Burlov База: https://instagram.com/ebm_base
Последние посты
Тег: #statistics · 4 постов
КЛАССНО, ПРОСТО, УДОБНО, НО БЕСПОЛЕЗНО? Есть интересный показатель, который кажется очень простым и удобным для клинической практики, но в действительности он скорее ненужен. Разберемся почему 🕵🏻 ❗Число необходимое для лечения (Number need to treat, NNT) - это количество пациентов, которое необходимо пролечить, чтобы получить один положительный результат лечения❗ К сожалению, не все пациенты от лечения выздоравливают. Такая суровая реальность 🤷🏻♂️ И когда мы лечим пациентов, то должны быть готовы, что 1-ый и 2-ой поправятся без лечения, у 3-ий будут осложнения даже с лечением, а 4-ому как раз наше лечение поможет (т.е. без лекарства не выздоровеет) 🤧 Сейчас я описал NNT=4 (рис.1) Рассчитывается через абсолютный риск (absolutely risk, AR, разница рисков, risk difference, RD), а точнее снижение абсолютного риска (absolutely risk reduction, ARR), формула в рис.2 🧮 ✅Что нам (как кажется) он даёт? 📍Знаем, сколько надо минимально пролечить пациентов, чтобы помочь 1-ому 📍Удобно и просто рассчитать самостоятельно в большинстве исследований 📍Понятно врачу и пациенту Но! Почти все это заблуждение! ❌ Точнее, не всё так просто, как хотелось бы... 🔸Мы не учитываем сами риски, т.е. ARR=0.02 и NNT=50 будут ОДИНАКОВЫЕ для R¹=0.03 и R²=0.01 (оба метода малоэффективны), R¹=0.98 и R²=0.96 (оба метода эффективны). А ситуации разные 🔸NNT это показатель для "среднего" пациента. Мы итак получаем усредненные оценки в исследованиях, но этот показатель гребёт всех под мифический "единый тип пациента", что в действительности не так 🔸Доверительные интервалы для NNT часто оказываются слишком большими или неинтерпретируемыми. Если у ARR в 95% ДИ будет 0 (т.е. вероятно, что снижения может не быть), то у NNT это будет ∞. Или может оказаться ДИ от 3 до 194, тогда сколько лечить? 🔸Не используется или забывается привязка ко времени. Мы получаем результаты (риски) за какой-то период, но почему-то при сообщении NNT это опускается. Также риски могут меняться с течением времени, что не имеет отражения в NNT Кажущийся простым показатель на самом деле сложен в интерпретации. Поэтому ряд статистиков не рекомендуют его применять. Ещё интересно, что в исследовании Misselbrook и Armstrong (2001) пациенты реже соглашались на лечение, когда получали информацию в NNT, a не в ARR🤯 А ведь всё так хорошо начиналось... #статистика#statistics
Hashtags
ИНТЕРЕСНО СЛОЖНО ДУМАТЬ ⠀ Регрессия - один из сложнейших и интереснейших методов в статистике 🤓 Из-за сложности формул, объяснений, количества получаемых данных некоторые так и не решаются разобраться с этим разделом. Но на самом деле вся сложность скрыта в понимании регрессионных моделей и применении их к реальным проблемам 🤖 ⠀ При этом в книгах и статьях по статистике встречается множество предположений для регрессии. И кажется, что если ваши данные не соответствуют им всем, то и не нужно применять этот метод 🙀😭 ⠀ Но это не так. Тут и скрывается понимание цели анализа, потому что она подскажет какие предположения для вас важны❗ ⠀ Рассмотрим некоторые варианты применения регрессии: ⠀ 📍 Прогнозирование. В данном случае мы хотим на основе уже известных нам данных попытаться предсказать какой-то исход📈 При этом здесь очень важна репрезентативность данных (на самом деле она необходима в любых исследованиях) ⠀ 📍 Изучение взаимосвязей. Здесь интересно узнать влияние разных факторов на исход, т.е. выявить значимые среди них 🎯 В такой ситуации, например, учитывается мультиколлинеарность факторов (связь факторов между собой вне исхода - например, на основе роста, веса и ИМТ оцениваем уровень общего белка) ⚧️ ⠀ 📍 Причинно-следственный вывод. В таком случае мы хотим узнать эффект от воздействия 🎁 И ключевой проблемой является схожесть групп или коррекция имеющихся различий. Что влечет за собой более строгое соблюдение предположений и учёт методологии исследования (контролируемость, сбор данных, их пропуски и т.д.)⛔ ⠀ Одним из важных пунктов при изучении регрессии - это применимость☝🏻 Нужно разобраться с целями исследования и анализа, понять методологию, источник и способ получения данных, определиться с исходом и т.д. 🤯 ⠀ В этом, на мой взгляд, и есть интерес (неординарность, пластичность). Но в этом и сложность (нужно думать, много думать). И это даже вдохновляет❗😎 #ebm_нюансы#статистика#statistics
КТО БЫСТРЕЕ? ⠀ В начале Ковида возросло количество "эпидемиологов". Я, к сожалению, не из них, но расскажу об одном показателе ⠀ ⚠️Заболеваемость (incidence) - это мера возникновения новых случаев заболевания/исходов в течение определенного периода времени⚠️ ⠀ Думаю, не редко слышали "заболеваемость X выросла на 4%". Почему подобные сообщения бессмысленны? В них не указано время (4% за неделю и за год имеют разный смысл) ⠀ Существуют два способа оценки заболеваемости: ⠀ 1️⃣ Cumulative incidence (CI, обшая заболеваемость) - это доля новых случаев (от подходящей выборки) в течение определенного периода времени ‼️ Картинка 1: формула и визуализация ⠀ Выражается в % или в количестве событий на 1000 человек (или больше) 👨👩👧👦 ⠀ ✅ CI удобно использовать, чтобы понимать общую вероятность случая/исхода (т.е. оценка риска). При этом временной промежуток должен соблюдаться при сборе данных и сообщаться в результатах ⠀ ❌ Но, не учитываются потери при наблюдении (если человек наблюдался меньше положенного срока) и время до возникновения случая/исхода ⠀ Поэтому есть другой метод оценки ⠀ 2️⃣ Incidence rate (IR, коэффициент заболеваемости) - мера количества новых случаев/исходов на единицу времени‼️ Т.е. по сути это скорость заболеваемости🤯 Картинка 2: формула и визуализация ⠀ Выражается в количестве событий на человеко-лет (интересный показатель)⏳ ⠀ ✅ С ее помощью можно сравнить скорость возникновения случаев/исходов у двух групп при одинаковых CI (см карусель) ⠀ ✅ Также он пластичный для интерпретации: Например, 29 на 1000 человеко-лет Это 29 случаев из 1000 человек при наблюдении в 1 год Это и 29 из 100 в 10 лет ⠀ ⚠️ Но так можно, если предполагается, что уровень заболеваемости постоянен в течение разных периодов времени ⠀ ❌ Для его расчета надо отслеживать в динамике случаи, чтобы посчитать сумму времени наблюдения ⠀ При этом его можно использовать не только для оценки "скорости" новых случаев заболеваний, а так же осложнений, летальных исходов🤓 ⠀ Нередко термины используют неправильно. С заболеваемостью это наблюдается часто (забывают про время). А многие до сих пор не знают об incidence rate 🤷🏻♂️ #ebm_epidemiology#ebm_статистика#statistics#эпидемиология#epidemiology
САМЫЙ ЖЕЛАННЫЙ Великий и могучий уровень значимости (или р, или р-value, или р-значение и т.д.). Как часто вы его встречаете в статьях, на конференциях? ИМХО, следование ему превращается порой в карго-культ 🧟♂ ⠀ ❗p-value - это вероятность получить такой или ещё более экстремальный (отличающийся) результат при условии, что верна нулевая гипотеза❗ ⠀ Сложно? Непонятно? Но это его единственное верное определение (если вы считаете иначе, то прочитайте список литературы, а потом можете подискутировать с авторами-статистиками) 🥸 ⠀ На рисунке ниже у нас есть (гипотетически) информация о характеристиках признака (рост, вес, длина ноги и пр.), и мы знаем ее среднее значение (М0). В ходе эксперимента мы получаем другое среднее (М1), которое явно не совпадает с М0. Если нулевая гипотеза (о значении М0) верна, то мы можем оценить с какой вероятностью мы могли получить М1. А если посчитает вероятность получить М1 или ещё больший (экстремальный) результат, то и получим заветное p-value (синяя область) 🫠 ⠀ И если р меньше 0,05, то мы отвергаем нулевую гипотезу и считаем, что наш результат может объяснить альтернативная гипотеза 🤔 ⠀ А почему 0,05❓ ⠀ Вот так сошлись звёзды в 20 веке, что был принят субъективный и произвольный порог в 5%. Считается, что это слишком низкая вероятность для верной нулевой гипотезы 😰 ⠀ Будем считать, мы согласились играть по таким правилам со значимым уровнем р<0,05, но у этого всего есть свои нюансы 🤬 ⠀ 1️⃣ Статистическая значимость ≠ клинической значимости. ⠀ Можно получить значимый результат, но различия будут очень малы и не иметь практического применения (нередко на больших выборках). Напротив, важный клинический результат может быть статистически незначимым (много причин), но в то же время это не доказывает, что эффекта нет 🤯 ⠀ 2️⃣ Разница между значимым и незначимым условна и формальна. ⠀ Сильно отличается 0,049 и 0,051? По этой проблеме ведутся дискуссии и споры 🗣️ ⠀ 3️⃣ p-хакинг. ⠀ Всем нужен значимый р, поэтому делают множественные сравнения ноздрей, ног, пальцев, миллион подгрупповых анализов, подбор статистических тестов, а иногда и неумышленно его находят 🤡 #ebm_нюансы#statistics#статистика#p_value