TGTGInsightаналитика telegramLIVE / telegram public index
К списку каналов
Ebm_base avatar

TGINSIGHT CHAT

Ebm_base

@ebm_base

Медицина

Альтернативное, дополнительное, неэкологичное пространство для рассказов о доказательной медицине, статистике, эпидемиологии и прочим ужасам 👀 Клоун, автор и организатор журнального клуба @Nik_Burlov База: https://instagram.com/ebm_base

Подписчики3,820Текущее число подписчиков
Постов902Проиндексировано постов
Охват14,379Просмотры последних постов
Последние посты

Последние посты

Стр. 11 из 76 · 902 постов

Опубликован 28 окт.

ответ на эту критику от этой группы тоже есть - https://doi.org/10.1080/19466315.2022.2103180, но я не нашла его полностью )) хотя очень любопытно было бы почитать его весь

1,750 views

Опубликован 28 окт.

Кстати, в FDA есть рабочая группа по непропорциональным рискам (Cross-Pharma Non-proportional Hazards Working Group) - можно почитать их рекомендации (нет, у них нет своей странички в интернете, я нашла их случайно, есть несколько публикаций и презентаций) - например, https://ww2.amstat.org/meetings/biop/2020/onlineprogram/handouts/SC5-Handouts.pdf или https://doi.org/10.1080/19466315.2021.1874507. Не знаю, насколько они на практике являются устоявшимся в FDA, но статьи с критикой этого подхода (рекомендуемого этой группой MaxCombo теста, в частности) тоже есть (например, https://doi.org/10.1080/19466315.2021.2008485).

1,660 views

Опубликован 28 окт.

Вообще тут же сложность еще с непропорциональными рисками в том, что их бы заранее, на этапе планирования исследования, выбора экстиманда и, соответственно, теста/ модели, предвидеть. Причем не просто предвидеть их наличие, но и то, как эта непропорциональность может быть устроена - от этого (т.е. того, как устроена альтернатива нулевой гипотезе о равенстве выживаемости/ хазардов в группах) зависит и мощность теста, а значит, и его выбор. Все логранги, включая MaхCombo, теряют мощность при пересекающихся хазардах (именно хазардах, что может происходить и без пересечения кривых выживаемости, просто пересечение последних - это самый крайний вариант). Вот в этой статье как раз показано, как разные тесты работают в зависимости от того, как устроен эффект. Соответственно, нужно как-то заранее предположить, как он может быть устроен - исходя, из клинических соображений (например, в зависит от различий в механизме действия, если речь о сравнении разных опций терапии). Но. Даже если клинически мы будем предполагать, что риски пропорциональны, они потом могут оказаться непропорциональными из-за интеркуррентных событий или модификатора эффекта (эффект сильно разный в подгруппах), а такое предугадать бывает сложнее... Поэтому прежде чем бросаться подбирать подходящий тест (если мы его заранее не запланировали), я бы попробовала найти причину непропорциональности, особенно если она является "неожиданной" и необъяснимой клинически. Поскольку бороться с некоторыми причинами видимой непропорциональности нужно не с помощью альтернативных тестов или моделей выживаемости. Если же про тесты говорить, то в той же статье есть и про их недостатки. Например, при отложенном эффекте, если мы используем взвешенный логранг с большим весом более поздним событиям, мы практически не штрафуем за ранние события, т.е. как бы цена одного и того же события получается разная, что тоже вызывает вопросы, в том числе с точки зрения этики. И там же еще одна важная мысль, что тесты тестами, но вопрос об оценке эффекта остается. Например, даже если мы посчитаем какой-нибудь взвешенный HR, то мы его интерпретировать должны уже в привязке к тому периоду, по которому мы выживаемость сравнивали + и взвешенный, и невзвешенный HR в случае непропорциональности зависят от распределения времени до цензурирования, что как бы мешает делать вывод в отношении времени до события.

1,350 views

Опубликован 28 окт.

Интересно и наглядно. 1 таблица - как ведут себя разные тесты (конкретно p-value) при нарушении пропорциональности рисков (non-PH or crossing hazards). 2 таблица - при сохранении PH (точнее не отклонено допущение о PH). Очень часто используют log-rank test в онкологических трайлах. Но в случаях нарушения PH лучше бы использовать альтернативы. Полезно посмотреть статью (как минимум), чтобы узнать, что анализ выживаемости - это не только кривые КМ, лог-ранг и регрессия Кокса.

1,150 views

Опубликован 27 окт.

Эфир уже на нашем RUTUBE канале ⬇️⬇️⬇️ https://rutube.ru/video/9f40f123394e08d6f75e0eddc65a7de8/?r=plwm #эфир

1,060 views

Hashtags

Опубликован 26 окт.

Он как токсичный подорожник

1,330 views

Опубликован 26 окт.

Речь об одном препарате, но думаю в описание канала тоже смотрелось бы неплохо))) У кого-нибудь ещё есть предложения по подходящим характеристикам канала?

1,430 views

Опубликован 26 окт.

Ebm_base pinned «ЭТО НЕ НА ВАС РАССЧИТАНО И ВООБЩЕ НЕВОЗМОЖНО Читая книги, статьи, смотря видео по статистике, я понял, что лучше избегать категоричных фраз. Или, на крайний случай, иметь в кармане пару ссылок для подтверждение мнения. В общем, как обычно "это зависит..."…»

views

Опубликован 26 окт.

1,270 views

Опубликован 26 окт.

Когда увидите в КР FLOT+дурвалумаб, то вспоминайте этот слайд 😁

1,250 views

Опубликован 26 окт.

⚡️Меньше часа до эфира⚡️ Подключение в 17:00 🕔 здесь https://my.mts-link.ru/j/20600430/1906102850 А тем временем ИИ сгенерировал нам баннер 😅 #эфир#СТАТИСТИКА_ПРОСТО

1,150 views

Опубликован 26 окт.

SUTVA (Stable Unit Treatment Value Assumption). Стабильность воздействия на экспериментальный объект. Один из важных принципов честного АБ тестирования. Этот принцип предполагает, что поведение одного участника эксперимента не зависит от поведения других участников эксперимента. Чтобы понять лучше давайте посмотрим примеры 🗂 Сервис для заполнения бухгалтерской отчетности Вы развиваете такой сервис и решили провести АБ тест. Половине пользователей показываете старую версию интерфейса, а половине новую. Вроде все нормально, но могут быть проблемы. Представьте, компании в которых несколько бухгалтеров - пользователей сервиса и все они сидят в одном кабинете. Кто-то из них получил старый интерфейс, а кто-то новый. И вот уже Галя кричит: Тамара Ивановна посмотри, куда у меня делись все кнопки (она получила тестовую версию), Тамара Ивановна смотрит на новый интерфейс Галины и говорит, а у меня все по старому (она в контрольной группе). Через 5 минут они уже звонят в тех поддержку, чтобы выяснить что за фигня. Короче эксперимент сломался, пользователи повлияли друг на друга и увидели оба варианта. 🚕 Сервис вызова такси Предположим у нас мобильное приложение по заказу такси и мы хотим протестировать новый алгоритм назначения цены поездок. В среднем стоимость поездки будет выше в тестовой версии, чем в контрольной версии. Как обычно делим пользователей на 2 группы тест и контроль, но могут быть проблемы. У нас ведь есть водители, которым интересно брать наиболее прибыльные заказы, а так как у пользователей тестовой группы цены в среднем выше, то и больше водителей будет откликаться на эти заказы. Может сложиться ситуация, что свободных водителей готовых браться за заказы от контрольной группы останется совсем мало и пользователи контрольной группы не смогут вызвать такси из-за этого. Т.е. воздействие на тестовую группу опосредовано через водителей повлияло и на контрольную группу. 💰 Кэшбек в банке Предположим вы банк и вы вводите супер клевый кэшбек 5% на все. Решаете протестировать и делаете классический АБ тест. Одной группе не даете новый кэшбек, другой даете. Согласитесь, что кэшбек 5% - классно и вы скорее всего расскажите о нем своим родственникам и друзьям, которые также могут быть клиентами банка, но если они попадут в контрольную группу, то такого классного кэшбека у них не будет и они расстроятся. Т.е. экспериментальное воздействие неявно повлияло на поведение контрольной группы. Что делать в таких ситуациях? Если знаете - пишите в комменты. Если хотите узнать, то поставьте 👍 и я расскажу в следующих постах о подходах для работы с экспериментами в подобных ситуациях.

979 views
12•••5•••910111213•••15•••20•••25•••30•••35•••40•••45•••50•••55•••60•••65•••70•••7576