Вербальные шкалы_26_02_2013.ppt
- Количество слайдов: 21
Вербальные шкалы
Надежность доверительных интервалов (ДИ) Уровень значимости α Уровень доверия Степень надёжности ДИ 100(1 – α)% 0, 05 95% Низкая 0, 01 99% Средняя 0, 001 99, 9% Высокая 2
Традиционная интерпретация P-значений (шкала Michelin) P-значение Статистическая значимость Шкала Мишлена > 0, 05 Незначимо 0, 05 – 0, 01 Умеренно значимо * 0, 01 – 0, 001 Значимо ** < 0, 001 Высоко значимо *** 3 3
Глотов Н. В. , Животовский Л. А. , Хованов Н. В. , Хромов-Борисов Н. Н. Биометрия, Л. : Изд-во ЛГУ, 1982. – 264 с. • Выбор уровня значимости определяется важностью биологических выводов, которые должен сделать экспериментатор. • В настоящее время многие биометрики склоняются к следующему правилу: • а) если P > 0, 05, то принимается нулевая гипотеза; • б) если P < 0, 01, то нулевая гипотеза отклоняется и принимается конкурирующая; • в) если 0, 01 < P < 0, 05, то результат считается неопределенным. 4 4
[0, 05; 0, 01] – «серая зона» P-значение Статистическая значимость Шкала Мишлена > 0, 05 Незначимо От 0, 05 до 0, 01 Неопределенно * От 0, 01 до 0, 001 Значимо ** < 0, 001 Высоко значимо *** 5 5
Калибровка P-значения • Sellke T. , Bayarri M. J. , Berger J. O. Calibration of p values for testing precise null hypotheses // The American Statistician, 2001. - Vol. 55. - No. 1. – P. 62 -71. • При 6 6
Калибровка Р-значений Нижняя граница для вероятности нулевой гипотезы P(H 0) Верхняя граница для вероятности воспроизведения Рrepr 0, 05 > 30% < 50% 0, 01 > 10% < 73% 0, 001 > 2% < 90% P-значение Для наглядности значения в таблице округлены до первой значащей цифры. Более точно значения для P(H 0) (сверху вниз) равны 29%, 11% и 1, 8%. Posavac E. J. Using p values to estimate the probability of statistically significant replication // Understanding Statistics, 2002. – Vol. 1. – No. 2. – P. 101 -112. 7 7
Идеальный и бесполезный тесты в терминах чувствительности Se и специфичности Sp • Если тест идеальный, то • Se = 1 и Sp = 1. • Если • Se ≤ 0, 5 и Sp ≤ 0, 5, • то тест следует признать бесполезным. 8
Возможные словесные интерпретации для градаций чувствительности диагностического теста Se Se = P(T+|D+) Чувствительность «позитивов» к наличию у субъекта болезни 0, 0 – 0, 5 Практически бесполезная 0, 5 – 0, 7 Низкая 0, 7 – 0, 9 Средняя 0, 9 – 1, 0 Высокая 9
Возможные словесные интерпретации для градаций специфичности диагностического теста Sp Sp = P(T-|D-) Специфичность «негативов» в отношении отсутствия у субъекта болезни 0, 0 – 0, 5 Практически бесполезная 0, 5 – 0, 7 Низкая 0, 7 – 0, 9 Средняя 0, 9 – 1, 0 Высокая 10
Идеальный и бесполезный тесты в терминах отношений правдоподобий LR • Если тест идеальный, то • LR[+] = ∞ и LR[-] = ∞. • Если • LR[+] ≤ 1 и LR[-] ≤ 1, • то тест следует признать бесполезным. 11
Принятые словесные интерпретации для градаций LR[+] = P(T+|D+) : P(T+|D-) Повышение посттестовых шансов за/против наличия болезни у субъекта с «позитивом» по сравнению с претестовыми шансами за/против наличия у него болезни 1– 3 Практически ничтожное 3 – 10 Малое 10 – 33 Среднее 33 – 100 Высокое 100 – 1000 Очень высокое 12
Принятые словесные интерпретации для градаций LR[-] = P(T-|D-) : P(T-|D+) Повышение посттестовых шансов за/против отсутствия болезни у субъекта с «негативом» по сравнению с претестовыми шансами за/против отсутствия у него болезни 1– 3 Практически ничтожное 3 – 10 Малое 10 – 33 Среднее 33 – 100 Высокое 100 – 1000 Очень высокое 13
Идеальный и бесполезный тесты в терминах предсказательных вероятностей PPV и NPV • В терминах предсказательных вероятностей: • Если тест идеальный, то • PPV = 1 и NPV = 1. • Если • PPV ≤ P(D+) и NPV ≤ P(D-), • то тест следует признать бесполезным. 14
Идеальный и бесполезный тесты в терминах AUC • Если тест идеальный, то • AUC = 1. • Если • AUC ≤ 0, 5, • то тест бесполезен. 15
Словесные интерпретации для градаций AUC Диапазон AUC Способность диагностического теста распознавать наличие или отсутствие болезни 1, 0 – 0, 9 Отличная 0, 8 – 0, 9 Хорошая 0, 7 – 0, 8 Удовлетворительная 0, 6 – 0, 7 Посредственная 0, 5 – 0, 6 Неудовлетворительная 16
Интерпретация стандартизированного размера эффекта по Коуэну d. C http: //www. sportsci. org/resource/stats/ Размер эффекта, d. C Градация эффекта 0 – 0, 2 Ничтожный 0, 2 – 0, 6 Малый 0, 6 – 1, 2 Умеренный 1, 2 – 2, 0 Большой 2, 0 – 4, 0 Очень большой 4, 0 - Исключительно большой 17 17
Интерпретация убедительности Бейзовых факторов, BF 10 и BF 01 BF 10 Свидетельство в пользу гипотезы Н 1 против гипотезы Н 0 BF 01 Свидетельство в пользу гипотезы Н 0 против гипотезы Н 1 >100 Убедительное <0, 01 Убедительное 30 – 100 Очень сильное 0, 01 – 0, 03 Очень сильное 10 – 30 Сильное 0, 03 – 0, 1 Сильное 3 – 10 Умеренное 0, 1 – 0, 3 Умеренное 1– 3 Пренебрежимо малое 0, 3 - 1 Пренебрежимо малое 18
Словесная интерпретация (вербальная шкала) градаций OR OR Интерпретация силы статистической связи 1 – 1, 5 Практически ничтожная 1, 5 – 3, 5 Очень слабая 3, 5 – 9, 0 Слабая 9, 0 – 32 Умеренная 32 – 360 Сильная >360 Практически идеальная 19
Словесные интерпретации для разности долей RD (или δ) Интервалы значений RD 0, 0 – 0, 1 Практическая важность разности долей Ничтожная 0, 1 – 0, 3 – 0, 6 – 0, 9 – 1, 0 Малая Умеренная Большая Очень большая
Словесная интерпретация NNT – числа субъектов, подлежащих воздействию NNT Интерпретация клинического эффекта Ничтожный >5 Слабый 2– 5 Сильный <2 Очень сильный
Вербальные шкалы_26_02_2013.ppt