Лекция 3_02_03_2015.ppt
- Количество слайдов: 146
Лекция 3: Статистика в клеточной биологии и в клинических исследованиях 1
Упорядоченный посев и пуассонер – высокоточная техника количественной микробиологии МЕДИЦИНА. XXI ВЕК № 2 (11) 2008, c. 92 -97 2
Н. Н. Хромов-Борисов, Jenifer Saffi , Joao A. P. Henriques Упорядоченный посев и пуассонер – высокоточная техника количественной микробиологии 3
Упорядоченный посев 4
Симеон Дени Пуассон (Siméon Denis Poisson, 21. 06. 1781— 25. 04. 1840) 5
Распределение Пуассона • Распределение числа событий, происходящих в фиксированном временнóм или пространственном интервале (объеме), • при условии, • что эти события независимы и что • вероятность совпадения (попадания в одну точку пространства) или одновременного наступления двух и более событий пренебрежимо мала. 6
Распределение Пуассона • • • P(k) = e-λλk/k! e = 2, 71828 – основание натурального логарифма k! = 1·2·…(k-1)·k – факториал Характеристическое свойство раcпределения Пуассона – его математическое ожидание (среднее значение) и дисперсия равны другу: • Ek* = Dk* = λ, т. е. это распределение имеет всего лишь один параметр λ. 7
Пуассонер 8
Сравнение упорядоченного посева с обычным методом 9
Воспроизводимость 10
Распределения числа колоний дрожжей на десяти чашках Петри, порожденные пуассонером, и их сравнение с распределением числа колоний, полученных традиционным методом посева. 11
Пуассоновость 12
Среднеквадратичное отклонение (стандартная ошибка среднего) • Поскольку математическое ожидание (среднее значение) и дисперсия распределения Пуассона равны другу: • Ek* = Dk* = λ, • то его среднеквадратичное отклонение есть: • SE = √Dk* = √λ 13
Элементы планирования экспериментов 14
Счетная камера Горяева (гемацитометер) 15
Клетки в камере Горяева 16
Как подсчитывать клетки в камере Горяева • • • N ± √N Сколько клеток надо подсчитать, чтобы относительная ошибка составила 5%? Ответ: ~ 400 Решение: SE = √ 400 = 20 20 : 400 = 0, 05 17
• Сколько клеток надо подсчитать, чтобы относительная ошибка составила 1%? 18
• Так сколько же клеток надо подсчитать, чтобы относительная ошибка составила 1%? • Ответ: ~ 10 000 • Решение: • SE = √ 10 000 = 100 • 100 : 10 000 = 0, 01 19
Молитва и сепсис 20
Leonard Leibovici, Университет Тель-Авива, Израиль • Основные научные интересы: • Бактериальные инфекции и антибиотикотерапия; • Компьютеризация медицинских исследований; • Медицинская этика; • Доказательная медицина. • 21
Leonard Leibovici Effects of remote, retroactive intercessory prayer on outcomes in patients with bloodstream infection: randomised controlled trial // BMJ, 2001. – Vol. 323. – P. 1450 -1451. • Методы • Выборку из 3393 пациентов с заражением крови (с сепсисом) рандомизированно, т. е. случайным образом разбили на две группы – контрольную (1702 пациента) и опытную (1691 пациент). • Перечень имен пациентов во второй группе был передан человеку, который произносил краткую молитву за улучшение здоровья и полное выздоровление всей этой группы целиком. • Пациенты, за которых молились, об этом не знали. 22
Основные характеристики двух групп пациентов 23
Результаты Группа Умерло Выжило Всего Без молитвы 514 0, 270, 300, 34 1188 1702 С молитвой 475 0, 250, 280, 32 1216 1691 Всего 989 0, 260, 290, 31 2404 3393 Проверка независимости (однородности) Точное P-значение Pexact = 0, 19 Бейзов фактор BF 01 = 12, 7 Связь между молитвой и смертностью от сепсиса статистически незначима (Pval = 0, 19 > 0, 05). Полученное значение бейзова фактора (BF 01 = 12, 7) показывает, что примерно в 13 раз более правдоподобно получить такие данные, когда эта связь действительно отсутствует, чем когда она есть. Молитва, скорее всего, не влияет на смертность при сепсисе. 24
• Различие эффектов в опыте и в контроле можно выражать абсолютными и (или) относительными показателями (величинами). • И те и другие имеют свои преимущества и недостатки. • В повседневной клинической практике абсолютные показатели считаются более показательными и интерпретируемыми. 25
Основные меры эффекта в таблицах 2 х2 • Разность долей (рисков) – RD (Risk Difference) • Отношение рисков (долей) – RR (Risk Ratio) • Отношение оддов (шансов за/против) – OR (Odds Ratio) • Число подлежащих воздействию – NNT (Number Needed to Treat) 26
Таблица 2× 2 Группа Исход (эффект) Всего Неблагоприятный Благоприятный Контроль a b a + b Опыт c d c + d Всего a + c b + d N Разность долей RD = [c/(c + d)] - [a/(a + b)] Отношение долей RR = [c/(c + d)] : [a/(a + b)] Отношение оддов OR = ad/bc Число подлежащих воздействию NNT = 1/RD 27
Принципы построения бейзовских статистических оценок 28
Бейзовский Доверительный (правдоподобный) Интервал (ДИ) 29
Использованные программы • • • Моделирование подбрасывания монет: http: //www. random. org/coins/ и http: //www. random. org/coins/ Построение графиков бета-распределения: http: //keisan. casio. com/has 10/Spec. Exec. cgi Вычисление бейзовских доверительных интервалов для долей: Программа Le. PAC version 2. 0. 38 http: //www. univ-rouen. fr/LMRS/Persopage/Lecoutre/PAC. htm и http: //www. causascientia. org/math_stat/Proportion. CI. html 30
Порождение распределения для доли выпадения орлов φ(H) Нет информации Beta(a* = 1, b* = 1) 31
Точечные и интервальные статистические оценки доли выпадения орлов φ(H) 3 H : 7 T; n = 10 Beta(a* = 4, b* = 8) Статистические оценки Шири- Уров. Точеч- Границы ДИ на ДИ ни довеные Ниж- Верхрия ние 0, 11 0, 50 95% 0, 07 0, 69 0, 62 99% 0, 04 0, 32 0, 61 0, 78 0, 74 99, 9% Плотность бета распределения Beta(a = 4, b = 8) 32
Точечные и интервальные статистические оценки доли выпадения орлов φ(H) 47 H : 53 T; n = 100; Beta(a* = 48, b* = 54) 527 H : 473 T; n=1000; Beta(a* = 528, b* = 474) Статистические оценки Точечная Границы ДИ Ширина ДИ Уровни доверия Верхние 0, 38 0, 47 Нижние 0, 58 0, 20 0, 60 0, 25 99% 0, 31 0, 63 0, 32 99, 9% Точечная Границы ДИ Ширина ДИ Уровни доверия 0, 53 Нижние Верхние 0, 50 95% 0, 35 Статистические оценки 0, 56 0, 06 95% 0, 49 0, 57 0, 08 99% 0, 48 0, 58 0, 10 99, 9% 33
Точечные и интервальные статистические оценки доли выпадения орлов φ(H) 5111 H : 4889 T; n = 10 000; Более тонкий масштаб Beta(a* = 5112, b* = 4890) Статистические оценки Точечн ая Границы ДИ Ширина ДИ Уровни довер ия Верхние 0, 501 0, 511 Нижние 0, 521 0, 020 95% 0, 498 0, 524 0, 026 99% 0, 495 0, 528 0, 033 99, 9% 34
Программа Le. PAC http: //www. univ-rouen. fr/LMRS/Persopage/Lecoutre/PAC. htm 35
Оценка доли скончавшихся в контрольной группе, φ1 в программе Le. PAC 36
Плотность распределения и 99, 9%-й ДИ для оцениваемой доли скончавшихся в контрольной группе, φ1 φ1 = 0, 270, 300, 34 37
Оценка доли скончавшихся в группе подвергнутых воздействию молитвы φ2 в программе Le. PAC 38
Плотность распределения и 99, 9%-й ДИ для доли скончавшихся в группе подвергнутых воздействию молитвы, φ2 φ2 = 0, 250, 280, 32 39
Плотности распределения для долей скончавшихся от сепсиса в группах пациентов, подвернутых (φ1) и не подвергнутых молитве (φ2) 40
Оценка неизвестной разности долей RDunkn = δ = φ1 - φ2 в программе Le. PAC 41
Плотность распределения и 95%-й ДИ для оцениваемой разности долей RDunkn = δ = φ1 - φ2 RD = -0, 0090, 0210, 052 42
Плотность распределения для оцениваемой разности долей δ = φ1 - φ2 = RD в допустимых границах от -1 до +1 43
95%, 99% и 99, 9% ДИ для оцениваемой разности долей RDunkn = δ = φ1 - φ2 Уровень доверия ДИ Границы Ширина Нижняя Верхняя 95% - 0, 009 0, 052 0, 061 99% - 0, 019 0, 061 0, 080 99, 9% - 0, 030 0, 072 0, 102 Когда доли равны (φ1 = φ2) , то их разность равна нулю: RD = δ = φ1 - φ2 = 0. Все три полученных ДИ для оцениваемой разности долей RDunkn содержат значение RD = 0. Это дает нам основание утверждать, что, скорее всего, оцениваемое этими интервалами неизвестное нам значение RDunkn статистически не отличается от нуля и, соответственно, первая и вторая доли статистически одинаковы. Основной вывод: Молитва, скорее всего, не влияет на смертность при сепсисе. 44
Что такое отношение рисков, RR = τ ? • Это есть отношение двух условных вероятностей (долей), например, доли скончавшихся в контрольной группе φ1 к доле скончавшихся в опытной группе φ2: • RR = φ1 / φ2 45
Оценка неизвестного отношения долей (рисков) RRunkn = τ = φ1 / φ2 в программе Le. PAC 46
Плотность распределения и 95%-й ДИ для оцениваемого отношения долей (рисков) RRunkn = τ = φ1 / φ2 RR = 0, 971, 081, 19 47
95%, 99% и 99, 9% ДИ для оцениваемого отношения долей RRunkn = τ = φ1 / φ2 Уровень доверия ДИ Границы Ширина Нижняя Верхняя 95% 0, 97 1, 19 0, 061 99% 0, 94 1, 23 0, 080 99, 9% 0, 90 1, 28 0, 102 Когда доли равны (φ1 = φ2), то их отношение равно единице: RR = τ = φ1 / φ2 = 1. Все три полученных ДИ для оцениваемого отношения долей RRunkn содержат значение RR = 1. Это дает нам основание утверждать, что, скорее всего, оцениваемое этими интервалами неизвестное нам значение RRunkn статистически не отличается от 1, соответственно, первая и вторая доли статистически одинаковы. Основной вывод: Молитва, скорее всего, не влияет на смертность при сепсисе. 48
Что такое «отношение шансов» , OR? • Это «трехэтажное» отношение: • 1. Вероятность есть отношение количества исходов k, благоприятствующих данному событию (A) к общему количеству исходов N: • P(A) = k / N • 2. Шансы (Odds) суть ставки за и против, т. е. отношение вероятности данного события P(A) к вероятности противоположного события P(non. A) = 1 – P(A): • Odds = P(A) : [1 - P(A)] = k / (N – k) • 3. Отношение шансов (OR – Odds Ratio) есть отношение шансов за и против события A к шансам за и против события B: • OR = {P(A) / [1 - P(A)]} : {P(B) / [1 - P(B)]} 49
Оценка неизвестного отношения оддов (шансов за/против) ORunkn = ω = [φ1 / (1 - φ1)] : [φ2 / (1 - φ2)] в программе Le. PAC 50
Плотность распределения и 95%-й ДИ для оцениваемого отношения оддов (шансов за/против), ORunkn = ω = [φ1 / (1 - φ1)] : [φ2 / (1 - φ2)] OR = 0, 961, 111, 28 51
95%, 99% и 99, 9% ДИ для оцениваемого отношения оддов (шансов за/против) OR = ω = [φ1 / (1 - φ1)] : [φ2 / (1 - φ2)] Уровень доверия ДИ Границы Ширина Нижняя Верхняя 95% 0, 96 1, 28 0, 061 99% 0, 91 1, 35 0, 080 99, 9% 0, 86 1, 42 0, 102 Когда доли равны, то отношение оддов равно единице: OR = ω = [φ1 / (1 - φ1)] : [φ2 / (1 - φ2)] = 1. Все три полученных ДИ для оцениваемого отношения оддов ORunkn содержат значение OR = 1. Это дает нам основание утверждать, что, скорее всего, оцениваемое этими интервалами неизвестное нам значение ORunkn статистически не отличается от 1, соответственно, первая и вторая доли статистически одинаковы. Основной вывод: Молитва, скорее всего, не влияет на смертность при сепсисе. 52
Результаты • Смертность в опытной группе была примерно на 2% ниже, чем в контрольной, однако наблюдаемое различие между долями φ1 и φ2 является статистически незначимым, т. е. оказывается кажущимся. • φ1 = 0, 270, 300, 34 • φ2 = 0, 250, 280, 32 • RD = δ = φ1 – φ2 = -0, 0300, 0210, 072 содержит значение 0. • RR = τ = φ1 / φ2 = 0, 901, 071, 28 • OR = ω = [φ1(1 - φ1)] / [φ2(1 -φ2)] = 0, 861, 111, 42 – оба содержат значение 1. 53
Ошибки I и II рода и мощность статистического критерия 54
Диагностика Тест Болезнь Положительный (T+) Отрицательный (T-) Есть (D+) Чувствительность Se = P(T+|D+) X Ложный «негатив» (1 – Se) = P(T-|D+) Нет (D-) X Ложный «позитив» (1 – Sp) = P(T+|D-) Специфичность Sp = P(T-|D-) 55
Теория Неймана-Пирсона: Ошибки I и II рода, уровень значимости α и мощность критерия Power = (1 – β) Действительность Критерий H 0 отклонена (принята H 1) H 0 не отклонена Верна H 1: ES 0 Верное решение Мощность (1 - ) X Ошибка II рода с вероятностью Верна Ho: ES = 0 X Ошибка I рода с вероятностью Верное решение (1 – α) 56
H 1: есть беременность; H 0: нет беременности Истинный позитив, верна H 1 Ложный негатив, ошибка II рода, ложная беспечность Ложный позитив, ошибка I рода, ложная тревога Истинный негатив, верна H 0 57
Судебные ошибки Вердикт: подозреваемый Действительность: подозреваемый H 1: виновен H 0: невиновен Верное решение Неверное решение (Ошибка первого рода, ложное осуждение) Невиновен Неверное решение (Ошибка второго рода, ложное оправдание) Верное решение 58
Ошибки I и II рода Результат применения статистического критерия Решено принять H 1 и отклонить H 0 Верная гипотеза H 1 H 0 H 1 верно принята H 0 верно отклонена Вероятность (1 – β) – мощность H 1 неверно принята H 0 неверно отклонена, (Ошибка первого рода, ложная тревога) Вероятность α – уровень значимости H 0 неверно принята H 1 неверно отклонена, Решено принять H 0 (Ошибка второго рода, и отклонить H 1 недостаточная бдительность) Вероятность β H 0 верно принята, H 1 верно отклонена Вероятность (1 – α) 59
Мощность статистического критерия • Мощность статистического критерия (теста) аналогична чувствительности диагностического теста. • Подобно тому как для оценки чувствительности диагностического теста нам нужны безошибочные сведения о наличии (D+) или об отсутствии (D-) болезни, так и для оценки мощности статистического теста нам нужны безошибочные сведения об истинной справедливости нулевой (H 0) и альтернативной (H 1) гипотез. 60
Компромисс • Например, в случае металлодетектора • повышение чувствительности прибора приведёт к увеличению риска ошибки первого рода (ложная тревога), а • понижение чувствительности - к увеличению риска ошибки второго рода (пропуск запрещённого предмета, потеря бдительности). 61
• Анализ мощности основан на предположении, что верна альтернативная гипотеза H 1, например, о том, что разность долей RD не равна нулю: • H 1: RD ≠ 0. • Но этого недостаточно. • Необходимо знать конкретное значение разности долей δ 1: • H 1: RD = δ 1 ≠ 0. • Только при таком условии мы можем ответить на вопрос, какова вероятность того, что эксперимент с заданной разностью долей эффекта δ 1 и с определенным объемом выборки n приведет к статистически значимому результату, если верна данная альтернативная гипотеза. • При этом мы должны заранее выбрать тот или иной уровень значимости: • α = 0, 05; 0, 01 или 0, 001 62
Анализ статистической мощности a priori или post-hoc • Анализ мощности можно проводить либо a priori, т. е. до получения данных, либо post hoc, т. е. после получения данных. • A priori анализ мощности обычно используется для оценки объемов выборок ni, необходимых для достижения желаемой мощности Powerexp при заданном размере эффекта ESexp. • Post hoc анализ мощности используется для оценки достигнутой мощности Powerach. • В этом случае предполагается, что наблюдаемый эффект ESobs и его варьирование равны истинным значениям параметров. 63
Оценка (post hoc) достигнутой мощности критерия при уровне значимости α = 0, 01: (1 – β) = 0, 098 64
Оценка (a priori) минимально необходимых объемов выборок при уровне значимости α = 0, 01 и мощности (1 – β) = 0, 95: n 1 = n 2 = 18 337; N = n 1 + n 2 = 36 674 65
Стоит ли игра свеч? • Таким образом, для того, чтобы получить убедительные статистические доказательства о влиянии молитвы на выживаемость при сепсисе, нужно более чем в 10 раз увеличить объемы анализируемых выборок субъектов с сепсисом и без него. 66
Что такое NNT – количество подлежащих воздействию? • NNT – Number Needed to Treat • Среднее количество пациентов, которых надо подвергнуть (данному) воздействию, дабы предотвратить один неблагоприятный исход • (или получить один дополнительный благоприятный исход) • по сравнению с контрольной группой (без данного воздействия). 67
Прочувствуйте разницу • Утверждение: • «необходимо подвергнуть данному воздействию 50 пациентов, чтобы предотвратить один неблагоприятный исход» • информативнее и понятнее, нежели: • «данное воздействие снижает риск неблагоприятного исхода на 0, 02» 68
• Относительные меры эффекта OR, RR, часто приводят к впечатляющим цифрам, даже когда абсолютные эффекты воздействия (RD) оказываются малыми • Примеры: • 1. φ1 = 0, 6; φ1 = 0, 1; RR = 6; OR = 13, 5; • RD = 0, 5; NNT = 2 • 2. φ1 = 0, 06; φ2 = 0, 01; RR = 6; OR = 110, 06; но • RD = 0, 05 и NNT = 20 69
Программа Visual Rx http: //www. nntonline. net/visualrx/ 70
Верхняя граница ДИ для NNT - неопределенная 71
Алопеция (облысение) и ИБС 72
• Алопе ция (лысость, от др. греч. ἀλωπεκία через лат. alopecia — облысение, плешивость) — патологическое выпадение волос, приводящее к их поредению или полному исчезновению в определенных областях головы или туловища. • К наиболее распространенным видам алопеции относится андрогенетическая (androgenetic), диффузная или симптоматическая (effluviums), очаговая или гнездная (areata), рубцовая (scarring) 73
Градации облысения по Норвуду 74
Lotufo P. A. Male Pattern Baldness and Coronary Heart Disease: The Physician's Health Study Archives of Internal Medicine, 2000. – Vol. 160. – P. 165 -171. 75
Период наблюдения: 11 лет ИБС Всего есть 127 0, 0700, 0940, 123 1224 1351 нет Алопеция нет 548 0, 0580, 0670, 077 7611 8159 675 8835 9510 Всего Проверка независимости (однородности) Pval = 0, 00058 BF 01 = 0, 053 BF 10 =18, 9 Связь между алопецией и развитием ИБС статистически высоко значима (Pval = 0, 00058 ≈ 6· 10 -4). Полученное значение бейзова фактора (BF 10 =18, 9) показывает, что примерно в 19 раз более правдоподобно получить такие данные, когда эта связь действительно есть, чем когда ее нет. 76
Интерпретация убедительности Бейзовых факторов, BF 10 и BF 01 Свидетельство в пользу гипотезы Н 0 против гипотезы Н 1 >100 30 – 100 Убедительное Очень сильное 10 – 30 3 – 10 Сильное Умеренное (слабое) 1 – 3 Пренебрежимо малое BF 10 Свидетельство в пользу гипотезы Н 1 против гипотезы Н 0 77
Плотности распределения и 99, 9%-е ДИ для долей заболевших ИБС в группах с алопецией (φ1) и без нее (φ2) 78
Плотность распределения для оцениваемой разности долей (рисков), RDunkn = δ = φ1 - φ2 Когда доли равны, то их разность равна нулю: RD = δ = φ1 - φ2 = 0. Полученный 99, 9%-й ДИ для разности долей не накрывает значение RD = 0. Это дает нам основание утверждать, что, скорее всего, оцениваемое этим интервалом неизвестное нам значение RDunkn статистически значимо отличается от нуля, т. е. первая доля статистически значимо превышает вторую долю (на уровне значимости = 1 – 0, 999 = 0, 001). Основной вывод: между алопецией и ИБС, скорее всего, имеется взаимозависимость. 79
Плотность распределения для оцениваемого отношения долей (рисков), RRunkn = τ = φ1 / φ2 Когда доли равны, то их отношение равно единице: RR = τ = φ1 / φ2 = 1. Полученный 99, 9%-й ДИ для отношения долей не накрывает значение RR = 1. Это дает нам основание утверждать, что, скорее всего, неизвестное нам оцениваемое этим интервалом значение RRunkn статистически значимо (на уровне значимости = 1 – 0, 999 = 0, 001) отличается от 1 и что, соответственно, первая и вторая доли статистически различаются. Основной вывод тот же: между алопецией и ИБС, скорее всего, имеется взаимозависимость. 80
Плотность распределения для оцениваемого отношения шансов ORunkn = ω = [φ1 / (1 - φ1)] : [φ2 / (1 - φ2)] Когда доли равны, то отношение шансов равно единице: OR = ω = [φ1 / (1 - φ1)] : [φ2 / (1 - φ2)] = 1. Полученный 99, 9%-й ДИ для отношения долей не накрывает значение OR = 1. Это дает нам основание утверждать, что, скорее всего, оцениваемое этим интервалом неизвестное нам значение ORunkn статистически значимо отличается от 1 и что, соответственно, первая и вторая доли статистически различаются на уровне значимости = 1 - 0, 999 = 0, 001 Основной вывод тот же: между алопецией и ИБС, скорее всего, имеется взаимозависимость. 81
Оценка (post hoc) достигнутой мощности критерия при α = 0, 01: 1 – β = 0, 82 82
Оценка (a priori) минимально необходимых объемов выборок при α = 0, 01 и 1 – β = 0, 95: n 1 = 2 050; n 2 = 12 299; N = n 1 + n 2 = 14 349 83
Стоит ли овчинка выделки? • Таким образом, для того, чтобы получить более убедительные статистические доказательства о взаимосвязи между алопецией и заболеваемостью ИБС, нужно всего лишь в 1, 5 раза увеличить объемы анализируемых выборок субъектов с алопецией и без нее. 84
Программа Visual Rx http: //www. nntonline. net/ 85
Для предупреждения хотя бы одного случая ИБС надо «излечить» от алопеции от 18 до 1000 субъектов 86
Вербальные шкалы 87
Словесная интерпретация для градаций модуля разности долей |RD| и для числа субъектов, подлежащих воздействию NNT Интерпретация |RD| NNT < 0, 05 >20 Ничтожный 0, 05 – 0, 1 10 – 20 Малый 0, 1 – 0, 2 5 – 10 Умеренный 0, 2 – 0, 5 2 – 5 Высокий > 0, 5 < 2 Очень высокий клинического эффекта 88
Словесная интерпретация (вербальная шкала) градаций для отношения долей RR RR Интерпретация клинического эффекта 1, 0 – 3, 0 Практически ничтожный 3, 0 – 10 Слабый 10 – 33 Умеренный 33 – 100 Сильный > 100 Очень сильный 89
Словесная интерпретация (вербальная шкала) градаций для отношения шансов OR OR Интерпретация силы статистической связи 1 – 1, 5 Практически ничтожная 1, 5 – 3, 5 Очень слабая 3, 5 – 9, 0 Слабая 9, 0 – 32 Умеренная 32 – 360 Сильная > 360 Практически идеальная 90
Статистическая значимость эффекта не означает его практическую (клиническую) полезность • В нашем случае наблюдаемая связь между алопецией и заболеваемостью ИБС статистически высоко значима: • Pval = 0, 00058 ≈ 6· 10 -4 и BF 10 = 18, 9. • Однако, ее клиническая полезность ничтожна: • RD = δ = φ1 - φ2 = 0, 0010, 0270, 057 • RR = τ = φ1 / φ2 = 1, 021, 401, 89 • OR = ω = [φ1 / (1 - φ1)] : [φ2 / (1 - φ2)] = 1, 021, 452, 01 • NNT = 18381000 91
• Известно, что евнухи, когда они становятся евнухами в возрасте до 25 лет, не лысеют. • Вряд ли найдется врач, который на основании этих данных будет рекомендовать молодым людям обзаводиться детьми до 25 лет, а потом становится евнухами, чтобы не лысеть и чтобы на 2% снизить риск развития у них ИБС. • Тем не менее, это очень похоже на рекомендации медицинских генетиков, подавляющее большинство которых слишком часто бывают основаны на столь же клинически ничтожных значениях распознавательной и предсказательной способностей генетических маркеров. • Редко значения отношения шансов в этих работах превышают значение OR > 2. 92
• Целесообразно ли использовать наличие алопеции в качестве диагностического теста для ИБС? 93
Можно ли использовать наличие алопеции в качестве диагностического теста для ИБС? Алопеция и ИБС Маммография и рак молочной железы 94
Корреляция и регрессия 95
Займемся своей фигурой и здоровьем Roger W. Johnson Fitting percentage of body fat to simple body measurements Journal of Statistics Education v. 4, n. 1 (1996) http: //www. amstat. org/publications/jse/v 4 n 1/datasets. johnson. html 96
97
Возраст 98
Вес, фунты (1 lbs = 0, 4536 кг) 99
Рост, дюймы (1 inch = 2, 54 см) 100
ИМТ • Показатель индекса массы тела предложил бельгийский социолог и статистик Адольф Кетле (Adolphe Quetelet) в 1869 году. • ИМТ - индекс массы тела • BMI Body Mass Index • BMI 1 = ИМТ = W/h 2, кг/м 2 • BMI 2 = ИМТ = W 1, 2/h 3, 3, кг 1, 2/м 3, 3 • Abdel-Malek A. K. , Mukherjee D. , Roche, A. F. A method of constructing an index of obesity • Human Biology, 1985. – Vol. 57. № 3. – P. 415 -430. 101
Адольф Кетле (Ламбер Адольф Жак Кетеле; Lambert-Adolph-Jacques Quetelet; 22. 02. 1796, Гент - 17. 02. 1874 Брюссель • Бельгийский математик, астроном, метероролог, социолог. • Один из родоначальников научной статистики. • В частности он предложил индекс массы тела в 1869 году. 102
Интерпретация показателей ИМТ согласно рекомендациями ВОЗ http: //ru. wikipedia. org/wiki/Индекс_массы_тела Индекс массы тела Соответствие между массой человека и его ростом менее 16, Выраженный дефицит массы 16, 5— 18, 5 Недостаточная (дефицит) масса тела 18, 5— 25, 0 Норма 25, 0— 30, 0 Избыточная масса тела (предожирение) 30, 0— 35, 0 Ожирение первой степени 35, 0 — 40, 0 Ожирение второй степени 40 и более Ожирение третьей степени (морбидное) 103
Индекс массы тела, кг/м 2 104
Корреляция между ростом и весом 105
Корреляция между ростом и весом Оценка коэффициентов корреляции: r и r. S 106
Корреляция между массой тела и ИМТ 107
Корреляция между ростом и ИМТ 108
Плотность тела • • D = WA/[(WA – WW)/c - LV], WA – вес тела на воздухе, кг WW – вес тела в воде, кг с – температурная поправка для плотности воды LV – остаточный объем легких, л При t = 4° C, с = 1 При t = 25° C, с = 0, 997 109
Плотность тела 110
Формулы Сири (Siri, 1956) и Брожека (Brozek, 1963) для определения процентного содержания жира в организме человека • a = 1, 10 г/см 3 – плотность безжирововых тканей тела • b = 0, 9 г/см 3 – плотность жирововых тканей тела • D – плотность тела, г/см 3 • Формула Сири: • B = (1/D) × [ab/(a-b)] – [b/(a-b)] = • = 495/D – 450, % • Формула Брожека: • B = 457/D – 414, 2, % 111
Авторы формул для определения процентного содержания жира в организме человека • Brozek J. , Grande F. , Anderson J. , Keys, A. • Densitometric analysis of body composition: Revision of some quantitative assumptions, • Annals of the New York Academy of Sciences, 1963. – Vol. 110. – P. 113 -140. • Siri W. E. • Gross composition of the body. • Advances in Biological and Medical Physics (Vol. IV), • eds. J. H. Lawrence and C. A. Tobias, • New York: Academic Press, 1956. 112
Процентное содержание жира по формуле Сири (Siri, 1956) 113
Процентное содержание жира по формуле Брожека (Brozek, Siri, 1963) 114
Корреляция между плотностью тела и процентным содержанием жира 115
Корреляция между плотностью тела и процентным содержанием жира Оценка коэффициентов корреляции: r и r. S 116
Уравнение линейной регрессии: зависимость процентного содержания жира от плотности тела – метод нименьших квадратов 117
Уравнение линейной регрессии: интервальная оценка 118
119
Корреляция между общим весом и весом без жира 120
Корреляция между возрастом и процентным содержанием жира 121
Корреляция между возрастом и весом 122
Корреляция между окружностью талии и окружностью бедер 123
Основной критерий диагностики метаболического синдрома – центральное ожирение, определяемое по объёму талии • Критерии ВОЗ: наличие центрального ожирения: • индекс «талия–бедра» – ИТБ > 0, 9 у мужчин и > 0, 85 у женщин • или > 1, 0 у мужчин и > 0, 8 у женщин. • Критерии Национальной образовательной программы по холестерину США (NCEP): абдоминальное ожирение: • окружность талии: > 102 cм у мужчин и > 88 см у женщин. • Критерии Международной диабетической ассоциации (2005 г. ): центральным ожирением для европейцев рекомендовано считать: окружность талии > 94 см у мужчин и > 80 см у женщин. 124
Корреляция между систолическим и диастолическим артериальным давлением 125
Систолическое артериальное давление 126
127
128
129
130
131
132
Вербальные шкалы 133
Надежность доверительных интервалов (ДИ) Уровень значимости доверия α 100(1 – α)% 0, 05 95% Низкая 0, 01 99% Средняя 0, 001 99, 9% Высокая Степень надёжности ДИ 134
Возможные словесные интерпретации для градаций Se и Sp Se = P(T+|D+) Чувствительность «позитивов» к наличию болезни 0, 0 – 0, 5 Практически бесполезная 0, 5 – 0, 7 Низкая 0, 7 – 0, 9 Средняя 0, 9 – 1, 0 Высокая Sp = P(T-|D-) Специфичность «негативов» в отношении отсутствия болезни 135
Возможные словесные интерпретации для градаций PPV и NPV PPV = P(D+|T+) Способность «позитивов» предсказывать наличие болезни 0, 0 – 0, 5 Практически бесполезная 0, 5 – 0, 7 Низкая 0, 7 – 0, 9 Средняя 0, 9 – 1, 0 Высокая NPV = P(D-|T-) Способность «негативов» предсказывать отсутствие болезни 136
Принятые словесные интерпретации для градаций LR[+] и LR[-] LR[+] Повышение посттестовых шансов за/против наличия болезни у субъекта с позитивом по сравнению с претестовыми шансами за/против наличия у него болезни 1 – 3 Практически ничтожное 3 – 10 Малое 10 – 33 Среднее 33 – 100 Высокое 100 – 1000 Очень высокое > 1000 Практически идеальное LR[-] Повышение посттестовых шансов за/против отсутствия болезни у субъекта с негативом по сравнению с претестовыми шансами за/против отсутствия у него болезни 137
Словесные интерпретации для градаций AUC 1, 0 – 0, 9 Способность диагностического теста распознавать наличие или отсутствие болезни Отличная 0, 8 – 0, 9 Хорошая 0, 7 – 0, 8 Удовлетворительная 0, 6 – 0, 7 Посредственная 0, 5 – 0, 6 Неудовлетворительная Интервал AUC 138
Традиционная интерпретация значений Pval и шкала Michelin Значение Pval Статистическая значимость > 0, 05 Незначимо 0, 05 – 0, 01 Умеренно значимо * 0, 01 – 0, 001 Значимо ** < 0, 001 Высоко значимо *** Шкала Мишлена 139
Калибровка Р-значений Нижняя граница для вероятности нулевой гипотезы P(H 0) Верхняя граница для вероятности воспроизведения Рrepr 0, 05 > 30% < 50% 0, 01 > 10% < 73% 0, 001 > 2% < 90% P-значение Для наглядности значения в таблице округлены до первой значащей цифры. Более точно значения для P(H 0) (сверху вниз) равны 29%, 11% и 1, 8%. Posavac E. J. Using p values to estimate the probability of statistically significant replication // Understanding Statistics, 2002. – Vol. 1. – No. 2. – P. 101 -112. 140
Интерпретация убедительности Бейзовых факторов, BF 10 и BF 01 Свидетельство в пользу гипотезы Н 0 против гипотезы Н 1 >100 30 – 100 Убедительное Очень сильное 10 – 30 3 – 10 Сильное Умеренное (слабое) 1 – 3 Пренебрежимо малое BF 10 Свидетельство в пользу гипотезы Н 1 против гипотезы Н 0 141
Интерпретация стандартизированного размера эффекта по Коуэну d. C http: //www. sportsci. org/resource/stats/ Размер эффекта, d. C Градация эффекта 0 – 0, 2 Ничтожный 0, 2 – 0, 5 Малый 0, 5 – 1, 0 Средний 1, 0 – 2, 0 Большой 2, 0 – 4, 0 Очень большой 4, 0 - Исключительно большой 142
Словесная интерпретация для градаций модуля разности долей |RD| и для числа субъектов, подлежащих воздействию NNT Интерпретация |RD| NNT < 0, 05 >20 Ничтожный 0, 05 – 0, 1 10 – 20 Малый 0, 1 – 0, 2 5 – 10 Умеренный 0, 2 – 0, 5 2 – 5 Высокий > 0, 5 < 2 Очень высокий клинического эффекта 143
Словесная интерпретация (вербальная шкала) градаций для отношения долей RR RR Интерпретация клинического эффекта 1, 0 – 3, 0 Практически ничтожный 3, 0 – 10 Слабый 10 – 33 Умеренный 33 – 100 Сильный > 100 Очень сильный 144
Словесная интерпретация (вербальная шкала) градаций для отношения шансов OR OR Интерпретация силы статистической связи 1 – 1, 5 Практически ничтожная 1, 5 – 3, 5 Очень слабая 3, 5 – 9, 0 Слабая 9, 0 – 32 Умеренная 32 – 360 Сильная > 360 Практически идеальная 145
Спасибо за внимание! Слайды доступны для всех Никита Николаевич Хромов-Борисов Кафедра медицинской информатики ПСПб. ГМУ им. акад. И. П. Павлова Nikita. Khromov. Borisov@gmail. com 8 -952 -204 -89 -49 146
Лекция 3_02_03_2015.ppt