Лекция 3 Статистика в клеточной биологии и в

Лекция 3: Статистика в клеточной биологии и в клинических исследованиях 1

Упорядоченный посев и пуассонер – высокоточная техника количественной микробиологии МЕДИЦИНА. XXI ВЕК № 2 (11) 2008, c. 92 -97 2

Н. Н. Хромов-Борисов, Jenifer Saffi , Joao A. P. Henriques Упорядоченный посев и пуассонер – высокоточная техника количественной микробиологии 3

Упорядоченный посев 4

Симеон Дени Пуассон (Siméon Denis Poisson, 21. 06. 1781— 25. 04. 1840) 5

Распределение Пуассона • Распределение числа событий, происходящих в фиксированном временнóм или пространственном интервале (объеме), • при условии, • что эти события независимы и что • вероятность совпадения (попадания в одну точку пространства) или одновременного наступления двух и более событий пренебрежимо мала. 6

Распределение Пуассона • • • P(k) = e-λλk/k! e = 2, 71828 – основание натурального логарифма k! = 1·2·…(k-1)·k – факториал Характеристическое свойство раcпределения Пуассона – его математическое ожидание (среднее значение) и дисперсия равны другу: • Ek* = Dk* = λ, т. е. это распределение имеет всего лишь один параметр λ. 7

Пуассонер 8

Сравнение упорядоченного посева с обычным методом 9

Воспроизводимость 10

Распределения числа колоний дрожжей на десяти чашках Петри, порожденные пуассонером, и их сравнение с распределением числа колоний, полученных традиционным методом посева. 11

Пуассоновость 12

Среднеквадратичное отклонение (стандартная ошибка среднего) • Поскольку математическое ожидание (среднее значение) и дисперсия распределения Пуассона равны другу: • Ek* = Dk* = λ, • то его среднеквадратичное отклонение есть: • SE = √Dk* = √λ 13

Элементы планирования экспериментов 14

Счетная камера Горяева (гемацитометер) 15

Клетки в камере Горяева 16

Как подсчитывать клетки в камере Горяева • • • N ± √N Сколько клеток надо подсчитать, чтобы относительная ошибка составила 5%? Ответ: ~ 400 Решение: SE = √ 400 = 20 20 : 400 = 0, 05 17

• Сколько клеток надо подсчитать, чтобы относительная ошибка составила 1%? 18

• Так сколько же клеток надо подсчитать, чтобы относительная ошибка составила 1%? • Ответ: ~ 10 000 • Решение: • SE = √ 10 000 = 100 • 100 : 10 000 = 0, 01 19

Молитва и сепсис 20

Leonard Leibovici, Университет Тель-Авива, Израиль • Основные научные интересы: • Бактериальные инфекции и антибиотикотерапия; • Компьютеризация медицинских исследований; • Медицинская этика; • Доказательная медицина. • 21

Leonard Leibovici Effects of remote, retroactive intercessory prayer on outcomes in patients with bloodstream infection: randomised controlled trial // BMJ, 2001. – Vol. 323. – P. 1450 -1451. • Методы • Выборку из 3393 пациентов с заражением крови (с сепсисом) рандомизированно, т. е. случайным образом разбили на две группы – контрольную (1702 пациента) и опытную (1691 пациент). • Перечень имен пациентов во второй группе был передан человеку, который произносил краткую молитву за улучшение здоровья и полное выздоровление всей этой группы целиком. • Пациенты, за которых молились, об этом не знали. 22

Основные характеристики двух групп пациентов 23

Результаты Группа Умерло Выжило Всего Без молитвы 514 0, 270, 300, 34 1188 1702 С молитвой 475 0, 250, 280, 32 1216 1691 Всего 989 0, 260, 290, 31 2404 3393 Проверка независимости (однородности) Точное P-значение Pexact = 0, 19 Бейзов фактор BF 01 = 12, 7 Связь между молитвой и смертностью от сепсиса статистически незначима (Pval = 0, 19 > 0, 05). Полученное значение бейзова фактора (BF 01 = 12, 7) показывает, что примерно в 13 раз более правдоподобно получить такие данные, когда эта связь действительно отсутствует, чем когда она есть. Молитва, скорее всего, не влияет на смертность при сепсисе. 24

• Различие эффектов в опыте и в контроле можно выражать абсолютными и (или) относительными показателями (величинами). • И те и другие имеют свои преимущества и недостатки. • В повседневной клинической практике абсолютные показатели считаются более показательными и интерпретируемыми. 25

Основные меры эффекта в таблицах 2 х2 • Разность долей (рисков) – RD (Risk Difference) • Отношение рисков (долей) – RR (Risk Ratio) • Отношение оддов (шансов за/против) – OR (Odds Ratio) • Число подлежащих воздействию – NNT (Number Needed to Treat) 26

Таблица 2× 2 Группа Исход (эффект) Всего Неблагоприятный Благоприятный Контроль a b a + b Опыт c d c + d Всего a + c b + d N Разность долей RD = [c/(c + d)] - [a/(a + b)] Отношение долей RR = [c/(c + d)] : [a/(a + b)] Отношение оддов OR = ad/bc Число подлежащих воздействию NNT = 1/RD 27

Принципы построения бейзовских статистических оценок 28

Бейзовский Доверительный (правдоподобный) Интервал (ДИ) 29

Использованные программы • • • Моделирование подбрасывания монет: http: //www. random. org/coins/ и http: //www. random. org/coins/ Построение графиков бета-распределения: http: //keisan. casio. com/has 10/Spec. Exec. cgi Вычисление бейзовских доверительных интервалов для долей: Программа Le. PAC version 2. 0. 38 http: //www. univ-rouen. fr/LMRS/Persopage/Lecoutre/PAC. htm и http: //www. causascientia. org/math_stat/Proportion. CI. html 30

Порождение распределения для доли выпадения орлов φ(H) Нет информации Beta(a* = 1, b* = 1) 31

Точечные и интервальные статистические оценки доли выпадения орлов φ(H) 3 H : 7 T; n = 10 Beta(a* = 4, b* = 8) Статистические оценки Шири- Уров. Точеч- Границы ДИ на ДИ ни довеные Ниж- Верхрия ние 0, 11 0, 50 95% 0, 07 0, 69 0, 62 99% 0, 04 0, 32 0, 61 0, 78 0, 74 99, 9% Плотность бета распределения Beta(a = 4, b = 8) 32

Точечные и интервальные статистические оценки доли выпадения орлов φ(H) 47 H : 53 T; n = 100; Beta(a* = 48, b* = 54) 527 H : 473 T; n=1000; Beta(a* = 528, b* = 474) Статистические оценки Точечная Границы ДИ Ширина ДИ Уровни доверия Верхние 0, 38 0, 47 Нижние 0, 58 0, 20 0, 60 0, 25 99% 0, 31 0, 63 0, 32 99, 9% Точечная Границы ДИ Ширина ДИ Уровни доверия 0, 53 Нижние Верхние 0, 50 95% 0, 35 Статистические оценки 0, 56 0, 06 95% 0, 49 0, 57 0, 08 99% 0, 48 0, 58 0, 10 99, 9% 33

Точечные и интервальные статистические оценки доли выпадения орлов φ(H) 5111 H : 4889 T; n = 10 000; Более тонкий масштаб Beta(a* = 5112, b* = 4890) Статистические оценки Точечн ая Границы ДИ Ширина ДИ Уровни довер ия Верхние 0, 501 0, 511 Нижние 0, 521 0, 020 95% 0, 498 0, 524 0, 026 99% 0, 495 0, 528 0, 033 99, 9% 34

Программа Le. PAC http: //www. univ-rouen. fr/LMRS/Persopage/Lecoutre/PAC. htm 35

Оценка доли скончавшихся в контрольной группе, φ1 в программе Le. PAC 36

Плотность распределения и 99, 9%-й ДИ для оцениваемой доли скончавшихся в контрольной группе, φ1 φ1 = 0, 270, 300, 34 37

Оценка доли скончавшихся в группе подвергнутых воздействию молитвы φ2 в программе Le. PAC 38

Плотность распределения и 99, 9%-й ДИ для доли скончавшихся в группе подвергнутых воздействию молитвы, φ2 φ2 = 0, 250, 280, 32 39

Плотности распределения для долей скончавшихся от сепсиса в группах пациентов, подвернутых (φ1) и не подвергнутых молитве (φ2) 40

Оценка неизвестной разности долей RDunkn = δ = φ1 - φ2 в программе Le. PAC 41

Плотность распределения и 95%-й ДИ для оцениваемой разности долей RDunkn = δ = φ1 - φ2 RD = -0, 0090, 0210, 052 42

Плотность распределения для оцениваемой разности долей δ = φ1 - φ2 = RD в допустимых границах от -1 до +1 43

95%, 99% и 99, 9% ДИ для оцениваемой разности долей RDunkn = δ = φ1 - φ2 Уровень доверия ДИ Границы Ширина Нижняя Верхняя 95% - 0, 009 0, 052 0, 061 99% - 0, 019 0, 061 0, 080 99, 9% - 0, 030 0, 072 0, 102 Когда доли равны (φ1 = φ2) , то их разность равна нулю: RD = δ = φ1 - φ2 = 0. Все три полученных ДИ для оцениваемой разности долей RDunkn содержат значение RD = 0. Это дает нам основание утверждать, что, скорее всего, оцениваемое этими интервалами неизвестное нам значение RDunkn статистически не отличается от нуля и, соответственно, первая и вторая доли статистически одинаковы. Основной вывод: Молитва, скорее всего, не влияет на смертность при сепсисе. 44

Что такое отношение рисков, RR = τ ? • Это есть отношение двух условных вероятностей (долей), например, доли скончавшихся в контрольной группе φ1 к доле скончавшихся в опытной группе φ2: • RR = φ1 / φ2 45

Оценка неизвестного отношения долей (рисков) RRunkn = τ = φ1 / φ2 в программе Le. PAC 46

Плотность распределения и 95%-й ДИ для оцениваемого отношения долей (рисков) RRunkn = τ = φ1 / φ2 RR = 0, 971, 081, 19 47

95%, 99% и 99, 9% ДИ для оцениваемого отношения долей RRunkn = τ = φ1 / φ2 Уровень доверия ДИ Границы Ширина Нижняя Верхняя 95% 0, 97 1, 19 0, 061 99% 0, 94 1, 23 0, 080 99, 9% 0, 90 1, 28 0, 102 Когда доли равны (φ1 = φ2), то их отношение равно единице: RR = τ = φ1 / φ2 = 1. Все три полученных ДИ для оцениваемого отношения долей RRunkn содержат значение RR = 1. Это дает нам основание утверждать, что, скорее всего, оцениваемое этими интервалами неизвестное нам значение RRunkn статистически не отличается от 1, соответственно, первая и вторая доли статистически одинаковы. Основной вывод: Молитва, скорее всего, не влияет на смертность при сепсисе. 48

Что такое «отношение шансов» , OR? • Это «трехэтажное» отношение: • 1. Вероятность есть отношение количества исходов k, благоприятствующих данному событию (A) к общему количеству исходов N: • P(A) = k / N • 2. Шансы (Odds) суть ставки за и против, т. е. отношение вероятности данного события P(A) к вероятности противоположного события P(non. A) = 1 – P(A): • Odds = P(A) : [1 - P(A)] = k / (N – k) • 3. Отношение шансов (OR – Odds Ratio) есть отношение шансов за и против события A к шансам за и против события B: • OR = {P(A) / [1 - P(A)]} : {P(B) / [1 - P(B)]} 49

Оценка неизвестного отношения оддов (шансов за/против) ORunkn = ω = [φ1 / (1 - φ1)] : [φ2 / (1 - φ2)] в программе Le. PAC 50

Плотность распределения и 95%-й ДИ для оцениваемого отношения оддов (шансов за/против), ORunkn = ω = [φ1 / (1 - φ1)] : [φ2 / (1 - φ2)] OR = 0, 961, 111, 28 51

95%, 99% и 99, 9% ДИ для оцениваемого отношения оддов (шансов за/против) OR = ω = [φ1 / (1 - φ1)] : [φ2 / (1 - φ2)] Уровень доверия ДИ Границы Ширина Нижняя Верхняя 95% 0, 96 1, 28 0, 061 99% 0, 91 1, 35 0, 080 99, 9% 0, 86 1, 42 0, 102 Когда доли равны, то отношение оддов равно единице: OR = ω = [φ1 / (1 - φ1)] : [φ2 / (1 - φ2)] = 1. Все три полученных ДИ для оцениваемого отношения оддов ORunkn содержат значение OR = 1. Это дает нам основание утверждать, что, скорее всего, оцениваемое этими интервалами неизвестное нам значение ORunkn статистически не отличается от 1, соответственно, первая и вторая доли статистически одинаковы. Основной вывод: Молитва, скорее всего, не влияет на смертность при сепсисе. 52

Результаты • Смертность в опытной группе была примерно на 2% ниже, чем в контрольной, однако наблюдаемое различие между долями φ1 и φ2 является статистически незначимым, т. е. оказывается кажущимся. • φ1 = 0, 270, 300, 34 • φ2 = 0, 250, 280, 32 • RD = δ = φ1 – φ2 = -0, 0300, 0210, 072 содержит значение 0. • RR = τ = φ1 / φ2 = 0, 901, 071, 28 • OR = ω = [φ1(1 - φ1)] / [φ2(1 -φ2)] = 0, 861, 111, 42 – оба содержат значение 1. 53

Ошибки I и II рода и мощность статистического критерия 54

Диагностика Тест Болезнь Положительный (T+) Отрицательный (T-) Есть (D+) Чувствительность Se = P(T+|D+) X Ложный «негатив» (1 – Se) = P(T-|D+) Нет (D-) X Ложный «позитив» (1 – Sp) = P(T+|D-) Специфичность Sp = P(T-|D-) 55

Теория Неймана-Пирсона: Ошибки I и II рода, уровень значимости α и мощность критерия Power = (1 – β) Действительность Критерий H 0 отклонена (принята H 1) H 0 не отклонена Верна H 1: ES 0 Верное решение Мощность (1 - ) X Ошибка II рода с вероятностью Верна Ho: ES = 0 X Ошибка I рода с вероятностью Верное решение (1 – α) 56

H 1: есть беременность; H 0: нет беременности Истинный позитив, верна H 1 Ложный негатив, ошибка II рода, ложная беспечность Ложный позитив, ошибка I рода, ложная тревога Истинный негатив, верна H 0 57

Судебные ошибки Вердикт: подозреваемый Действительность: подозреваемый H 1: виновен H 0: невиновен Верное решение Неверное решение (Ошибка первого рода, ложное осуждение) Невиновен Неверное решение (Ошибка второго рода, ложное оправдание) Верное решение 58

Ошибки I и II рода Результат применения статистического критерия Решено принять H 1 и отклонить H 0 Верная гипотеза H 1 H 0 H 1 верно принята H 0 верно отклонена Вероятность (1 – β) – мощность H 1 неверно принята H 0 неверно отклонена, (Ошибка первого рода, ложная тревога) Вероятность α – уровень значимости H 0 неверно принята H 1 неверно отклонена, Решено принять H 0 (Ошибка второго рода, и отклонить H 1 недостаточная бдительность) Вероятность β H 0 верно принята, H 1 верно отклонена Вероятность (1 – α) 59

Мощность статистического критерия • Мощность статистического критерия (теста) аналогична чувствительности диагностического теста. • Подобно тому как для оценки чувствительности диагностического теста нам нужны безошибочные сведения о наличии (D+) или об отсутствии (D-) болезни, так и для оценки мощности статистического теста нам нужны безошибочные сведения об истинной справедливости нулевой (H 0) и альтернативной (H 1) гипотез. 60

Компромисс • Например, в случае металлодетектора • повышение чувствительности прибора приведёт к увеличению риска ошибки первого рода (ложная тревога), а • понижение чувствительности - к увеличению риска ошибки второго рода (пропуск запрещённого предмета, потеря бдительности). 61

• Анализ мощности основан на предположении, что верна альтернативная гипотеза H 1, например, о том, что разность долей RD не равна нулю: • H 1: RD ≠ 0. • Но этого недостаточно. • Необходимо знать конкретное значение разности долей δ 1: • H 1: RD = δ 1 ≠ 0. • Только при таком условии мы можем ответить на вопрос, какова вероятность того, что эксперимент с заданной разностью долей эффекта δ 1 и с определенным объемом выборки n приведет к статистически значимому результату, если верна данная альтернативная гипотеза. • При этом мы должны заранее выбрать тот или иной уровень значимости: • α = 0, 05; 0, 01 или 0, 001 62

Анализ статистической мощности a priori или post-hoc • Анализ мощности можно проводить либо a priori, т. е. до получения данных, либо post hoc, т. е. после получения данных. • A priori анализ мощности обычно используется для оценки объемов выборок ni, необходимых для достижения желаемой мощности Powerexp при заданном размере эффекта ESexp. • Post hoc анализ мощности используется для оценки достигнутой мощности Powerach. • В этом случае предполагается, что наблюдаемый эффект ESobs и его варьирование равны истинным значениям параметров. 63

Оценка (post hoc) достигнутой мощности критерия при уровне значимости α = 0, 01: (1 – β) = 0, 098 64

Оценка (a priori) минимально необходимых объемов выборок при уровне значимости α = 0, 01 и мощности (1 – β) = 0, 95: n 1 = n 2 = 18 337; N = n 1 + n 2 = 36 674 65

Стоит ли игра свеч? • Таким образом, для того, чтобы получить убедительные статистические доказательства о влиянии молитвы на выживаемость при сепсисе, нужно более чем в 10 раз увеличить объемы анализируемых выборок субъектов с сепсисом и без него. 66

Что такое NNT – количество подлежащих воздействию? • NNT – Number Needed to Treat • Среднее количество пациентов, которых надо подвергнуть (данному) воздействию, дабы предотвратить один неблагоприятный исход • (или получить один дополнительный благоприятный исход) • по сравнению с контрольной группой (без данного воздействия). 67

Прочувствуйте разницу • Утверждение: • «необходимо подвергнуть данному воздействию 50 пациентов, чтобы предотвратить один неблагоприятный исход» • информативнее и понятнее, нежели: • «данное воздействие снижает риск неблагоприятного исхода на 0, 02» 68

• Относительные меры эффекта OR, RR, часто приводят к впечатляющим цифрам, даже когда абсолютные эффекты воздействия (RD) оказываются малыми • Примеры: • 1. φ1 = 0, 6; φ1 = 0, 1; RR = 6; OR = 13, 5; • RD = 0, 5; NNT = 2 • 2. φ1 = 0, 06; φ2 = 0, 01; RR = 6; OR = 110, 06; но • RD = 0, 05 и NNT = 20 69

Программа Visual Rx http: //www. nntonline. net/visualrx/ 70

Верхняя граница ДИ для NNT - неопределенная 71

Алопеция (облысение) и ИБС 72

• Алопе ция (лысость, от др. греч. ἀλωπεκία через лат. alopecia — облысение, плешивость) — патологическое выпадение волос, приводящее к их поредению или полному исчезновению в определенных областях головы или туловища. • К наиболее распространенным видам алопеции относится андрогенетическая (androgenetic), диффузная или симптоматическая (effluviums), очаговая или гнездная (areata), рубцовая (scarring) 73

Градации облысения по Норвуду 74

Lotufo P. A. Male Pattern Baldness and Coronary Heart Disease: The Physician's Health Study Archives of Internal Medicine, 2000. – Vol. 160. – P. 165 -171. 75

Период наблюдения: 11 лет ИБС Всего есть 127 0, 0700, 0940, 123 1224 1351 нет Алопеция нет 548 0, 0580, 0670, 077 7611 8159 675 8835 9510 Всего Проверка независимости (однородности) Pval = 0, 00058 BF 01 = 0, 053 BF 10 =18, 9 Связь между алопецией и развитием ИБС статистически высоко значима (Pval = 0, 00058 ≈ 6· 10 -4). Полученное значение бейзова фактора (BF 10 =18, 9) показывает, что примерно в 19 раз более правдоподобно получить такие данные, когда эта связь действительно есть, чем когда ее нет. 76

Интерпретация убедительности Бейзовых факторов, BF 10 и BF 01 Свидетельство в пользу гипотезы Н 0 против гипотезы Н 1 >100 30 – 100 Убедительное Очень сильное 10 – 30 3 – 10 Сильное Умеренное (слабое) 1 – 3 Пренебрежимо малое BF 10 Свидетельство в пользу гипотезы Н 1 против гипотезы Н 0 77

Плотности распределения и 99, 9%-е ДИ для долей заболевших ИБС в группах с алопецией (φ1) и без нее (φ2) 78

Плотность распределения для оцениваемой разности долей (рисков), RDunkn = δ = φ1 - φ2 Когда доли равны, то их разность равна нулю: RD = δ = φ1 - φ2 = 0. Полученный 99, 9%-й ДИ для разности долей не накрывает значение RD = 0. Это дает нам основание утверждать, что, скорее всего, оцениваемое этим интервалом неизвестное нам значение RDunkn статистически значимо отличается от нуля, т. е. первая доля статистически значимо превышает вторую долю (на уровне значимости = 1 – 0, 999 = 0, 001). Основной вывод: между алопецией и ИБС, скорее всего, имеется взаимозависимость. 79

Плотность распределения для оцениваемого отношения долей (рисков), RRunkn = τ = φ1 / φ2 Когда доли равны, то их отношение равно единице: RR = τ = φ1 / φ2 = 1. Полученный 99, 9%-й ДИ для отношения долей не накрывает значение RR = 1. Это дает нам основание утверждать, что, скорее всего, неизвестное нам оцениваемое этим интервалом значение RRunkn статистически значимо (на уровне значимости = 1 – 0, 999 = 0, 001) отличается от 1 и что, соответственно, первая и вторая доли статистически различаются. Основной вывод тот же: между алопецией и ИБС, скорее всего, имеется взаимозависимость. 80

Плотность распределения для оцениваемого отношения шансов ORunkn = ω = [φ1 / (1 - φ1)] : [φ2 / (1 - φ2)] Когда доли равны, то отношение шансов равно единице: OR = ω = [φ1 / (1 - φ1)] : [φ2 / (1 - φ2)] = 1. Полученный 99, 9%-й ДИ для отношения долей не накрывает значение OR = 1. Это дает нам основание утверждать, что, скорее всего, оцениваемое этим интервалом неизвестное нам значение ORunkn статистически значимо отличается от 1 и что, соответственно, первая и вторая доли статистически различаются на уровне значимости = 1 - 0, 999 = 0, 001 Основной вывод тот же: между алопецией и ИБС, скорее всего, имеется взаимозависимость. 81

Оценка (post hoc) достигнутой мощности критерия при α = 0, 01: 1 – β = 0, 82 82

Оценка (a priori) минимально необходимых объемов выборок при α = 0, 01 и 1 – β = 0, 95: n 1 = 2 050; n 2 = 12 299; N = n 1 + n 2 = 14 349 83

Стоит ли овчинка выделки? • Таким образом, для того, чтобы получить более убедительные статистические доказательства о взаимосвязи между алопецией и заболеваемостью ИБС, нужно всего лишь в 1, 5 раза увеличить объемы анализируемых выборок субъектов с алопецией и без нее. 84

Программа Visual Rx http: //www. nntonline. net/ 85

Для предупреждения хотя бы одного случая ИБС надо «излечить» от алопеции от 18 до 1000 субъектов 86

Вербальные шкалы 87

Словесная интерпретация для градаций модуля разности долей |RD| и для числа субъектов, подлежащих воздействию NNT Интерпретация |RD| NNT < 0, 05 >20 Ничтожный 0, 05 – 0, 1 10 – 20 Малый 0, 1 – 0, 2 5 – 10 Умеренный 0, 2 – 0, 5 2 – 5 Высокий > 0, 5 < 2 Очень высокий клинического эффекта 88

Словесная интерпретация (вербальная шкала) градаций для отношения долей RR RR Интерпретация клинического эффекта 1, 0 – 3, 0 Практически ничтожный 3, 0 – 10 Слабый 10 – 33 Умеренный 33 – 100 Сильный > 100 Очень сильный 89

Словесная интерпретация (вербальная шкала) градаций для отношения шансов OR OR Интерпретация силы статистической связи 1 – 1, 5 Практически ничтожная 1, 5 – 3, 5 Очень слабая 3, 5 – 9, 0 Слабая 9, 0 – 32 Умеренная 32 – 360 Сильная > 360 Практически идеальная 90

Статистическая значимость эффекта не означает его практическую (клиническую) полезность • В нашем случае наблюдаемая связь между алопецией и заболеваемостью ИБС статистически высоко значима: • Pval = 0, 00058 ≈ 6· 10 -4 и BF 10 = 18, 9. • Однако, ее клиническая полезность ничтожна: • RD = δ = φ1 - φ2 = 0, 0010, 0270, 057 • RR = τ = φ1 / φ2 = 1, 021, 401, 89 • OR = ω = [φ1 / (1 - φ1)] : [φ2 / (1 - φ2)] = 1, 021, 452, 01 • NNT = 18381000 91

• Известно, что евнухи, когда они становятся евнухами в возрасте до 25 лет, не лысеют. • Вряд ли найдется врач, который на основании этих данных будет рекомендовать молодым людям обзаводиться детьми до 25 лет, а потом становится евнухами, чтобы не лысеть и чтобы на 2% снизить риск развития у них ИБС. • Тем не менее, это очень похоже на рекомендации медицинских генетиков, подавляющее большинство которых слишком часто бывают основаны на столь же клинически ничтожных значениях распознавательной и предсказательной способностей генетических маркеров. • Редко значения отношения шансов в этих работах превышают значение OR > 2. 92

• Целесообразно ли использовать наличие алопеции в качестве диагностического теста для ИБС? 93

Можно ли использовать наличие алопеции в качестве диагностического теста для ИБС? Алопеция и ИБС Маммография и рак молочной железы 94

Корреляция и регрессия 95

Займемся своей фигурой и здоровьем Roger W. Johnson Fitting percentage of body fat to simple body measurements Journal of Statistics Education v. 4, n. 1 (1996) http: //www. amstat. org/publications/jse/v 4 n 1/datasets. johnson. html 96

97

Возраст 98

Вес, фунты (1 lbs = 0, 4536 кг) 99

Рост, дюймы (1 inch = 2, 54 см) 100

ИМТ • Показатель индекса массы тела предложил бельгийский социолог и статистик Адольф Кетле (Adolphe Quetelet) в 1869 году. • ИМТ - индекс массы тела • BMI Body Mass Index • BMI 1 = ИМТ = W/h 2, кг/м 2 • BMI 2 = ИМТ = W 1, 2/h 3, 3, кг 1, 2/м 3, 3 • Abdel-Malek A. K. , Mukherjee D. , Roche, A. F. A method of constructing an index of obesity • Human Biology, 1985. – Vol. 57. № 3. – P. 415 -430. 101

Адольф Кетле (Ламбер Адольф Жак Кетеле; Lambert-Adolph-Jacques Quetelet; 22. 02. 1796, Гент - 17. 02. 1874 Брюссель • Бельгийский математик, астроном, метероролог, социолог. • Один из родоначальников научной статистики. • В частности он предложил индекс массы тела в 1869 году. 102

Интерпретация показателей ИМТ согласно рекомендациями ВОЗ http: //ru. wikipedia. org/wiki/Индекс_массы_тела Индекс массы тела Соответствие между массой человека и его ростом менее 16, Выраженный дефицит массы 16, 5— 18, 5 Недостаточная (дефицит) масса тела 18, 5— 25, 0 Норма 25, 0— 30, 0 Избыточная масса тела (предожирение) 30, 0— 35, 0 Ожирение первой степени 35, 0 — 40, 0 Ожирение второй степени 40 и более Ожирение третьей степени (морбидное) 103

Индекс массы тела, кг/м 2 104

Корреляция между ростом и весом 105

Корреляция между ростом и весом Оценка коэффициентов корреляции: r и r. S 106

Корреляция между массой тела и ИМТ 107

Корреляция между ростом и ИМТ 108

Плотность тела • • D = WA/[(WA – WW)/c - LV], WA – вес тела на воздухе, кг WW – вес тела в воде, кг с – температурная поправка для плотности воды LV – остаточный объем легких, л При t = 4° C, с = 1 При t = 25° C, с = 0, 997 109

Плотность тела 110

Формулы Сири (Siri, 1956) и Брожека (Brozek, 1963) для определения процентного содержания жира в организме человека • a = 1, 10 г/см 3 – плотность безжирововых тканей тела • b = 0, 9 г/см 3 – плотность жирововых тканей тела • D – плотность тела, г/см 3 • Формула Сири: • B = (1/D) × [ab/(a-b)] – [b/(a-b)] = • = 495/D – 450, % • Формула Брожека: • B = 457/D – 414, 2, % 111

Авторы формул для определения процентного содержания жира в организме человека • Brozek J. , Grande F. , Anderson J. , Keys, A. • Densitometric analysis of body composition: Revision of some quantitative assumptions, • Annals of the New York Academy of Sciences, 1963. – Vol. 110. – P. 113 -140. • Siri W. E. • Gross composition of the body. • Advances in Biological and Medical Physics (Vol. IV), • eds. J. H. Lawrence and C. A. Tobias, • New York: Academic Press, 1956. 112

Процентное содержание жира по формуле Сири (Siri, 1956) 113

Процентное содержание жира по формуле Брожека (Brozek, Siri, 1963) 114

Корреляция между плотностью тела и процентным содержанием жира 115

Корреляция между плотностью тела и процентным содержанием жира Оценка коэффициентов корреляции: r и r. S 116

Уравнение линейной регрессии: зависимость процентного содержания жира от плотности тела – метод нименьших квадратов 117

Уравнение линейной регрессии: интервальная оценка 118

119

Корреляция между общим весом и весом без жира 120

Корреляция между возрастом и процентным содержанием жира 121

Корреляция между возрастом и весом 122

Корреляция между окружностью талии и окружностью бедер 123

Основной критерий диагностики метаболического синдрома – центральное ожирение, определяемое по объёму талии • Критерии ВОЗ: наличие центрального ожирения: • индекс «талия–бедра» – ИТБ > 0, 9 у мужчин и > 0, 85 у женщин • или > 1, 0 у мужчин и > 0, 8 у женщин. • Критерии Национальной образовательной программы по холестерину США (NCEP): абдоминальное ожирение: • окружность талии: > 102 cм у мужчин и > 88 см у женщин. • Критерии Международной диабетической ассоциации (2005 г. ): центральным ожирением для европейцев рекомендовано считать: окружность талии > 94 см у мужчин и > 80 см у женщин. 124

Корреляция между систолическим и диастолическим артериальным давлением 125

Систолическое артериальное давление 126

127

128

129

130

131

132

Вербальные шкалы 133

Надежность доверительных интервалов (ДИ) Уровень значимости доверия α 100(1 – α)% 0, 05 95% Низкая 0, 01 99% Средняя 0, 001 99, 9% Высокая Степень надёжности ДИ 134

Возможные словесные интерпретации для градаций Se и Sp Se = P(T+|D+) Чувствительность «позитивов» к наличию болезни 0, 0 – 0, 5 Практически бесполезная 0, 5 – 0, 7 Низкая 0, 7 – 0, 9 Средняя 0, 9 – 1, 0 Высокая Sp = P(T-|D-) Специфичность «негативов» в отношении отсутствия болезни 135

Возможные словесные интерпретации для градаций PPV и NPV PPV = P(D+|T+) Способность «позитивов» предсказывать наличие болезни 0, 0 – 0, 5 Практически бесполезная 0, 5 – 0, 7 Низкая 0, 7 – 0, 9 Средняя 0, 9 – 1, 0 Высокая NPV = P(D-|T-) Способность «негативов» предсказывать отсутствие болезни 136

Принятые словесные интерпретации для градаций LR[+] и LR[-] LR[+] Повышение посттестовых шансов за/против наличия болезни у субъекта с позитивом по сравнению с претестовыми шансами за/против наличия у него болезни 1 – 3 Практически ничтожное 3 – 10 Малое 10 – 33 Среднее 33 – 100 Высокое 100 – 1000 Очень высокое > 1000 Практически идеальное LR[-] Повышение посттестовых шансов за/против отсутствия болезни у субъекта с негативом по сравнению с претестовыми шансами за/против отсутствия у него болезни 137

Словесные интерпретации для градаций AUC 1, 0 – 0, 9 Способность диагностического теста распознавать наличие или отсутствие болезни Отличная 0, 8 – 0, 9 Хорошая 0, 7 – 0, 8 Удовлетворительная 0, 6 – 0, 7 Посредственная 0, 5 – 0, 6 Неудовлетворительная Интервал AUC 138

Традиционная интерпретация значений Pval и шкала Michelin Значение Pval Статистическая значимость > 0, 05 Незначимо 0, 05 – 0, 01 Умеренно значимо * 0, 01 – 0, 001 Значимо ** < 0, 001 Высоко значимо *** Шкала Мишлена 139

Калибровка Р-значений Нижняя граница для вероятности нулевой гипотезы P(H 0) Верхняя граница для вероятности воспроизведения Рrepr 0, 05 > 30% < 50% 0, 01 > 10% < 73% 0, 001 > 2% < 90% P-значение Для наглядности значения в таблице округлены до первой значащей цифры. Более точно значения для P(H 0) (сверху вниз) равны 29%, 11% и 1, 8%. Posavac E. J. Using p values to estimate the probability of statistically significant replication // Understanding Statistics, 2002. – Vol. 1. – No. 2. – P. 101 -112. 140

Интерпретация убедительности Бейзовых факторов, BF 10 и BF 01 Свидетельство в пользу гипотезы Н 0 против гипотезы Н 1 >100 30 – 100 Убедительное Очень сильное 10 – 30 3 – 10 Сильное Умеренное (слабое) 1 – 3 Пренебрежимо малое BF 10 Свидетельство в пользу гипотезы Н 1 против гипотезы Н 0 141

Интерпретация стандартизированного размера эффекта по Коуэну d. C http: //www. sportsci. org/resource/stats/ Размер эффекта, d. C Градация эффекта 0 – 0, 2 Ничтожный 0, 2 – 0, 5 Малый 0, 5 – 1, 0 Средний 1, 0 – 2, 0 Большой 2, 0 – 4, 0 Очень большой 4, 0 - Исключительно большой 142

Словесная интерпретация для градаций модуля разности долей |RD| и для числа субъектов, подлежащих воздействию NNT Интерпретация |RD| NNT < 0, 05 >20 Ничтожный 0, 05 – 0, 1 10 – 20 Малый 0, 1 – 0, 2 5 – 10 Умеренный 0, 2 – 0, 5 2 – 5 Высокий > 0, 5 < 2 Очень высокий клинического эффекта 143

Словесная интерпретация (вербальная шкала) градаций для отношения долей RR RR Интерпретация клинического эффекта 1, 0 – 3, 0 Практически ничтожный 3, 0 – 10 Слабый 10 – 33 Умеренный 33 – 100 Сильный > 100 Очень сильный 144

Словесная интерпретация (вербальная шкала) градаций для отношения шансов OR OR Интерпретация силы статистической связи 1 – 1, 5 Практически ничтожная 1, 5 – 3, 5 Очень слабая 3, 5 – 9, 0 Слабая 9, 0 – 32 Умеренная 32 – 360 Сильная > 360 Практически идеальная 145

Спасибо за внимание! Слайды доступны для всех Никита Николаевич Хромов-Борисов Кафедра медицинской информатики ПСПб. ГМУ им. акад. И. П. Павлова Nikita. Khromov. Borisov@gmail. com 8 -952 -204 -89 -49 146