
аналитические исследования М.Г.-1.ppt
- Количество слайдов: 114
Аналитические эпидемиологически исследования Доцент М. Г. Меньшикова
Аналитические исследования – исследования, направленные на выявление причин и условий, детерминирующих те проявления заболеваемости, которые выявляются в результате описательнооценочных исследований. Они служат для вскрытия причинно-следственных связей в механизмах развития заболеваемости в конкретных условиях места и времени Черкасский Б. Л. , 2000
Аналитические исследования необходимы для выявления и количественной оценки причин возникновения и распространения болезней
Результаты аналитических исследований используют при разработке профилактических мероприятий, направленных на устранение или уменьшение степени воздействия факторов, приводящих к болезни или другим исходам
Аналитические исследования Когортное исследование Статистические методы выявления связи Случайконтроль Поперечные исследования
Аналитические исследования отвечают на вопросы n n n Почему кто-то болеет чаще, а кто-то реже? Почему где-то болеют чаще, а где-то реже? Почему когда-то болеют чаще, а когда-то реже? Уиллим Фарр (1807 -1883) основатель медицинской статистики
Задача – найти причинноследственную связь между причиной (П) и следствием (С) П ? С
Девид Юм (1711 -1776) Причина – это событие , вслед за которым наблюдается другое событие, и когда после всех событий, подобных первому, наблюдается все события подобные второму
Термины Причина n Необходимые причины n Достаточные причины n Составляющие причины n Дополнительные причины n Факторы риска
Необходимая причина – такая причина (одна или несколько), если при ее отсутствии невозможно возникновение и (или) распространение болезни.
Достаточные причины – это тот комплекс причин в присутствии которых неизбежно происходит возникновение и (или) распространение болезни.
Все факторы образующие достаточную причину называют составляющим причинами.
Модель о причинноследственных связях факторов и болезни (Ротман К. Дж. , 1976)
Дополнительные причины – это любые причины, кроме необходимой причины.
Каждая причина формирует соответствующую часть заболеваемости, которую называют этиологической долей (ЕЕ)
Этиологическая доля– это удельный вес (доля) тех случаев болезни, которые могли бы быть предотвращены при отсутствии влияния факторов риска.
Когортное исследование – исследование, в котором в течение определенного времени проводится эпидемиологическое изучение избранной группы лиц (когорты), изначально объединенной каким-либо общим признаком Черкасский Б. Л. , 2001
Когортное исследование Цель – определение причин возникновения и распространения болезней. n Когорта (в медицине) – выборка людей, объединенных общими признаками состояния здоровья, в которой ожидается возникновение случаев болезни. n Фактор риска П Причинноследственная связь С Болезнь
Алгоритм когортного исследования с одним фактором риска и одной болезнью
Алгоритм когортного исследования с тремя факторами риска и одной болезнью
Статистическая обработка данных в когортных исследованиях n n n n Группировка материала в четырехпольной таблице Инцидентность Относительный риск Атрибутивный риск Этиологическая доля Добавочный популяционный риск Отношение шансов Оценка достоверности различий (критерий Пирсона или точный критерий Фишера)
Макет четырехпольной таблицы для когортных исследований Группы Случаи болезни всего есть нет Основная группа (экспонированные) а Ь a+b Контрольная группа (неэкспонированные) с d c+d а+с b+d a+b+c+d=N Всего Таблица заполняется только абсолютными величинами
Статистическая обработка данных в когортных исследованиях n Инцидентность (RF) – риск развития болезни при наличии или отсутствии фактора риска, n RF – указывает на частоту возникновения новых случаев болезни в основной и контрольной группах
Статистическая обработка данных в когортных исследованиях Относительный риск (PR; RR) n n Используют для оценки наличия связи между фактором риска и возникновением болезни RR=1 – связь отсутствует RR>1 – изучаемый фактор приводит к болезни RR<1 – изучаемый фактор оказывает благоприятное воздействие на здоровье или
Атрибутивный риск n n Аналогичное понятие - разница рисков, абсолютная разность рисков, добавочный риск, attributable risk. Особую значимость для здравоохранения имеет показатель, именуемый атрибутивным (добавочным) риском для популяции, или популяционным атрибутивным (добавочным) риском (population attributable risk. ARP). Этот показатель выражает и частоту, и долю избыточной заболеваемости, обусловленной влиянием фактора риска не только в группе риска, но и во всей популяции, в которой «рассеяны» представители группы риска.
Атрибутивный риск в основной группе
Атрибутивный риск n Разница абсолютных рисков разных групп населения составляет атрибутивный (добавочный, избыточный) риск, т. е. дополнительный риск, порожденный действием предполагаемой причины и выраженный в той же частоте заболеваний, что и сравниваемые показатели n Атрибутивный риск для популяции отражает избыточную, возможно предотвратимую заболеваемость, которую связывают с действием определенного фактора. ARP – помогает определить приоритетные направления профилактики болезней и наиболее эффективно использовать имеющийся ресурсы. n
Пример Результаты эпидемиологического обследования (институт профессиональной кардиологии в Москве) Группа по отношению к фактору риска (мужчины 40 Курят Частота заболеваний кардиопатиями на 100 человек 5, 1 Не курят 2, 7 – 59 лет)
Атрибутивный риск у курящих мужчин 40 -59 лет в Москве составляет 2, 4 случая на 100 человек в год (5, 1 -2, 7=2, 4%). Относительный риск = 1, 8 раза (5, 1%: 2, 7%), риск развития заболевания из курящих мужчин в возрасте 40 -59 лет почти в 2 раза выше, чем у некурящих того же возраста (следует оценить статистическую значимость различий показателей заболеваемости курящих и некурящих мужчин).
Этиологическая доля n Этиологическая доля (доля добавочного риска, attributable fraction — AF, EF). Данный показатель содержит ту же информацию, что и атрибутивный риск. Этиологическая доля указывает на удельный вес случаев заболевания от изучаемого фактора риска в общем количестве больных основной группы.
Этиологическая доля (атрибутивная фракция). Рассчитывается в случаях изучения причинноследственной связи факторов риска и заболеваемости. Этиологическая доля( – это удельный вес EF) (доля) случаев болезни, которые могли бы быть предотвращены при отсутствии действия фактора риска (т. е. доля тех случаев болезни в группе риска, которая связана с непосредственным влиянием фактора риска).
частота случаев в группе ( – частота случаев в группе ( F+) F-) EF= ------------------------------------------х R частота случаев в группе ( F+) F+, F- - группы населения соответственно подверженные или неподверженные влиянию факторов риска. EF – в % или долях единицы R = 100 или 1 ( размерность показателя)
EF= 5, 1 – 2, 7 --------- х 100 = 47% 5, 1 47% случаев заболевания кардиопатиями у мужчин 40 -59 лет можно было бы предотвратить, если бы они не курили. 53% (100 % – 47%) случаев заболевания у курящих мужчин того же возраста произошли бы в любом случае, даже если бы они не курили
Использование EF: изучение достаточности необходимых и дополнительных причин; n определить и обосновать приоритетные направления профилактики заболеваемости и т. д. n
Добавочный(атрибутивный) популяционный риск n Данный показатель является аналогом этиологической доли, рассчитанным не для выборки (когорты), а для генеральной совокупности. Добавочный популяционный риск (population attributable risk, PAR) или атрибутивный риск для популяции (ARP), необходим для оценки риска возникновения предполагаемого исхода (болезни) при воздействии изучаемого фактора на популяцию.
APR – отражает избыточную, возможно предотвратимую заболеваемость в популяции, которую связывают с действием определенного фактора риска. Зависит от распространенности (р) фактора риска среди всего населения Цель применения ARP – определить приоритетные направления профилактики болезней и наиболее эффективно использовать имеющиеся ресурсы.
Р - распространенность Оценка распространенности – цель самостоятельных исследований (популяционные или составная часть эпидемиологических) n Определяется доля лиц в популяции, подверженных действию факторов риска n ARP = AR*P n AR – абсолютный (атрибутивный) риск n P – доля (в популяции) лиц подверженных действию факторов риска, выраженная в долях единиц (а не в процентах)
Пример n Доля курящих в Москве среди мужчин 40 -59 лет в среднем составляет 58% , а в долях единицы - 0, 58 n ARP = (5, 1 -2, 7)*0, 58=1, 4% n Таким образом, можно предположить, что избыточная частота вполне предотвращаемой заболеваемости кардиопатиями у всех мужчин в возрасте 40 -59 лет, составляет 1, 4 случая на 100 человек в год.
Статистическая обработка данных в когортных исследованиях n Отношение шансов (odds ratio — OR). Данный показатель указывает во сколько раз шанс заболеть в основной группе, больше шанса заболеть в контрольной группе. Отношение шансов оценивают так же, как и относительный риск.
Недостатки когортных исследований n Затруднительно проводить исследование при изучении редко встречающихся болезней (необходимо формировать когорту большой численности) Высокая стоимость, n большая продолжительность n
Достоинства когортных исследований n n Единственный способ оценки показателей абсолютного, атрибутивного, относительного риска возникновения заболевания и оценки этиологической доли случаев, связанных с предполагаемым фактором риска. Возможность выявлять редко встречающиеся причины. Возможность одновременно выявлять несколько факторов риска одного или нескольких заболеваний. Достаточно высокая достоверность выводов, связанная с тем, что в когортных исследованиях гораздо легче избежать ошибок при формировании основных и контрольных групп, так как они создаются после выявления изучаемых эффектов (заболеваний, смертей и др. ).
Исследование случай-контроль – аналитическое ретроспективное исследование, целью которого является выявление факторов риска изучаемой болезни. Основная группа – это больные с изучаемой болезнью, контрольная – не страдающие данной болезнью Покровский В. И. , 2008
Исследование случай-контроль П С Направление поиска причинно-следственных связей
Алгоритм выборочного исследования случай-контроль
Статистическая обработка данных в исследованиях случай-контроль n n Группировка материала в четырехпольной таблице Частота встречаемости факторов риска в группах сравнения Отношение шансов Этиологическая доля
Статистическая обработка полученных данных в исследованиях случайконтроль Макет четырехпольной таблицы для исследований случайконтроль Группы Больные, страдающие изучаемой болезнью Здоровые или больные, но имеющие другую болезнь Всего Фактор риска в анамнезе есть нет а b Всего a+b с d c+d а+с b+d a+b+c+d=N
Частота встречаемости факторов риска в группах сравнения n n Частота встречаемости факторов риска в основной группе (случай ) = а/(а+b) Частота встречаемости факторов риска в контрольной группе = с/(с+d) Рассчитанная частота встречаемости факторов риска отражает значение вероятности воздействия изучаемого фактора в сравниваемых группах
Отношение шансов в исследованиях случай-контроль Существует разница между показателем отношения шансов, полученных в когортных исследованиях и исследованиях случай-контроль. В когортных исследованиях рассчитывают отношение шансов заболеть при наличии или отсутствия фактора риска, а в исследованиях случай-контроль оценивают отношение шансов встретить у больных и здоровых участников предполагаемые факторы риска.
Показатель этиологической доли в исследованиях случай-контроль Показатель этиологической доли (указывает на удельный вес числа случаев воздействия искомого фактора риска, приводящего к изучаемой болезни) рассчитывают по формуле:
Достоинство исследования случай-контроль n Возможность проведения исследования независимо от распространенности изучаемой болезни Сравнительно небольшие затраты времени, сил и средств n Относительно короткая продолжительность проведения n Возможно выявление одновременно нескольких факторов риска одного заболевания n
Недостатки исследования случай-контроль n n n Невозможность выявит редко встречающиеся причины болезни. При этом невозможно оценить достоверность различай частоты встречаемости фактора риска и сделать выводы о причинно-следственной связи Невозможно количественно оценить риск возникновения болезни от предполагаемой причины Низкая достоверность выводов из-за высокой подверженности систематическим ошибкам
Поперечное (одномоментное) исследование – исследование, позволяющее изучить распространенность какого-либо заболевания и факторы его определяющие на момент обследования. Главной особенностью является то, что данные о воздействии фактора и эффекте его относятся к одному моменту времени Л. П. Зуева. , 2009
Цель поперечного (одномоментного) исследования – описание взаимосвязи между болезнью (или другими состояниями здоровья) и факторами, существующими в определенной популяции в конкретное время и оказывающими как благоприятное, так и отрицательное воздействие на людей. В рамках поперечного исследования оценивают распространенность (превалентность) случаев болезни и распространенность факторов риска, а также оценивают их сочетание Черкасский Б. Л. , 2001
Поперечное исследование n n n Одномоментные исследования часто составляют основу для решения вопросов оперативного управления в здравоохранении. Это обусловлено возможностью постоянного обновления данных о состоянии здоровья отдельных контингентов путем исследования небольших групп людей. Такое исследование выполняется в определенный момент, однако собранные факты могут касаться и событий в прошлом (например, изучение амбулаторных карт пациентов с целью установления частоты измерения артериального давления за последние 5 лет).
Этапы проведения поперечного исследования n n n n Формирование выборки (когорты) из генеральной совокупности с учетом признаков включения и исключения. Выборка должна быть качественно и количественно репрезентативной. Сбор информации о распространенности фактора риска и болезни. В результате одномоментного обследования выборки (когорты) формируют четыре группы участников. Описание клинической картины болезни, а также установление случаев воздействия предполагаемых факторов риска. Формирование гипотез о факторах риска и болезнях и их взаимосвязи. Расчет показателей. В одномоментных исследованиях, как уже упоминалось, рассчитывают показатель превалентности (распространен ности). Оценка достоверности различий Показатель превалентности периода (PR) и моментной превалентности (PRM): где А — число всех больных участников исследования, при однократном выявлении — показатель PRM, при многократном — PR; N — численность выборки (когорты); R — размерность.
Поперечное исследование – фактор риска и болезни изучают одновременно Население Сбор информации о распространенности факторов риска и болезни выборка Фактор + Болезнь + Фактор + Болезнь - Фактор Болезнь + Фактор Болезнь -
Достоинства поперечных исследований Описывает клиническую картину заболеваемости с одновременной регистрацией факта воздействия изучаемой причины. n Простой алгоритм проведения. n Информативность. n Низкие экономические затраты. n
Недостатки поперечных исследований Отсутствие группы сравнения. n Невозможно однозначно установить причинно-следственные связи, т. к. при поперечных исследованиях не получают непосредственных данных о последовательности событий (например, n избыточный вес и артрит).
Исследования связи n Цель – изучить показатели воздействия неблагоприятных факторов и их последствия Опасность возникновения ошибки о выводах, к случайные сочетания показателей распространенности какого-либо фактора и связанного с ним явления принимают за нали причинно-следственной связи между ними
Достоинства и недостатки исследования связи n n n Полученные данные не могут являться доказательством причинно-следственной связи между явлениями Используют официальную информацию о заболеваемости, различных воздействиях, экономических и других факторах Полученные выводы о причинах заболеваемости во многих случаях следует рассматривать как ориентировочные Эти исследования стимулируют проведение когортных исследований и исследований «случай-контроль» Могут иметь особое значение для формулирования новых гипотез, определяющих направления дальнейших исследований и противоэпидемических мероприятий
Определение достоверности результатов исследования n n ХИ – квадрат – критерий Пирсона Критерий Фишера
2 Х (хи-квадрат) Характеристика n Наиболее применяемый в медицинской статистике n Подходит для качественных данных n Основывается на сопоставлении частот наблюдаемых событий с теми, что могли бы иметь место, если бы события происходили случайно
Расчет коэффициента Пирсона Формула вычисления критерия в общем виде: Х 2 = ∑ [(О – Е)2 / Е] Х 2 = сумме отношений квадратов разностей фактической и ожидаемой частоты к ожидаемой. Х 2 = n (ad – bc)2 / [(a+b) (а+с) (b+d) (c+d)] n= a + b + c + d Х 2 служит для оценки статистической значимости более 3, 85) (отличия наблюдаемых частот от случайных без оценки силы влияния фактора
В таблице (ниже) приведены величины Х 2, соответствующие вероятности ошибки пер вого рода (Р) при соответствующем числе степеней свободы. Предполагается двухсторонний тест. Если величина Х 2 больше приведенной в таблице, то Р меньше соответствующей величины в заголовке колонки таблицы. Пример: Х 2 - 8 , 06; при числе степеней свободы 2 вероятность Р менее 0, 02, но более 0, 01.
Распределение Х 2 Число степеней свободы Двухсторонняя вероятность (Р) 0, 2 0, 1 0, 05 0, 02 0, 01 0, 001 1 1, 642 2, 706 3, 841 5, 412 6, 635 10, 827 2 3, 219 4, 605 4, 991 7, 824 9, 210 13, 815 3 4, 642 6, 251 7, 815 9, 837 11, 345 16, 268 4 5, 989 7, 779 9, 488 11, 668 13, 277 18, 465 5 7, 289 9, 236 11, 070 13, 388 15, 086 20, 517 6 8, 558 10, 645 12, 592 15, 033 16, 812 22, 457 7 9, 803 12, 017 14, 067 16, 622 18, 475 24, 322 8 11, 030 13, 362 15, 507 18, 168 20, 090 26, 125 9 12, 242 14, 684 16, 919 19, 679 21, 666 27, 877 10 13, 442 15, 987 18, 307 21, 161 23, 209 29, 588 11 14, 631 17, 275 19, 675 22, 618 24, 725 31, 264 12 15, 812 18, 549 21, 026 24, 054 26, 217 32, 909 13 16, 985 19, 812 22, 362 25, 472 27, 688 34, 528 14 18, 151 21, 064 23, 685 26, 873 29, 141 36, 123 15 19, 311 22, 307 24, 996 28, 259 30, 578 37, 697
Число степеней свободы = число наблюдаемых случаев минус число параметров, ограничивающих вариации. (r – 1) (c – 1) r – число строк; с – число колонок в таблице Число степеней свобода равно 1 (2 -1)*(2 -1) = 1 Сравниваем х2 = 1 с табличным Гипотеза о случайном совпадении вида бутербродов с заболеванием м. б. отвергнута с вероятностью ошибки типа I р < 0, 001
При размере таблицы сопряжения 2 х2 х2 вычисляется с поправкой Йетса. Размер поправки уменьшается по мере увеличения числа наблюдений Поправка – вычитание из разности ожидаемого и фактического числа наблюдений ½ от общего числа наблюдений (n/2), т. е. заменяем О – Е на (О – Е) – n/2 Х 2 = n ([ad-c] – n/2)2 / [(a+b) (а+с) (b+d) (c+d)] = 15, 02
Х 2 используется для независимых совокупностей; - не используется для ординарных данных; - не более 20% числа ячеек таблицы могут иметь число наблюдений менее 5 (объединение общих групп); - общее число обследованных должно быть не менее 20. -при общем числе наблюдений от 20 до 40 в каждой ячейке д. б. 5 и более наблюдений; - если х2 не применим к качественным критериям используют точеный критерий Фишера (ТКФ) -
Критические значения Фишера Ni р 1 2 3 4 б 8 10 15 20 40 60 120 ∞ N, 0, 05 0, 01 0, 05 0, 01 0, 05 0, 01 1 161 4051 18, 51 98, 50 10, 13 34, 11 7, 71 21, 20 5, 99 13, 74 5, 32 11, 26 4, 96 10, 04 4, 54 8, 68 4, 35 8, 10 4, 08 7, 31 4 7, 08 3, 92 6, 85 2 199 4999 19 99 9, 55 30, 82 6, 94 18 5, 14 10, 92 4, 46 8, 65 4, 1 7, 56 3, 68 6, 36 3, 49 5, 85 3, 23 5, 18 3, 15 4, 98 3, 07 4, 79 3 215 5403 19, 16 99, 17 9, 28 29, 46 6, 59 16, 69 4, 76 9, 78 4, 07 7, 59 3, 71 6, 55 3, 29 5, 42 3, 10 4, 94 2, 84 4, 31 2, 76 4, 13 2, 68 3, 95 4 224 5624 19, 25 9, 12 28, 71 6, 39 15, 98 4, 53 9, 15 3, 84 7, 01 3, 48 5, 99 3, 06 4, 89 2, 87 4, 43 2, 61 3, 83 2, 53 3, 65 2, 45 3, 48 6 234 5859 19, 33 99, 33 8, 94 27, 91 6, 16 15, 21 4, 28 8, 47 3, 58 6, 37 3, 22 5, 39 2, 79 4, 32 2, 60 3, 87 2, 34 3, 29 2, 25 3, 12 2, 18 2, 96 8 239 5981 19, 37 99, 75 8, 85 27, 49 6, 04 14, 80 4, 15 8, 10 3, 44 6, 03 3, 07 5, 06 2, 64 4 2, 45 3, 56 2, 18 2, 99 2, 10 2, 82 2, 02 2, 66 10 242 6056 19, 40 99, 80 8, 79 27, 23 5, 96 14, 55 4, 06 7, 87 3, 35 5, 81 2, 98 4, 85 2, 54 3, 80 2, 35 3, 37 2, 08 2, 80 1, 99 2, 63 1, 91 2, 47 15 246 6158 19, 43 99, 87 8, 70 26, 87 5, 86 14, 20 3, 94 7, 56 3, 22 5, 52 2, 84 4, 56 2, 40 3, 52 2, 20 3, 09 1, 92 2, 52 1, 84 2, 35 1. 75 2, 19 20 248 6209 19, 45 99, 90 8, 66 26, 69 5, 80 14, 02 3, 87 7, 40 3, 15 5, 36 2, 77 4, 41 2, 33 3, 37 2, 12 2, 94 1, 84 2, 37 1, 75 2, 20 1, 66 2, 03 ∞ 254, 3 6365, 9 19, 50 99, 50 8, 53 26, 13 5, 63 13, 46 3, 67 6, 88 2, 93 4, 86 2, 54 3, 91 2, 07 2, 87 1, 84 2, 42 1, 51 1, 80 1, 39 1, 60 1, 25 1, 38 0, 05 3, 84 3 2, 60 2, 37 2, 10 1, 94 1, 83 1, 67 1, 57 1, 17 0, 01 6, 63 4, 61 3, 78 3, 32 2, 80 2, 51 2, 32 2, 04 1, 88 1, 24
Экологические исследования n Экологические исследования (ЭИ) – вид эпидемиологических исследований, при которых изучают показатели воздействия неблагоприятных факторов и их последствий. n Название этого типа исследований отражает, что в них изучается влияние факторов внешней среды
Особенности экологического исследования n n Объект наблюдения популяция, выделенное по территориальному признаку (общность территории проживания) Нет четкого разделения изучаемой популяции на основную и контрольную группу Заболеваемость населения данной территории в данное время сравнивают с заболеваемостью населения других территорий, либо с заболеваемостью того же населения, но в другое время Используется только данные официальной статистики и по заболеваемости, и по факторам риска
Некоторые отличительные характеристики аналитических исследований Когортный метод исследования 1 Объект наблюдения 2 На каждого человека составляют учетные документы, включающие различные признаки в том числе факториальные Случайконтроль Экологические исследования Популяция Такой документ составляется Популяция Такой Учетные документ карты на составляется каждого человека не применяют
Некоторые отличительные характеристики аналитических исследований Когортный Случайметод контроль исследования Экологические исследования 3 Для выделения выделяемой части населения используют в основном территориальный признак (общность территории проживания) Используют как и многие другие признаки 4 Есть четкое разделение на основную (экспонируемую) и контрольную группу Есть Нет 5 Используется официальная Не Не Используется информация о заболеваемости используется и воздействий различных факторов
Экологические исследования Достоинства n n Недостатки n Не сложный сбор и описательный анализ данных Стимулирует проведение других аналитических n исследований (когортное, случайконтроль) n Недостаточная надежность, отсутствие или недоступность, официальных данных о заболеваемости и воздействий факторов риска Трудно объяснить выявленные проявления заболеваемости выводы рассматриваются как ориентированные. Результат ЭИ – определение новых гипотез и выявление зон повышенного внимания
Измерение связи Статистическая связь – закономерные изменения величины одного признака при изменении другого n Статистическая оценка связи не выявляет причинно-следственные связи n
Статистическая оценка связи Причинноследственные связи Увеличение первой величины вместе со второй не означает, что увеличение первой обусловлено увеличение и второй
Статистическое измерение связи Корреляционный анализ n Регрессионный анализ n Дисперсионный анализ (однофакторный, многофакторный) n
Корреляция – способ измерения связи. Коэффициент корреляции отражает степень статистической связи между двумя признаками: r = 0 – связь отсутствует r = +1 – прямолинейная связь r = -1 – обратная линейная связь Оценка (качественная): От +0, 25 до 0 (и от 0 до -0, 25) – отсутствие или слабая связь От +0, 26 до +0, 5 (и от -0, 26 до -0, 5) – умеренная От +0, 51 до +0, 75 (и от -0, 51 до -0, 75) – средняя (хорошая) Более +0, 75 (более -0, 75) – сильная (тесная) +1, 0 (-1, 0) – полная (функциональная)
Величина r экспонента на генеральную совокупность вычислением доверительных границ (Д. И. ) r – используется для изучения связи направленных измерений (у разных субъектов) n Нельзя использовать r при условиях: n Ш сопоставления одного признака двумя способами Ш оценки результатов повторных измерений Ш если связь носит не линейный характер Ш если дисперсия у двух изучаемых переменных заметно различаются
Квадрат коэффициента корреляции (r 2) называют коэффициентом детерминации n Он отражает долю дисперсии признаков, обусловленную изучаемой связью (r 2 * 100%). Если корреляция х и у равняется 0, 5, то 25% дисперсии признаки у связаны с дисперсией х. r 2 - доля влияния анализируемого признака на результативный признак.
Коэффициент корреляции рангов Для случаев ненормального распределения, нелинейной связи и ординарных данных более адекватно использование коэффициента корреляции рангов Спирмена (ρ) Интерпретация величины коэффициента Спирмена такая же как и у коэффициента Пирсона
Коэфициент регрессии Для количественных выводов оценка коэффициента корреляции в большинстве случаев недостаточно. Применение регрессионного анализа полезно для установления степени изменения одного признака при изменении другого (не доказывает ее причинно-следственного характера). Частным случаем регрессионного анализа является вычисление прямолинейной, криволинейной тенденции в многолетней динамике заболеваемости. (степенная кривая экспонента). у = а + вх (а-постоянная; в – коэффициент степени изменения у при изменении х)
Коэффициент ассоциации Наличие связи, ее количественная характеристика (качественные и количественные признаки). Выбор коэффицентов ассоциации Q, Ф зависит от: характера исходных данных; n необходимой точностью анализа. n
Достоинства n n простота вычисления; возможность обрабатывать качественные и количественные признаки, после их группировки и придания характера качественных признаков Макет четырехстепенной таблицы взаимной сопряженности (2 х2) признаки А не. А В В а b а+b не. В c d c+d ∑А а+с b+d n Q= ad – cb ad + cb
ПРИМЕР Распределение рабочих по случаям заболевания в году профессии болели Не болели итого Станочники Прочие 78 30 83 92 161 122 всего 108 175 283 78*92 – 30*83 Q= = 0, 49 ≈ 0, 5 78*92 + 30*83 Связь считается установленной, если абсолютные значения Q находятся в пределах от 0, 5 до 1. Сила связи оценивается также, как и коэффициент корреляции (r).
Коэффициент контингенции (Ф) 1. Значение Ф всегда меньше значения Q 2. Дает двустороннюю оценку ad – cb Ф = 0, 24 Ф = √(a+b)(c+d)(b+d)(a+c) = 0, 24 3. Осторожно относится к оценкам направленности связи (прямая или обратная), [пол, диагноз, заболевания – не имеют упорядочного ранжирования] 4. Заниженные значения при анализе взаимосвязей в случае резкого ассиметричного распределения данных в клетках таблицы
n n ДИСПЕРСИОННЫЙ АНАЛИЗ [variance analysis] — раздел статистики, позволяет оценить меру влияния отдельных факторов на уровень заболеваемости При этом исходят из положения о том, что существенность фактора в определенных условиях характеризуется его вкладом в дисперсию результата. Английский статистик Р. Фишер, разработавший этот метод, определил его как “отделение дисперсии, приписываемой одной группе причин, от дисперсии, приписываемой другим группам”.
n n Анализ производится следующим образом. Сначала группируют совокупность наблюдений по факторному признаку, находят среднее значение результата и дисперсию по каждой группе. Затем определяют общую дисперсию и вычисляют, какая доля ее зависит от условий, общих для всех групп, какая — от исследуемого фактора, а какая — от случайных причин. И наконец, с помощью специального критерия Фишера определяют, насколько существенны различия между группами наблюдений и, следовательно, можно ли считать ощутимым влияние тех или иных факторов. Д. а. применяется в ряде исследований, где он служит, в частности, предварительным этапом к регрессионному анализу статистических данных, поскольку позволяет выделить относительно небольшое (но достаточное для целей исследования) количество параметров регрессии.
Классификация ошибок в аналитических исследованиях
Ошибки в аналитических исследованиях Случайные ошибки n n Случайная ошибка исследования - исключительно случайное расхождение между результатами измерения какого-либо явления в конкретном выборочном исследовании и истинной величиной этого явления. Случайная ошибка в отдельном исследовании может отклонить результат от истины с одинаковой вероятностью в сторону заниженной или завышенной оценки. Источник случайных ошибок - непреднамеренные незначительные неточности в определении популяции, формировании репрезентативной выборки, оформлении учетных документов, составлении основных и контрольных групп, измерении явлений в группах и фиксации результатов и т. д.
Ошибки в аналитических исследованиях Систематические ошибки Систематическая ошибка, или смешение - это непреднамеренное, но регулярное, неслучайное, однонаправленное отклонение результатов измерения от истинного значения. Систематические ошибки могут создать видимость различий, когда в действительности их нет, или наоборот, скрыть различия, которые на самом деле существуют.
Ошибки в аналитических исследованиях Систематические ошибки (ошибки выборк n. На этапе формирования выборки (нечеткие критерии включения и исключения) n. На этапе формирования групп
Ошибки в аналитических исследованиях Ошибки выборки При формировании выборки возможны следующие смещения подбора: n центростремительное смещение (концентрация хронических и серьезных больных и максимальные возможности диагностики и лечения в специализированных центрах); n смещение популярности (присутствие нетипичных больных); n смещение фильтрации ( «движение» пациентов от звена первичной медицинской помощи до специализированных центров приводит к их частичному отсеиванию по разным причинам: особенности течения заболевания, социальным причинам, географическим, финансовым, особенностям раннее примененного лечения и т. д. ); n смещение доступности диагностики (вариант смещения фильтрации).
Ошибки в аналитических исследованиях Информационные ошибки Связаны с систематическим отклонением в методах сбора данных: n Ошибка раскрытия информации n Ошибки интервьюера n Ошибки памяти n Ошибки классификации
Ошибки в аналитических исследованиях Смешивающие факторы Действие неучтенных факторов приводит к смещению результатов
Ошибки в аналитических исследованиях Проявление смешивающегося фактора Низкая концентрация гормонов беременности
Ошибки в аналитических исследованиях В следствии миграции Связаны с потерей участников в ходе исследований
Меры по устранению случайной ошибки Тщательная количественная оценка экспозиции и ее эффекта n Увеличение выборки n
Меры по устранению систематической ошибки Правильное планирование и осуществление исследования, а так же оценка результатов Для устранения смешивающего эффекта n Этапы планирования n n n Рандомизация Регистрация Подбор Этап анализа n n Стратификация Статистическое моделирование
Меры по устранению систематической ошибки n n n Рандомизация – раздел изучаемых лиц или явлений по группам, осуществляемое по случайному признаку Регистрация – ограничение состава изучаемых групп только лицам, которые не подвергались воздействию потенциальных вмешивающихся факторов Подбор контролей – подбор контроля к каждому случаю заболевания, что бы они не отличались не по одному из подозреваемых вмешивающихся факторов
Меры по устранению систематической ошибки n Стратификация – выделение страт (подгрупп) однородных с точки зрения имеющихся переменных Умер Выжил Заразился ВБИ 46 92 RR=2. 43 (1, 80 -3, 26) Не заразился ВБИ 104 653 Пример результата оценки риска гибели пациентов отделения реанимации новорожденных в связи с возникновением у них ВБИ (по данным Hemming V. G. и соавт. )
Результаты анализа (стратификации) Масса тела (г) Заражение ВБИ Менее 1000 заразился 12 13 1, 44(0, 74 -2, 76) 10 20 заразился 12 30 24 83 заразился 7 11 не заразился 18 124 заразился 15 38 не заразился 2000 и более RR (95% ДИ) не заразился 1500 -1999 Выжил не заразился 1000 -1499 Умер 52 426 Суммарная оценка риска с учетом массы тела 1, 27(0, 70 -2, 31) 3, 07(1, 49 -6, 32) 2, 60(1, 58 -4, 29) 1, 88(1, 40 -2, 54) видно, что внутри каждой страты (т. е. практически вне зави симости от массы тела) заражение ВБИ действительно влияет на риск ги бели новорожденных. В то же время суммарная оценка риска* гибели в связи с заражением ВБИ с учетом различий по массе тела (RR=1, 88) ока залась меньше, чем «грубая» оценка риска ( R=2, 43). Это означает, что R утверждение о связи риска заражения ВБИ и массы тела новорожденных не лишено смысла.
Статистическая чувствительность Величину (1 -β) – называют чувствительностью статистического критерия или чувствительностью исследования
Выбор статистического критерия зависит от: Характера данных полученных в ходе исследования n Структуры исследования n Вопроса поставленного для исследования n
Подбор контрольной группы Независимая выборка Одни и тоже люди в опыте и контроле, но в разное время Связанные выборки Пациенту подбирается пара равная по возрасту и по полу Статистические критерии, предназначенные для связанных выборок не должны использоваться для независимых выборок и наоборот
Признаки Качественные Количественные Ш Альтернативные Ш Дискретные (возможно (дихотомические = экзистенциальные = бинарные) = качественные Ш Номинативные = полихотомические Ш Ординальныепорядковые = ранжирование шага между ступеньками шкалы ординаров, в определенных единиц измерения) v число приступов v число детей Ш Непрерывные v концентрация v масса v длина
Альтернативные (дихотомические = экзистенциальные = бинарные) = качественные Женщина – мужчина n Живой – мертвый n Возраст n И т. д. (интенсивные показатели) n
Номинативные = полихотомические Имеет варианты отличающиеся между собой, но их нельзя ранжировать, соотнести по величине: n Диагноз n Тип клетки n Доля от выборки
Ординальные = порядковые Можно ранжировать (в виде частоты): n естественный порядок величины признака, n оценка силы землетрясения в баллах, n стадия болезни по условной лекале.
Оптимальные статистические критерии для сравнения групп при разных типах данных и разной структуре исследования ПРИЛ. № 1 Тип данных номинативные ординальные количествен и др. А. Биномиальный Колмогорова-Смирнова Не приложимо. критерий для одной выборки Примечание. Случай с одной Одна Б. х2 для одной выборки на выборкой редко встречается в полноту соответствия медицинской литературе А. х2 А. Манна-Уитни (U) А. Критерий Стьюдента t Две Б. Точный критерий Б. Ранговый критерий Б. Критерий Манна-Уитни (U) независимые Фишера Вилкоксона Тесты Мак-Нимара и А. Критерий знаков t-тест для связанных выборок Две Мантеля-Хэнзеля Б. Ранговый критерий связанные (варианты х2) Вилкоксона для разностей рангов хг для К независимых Тест Крускал-Уэллиса Одномерный дисперсионный выборок. (одномерный анализ (ANOVA). Примечание. Не может дисперсионный анализ, Примечание. 1. Неприемлемо ANOVA) использовать множество t-тестов 3 и более быть использован, если независимых более 20% ячеек имеют для сравнения 3 и более групп. 2. выборок ожидаемую частоту Если найдено различие между 3 и менее 5 или если хотя бы более группами существуют одна ячейка имеет критерии для локализации ожидаемую частоту менее различия Число и тип выборки
Оптимальные статистические критерии для сравнения групп при разных типах данных и разной структуре исследования ПРИЛ. № 1 Число и тип выборки номинативные Тип данных ординальные кол ичествен и ые Тест Кокрейна (Q) Двумерный дисперсионный Многофакторный (для повторных анализ по Фридману измерений) дисперсионный анализ (ANOVA) (MANOVA). Примечания. 1. Неприемлемо использовать 3 и более множество парных критериев для связанных сравнения 3 и более повторных выборок измерений. 2. Если найдено различие между 3 и более группами, существуют критерии для локализации различия Коэффициенты Л. Коэффициент корреляции сопряженности рангов Слирмена (rs или р) Пирсона (г) Б. Коэффициент корреляции Примечание. Линейная регрессия и Меры рангов Кенделла (Т) В. корреляция - это разные Коэффициент корреляции процедуры копкордантности (согласия) Кенделла (w)
Оптимальные статистические критерии для сопоставления разных данных типов в ПРИЛ. № 2 медицинском исследовании Тип независимой переменной (объяснительной, предиктора) Тип зависимой переменной (ответ, результат) качественный номинативный ординальный количественный Качественный х2 х2 логлинейиые модели Логистическая регрессия Номинативный х2 х2 логлинейиые модели Логистическая регрессия Ординальный Манна-Уитни (U) Крускалл. Уэллиса Количественный t-критерий ANOVA Кенделла или корреляции рангов Спирмсна рангов Спирмена Кенделла или корреляции регрессионный рангов Спирмена
Выбор непараметрического критерия для анализа данных ПРИЛ. № 3 Случай двух выборок Тип данных Оценка различии Вид выборки независимые выборки Интервальные Ординальные Фишера-Питмана Вилкоксона; ранжированных категорий; Гехана для цензурированных данных Номинативные Фишера для четырехпольной таблицы или Фишера для таблицы сопряженности 3 и более категорий Оценка зависимостей связанные выборки подобранные выборки Рандомизации ТКФ Питмана Суммы рангов Критерий знаков Спирмсна; ранжированных категорий; цензурированных данных Мак Нимара для 2 категорий; Лемахсра для 3 и более категорий Баукера Фишера для четырехпольной таблицы или Фишера для таблицы сопряженности 3 и более категорий Случай трех и более выборок, критерии на значимость различий Тин данных Интервальные Независимые выборки рандомизации Вид выборки Связанные выборки Рандомизации Крускал-Уэллиса; ранжированных категорий; Ординальные Шемпсра для цснзурированных данных; критерий тренда; Пателя-Хосля на взаимодействие Номинативные Фишера для таблицы сопряженности Подобранные выборки Питмана-Уэлча Суммы рангов Фридмана Тест для таблицы сопряженности Уэллса
Благодарю за внимание!