Параметрические и непараметрические методы.ppt
- Количество слайдов: 42
Параметрические и непараметрические методы в биомедицинских исследованиях Новикова Н. М. Международный государственный экологический университет им. А. Д. Сахарова
Статистические шкалы n Применение тех или других статистических методов определяется тем, к какой статистической шкале относится полученный материал (другими словами, к какому типу относятся переменные) Международный семинар «Применение статистических методов в биомедицинских исследованиях» Минск, 18 мая 2011
Статистические шкалы Номинальная (nominal/categorical) ( Порядковая (ordinal) Интервальная (interval) Относительная Международный семинар «Применение статистических методов в биомедицинских исследованиях» Минск, 18 мая 2011
Типы переменных n Номинальные/качественные: Могут быть измерены только в терминах принадлежности к различным классам. Не связаны арифметическими соотношениями, упорядочить нельзя. Способ описания: подсчет числа объектов, имеющих одно и то же значение (пол, цвет, национальность и т. д. ) n Порядковые (ординальные)/ранжируемые: n Интервальные/количественные: Отражают условную степень выраженности какого-либо признака. Можно упорядочить, но производить арифметические действия нельзя (состояние больного, стадии болезни, баллы, рейтинги и т. д. ) Позволяют численно выразить и сравнить различия между ними. Можно упорядочивать и производить арифметические действия. Имеют единицы измерения. Международный семинар «Применение статистических методов в биомедицинских исследованиях» Минск, 18 мая 2011
Для различных переменных и шкал применяются разные методы статистического анализа !!! Международный семинар «Применение статистических методов в биомедицинских исследованиях» Минск, 18 мая 2011
Первым этапом анализа количественных данных является анализ вида их распределения Международный семинар «Применение статистических методов в биомедицинских исследованиях» Минск, 18 мая 2011
ПОЧЕМУ ВАЖНО ЗНАТЬ ФОРМУ РАСПРЕДЕЛЕНИЯ? Критерии, основанные на оценке параметров распределения (параметрические методы статистического анализа), применимы только в случае, если данные подчиняются соответствующему распределению (чаще всего речь идет о нормальном (гауссовом) распределении колообразного вида) Международный семинар «Применение статистических методов в биомедицинских исследованиях» Минск, 18 мая 2011
НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ n n n нормальное распределение полностью определяется двумя параметрами: средним значением и стандартным отклонением 68% всех наблюдений лежат в диапазоне ± 1 стандартное отклонение от среднего, а диапазон ± 2 стандартных отклонения содержит 95% значений Числовые характеристики мода, медиана и среднее совпадают Международный семинар «Применение статистических методов в биомедицинских исследованиях» Минск, 18 мая 2011
Способы проверки соответствия эмпирического распределения нормальному Способы, основанные на визуальной оценке близости распределения признака к нормальному: – построение гистограммы распределения признака – построение графика функции распределения признака Международный семинар «Применение статистических методов в биомедицинских исследованиях» Минск, 18 мая 2011
n Вычисление среднего, медианы и моды. Если мода, медиана и среднее арифметическое друг от друга значительно не отличаются, мы имеем дело с нормальным распределением. n Вычисление коэффициентов асимметрии и эксцесса. Для нормального распределения эти показатели равны 0. n при нормальном распределении в пределах: х ± 0, 3 σ находится 25 % всех единиц наблюдения; х ± 0, 7 σ находится 50 % всех единиц наблюдения; х ± 1, 1 σ находится 75 % всех единиц наблюдения; х ± 3, 0 σ находится 99 % всех единиц наблюдения. Международный семинар «Применение статистических методов в биомедицинских исследованиях» Минск, 18 мая 2011
Статистические критерии для проверки нормальности распределения n Критерий согласия χ2 Пирсона (Pearson). n Критерий Колмогорова-Смирнова (Kolmogorov-Smirnov). Применяется, если среднее значение и стандартное отклонение признака известны априори. n Критерий Лиллиефорса (Lilliefors). Применяется, если среднее значение и стандартное отклонение признака неизвестны и вычисляются по выборке. n Критерий Шапиро-Уилка (Shapiro–Wilk). Также применяется при априори неизвестных параметрах, является наиболее мощным, универсальным и строгим. Международный семинар «Применение статистических методов в биомедицинских исследованиях» Минск, 18 мая 2011
Часто ли встречается нормальное распределение? n n n Можно сказать, что из всех распределений в природе чаще всего встречается именно нормальное распределение – отсюда и произошло одно из его названий. Но для данных биомедицинских исследований это не всегда верно. Нормальное распределение встречается в биомедицинских признаках примерно в 20 -25% (? ? ? ). До тех пор пока выборка достаточно большая (например, 30 (100) или больше наблюдений), можно считать, что выборочное распределение нормально (? ? ? ). Международный семинар «Применение статистических методов в биомедицинских исследованиях» Минск, 18 мая 2011
Международный семинар «Применение статистических методов в биомедицинских исследованиях» Минск, 18 мая 2011
Описание количественных данных в зависимости от вида их распределения n n n Для описания выборочного нормального распределения количественных признаков необходимо указывать: число наблюдений, среднее значение, стандартное отклонение. Для описания выборочного распределения количественных признаков, которое отличается от нормального, рекомендуется указывать: число наблюдений, медиану, нижний и верхний квартили. Не применяйте оценку среднего и стандартного отклонения для порядковых данных!!! Международный семинар «Применение статистических методов в биомедицинских исследованиях» Минск, 18 мая 2011
Пример: распределение возраста заболевших менингитом, вызванным гемофильной палочкой 1, 1, 1, 1, 1, 20, 50, 71 n=23 Среднее = 7, отклонение = 17, 6 Медиана = 1, 25 процентиль = 1, 75 процентиль = 1 Международный семинар «Применение статистических методов в биомедицинских исследованиях» Минск, 18 мая 2011
M±m =? ? ? Среднее ± стандартное отклонение n Среднее ± стандартная ошибка среднего n Что-что ± что-то ? n Международный семинар «Применение статистических методов в биомедицинских исследованиях» Минск, 18 мая 2011
1: 21, 22, 23, 24, 24, 25, 25, 26, 26, 27, 28, 29, 30 2: 20, 20, 20, 21, 21, 21, 33, 34, 36, 37, 42 Среднее 1=25, 14; Ст. отклон. 1 = 2, 31 Среднее 2=25, 00; Ст. отклон. 2 = 7, 32 Международный семинар «Применение статистических методов в биомедицинских исследованиях» Минск, 18 мая 2011
Международный семинар «Применение статистических методов в биомедицинских исследованиях» Минск, 18 мая 2011
Международный семинар «Применение статистических методов в биомедицинских исследованиях» Минск, 18 мая 2011
Параметрические критерии для сравнения двух и более независимых групп по одному количественному признаку n t-критерий Стьюдента n Дисперсионный анализ (ANOVA – ANalysis Of VAriance) Международный семинар «Применение статистических методов в биомедицинских исследованиях» Минск, 18 мая 2011
Требования: Каждая выборка независима от остальных выборок. n Каждая выборка случайным образом извлечена из исследуемой совокупности. n Совокупность нормально распределена. n Дисперсии всех выборок равны (проверяется с помощью F-критерия Фишера, критерия Левена). n Международный семинар «Применение статистических методов в биомедицинских исследованиях» Минск, 18 мая 2011
n По существу, для каждого параметрического критерия имеется, по крайней мере, одна непараметрическая альтернатива. n Непараметрические методы не основываются на оценке параметров (таких как среднее или стандартное отклонение) при описании выборочного распределения => не требуют предположения нормальности. Могут применяться не только для количественных данных. n Во многих непараметрических методах значения признака заменяются рангами Международный семинар «Применение статистических методов в биомедицинских исследованиях» Минск, 18 мая 2011
Непараметрические аналоги для критериев при сравнении независимых групп по одному признаку n n Для критерия Стьюдента: критерий Манна -Уитни (Mann-Whitney), Вальда— Вольфовица, Колмогорова— Смирнова, медианный критерий Для дисперсионного анализа: критерий Краскела (Крускала) -Уоллиса (Kruskal — Wallis), медианный критерий Международный семинар «Применение статистических методов в биомедицинских исследованиях» Минск, 18 мая 2011
Пример (С. Гланц): При заболеваниях сетчатки повышается проницаемость ее сосудов. Измерили проницаемость сосудов сетчатки у здоровых и у больных с ее поражением: Здоровые Больные 0, 5 1, 2 0, 7 1, 4 0, 7 1, 6 1, 0 1, 7 1, 2 1, 8 1, 4 2, 2 1, 4 2, 3 1, 6 2, 4 1, 6 6, 4 1, 7 19, 0 2, 2 Критерий Стьюдента: 23, 6 Xср1= 1, 25; Cт. откл. = 0, 49 Хср2= 5, 44; Cт. откл. = 7, 59 t = 1, 908, ν = 22, p > 0, 05. Критерий Манна-Уитни: Z = 3, 041, p < 0, 005 Международный семинар «Применение статистических методов в биомедицинских исследованиях» Минск, 18 мая 2011
Непараметрические критерии для сравнения зависимых групп по количественным и порядковым признакам Используются при анализе данных, полученные в одной группе больных (до и после лечения); при анализе выборок, сформированных путем подбора пар по полу, возрасту, стадии заболевания и т. д. ): – Для парного критерия Стьюдента: критерий Вилкоксона (Wilcoxon), критерий знаков. – Для дисперсионного анализа: критерий Фридмана (Friedman) Международный семинар «Применение статистических методов в биомедицинских исследованиях» Минск, 18 мая 2011
Непараметрические критерии для сравнения групп по качественному признаку Независимые выборки n n Критерий 2 Точный критерий Фишера Зависимые выборки n n Критерий Мак. Нимара (Mc. Nemar) Q-критерий Кохрена (Cochran) Международный семинар «Применение статистических методов в биомедицинских исследованиях» Минск, 18 мая 2011
Анализ связи двух признаков Параметрические методы n n Коэффициент корреляции Пирсона Линейная регрессия Требования n n n Нормальность распределения Количественные признаки Линейная связь признаков Международный семинар «Применение статистических методов в биомедицинских исследованиях» Минск, 18 мая 2011
r=0, 816 ? Международный семинар «Применение статистических методов в биомедицинских исследованиях» Минск, 18 мая 2011
Анализ связи двух признаков Непараметрические методы n n n Коэффициент ранговой корреляции Спирмена (Spearman) Коэффициент ранговой корреляции Кендалла (Kendall ) Коэффициент корреляции гамма (Goodman and Kruskal's gamma test) Точечно-бисериальный и рангово-бисериальный коэффициент корреляции Коэффициент сопряженности Логистическая регрессия Международный семинар «Применение статистических методов в биомедицинских исследованиях» Минск, 18 мая 2011
Не требуется нормальности распределения n Признаки могут быть любого типа n Можно анализировать нелинейную зависимость n Международный семинар «Применение статистических методов в биомедицинских исследованиях» Минск, 18 мая 2011
Международный семинар «Применение статистических методов в биомедицинских исследованиях» Минск, 18 мая 2011
Задача Параметрические методы Непараметрические методы Выполнение описательной статистики Сравнение двух независимых групп по одному признаку Вычисление среднего, стандартного отклонения Вычисление медиан и интерквартильных интервалов, долей Критерий Стьюдента Критерии Манна-Уитни, Колмогорова. Смирнова, Вальда-Вольфовица, 2, точный критерий Фишера Сравнение двух зависимых групп по одному признаку Критерий Стьюдента для зависимых выборок Критерий Вилкоксона, критерий знаков, критерий Мак. Нимара Сравнение трех и Дисперсионный анализ более независимых групп по одному признаку Сравнение трех и Дисперсионный анализ для более зависимых групп зависимых выборок по одному признаку Критерий Краскела-Уоллиса, медианный критерий, 2 Анализ взаимосвязи двух признаков Коэффициенты корреляции Спирмена, Кендалла, гамма, точечно-бисериальный и ранговобисериальный коэффициенты корреляции, коэффициент сопряженности, логистическая регрессия и др. Коэффициент корреляции Пирсона, линейная регрессия Критерий Фридмана, критерий Кохрена Международный семинар «Применение статистических методов в биомедицинских исследованиях» Минск, 18 мая 2011
Международный семинар «Применение статистических методов в биомедицинских исследованиях» Минск, 18 мая 2011
Международный семинар «Применение статистических методов в биомедицинских исследованиях» Минск, 18 мая 2011
Международный семинар «Применение статистических методов в биомедицинских исследованиях» Минск, 18 мая 2011
Международный семинар «Применение статистических методов в биомедицинских исследованиях» Минск, 18 мая 2011
Международный семинар «Применение статистических методов в биомедицинских исследованиях» Минск, 18 мая 2011
Международный семинар «Применение статистических методов в биомедицинских исследованиях» Минск, 18 мая 2011
Международный семинар «Применение статистических методов в биомедицинских исследованиях» Минск, 18 мая 2011
Международный семинар «Применение статистических методов в биомедицинских исследованиях» Минск, 18 мая 2011
Международный семинар «Применение статистических методов в биомедицинских исследованиях» Минск, 18 мая 2011
Рекомендуемая литература n n n Гланц С. Медико-биологическая статистика. — М. : практика, 1999. Реброва О. Ю. Статистический анализ медицинских данных. Применение пакета прикладных программ STATISTICA // М. : Медиасфера. - 2002. - 312 с. Юнкеров В. И. , Григорьев С. Г. Математико-статистическая обработка данных медицинских исследований. – СПб. : ВМед. А, 2002. – 266 с. Ермолаев О. Ю. Математическая статистика для психологов. – М. : Московский психолого-социальный институт - Флинта, 2003. – 336 с. www. biometrica. tomsk. ru – сайт доказательной биологии и медицины http: //www. statsoft. ru/home/textbook/default. htm - электроный учебник по статистике Международный семинар «Применение статистических методов в биомедицинских исследованиях» Минск, 18 мая 2011
Параметрические и непараметрические методы.ppt