Идрисова 346 бс..pptx
- Количество слайдов: 35
Ао «Медицинский университет астана» кафедра «Медбиофизики, информатики с курсом высшей математики» Самостоятельная работа студента На тему: «Критерий согласия. Практический пример применения критерия согласия. Закон Менделя. » Выполнила: Идрисова Д. Н. Группа: 346, ОМ Проверила: Оспанова Г. К. Астана 2014 г.
Содержание. Введение Критерии согласия. Закон Менделя Практический пример применения критерия согласия. Заключение Список литературы. Ссылки
Введение. Так как все предположения о характере того или иного распределения – это гипотезы, то они должны быть подвергнуты статистической проверке с помощью критериев согласия, которые дают возможность установить, когда расхождения между теоретическими и эмпирическими частотами следует признать несущественными, т. е. случайными, а когда – существенными (неслучайными). Таким образом, критерии согласия позволяют отвергнуть или подтвердить правильность выдвинутой при выравнивании ряда гипотезы о характере распределения в эмпирическом ряду.
Критерии согласия Критериями согласия называют статистические критерии, предназначенные для проверки согласия опытных данных и теоретической модели. Лучше всего этот вопрос разработан, если наблюдения представляют случайную выборку. Теоретическая модель в этом случае описывает закон распределения.
Критерии согласия основаны на использовании различных мер расстояний между анализируемым эмпирическим распределением и функцией распределения признака в генеральной совокупности.
Непараметрические критерии согласия üКритерий согласия Колмогорова q. Критерий Смирнова q. Критерий омега квадрат
Перечисленные критерии были разработаны для проверки согласия с полностью известным теоретическим распределением. Расчетные формулы, таблицы распределений и критических значений широко распространены. Основная идея критериев Колмогорова, омега квадрат и аналогичных им состоит в измерении расстояния между функцией эмпирического распределения и функцией теоретического распределения. Различаются эти критерии видом расстояний в пространстве функций распределения
Законы Менделя — это принципы передачи наследственных признаков от родительских организмов к их потомкам, вытекающие из экспериментов Грегора Менделя. Эти принципы послужили основой для классической генетики и впоследствии были объяснены как следствие молекулярных механизмов наследственности
Пример. В некоторых классических экспериментах с селекцией гороха Мендель наблюдал частоты различных видов семян, получаемых при скрещивании растений с круглыми желтыми семенами и растений с морщинистыми зелеными семенами. Они приводятся ниже вместе с теоретическими вероятностями, вычисленными в соответствии с теорией наследственности Менделя.
Семена Наблюденная Ожидаемая численность Круглые и желтые 315 556*9/16=313 Морщинистые и желтые Круглые и зеленые 101 556*3/16=104 108 556*3/16=104 Морщинистые зеленые 32 556*1/16=35 556 Всего и
В этом случае теоретическое распределение дискретно и известно полностью. Для проверки согласия экспериментальных данных теоретическому распределению используем критерий для простой гипотезы. Значение статистики, вычисленное по выборке равно
что меньше 5%-ного критического значения Следовательно, теория наследственности Менделя не противоречит полученным экспериментальным данным.
Наряду с количественными статистическими критериями для определения типа распределения по выборочным данным используются графические методы. Простейший способ – построение по имеющейся выборке гистограммы относительных частот и на том же графике и в том же масштабе, - кривой плотности нормального распределения с выборочным средним и выборочной дисперсией в качестве параметров. Значительные отклонения от нормальности (сильная асимметрия, бимодальность) легко обнаруживаются на графике.
Рис. 1. Пример сравнения гистограммы и кривой нормальной плотности
Критерии согласия Родились: 84 розовых мыши и 16 зелёных. H 0: выборка получена из популяции, где соотношение розовых и зелёных – 3: 1. H 1: выборка получена из популяции, где соотношение розовых и зелёных не равно 3: 1 1: 3 ? ? Заметим, что речь идёт только о частотах, но не о параметрах распределения.
Критерии согласия розовые зелёные всего Oi Ei df = k-1=1 χ2 cv = 3. 841<4. 320 p=0. 038 84 75 16 25 100 Чем больше значение χ2, тем хуже наши данные соответствуют теоретическому распределению – тем меньше р H 0 отвергаем – соотношение мышей не соответствует ожидаемому
Критерии согласия
Критерии согласия Категорий может быть сколько угодно. Родились: 152 розовых мыши с острым хвостом; 39 розовых с курчавым хвостом; 53 зелёных с острым, 6 зелёных с курчавым. H 0: выборка получена из популяции, где соотношение фенотипов – 9: 3: 3: 1. H 1: выборка получена из популяции, где соотношение фенотипов не равно 9: 3: 3: 1
Критерии согласия + 1: 3: 3: 9 ? ?
Критерии согласия Важное замечание: В всех критериях согласия H 0 гипотеза – о том, что форма распределений ОДИНАКОВА То есть, когда мы ищем подтверждение тому, что наши данные удовлетворяют некоторому распределению, мы должны радоваться, получив p>>0. 05!
Критерии согласия Zar, 1999: Если мы сравнили распределение с теоретическим, получили отличия (!), а теперь хотим показать, из-за какой именно категории эти отличия возникли, можно какой именно категории отдельно сравнить с теоретическим распределением остальные категории, а затем – отношение этой категории к остальным. Т. е. , если нам кажется, что всё портят зелёные мыши с курчавыми хвостами, сравним: 1. соотношение остальных мышей с 9: 3: 3; 2. отношение зелёных-курчавых к остальным с 1: 15.
Критерии согласия Итак: 1. у нас одна выборка 2. Переменная качественная 3. мы сравниваем наблюдаемые частоты с ожидаемыми (observed and expected) Критерий χ2 Пирсона (Pearson Chi-square test)
Сравнение нашего распределения с теоретическим (нужна таблица с посчитанными частотами)
результаты
Критерии согласия Если у нас только 2 проявления признака Поправка Йейтса для критерия χ2 (Yates correction for continuity) 1: 3 ? ? Для заданного теоретического распределения χ2 может принимать только строго определённые значения для разных наблюдаемых распределений.
Критерии согласия Например: если ожидаемые частоты – 75 и 25, то значения χ2 будут для 84 и 16 – 4. 32, промежуточных значений для 83 и 17 – 3. 14, не может быть для данных для 82 и 18 – 2. 61 ожидаемых частот Но χ2 распределение непрерывное. И для заданного уровня значимости p мы не найдём точно соответствующего ему значения χ2. χ2 с поправкой Йейтса: (для больших N не нужен) Делает тест более консервативным.
Биномиальный тест Элементарный тест для сравнения двух частот с теоретическими (для маленьких выборок, легко считать вручную). Большие выборки – задача для теста χ2. Пример с котом Гусом: у нас есть подозрение, что он правша. Мы дали ему игрушку на резинке, он ударил по ней 10 раз: 8 - правой, 2 – левой. Справедливо ли наше подозрение? T Пример с Т-образным лабиринтом: 10 мышей пошли налево, 3 – направо.
Критерии согласия Замечательный тест Колмогорова-Смирнова для ранговых данных (Kolmogorov-Smirnov goodness of fit for discrete ordinal scale data). 35 кошек выбирают из 5 типов корма, различающихся по влажности. Случаен ли выбор или есть предпочтения? То есть, 5 типов корма можно проранжировать от самого влажного к самому сухому, это не просто качественные признаки. Мощность такого теста выше, чем χ2 , но его нет в Zar, 2010 (1999). Staristica.
Критерии согласия Тесты на соответствие непрерывным распределениям Соответствует ли распределение мотыльков на дереве НОРМАЛЬНОМУ РАСПРЕДЕЛЕНИЮ? Переменная – высота от земли в метрах ü Тест Колмогорова-Смирнова (Kolmogorov-Smirnov test) (если известны дисперсия и среднее в популяции) D-статистика. ü Lilliefors test – если НЕизвестны дисперсия и среднее в популяции – «улучшенный К-С тест» ü Shapiro-Wilk’s W test (самый мощный, размер выборки до 5000) – наиболее предпочтительный.
Проверка распределения на нормальность
маленькое p говорит о том, что данные не соответствуют нормальному распределению.
Сравнение с другими теоретическими распределениями: Тест Колмогорова-Смирнова для непрерывных распределений
Заключение. Таким образом, критерии согласия основаны на использовании различных мер расстояния между анализируемым эмпирическим распределением и функцией распределения признака в генеральной совокупности. Критериями согласия называют статистические критерии, предназначенные для проверки согласия опытных данных и теоретической модели.
Список литературы: 1. Савилов Е. Д. , Мамонтова Л. М. и др. применение статистических методов в эпидемиологическом анализе. – «МЕД пресс-информ» 2004. 2. Лукьянов Е. А. Медицинская статистика , -М: Изд. РУДН, 2002. 3. Жижин К. С. Медицинская статистика. -Высшая школа. Феникс. 2007 4. Банержи А. Медицинская статистика понятным языком. 2007 5. Медик В. А. Токмачев М. СФишман Б. Б. Статистика в медицине и биологии. Медицина, 2000 Ссылки: 1. http: //www. basegroup. ru/glossary/definitions/chi_square_test/ 2. http: //www. exponenta. ru/educat/systemat/shelomovsky/lab 14. as p 3. http: //udel. edu/~mcdonald/statexactbin. htm
Спасибо за внимание!
Идрисова 346 бс..pptx