Скачать презентацию Статистические критерии -2 ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ РАЗЛИЧИЯ Смысл Скачать презентацию Статистические критерии -2 ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ РАЗЛИЧИЯ Смысл

Семинар 4. Статистические критерии 2.ppt

  • Количество слайдов: 16

Статистические критерии -2 Статистические критерии -2

ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ РАЗЛИЧИЯ Смысл критериев различия Критерии различия позволяют дать ответ на вопросы трех ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ РАЗЛИЧИЯ Смысл критериев различия Критерии различия позволяют дать ответ на вопросы трех типов относится ли то или иное измерение к данной совокупности? соответствует ли эмпирическое распределение теоретическому? различаются ли две эмпирические выборки? Практическая задача: проблема выбросов можно ли применять ДИ, tкритерий и др. сравнение контроля и опыта Нулевая гипотеза Н 0: реального различия нет сомнительное измерение принадлежит данной совокупности, его отличие случайно различие между выборочным и теоретическим распределением в действительности отсутствует, имеющееся отличие – случайность две выборки – контроль и опыт- не отличаются, различие между ними – случайность Альтернативная гипотеза Н 1: различие неслучайно Если θ> θα – H 0 отклоняется

ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ РАЗЛИЧИЯ Принадлежность резко выделяющихся наблюдений к выборке x 1, x 2, …, ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ РАЗЛИЧИЯ Принадлежность резко выделяющихся наблюдений к выборке x 1, x 2, …, xn-1, xn H 0: xn не является выбросом нулевая гипотеза статистика критерия 1. Правило четырех сигм (если n≥ 10) Если θ > 4 s - H 0 отклоняется 2. Критерий Диксона (если n ≤ 25) Если r > rα - H 0 отклоняется 3. Если n >25 Если t > tα - H 0 отклоняется условие проверки

ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ РАЗЛИЧИЯ 4 6 2 5 3 8 2 выборке Принадлежность резко выделяющихся ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ РАЗЛИЧИЯ 4 6 2 5 3 8 2 выборке Принадлежность резко выделяющихся наблюдений к 1 4 5 Является ли значение 8 выбросом? x , …, x 1 2 n-1 n N=10 H 0: xn не является выбросом 1. Правило четырех сигм (если n≥ 10) 1. θ=Ι 4 -8Ι=4 4 s=4*2. 11=8. 44 θ<4 s – H 0 не отклоняется, 8 – не выброс Если θ > 4 s - H 0 отклоняется 2. Критерий Диксона (если n ≤ 25) r 0, 05 = 0, 477 Если r > rα - H 0 отклоняется r < rα - H 0 не отклоняется, 8 – не выброс 3. Если n >25 Если t > tα - H 0 отклоняется t 0, 05 = 2. 11 t < tα , 8 – не выброс

ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ РАЗЛИЧИЯ Смысл критериев различия Критерии различия позволяют дать ответ на вопросы трех ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ РАЗЛИЧИЯ Смысл критериев различия Критерии различия позволяют дать ответ на вопросы трех типов относится ли то или иное измерение к данной совокупности? соответствует ли эмпирическое распределение теоретическому? различаются ли две эмпирические выборки? Практическая задача: проблема выбросов можно ли применять ДИ, tкритерий и др. сравнение контроля и опыта Нулевая гипотеза Н 0: реального различия нет сомнительное измерение принадлежит данной совокупности, оно не случайно различие между выборочным и теоретическим распределением в действительности отсутствует, имеющееся отличие – случайность две выборки – контроль и опыт- не отличаются, различие между ними – случайность Альтернативная гипотеза Н 1: различие неслучайно Если θ> θα – H 0 отклоняется

ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ РАЗЛИЧИЯ Проверка гипотез о законах стат. распределения Н 0: экспериментальные данные подчиняются ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ РАЗЛИЧИЯ Проверка гипотез о законах стат. распределения Н 0: экспериментальные данные подчиняются данному теоретическому распределению Если θ> θα – H 0 отклоняется Критерий χ2 fi – число выборочных значений, попавших в i-ый класс (наблюдаемые частоты) – ожидаемые частоты попадания в i-ый класс, предсказанные на основе теоретического закона ν=k-mf - число степеней свободы k – число классов mf – число параметров, описывающих теоретическое распределение, +1 Нормальное, биномиальное распределения mf =3 Пуассон, Стьюдент mf =2 Равномерное распределение mf =1

Объем выборки: Процедура не применима, если объем выборки (по разным рекомендациям) меньше 30 -50 Объем выборки: Процедура не применима, если объем выборки (по разным рекомендациям) меньше 30 -50 n Практическая рекомендация для определения числа классов: k 40– 100– 500– 1000– 10000 7– 9 8– 12 10– 16 12– 22 .

Пример: Соответствует ли распределение людей по росту Номер Рост, см нормальномуfiзакону? класса i 1 Пример: Соответствует ли распределение людей по росту Номер Рост, см нормальномуfiзакону? класса i 1 142 -144 1 2 145 -147 2 3 148 -150 8 4 151 -153 26 5 154 -156 65 6 157 -159 120 7 160 -162 179 8 163 -165 201 9 166 -168 172 10 169 -171 120 11 172 -174 64 12 175 -177 28 13 178 -180 10 14 181 -183 3 15 184 -186 1 Сумма 1000 1. Построить вариационный ряд (гистограмму) 2. Сформулировать нулевую гипотезу H 0: эмпирическое распределение не отличается от нормального

Номер класса i Рост, см fi 1 142 -144 1 2 145 -147 2 Номер класса i Рост, см fi 1 142 -144 1 2 145 -147 2 3 148 -150 8 4 151 -153 26 5 154 -156 65 6 157 -159 120 7 160 -162 179 8 163 -165 201 9 166 -168 172 10 169 -171 120 11 172 -174 64 12 175 -177 28 13 178 -180 10 14 181 -183 3 15 184 -186 1 Сумма 1000 3. Построить теоретическое распределение

Номер класса i Рост, см fi 1 142 -144 1 0, 47 2 145 Номер класса i Рост, см fi 1 142 -144 1 0, 47 2 145 -147 2 2, 32 3 148 -150 8 9, 00 4 151 -153 26 27, 30 5 154 -156 65 64, 77 6 157 -159 120, 16 7 160 -162 179 174, 35 8 163 -165 201 197, 83 9 166 -168 172 175, 55 10 169 -171 120 121, 83 11 172 -174 64 66, 12 12 175 -177 28 28, 07 13 178 -180 10 9, 32 14 181 -183 3 2, 42 15 184 -186 1 0, 49 1000 Сумма 3. Построить теоретическое распределение

Номер класса i Рост, см fi 1 142 -144 1 0, 47 0, 61 Номер класса i Рост, см fi 1 142 -144 1 0, 47 0, 61 2 145 -147 2 2, 32 0, 04 3 148 -150 8 9, 00 0, 11 4 151 -153 26 27, 30 0, 06 5 154 -156 65 64, 77 0, 00 6 157 -159 120, 16 0, 00 9 166 -168 172 175, 55 0, 07 10 169 -171 120 121, 83 0, 03 12 175 -177 28 28, 07 0, 00 13 178 -180 10 9, 32 0, 05 14 181 -183 3 2, 42 0, 14 15 184 -186 1 0, 49 0, 53 1000 1, 88 4. Объединение крайних классов Критерий хи-квадрат может привести к неправильному результату, если 160 -162 179 174, 35 0, 12 имеются очень малые теоретические частоты – тогда деление на очень малую 8 величину неоправданно завышает0, 05 163 -165 201 197, 83 окончательный результат 7 11 Практическая рекомендация: если 0, 07<3, то крайние классы объединяют 172 -174 64 66, 12 Сумма

Номер класса i Рост, см fi 1 142 -144 1 0, 47 0, 61 Номер класса i Рост, см fi 1 142 -144 1 0, 47 0, 61 2 145 -147 2 2, 32 0, 04 3 148 -150 8 9, 00 0, 11 11 11, 79 4 151 -153 26 27, 30 0, 06 26 27, 30 5 154 -156 65 64, 77 0, 00 65 64, 77 6 157 -159 120, 16 0, 00 120, 16 7 160 -162 179 174, 35 0, 12 179 174, 35 8 163 -165 201 197, 83 0, 05 201 197, 83 9 166 -168 172 175, 55 0, 07 172 175, 55 10 169 -171 120 121, 83 0, 03 120 121, 83 11 172 -174 64 66, 12 0, 07 64 66, 12 12 175 -177 28 28, 07 0, 00 28 28, 07 13 178 -180 10 9, 32 0, 05 14 12, 23 14 181 -183 3 2, 42 0, 14 - - 15 184 -186 1 0, 49 0, 53 - - 1000 1, 88 1000 Сумма fi 5. Расчет статистики критерия -

Номер класса i Рост, см fi 1 142 -144 1 0, 47 0, 61 Номер класса i Рост, см fi 1 142 -144 1 0, 47 0, 61 2 145 -147 2 2, 32 0, 04 3 148 -150 8 9, 00 0, 11 11 11, 79 0, 05 4 151 -153 26 27, 30 0, 06 5 154 -156 65 64, 77 6 157 -159 120, 16 7 160 -162 179 174, 35 0, 00 Число степеней свободы ν=k-m =11 -3=8 65 64, 77 0, 00 f 0, 00 α=0. 05 120, 16 0, 00 0, 12 Χ 2α, 8=15. 5 174, 35 0, 12 179 8 163 -165 201 197, 83 0, 05 9 166 -168 172 175, 55 0, 07 Χ 10 169 -171 120 121, 83 0, 03 11 172 -174 64 66, 12 120 121, 83 0, 03 Рост распределен по нормальному закону 0, 07 64 66, 12 0, 07 12 175 -177 28 28, 07 0, 00 13 178 -180 10 9, 32 0, 05 14 12, 23 0, 26 14 181 -183 3 2, 42 0, 14 - - 15 184 -186 1 0, 49 0, 53 - - 1000 1, 88 1000 Сумма fi 6. Определение критического значения - 201 2 α, 8=15. 5 172 197, 83 0, 05 > Χ 2=0. 71 – 0, 07 нельзя H 0 175, 55 отвергнуть => 0, 71

Номер класса i Рост, см fi 1 142 -144 1 2 1. 3 2. Номер класса i Рост, см fi 1 142 -144 1 2 1. 3 2. 4 3. 4. 5 6 7 5. 8 9 fi 0, 47 0, 61 - - 145 -147 2 2, 32 0, 04 Построить эмпирическое распределение (найти fi) 11, 79 148 -150 8 9, 00 0, 11 11 Построить теоретическое распределение (найти ) 151 -153 26 0, 06 <3) 26 27, 30 Объединить крайние 27, 30 (если классы Рассчитать Χ 2 65 154 -156 64, 77 0, 00 65 64, 77 157 -159 120, 16 0, 05 0, 06 0, 00 120, 16 0, 00 160 -162 179 174, 35 0, 12 2 Сравнить с табличным χ α, v 163 -165 201 197, 83 0, 05 (Число степеней свободы ν=k-mf) 166 -168 172 175, 55 0, 07 179 174, 35 0, 12 201 197, 83 0, 05 172 175, 55 0, 07 10 169 -171 120 121, 83 0, 03 11 172 -174 64 66, 12 0, 07 12 175 -177 28 28, 07 0, 00 13 178 -180 10 9, 32 0, 05 14 12, 23 0, 26 критерий 3 не с 14 Важно: 181 -183 хи-квадрат работает 0, 14 исходными экспериментальными 2, 42 значениями, а с частотами распределения (плотностью распределения) 15 184 -186 1 0, 49 0, 53 Сумма 1000 1, 88 1000 0, 71

Задание Для проверки игральной кости было произведено 60 бросков. Наблюдаемые частоты появления каждого из Задание Для проверки игральной кости было произведено 60 бросков. Наблюдаемые частоты появления каждого из 6 чисел следующие: 7 16 8 17 3 9. Проверить нуль-гипотезу – «кость идеальная» .

Как были сфальсифицированы выборы и как это обнаружилось Результаты выборов (Гос. Дума, 2011) ЕР Как были сфальсифицированы выборы и как это обнаружилось Результаты выборов (Гос. Дума, 2011) ЕР 49, 3% КПРФ 19, 1% СР 13, 2% ЛДПР 11, 6% Яблоко 3, 4% “…математика такая штука, что «отменить» распределение Гаусса — это примерно как объявить прямой угол равным 100, а кипение воды назначить при 60 градусах специальным указом”