Л8. Статистические критерии.ppt
- Количество слайдов: 19
Оптимальный объем выборки 4 6 2 5 3 8 2 1 4 5 Достаточен ли объем выборки для того, чтобы среднее значение - минимальный объем выборки, выборки было определено с относительной вероятной ошибкой необходимый для получения среднего 25% на уровне 95% доверительной вероятности? значения с определенной точностью δ ε=0, 25 t=2, 26 - минимальный объем выборки, необходимый для получения среднего значения с относительной вероятной ошибкой ε Размер выборки N=10 недостаточен
Статистические критерии
ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ РАЗЛИЧИЯ Смысл критериев различия Критерии различия позволяют дать ответ на вопросы трех типов относится ли то или иное измерение к данной совокупности? соответствует ли эмпирическое распределение теоретическому? различаются ли две эмпирические выборки? Практическая задача: проблема выбросов можно ли применять ДИ, tкритерий и др. сравнение контроля и опыта Нулевая гипотеза Н 0: реального различия нет сомнительное измерение принадлежит данной совокупности, его отличие случайно Альтернативная гипотеза Н 1: различие неслучайно различие между две выборки – выборочным и контроль и опыт- не теоретическим отличаются, распределением в различие между действительности ними – случайность отсутствует, имеющееся отличие – случайность Задача статистических критериев – проверка гипотез Статистические критерии ничего не могут утверждать или подтверждать, они могут только отвергать или не отвергать гипотезы Если нуль-гипотезу удается отвергнуть, то принимается альтернативная гипотеза: полученное отличие является неслучайным, т. е. оно есть на самом деле
ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ РАЗЛИЧИЯ Принадлежность резко выделяющихся наблюдений к выборке x 1, x 2, …, xn-1, xn H 0: xn не является выбросом 4 6 2 5 3 8 2 1 4 5 Является ли значение 8 выбросом? N=10 1. Правило четырех сигм (если n≥ 10) 1. θ=Ι 4 -8Ι=4 Если θ > 4 s - H 0 отклоняется 4 s=4*2. 11=8. 44 2. Критерий Диксона (если n ≤ 25) Если r > rα - H 0 отклоняется θ<4 s – H 0 не отклоняется, 8 – не выброс 2. r 0, 05 = 0, 477 3. Если n >25 Если t > tα - H 0 отклоняется r < rα - H 0 не отклоняется, 8 – не выброс
ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ РАЗЛИЧИЯ Принадлежность резко выделяющихся наблюдений к выборке x 1, x 2, …, xn-1, xn H 0: xn не является выбросом нулевая гипотеза статистика критерия 1. Правило четырех сигм (если n≥ 10) Если θ > 4 s - H 0 отклоняется 2. Критерий Диксона (если n ≤ 25) Если r > rα - H 0 отклоняется 3. Если n >25 Если t > tα - H 0 отклоняется условие проверки
Порядок проверки гипотезы Вариант 1 – сравнение расчетного значения критерия с критическим значением 1. Вычисляем значение статистики критерия θ 2. Для заданного уровня значимости α находим критическое (табличное) значение θα
Порядок проверки гипотезы Вариант 1 – сравнение расчетного значения критерия с критическим значением 1. Вычисляем значение статистики критерия θ 2. Для заданного уровня значимости α находим критическое (табличное) значение θα 3. Сравниваем статистику критерия θ с табличным (критическим) значением θα Если θ> θα – H 0 отклоняется
ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ РАЗЛИЧИЯ Смысл критериев различия Критерии различия позволяют дать ответ на вопросы трех типов относится ли то или иное измерение к данной совокупности? соответствует ли эмпирическое распределение теоретическому? различаются ли две эмпирические выборки? Практическая задача: проблема выбросов можно ли применять ДИ, tкритерий и др. сравнение контроля и опыта Нулевая гипотеза Н 0: реального различия нет сомнительное измерение принадлежит данной совокупности, оно не случайно различие между выборочным и теоретическим распределением в действительности отсутствует, имеющееся отличие – случайность две выборки – контроль и опыт- не отличаются, различие между ними – случайность Альтернативная гипотеза Н 1: различие неслучайно Если θ> θα – H 0 отклоняется
ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ РАЗЛИЧИЯ Проверка гипотез о законах стат. распределения Н 0: экспериментальные данные подчиняются данному теоретическому распределению Если θ> θα – H 0 отклоняется Критерий χ2 fi – число выборочных значений, попавших в i-ый класс (наблюдаемые частоты) – ожидаемые частоты попадания в i-ый класс, предсказанные на основе теоретического закона ν=k-mf - число степеней свободы k – число классов mf – число параметров, описывающих теоретическое распределение, +1 Нормальное, биномиальное распределения mf =3 Пуассон, Стьюдент mf =2 Равномерное распределение mf =1
Объем выборки: Процедура не применима, если объем выборки (по разным рекомендациям) меньше 30 -50 n Практическая рекомендация для определения числа классов: k 40– 100– 500– 1000– 10000 7– 9 8– 12 10– 16 12– 22 .
Пример: Соответствует ли распределение людей по росту Номер Рост, см нормальномуfiзакону? класса i 1 142 -144 1 2 145 -147 2 3 148 -150 8 4 151 -153 26 5 154 -156 65 6 157 -159 120 7 160 -162 179 8 163 -165 201 9 166 -168 172 10 169 -171 120 11 172 -174 64 12 175 -177 28 13 178 -180 10 14 181 -183 3 15 184 -186 1 Сумма 1000 1. Построить вариационный ряд (гистограмму) 2. Сформулировать нулевую гипотезу H 0: эмпирическое распределение не отличается от нормального
Номер класса i Рост, см fi 1 142 -144 1 2 145 -147 2 3 148 -150 8 4 151 -153 26 5 154 -156 65 6 157 -159 120 7 160 -162 179 8 163 -165 201 9 166 -168 172 10 169 -171 120 11 172 -174 64 12 175 -177 28 13 178 -180 10 14 181 -183 3 15 184 -186 1 Сумма 1000 3. Построить теоретическое распределение
Номер класса i Рост, см fi 1 142 -144 1 0, 47 2 145 -147 2 2, 32 3 148 -150 8 9, 00 4 151 -153 26 27, 30 5 154 -156 65 64, 77 6 157 -159 120, 16 7 160 -162 179 174, 35 8 163 -165 201 197, 83 9 166 -168 172 175, 55 10 169 -171 120 121, 83 11 172 -174 64 66, 12 12 175 -177 28 28, 07 13 178 -180 10 9, 32 14 181 -183 3 2, 42 15 184 -186 1 0, 49 1000 Сумма 3. Построить теоретическое распределение
Номер класса i Рост, см fi 1 142 -144 1 0, 47 0, 61 2 145 -147 2 2, 32 0, 04 3 148 -150 8 9, 00 0, 11 4 151 -153 26 27, 30 0, 06 5 154 -156 65 64, 77 0, 00 6 157 -159 120, 16 0, 00 9 166 -168 172 175, 55 0, 07 10 169 -171 120 121, 83 0, 03 12 175 -177 28 28, 07 0, 00 13 178 -180 10 9, 32 0, 05 14 181 -183 3 2, 42 0, 14 15 184 -186 1 0, 49 0, 53 1000 1, 88 4. Объединение крайних классов Критерий хи-квадрат может привести к неправильному результату, если 160 -162 179 174, 35 0, 12 имеются очень малые теоретические частоты – тогда деление на очень 8 малую величину неоправданно 0, 05 163 -165 201 197, 83 завышает окончательный результат 7 11 Практическая рекомендация: если 172 -174 64 66, 12 0, 07 Сумма <3, то крайние классы объединяют
Номер класса i Рост, см fi 1 142 -144 1 0, 47 0, 61 2 145 -147 2 2, 32 0, 04 3 148 -150 8 9, 00 0, 11 11 11, 79 4 151 -153 26 27, 30 0, 06 26 27, 30 5 154 -156 65 64, 77 0, 00 65 64, 77 6 157 -159 120, 16 0, 00 120, 16 7 160 -162 179 174, 35 0, 12 179 174, 35 8 163 -165 201 197, 83 0, 05 201 197, 83 9 166 -168 172 175, 55 0, 07 172 175, 55 10 169 -171 120 121, 83 0, 03 120 121, 83 11 172 -174 64 66, 12 0, 07 64 66, 12 12 175 -177 28 28, 07 0, 00 28 28, 07 13 178 -180 10 9, 32 0, 05 14 12, 23 14 181 -183 3 2, 42 0, 14 - - 15 184 -186 1 0, 49 0, 53 - - 1000 1, 88 1000 Сумма fi 5. Расчет статистики критерия -
Номер класса i Рост, см fi 1 142 -144 1 0, 47 0, 61 2 145 -147 2 2, 32 0, 04 3 148 -150 8 9, 00 0, 11 11 11, 79 0, 05 4 151 -153 26 27, 30 0, 06 5 154 -156 65 64, 77 6 157 -159 120, 16 0, 00 Число степеней свободы ν=k-m =11 -3=8 65 64, 77 0, 00 f 0, 00 α=0. 05 120, 16 0, 00 7 160 -162 179 174, 35 0, 12 Χ 2α, 8=15. 5 174, 35 179 0, 12 8 163 -165 201 197, 83 0, 05 9 166 -168 172 175, 55 0, 07 Χ 10 169 -171 120 121, 83 0, 03 11 172 -174 64 66, 12 120 121, 83 0, 03 Рост распределен по нормальному закону 0, 07 64 66, 12 0, 07 12 175 -177 28 28, 07 0, 00 13 178 -180 10 9, 32 0, 05 14 12, 23 0, 26 14 181 -183 3 2, 42 0, 14 - - 15 184 -186 1 0, 49 0, 53 - - 1000 1, 88 1000 Сумма fi 6. Определение критического значения - 201 2 197, 83 α, 8=15. 5 172 > Χ 2=0. 71 – H 0 нельзя 175, 55 0, 07 отвергнуть => 0, 71
Номер класса i Рост, см fi 1 142 -144 1 2 1. 3 2. 4 3. 4. 5 6 7 5. 8 9 fi 0, 47 0, 61 - - 145 -147 2 2, 32 0, 04 Построить эмпирическое распределение (найти fi) 148 -150 8 9, 00 0, 11 11 11, 79 Построить теоретическое распределение (найти ) 151 -153 27, 30 0, 06 26 27, 30 Объединить 26 крайние классы (если <3) Рассчитать Χ 2 154 -156 65 64, 77 0, 00 65 64, 77 157 -159 120, 16 0, 05 0, 06 0, 00 120, 16 0, 00 160 -162 179 174, 35 0, 12 2 Сравнить с табличным χ α, v 163 -165 201 197, 83 0, 05 (Число степеней свободы ν=k-mf) 166 -168 172 175, 55 0, 07 179 174, 35 0, 12 201 197, 83 0, 05 172 175, 55 0, 07 10 169 -171 120 121, 83 0, 03 11 172 -174 64 66, 12 0, 07 12 175 -177 28 28, 07 0, 00 13 178 -180 10 9, 32 0, 05 14 12, 23 0, 26 14 Важно: критерий хи-квадрат работает не с исходными экспериментальными 181 -183 3 2, 42 0, 14 значениями, а с частотами распределения (плотностью 15 184 -186 1 0, 49 0, 53 распределения) Сумма 1000 1, 88 1000 0, 71
Задание Для проверки игральной кости было произведено 60 бросков. Наблюдаемые частоты появления каждого из 6 чисел следующие: 7 16 8 17 3 9. Проверить нуль-гипотезу – «кость идеальная» .
Как были сфальсифицированы выборы и как это обнаружилось “…математика такая штука, что «отменить» распределение Гаусса — это примерно как объявить прямой угол равным 100, а кипение воды назначить при 60 градусах специальным указом”
Л8. Статистические критерии.ppt