Л9. Статистические критерии 2.ppt
- Количество слайдов: 30
Статистические критерии - 2
ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ Критерии различия позволяют дать ответ на вопросы трех типов относится ли то или иное измерение к данной совокупности? соответствует ли эмпирическое распределение теоретическому? различаются ли две эмпирические выборки? Практическая задача: проблема выбросов можно ли применять ДИ, tкритерий и др. сравнение контроля и опыта Нулевая гипотеза Н 0: реального различия нет сомнительное измерение принадлежит данной совокупности, его отличие случайно различие между выборочным и теоретическим распределением в действительности отсутствует, имеющееся отличие – случайность две выборки – контроль и опыт- не отличаются, различие между ними – случайность Альтернативная гипотеза Н 1: различие неслучайно
Номер класса i Рост, см fi 1 142 -144 1 0, 47 0, 61 - - 2 145 -147 2 2, 32 0, 04 - - 3 148 -150 8 9, 00 0, 11 11 11, 79 4 151 -153 26 5 154 -156 65 6 157 -159 120 7 160 -162 179 27, 30 1. 64, 77 2. 3. 120, 16 4. 174, 35 8 163 -165 201 197, 83 0, 05 9 166 -168 172 175, 55 0, 07 10 169 -171 120 121, 83 5. 11 172 -174 64 66, 12 12 175 -177 28 28, 07 0, 00 13 178 -180 10 9, 32 0, 05 14 12, 23 0, 26 14 181 -183 3 2, 42 0, 14 - - 15 184 -186 1 0, 49 0, 53 - - 1000 1, 88 1000 Сумма fi 0, 05 0, 06 26 27, 30 0, 06 Построить эмпирическое распределение (найти fi) 0, 00 65 64, 77 0, 00 Построить теоретическое распределение (найти ) Объединить120 крайние классы (если <3) 0, 00 120, 16 0, 00 Рассчитать Χ 2 0, 12 179 174, 35 0, 12 0, 03 120 121, 83 Сравнить с табличным χ2α, v 0, 03 (Число степеней свободы ν=k-mf) 0, 07 64 66, 12 0, 07 0, 71
Задание Для проверки игральной кости было произведено 60 бросков. Наблюдаемые частоты появления каждого из 6 чисел следующие: 7 16 8 17 3 9. Проверить нуль-гипотезу – «кость идеальная» . Номер класса i fi 1 7 10 9 0, 9 2 16 10 36 3, 6 3 8 10 4 0, 4 4 17 10 49 4, 9 5 3 10 49 4, 9 6 9 10 1 0, 1 Сумма 60 60 14, 8 f=k-1=6 -1=5 нуль-гипотеза отвергается – кость не идеальная
ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ Смысл критериев различия Критерии различия позволяют дать ответ на вопросы трех типов относится ли то или иное измерение к данной совокупности? соответствует ли эмпирическое распределение теоретическому? различаются ли две эмпирические выборки? Практическая задача: проблема выбросов можно ли применять ДИ, tкритерий и др. сравнение контроля и опыта Нулевая гипотеза Н 0: реального различия нет сомнительное измерение принадлежит данной совокупности, оно не случайно различие между выборочным и теоретическим распределением в действительности отсутствует, имеющееся отличие – случайность две выборки – контроль и опыт- не отличаются, различие между ними – случайность Альтернативная гипотеза Н 1: различие неслучайно Если θ> θα – H 0 отклоняется
ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ Сравнение двух выборок Критерий Стьюдента 1) Сравнение выборочного среднего с константой нулевая гипотеза f Нулевая гипотеза отвергается, если t>tα 2. 15 27 2. 05 2 4. 30 15 2. 13 28 2. 05 3 3. 18 16 2. 12 29 2. 04 2. 78 17 2. 11 30 2. 04 2. 57 18 2. 10 40 2. 02 6 условие проверки 14 5 f=n-1 - число степеней свободы 12. 71 4 статистика критерия t 0. 95 1 H 0: f t 0. 95 2. 45 19 2. 09 50 2. 01 7 2. 37 20 2. 09 60 2. 00 8 2. 31 21 2. 08 80 1. 99 9 2. 26 22 2. 07 100 1. 98 10 2. 23 23 2. 07 120 1. 98 11 2. 20 24 2. 06 200 1. 97 12 2. 18 25 2. 06 500 1. 96 13 2. 16 26 2. 06 >> 1. 96
ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ При определении p. H раствора было получено значение 7. 48± 0. 21 на n=10 пробах. Можно ли считать Сравнение двух выборок реакцию раствора нейтральной? Критерий Стьюдента Нуль-гипотеза: Реакция раствора нейтральная, т. е. p. H=7=μ, 1) Сравнение выборочного среднего с константой μ-x=0 f 1 H 0 : t 0. 95 12. 71 f 14 t 0. 95 2. 15 f 27 t 0. 95 2. 05 2 4. 30 15 2. 13 28 2. 05 f=10 -1=9, t 9, 0. 05=2. 26 t 9, 0. 05< t – нуль-гипотеза 3 3. 18 быть отвергнута на 5% 2. 04 может 16 2. 12 29 уровне значимости: раствор не является 2. 11 4 2. 78 17 нейтральным. 30 2. 04 5 18 2. 10 40 2. 02 6 f=n-1 - число степеней свободы 2. 57 2. 45 19 2. 09 50 2. 01 7 2. 37 20 2. 09 60 2. 00 8 2. 31 21 2. 08 80 1. 99 9 2. 26 22 2. 07 100 1. 98 10 2. 23 23 2. 07 120 1. 98 11 2. 20 24 2. 06 200 1. 97 12 2. 18 25 2. 06 500 1. 96 13 2. 16 26 2. 06 >> 1. 96
ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ РАЗЛИЧИЯ Выборка объемом 25 имеет среднее значение =9 и стандартное 4. Сравнение контроля и опыта с доверительной вероятностью 95% отклонение s=2. Можно ли считать, что среднее равно 10? Критерий Стьюдента 1) Сравнение выборочного среднего с константой H 0: t 0. 95 1 12. 71 14 2. 15 27 2. 05 2 4. 30 15 2. 13 28 2. 05 3 3. 18 16 2. 12 29 2. 04 4 2. 78 17 2. 11 30 2. 04 5 2. 57 18 2. 10 40 2. 02 6 f=n-1 - число степеней свободы f f t 0. 95 2. 45 19 2. 09 50 2. 01 7 2. 37 20 2. 09 60 2. 00 8 2. 31 21 2. 08 80 1. 99 9 2. 26 22 2. 07 100 1. 98 10 2. 23 23 2. 07 120 1. 98 11 2. 20 24 2. 06 200 1. 97 12 2. 18 25 2. 06 500 1. 96 13 2. 16 26 2. 06 >> 1. 96
Критерий Стьюдента 2) Сравнение двух выборочных средних H 0: Нулевая гипотеза отвергается, если t>tα А. Выборки взяты из одной генеральной совокупности; дисперсии равны f=nx+ny-2, Если nx=ny=n, то f=2 n-2
Проверяется эффективность Критерий Стьюдента применения препарата, защитного от некоторой инфекции. Взяты две группы животных, измеряемая величина – время сопротивляемости болезни 2) Сравнение двух выборочных средних H 0: Нулевая гипотеза отвергается, если t>tα А. Выборки взяты из одной генеральной совокупности; дисперсии равны f=nx+ny-2, Нуль-гипотеза: препарат не действует, выборки не отличаются Если nx=ny=n, то f=2 n-2 f=32+23 -2=53≈50, t 0. 05(f=50)=2. 01 t>tα – нуль-гипотеза отклоняется. Следовательно, расхождение между опытом и контролем можно считать значимым, т. е. препарат обладает защитным действием.
Критерий Стьюдента 2) Сравнение двух выборочных средних H 0: Б. Выборки взяты из разных генеральных совокупностей; дисперсии неравны Если выборки большие, f=∞
пример Изучали урожайность двух сортов ячменя, которые высевали на 5 делянках H 0: сорта не различаются по урожайности Номер делянки 1 2 3 4 5 среднее дисперсия Сорт 1 9, 1 7, 3 8 7, 9 9, 4 8, 34 0, 77 Сорт 2 7, 6 8, 2 5, 7 6, 1 - 6, 90 1, 42 Какой вывод? t 0. 05(f=5. 4)≈2. 57> t=2. 017 – различия между сортами незначимы.
Критерий Стьюдента 2) Сравнение двух при 95% дов. вероятности Сравнить средниевыборочных средних H 0: Б. Выборки взяты из разных генеральных совокупностей Если выборки большие, f=∞
Критерий Стьюдента В. Сравнение выборок с попарно связанными измерениями H 0: f=n-1 Пример: предпосевная обработка семян пшеницы – влияние на урожайность Годы Опыт xi Контроль yi 1947 22. 9 19. 4 1948 20. 2 16. 2 1949 19. 5 16. 9 1950 30. 5 29. 3 1951 35. 6 31. 4 1952 31. 9 28. 5 1953 27. 7 25. 6 сумма среднее
Критерий Стьюдента В. Сравнение выборок с попарно связанными измерениями H 0: f=n-1 Пример: предпосевная обработка семян пшеницы – влияние на урожайность Годы Опыт xi Контроль yi Δi=xi-yi 1947 22. 9 19. 4 3. 5 1948 20. 2 16. 2 4. 0 1949 19. 5 16. 9 2. 6 1950 30. 5 29. 3 1. 2 1951 35. 6 31. 4 4. 2 1952 31. 9 28. 5 3. 4 1953 27. 7 25. 6 2. 1 сумма 188. 3 167. 3 21. 0 среднее
Критерий Стьюдента В. Сравнение выборок с попарно связанными измерениями H 0: f=n-1 Δi=xi-yi Пример: предпосевная обработка семян пшеницы – влияние на урожайность Годы Опыт xi Контроль yi Δi=xi-yi 1947 22. 9 19. 4 3. 5 0. 25 1948 20. 2 16. 2 4. 0 1 1949 19. 5 16. 9 2. 6 0. 16 1950 30. 5 29. 3 1. 2 3. 24 1951 35. 6 31. 4 4. 2 1. 44 1952 31. 9 28. 5 3. 4 0. 16 1953 27. 7 25. 6 2. 1 0. 81 сумма 188. 3 167. 3 21. 0 7. 06 среднее n=7 H 0 отклоняется – предпосевная обработка семян дала результат
Порядок проверки гипотезы Вариант 1 – сравнение расчетного значения критерия с критическим значением 1. Вычисляем значение статистики критерия θ 2. Для заданного уровня значимости α находим критическое (табличное) значение θα 3. Сравниваем статистику критерия θ с табличным (критическим) значением θα Если θ> θα – H 0 отклоняется
«Хорошая» (удобная) статистика критерия может подчиняться известному закону распределения, например, закону Стьюдента Между статистикой критерия (θ) и уровнем значимости (α) существует жесткая связь – зная одно, можно найти второе (с помощью стандартных таблиц, расчетов или компьютерных стат. пакетов) Критические значения t-распределения для 95%-ной доверительной вероятности f t 0. 95 1 12. 71 14 2. 15 27 2. 05 2 4. 30 15 2. 13 28 2. 05 3 3. 18 16 2. 12 29 2. 04 4 2. 78 17 2. 11 30 2. 04 5 2. 57 18 2. 10 40 2. 02 6 2. 45 19 2. 09 50 2. 01 7 2. 37 20 2. 09 60 2. 00 8 2. 31 21 2. 08 80 1. 99 9 2. 26 22 2. 07 100 1. 98 10 2. 23 23 2. 07 120 1. 98 11 2. 20 24 2. 06 200 1. 97 12 2. 18 25 2. 06 500 1. 96 13 2. 16 26 2. 06 >> 1. 96
Порядок проверки гипотезы Вариант 1 – сравнение расчетного значения критерия с критическим значением Вариант 2 – сравнение расчетного уровня значимости с критическим уровнем значимости 1. Вычисляем значение статистики критерия θ 2. Для заданного уровня значимости α находим критическое (табличное) значение θα 2. Находим соответствующий этому значению θ уровень значимости p 3. Сравниваем уровень значимости p c принятым уровнем значимости α 3. Сравниваем статистику критерия θ с табличным (критическим) значением θα Если θ> θα – H 0 отклоняется Если p< α – H 0 отклоняется
Порядок проверки гипотезы Вариант 1 – сравнение расчетного значения критерия с критическим значением 1. Вычисляем значение статистики критерия θ 2. Для заданного уровня значимости α находим критическое (табличное) значение θα 3. Сравниваем статистику критерия θ с табличным (критическим) значением θα Если θ> θα – H 0 отклоняется Как найти θα без таблиц?
Порядок проверки гипотезы Вариант 1 – сравнение расчетного значения критерия с Как найти точное p (достигнутый уровень критическим значением значимости) для расчетного θ? Вариант 2 – сравнение расчетного (достигнутого) уровня значимости с критическим уровнем значимости 1. Вычисляем значение статистики критерия θ 2. Для заданного уровня значимости α находим критическое (табличное) значение θα 2. Находим соответствующий этому значению θ уровень значимости p 3. Сравниваем уровень значимости p c принятым уровнем значимости α 3. Сравниваем статистику критерия θ с табличным (критическим) значением θα Если θ> θα – H 0 отклоняется Если p< α – H 0 отклоняется
Критерий Стьюдента в Excel: сравнение двух выборок
Еще раз об уровнях значимости или Будем ли замораживать инопланетянина? Задача стат. критерия: проверить (отвергнуть) нулевую гипотезу = найти ( «увидеть» ) различия Отвергнуть нулевую гипотезу (найти различия) проще, если 1. Выборка большая 2. Взят мощный стат. критерий 3. Допускается большое значение ошибки p уровень значимости p = ошибка I рода – это вероятность неверно отвергнуть нулевую гипотезу Н 0: он человек Если на уровне значимости p=5% стат. критерий отвергнет нулевую гипотезу (т. е. будет принята альтернативная гипотеза он не человек), то вероятность ошибки (он все же человек, а мы его заморозили) – 5%
p < 0. 1 -0. 05 – тенденция p < 0. 05 -0. 01 – значимость p < 0. 001 – высокая значимость инопланетянин p=30% p=1% инопланетя Может и человек
ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ При определении p. H раствора было получено значение 7. 48± 0. 21 на n=10 пробах. Можно ли считать Сравнение двух выборок реакцию раствора нейтральной? Критерий Стьюдента Нуль-гипотеза: Реакция раствора нейтральная, т. е. p. H=7=μ, 1) Сравнение выборочного среднего с константой μ-x=0 f 1 H 0 : t 0. 95 12. 71 f 14 t 0. 95 2. 15 f 27 t 0. 95 2. 05 2 4. 30 15 2. 13 28 2. 05 f=10 -1=9, t 9, 0. 05=2. 26 16 2. 12 29 t 9, 0. 05< t – нуль-гипотеза 3 3. 18 быть отвергнута на 5% 2. 04 может уровне значимости: раствор не является 2. 11 4 2. 78 17 нейтральным. 30 2. 04 Однако, на 1% ном уровне 2. 57 гипотеза 5 значимости t 9, 0. 99=3. 25 – 40 2. 02 18 2. 10 H 0 не м. б. отвергнута: раствор является нейтральным 6 f=n-1 - число степеней свободы 2. 45 19 2. 09 50 2. 01 7 2. 37 20 2. 09 60 2. 00 8 2. 31 21 2. 08 80 1. 99 9 2. 26 22 2. 07 100 1. 98 10 2. 23 23 2. 07 120 1. 98 11 2. 20 24 2. 06 200 1. 97 12 2. 18 25 2. 06 500 1. 96 13 2. 16 26 2. 06 >> 1. 96
Важно! Условия применимости критерия Стьюдента (классического): 1. Нормальность распределения случайных величин Критерий хи-квадрат Критерий Шапиро-Уилка Критерий асимметрии и эксцесса 2. Равенство дисперсий в сравниваемых выборках
Критерий Фишера – сравнение дисперсий H 0: f 1=n 1 -1 f 2=n 2 -1 порядок степеней свободы имеет значение:
Критерий Фишера – сравнение дисперсий В двух классах проводилось тестирование умственного развития десяти учащихся. Полученные значения величин средних достоверно не различались, однако психолога интересует вопрос – есть ли различия в степени однородности показателей умственного развития между классами. N п/п Класс II 1 90 41 2 29 49 3 39 56 4 79 64 5 88 72 6 53 65 7 34 63 8 40 87 9 75 77 10 79 62 Всего 606 636 Средний бал 60, 6 63, 6 Дисперсия 572, 83 174, 04 Различие средних недостоверно: t=0, 347 < t 0. 05, 9=2, 26 f 1=9 f 2=9 F 0. 05=3, 18
Задание При измерении величины газообмена в опытной (n 1=10) и контрольной (n 2=10) группах животных были получены, соответственно, следующие величины дисперсий – s 12=163. 9 и s 22=89. 3. Отличается ли вариабельность показателей газообмена в опытной и контрольной группах животных?
Какой критерий нужно применить?


