Скачать презентацию Статистические критерии — 3 ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ Критерии Скачать презентацию Статистические критерии — 3 ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ Критерии

Семинар 5. Статистические критерии 3.ppt

  • Количество слайдов: 24

Статистические критерии - 3 Статистические критерии - 3

ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ Критерии различия позволяют дать ответ на вопросы трех типов относится ли то ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ Критерии различия позволяют дать ответ на вопросы трех типов относится ли то или иное измерение к данной совокупности? соответствует ли эмпирическое распределение теоретическому? различаются ли две эмпирические выборки? Практическая задача: проблема выбросов можно ли применять ДИ, tкритерий и др. сравнение контроля и опыта Нулевая гипотеза Н 0: реального различия нет сомнительное измерение принадлежит данной совокупности, его отличие случайно различие между выборочным и теоретическим распределением в действительности отсутствует, имеющееся отличие – случайность две выборки – контроль и опыт- не отличаются, различие между ними – случайность Альтернативная гипотеза Н 1: различие неслучайно

ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ РАЗЛИЧИЯ Проверка гипотез о законах стат. распределения Н 0: экспериментальные данные подчиняются ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ РАЗЛИЧИЯ Проверка гипотез о законах стат. распределения Н 0: экспериментальные данные подчиняются данному теоретическому распределению Если θ> θα – H 0 отклоняется Критерий χ2 fi – число выборочных значений, попавших в i-ый класс (наблюдаемые частоты) – ожидаемые частоты попадания в i-ый класс, предсказанные на основе теоретического закона ν=k-mf - число степеней свободы k – число классов mf – число параметров, описывающих теоретическое распределение, +1 Нормальное, биномиальное распределения mf =3 Пуассон, Стьюдент mf =2 Равномерное распределение mf =1

Номер класса i Рост, см fi 1 142 -144 1 0, 47 0, 61 Номер класса i Рост, см fi 1 142 -144 1 0, 47 0, 61 - - 2 145 -147 2 2, 32 0, 04 - - 3 148 -150 8 9, 00 0, 11 11 11, 79 4 151 -153 26 5 154 -156 65 6 157 -159 120 7 160 -162 179 27, 30 1. 64, 77 2. 3. 120, 16 4. 174, 35 8 163 -165 201 197, 83 0, 05 9 166 -168 172 175, 55 0, 07 10 169 -171 120 121, 83 5. 11 172 -174 64 66, 12 12 175 -177 28 28, 07 0, 00 13 178 -180 10 9, 32 0, 05 14 12, 23 0, 26 14 181 -183 3 2, 42 0, 14 - - 15 184 -186 1 0, 49 0, 53 - - 1000 1, 88 1000 Сумма fi 0, 05 0, 06 26 27, 30 0, 06 Построить эмпирическое распределение (найти fi) 0, 00 65 64, 77 0, 00 Построить теоретическое распределение (найти ) Объединить120 крайние классы (если <3) 0, 00 120, 16 0, 00 Рассчитать Χ 2 0, 12 179 174, 35 0, 12 0, 03 120 121, 83 Сравнить с табличным χ2α, v 0, 03 (Число степеней свободы ν=k-mf) 0, 07 64 66, 12 0, 07 0, 71

Задание Для проверки игральной кости было произведено 60 бросков. Наблюдаемые частоты появления каждого из Задание Для проверки игральной кости было произведено 60 бросков. Наблюдаемые частоты появления каждого из 6 чисел следующие: 7 16 8 17 3 9. Проверить нуль-гипотезу – «кость идеальная» . Номер класса i fi 1 7 10 9 0, 9 2 16 10 36 3, 6 3 8 10 4 0, 4 4 17 10 49 4, 9 5 3 10 49 4, 9 6 9 10 1 0, 1 Сумма 60 60 14, 8 f=k-1=6 -1=5 нуль-гипотеза отвергается – кость не идеальная

Как были сфальсифицированы выборы и как это обнаружилось Результаты выборов (Гос. Дума, 2011) ЕР Как были сфальсифицированы выборы и как это обнаружилось Результаты выборов (Гос. Дума, 2011) ЕР 49, 3% КПРФ 19, 1% СР 13, 2% ЛДПР 11, 6% “…математика такая штука, что «отменить» распределение Гаусса — это примерно как объявить прямой угол равным 100, а кипение воды назначить при 60 градусах специальным указом”

ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ Смысл критериев различия Критерии различия позволяют дать ответ на вопросы трех типов ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ Смысл критериев различия Критерии различия позволяют дать ответ на вопросы трех типов относится ли то или иное измерение к данной совокупности? соответствует ли эмпирическое распределение теоретическому? различаются ли две эмпирические выборки? Практическая задача: проблема выбросов можно ли применять ДИ, tкритерий и др. сравнение контроля и опыта Нулевая гипотеза Н 0: реального различия нет сомнительное измерение принадлежит данной совокупности, оно не случайно различие между выборочным и теоретическим распределением в действительности отсутствует, имеющееся отличие – случайность две выборки – контроль и опыт- не отличаются, различие между ними – случайность Альтернативная гипотеза Н 1: различие неслучайно Если θ> θα – H 0 отклоняется

ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ Сравнение двух выборок Критерий Стьюдента 1) Сравнение выборочного среднего с константой нулевая ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ Сравнение двух выборок Критерий Стьюдента 1) Сравнение выборочного среднего с константой нулевая гипотеза f Нулевая гипотеза отвергается, если t>tα 2. 15 27 2. 05 2 4. 30 15 2. 13 28 2. 05 3 3. 18 16 2. 12 29 2. 04 2. 78 17 2. 11 30 2. 04 2. 57 18 2. 10 40 2. 02 6 условие проверки 14 5 f=n-1 - число степеней свободы 12. 71 4 статистика критерия t 0. 95 1 H 0: f t 0. 95 2. 45 19 2. 09 50 2. 01 7 2. 37 20 2. 09 60 2. 00 8 2. 31 21 2. 08 80 1. 99 9 2. 26 22 2. 07 100 1. 98 10 2. 23 23 2. 07 120 1. 98 11 2. 20 24 2. 06 200 1. 97 12 2. 18 25 2. 06 500 1. 96 13 2. 16 26 2. 06 >> 1. 96

ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ При определении p. H раствора было получено значение 7. 48± 0. 21 ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ При определении p. H раствора было получено значение 7. 48± 0. 21 на n=10 пробах. Можно ли считать Сравнение двух выборок реакцию раствора нейтральной? Критерий Стьюдента Нуль-гипотеза: Реакция раствора нейтральная, т. е. p. H=7=μ, 1) Сравнение выборочного среднего с константой μ-x=0 f 1 H 0 : t 0. 95 12. 71 f 14 t 0. 95 2. 15 f 27 t 0. 95 2. 05 2 4. 30 15 2. 13 28 2. 05 f=10 -1=9, t 9, 0. 05=2. 26 t 9, 0. 05< t – нуль-гипотеза 3 3. 18 быть отвергнута на 5% 2. 04 может 16 2. 12 29 уровне значимости: раствор не является 2. 11 4 2. 78 17 нейтральным. 30 2. 04 5 18 2. 10 40 2. 02 6 f=n-1 - число степеней свободы 2. 57 2. 45 19 2. 09 50 2. 01 7 2. 37 20 2. 09 60 2. 00 8 2. 31 21 2. 08 80 1. 99 9 2. 26 22 2. 07 100 1. 98 10 2. 23 23 2. 07 120 1. 98 11 2. 20 24 2. 06 200 1. 97 12 2. 18 25 2. 06 500 1. 96 13 2. 16 26 2. 06 >> 1. 96

ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ РАЗЛИЧИЯ Выборка объемом 25 имеет среднее значение =9 и стандартное 4. Сравнение ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ РАЗЛИЧИЯ Выборка объемом 25 имеет среднее значение =9 и стандартное 4. Сравнение контроля и опыта с доверительной вероятностью 95% отклонение s=2. Можно ли считать, что среднее равно 10? Критерий Стьюдента 1) Сравнение выборочного среднего с константой H 0: t 0. 95 1 12. 71 14 2. 15 27 2. 05 2 4. 30 15 2. 13 28 2. 05 3 3. 18 16 2. 12 29 2. 04 4 2. 78 17 2. 11 30 2. 04 5 2. 57 18 2. 10 40 2. 02 6 f=n-1 - число степеней свободы f f t 0. 95 2. 45 19 2. 09 50 2. 01 7 2. 37 20 2. 09 60 2. 00 8 2. 31 21 2. 08 80 1. 99 9 2. 26 22 2. 07 100 1. 98 10 2. 23 23 2. 07 120 1. 98 11 2. 20 24 2. 06 200 1. 97 12 2. 18 25 2. 06 500 1. 96 13 2. 16 26 2. 06 >> 1. 96

Критерий Стьюдента 2) Сравнение двух выборочных средних H 0: Нулевая гипотеза отвергается, если t>tα Критерий Стьюдента 2) Сравнение двух выборочных средних H 0: Нулевая гипотеза отвергается, если t>tα А. Выборки взяты из одной генеральной совокупности; дисперсии равны f=nx+ny-2, Если nx=ny=n, то f=2 n-2

Проверяется эффективность Критерий Стьюдента применения препарата, защитного от некоторой инфекции. Взяты две группы животных, Проверяется эффективность Критерий Стьюдента применения препарата, защитного от некоторой инфекции. Взяты две группы животных, измеряемая величина – время сопротивляемости болезни 2) Сравнение двух выборочных средних H 0: Нулевая гипотеза отвергается, если t>tα А. Выборки взяты из одной генеральной совокупности; дисперсии равны f=nx+ny-2, Нуль-гипотеза: препарат не действует, выборки не отличаются Если nx=ny=n, то f=2 n-2 f=32+23 -2=53≈50, t 0. 05(f=50)=2. 01 t>tα – нуль-гипотеза отклоняется. Следовательно, расхождение между опытом и контролем можно считать значимым, т. е. препарат обладает защитным действием.

Критерий Стьюдента 2) Сравнение двух выборочных средних H 0: Б. Выборки взяты из разных Критерий Стьюдента 2) Сравнение двух выборочных средних H 0: Б. Выборки взяты из разных генеральных совокупностей; дисперсии неравны Если выборки большие, f=∞

пример Изучали урожайность двух сортов ячменя, которые высевали на 5 делянках H 0: сорта пример Изучали урожайность двух сортов ячменя, которые высевали на 5 делянках H 0: сорта не различаются по урожайности Номер делянки 1 2 3 4 5 среднее дисперсия Сорт 1 9, 1 7, 3 8 7, 9 9, 4 8, 34 0, 77 Сорт 2 7, 6 8, 2 5, 7 6, 1 - 6, 90 1, 42 Какой вывод? t 0. 05(f=5. 4)≈2. 57> t=2. 017 – различия между сортами незначимы.

Критерий Стьюдента 2) Сравнение двух при 95% дов. вероятности Сравнить средниевыборочных средних H 0: Критерий Стьюдента 2) Сравнение двух при 95% дов. вероятности Сравнить средниевыборочных средних H 0: Б. Выборки взяты из разных генеральных совокупностей Если выборки большие, f=∞

Критерий Стьюдента В. Сравнение выборок с попарно связанными измерениями H 0: f=n-1 Пример: предпосевная Критерий Стьюдента В. Сравнение выборок с попарно связанными измерениями H 0: f=n-1 Пример: предпосевная обработка семян пшеницы – влияние на урожайность Годы Опыт xi Контроль yi 1947 22. 9 19. 4 1948 20. 2 16. 2 1949 19. 5 16. 9 1950 30. 5 29. 3 1951 35. 6 31. 4 1952 31. 9 28. 5 1953 27. 7 25. 6 сумма среднее

Критерий Стьюдента В. Сравнение выборок с попарно связанными измерениями H 0: f=n-1 Пример: предпосевная Критерий Стьюдента В. Сравнение выборок с попарно связанными измерениями H 0: f=n-1 Пример: предпосевная обработка семян пшеницы – влияние на урожайность Годы Опыт xi Контроль yi Δi=xi-yi 1947 22. 9 19. 4 3. 5 1948 20. 2 16. 2 4. 0 1949 19. 5 16. 9 2. 6 1950 30. 5 29. 3 1. 2 1951 35. 6 31. 4 4. 2 1952 31. 9 28. 5 3. 4 1953 27. 7 25. 6 2. 1 сумма 188. 3 167. 3 21. 0 среднее

Критерий Стьюдента В. Сравнение выборок с попарно связанными измерениями H 0: f=n-1 Δi=xi-yi Пример: Критерий Стьюдента В. Сравнение выборок с попарно связанными измерениями H 0: f=n-1 Δi=xi-yi Пример: предпосевная обработка семян пшеницы – влияние на урожайность Годы Опыт xi Контроль yi Δi=xi-yi 1947 22. 9 19. 4 3. 5 0. 25 1948 20. 2 16. 2 4. 0 1 1949 19. 5 16. 9 2. 6 0. 16 1950 30. 5 29. 3 1. 2 3. 24 1951 35. 6 31. 4 4. 2 1. 44 1952 31. 9 28. 5 3. 4 0. 16 1953 27. 7 25. 6 2. 1 0. 81 сумма 188. 3 167. 3 21. 0 7. 06 среднее n=7 H 0 отклоняется – предпосевная обработка семян дала результат

Порядок проверки гипотезы Вариант 1 – сравнение расчетного значения критерия с критическим значением 1. Порядок проверки гипотезы Вариант 1 – сравнение расчетного значения критерия с критическим значением 1. Вычисляем значение статистики критерия θ 2. Для заданного уровня значимости α находим критическое (табличное) значение θα 3. Сравниваем статистику критерия θ с табличным (критическим) значением θα Если θ> θα – H 0 отклоняется

 «Хорошая» (удобная) статистика критерия может подчиняться известному закону распределения, например, закону Стьюдента Между «Хорошая» (удобная) статистика критерия может подчиняться известному закону распределения, например, закону Стьюдента Между статистикой критерия (θ) и уровнем значимости (α) существует жесткая связь – зная одно, можно найти второе (с помощью стандартных таблиц, расчетов или компьютерных стат. пакетов) Критические значения t-распределения для 95%-ной доверительной вероятности f t 0. 95 1 12. 71 14 2. 15 27 2. 05 2 4. 30 15 2. 13 28 2. 05 3 3. 18 16 2. 12 29 2. 04 4 2. 78 17 2. 11 30 2. 04 5 2. 57 18 2. 10 40 2. 02 6 2. 45 19 2. 09 50 2. 01 7 2. 37 20 2. 09 60 2. 00 8 2. 31 21 2. 08 80 1. 99 9 2. 26 22 2. 07 100 1. 98 10 2. 23 23 2. 07 120 1. 98 11 2. 20 24 2. 06 200 1. 97 12 2. 18 25 2. 06 500 1. 96 13 2. 16 26 2. 06 >> 1. 96

Порядок проверки гипотезы Вариант 1 – сравнение расчетного значения критерия с критическим значением Вариант Порядок проверки гипотезы Вариант 1 – сравнение расчетного значения критерия с критическим значением Вариант 2 – сравнение расчетного уровня значимости с критическим уровнем значимости 1. Вычисляем значение статистики критерия θ 2. Для заданного уровня значимости α находим критическое (табличное) значение θα 2. Находим соответствующий этому значению θ уровень значимости p 3. Сравниваем уровень значимости p c принятым уровнем значимости α 3. Сравниваем статистику критерия θ с табличным (критическим) значением θα Если θ> θα – H 0 отклоняется Если p< α – H 0 отклоняется

Порядок проверки гипотезы Вариант 1 – сравнение расчетного значения критерия с критическим значением 1. Порядок проверки гипотезы Вариант 1 – сравнение расчетного значения критерия с критическим значением 1. Вычисляем значение статистики критерия θ 2. Для заданного уровня значимости α находим критическое (табличное) значение θα 3. Сравниваем статистику критерия θ с табличным (критическим) значением θα Если θ> θα – H 0 отклоняется Как найти θα без таблиц?

Порядок проверки гипотезы Вариант 1 – сравнение расчетного значения критерия с Как найти точное Порядок проверки гипотезы Вариант 1 – сравнение расчетного значения критерия с Как найти точное p (достигнутый уровень критическим значением значимости) для расчетного θ? Вариант 2 – сравнение расчетного (достигнутого) уровня значимости с критическим уровнем значимости 1. Вычисляем значение статистики критерия θ 2. Для заданного уровня значимости α находим критическое (табличное) значение θα 2. Находим соответствующий этому значению θ уровень значимости p 3. Сравниваем уровень значимости p c принятым уровнем значимости α 3. Сравниваем статистику критерия θ с табличным (критическим) значением θα Если θ> θα – H 0 отклоняется Если p< α – H 0 отклоняется

Критерий Стьюдента в Excel: сравнение двух выборок Критерий Стьюдента в Excel: сравнение двух выборок