Скачать презентацию Статистические гипотезы и критерии их проверки 1 Скачать презентацию Статистические гипотезы и критерии их проверки 1

Leks_9.ppt

  • Количество слайдов: 34

Статистические гипотезы и критерии их проверки Статистические гипотезы и критерии их проверки

1. Понятие статистической гипотезы и статистического критерия 2. Алгоритм проверки статистических гипотез 3. Параметрические 1. Понятие статистической гипотезы и статистического критерия 2. Алгоритм проверки статистических гипотез 3. Параметрические критерии (Стьюдента, Фишера) 4. Непараметрические критерии (Уайта, Знаков, Уилкоксона)

Статистическая гипотеза – проверяемое математическими методами предположение относительно статистических характеристик результатов измерений Н: (утверждение) Статистическая гипотеза – проверяемое математическими методами предположение относительно статистических характеристик результатов измерений Н: (утверждение) Различают нулевую гипотезу Н 0 альтернативную гипотезу Н 1

Нулевой гипотезой (Н 0) называется гипотеза, в соответствии с которой отсутствуют различия между сравниваемыми Нулевой гипотезой (Н 0) называется гипотеза, в соответствии с которой отсутствуют различия между сравниваемыми совокупностями Н 0: ( ) или Н 0: ( ) Альтернативной гипотезой (Н 1) называется гипотеза, которая подтверждает различия между совокупностями Н 1: ( ) или Н 1: ( )

Ошибки, допускаемые при проверке гипотез, можно разделить на два типа: § ошибки первого рода Ошибки, допускаемые при проверке гипотез, можно разделить на два типа: § ошибки первого рода (отклонение нулевой гипотезы, когда она верна) § ошибки второго рода (принятие нулевой гипотезы, когда верна альтернативная)

Вероятность ошибки первого рода называется уровнем значимости и обозначается. Таким образом, уровень значимости – Вероятность ошибки первого рода называется уровнем значимости и обозначается. Таким образом, уровень значимости – процент маловероятных случаев, которые противоречат принятой гипотезе. Уровень значимости – значение вероятности, при котором различия между выборочными показателями можно считать случайными и несущественными

Как принятие, так и отклонение гипотезы осуществляется на основе определенного критерия Статистическим критерием называется Как принятие, так и отклонение гипотезы осуществляется на основе определенного критерия Статистическим критерием называется правило, обеспечивающее принятие истинной и отклонение ложной гипотезы с заранее заданной вероятностью

Критерии проверки статистических гипотез можно разделить на три класса: § Параметрические критерии, которые служат Критерии проверки статистических гипотез можно разделить на три класса: § Параметрические критерии, которые служат для проверки гипотез о параметрах распределения генеральной совокупности § Непараметрические критерии, которые не требуют знания параметров распределения и применяются к данным, выраженным в шкалах наименований или порядка. § Критерии согласия, служащие для проверки гипотез о согласии распределения генеральной совокупности с ранее принятой теоретической моделью.

Основные этапы проверки гипотезы: 1. Формулировка нулевой гипотезы, которую в дальнейшем необходимо принять или Основные этапы проверки гипотезы: 1. Формулировка нулевой гипотезы, которую в дальнейшем необходимо принять или отклонить (Но) 2. Выбор уровня значимости. 3. Выбор критерия для проверки гипотезы и его вычисление. Если необходимо, то определение статистических характеристик выборки (среднее арифметическое, стандартное отклонение). 4. Сравнение расчетного значения с граничным (критическим) значением критерия (из таблицы) для выбранного уровня значимости и принятие (или отклонение) гипотезы.

Критерий Стьюдента Условия применения: обе выборки независимы и получены из генеральных совокупностей X и Критерий Стьюдента Условия применения: обе выборки независимы и получены из генеральных совокупностей X и Y, имеющих нормальное распределение. Выборки могут быть разновеликими. Сравнение ведется по средним арифметическим

Алгоритм применения критерия Стьюдента: § Принимается предположение о нормальности распределения генеральных совокупностей, формулируется нулевая Алгоритм применения критерия Стьюдента: § Принимается предположение о нормальности распределения генеральных совокупностей, формулируется нулевая гипотеза Но. § Задается необходимый уровень значимости. § Формируются две независимые выборки из генеральных совокупностей Х и У, с объемами соответственно nx и ny. § Вычисляются выборочные характеристики методом средних величин и ошибки репрезентативности.

§ Вычисляется расчетное значение критерия Стьюдента по формуле: где и – средние значения выборок, § Вычисляется расчетное значение критерия Стьюдента по формуле: где и – средние значения выборок, mх и mу – их ошибки репрезентативности. § Определяется расчетный объем: n = nx + ny - 2 § По таблице Стьюдента при заданном уровне значимости по расчетному объему находится граничное значение критерия tгр § Делается вывод: если t p > t гр, то выборочные средние значения значимо различаются (различие статистически достоверно). В противоположном случае (t p < t гр) различие статистически недостоверно.

Критерий Фишера Условия применения: обе выборки независимы и получены из нормально распределенных генеральных совокупностей Критерий Фишера Условия применения: обе выборки независимы и получены из нормально распределенных генеральных совокупностей X и Y. Если предположение о нормальности не может быть принято, критерий Фишера применять не следует. Выборки могут быть разновеликими. Сравнение ведется по дисперсиям, т. е. нас интересует стабильность результатов

Алгоритм применения критерия Фишера § Принимается предположение о нормальности распределения генеральных совокупностей, формулируется нулевая Алгоритм применения критерия Фишера § Принимается предположение о нормальности распределения генеральных совокупностей, формулируется нулевая гипотеза Но § Выбирается уровень значимости § Формируются две независимые выборки с объемами nx и ny соответственно § Рассчитываются значения выборочных дисперсий Dх и Dу (большую из них обозначают D 1, меньшую D 2)

§ Вычисляется значение критерия Фишера по формуле: § Сравнивается расчетное значение Fр с критическим § Вычисляется значение критерия Фишера по формуле: § Сравнивается расчетное значение Fр с критическим значением Fгр, которое находится по таблице значений критерия Фишера при заданном уровне значимости и степенях свободы k 1 = nx - 1 и k 2 = ny - 1. § Делается вывод: если вычисленное значение критерия Фишера больше или равно критическому (Fр >Fгр), то различие между дисперсиями статистически достоверно. В противном случае (Fр < Fгр) недостоверно.

Пример. Дети 10 и 12 лет вращают головой до потери равновесия Измеряется время от Пример. Дети 10 и 12 лет вращают головой до потери равновесия Измеряется время от начала вращения до потери равновесия у детей 10 лет (с) и 12 лет (с). Оценить изменилась ли стабильность результатов. 5, 4 5, 5 5, 7 5, 6 5, 4 5, 5 5, 6 5, 5 5, 7 5, 6 5, 3 5, 5 5, 6 5, 7 5, 3 5, 5 5, 7 5, 4 5, 6 5, 5 6, 4 6, 6 6, 1 6, 8 6, 3 6, 6 6, 4 6, 8 6, 1 6, 3 6, 6 6, 8 6, 4 6, 1 6, 6 6, 4 6, 3 6, 4 6, 8 Принимаем нулевую гипотезу (Н 0) и задаем уровень значимости 0, 05. Выборки из генеральных совокупностей, представляем в виде вариационного ряда и находим дисперсии.

xi ni yi ni 5, 3 5, 4 5, 5 2 3 6 6, xi ni yi ni 5, 3 5, 4 5, 5 2 3 6 6, 1 3 6, 4 4 5 5, 6 5, 7 5 4 20 6, 6 6. 8 4 4 20 Для уровня значимости 0, 05 и объемов выборок 20 по таблице Фишера находим

В последнее время в математической статистике интенсивно разрабатываются непараметрические методы, которые строятся на как В последнее время в математической статистике интенсивно разрабатываются непараметрические методы, которые строятся на как можно меньшем количестве допущений. Ранг – порядковый номер выборочного значения, если в выборке нет совпадающих значений Если же они есть, то ранг определяется как среднее арифметическое порядковых номеров совпадающих значений

Критерий Уилкоксона Это непараметрический критерий - аналог параметрического критерия Стьюдента для связанных выборок, т. Критерий Уилкоксона Это непараметрический критерий - аналог параметрического критерия Стьюдента для связанных выборок, т. е. выборок, полученных при парных сравнениях Количество элементов в выборках должно быть одинаковым

Алгоритм применения: § Задаем уровень значимости § Записываем значения выборок xi и yi в Алгоритм применения: § Задаем уровень значимости § Записываем значения выборок xi и yi в виде столбцов попарно § Отбрасываем пары с одинаковыми значениями xi и yi и объем выборки (количество пар значений) сокращаем на число отброшенных пар § Находим разности каждой пары значений (xi - yi) и обозначаем эту разность di § Выставляем ранги абсолютных значений di, начиная с самой маленькой разности § Отдельно записываем ранги, относящиеся к положительным и отрицательным значениям разностей § Находим суммы рангов отрицательных и положительных разностей

§ Меньшую из найденных сумм принимаем в качестве расчетного критерия Уилкоксона (Wp). § Из § Меньшую из найденных сумм принимаем в качестве расчетного критерия Уилкоксона (Wp). § Из таблицы критических значений критерия Уилкоксона находим граничное значения критерия Wгр при заданном уровне значимости и объеме выборки N. § Делаем вывод: если расчетное значение критерия Уилкоксона меньше или равно граничному значению ( Wр < Wгр), то наблюдаемое различие связанных выборок является статистически значимым (достоверным). В противном случае различие статистически недостоверно.

ПРИМЕР Оценить изменение содержания глюкозы, мг %, в крови у 12 футболистов до нагрузки ПРИМЕР Оценить изменение содержания глюкозы, мг %, в крови у 12 футболистов до нагрузки х і и через 20 мин после нее у і. хі уі хі - уі W W (+) 71, 2 75, 4 -4, 2 8 8 71, 9 74, 3 -2, 4 6 6 72, 3 0 - 72, 9 74, 8 -1, 9 5 74, 1 73, 0 1, 1 3, 5 74, 8 81, 0 -6, 2 11 11 75, 3 76, 4 -1, 1 3, 5 76, 8 76, 5 0, 3 2 77, 0 81, 3 -4, 3 9 9 77, 2 80, 4 -3, 2 7 7 77, 5 77, 3 0, 2 1 78, 0 83, 2 -5, 2 10 - W(-) 5 3, 5 2 1 10 6, 5 59, 5

§ § § ВЫВОД: Расчетное значение критерия определим как меньшую из сумм рангов, назначенных § § § ВЫВОД: Расчетное значение критерия определим как меньшую из сумм рангов, назначенных положительным и отрицательным разностям исходных данных Wр = 6, 5. Определим граничное значение критерия из таблицы Уилкоксона при уровне значимости 0, 05 и объеме n = 11 Wгр = 15. Поскольку Wр < Wгр , приходим к выводу о статистически достоверном различии между исходными данными. Таким образом, у испытуемых существенно увеличилось содержание глюкозы в крови после тренировочной нагрузки. Это, по-видимому, свидетельствует об эффективности предложенной нагрузки.

Критерий Уайта Критерий применяется при сравнении двух больших, независимых разновеликих выборок для установления достоверности Критерий Уайта Критерий применяется при сравнении двух больших, независимых разновеликих выборок для установления достоверности различий

Алгоритм применения: § Задается уровень значимости § Эмпирические данные ранжируются по двум линиям, которые Алгоритм применения: § Задается уровень значимости § Эмпирические данные ранжируются по двум линиям, которые соответствуют исследуемым группам. Ранжирование производится одновременно для обеих групп § Полученные ранги суммируются по каждой линии отдельно и меньшая из сумм принимается за расчетное значение критерия § По таблице для заданной надежности и соответствующих объемов выборок находим граничное значение критерия Уайта § Если расчетное значение критерия Тр меньше или равно граничному значению Тгр, то различие между выборками есть статистически значимым. В противном случае различие статистически недостоверно и выборочные значения можно считать одинаковыми.

Пример. Два пловца X и Y в равноценных условиях 10 раз проплыли 25 метровую Пример. Два пловца X и Y в равноценных условиях 10 раз проплыли 25 метровую дистанцию. Проанализировав время прохождения дистанции первым xi (мс– 1) и вторым уi (мс– 1) пловцами, определить достоверность различия полученных данных. xi 12, 4 12, 5 12, 3 12, 8 12, 5 12, 0 12, 2 12, 4 12, 3 12, 7 уi 12, 8 12, 9 12, 5 12, 4 12, 7 12, 5 12, 8 12, 3 12, 5 12, 2

Решение: § Ранжируем данные и присваиваем им ранги Rxi 1 2, 5 5 5 Решение: § Ранжируем данные и присваиваем им ранги Rxi 1 2, 5 5 5 8 8 12 12 15, 5 18 xi 12, 0 12, 2 12, 3 12, 4 12, 5 12, 7 12, 8 Ryi 2, 5 5 8 12 12 12 15, 5 18 18 20 yi 12, 2 12, 3 12, 4 12, 5 12, 7 12, 8 12, 9 § Суммируем ранги отдельно R хi и R уi Тх = 1+ 2, 5 + 5 + 8+ 12 + 15, 5 + 18 = 87, 0 Ту = 2, 5 + 8 + 12 + 15, 5 + 18 + 20 = 123, 0 § Меньшая из сумм принимается за расчетное значение критерия Уайта — Тр = 87, 0 § По таблице граничных значений критерия Уайта при заданном уровне значимости р = 0, 05 и количестве эмпиричных измерений пх — пу = 10 находим граничное значение критерия Тгр = 78

Вывод: Поскольку Трасч > Тгр, то различие между выборками статистически недостоверно. Показатели обоих пловцов Вывод: Поскольку Трасч > Тгр, то различие между выборками статистически недостоверно. Показатели обоих пловцов на 25 -метровой дистанции существенно не отличаются, пловцы — спортсмены одной квалификации

Критерий знаков Этот критерий применяется при сравнении больших, равновесных выборок с попарно сопряженными вариантами. Критерий знаков Этот критерий применяется при сравнении больших, равновесных выборок с попарно сопряженными вариантами. Такие задачи встречаются в тех случаях, когда рассматривается один и тот же объект до и после опыта или сравнивается аналогичный признак в нескольких группах, например, в контрольной и экспериментальной

Алгоритм применения: § Задается уровень значимости § Записываем значения выборок xi и yi в Алгоритм применения: § Задается уровень значимости § Записываем значения выборок xi и yi в виде столбцов попарно § В третьем столбце улучшение результата обозначается знаком плюс (+), ухудшение — знаком минус (–). Необходимо помнить о том, что в практике спорта под улучшением в одних случаях понимается увеличение абсолютного значения (прирост силы, веса, расстояния), в других случаях — уменьшение (время прохождения дистанции) § Подсчитываются суммы положительных, отрицательных и нулевых изменений

§ Сумма отрицательных изменений – расчетное значения критерия «знаков» Zp § По таблице границ § Сумма отрицательных изменений – расчетное значения критерия «знаков» Zp § По таблице границ критической области критерия «знаков» (при заданной надежности и количестве исследуемых пар n без нулевых значений) находят граничное значение критерия "знаков" Zrp — это интервал § При попадании количества отрицательных изменений внутрь этого интервала наблюдается статистическая недостоверность между исследуемыми показателями в сравниваемых группах, в противоположном случае — статистическая достоверность различия.

Пример Сравнить достоверность различия результатов в прыжках в длину с места в группе в Пример Сравнить достоверность различия результатов в прыжках в длину с места в группе в начале подготовительного периода х. Zi(м) и в конце уi (м) xi yi i 1, 1 1, 3 + 1, 2 0 1, 3 1, 4 + 1, 4 1, 3 – 1, 4 1, 5 + 1, 4 1, 6 + 1, 5 0 1, 5 1, 7 + 1, 6 1, 5 – 1, 7 1, 8 + 1, 7 1, 6 – 1, 8 1, 7 – 1, 8 0 1, 8 1, 9 + 1, 8 1, 7 –

Решение: § Подсчитываем количество положительных, отрицательных и нулевых значений: Z(+) = 9, Z(–) = Решение: § Подсчитываем количество положительных, отрицательных и нулевых значений: Z(+) = 9, Z(–) = 5, Z(0) = 3 § Задаем уровень значимости р = 0, 05 и находим расчетный объем n = n — Z(0) = 17 — 3 = 14 § По таблице критерия «знаков» находим искомый интервал Zгp = 3. . . 11

Вывод: Так как Z(–) = 5 находится внутри этого интервала, то различие между показателями Вывод: Так как Z(–) = 5 находится внутри этого интервала, то различие между показателями статистически недостоверно. Это значит, что параметр — прыжок в длину с места (м) не изменился в течение подготовительного периода во всей группе. Тренировочные занятия на развитие данного параметра должны быть интенсифицированы