Leks_9.ppt
- Количество слайдов: 34
Статистические гипотезы и критерии их проверки
1. Понятие статистической гипотезы и статистического критерия 2. Алгоритм проверки статистических гипотез 3. Параметрические критерии (Стьюдента, Фишера) 4. Непараметрические критерии (Уайта, Знаков, Уилкоксона)
Статистическая гипотеза – проверяемое математическими методами предположение относительно статистических характеристик результатов измерений Н: (утверждение) Различают нулевую гипотезу Н 0 альтернативную гипотезу Н 1
Нулевой гипотезой (Н 0) называется гипотеза, в соответствии с которой отсутствуют различия между сравниваемыми совокупностями Н 0: ( ) или Н 0: ( ) Альтернативной гипотезой (Н 1) называется гипотеза, которая подтверждает различия между совокупностями Н 1: ( ) или Н 1: ( )
Ошибки, допускаемые при проверке гипотез, можно разделить на два типа: § ошибки первого рода (отклонение нулевой гипотезы, когда она верна) § ошибки второго рода (принятие нулевой гипотезы, когда верна альтернативная)
Вероятность ошибки первого рода называется уровнем значимости и обозначается. Таким образом, уровень значимости – процент маловероятных случаев, которые противоречат принятой гипотезе. Уровень значимости – значение вероятности, при котором различия между выборочными показателями можно считать случайными и несущественными
Как принятие, так и отклонение гипотезы осуществляется на основе определенного критерия Статистическим критерием называется правило, обеспечивающее принятие истинной и отклонение ложной гипотезы с заранее заданной вероятностью
Критерии проверки статистических гипотез можно разделить на три класса: § Параметрические критерии, которые служат для проверки гипотез о параметрах распределения генеральной совокупности § Непараметрические критерии, которые не требуют знания параметров распределения и применяются к данным, выраженным в шкалах наименований или порядка. § Критерии согласия, служащие для проверки гипотез о согласии распределения генеральной совокупности с ранее принятой теоретической моделью.
Основные этапы проверки гипотезы: 1. Формулировка нулевой гипотезы, которую в дальнейшем необходимо принять или отклонить (Но) 2. Выбор уровня значимости. 3. Выбор критерия для проверки гипотезы и его вычисление. Если необходимо, то определение статистических характеристик выборки (среднее арифметическое, стандартное отклонение). 4. Сравнение расчетного значения с граничным (критическим) значением критерия (из таблицы) для выбранного уровня значимости и принятие (или отклонение) гипотезы.
Критерий Стьюдента Условия применения: обе выборки независимы и получены из генеральных совокупностей X и Y, имеющих нормальное распределение. Выборки могут быть разновеликими. Сравнение ведется по средним арифметическим
Алгоритм применения критерия Стьюдента: § Принимается предположение о нормальности распределения генеральных совокупностей, формулируется нулевая гипотеза Но. § Задается необходимый уровень значимости. § Формируются две независимые выборки из генеральных совокупностей Х и У, с объемами соответственно nx и ny. § Вычисляются выборочные характеристики методом средних величин и ошибки репрезентативности.
§ Вычисляется расчетное значение критерия Стьюдента по формуле: где и – средние значения выборок, mх и mу – их ошибки репрезентативности. § Определяется расчетный объем: n = nx + ny - 2 § По таблице Стьюдента при заданном уровне значимости по расчетному объему находится граничное значение критерия tгр § Делается вывод: если t p > t гр, то выборочные средние значения значимо различаются (различие статистически достоверно). В противоположном случае (t p < t гр) различие статистически недостоверно.
Критерий Фишера Условия применения: обе выборки независимы и получены из нормально распределенных генеральных совокупностей X и Y. Если предположение о нормальности не может быть принято, критерий Фишера применять не следует. Выборки могут быть разновеликими. Сравнение ведется по дисперсиям, т. е. нас интересует стабильность результатов
Алгоритм применения критерия Фишера § Принимается предположение о нормальности распределения генеральных совокупностей, формулируется нулевая гипотеза Но § Выбирается уровень значимости § Формируются две независимые выборки с объемами nx и ny соответственно § Рассчитываются значения выборочных дисперсий Dх и Dу (большую из них обозначают D 1, меньшую D 2)
§ Вычисляется значение критерия Фишера по формуле: § Сравнивается расчетное значение Fр с критическим значением Fгр, которое находится по таблице значений критерия Фишера при заданном уровне значимости и степенях свободы k 1 = nx - 1 и k 2 = ny - 1. § Делается вывод: если вычисленное значение критерия Фишера больше или равно критическому (Fр >Fгр), то различие между дисперсиями статистически достоверно. В противном случае (Fр < Fгр) недостоверно.
Пример. Дети 10 и 12 лет вращают головой до потери равновесия Измеряется время от начала вращения до потери равновесия у детей 10 лет (с) и 12 лет (с). Оценить изменилась ли стабильность результатов. 5, 4 5, 5 5, 7 5, 6 5, 4 5, 5 5, 6 5, 5 5, 7 5, 6 5, 3 5, 5 5, 6 5, 7 5, 3 5, 5 5, 7 5, 4 5, 6 5, 5 6, 4 6, 6 6, 1 6, 8 6, 3 6, 6 6, 4 6, 8 6, 1 6, 3 6, 6 6, 8 6, 4 6, 1 6, 6 6, 4 6, 3 6, 4 6, 8 Принимаем нулевую гипотезу (Н 0) и задаем уровень значимости 0, 05. Выборки из генеральных совокупностей, представляем в виде вариационного ряда и находим дисперсии.
xi ni yi ni 5, 3 5, 4 5, 5 2 3 6 6, 1 3 6, 4 4 5 5, 6 5, 7 5 4 20 6, 6 6. 8 4 4 20 Для уровня значимости 0, 05 и объемов выборок 20 по таблице Фишера находим
В последнее время в математической статистике интенсивно разрабатываются непараметрические методы, которые строятся на как можно меньшем количестве допущений. Ранг – порядковый номер выборочного значения, если в выборке нет совпадающих значений Если же они есть, то ранг определяется как среднее арифметическое порядковых номеров совпадающих значений
Критерий Уилкоксона Это непараметрический критерий - аналог параметрического критерия Стьюдента для связанных выборок, т. е. выборок, полученных при парных сравнениях Количество элементов в выборках должно быть одинаковым
Алгоритм применения: § Задаем уровень значимости § Записываем значения выборок xi и yi в виде столбцов попарно § Отбрасываем пары с одинаковыми значениями xi и yi и объем выборки (количество пар значений) сокращаем на число отброшенных пар § Находим разности каждой пары значений (xi - yi) и обозначаем эту разность di § Выставляем ранги абсолютных значений di, начиная с самой маленькой разности § Отдельно записываем ранги, относящиеся к положительным и отрицательным значениям разностей § Находим суммы рангов отрицательных и положительных разностей
§ Меньшую из найденных сумм принимаем в качестве расчетного критерия Уилкоксона (Wp). § Из таблицы критических значений критерия Уилкоксона находим граничное значения критерия Wгр при заданном уровне значимости и объеме выборки N. § Делаем вывод: если расчетное значение критерия Уилкоксона меньше или равно граничному значению ( Wр < Wгр), то наблюдаемое различие связанных выборок является статистически значимым (достоверным). В противном случае различие статистически недостоверно.
ПРИМЕР Оценить изменение содержания глюкозы, мг %, в крови у 12 футболистов до нагрузки х і и через 20 мин после нее у і. хі уі хі - уі W W (+) 71, 2 75, 4 -4, 2 8 8 71, 9 74, 3 -2, 4 6 6 72, 3 0 - 72, 9 74, 8 -1, 9 5 74, 1 73, 0 1, 1 3, 5 74, 8 81, 0 -6, 2 11 11 75, 3 76, 4 -1, 1 3, 5 76, 8 76, 5 0, 3 2 77, 0 81, 3 -4, 3 9 9 77, 2 80, 4 -3, 2 7 7 77, 5 77, 3 0, 2 1 78, 0 83, 2 -5, 2 10 - W(-) 5 3, 5 2 1 10 6, 5 59, 5
§ § § ВЫВОД: Расчетное значение критерия определим как меньшую из сумм рангов, назначенных положительным и отрицательным разностям исходных данных Wр = 6, 5. Определим граничное значение критерия из таблицы Уилкоксона при уровне значимости 0, 05 и объеме n = 11 Wгр = 15. Поскольку Wр < Wгр , приходим к выводу о статистически достоверном различии между исходными данными. Таким образом, у испытуемых существенно увеличилось содержание глюкозы в крови после тренировочной нагрузки. Это, по-видимому, свидетельствует об эффективности предложенной нагрузки.
Критерий Уайта Критерий применяется при сравнении двух больших, независимых разновеликих выборок для установления достоверности различий
Алгоритм применения: § Задается уровень значимости § Эмпирические данные ранжируются по двум линиям, которые соответствуют исследуемым группам. Ранжирование производится одновременно для обеих групп § Полученные ранги суммируются по каждой линии отдельно и меньшая из сумм принимается за расчетное значение критерия § По таблице для заданной надежности и соответствующих объемов выборок находим граничное значение критерия Уайта § Если расчетное значение критерия Тр меньше или равно граничному значению Тгр, то различие между выборками есть статистически значимым. В противном случае различие статистически недостоверно и выборочные значения можно считать одинаковыми.
Пример. Два пловца X и Y в равноценных условиях 10 раз проплыли 25 метровую дистанцию. Проанализировав время прохождения дистанции первым xi (мс– 1) и вторым уi (мс– 1) пловцами, определить достоверность различия полученных данных. xi 12, 4 12, 5 12, 3 12, 8 12, 5 12, 0 12, 2 12, 4 12, 3 12, 7 уi 12, 8 12, 9 12, 5 12, 4 12, 7 12, 5 12, 8 12, 3 12, 5 12, 2
Решение: § Ранжируем данные и присваиваем им ранги Rxi 1 2, 5 5 5 8 8 12 12 15, 5 18 xi 12, 0 12, 2 12, 3 12, 4 12, 5 12, 7 12, 8 Ryi 2, 5 5 8 12 12 12 15, 5 18 18 20 yi 12, 2 12, 3 12, 4 12, 5 12, 7 12, 8 12, 9 § Суммируем ранги отдельно R хi и R уi Тх = 1+ 2, 5 + 5 + 8+ 12 + 15, 5 + 18 = 87, 0 Ту = 2, 5 + 8 + 12 + 15, 5 + 18 + 20 = 123, 0 § Меньшая из сумм принимается за расчетное значение критерия Уайта — Тр = 87, 0 § По таблице граничных значений критерия Уайта при заданном уровне значимости р = 0, 05 и количестве эмпиричных измерений пх — пу = 10 находим граничное значение критерия Тгр = 78
Вывод: Поскольку Трасч > Тгр, то различие между выборками статистически недостоверно. Показатели обоих пловцов на 25 -метровой дистанции существенно не отличаются, пловцы — спортсмены одной квалификации
Критерий знаков Этот критерий применяется при сравнении больших, равновесных выборок с попарно сопряженными вариантами. Такие задачи встречаются в тех случаях, когда рассматривается один и тот же объект до и после опыта или сравнивается аналогичный признак в нескольких группах, например, в контрольной и экспериментальной
Алгоритм применения: § Задается уровень значимости § Записываем значения выборок xi и yi в виде столбцов попарно § В третьем столбце улучшение результата обозначается знаком плюс (+), ухудшение — знаком минус (–). Необходимо помнить о том, что в практике спорта под улучшением в одних случаях понимается увеличение абсолютного значения (прирост силы, веса, расстояния), в других случаях — уменьшение (время прохождения дистанции) § Подсчитываются суммы положительных, отрицательных и нулевых изменений
§ Сумма отрицательных изменений – расчетное значения критерия «знаков» Zp § По таблице границ критической области критерия «знаков» (при заданной надежности и количестве исследуемых пар n без нулевых значений) находят граничное значение критерия "знаков" Zrp — это интервал § При попадании количества отрицательных изменений внутрь этого интервала наблюдается статистическая недостоверность между исследуемыми показателями в сравниваемых группах, в противоположном случае — статистическая достоверность различия.
Пример Сравнить достоверность различия результатов в прыжках в длину с места в группе в начале подготовительного периода х. Zi(м) и в конце уi (м) xi yi i 1, 1 1, 3 + 1, 2 0 1, 3 1, 4 + 1, 4 1, 3 – 1, 4 1, 5 + 1, 4 1, 6 + 1, 5 0 1, 5 1, 7 + 1, 6 1, 5 – 1, 7 1, 8 + 1, 7 1, 6 – 1, 8 1, 7 – 1, 8 0 1, 8 1, 9 + 1, 8 1, 7 –
Решение: § Подсчитываем количество положительных, отрицательных и нулевых значений: Z(+) = 9, Z(–) = 5, Z(0) = 3 § Задаем уровень значимости р = 0, 05 и находим расчетный объем n = n — Z(0) = 17 — 3 = 14 § По таблице критерия «знаков» находим искомый интервал Zгp = 3. . . 11
Вывод: Так как Z(–) = 5 находится внутри этого интервала, то различие между показателями статистически недостоверно. Это значит, что параметр — прыжок в длину с места (м) не изменился в течение подготовительного периода во всей группе. Тренировочные занятия на развитие данного параметра должны быть интенсифицированы