Проверка_гипотез[1].ppt
- Количество слайдов: 21
Статистическая проверка гипотез Раздел 4
Статистические гипотезы Статистическая гипотеза – любое предположение 1) о виде неизвестного распределения или 2) о параметрах известных распределений, проверяемое по выборке Примеры статистических гипотез: Ø генеральная совокупность распределена по нормальному закону Ø дисперсии двух нормальных совокупностей равны между собой
Общая постановка задачи проверки гипотез I. Формулируют: Ø Нулевую (основную) гипотезу - гипотезу об отсутствии различий Примеры: 1. Н 0: a = 10; 2. Н 0: X 1 не превышает X 2 Ø Альтернативную (конкурирующую) гипотезу - гипотезу о значимости различий Примеры: 1. Н 1: a ≠ 10 2. Н 1: X 1 превышает X 2 II. Задают уровень значимости - вероятность ошибки отвергнуть нулевую гипотезу, если на самом деле эта гипотеза верна (при 0, 05 ошибка возможна в 5% случаев)
Ошибки проверке гипотез ØОшибка первого рода – отклонение гипотезы Н 0, когда она верна ØВероятность ошибки первого рода – уровень значимости ØОшибка второго рода – принятие гипотезы Н 0, когда верна гипотеза Н 1 ØВероятность ошибки второго рода -
Ошибки проверке гипотез (продолжение) Решение Принять Н 0 Справедлива Н 1 Принять Н 1 Правильное с вероятностью 1 - Ошибочное с вероятностью Правильное с вероятностью 1 -
f(x) Область отклонения гипотезы Площадь равна /2 Область принятия гипотезы Н 0 Область отклонения гипотезы Площадь равна /2 Площадь равна 1 - x O x /2
Общая постановка задачи проверки гипотез (продолжение) III. Истинность принятой гипотезы проверяют с помощью критериев значимости Ø Статистический критерий (критерий) - случайная величина K, служащая для проверки гипотезы H 0, функция распределения которой известна Ø Критерий K зависит от : 1) f - числа степеней свободы и 2) - уровня значимости Ø По таблице определяют критическое значение Ккрит( , f ), превышение которого при справедливости гипотезы H 0 маловероятно Ø Фактическую величину критерия Кнабл получают по данным наблюдения
Виды статистических критериев Ø Параметрические - используются только для нормальных распределений Примеры: 1. Критерий Стьюдента – t критерий 2. Критерий Фишера – F - критерий Ø Непараметрические - применяются для распределений различных видов Примеры: 1. Критерий знаков 2. Критерий Уилкоксона. Манна-Уитни (U критерий) 3. Критерий согласия Пирсона (критерий χ2 хи -квадрат)
Общая постановка задачи проверки гипотез (продолжение) IV. Сравнивают Кнабл и Ккрит( , f ) Для параметрических критериев: Ø если Кнабл < Ккрит( , f) – принимают Н 0 Ø если Кнабл > Ккрит( , f) – принимают Н 1 Для непараметрических критериев: Ø если Кнабл > Ккрит( , f) – принимают Н 0 Ø если Кнабл < Ккрит( , f) – принимают Н 1
Проверка гипотез относительно средних (t - критерий Стьюдента) Ø Условия применения гипотезы: 1) выборки малы (менее 30 значений каждая); 2) генеральные совокупности распределены по нормальному закону; 3) генеральные дисперсии равны (или различаются незначимо) Ø Нулевая гипотеза Н 0: генеральные средние равны, т. е. M(X) = M(Y) Ø Конкурирующая гипотеза Н 1: генеральные средние не равны, т. е. M(X) ≠ M(Y)
Проверка гипотез относительно средних (t - критерий Стьюдента) (продолжение) Ø Критическое значение критерия t крит определяется по таблице критических значений распределения Стьюдента Ø Эмпирическое значение критерия Ø Вывод: если tфакт< t крит - нулевая гипотеза принимается: генеральные средние различаются незначимо; если tфакт t крит - нулевая гипотеза отвергается: генеральные средние отличаются значимо
Пример. Средняя продолжительность госпитализации 36 больных пиелонефритом, получавших правильное лечение (соответствующее официальным рекомендациям) лечение, составила 4, 51 суток, а 36 больных, получавших неправильное лечение, - 6, 28 суток. Стандартные отклонения для этих групп – соответственно 1, 98 суток и 2, 54 суток. Позволяет ли правильное лечение сократить срок госпитализации?
Решение 1. Вычисляем: tфакт = 3, 3 2. Определяем число степеней свободы: f = 36 + 36 - 2 = 70 3. Задаем уровень значимости = 0, 01 4. По таблице распределения Стьюдента находим для f = 70 и = 0, 01: t крит = 2, 648 5. Сравниваем: tфакт >t крит 6. Следовательно, различия в сроках госпитализации статистически значимы
Проверка гипотез для дисперсий (F - критерий Фишера) Ø Условие применения гипотезы: случайные величины распределены по нормальному закону; Ø Нулевая гипотеза Н 0: генеральные дисперсии равны, т. е. σX = σY Ø Конкурирующая гипотеза Н 1: генеральные дисперсии не равны, т. е. σX ≠ σY
Проверка гипотез для дисперсий (F - критерий Фишера) (продолжение) Ø Критическое значение критерия Fкрит(α/2, f 1 = n 1 - 1, f 2 = n 2 - 1) определяется по распределению Фишера Ø Эмпирическое значение критерия или , если s. Y > s. X Ø Вывод: если Fфакт< Fкрит - нулевая гипотеза принимается: генеральные дисперсии различаются незначимо; если Fфакт F крит - нулевая гипотеза отвергается: генеральные дисперсии отличаются значимо
Проверка гипотез о законах распределения критерий согласия Пирсона (критерий χ2 хи-квадрат) Ø Условие применения гипотезы: закон распределения неизвестен Ø Нулевая гипотеза Н 0: генеральная совокупность распределена по некоторому теоретическому закону F(x) = Fтеор(x) Ø Конкурирующая гипотеза Н 1: генеральная совокупность не распределена по закону Fтеор(x): F(x) Fтеор(x)
Проверка гипотез о законах распределения критерий согласия Пирсона (критерий χ2 хи-квадрат) (продолжение) Ø Критическое значение критерия χ2 крит ( , f) определяется по распределению χ2 Ø Эмпирическое значение критерия Ø Вывод: если χ2 набл< χ2 крит - нулевая гипотеза принимается: распределение подчиняется выбранному закону; если χ2 набл χ2 крит - нулевая гипотеза отвергается: распределение не подчиняется выбранному закону
Пример. При гемодиализе кровь больного пропускают через искусственную почку – аппарат, удаляющий из крови продукты обмена веществ. Искусственная почка подсоединяется к артерии и вене больного: кровь из артерии поступает в аппарат и оттуда, уже очищенная, - вену. Так как гемодиализ проводится регулярно, больному устанавливают артериовенозный шунт. В артерию и вену на предплечье вводят тефлоновые трубки; их концы выводят наружу и соединяют друг с другом. При очередной процедуре гемодиализа трубки разъединяют между собой и присоединяют к аппарату. После диализа трубки вновь соединяют, и кровь течет по шунту из артерии в вену. Завихрения тока крови в местах соединения трубок и сосудов приводят к тромбированию шунта. Проверяли, нельзя ли снизить риск тромбоза назначением небольших доз аспирина (160 мг/сутки).
Тромбозы шунта приеме плацебо и аспирина, наблюдаемые частоты Плацебо Аспирин Всего Тромбоз есть 18 6 24 Тромбоза нет 7 13 20 Тромбозы шунта приеме плацебо и аспирина, ожидаемые частоты Плацебо Аспирин Всего Тромбоз есть 13, 64 10, 36 24 Тромбоза нет 11, 36 18, 64 20
Расчет ожидаемых частот Тромбоз произошел у 24 из 44 обследованных, т. е. в 54, 55 % случаев Нулевая гипотеза: аспирин не влияет на риск тромбоза Тромбоз наблюдается: В группе плацебо 25 54, 55% = 13, 64 В группе аспирина 19 54, 55 = 10, 36
Решение. 1. Вычисляем: 2 набл = 7, 1 2. Задаем уровень значимости: = 0, 05 3. Определяем по таблице распределения 2 крит = 3, 84 4. Сравниваем: 2 набл > 2 крит 5. Следовательно отклоняется гипотеза об отсутствии связи между приемом аспирина и образованием тромбов.