Скачать презентацию Статистическая проверка гипотез Раздел 4  Статистические гипотезы Скачать презентацию Статистическая проверка гипотез Раздел 4 Статистические гипотезы

Проверка_гипотез[1].ppt

  • Количество слайдов: 21

Статистическая проверка гипотез Раздел 4 Статистическая проверка гипотез Раздел 4

Статистические гипотезы Статистическая гипотеза – любое предположение 1) о виде неизвестного распределения или 2) Статистические гипотезы Статистическая гипотеза – любое предположение 1) о виде неизвестного распределения или 2) о параметрах известных распределений, проверяемое по выборке Примеры статистических гипотез: Ø генеральная совокупность распределена по нормальному закону Ø дисперсии двух нормальных совокупностей равны между собой

Общая постановка задачи проверки гипотез I. Формулируют: Ø Нулевую (основную) гипотезу - гипотезу об Общая постановка задачи проверки гипотез I. Формулируют: Ø Нулевую (основную) гипотезу - гипотезу об отсутствии различий Примеры: 1. Н 0: a = 10; 2. Н 0: X 1 не превышает X 2 Ø Альтернативную (конкурирующую) гипотезу - гипотезу о значимости различий Примеры: 1. Н 1: a ≠ 10 2. Н 1: X 1 превышает X 2 II. Задают уровень значимости - вероятность ошибки отвергнуть нулевую гипотезу, если на самом деле эта гипотеза верна (при 0, 05 ошибка возможна в 5% случаев)

Ошибки проверке гипотез ØОшибка первого рода – отклонение гипотезы Н 0, когда она верна Ошибки проверке гипотез ØОшибка первого рода – отклонение гипотезы Н 0, когда она верна ØВероятность ошибки первого рода – уровень значимости ØОшибка второго рода – принятие гипотезы Н 0, когда верна гипотеза Н 1 ØВероятность ошибки второго рода -

Ошибки проверке гипотез (продолжение) Решение Принять Н 0 Справедлива Н 1 Принять Н 1 Ошибки проверке гипотез (продолжение) Решение Принять Н 0 Справедлива Н 1 Принять Н 1 Правильное с вероятностью 1 - Ошибочное с вероятностью Правильное с вероятностью 1 -

f(x) Область отклонения гипотезы Площадь равна /2 Область принятия гипотезы Н 0 Область отклонения f(x) Область отклонения гипотезы Площадь равна /2 Область принятия гипотезы Н 0 Область отклонения гипотезы Площадь равна /2 Площадь равна 1 - x O x /2

Общая постановка задачи проверки гипотез (продолжение) III. Истинность принятой гипотезы проверяют с помощью критериев Общая постановка задачи проверки гипотез (продолжение) III. Истинность принятой гипотезы проверяют с помощью критериев значимости Ø Статистический критерий (критерий) - случайная величина K, служащая для проверки гипотезы H 0, функция распределения которой известна Ø Критерий K зависит от : 1) f - числа степеней свободы и 2) - уровня значимости Ø По таблице определяют критическое значение Ккрит( , f ), превышение которого при справедливости гипотезы H 0 маловероятно Ø Фактическую величину критерия Кнабл получают по данным наблюдения

Виды статистических критериев Ø Параметрические - используются только для нормальных распределений Примеры: 1. Критерий Виды статистических критериев Ø Параметрические - используются только для нормальных распределений Примеры: 1. Критерий Стьюдента – t критерий 2. Критерий Фишера – F - критерий Ø Непараметрические - применяются для распределений различных видов Примеры: 1. Критерий знаков 2. Критерий Уилкоксона. Манна-Уитни (U критерий) 3. Критерий согласия Пирсона (критерий χ2 хи -квадрат)

Общая постановка задачи проверки гипотез (продолжение) IV. Сравнивают Кнабл и Ккрит( , f ) Общая постановка задачи проверки гипотез (продолжение) IV. Сравнивают Кнабл и Ккрит( , f ) Для параметрических критериев: Ø если Кнабл < Ккрит( , f) – принимают Н 0 Ø если Кнабл > Ккрит( , f) – принимают Н 1 Для непараметрических критериев: Ø если Кнабл > Ккрит( , f) – принимают Н 0 Ø если Кнабл < Ккрит( , f) – принимают Н 1

Проверка гипотез относительно средних (t - критерий Стьюдента) Ø Условия применения гипотезы: 1) выборки Проверка гипотез относительно средних (t - критерий Стьюдента) Ø Условия применения гипотезы: 1) выборки малы (менее 30 значений каждая); 2) генеральные совокупности распределены по нормальному закону; 3) генеральные дисперсии равны (или различаются незначимо) Ø Нулевая гипотеза Н 0: генеральные средние равны, т. е. M(X) = M(Y) Ø Конкурирующая гипотеза Н 1: генеральные средние не равны, т. е. M(X) ≠ M(Y)

Проверка гипотез относительно средних (t - критерий Стьюдента) (продолжение) Ø Критическое значение критерия t Проверка гипотез относительно средних (t - критерий Стьюдента) (продолжение) Ø Критическое значение критерия t крит определяется по таблице критических значений распределения Стьюдента Ø Эмпирическое значение критерия Ø Вывод: если tфакт< t крит - нулевая гипотеза принимается: генеральные средние различаются незначимо; если tфакт t крит - нулевая гипотеза отвергается: генеральные средние отличаются значимо

Пример. Средняя продолжительность госпитализации 36 больных пиелонефритом, получавших правильное лечение (соответствующее официальным рекомендациям) лечение, Пример. Средняя продолжительность госпитализации 36 больных пиелонефритом, получавших правильное лечение (соответствующее официальным рекомендациям) лечение, составила 4, 51 суток, а 36 больных, получавших неправильное лечение, - 6, 28 суток. Стандартные отклонения для этих групп – соответственно 1, 98 суток и 2, 54 суток. Позволяет ли правильное лечение сократить срок госпитализации?

Решение 1. Вычисляем: tфакт = 3, 3 2. Определяем число степеней свободы: f = Решение 1. Вычисляем: tфакт = 3, 3 2. Определяем число степеней свободы: f = 36 + 36 - 2 = 70 3. Задаем уровень значимости = 0, 01 4. По таблице распределения Стьюдента находим для f = 70 и = 0, 01: t крит = 2, 648 5. Сравниваем: tфакт >t крит 6. Следовательно, различия в сроках госпитализации статистически значимы

Проверка гипотез для дисперсий (F - критерий Фишера) Ø Условие применения гипотезы: случайные величины Проверка гипотез для дисперсий (F - критерий Фишера) Ø Условие применения гипотезы: случайные величины распределены по нормальному закону; Ø Нулевая гипотеза Н 0: генеральные дисперсии равны, т. е. σX = σY Ø Конкурирующая гипотеза Н 1: генеральные дисперсии не равны, т. е. σX ≠ σY

Проверка гипотез для дисперсий (F - критерий Фишера) (продолжение) Ø Критическое значение критерия Fкрит(α/2, Проверка гипотез для дисперсий (F - критерий Фишера) (продолжение) Ø Критическое значение критерия Fкрит(α/2, f 1 = n 1 - 1, f 2 = n 2 - 1) определяется по распределению Фишера Ø Эмпирическое значение критерия или , если s. Y > s. X Ø Вывод: если Fфакт< Fкрит - нулевая гипотеза принимается: генеральные дисперсии различаются незначимо; если Fфакт F крит - нулевая гипотеза отвергается: генеральные дисперсии отличаются значимо

Проверка гипотез о законах распределения критерий согласия Пирсона (критерий χ2 хи-квадрат) Ø Условие применения Проверка гипотез о законах распределения критерий согласия Пирсона (критерий χ2 хи-квадрат) Ø Условие применения гипотезы: закон распределения неизвестен Ø Нулевая гипотеза Н 0: генеральная совокупность распределена по некоторому теоретическому закону F(x) = Fтеор(x) Ø Конкурирующая гипотеза Н 1: генеральная совокупность не распределена по закону Fтеор(x): F(x) Fтеор(x)

Проверка гипотез о законах распределения критерий согласия Пирсона (критерий χ2 хи-квадрат) (продолжение) Ø Критическое Проверка гипотез о законах распределения критерий согласия Пирсона (критерий χ2 хи-квадрат) (продолжение) Ø Критическое значение критерия χ2 крит ( , f) определяется по распределению χ2 Ø Эмпирическое значение критерия Ø Вывод: если χ2 набл< χ2 крит - нулевая гипотеза принимается: распределение подчиняется выбранному закону; если χ2 набл χ2 крит - нулевая гипотеза отвергается: распределение не подчиняется выбранному закону

Пример. При гемодиализе кровь больного пропускают через искусственную почку – аппарат, удаляющий из крови Пример. При гемодиализе кровь больного пропускают через искусственную почку – аппарат, удаляющий из крови продукты обмена веществ. Искусственная почка подсоединяется к артерии и вене больного: кровь из артерии поступает в аппарат и оттуда, уже очищенная, - вену. Так как гемодиализ проводится регулярно, больному устанавливают артериовенозный шунт. В артерию и вену на предплечье вводят тефлоновые трубки; их концы выводят наружу и соединяют друг с другом. При очередной процедуре гемодиализа трубки разъединяют между собой и присоединяют к аппарату. После диализа трубки вновь соединяют, и кровь течет по шунту из артерии в вену. Завихрения тока крови в местах соединения трубок и сосудов приводят к тромбированию шунта. Проверяли, нельзя ли снизить риск тромбоза назначением небольших доз аспирина (160 мг/сутки).

Тромбозы шунта приеме плацебо и аспирина, наблюдаемые частоты Плацебо Аспирин Всего Тромбоз есть 18 Тромбозы шунта приеме плацебо и аспирина, наблюдаемые частоты Плацебо Аспирин Всего Тромбоз есть 18 6 24 Тромбоза нет 7 13 20 Тромбозы шунта приеме плацебо и аспирина, ожидаемые частоты Плацебо Аспирин Всего Тромбоз есть 13, 64 10, 36 24 Тромбоза нет 11, 36 18, 64 20

Расчет ожидаемых частот Тромбоз произошел у 24 из 44 обследованных, т. е. в 54, Расчет ожидаемых частот Тромбоз произошел у 24 из 44 обследованных, т. е. в 54, 55 % случаев Нулевая гипотеза: аспирин не влияет на риск тромбоза Тромбоз наблюдается: В группе плацебо 25 54, 55% = 13, 64 В группе аспирина 19 54, 55 = 10, 36

Решение. 1. Вычисляем: 2 набл = 7, 1 2. Задаем уровень значимости: = 0, Решение. 1. Вычисляем: 2 набл = 7, 1 2. Задаем уровень значимости: = 0, 05 3. Определяем по таблице распределения 2 крит = 3, 84 4. Сравниваем: 2 набл > 2 крит 5. Следовательно отклоняется гипотеза об отсутствии связи между приемом аспирина и образованием тромбов.