Основы теории проверки статистических гипотез План лекции

Скачать презентацию Основы теории проверки статистических гипотез План лекции

Lektsia_BioStat-_2.ppt

Количество слайдов: 31

Основы теории проверки статистических гипотез.

План лекции: 1. Статистические гипотезы в медико- биологических исследованиях. 2. Параметрические критерии различий. 3. Непараметрические критерии. 4. Критерии согласия.

Процедура сопоставления высказанного предположения (гипотезы) с выборочными данными называется проверкой гипотез. Задачи статистической проверки гипотез: §Относительно некоторой генеральной совокупности высказывается та или иная гипотеза Н 0. §Из этой генеральной совокупности извлекается выборка. §Требуется указать правило, при помощи которого можно было бы по выборке решить вопрос о том, следует ли отклонить гипотезу Н 0 или принять ее.

Статистическая гипотеза- это предположение о виде распределения или о величинах неизвестных параметров генеральной совокупности, которая может быть проверена на основании выборочных показателей. Примеры статистических гипотез: Генеральная совокупность распределена по нормальному закону Гаусса. Дисперсии двух нормальных совокупностей равны между собой.

Статистические гипотезы Параметрические Непараметрические

Нулевой гипотезой Н 0 называется основная гипотеза, которая проверяется. Альтернативной гипотезой Н 1, называется гипотеза, конкурирующая с нулевой, то есть противоречащая ей. Простой называют гипотезу, содержащую только одно предположение. a=a 0 Сложной называют гипотезу, которая состоит из конечного или бесконечного числа простых гипотез. Статистическим критерием проверки гипотезы Н 0 называется правило, по которому принимается решение принять или отклонить гипотезу Н 0.

Основной принцип проверки гипотез Проверку гипотез осуществляют на основании результатов выборки X 1, X 2, …, Xn , из которых формируют функцию выборки Tn=T(X 1, X 2, …, Xn ), называемой статистикой критерия. Tn=T(X 1, X 2, …, Xn ) критическая область S область принятия гипотезы

Возможные ошибки проверке гипотез Первого рода Второго рода Гипотеза Н 0 Отвергается Принимается Верна Неверна Ошибка 1 -го рода Нет ошибки Ошибка 2 -го рода

Уровнем значимости критерия ( ) называется вероятность допустить ошибку 1 -го рода. Вероятность ошибки 2 -го рода обозначается через β. Мощностью критерия называется вероятность недопущения ошибки 2 -го рода (1 - β). Р(отвергнуть Н 0/Н 0 верна) или Р(Н 1/Н 0) β Р(принять Н 0/Н 0 неверна) или β Р(Н 0 /Н 1) 1 -β Р(принять Н 1/Н 1 верна) Чем больше мощность критерия, тем вероятность ошибки 2 -го рода меньше. Разумное соотношение между и β находят, исходя из тяжести последствий каждой из ошибок.

Пример: Пусть проверяется гипотеза отсутствия у пациента некоторого заболевания. Признаком заболевания служит значение определенного показателя ( к примеру, артериальное давление). Н 0 –значение показателя в норме, т. е. пациент здоров. а Н 1 -значение показателя отличается от нормы, т. е. пациент болен. Ошибка прервого рода- отклонение нулевой гипотезы, когда она верна, то есть признание человека больным, когда он на самом деле здоров. Ошибка второго рода- принятие нулевой гипотезы, когда она неверна, то есть признать человека здоровым, когда он на самом деле болен. Возможно пожертвовать высоким уровнем значимости с целью уменьшить вероятность ошибки второго рода β.

Методика проверки гипотез: 1. Формирование нулевой Н 0 и альтернативной Н 1 гипотез исходя из выборки X 1, X 2, …, Xn. 2. Подбор статистики критерия Tn=T(X 1, X 2, …, Xn ) 3. По статистике критерия Tn и уровню значимости определяют критическую точку tкр, то есть границу, отделяющую область от S. 4. Для полученной реализации выборки Х=(X 1, X 2, …, Xn ) подсчитывают значение критерия, то есть Tнабл=T(X 1, X 2, …, Xn ) t 5. Если t S (например, t> tкр для правосторонней области S), то нулевую гипотезу Н 0 отвергают; если же t (t

Параметрические критерии различий. t-критерий Стьюдента: Общий вид:

Случай независимых выборок. n 1=n 2=n df=n-1 n 1≠n 2 df= n 1+n 2 -2

Случай зависимых выборок. df=n-1

Вывод: • используется для проверки гипотезы о различии средних только для двух групп. • применяется в случае малых выборок. • Если схема эксперимента предполагает большее число групп, воспользуйтесь дисперсионным анализом. • Если критерий Стьюдента был использован для проверки различий между несколькими группами, то истинный уровень значимости можно получить, умножив уровень значимости, на число возможных сравнений.

F- критерий Фишера: 1> 2 df 1=n 1 -1, df 2=n 2 -1

Непараметрические критерии. Критерий различия называют непараметрическим, если он не базируется на предположении о типе распределения генеральной совокупности и не использует параметры этой совокупности. Применение непараметрических методов целесообразно: • на этапе разведочного анализа; • при малом числе наблюдений (до 30); • когда нет уверенности в соответствии данных закону нормального распределения.

Непараметрические критерии представлены основными группами: • критерии различия между группами независимых выборок; • критерии различия между группами зависимых выборок.

Различия между независимыми группами • U критерий Манна-Уитни • двухвыборочный критерий Колмогорова – Смирнова.

Различия между зависимыми группами • z – критерий знаков • Т – критерий Уилкоксона парных сравнений

Критерии согласия: Критерием согласия называют статистический критерий проверки гипотезы о предполагаемом законе неизвестного распределения. üПирсона (Хи-квадрат), üКолмогорова, üФишера, üСмирнова.

Критерий согласия Колмогорова - Смирнова.

Критерий согласия Колмогорова- Смирнова Последовательность обработки данных: 1. Объединяются в один ряд в возрастающем порядке все варианты, встречающиеся в сравниваемых группах наблюдений. 2. Записываются частоты вариант для одной и другой групп. 3. Проставляются частоты в накопленном порядке. 4. Накопленные частоты делятся на число наблюдений в соответствующих группах. 5. Вычисляются разности накопленных частот по группам Х и У без учета знаков.

Критерий согласия Колмогорова- Смирнова 6. Находится максимальная разность D. 7. По формуле определяется критерий 2. 8. Сравнивается полученное значение 2 с граничными значениями , которые для , а для . 6. Если , то различия между сравниваемыми группами признаются существенными

Критерий согласия χ2 (хи-квадрат) Пирсона. Н 0: «между эмперическим распределением и теоретической моделью нет никакого различия» . … … Если эмпирические частоты (ni) сильно отличаются от теоретических (npi) , то проверяемую гипотезу Но следует отвергнуть; в противном случае-принять.

Критерий согласия χ2 (хи-квадрат) Пирсона. n-объем выборки k-число интервалов разбиения выборки ni-число значений выборки, попавших в і-й интервал npi - теоретическая частота попадания значений случайной величины Х в і-й интервал.

Критерий согласия χ2 (хи-квадрат) Пирсона. или О-фактически наблюдаемое число Е- теоретически ожидаемое число

Поправка Йейтса Для распределения признаков, принимают всего 2 значения. которые

Правило применения критерия χ2. *По формуле вычисляют - выборочное значение статистики критерия. *выбрав уровень значимости α критерия, по таблице -распределения находим критическую точку *Если ≤ , то гипотеза Н 0 не противоречит опытным данным; если > , то гипотеза Н 0 отвергается. Неоходимым условием применения критерия Пирсона является наличие в каждом из интервалов не менее 5 наблюдений

ЛИТЕРАТУРА: Медик В. А. , Токмачев М. С. , Фишман Б. Б. Статистика в медицине и биологии. М. : Медицина, 2000. • Лукьянова Е. А. Медицинская статистика. - М. : Изд. РУДН, 2002. • Рокицкий П. Ф. Биологическая статистика. Высшая школа, 1973. • И. В. Павлушков и др. Основы высшей математики и математической статистики. (учебник для медицинских и фармацевтических вузов) М. , «ГЭОТАР - МЕД» ; 2003 •

СПАСИБО ЗА ВНИМАНИЕ.