Скачать презентацию Теория вероятностей и математическая статистика Проверка статистических гипотез Скачать презентацию Теория вероятностей и математическая статистика Проверка статистических гипотез

Проверка статистических гипотез.pptx

  • Количество слайдов: 50

Теория вероятностей и математическая статистика Проверка статистических гипотез Теория вероятностей и математическая статистика Проверка статистических гипотез

Контрольные вопросы 1. Что такое статистическая гипотеза? 2. Какую гипотезу называют нулевой (основной)? 3. Контрольные вопросы 1. Что такое статистическая гипотеза? 2. Какую гипотезу называют нулевой (основной)? 3. Какую гипотезу называют конкурирующей (альтернативной)? 4. Зачем выдвигается конкурирующая гипотеза? 5. Что такое ошибка 1 -го рода? Ошибка 2 -го рода? 6. Что называют уровнем значимости? 7. Приведите общую схему проверки статистических гипотез? 8. Что такое критическая область критерия? 9. Для проверки каких гипотез используется критерий Стьюдента? 10. Одновыборочный критерий Стьюдента (t-критерий) 11. Двухвыборочный критерий Стьюдента (t-критерий) 12. Распределение хи-квадрат и критерий Пирсона 13. Распределение Фишера и критерий Фишера (F-test)

Нормальное распределение Ц. П. Т. t-распределение (распределение Стьюдента) Распределение χ2 Критерий Пирсона (χ2 -тест) Нормальное распределение Ц. П. Т. t-распределение (распределение Стьюдента) Распределение χ2 Критерий Пирсона (χ2 -тест) Распределение Фишера

Выборочный метод Пусть для получения опытных данных необходимо провести обследование соответствующих объектов (генеральную совокупность). Выборочный метод Пусть для получения опытных данных необходимо провести обследование соответствующих объектов (генеральную совокупность). Обычно исследуют не всю совокупность объектов, а отбирают из неё некоторое количество объектов и исследуют только их (выборочную совокупность или другими словами выборку). По выборке судят о генеральной совокупности, следовательно, любое высказывание о генеральной совокупности является гипотезой.

Одновыборочный t-критерий Одновыборочный t-критерий

Статистическая гипотеза – это любое предположение о виде или параметрах неизвестного закона распределения. Примеры. Статистическая гипотеза – это любое предположение о виде или параметрах неизвестного закона распределения. Примеры. 1. Генеральная совокупность распределена по закону Пуассона. 2. Математическое ожидание генеральной совокупности равно 100. 3. Дисперсии двух генеральных совокупностей равны. 4. На Марсе есть жизнь.

Проверяемую гипотезу называют нулевой (основной), обозначают её Н 0. Выдвинутая гипотеза может быть принята Проверяемую гипотезу называют нулевой (основной), обозначают её Н 0. Выдвинутая гипотеза может быть принята или отвергнута. Наряду с выдвинутой гипотезой Н 0 рассматривают и противоречащую ей гипотезу, которую называют конкурирующей (альтернативной) и обозначают Н 1. В зависимости от выборочных данных принимается либо основная гипотеза, либо конкурирующая. Задача: проверить, верна ли нулевая гипотеза Н 0 при альтернативной гипотезе Н 1?

Пример. Пусть известно, что генеральная совокупность распределена по показательному закону. λ – параметр распределения Пример. Пусть известно, что генеральная совокупность распределена по показательному закону. λ – параметр распределения λ – неизвестен H 0: λ = 10 H 1: λ = 20 H 1: λ = 5 H 1: λ > 10 H 1: λ ≠ 10

Гипотеза Н 0 Принимается Отвергается Верна Правильное решение Ошибка 1 -го рода Неверна Ошибка Гипотеза Н 0 Принимается Отвергается Верна Правильное решение Ошибка 1 -го рода Неверна Ошибка 2 -го рода Правильное решение Обозначим через – вероятность допустить ошибку 1 -го рода, через – 2 -го рода. Вероятность допустить ошибку 1 -го рода, то есть отвергнуть верную гипотезу Н 0, называют уровнем значимости.

Общая схема проверки статистических гипотез 1 этап Задаём уровень значимости . α – вероятность Общая схема проверки статистических гипотез 1 этап Задаём уровень значимости . α – вероятность ошибки 1 -го рода (ошибочно отвергнуть верную гипотезу) В качестве α обычно берётся малое значение: 0. 05, 0. 01, 0. 005, 0. 001.

2 этап Строим случайную величину K, называемую статистическим критерием, для которой выполняются следующие условия: 2 этап Строим случайную величину K, называемую статистическим критерием, для которой выполняются следующие условия: 1) она является функцией от выборочных данных: K=K(x 1, x 2, …, xn); 2) её значения позволяют судить о «расхождении выборки с гипотезой Н 0» , то есть о том, надо принимать или отвергать гипотезу H 0; 3) распределение этой величины известно.

3 этап Вычисляем значения критерия, подставляя в него выборочные данные. Это число называют наблюдаемым 3 этап Вычисляем значения критерия, подставляя в него выборочные данные. Это число называют наблюдаемым значением критерия и обозначают Kнабл. 4 этап Находим критическую область данного критерия, то есть совокупность значений критерия, при которых нулевую гипотезу отвергают. Все остальные значения критерия образуют область, называемую областью принятия гипотезы. Если наблюдаемое значение критерия попадает в критическую область, то гипотезу отвергаем, если в область принятия гипотезы, то принимаем.

Точки, которые отделяют критическую область от области принятия гипотезы, называют критическими точками. Чаще всего Точки, которые отделяют критическую область от области принятия гипотезы, называют критическими точками. Чаще всего встречаются следующие виды критических областей: а) левосторонняя K < kкр б) правосторонняя K > kкр в) двусторонняя K < kкр1 K > kкр2

Критическую область W целесообразно находить согласно следующим требованиям: 1. 2. вероятность ошибки 2 -го Критическую область W целесообразно находить согласно следующим требованиям: 1. 2. вероятность ошибки 2 -го рода – минимальная, то есть вероятность – максимальная Вероятность не допустить ошибку 2 -го рода, то есть отвергнуть гипотезу H 0, когда она неверна, называется мощностью критерия. 1. 2. мощность критерия – максимальная

Схема проверки статистических гипотез 1. Задаём уровень значимости. • зависит от «тяжести последствий» ошибок Схема проверки статистических гипотез 1. Задаём уровень значимости. • зависит от «тяжести последствий» ошибок 1 -го и 2 -го рода для каждой конкретной задачи 2. Строим статистический критерий. • для каждой гипотезы имеет свой вид • описаны в литературе

3. Вычисляем наблюдаемое значение критерия. • подставляем в формулу выборочные данные 4. Находим критическую 3. Вычисляем наблюдаемое значение критерия. • подставляем в формулу выборочные данные 4. Находим критическую область и проверяем, попадает ли в неё наблюдаемое значение критерия. • критическая область зависит от вида конкурирующей гипотезы • критические точки находятся по специальным таблицам или с помощью компьютера

Критерий Стьюдента Известно, что генеральная совокупность распределена по нормальному закону, но его параметры неизвестны. Критерий Стьюдента Известно, что генеральная совокупность распределена по нормальному закону, но его параметры неизвестны. a, σ – параметры распределения Проверить гипотезу: Критерий: a 0 – некоторое число – выборочная средняя n – объём выборки s – исправленное среднее квадратическое отклонение Т имеет распределение Стьюдента с (n-1) степенями свободы

1. Критическая область W – правосторонняя: F(x) – функция распределения Стьюдента с (n-1) степенями 1. Критическая область W – правосторонняя: F(x) – функция распределения Стьюдента с (n-1) степенями свободы

2. Критическая область W – левосторонняя: F(x) – функция распределения Стьюдента с (n-1) степенями 2. Критическая область W – левосторонняя: F(x) – функция распределения Стьюдента с (n-1) степенями свободы

3. Критическая область W – двусторонняя: F(x) – функция распределения Стьюдента с (n-1) степенями 3. Критическая область W – двусторонняя: F(x) – функция распределения Стьюдента с (n-1) степенями свободы , или ,

Пример. Проектный контролируемый размер изделий, изготовляемых станком-автоматом, а = 35 мм. Измерения 20 случайно Пример. Проектный контролируемый размер изделий, изготовляемых станком-автоматом, а = 35 мм. Измерения 20 случайно отобранных изделий дали следующие результаты: xi ni 34. 8 2 34. 9 3 35. 0 4 35. 1 6 35. 3 5 Требуется при уровне значимости 0. 05 проверить нулевую гипотезу H 0: а = 35 при конкурирующей гипотезе H 1: а ≠ 35.

xi ni 34. 8 2 H 0: а = 35 34. 9 3 35. xi ni 34. 8 2 H 0: а = 35 34. 9 3 35. 0 4 35. 1 6 n = 20 α = 0. 05 35. 3 5 H 1: а ≠ 35 а 0 = 35 – выборочная средняя s – исправленное среднее квадратическое отклонение s = 0. 16 Критическая область двусторонняя: 1. 96 – 2. 09 Принимаем нулевую гипотезу, то есть станок обеспечивает проектный размер изделий.

 • Критерий согласия – критерий проверки гипотезы о предполагаемом законе неизвестного распределения. • • Критерий согласия – критерий проверки гипотезы о предполагаемом законе неизвестного распределения. • Критерии согласия: ( хи квадрат) Пирсона, Колмогорова, Смирнова и др.

Проверка гипотезы о нормальном распределении генеральной совокупности Критерий Пирсона. Проверка гипотезы о нормальном распределении генеральной совокупности Критерий Пирсона.

Распределение хи-квадрат (χ2) Функции плотности вероятности Распределение хи-квадрат (χ2) Функции плотности вероятности

Критерий согласия χ2 (Пирсона) «Слишком хорошее» согласие? Возможно, систематичес кая ошибка или подлог? Распределения Критерий согласия χ2 (Пирсона) «Слишком хорошее» согласие? Возможно, систематичес кая ошибка или подлог? Распределения одинаковые (согласуются) Распределения разные (не согласуются)

Критерий согласия χ2 (Пирсона) Пример с игральной костью Игральная кость: pi = 1/6 +--+------+ Критерий согласия χ2 (Пирсона) Пример с игральной костью Игральная кость: pi = 1/6 +--+------+ |No| Oi | Ei | +--+------+ | 1| 12| 8| | 2| 4| 8| | 3| 6| 8| | 4| 8| 8| | 5| 7| 8| | 6| 11| 8| +--+------+ | | 48| +--+------+ chi 2(empirical): 5. 75000 chi 2(a=0. 95; f=5): 11. 07050 chi 2(a=0. 05; f=5); 1. 14548 Игральная кость: p 1 = 3 pi +--+------+ (i=2. . 6) |No| Oi | Ei | +--+------+ | 1| 20| 8| | 2| 4| 8| | 3| 5| 8| | 4| 10| 8| | 5| 5| 8| | 6| 4| 8| +--+------+ + | 48| +--+------+ chi 2(empirical): 24. 75000 chi 2(a=0. 95; f=5): 11. 07050 chi 2(a=0. 05; f=5); 1. 14548

Критерий согласия χ2 (Пирсона) Пример с игральной костью Игральная кость: «подгонка» +--+------+ |No| Oi Критерий согласия χ2 (Пирсона) Пример с игральной костью Игральная кость: «подгонка» +--+------+ |No| Oi | Ei | +--+------+ | 1| 9| 8| | 2| 7| 8| | 3| 8| 8| | 4| 7| 8| | 5| 9| 8| | 6| 8| 8| +--+------+ + | 48| +--+------+ chi 2(empirical): 0. 50000 chi 2(a=0. 95; f=5): 11. 07050 chi 2(a=0. 05; f=5); 1. 14548

Критерий согласия χ2 : непрерывное распределение Критерий согласия χ2 : непрерывное распределение

 • В качестве критерия проверки примем случайную величину где -эмпирические частоты; -теоретические частоты. • В качестве критерия проверки примем случайную величину где -эмпирические частоты; -теоретические частоты.

 • Строим правостороннюю критическую область, исходя из требования, что в предположении справедливости где • Строим правостороннюю критическую область, исходя из требования, что в предположении справедливости где - уровень значимости; - число степеней свободы. ,

 • Число степеней свободы находят по формуле где - число групп(частичных интервалов) выборки; • Число степеней свободы находят по формуле где - число групп(частичных интервалов) выборки; - число параметров предполагаемого распределения, которые оценены по данным выборки. Если предполагаемое распределение нормальное, то оценивают два параметра и тогда

 • Если обозначить то при гипотезу , принимают; при отвергают. гипотезу • Если обозначить то при гипотезу , принимают; при отвергают. гипотезу

Критерий согласия Колмогорова • Если функция распределения случайной величины X F ( x) непрерывна, Критерий согласия Колмогорова • Если функция распределения случайной величины X F ( x) непрерывна, то практически ее эмпирическая функция F*(x) распределения при. сходится к F(x)

 • Если непрерывна, то функция распределения величины при имеет пределом функцию которая не • Если непрерывна, то функция распределения величины при имеет пределом функцию которая не зависит от вида функции

 • По таблице найдем значение функции и затем значение функции Если , то • По таблице найдем значение функции и затем значение функции Если , то расхождение между эмпирическими и теоретическими функциями распределения несущественно, если , то расхождение существенно.

Сравнение двух дисперсий нормальных генеральных совокупностей. • В качестве критерия проверки нулевой гипотезы о Сравнение двух дисперсий нормальных генеральных совокупностей. • В качестве критерия проверки нулевой гипотезы о равенстве генеральных дисперсий примем случайную величину , причем отношение большей исправленной дисперсии к меньшей:

F-тест (критерий Фишера) Функции MS Excel: F. ТЕСТ, F. РАСП, F. ОБР, ФТЕСТ, Ф F-тест (критерий Фишера) Функции MS Excel: F. ТЕСТ, F. РАСП, F. ОБР, ФТЕСТ, Ф

F-распределение (Фишера) F-распределение (Фишера)

F-тест (критерий Фишера) Функции MS Excel: F. ТЕСТ, F. РАСП, F. ОБР, ФТЕСТ, Ф F-тест (критерий Фишера) Функции MS Excel: F. ТЕСТ, F. РАСП, F. ОБР, ФТЕСТ, Ф

Двухвыборочный t-критерий Формула для случая двух независимых выборок со статистически незначимым различием между дисперсиями Двухвыборочный t-критерий Формула для случая двух независимых выборок со статистически незначимым различием между дисперсиями Функции MS Excel: пакет анализа данных

 • Величина F при условии справедливости имеет распределение Фишера-Снедекора со степенями свободы и • Величина F при условии справедливости имеет распределение Фишера-Снедекора со степенями свободы и , где - объем выборки, по которой вычислена большая исправленная дисперсия.

Виды регрессии • 1) регрессия на в виде функциональной зависимости ; • 2) регрессия Виды регрессии • 1) регрессия на в виде функциональной зависимости ; • 2) регрессия на в виде функциональной зависимости.

Выборочный коэффициент корреляции Выборочный коэффициент корреляции

Выборочное уравнение прямой линии регрессии на Выборочное уравнение прямой линии регрессии на

Выборочное уравнение прямой линии регрессии на Выборочное уравнение прямой линии регрессии на

 • Если данные наблюдений над признаками и заданы в виде корреляционной таблицы с • Если данные наблюдений над признаками и заданы в виде корреляционной таблицы с равноотстоящими вариантами, то целесообразно перейти к условным вариантам : ,

Выборочный коэффициент корреляции Выборочный коэффициент корреляции