Семинар 3. Статистические критерии 1.ppt
- Количество слайдов: 13
Стандартные ошибки сложных средних x, y, z – случайные величины, a, b, m - константы Случайная величина z = a+x z = ax z=a ebx z=a lg (bx), z=xm z=x±y Стандартная ошибка среднего
Стандартные ошибки сложных средних z=xy или z=x/y Закон преобразования ошибок средняя относительная ошибка С 1 кв. м собрали 247 ± 8 колосьев пшеницы. степенных произведений. Вес колоса – 851 ± 14 мг. Пусть h = kxaybzc… Какова урожайность сорта (в ц/га)? где x, y, z – переменные, k, a, b, c – константы С 1 кв. м: При пересчете на гектар: 21. 02± 0. 76 ц/га
Оптимальный объем выборки 4 6 2 5 3 8 2 1 4 5 Достаточен ли объем выборки для того, чтобы среднее значение - минимальный объем выборки, выборки было определено с относительной вероятной ошибкой необходимый для получения среднего 25% на уровне 95% доверительной вероятности? значения с определенной точностью δ ε=0, 25 t=2, 26 - минимальный объем выборки, необходимый для получения среднего значения с относительной вероятной ошибкой ε Размер выборки N=10 недостаточен
Статистические критерии
ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ РАЗЛИЧИЯ Смысл критериев различия Критерии различия позволяют дать ответ на вопросы трех типов относится ли то или иное измерение к данной совокупности? соответствует ли эмпирическое распределение теоретическому? различаются ли две эмпирические выборки? Практическая задача: проблема выбросов можно ли применять ДИ, tкритерий и др. сравнение контроля и опыта Нулевая гипотеза Н 0: реального различия нет сомнительное измерение принадлежит данной совокупности, его отличие случайно Альтернативная гипотеза Н 1: различие неслучайно различие между две выборки – выборочным и контроль и опыт- не теоретическим отличаются, распределением в различие между действительности ними – случайность отсутствует, имеющееся отличие – случайность Задача статистических критериев – проверка гипотез Статистические критерии ничего не могут утверждать или подтверждать, они могут только отвергать или не отвергать гипотезы Если нуль-гипотезу удается отвергнуть, то принимается альтернативная гипотеза: полученное отличие является неслучайным, т. е. оно есть на самом деле
Принадлежность резко выделяющихся наблюдений к выборке (проблема выбросов) 1. Правило четырех сигм можно применять если n≥ 10 если xэкстр лежит вне области оно может быть отброшено как выброс среднее значение и ст. отклонение рассчитываются без учета xэкстр Уровень значимости этого правила: при нормальном распределении при симметричном одновершинном распределении произвольном распределении α=0. 01% α =3% α =6%
Принадлежность резко выделяющихся наблюдений к выборке n 2. Критерий Диксона Для малых выборок (n ≤ 25) Критические значения коэффициента Диксона rα условие проверки 0, 886 0, 941 0, 976 0, 988 0, 679 0, 765 0, 846 0, 899 5 0, 557 0, 642 0, 729 0, 78 6 0, 482 0, 56 0, 644 0, 698 7 0, 434 0, 507 0, 586 0, 637 8 0, 479 0, 554 0, 631 0, 683 9 0, 441 0, 512 0, 587 0, 636 10 0, 409 0, 477 0, 551 0, 597 11 0, 517 0, 576 0, 538 0, 679 0, 49 0, 546 0, 605 0, 642 0, 467 0, 521 0, 578 0, 615 0, 462 0, 546 0, 602 0, 641 15 Если r > rα , то результат признается грубой погрешностью и исключается из дальнейшей обработки 3 14 статистика критерия α=0, 01 13 H 0: xn не является выбросом α=0, 02 12 нулевая гипотеза α=0, 05 4 Чтобы использовать критерий, значения в эмпирической выборке нужно выстроить в порядке возрастания и пронумеровать: x 1, x 2, …, xn-1, xn α=0, 1 0, 472 0, 525 0, 579 0, 616 16 0, 452 0, 507 0, 559 0, 595 17 0, 438 0, 49 0, 542 0, 577 18 0, 424 0, 475 0, 527 0, 561 19 0, 412 0, 462 0, 514 0, 547 20 0, 401 0, 45 0, 502 0, 535 21 0, 391 0, 44 0, 491 0, 524 22 0, 382 0, 43 0, 481 0, 514 23 0, 374 0, 421 0, 472 0, 505 24 0, 367 0, 413 0, 464 0, 497 25 0, 36 0, 406 0, 457 0, 489
Принадлежность 177 176. выборка: 157 326 резко выделяющихся наблюдений к выборке n Критические значения коэффициента Диксона Является ли 326 выбросом? r 2. Критерий Диксона Для малых выборок (n ≤ 25) α 0, 941 0, 976 0, 988 4 0, 679 0, 765 0, 846 0, 899 5 0, 557 0, 642 0, 729 0, 78 6 0, 482 0, 56 0, 644 0, 698 7 0, 434 0, 507 0, 586 0, 637 8 0, 479 0, 554 0, 631 0, 683 9 0, 441 0, 512 0, 587 0, 636 10 0, 409 0, 477 0, 551 0, 597 11 0, 517 0, 576 0, 538 0, 679 0, 49 0, 546 0, 605 0, 642 0, 467 0, 521 0, 578 0, 615 0, 462 0, 546 0, 602 0, 641 0, 472 0, 525 0, 579 0, 616 0, 452 0, 507 0, 559 0, 595 17 Если r > rα , то результат признается грубой погрешностью и исключается из дальнейшей обработки 0, 886 16 H 0: xn не является выбросом 3 15 Значит, значение 326 является выбросом α=0, 01 14 > r 0. 05; 4=0. 765 Чтобы использовать критерий, значения в эмпирической выборке нужно выстроить в порядке возрастания и пронумеровать: Нуль-гипотеза отклоняется. x 1, x 2, …, xn-1, xn α=0, 02 13 n=4 α=0, 05 12 Упорядоченный ряд: 157 176 177 326 α=0, 1 0, 438 0, 49 0, 542 0, 577 18 0, 424 0, 475 0, 527 0, 561 19 0, 412 0, 462 0, 514 0, 547 20 0, 401 0, 45 0, 502 0, 535 21 0, 391 0, 44 0, 491 0, 524 22 0, 382 0, 43 0, 481 0, 514 23 0, 374 0, 421 0, 472 0, 505 24 0, 367 0, 413 0, 464 0, 497 25 0, 36 0, 406 0, 457 0, 489
Принадлежность резко выделяющихся наблюдений к выборке n Критические значения tα α=0, 05 4 1. 46 1. 49 5 1. 67 1. 75 6 1. 82 1. 94 2. 10 2. 03 2. 22 2. 11 2. 32 10 2. 18 2. 41 12 2. 29 2. 55 14 2. 37 2. 66 15 2. 41 2. 71 16 2. 44 2. 75 18 2. 50 2. 82 20 2. 56 2. 88 30 2. 74 3. 10 40 Критерии r и t основаны на предположении о нормальности распределения генеральной совокупности 1. 15 9 Если t > t , то результат признается грубой α погрешностью и исключается из дальнейшей обработки 1. 15 8 H 0: xэкстрем не является выбросом 3 7 3. Если n >25 α=0, 01 2. 87 3. 24 50 2. 96 3. 34 60 3. 03 3. 41 100 3. 21 3. 60 120 3. 27 3. 66 1000 3. 28 3. 67
ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ РАЗЛИЧИЯ Принадлежность резко выделяющихся наблюдений к выборке x 1, x 2, …, xn-1, xn H 0: xn не является выбросом нулевая гипотеза статистика критерия 1. Правило четырех сигм (если n≥ 10) Если θ > 4 s - H 0 отклоняется 2. Критерий Диксона (если n ≤ 25) Если r > rα - H 0 отклоняется 3. Если n >25 Если t > tα - H 0 отклоняется условие проверки
Порядок проверки гипотезы Вариант 1 – сравнение расчетного значения критерия с критическим значением 1. Вычисляем значение статистики критерия θ 2. Для заданного уровня значимости α находим критическое (табличное) значение θα
Порядок проверки гипотезы Вариант 1 – сравнение расчетного значения критерия с критическим значением 1. Вычисляем значение статистики критерия θ 2. Для заданного уровня значимости α находим критическое (табличное) значение θα 3. Сравниваем статистику критерия θ с табличным (критическим) значением θα Если θ> θα – H 0 отклоняется
ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ РАЗЛИЧИЯ Принадлежность резко выделяющихся наблюдений к выборке x 1, x 2, …, xn-1, xn H 0: xn не является выбросом 4 6 2 5 3 8 2 1 4 5 Является ли значение 8 выбросом? 1. Правило четырех сигм (если n≥ 10) Если θ > 4 s - H 0 отклоняется 2. Критерий Диксона (если n ≤ 25) Если r > rα - H 0 отклоняется 3. Если n >25 Если t > tα - H 0 отклоняется
Семинар 3. Статистические критерии 1.ppt