Непараметрические критерии проверки гипотез2.ppt
- Количество слайдов: 20
Непараметрические критерии проверки гипотез Обычно выделяется три типа задач: • 1. Выявление различий в уровне исследуемого признака (сравнение двух выборок, состоящих из различных объектов по одной и той же характеристике) • 2. Оценка достоверности сдвига значений изучаемой характеристики (сравнение одной и той же выборки по одной и той же характеристике) • 3. Выявление различий в распределении признака. Здесь можно выделить два типа задач: • сравнение эмпирического распределения с теоретическим • сравнение двух эмпирических распределений (обычно используется при небольшом числе градаций признака и частотности не менее 5 объектов по каждой градации).
Критерий Q-Розенбаума • • • Формулировка гипотез: H 0: уровень признака в первой группе не превышает уровня признака во второй группе H 1: уровень признака в первой группе превышает уровень признака во второй группе Алгоритм : 1. Зададается уровень значимости p. 2. Объекты в каждой группе располагаются по убыванию значения признака от более высокого до самого низкого. 3. В качестве первой выборки для определенности выбирается та, у которой наивысшее значение больше. Данный критерий неприменим в случае, если максимальные и минимальные значения совпадают. 4. Определяется число объектов первый выборки, у которых значения признака превышают максимальное значение этого признака у представителей второй выборки N 1. 5. Определяется число объектов второй выборки, у которых значение признака меньше минимального значения исследуемого признака представителей первой группы – N 2 6. Для проверки гипотезы для нахождения наблюдаемого значения используем критерий Q = N 1+ N 2 7. По таблице Q распределения находим критическое значение Qкр =Q(p, n 1, n 2) 8. Принятие решения: если Qнабл Qкр, то нулевая гипотезе отвергается и доказывается, что верна гипотеза H 1. Если Qнабл< Qкр, то нет оснований отвергнуть гипотезу H 0.
Критерий U-Манна-Уитни • • • • H 0: уровень признака в первой группе не превышает уровня признака во второй группе H 1: уровень признака в первой группе превышает уровень признака во второй группе Алгоритм : 1. Задать уровень значимости p. 2. Проражировать значения представителей обеих групп (для определенности ранг 1 приписываем наименьшему значению, если есть одинаковые значения ранговые связки, то считаем средние ранги). 3. Ранги расписывать отдельно по каждой группе. 4. Определить сумму рангов объектов первый выборки R 1 , второй – R 2. 5. Для каждой выборки отдельно считаем наблюдаемые значения и выбираем наименьшее. Т. е. для проверки гипотезы используем два критерия: U 1= n 1 n 2 + n 1( n 1 + 1)/2 – R 1 и U 2= n 1 n 2 + n 2( n 2 + 1)/2 – R 2 В качестве наблюдаемого значения выбираем наименьшее из них Uнабл = min(U 1, U 2 ) 6. По таблице U распределения находим критическое значение Uкр =U(p, n 1, n 2) 7. Принятие решения: различие будет достоверным, если Uнабл Uкр, в противном случае нет оснований отвергнуть гипотезу H 0.
Критерий G-знаков (сдвигов) • H 0: преобладание типичного направления сдвига является случайным • H 1: преобладание типичного направления сдвига является не случайным • Алгоритм : • 1. Задать уровень значимости p. • 2. Определить количество нулевых сдвигов, тогда n’ = n – n 0, где n 0 – количество нулевых сдвигов. • 3. Определить типичный сдвиг как сдвиг значений, который наблюдается у большинства объектов (он может быть как положительным, так и отрицательным). Соответственно, нетипичный сдвиг наблюдается у меньшего сила людей. В качестве критерия используем G = nнт, nнт – количество объектов с нетипичным сдвигом. • 4. Наблюдаемое значения вычисляется как Gнабл = nнт • 5. По таблице G распределения находим критическое значение • Gкр =G(p, n’) • 7. Принятие решения: сдвиг значений будет достоверным, если Gнабл Gкр, в противном случае нет оснований отвергнуть гипотезу H 0.
Критерий T-Вилкоксона • • • H 0: сдвиг значений признака является случайным H 1: сдвиг значений признака является не случайным Алгоритм : 1. Задать уровень значимости p. 2. Вычислить разность между первым и вторым измерениями. Определить типичный сдвиг. 3. Проранжировать абсолютные величины полученных разностей. 4. Найти сумму рангов объектов, у которых сдвиг является нетипичным. Наблюдаемое значения вычисляется как Tнабл = Rнт 5. По таблице T распределения находим критическое значение Tкр =T(p, n) 6. Принятие решения: сдвиг значений будет достоверным, если Tнабл Tкр, в противном случае нет оснований отвергнуть гипотезу H 0.
Критерий согласия 2 -Пирсона • 1. Случай сравнения эмпирического распределения с теоретическим. • • H 0: рассматриваемое эмпирическое распределение признака не значимо отличается от теоретического (например, нормального) H 1: рассматриваемое эмпирическое распределение признака значимо отличается от теоретического Алгоритм : 1. Задать уровень значимости p. 2. Вычислить частоты встречаемости каждой градации эмпирического распределения. 3. Вычислить теоретические частоты встречаемости каждой градации признака. Если в качестве теоретического распределения выбрано равномерное, то, чтобы найти теоретические частоты (а они будут одинаковыми для каждой градации), необходимо полученную сумму эмпирических часто разделить на количество градаций признака. 4. Найти сумму разностей эмпирических и теоретических частот – ( nэмпi – nтеорi)
• k - количество разрядов признака • • 5. По таблице 2 - распределения находим критическое значение 2 кр = 2 (p, k -1) • 6. Принятие решения: эмпирическое распределение значимо отличается от теоретического, если 2 набл 2 кр, в противном случае нет оснований отвергнуть гипотезу H 0.
• • • 2. Рассмотрим случай сравнения двух эмпирических распределений. Все требования к эмпирическим данным сохраняются. Алгоритм в данном случае аналогичен предыдущему случаю. H 0: рассматриваемые эмпирические распределения признака не значимо отличается друг от друга H 1: рассматриваемые эмпирические распределения признака значимо отличается друг от друга (выборки извлечены из различных генеральных совокупностей) Алгоритм : 1. Построить общее эмпирическое распределение, т. е. объединить эмпирические значения обоих выборок в один столбец. 2. Построить соответствующее теоретическое распределение. Распределение строится следующим образом: пусть теоретическая частота- nтеорi, эмпирическая частота i-й градации представителей 1 -й выборки – nэмпi 1, эмпирическая частота i-й градации представителей 2 -й выборки –nэмпi 2, общее количество наблюдений - n.
• Тогда, теоретическая частота соответствующая i той градации 1 й выборки будет равна Теоретическая частота соответствующая i той градации 2 й выборки соответственно 3. Задать уровень значимости p. 4. Вычислить часто встречаемости каждой градации эмпирического распределения. 3. Вычислить теоретические частоты встречаемости каждой градации признака. Если в качестве теоретического распределения выбрано равномерное, то, чтобы найти теоретические частоты (а они будут одинаковыми для каждой градации), необходимо полученную сумму эмпирических часто разделить на количество градаций признака.
• 4. Найти сумму разностей сформированных эмпирических и теоретических частот – ( nэмпi – nтеорi) 5. По таблице 2 - распределения находим критическое значение 2 кр = 2 (p, k – 1) 6. Принятие решения: эмпирическое распределение значимо отличается от теоретического, если 2 набл 2 кр, в противном случае нет оснований отвергнуть гипотезу H 0.
Критерий λ Колмогорова-Смирнова • • • 1. Вычислить относительные эмпирические частоты для каждого разряда по формуле: f эмпi=nэмпi/n где nэмп эмпирическая частота по данному разряду; 2. Вычислить накопленные эмпирические частоты Σfj по формуле: где Σfj=Σfj-1+fj – относительная частота, накопленная на предыдущих разрядах; j порядковый номер разряда; fj- относительная эмпирическая частота данного j го разряда. 3. Вычислить накопленные теоретические частоты для каждого раз ряда по формуле: Σfт j=Σf. Т j 1+f. Т j где Σf. Т j 1 теоретическая частота, накопленная на предыдущих разрядах; j порядковый номер разряда; f. Т j теоретическая частота данного разряда. 4. Вычислить разности между эмпирическими и теоретическими нако пленными частотами по каждому разряду (абсолютные величины полученных разностей) – di. 5. Определить наибольшую абсолютную величину разности dmax. 6. По Табл. определить критическое значение dкр для данного количества наблюдений n. Если dmax ≥ dкр, то различия между распределениями достоверны.
Н - критерий Крускала-Уоллиса • Критерий предназначен для оценки различий одновременно между тремя, четырьмя и т. д. выборками по уровню какого либо признака. • Он позволяет установить, что уровень признака изменяется при переходе от группы к группе, но не указывает на направление этих из менений. • Гипотезы • H 0: Между выборками 1, 2, 3 и т. д. существуют лишь случайные раз личия по уровню исследуемого признака. • Н 1: Между выборками 1, 2, 3 и т. д. существуют неслучайные разли чия по уровню исследуемого признака • Алгоритм • 1. Проранжировать значения признака представителей всех групп, приписывая меньшему значению меньший ранг. Общее количество рангов будет равняться количеству испытуемых в объединенной выборке. • 2. Рассписать ранги отдельно по каждой группе. • 3. Подсчитать суммы рангов по каждой группе (Tj). Проверить совпадение общей суммы рангов с расчетной
• 4. Найти значение критерия Н по формуле: • • • где N - общее количество испытуемых в объединенной выборке; n количество испытуемых в каждой группе; Т - суммы рангов по каждой группе. • При количестве групп с=3, n 1 • n 2 • n 3≤ 5 определить критические значения и соответствующий им уровень значимости по Таблице Крускала Уоллиса. Если Нэмп равен или превышает критическое значение 0, 05, H 0 отвергается. • • • При количестве групп с>3 или количестве испытуемых n 1 • n 2 • n 3>5, определить критические значения χ2 по Табл. IX Приложения 1. Если Нэмп равен или превышает критическое значение χ2, H 0 отвергается
Критерий χ2 r Фридмана • • • Назначение критерия Критерий χ2 r применяется для сопоставления показателей, измеренных в трех или более условиях на одной и той же выборке испытуемых. Позволяет установить, что величины показателей от условия к условию изменяются, но при этом не указывает на направление изменений. Гипотезы Н 0: Между показателями, полученными (измеренными) в разных условиях, существуют лишь случайные различия. H 1: Между показателями, полученными в разных условиях, существуют неслучайные различия Алгоритм 1. Проранжировать индивидуальные значения первого испытуемого, полученные им в 1 м, 2 м, 3 м и т. д. замерах. 2. Проделать то же самое по отношению ко всем другим испытуемым. 3. Просуммировать ранги по условиям, в которых осуществлялись замеры. Проверить совпадение общей суммы рангов с расчетной суммой. 4. Определить эмпирическое значение χ2 r по формуле
где с количество условии; п - количество испытуемых; Ti - суммы рангов по каждому из условий • • 5. Определить уровни статистической значимости для χ2 r а) при с=3, n<9 по Таблице Фридмана; б) при с=4, n<4 по Таблице χ2. 6. При большем количестве условий и/или испытуемых определить количество степеней свободы v по формуле: v=c-1, где с количество условий (замеров). По Таблопределить критические значения кри терияχ2 при данном числе степеней свободы V. Если χ2 r эмп равен критическому значению χ2 или превышает его, различия достоверны
МНОГОФУНКЦИОНАЛЬНЫЕ СТАТИСТИЧЕСКИЕ КРИТЕРИИ • • • Многофункциональные статистические критерии это критерии, которые могут использоваться по отношению к самым разнообразным данным, выборкам и задачам. Данные могут быть представлены в любой шкале, начиная от номинативной (шкалы наименований) Выборки могут быть как независимыми, так и «связанными» К числу многофункциональных критериев относится критерий φ* Фишера (угловое преобразование Фишера) и, биномиальный критерий m. Многофункциональные критерии построены на сопоставлении долей, выраженных в долях единицы или в процентах. Суть критериев состоит в определении того, какая доля наблюдений (реакций, выборов, испытуемых) в данной выборке характеризуется интересующим исследователя эффектом и какая доля этим эффектом не характеризуется. Критерий φ* — угловое преобразование Фишера Назначение критерия φ* Критерий Фишера предназначен для сопоставления двух выборок по частоте встречаемости интересующего исследователя эффекта Критерий оценивает достоверность различий между процентными долями двух выборок, в которых зарегистрирован интересующий нас эффект. Суть углового преобразования Фишера состоит в переводе процентных долей в величины центрального угла , который измеряется в радианах. Большей процентной доле будет соответствовать больший угол ф, а меньшей доле меньший угол (соотношения не линейные) •
• • • Гипотезы H 0: Доля лиц, у которых проявляется исследуемый эффект, в выборке 1 не больше, чем в выборке 2. H 1: Доля лиц, у которых проявляется исследуемый эффект, в выборке 1 больше, чем в выборке 2 • • Алгоритм 1. Определить те значения признака, которые будут критерием для разделения испытуемых на тех, у кого "есть эффект" и тех, у кого "нет эффекта". Если признак измерен количественно, использовать критерий λ для поиска оптимальной точки разделения. 2. Начертить четырехклеточную таблицу из двух столбцов и двух строк. Первый столбец "есть эффект"; второй столбец "нет эффекта"; первая строка сверху 1 группа (выборка); вторая строка 2 группа (выборка). 3. Подсчитать количество испытуемых в первой группе, у которых "есть эффект", и занести это число в левую верхнюю ячейку таблицы. 4. Подсчитать количество испытуемых в первой выборке, у которых "нет эффекта", и занести это число в правую верхнюю ячейку таблицы. Подсчитать сумму по двум верхним ячейкам. Она должна совпадать с количеством испытуемых в первой группе. 5. Подсчитать количество испытуемых во второй группе, у которых "есть эффект", и занести это число в левую нижнюю ячейку таблицы. 6. Подсчитать количество испытуемых во второй выборке, у которых "нет эффекта", и занести это число в правую нижнюю ячейку таблицы. Подсчитать сумму по двум нижним ячейкам. Она должна совпадать с количеством испытуемых во второй группе (выборке). • • •
• • • 7. Определить процентные доли испытуемых, у которых "есть эффект", путем отнесения их количества к общему количеству испытуемых в данной группе (выборке). Записать полученные процентные доли соответственно в левой верхней и левой нижней ячейках таблицы в скобках, чтобы не перепутать их с абсолютными значениями. 8. Проверить, не равняется ли одна из сопоставляемых процентных долей нулю. Если это так, попробовать изменить это, сдвинув точку разделения групп в ту или иную сторону. Если это невозможно или нежелательно, отказаться от критерия φ* и использовать критерий χ2. 9. Определить по таблице величины углов φ для каждой из сопоставляемых процентных долей. 10. Подсчитать эмпирическое значение φ* по формуле: • где: φ1 угол, соответствующий большей процентной доле; φ2 угол, соответствующий меньшей процентной доле; n 1 количество наблюдений в выборке 1; n 2 количество наблюдений в выборке 2. 11. Сопоставить полученное значение φ* с критическими значениями: φ* ≤ 1, 64 (р<0, 05) и φ* ≤ 2, 31 (р<0, 01). Если φ*эмп >φ*кр. H 0 отвергается. • При необходимости определить точный уровень значимости полученного φ*эмп по Таблице.
• Допустим, нас интересует, различаются ли две группы студентов по успешности решения новой экспериментальной задачи. • В первой группе из 20 человек с задачей справились 12 человек, • Во второй выборке из 25 человек справились 10. • В первом случае процентная доля решивших задачу составит 12/20· 100%=60%, • а во второй 10/25· 100%=40%. • Достоверно ли различаются эти процентные доли при данных n 1 и n 2? •
Группы "Есть эффект": решена Количество испытуемых задача % доля "Нет эффекта": задача не решена Суммы Количество испытуемых % доля 1 группа 12 (60%) А 8 (40%) Б 20 2 группа 10 (40%) В 15 (60%) Г 25 Суммы 22 23 45
Непараметрические критерии проверки гипотез2.ppt