занятие_7_манна-уитни2013_1.ppt
- Количество слайдов: 30
ОПРЕДЕЛЕНИЕ: ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ. Критерии, построенные на основании параметров изучаемой совокупности и связанные с предположением о нормальности распределения ее вариант называются параметрическими. НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ. Критерии, построенные на основании функций, зависящих непосредственно от вариант данной совокупности с их частотами, и свободные от предположения о виде распределения, называются непараметрическими
U-критерий Манна-Уитни (англ. Mann-Whitney U test) — непараметрический статистический критерий, используемый для оценки различий между двумя выборками. Позволяет выявлять различия в значении параметра между малыми выборками. Ограничения применимости критерия: В каждой из выборок должно быть не менее 3 значений признака. Допускается, чтобы в одной выборке было два значения, но во второй тогда не менее пяти. В каждой выборке должно быть не более 60 значений параметра, но уже при выборках в 20 и более единиц метод становится довольно трудоемким.
Для применения U-критерия Манна-Уитни нужно произвести следующие операции. 1. Составить единый ранжированный (в порядке возрастания) ряд из обоих сопоставляемых выборок, каждому значению признака присвоить ранг (ранги – числа натурального ранга; меньшему значению присваивается меньший ранг; одинаковым значениям признака присваивается одинаковый средний ранг. 2. Разделить единый ранжированный ряд на два, состоящие соответственно из единиц первой и второй выборок. Подсчитать отдельно сумму рангов, пришедшихся на долю элементов первой выборки, и отдельно — на долю элементов второй выборки. Определить большую из двух ранговых сумм (Tx), соответствующую выборке с nx единиц. 3. Определить значение U-критерия Манна-Уитни по формуле: 4. По таблице определить критические значения критерия для данных n 1 и n 2. Если полученное значение U меньше табличного или равно ему для избранного уровня статистической значимости, то признается наличие существенного различия между уровнем признака в рассматриваемых выборках (принимается альтернативная гипотеза). Если же полученное значение U больше табличного, принимается нулевая гипотеза. Достоверность различий тем выше, чем меньше значение U.
Изучали вес рыжих полевок, добытых в ельниках и сосняках Вес, г Средний вес в ельниках: 20, 25, 19, 25, 24, 27, 26, 22 в сосняках: 22, 19, 20, 25, 26, 23 23, 8 г 22, 3 г
n Но: Наблюдаемые различия между значениями признака в рассматриваемых выборках случайны. n На: Наблюдаемые различия между значениями признака в рассматриваемых выборках не случайны.
Изучали вес рыжих полевок, добытых в ельниках и сосняках в ельниках: 20, 25, 19, 25, 24, 27, 26, 22 в сосняках: 22, 19, 20, 25, 26, 23 23, 8 г 22, 3 г
Одинаковым значениям присваивается одинаковый средний ранг
n 1, n 2 – объем выборок nx – объем выборки с максимальной суммой рангов Тх
n 1, n 2 – объем выборок nx – объем выборки с максимальной суммой рангов Тх
n 1, n 2 – объем выборок nx – объем выборки с максимальной суммой рангов Тх
n 1, n 2 – объем выборок nx – объем выборки с максимальной суммой рангов Тх Так как табличное значение критерия меньше фактического (U=24), можно заключить, что наблюдаемые различия в весе тела полевок, добытых в разных биотопах, носят случайный характер, т. е. статистически недостоверны (нулевая гипотеза сохраняется).
При больших выборках (n>20) , выборочное распределение статистики U быстро приближается к нормальному распределению: статистике U соответствует: • Z значение (нормально распределенная случайная величина) • или Z adjusted (с поправкой на связи в выборках) • Соответствующие р-значения (p-level). Так как p=0. 26>0. 05 Ho – принимается. Если выборки малого размера (n<20) STATISTICA вычисляет точную вероятность, связанную с соответствующей статистикой U 2*1 sided exact p (= 1 - (односторонняя) p(U) ) уровень значимости вычисленного значения критерия (двустороннего) p=0. 28>0. 05, следовательно Но – принимается.
Но: Наблюдаемые различия между значениями признака в рассматриваемых выборках случайны. На: Наблюдаемые различия между значениями признака в рассматриваемых выборках не случайны. Так как уровень значимости (p-level) меньше 0, 05 (он равен 0, 00000), вероятностью 0, 95 наблюдаемые различия между размерами моллюсков на песчаном и илистом пляжах не случайны.
Мощность критерия Принята гипотеза Верна Гипотеза H 0 - вероятность правильно принять Ho, когда верна Ho H 1 вероятность ошибочно принять H 1, когда верна H 0 (ошибка 1 -го рода, уровень значимости) вероятность ошибочно принять H 0, когда верна H 1 (ошибка 2 -го рода) вероятность правильно принять H 1, когда верна H 1 (мощность критерия)
1 -α α/2 1 -β β 0 α/2 T* Δ Мощность критерия Показаны распределения критерия при справедливости нуль-гипотезы Ho: и при справедливости альтернативной гипотезы Ha:
а Распределение статистик нулевой и альтернативной гипотез (а) 1 -β β α/2 T* 0 Δ Изменение мощности критерия: б 1 -β’ α/2 β' T* 0 Δ в § при увеличении различий между Ho и Ha (б); § при уменьшении объема выборки (в); § α/2 β α/2 T* 0 1 -β Δ г 1 -β’ β' α'/2 0 α'/2 T* Δ при уменьшении α (г)
Мощность двустороннего критерия меньше мощности одностороннего


