Скачать презентацию Есть Положительная Линейная К О Р Р Е Скачать презентацию Есть Положительная Линейная К О Р Р Е

corr 15.ppt

  • Количество слайдов: 21

Есть Положительная Линейная К О Р Р Е Л Я Ц И Я Нет Есть Положительная Линейная К О Р Р Е Л Я Ц И Я Нет Отрицательная Нелинейная

К О Есть Р Нет Р Y X e Входная переменная Выходная переменная Случайные К О Есть Р Нет Р Y X e Входная переменная Выходная переменная Случайные переменные Е Независимая переменная Зависимая переменная Остаточные компоненты Объясняющая переменная Объясняемая переменная Остатки Л Аргумент Отклик Предиктор Функция (прогноз) Положительная Отрицательная Я Это – фактор, напр. Это – признак, напр. Это – изменчивость Ц «глубина» «плотность признака, не ракушки» связанная с И фактором Я Линейная Нелинейная

К Зависимость между переменными случайными величинами X и Y, О при которой каждому значению К Зависимость между переменными случайными величинами X и Y, О при которой каждому значению одной из них соответствует не какое. Есть Р Нет то конкретное значение, а определенная групповая средняя другой величины, называется КОРРЕЛЯЦИОННОЙ или просто Р КОРРЕЛЯЦИЕЙ. Е Л Если по-простому, то корреляция – от лат. correlatio Положительная Отрицательная «соотношение, взаимосвязь» - это статистическая взаимосвязь Я двух или более случайных величин. При этом изменения значений Ц одной или нескольких из этих величин сопутствуют систематическому И ( «закономерному) изменению значений другой или других величин… Я Линейная Нелинейная

Коэффициент ковариации – мера линейной зависимости двух случайных величин. Оценивает НАПРАВЛЕНИЕ линейной связи. На Коэффициент ковариации – мера линейной зависимости двух случайных величин. Оценивает НАПРАВЛЕНИЕ линейной связи. На практике часто используется для анализа процентных данных (e. g. частот генов)… SSXY Если ковариация положительна, то с ростом значений одной случайной величины, значения второй имеют тенденцию возрастать, а если знак отрицательный — то убывать. глубина численность 1 100 1 1 2 30 2 105 2 2 4 15 3 110 3 3 3 50 4 115 4 4 5 50 5 120 5 5 8 55 6 125 6 6 9 100 7 130 7 7 11 100 8 135 8 8 Посчитайте CV для трех случаев и проиллюстрируйте данные ХY диаграммами. На диаграммах выделите мышкой точки, нажмите правую кнопку и используйте опцию «добавить линию тренда» , выбирайте «линейная» .

Коэффициент ковариации – мера линейной зависимости двух случайных величин. Оценивает НАПРАВЛЕНИЕ линейной связи. SSXY Коэффициент ковариации – мера линейной зависимости двух случайных величин. Оценивает НАПРАВЛЕНИЕ линейной связи. SSXY Если ковариация положительна, то с ростом значений одной случайной величины, значения второй имеют тенденцию возрастать, а если знак отрицательный — то убывать. К сожалению, только по абсолютному значению ковариации нельзя судить о том, насколько сильно величины взаимосвязаны ( «теснота связи» ), так как её масштаб зависит от их дисперсий. Масштаб можно отнормировать, поделив значение ковариации на произведение среднеквадратических отклонений (квадратных корней из дисперсий). При этом получается так называемый коэффициент корреляции Пирсона (r), который всегда находится в интервале от − 1 до 1.

Коэффициент корреляции Пирсона Теснота (сила) связи Y Произведение стандотклон’ов Y X менее сильная связь Коэффициент корреляции Пирсона Теснота (сила) связи Y Произведение стандотклон’ов Y X менее сильная связь признаков X более сильная связь признаков Посчитайте r для трех случаев. На диаграммах «постучите» мышкой по линии тренда, войдите в «параметры» и отметьте галкой «поместить … R^2»

n ry / x = Коэффициент корреляции Пирсона å ( x - x )( n ry / x = Коэффициент корреляции Пирсона å ( x - x )( y i =1 i n - y) n i =1 i или i =1 ( xi - x ) 2 å ( yi - y ) 2 å Теснота (сила) связи Y Y X менее сильная связь признаков Те же формулы, но записанные по-другому X более сильная связь признаков

Свойства коэффициента корреляции • Величина коэффициента корреляции может принимать значения от -1 до +1. Свойства коэффициента корреляции • Величина коэффициента корреляции может принимать значения от -1 до +1. Положительный знак указывает на однонаправленность тенденций взаимосвязанных изменений переменных X и Y, а отрицательный - на разнонаправленный. • Чем ближе значение коэффициента к +1 или -1, тем «теснее» связь. • Если распределение вариант обеих переменных подчиняется нормальному закону, справедливо равенство:

КОРРЕЛЯЦИЯ: сильная, или тесная 0, 70<=r; средняя при 0, 50<=r<0, 70; умеренная при 0, КОРРЕЛЯЦИЯ: сильная, или тесная 0, 70<=r; средняя при 0, 50<=r<0, 70; умеренная при 0, 30<=r<0, 50; слабая при 0, 20<=r<0, 30; очень слабая при NB! Здесь r – по модулю r<0, 20.

Корреляция оценивает направление связи и ее «тесноту» . Корреляция никак не оценивает «крутизну» связи, Корреляция оценивает направление связи и ее «тесноту» . Корреляция никак не оценивает «крутизну» связи, например для «черной» и «красной» зависимостей на графике r=-1 И еще: статистические связи или зависимости не следует путать с причинноследственными биологическими связями. Если численность ракушки падает с глубиной, это не значит, что глубина «негативно» влияет на ракушку! М. б. дело в грунте, который случайно или не случайно меняется с глубиной в районе исследования…

Проверка гипотезы о статистической значимости линейной связи НУЛЕВАЯ ГИПОТЕЗА: в генеральной совокупности связи между Проверка гипотезы о статистической значимости линейной связи НУЛЕВАЯ ГИПОТЕЗА: в генеральной совокупности связи между переменными нет и отличие коэффициента корреляции от нуля случайно. АЛЬТЕРНАТИВНАЯ ГИПОТЕЗА: коэффициент корреляции по модулю больше нуля. Нулевая гипотеза проверяется путем сравнения коэффициента корреляции с его ошибкой mr: считаем t стьюдента и сравниваем с критическим (двухсторонним) значением через =СТЬЮДРАСПОБР(α; ν). Либо напрямую оцениваем уровень значимости различий через =СТЬЮДРАСП(t; v; 2) Ошибка считается по-разному для больших (N≥ 100) и маленьких выборок. Число степеней свободы v=N-2. Ошибка для N≥ 100 Ошибка для N<100 При tr tst ( , ) гипотеза об отсутствии корреляционной связи сохраняется

глубина численность 1 100 1 1 2 30 2 105 2 2 4 15 глубина численность 1 100 1 1 2 30 2 105 2 2 4 15 3 110 3 3 3 50 4 115 4 4 5 50 5 120 5 5 8 55 6 125 6 6 9 100 7 130 7 7 11 100 8 135 8 8 Уточните r Пирсона с помощью функции exel и оцените значимость r для тех случаев, для которых это возможно (? ? ? ). r =коррел(диапазон X; диапазон Y) mr =корень((1 -r^2)/(n-2)) t =r/mr df =n-2 tкр(0. 05) =СТЬЮДРАСПОБР(0. 05; df) p =СТЬЮДРАСП(t; df; 2)

Для r=1 ошибка «по определению» равна « 0» , отсюда значимость такого r оценить Для r=1 ошибка «по определению» равна « 0» , отсюда значимость такого r оценить затруднительно…

Корреляционное отношение (η) – корень из силы влияния фактора (η 2) в однофакторном дисперсионном Корреляционное отношение (η) – корень из силы влияния фактора (η 2) в однофакторном дисперсионном анализе Формирование однофакторного дисперсионного комплекса, где: Фактор – независимый признак (Х), а признак, образующий выборки – зависимый признак (Y). Значения независимого признака ранжируются, выделяются градации (интервалы) признака, он становится качественным X 1, 0 а 2 (2, 5 – 4, 5) а 3 (4, 5 – 6) 1, 4 3, 0 2, 0 5, 1 4, 6 2, 0 3, 0 6, 8 4, 5 5, 1 5, 0 6, 0 5, 7 3, 0 6, 8 2, 0 7, 5 2, 0 3, 7 6, 0 4, 0 7, 5 4, 4 6, 5 5, 0 а 3 (4, 5 – 6) а 1 (1 – 2, 5) 3, 0 а 2 (2, 5 – 4, 5) 2, 0 а 1 (1 – 2, 5) Y 4, 6 5, 6 4, 5 5, 8 5, 7 6, 0 2, 0 Однофакторный дисперсионный комплекс 6, 5 корреляционное отношение (эта)

Малая глубина Большая глубина численность 1 100 1 1 2 30 2 105 2 Малая глубина Большая глубина численность 1 100 1 1 2 30 2 105 2 2 4 15 3 110 3 3 3 50 4 115 4 4 5 50 5 120 5 5 8 55 6 125 6 6 9 100 7 130 7 7 11 100 8 135 8 8 Свойства корреляционного отношения Если правильно сгруппировал Но: η (эта) отличается от 0 случайно / На: η (эта) отличается от 0 не случайно

Группировка независимого признака и корреляционное отношение X Y 1, 0 2, 0 1, 4 Группировка независимого признака и корреляционное отношение X Y 1, 0 2, 0 1, 4 3, 0 2, 0 5, 0 2, 0 3, 0 5, 1 3, 0 6, 8 3, 7 6, 0 4, 0 7, 5 4, 4 6, 5 5, 0 4, 6 5, 6 4, 5 5, 8 5, 7 6, 0 2, 0 10 8 6 4 2 0 0 1 2 3 4 5 r = 0, 29 6 7

Группировка независимого признака и корреляционное отношение X 1, 0 3, 0 2, 0 5, Группировка независимого признака и корреляционное отношение X 1, 0 3, 0 2, 0 5, 0 2, 0 3, 0 5, 1 3, 0 6, 8 3, 7 6, 0 4, 0 7, 5 4, 4 а 2 (3, 5 – 6) 2, 0 1, 4 а 1 (1 – 3, 5) Y 6, 5 5, 0 4, 6 5, 6 4, 5 5, 8 5, 7 6, 0 2, 0 η = 0, 12 r = 0, 29

Группировка независимого признака и корреляционное отношение X 1, 0 2, 0 5, 0 2, Группировка независимого признака и корреляционное отношение X 1, 0 2, 0 5, 0 2, 0 3, 0 5, 1 3, 0 6, 8 3, 7 6, 0 4, 0 7, 5 4, 4 6, 5 5, 0 а 3 (4, 5 – 6) 3, 0 2, 0 а 2 (2, 5 – 4, 5) 2, 0 1, 4 а 1 (1 – 2, 5) Y 4, 6 5, 6 4, 5 5, 8 5, 7 6, 0 2, 0 η = 0, 61 r = 0, 29

Оценка линейности связи Сравнение линейного коэффициента корреляции (Пирсона) и корреляционного отношения позволяет сделать вывод Оценка линейности связи Сравнение линейного коэффициента корреляции (Пирсона) и корреляционного отношения позволяет сделать вывод о линейном или нелинейном характере связи. Критерий линейности Блэкмана (гамма) Но: γ (гамма) отличается от 0 случайно На: γ (гамма) отличается от 0 не случайно * Выводы: • Если сохранили Но, то связь между признаками отличается от линейной случайно. • Если приняли На, то связь между признаками не линейна.