Положительная Отрицательная Линейная Нелинейная Есть Нет К О

Скачать презентацию Положительная Отрицательная Линейная Нелинейная Есть Нет К О Скачать презентацию Положительная Отрицательная Линейная Нелинейная Есть Нет К О

corr_15.ppt

  • Количество слайдов: 21

>Положительная Отрицательная Линейная Нелинейная Есть Нет К О Р Р Е Л Я Ц Положительная Отрицательная Линейная Нелинейная Есть Нет К О Р Р Е Л Я Ц И Я

>Положительная Отрицательная Линейная Нелинейная Есть Нет К О Р Р Е Л Я Ц Положительная Отрицательная Линейная Нелинейная Есть Нет К О Р Р Е Л Я Ц И Я

>Положительная Отрицательная Линейная Нелинейная Есть Нет К О Р Р Е Л Я Ц Положительная Отрицательная Линейная Нелинейная Есть Нет К О Р Р Е Л Я Ц И Я Зависимость между переменными случайными величинами X и Y, при которой каждому значению одной из них соответствует не какое-то конкретное значение, а определенная групповая средняя другой величины, называется КОРРЕЛЯЦИОННОЙ или просто КОРРЕЛЯЦИЕЙ. Если по-простому, то корреляция – от лат. correlatio «соотношение, взаимосвязь» - это статистическая взаимосвязь двух или более случайных величин. При этом изменения значений одной или нескольких из этих величин сопутствуют систематическому («закономерному) изменению значений другой или других величин…

>SSXY Коэффициент ковариации – мера линейной зависимости двух случайных величин. Оценивает НАПРАВЛЕНИЕ линейной связи. SSXY Коэффициент ковариации – мера линейной зависимости двух случайных величин. Оценивает НАПРАВЛЕНИЕ линейной связи. На практике часто используется для анализа процентных данных (e.g. частот генов)… Если ковариация положительна, то с ростом значений одной случайной величины, значения второй имеют тенденцию возрастать, а если знак отрицательный — то убывать. Посчитайте CV для трех случаев и проиллюстрируйте данные ХY диаграммами. На диаграммах выделите мышкой точки, нажмите правую кнопку и используйте опцию «добавить линию тренда», выбирайте «линейная».

>

>К сожалению, только по абсолютному значению ковариации нельзя судить о том, насколько сильно величины К сожалению, только по абсолютному значению ковариации нельзя судить о том, насколько сильно величины взаимосвязаны («теснота связи»), так как её масштаб зависит от их дисперсий. Масштаб можно отнормировать, поделив значение ковариации на произведение среднеквадратических отклонений (квадратных корней из дисперсий). При этом получается так называемый коэффициент корреляции Пирсона (r), который всегда находится в интервале от −1 до 1. SSXY Коэффициент ковариации – мера линейной зависимости двух случайных величин. Оценивает НАПРАВЛЕНИЕ линейной связи. Если ковариация положительна, то с ростом значений одной случайной величины, значения второй имеют тенденцию возрастать, а если знак отрицательный — то убывать.

>Коэффициент корреляции Пирсона Теснота (сила) связи более сильная связь признаков менее сильная связь признаков Коэффициент корреляции Пирсона Теснота (сила) связи более сильная связь признаков менее сильная связь признаков X Y X Y Посчитайте r для трех случаев. На диаграммах «постучите» мышкой по линии тренда, войдите в «параметры» и отметьте галкой «поместить … R^2» Произведение стандотклон’ов

>

>Коэффициент корреляции Пирсона или Теснота (сила) связи более сильная связь признаков менее сильная связь Коэффициент корреляции Пирсона или Теснота (сила) связи более сильная связь признаков менее сильная связь признаков X Y X Y Те же формулы, но записанные по-другому

>Свойства коэффициента корреляции Величина коэффициента корреляции может принимать значения от -1 до +1. Положительный Свойства коэффициента корреляции Величина коэффициента корреляции может принимать значения от -1 до +1. Положительный знак указывает на однонаправленность тенденций взаимосвязанных изменений переменных X и Y, а отрицательный - на разнонаправленный. Чем ближе значение коэффициента к +1 или -1, тем «теснее» связь. Если распределение вариант обеих переменных подчиняется нормальному закону, справедливо равенство:

>сильная, или тесная 0,70<=r; средняя при 0,50<=r<0,70; умеренная при 0,30<=r<0,50; слабая при 0,20<=r<0,30; очень сильная, или тесная 0,70<=r; средняя при 0,50<=r<0,70; умеренная при 0,30<=r<0,50; слабая при 0,20<=r<0,30; очень слабая при r<0,20. КОРРЕЛЯЦИЯ: NB! Здесь r – по модулю

>Корреляция оценивает направление связи и ее «тесноту». Корреляция никак не оценивает «крутизну» связи, например Корреляция оценивает направление связи и ее «тесноту». Корреляция никак не оценивает «крутизну» связи, например для «черной» и «красной» зависимостей на графике r=-1 И еще: статистические связи или зависимости не следует путать с причинно-следственными биологическими связями. Если численность ракушки падает с глубиной, это не значит, что глубина «негативно» влияет на ракушку! М.б. дело в грунте, который случайно или не случайно меняется с глубиной в районе исследования…

>Проверка гипотезы о статистической значимости линейной связи НУЛЕВАЯ ГИПОТЕЗА: в генеральной совокупности связи между Проверка гипотезы о статистической значимости линейной связи НУЛЕВАЯ ГИПОТЕЗА: в генеральной совокупности связи между переменными нет и отличие коэффициента корреляции от нуля случайно. АЛЬТЕРНАТИВНАЯ ГИПОТЕЗА: коэффициент корреляции по модулю больше нуля. Нулевая гипотеза проверяется путем сравнения коэффициента корреляции с его ошибкой mr: считаем t стьюдента и сравниваем с критическим (двухсторонним) значением через =СТЬЮДРАСПОБР(α;ν). Либо напрямую оцениваем уровень значимости различий через =СТЬЮДРАСП(t;v;2) Ошибка считается по-разному для больших (N≥100) и маленьких выборок. Число степеней свободы v=N-2. При tr tst (,) гипотеза об отсутствии корреляционной связи сохраняется Ошибка для N≥100 Ошибка для N<100

>Уточните r Пирсона с помощью функции exel и оцените значимость r для тех случаев, Уточните r Пирсона с помощью функции exel и оцените значимость r для тех случаев, для которых это возможно (???). r =коррел(диапазон X; диапазон Y) mr =корень((1-r^2)/(n-2)) t =r/mr df =n-2 tкр(0.05) =СТЬЮДРАСПОБР(0.05;df) p =СТЬЮДРАСП(t;df;2)

>Для r=1 ошибка «по определению» равна «0», отсюда значимость такого r оценить затруднительно… Для r=1 ошибка «по определению» равна «0», отсюда значимость такого r оценить затруднительно…

>Корреляционное отношение (η) – корень из силы влияния фактора (η2) в однофакторном дисперсионном анализе Корреляционное отношение (η) – корень из силы влияния фактора (η2) в однофакторном дисперсионном анализе Формирование однофакторного дисперсионного комплекса, где: Фактор – независимый признак (Х), а признак, образующий выборки – зависимый признак (Y). Значения независимого признака ранжируются, выделяются градации (интервалы) признака, он становится качественным а1 (1 – 2,5) а2 (2,5 – 4,5) а3 (4,5 – 6) Однофакторный дисперсионный комплекс корреляционное отношение (эта)

>Малая глубина Большая глубина Свойства корреляционного отношения Но: η (эта) отличается от 0 случайно Малая глубина Большая глубина Свойства корреляционного отношения Но: η (эта) отличается от 0 случайно / На: η (эта) отличается от 0 не случайно Если правильно сгруппировал

>r = 0,29 Группировка независимого признака и корреляционное отношение r = 0,29 Группировка независимого признака и корреляционное отношение

>а1 (1 – 3,5) а2 (3,5 – 6) η = 0,12 r = 0,29 а1 (1 – 3,5) а2 (3,5 – 6) η = 0,12 r = 0,29 Группировка независимого признака и корреляционное отношение

>а1 (1 – 2,5) а2 (2,5 – 4,5) а3 (4,5 – 6) η = а1 (1 – 2,5) а2 (2,5 – 4,5) а3 (4,5 – 6) η = 0,61 r = 0,29 Группировка независимого признака и корреляционное отношение

>Оценка линейности связи Сравнение линейного коэффициента корреляции (Пирсона) и корреляционного отношения позволяет сделать вывод Оценка линейности связи Сравнение линейного коэффициента корреляции (Пирсона) и корреляционного отношения позволяет сделать вывод о линейном или нелинейном характере связи. Критерий линейности Блэкмана (гамма) Выводы: Если сохранили Но, то связь между признаками отличается от линейной случайно. Если приняли На, то связь между признаками не линейна. Но: γ (гамма) отличается от 0 случайно На: γ (гамма) отличается от 0 не случайно *