7. Основы кор. анализа.ppt
- Количество слайдов: 29
Основы корреляционного анализа
План лекции: 1. Способы изучения корреляционных зависимостей. 2. Определение коэффициента парной линейной корреляции. 3. Достоверность коэффициента корреляции. Значимость различия двух коэффициентов корреляции. 4. Немонотонные связи между переменными.
СВЯЗИ МЕЖДУ СЛУЧАЙНЫМИ ВЕЛИЧИНАМИ До сегодняшнего дня мы изучали характеристики некоторых генеральных совокупностей и выборок из этих совокупностей. Каждую изучаемую генеральную совокупность или выборку из нее можно описать с помощью функций распределения или таких характеристик, как математическое ожидание (среднее) и дисперсия. Но как описать связи между случайными величинами из различных генеральных совокупностей или выборок?
ВИДЫ ЗАВИСИМОСТЕЙ Функциональная Корреляционная При функциональных зависимостях каждому значению одной переменной величины соответствует одно вполне определенное значение другой переменной (функции). Корреляционные (статистические) связи характеризуются тем, что численному значению одной переменной соответствует много значений (распределение) другой переменной.
ЗАДАЧИ КОРРЕЛЯЦИОННОГО АНАЛИЗА l Определение тесноты (степени сопряженности) между варьируемыми признаками l Определение формы и направления связи
Рассмотрим некоторое число n объектов, каждый из которых характеризуется двумя случайными переменными разного типа. Простейший случай: независимые переменные
Набор из двух случайных чисел: связь между числами отсутствует
Следующий пример: выборка студентов, каждый из которых характеризуется двумя случайными величинами: ростом и весом.
Связь между ростом (в метрах) и весом человека (в кг)
Процедура оценки связи (корреляции) между переменными двух типов 1. Находим среднее значение для каждого типа переменных и формируем новые переменные. Каждая новая переменная есть старая переменная минус среднее значений для переменных данного типа.
Нормированная связь «рост-вес» Ковариация сov (x, y)=199, 31
2. Вычисляем ковариацию переменных двух типов x и y: Можно видеть, что величина ковариации зависит от того, в каких единицах измеряются переменные.
Связь между ростом (в см) и весом человека (в г) cov(x, y) = 19931916
Связь между ростом (в километрах) и весом человека (в тоннах) cov(x, y)=0, 000199319
3. Вычисляем коэффициент связи между переменными, не зависящий от выбора шкал, в которых измеряют изучаемые переменные. Для этого делим величину ковариации на произведение стандартных отклонений для каждой из переменных. r - коэффициент корреляции
На практике коэффициент корреляции считают по формуле: Ковариации и корреляции между переменными при различном выборе единиц измерения Единицы cov(x, y) s(x) s(y) r(x, y) м/кг 199, 3192 0, 211682 21, 84657 0, 979 см/г 19931916 21, 168 21846, 57 0, 979 км/т 0, 000199 0, 000212 0, 021847 0, 979
Ковариация для независимых переменных cov(x, y)=-0, 3185 r(x, y)=-0, 1125
УСЛОВИЕ ОДНОРОДНОСТИ СВЯЗИ r(x, y)=0, 71
ОБЛАСТЬ ЗНАЧЕНИЙ КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ Если между двумя случайными величинами имеет место положительная линейная зависимость, то r=+1 Если между двумя случайными величинами имеет место отрицательная линейная зависимость, то r= -1
Если l |r| < 0, 3 – связь слабая; l 0, 3 ≤ |r| ≤ 0, 5 – связь умеренная; l 0, 5 ≤ |r| ≤ 0, 7 – связь значительная; l 0, 7 ≤ |r| ≤ 0, 9 – связь сильная; l |r| = 1 – связь функциональная. l Если связь отсутствует, то r = 0 ; l Обратное утверждение: если r = 0, то связь отсутствует - неверно
Оценки значимости коэффициента корреляции Значимость отличия коэффициента корреляции выборки от заданного значения коэффициента корреляции Нуль-гипотеза: коэффициент корреляции r выборки значимо не отличается от некоторого фиксированного значения r 0 Вычисление критериальной статистики
Значимость отличия коэффициента корреляции от нуля Для оценки используется t-критерий Нулевая гипотеза подтверждается, если
Значимость различия двух коэффициентов корреляции Критическая область : нижняя и верхняя границы р-процентных областей стандартного нормального распределения
R=0, 672 R=0, 965
Равенство нескольких коэффициентов корреляции
НЕМОНОТОННЫЕ СВЯЗИ МЕЖДУ ПЕРЕМЕННЫМИ Корреляция = 0, 00000000217
РЕКОМЕНДУЕМАЯ ЛИТЕРАТУРА: Основная литература: l Павлушков И. В. Основы высшей математики и математической статистики. М. , ГЭОТАР-Медиа, 2005, с. 289 -320. Учебно–методические пособия: l Шапиро Л. А. , Шилина Н. Г. Руководство к практическим занятиям по медицинской и биологической статистике Красноярск: ООО «Поликом» . – 2003.
РЕКОМЕНДУЕМАЯ ЛИТЕРАТУРА: l Обязательная: l Кричевец, А. Н. Математика для психологов /А. Н. Кричевец, Е. В. Шикин, А. Г. Дьячков. – М. : Флинта: НОУ ВПО «МПСИ» , 2010. – 376 с. l Наследов А. Д. Математические методы психологического исследования. Анализ и интерпретация данных/А. Д. Наследов. -СПб. : Речь, 2008. l Дополнительная: l Математика в примерах и задачах: учебное пособие /Л. Н. Журбенко, Г. А. Никонова, Н. В. Никонова и др. – М. : ИНФРА–М, 2011. – 373 с. l Болдин К. В. , Башлыков В. Н. , Рукосуев А. В. Высшая математика /К. В. Болдин К, В. Н. Башлыков, А. В. Рукосуев. – М. : Флинта, 2010 l Электронные ресурсы: l УБИЦ Крас. ГМУ Портал центра дистанционного образования Электронная библиотека l Ресурсы интернет
БЛАГОДАРЮ ЗА ВНИМАНИЕ!
7. Основы кор. анализа.ppt