корреляционный анализ.ppt
- Количество слайдов: 33
КОРРЕЛЯЦИОННЫЙ АНАЛИЗ
Исследователей часто интересует, как связаны между собой два показателя в данной группе лиц (классы, школы, трудовые коллективы и т. д. ). Например, связаны ли результаты контрольной работы по какомулибо предмету с уровнем тревожности или эффективность выполнения какой-либо задачи с силой мотивации.
Задачей корреляционного анализа является измерение тесноты или степени сопряженности между двумя или более (множественная корреляция) варьирующими признаками, а также к определению формы и направления существующей между ними связи.
Корреляционные связи не могут рассматриваться как свидетельство причинно - следственной связи, они свидетельствуют лишь о том, что изменениям одного признака, как правило, сопутствуют определенные изменения другого, но находится ли причина изменений в одном из признаков или она оказывается за пределами исследуемой пары признаков, нам не известно.
Связь между двумя стохастическими переменными можно выразить графически диаграммой рассеивания. В качестве примера рассмотрим оценки коэффициента интеллекта IQ 12 учащихся, определенные с помощью шкалы интеллекта Стенфорда-Бине в шестом классе, и успеваемость по химии, оцененная на основе теста, состоящего из 35 вопросов. Данные приведены в следующей таблице
Оценка IQ Оценка теста Стенфорда-Бине (X) N учащегося успеваемости по химии (Y) 1 120 31 2 112 25 3 110 19 4 120 24 5 103 17 6 126 28 7 113 18 8 114 20 9 106 16 10 108 15 11 128 27 12 109 19
На основе этой таблицы построена диаграмма рассеивания. На диаграмме рассеивания положение каждого ученика изображается точкой. Точка располагается в месте пересечения прямых линий, проведенных через оценку IQ перпендикулярно оси Х и через оценку теста по химии перпендикулярно оси Y для каждого ученика.
Корреляционные связи различаются по форме, направлению и степени (силе). По форме корреляционная связь может быть прямолинейной или криволинейной.
По направлению прямолинейная корреляционная связь может быть положительной (прямой) и отрицательной (обратной). При положительной корреляции более высоким значениям одного признака соответствуют более высокие значения другого, а более низким значениям одного признака - низкие значения другого. При отрицательной корреляции соотношения обратные.
Сила (теснота) корреляционной связи определяется по величине коэффициента корреляции, который обозначается символами r xy, ρ, rs. Коэффициент корреляции принимает значения в пределах от -1 до +1: -1 ≤ r ≤ 1.
Классификация корреляционных связей по их силе Используется две системы корреляционных связей по силе: общая и частная. Общая классификация корреляционных связей: 1) сильная или тесная при коэффициенте корреляции rxy ≥ 0, 7; 2) средняя при 0, 50 ≤ rxy < 0, 70; 3) умеренная при 0, 30 ≤ rxy < 0, 50; 4) слабая при 0, 20 ≤ rxy < 0, 30; 5) очень слабая при rxy < 0, 20.
Частная классификация корреляционных связей: 1) высокая значимая корреляция при r, соответствующем уровню статистической значимости Р ≤ 0, 001; 2) значимая корреляция при rxy, соответствующем уровню статистической значимости Р ≤ 0, 01; 3) достоверная связь при rxy, соответствующем уровню статистической значимости Р ≤ 0, 05; 4) незначимая корреляция при rxy, не достигающем уровня статистической значимости.
Две эти классификации не совпадают. Первая ориентирована только на величину коэффициента корреляции, а вторая определяет, какого уровня значимости достигает данная величина коэффициента корреляции при данном объеме выборки.
Если представить две переменные на координатном поле , то каждая пара значений будет отображать координаты точки в этом поле. Чем ближе точки к усредненной прямой, тем выше коэффициент корреляции (см. следующий рисунок )
Коэффициент корреляции будет положительным числом, когда при повышении X происходит повышение Y (прямая связь), отрицательным при обратной связи. На иллюстрации изображены различные по силе положительные коэффициенты корреляции. На следующей иллюстрации видны специально сгенерированные формы зависимостей и коэффициенты корреляции для них.
Линейный коэффициент корреляции Пирсона
Ограничения критерия: 1. Измерение признаков в интервальной шкале или шкале равных отношений. 2. Нормальное распределение признаков.
Алгоритм вычисления: 1. Проверить, является ли распределение признаков нормальным. 2. Вычислить средние значения величин X и. Y 3. Вычислить стандартные отклонения. 4. Вычислить эмпирическое значение rxyэмп
5. Для заданного n в таблице найти r xyкр 6. Если rxyэмп≥ rxy кр, связь статистически значима
Коэффициент ранговой корреляции Спирмена Метод ранговой корреляции Спирмена позволяет определить тесноту (силу) и направление корреляционной связи между двумя признаками или двумя профилями (иерархиями) признаков. Для подсчета ранговой корреляции необходимо располагать двумя рядами значений, которые могут быть проранжированы. Такими рядами значений могут быть:
1) два признака, измеренные в одной и той же группе испытуемых; 2) две индивидуальные иерархии признаков, выявленные у двух испытуемых по одному и тому же набору признаков; 3) две групповые иерархии признаков, 4) индивидуальная и групповая иерархии признаков.
Ограничения коэффициента ранговой корреляции 1. По каждой переменной должно быть представлено не менее 5 наблюдений. Верхняя граница выборки определяется имеющимися таблицами критических значений.
2. Коэффициент ранговой корреляции Спирмена rs при большом количестве одинаковых рангов по одной или обеим сопоставляемым переменным дает огрубленные значения. В идеале оба коррелируемых ряда должны представлять собой две последовательности несовпадающих значений. В случае, если это условие не соблюдается, необходимо вносить поправку на одинаковые ранги.
Коэффициент ранговой корреляции Спирмена подсчитывается по формуле:
где d - разность между рангами сопряженных значений признаков X и Y; n - количество ранжируемых значений (количество испытуемых).
Спасибо за внимание!


