Скачать презентацию Корреляционный анализ Методы корреляционного анализа получившие свое Скачать презентацию Корреляционный анализ Методы корреляционного анализа получившие свое

лекция 9 корреляция.pptx

  • Количество слайдов: 26

Корреляционный анализ Корреляционный анализ

Методы корреляционного анализа, получившие свое название благодаря тому, что основываются на «со-отношении» ( «corelation» Методы корреляционного анализа, получившие свое название благодаря тому, что основываются на «со-отношении» ( «corelation» ) переменных, представляют собой статистические методы, начало которым было положено в работах Карла Пирсона примерно в конце XIX в. Они тесно связаны с понятием регрессии, еще раньше сформулированным Фрэнсисом Гальтоном

Символ «r» (первая буква слова regression) исторически закрепился в качестве маркера корреляционных методов. Существуют Символ «r» (первая буква слова regression) исторически закрепился в качестве маркера корреляционных методов. Существуют два вида связей между двумя переменными: функциональные и статистические. При функциональных связях каждому значению одной переменной соответствует только одно значение другой переменной

Однако, даже существующая в реальности функциональная связь между переменными (рост и вес) выступает эмпирически Однако, даже существующая в реальности функциональная связь между переменными (рост и вес) выступает эмпирически как вероятностная (стохастическая) - статистическая.

Особенностью статистических связей является то, что каждому значению одной переменной может соответствовать множество значений Особенностью статистических связей является то, что каждому значению одной переменной может соответствовать множество значений другой переменной. Такие связи имеют еще одно название – корреляционные, а мера таких связей – коэффициент корреляции. В психологии как и во многих других науках, при изучении взаимосвязи признаков из поля зрения исследователя неизбежно выпадает множество возможных причин изменчивости признаков.

Итак, в психологии функциональная взаимосвязь явлений эмпирически может быть выявлена только как вероятностная связь. Итак, в психологии функциональная взаимосвязь явлений эмпирически может быть выявлена только как вероятностная связь. Наглядное представление о характере вероятностной связи дает диаграмма рассеивания – график которого соответствуют значениям переменной, а каждый испытуемый представляет собой точку.

Корреляционный анализ – это проверка гипотез о связях между переменными с использованием коэффициентов корреляции. Корреляционный анализ – это проверка гипотез о связях между переменными с использованием коэффициентов корреляции. Коэффициент корреляции – это мера прямой или обратной пропорциональности между двумя переменными. Он чувствителен к связи только в том случае, если связь является монотонной, то есть не меняет направления по мере увеличения значений одной из переменных.

Основные показатели коэффициента корреляции: Сила, направление, надежность (достоверность) связи. • Сила корреляции определяется по Основные показатели коэффициента корреляции: Сила, направление, надежность (достоверность) связи. • Сила корреляции определяется по абсолютной величине корреляции (от 0 до 1) • Направление корреляции определяется по знаку: «+» - связь прямая; «-» - связь обратная. • Надежность связи определяется p-уровнем статистической значимости (чем меньше р-уровень, тем выше статистическая значимость, достоверность связи).

Условия применения коэффициентов корреляции: • Переменные измерены в количественной шкале (ранговой, метрической шкале) на Условия применения коэффициентов корреляции: • Переменные измерены в количественной шкале (ранговой, метрической шкале) на одной и той же выборке испытуемых. • Связь между переменными является монотонной (не меняет своего направления)

Основная проверяемая статистическая гипотеза в отношении КК является ненаправленной и содержит утверждение о равенстве Основная проверяемая статистическая гипотеза в отношении КК является ненаправленной и содержит утверждение о равенстве корреляции нулю в генеральной совокупности: H 0: rxy=0 При ее отклонении принимается альтернативная гипотеза: H 1: rxy 0 - о наличии положительной или отрицательной корреляции между переменными в зависимости от знака.

Содержательные выводы: • если по результатам статистической проверки H 0: rxy=0 не отклоняется на Содержательные выводы: • если по результатам статистической проверки H 0: rxy=0 не отклоняется на уровне то делается вывод: связь между переменными не обнаружена; • если H 0: rxy=0 отклоняется на уровне то вывод: обнаружена положительная (отрицательная) связь между x и y.

Что влияет на р-уровень значимости корреляции? Статистическая значимость КК тем выше (руровень меньше), чем Что влияет на р-уровень значимости корреляции? Статистическая значимость КК тем выше (руровень меньше), чем больше его абсолютная величина (при одном и том же объеме выборки), и чем больше объем выборки (при одном и том же значении корреляции). При большой численности выборки (порядка 100 и больше) даже слабые вязи могут достигать статистической значимости.

Примерная интерпретация коэффициентов корреляции: r 0. 3 – слабая связь 0. 3<r 0. 7 Примерная интерпретация коэффициентов корреляции: r 0. 3 – слабая связь 0. 30, 7 – сильная связь.

Величина корреляции не всегда отражает силу связи. Наиболее распространенные причины – выбросы, ложные корреляции, Величина корреляции не всегда отражает силу связи. Наиболее распространенные причины – выбросы, ложные корреляции, нелинейные связи. Выбросы - это нетипичные или редкие значения, которые существенно отклоняются от распределения остальных выборочных данных. Эти данные могут отражать истинные свойства изучаемого явления (переменной), а могут быть связаны с ошибками измерения или аномальными явлениями, и поэтому не должны включаться в модель.

Выбросы могут не только искусственно увеличить коэффициент корреляции, но могут также и уменьшить степень Выбросы могут не только искусственно увеличить коэффициент корреляции, но могут также и уменьшить степень "реальной" зависимости. На второй и третьей диаграмме удалили 2 и 4 точки

Количественный подход к выбросам. Некоторые исследователи применяют численные методы удаления выбросов. Например, исключаются значения, Количественный подход к выбросам. Некоторые исследователи применяют численные методы удаления выбросов. Например, исключаются значения, которые выходят за границы ± 2 стандартных отклонений (и даже ± 1. 5 стандартных отклонений) вокруг выборочного среднего. В ряде случаев такая "чистка" данных абсолютно необходима. Например, при изучении реакции в когнитивной психологии, даже если почти все значения экспериментальных данных лежат в диапазоне 300 -700 миллисекунд, то несколько "странных времен реакции" 10 -15 секунд совершенно меняют общую картину. К сожалению, в общем случае, определение выбросов субъективно, и решение должно приниматься индивидуально в каждом эксперименте (с учетом особенностей эксперимента или "сложившейся практики" в данной области).

Корреляции в неоднородных группах. Отсутствие однородности в выборке также является фактором, смещающим (в ту Корреляции в неоднородных группах. Отсутствие однородности в выборке также является фактором, смещающим (в ту или иную сторону) выборочную корреляцию. Представьте ситуацию, когда коэффициент корреляции вычислен по данным, которые поступили из двух различных экспериментальных групп, что, однако, было проигнорировано при вычислениях. Далее, пусть действия экспериментатора в одной из групп увеличивают значения обеих коррелированных величин, и , таким образом, данные каждой группы сильно различаются на диаграмме рассеяния (как показано ниже на графике).

В подобных ситуациях высокая корреляция может быть следствием разбиения данных на две группы, а В подобных ситуациях высокая корреляция может быть следствием разбиения данных на две группы, а вовсе не отражать "истинную" зависимость между двумя переменными, которая может практически отсутствовать (это можно заметить, взглянув на каждую группу отдельно, см. следующий график).

Если вы допускаете такое явление и знаете, как определить Если вы допускаете такое явление и знаете, как определить "подмножества" данных, попытайтесь вычислить корреляции отдельно для каждого множества.

Нелинейные зависимости между переменными. Другим возможным источником трудностей, связанным с линейной корреляцией Пирсона r, Нелинейные зависимости между переменными. Другим возможным источником трудностей, связанным с линейной корреляцией Пирсона r, является форма зависимости. Корреляция Пирсона r хорошо подходит для описания линейной зависимости. Отклонения от линейности увеличивают общую сумму квадратов расстояний от регрессионной прямой, даже если она представляет "истинные" и очень тесные связи между переменными. Итак, еще одной причиной, вызывающей необходимость рассмотрения диаграммы рассеяния для каждого коэффициента корреляции, является нелинейность.

Например, следующий график показывает сильную корреляцию между двумя переменными, которую невозможно хорошо описать с Например, следующий график показывает сильную корреляцию между двумя переменными, которую невозможно хорошо описать с помощью линейной функции.

Особенности интерпретации коэффициента корреляции В отношении коэффициента корреляции рядом авторов часто употребляется понятие зависимости Особенности интерпретации коэффициента корреляции В отношении коэффициента корреляции рядом авторов часто употребляется понятие зависимости между переменными. В действительности, говоря о корреляции можно говорить лишь о статистической связи. Например, если обнаруживается положительная корреляция между успехами учеников по математике и английскому языку, то из этого не следует, что оценки по одному предмету зависят от оценок по другому, так как они выставляются независимо друг от друга. Скорее всего, за всеми этими оценками стоят факторы интеллекта и мотивации, проявлениями которых и являются успехи по учебным предметам. Также неправомерно, в таких случаях, говорить о причинной связи между двумя переменными, если коэффициент корреляции оказывается высоким.

Статистические методы не могут заменить собой логику и здравый смысл, и констатация причинной связи Статистические методы не могут заменить собой логику и здравый смысл, и констатация причинной связи или зависимости на основе вычислений коэффициента корреляции лежит исключительно на совести исследователя. При интерпретации нулевого значения коэффициента корреляции необходимо учитывать, что ноль не всегда означает отсутствие связи. Если связь между переменными носит нелинейный характер и на графике отображается кривой, то коэффициент корреляции получится близким или равным нулю несмотря на очевидный характер связи. Действительное отсутствие связи на графике будет отображаться множеством рассеянных точек (на диаграмме ниже рисунок В).

Сфера применения коэффициента корреляции. Использование коэффициентов корреляции в психологических исследованиях насчитывает уже почти столетнюю Сфера применения коэффициента корреляции. Использование коэффициентов корреляции в психологических исследованиях насчитывает уже почти столетнюю историю, и в основном они применяются в следующих случаях: 1. Для проверки гипотезы о связи различных явлений и переменных: социальных и социально-психологических, социально-психологических и психологических, психических и психофизиологических, психофизиологических и физиологических. Результаты таких исследований помогают составить системную картину психических явлений и явлений окружающего мира. 2. В психодиагностике для определения надежности и валидности теста, при создании и адаптации психологических методик. 3. В методе репертуарных решеток Келли для определения связей между конструктами индивидуального сознания. 4. В факторном анализе – методе исследования латентной структуры сложных психологических явлений и переменных, таких как интеллект, личность и т. д.

Виды коэффициентов корреляции. Соотношения типов шкал и соответствующих им коэффициентов корреляции Типы Шкал Наименований Виды коэффициентов корреляции. Соотношения типов шкал и соответствующих им коэффициентов корреляции Типы Шкал Наименований Коэфф. ассо-циации, 4 -х- польный к. а. Порядка Рангово-бисериальный к. к. Интервалов Точечно-бисериальный к. к. Отношений Точечно-бисериальный к. к. Порядка Рангово-бисериальный к. к. r-Спирмена t-Кендалла Интервалов Точечно-бисериальный к. к. r-Пирсона с учетом знака r-Пирсона Отношений Точечно-бисериальный к. к. r-Пирсона с учетом знака r-Пирсона с учетом знака