Корреляционный анализ.ppt
- Количество слайдов: 22
Корреляционный анализ
Меры взаимосвязи: ковариация и коэффициент корреляции, свойства. Для многомерных случайных величин важнейшей числовой характеристикой является коэффициент корреляции, описывающий количественную связь между двумя случайными величинами. Пусть на вероятностном пространстве заданы две случайные величины (x, y) и l математические ожидания M(x) , M(y ) l Величина µxy= M [(x - M(x)) (y – M(y ))] называется ковариацией случайных величин x и. Другое обозначение для ковариации µxy = Cov (x, y ). l
l Введем величину l Величина н ρxy называется коэффициентом корреляции случайных величин 1 и 2. Она не имеет размерности и не зависит ни от математического ожидания, ни от дисперсии. Рассмотрим свойства коэффициента корреляции. ρxy Свойство 1. коэффициент корреляции удовлетворяет неравенству: | ρxy | 1 или -1 ρxy +1 Свойство 2. Коэффициент корреляции ρxy = 1 тогда и только тогда, когда x и y связаны линейной зависимостью. Свойство 3. Если x и y независимы , то ρxy =0. Свойство 4. Обратное неверно, т. е. у зависимых величин x и y может быть коэффициент корреляции ρxy =0. l l l
Понятие корреляционной взаимосвязи Понятие корреляции в принятом в статистике значении появилось почти в середине XIX века благодаря работам сэра Фрэнсиса Гальтона. l Ф. Гальтон применил для корреляции следующую форму записи: corelation — связь, соотношение. l Первоначально исследования корреляции проводились в области естественных наук, прежде всего в биологии. l Лишь позднее применение методов корреляционного анализа распространилось на экономику, психологию, социологию. l
l l Ковариация для выборочных данных имеет следующий вид: Коэффициент корреляции для выборки определяется по формуле:
Графическое изображение корреляционной зависимости
Диаграммы рассеяния для различных случаев корреляционной зависимости
Основы теории измерений l l l В основе применения математических методов в любой науке лежит измерение. Объектами измерения являются свойства изучаемых эмпирических объектов. Для психологии - это свойства системы психики или ее подсистем, таких как восприятие, память, направленность личности, способности и т. д. Измерение свойств объектов это приписывание объектам числовых значений, отражающих меру наличия свойства у данного объекта. Отметим три важнейших свойства психологических измерений. Во-первых, это существование целого семейства шкал, допускающих различные группы преобразований. Во-вторых, это наличие сильного влияния процедуры измерения на значение измеряемой величины. В-третьих, это многомерность измеряемых психологических величин, т. е. существенная их зависимость от большого числа параметров.
Измерение включает в себя: -объект измерения, некая физическая система; -свойство этой системы, которое поддаются наблюдению и сравнению; l -инструмент, посредством которого проводится операция измерения. l Результатом операции измерения является метрическое число, объединяющее в себе эти три элемента. Часто выделяют две компоненты: измерительное устройство и собственно измерение. l Под измерением обычно понимают присвоение числовых выражений объекту измерения или свойству. l l l
l l l Общая концепция измерения существенно использует понятие реляционной системы (системы с отношениями), введенной А. Тарским. Определим числовую реляционную систему как N =< N, RN >, где N -множество числовых объектов, RN - множество отношений, заданных на N. Эмпирической реляционной системой назовем E =< E, RE>, где E -множество числовых объектов, RE - множество отношений, заданных на E. Тогда измерением назовем = < E, N > В психологических измерениях используются различные классификации типов шкал. Обычно выделяют два типа шкал: концептуальные и материальные. Концептуальная шкала – шкала, которая характеризуется определенным упорядочением числовых значений (ценой деление шкалы). Например, шкала измерения времени, измерения каких-либо психических, свойств, черт личности. Материальная шкала определяется упорядоченным множеством знаковотметок на измерительном приборе. Например, шкала конкретного циферблата, шкала измерения конкретной методики.
l l l Классификации шкал ведут происхождение от системы Стивенса, который пытался основать свою систему шкальных типов на понятиях эмпирической операции и математической структуры. Стивенс различает четыре вида шкал: наименований, порядка, интервалов и отношений. Типы шкал обусловливаются видом функции f, осуществляющей допустимые преобразования = f( ) Если f - монотонная функция, то соответствующая шкала является шкалой порядка; если f - линейная функция, то соответствующая шкала является шкалой интервалов; если f определяет преобразование подобия, то соответствующая шкала является шкалой отношений .
Шкала наименований шкалой наименований называется шкала, основанная на любом приписывании чисел, играющих роль простых имен, классов. Основная эмпирическая операция, допустимая в этой шкале – «операция равенства» . Математическая структура этого типа шкалы определяется группой подстановок, т. е. f(x)-взаимнооднозные подстановки. Примеры измерения в это шкале: номера групп в институте, типы интеллекта (математический, пространственный, вербальный, регионы, типы личности по и др. l Частным случаем этой шкала является дихотомическая шкала наименований. Измерение в этой шкалы означает приписывание 1, если объект принадлежит классу и 0, если нет. Примерами этой шкалы является измерение пола, учится- не учится, ответы на вопросы типа «да-нет» l
Шкала порядка l Шкала порядка (ординальная шкала)- предполагает упорядочение объектов относительно какого-либо свойства. Определяется двумя эмпирическими операциями: «установление равенства» и «установление < , >» . Математическая структура характеризуется изотонической (сохраняющей порядок) группой подстановок. f(x)-монотонно возрастающая функция. Форма шкалы остается инвариантной относительно любого монотонного преобразования. Измерение в этой шкале означает упорядочение объектов по степени выраженности свойства. Примерами измерения в шкале порядка является данные, полученные с использование теста Люшера, ценностных ориентаций Рокича, оценночные шкалы и др.
Шкала интервалов l Шкала интервалов – требует установления единицы измерения и какого-либо начала. Допускается все арифметические операции. Основная эмпирическая операция «операция равенства или различия интервалов» . Равенство промежутков между шкальными значениями выражает равенство интервалов между двумя эмпирическими объектами, т. е. равным разностям свойства соответствуют равные разности числовых значений. Математическая структура – это линейная функция y=af(x)+b. Инвариантна относительно любого линейного преобразования, не изменяющего ее ориентацию. Примеры: большинство методик на измерение уровня интеллекта, личностные методики (опросники).
Шкалка отношений l Шкала отношений - шкала, которая отличается от шкалы интервалов наличием естественного нуля (т. е. b=0). Эмпирическая операция, допустимая для этого типа шкалы – «операция равенства отношений» . Все арифметические операции допустимы. Математическая структурагруппа подобия. При смене начала координат (абсолютного нуля) преобразуется в шкалу интервалов. Данные психологических исследований редко отвечают измерению в этой шкале. Примеры – исследования слуховых и зрительных порогов восприятия, некоторые психофизиологические показатели
x, y –измерены в шкале интервалов или в шкале отношений коэффициент корреляции Пирсона.
Обе переменные измеряются в шкалах порядка. Коэффициент ранговой корреляции Спирмена l xi и yi – ранги i–го объекта характеристик x и y
Обе переменные измеряются в дихотомических шкалах наименований: мера связи - коэффициент "фи", - коэффициент Гилфорда l x, y – дихотомическая шкала наименований, коэффициент сопряженности, . l l l где рx - доля людей, имеющих единицу по Х; qx - доля людей, имеющих нуль по Х, которая равна 1 - рx; рy -доля тех, кто имеет единицу по Y, qy = 1 – рy – доля людей, имеющих 0 по y рxy - доля людей, которые имеют единицу как по Х, так и по Y
Таблица сопряженности признаков l l l ----------------------------Признак Х ----------Итог 0 1 -----------------------------Признак У 1 a b a+b ----------------------0 c d c+d -----------------------------Итог a+c b+d n -----------------------------
Коэффициент сопряженности, коэффициент Гилфорда
Одна переменная измерена в дихотомической шкале, другая в шкале интервалов или отношений Точечно – бисериальный коэффициент корреляции. n-объем выборки l n 1 -число объектов для которых x=1 l n 0 -число объектов для которых x=0 l
Одна переменная измерена в дихотомической шкале, другая в шкале порядка. Рангово-бисериальных коэффициент корреляции. l - среднее значение ранга для объектов по y, для которых x=1 l - среднее значение ранга для объектов по y, для которых x=0


