aspir_Korel.ppt
- Количество слайдов: 16
Корреляционной анализ
1. Функциональная и стохастическая зависимости 2. Корреляция, корреляционное поле. Прямая и обратная корреляция 3. Парный и ранговый коэффициенты корреляции 4. Определение значимости коэффициента корреляции
В математике существуют два подхода к анализу тесноты связи Функциональная зависимость – такой вид связи между двумя признаками X и Y, при которой каждому значению одного из них соответствует одно и только одно значение другого. Например: ПС = ЧСС/V 1 м; S = V * t Стохастическая или вероятностная зависимость – такая форма связи, когда при фиксированном значении одной величины другая величина может принимать различные значения.
• Например, в функции у = 3 х каждому значению х соответствует одно, в три раза большее, значение y, что говорит о наличии функциональной зависимости • В функции у = х2 каждому значению у соответствует 2 определенных значения х, что указывает на наличие стохастической зависимости. у = 3 х у = х2
Корреляция (от латинского correlatio соотношение, связь) – зависимость между двумя случайными величинами X и Y, которая характеризуется специальными коэффициентами Корреляционный анализ состоит в определении связи между двумя случайными величинами Х и У, где в качестве меры связи используется коэффициент корреляции По своему характеру корреляция бывает прямая (положительная) и обратная (отрицательная). Прямая корреляция – с увеличением первого признака второй тоже увеличивается (соответственно, с уменьшением – уменьшается). Обратная корреляция – уменьшение второго признака с увеличением первого (и, наоборот, увеличение второго с уменьшением первого)
Графическая интерпретация – корреляционное поле • Если точки рассеяны хаотично, то связь между признаками отсутствует. • Если точки группируются вокруг какой-либо линии, то связь есть, и она тем теснее, чем ближе они группируются. • По направлению линии можно сделать вывод о том, положительная или отрицательная корреляция.
Для количественной оценки корреляционной зависимости применяют коэффициент корреляции.
ПАРНЫЙ КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ БРАВЕ - ПИРСОНА • Если 0 < rxy < =0, 39 – связь слабая. • Если 0, 4 <= rxy <= 0, 69 – связь средняя. • Если 0, 7 < =rxy < = 0, 99 – связь тесная • Если rxy = 0 – корреляция отсутствует. • Если rxy = 1 – связь функциональная. • Знак коэффициента корреляции указывает на направление связи ( «+» - связь прямая, «-» - обратная)
ПРИМЕР 4. 2. Оценить существует ли взаимосвязь между упражнением прыжок в высоту с места и результатом в толчке штанги для тяжелоатлетов (возраст – 12 лет, весовая категория – до 60 кг. ) Исходные данные: прыжок в высоту с места(см): 57, 60, 58, 61, 63, 68, 55, 64, 66, 61 толчок (кг): 107, 5 110 115 107, 5 120 112, 5 120, 110
Алгоритм решения • Методом средних величин находим средние арифметические признаков Х (прыжок) и Y (толчок): = 61 (см) и = 113 (кг) • Находим разности между средними арифметическими и отдельными значениями признаков (для Х и У отдельно), возводим эти разности в квадраты и находим соответствующие суммы для подстановки в формулу для расчета коэффициента rxy: = 177, 5 ( это сумма произведений разностей); = 134 ( это сумма квадратов разностей первого признака); = 311, 3 ( это сумма квадратов разностей второго признака).
• 3. Подставляем найденные суммы в формулу для расчета коэффициента и находим коэффициент корреляции rxy : • 4. Вывод: так коэффициент корреляции равен 0, 87, то связь между признаками сильная и прямая, т. е. результат в толчке у тяжелоатлетов зависит от специальных упражнений (прыжок в высоту с места).
РАНГОВЫЙ КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ СПИРМЕНА Применяется в том случае, когда значения признаков заданы в порядковой шкале (оценки судей в баллах, места на соревнованиях и пр. ) • где – это разности рангов i-й пары значений Xi и Yi, • n – объем выборки ( количество пар)
Ранговый коэффициент корреляции обладает теми же свойствами, что и парный Ранг – порядковый номер выборочного значения, если в выборке нет совпадающих значений Если же они есть, то ранг определяется как среднее арифметическое порядковых номеров совпадающих значений В данном методе присваивают ранги, начиная с лучшего результата
ПРИМЕР. Существует ли связь между результатами в прыжках в длину с места - xi (cм) и занятыми на соревнованиях местами – yi для гимнастов 11 -12 лет. № Xi Yi Rxi Ryi Di Di 2 1 175 5 10 5 5 25 2 176 7 9 7 2 4 3 179 8 8 8 0 0 4 180 9 7 9 -2 4 5 184 3 5 3 2 4 6 191 1 2 1 1 1 7 181 10 6 10 4 16 8 186 6 3 6 -3 9 9 192 4 1 4 -3 9 10 185 2 4 2 2 4 Алгоритм решения. • Находим ранги Rxi и Ryi значений Xi и Yi , (они приведены в столбцах 4 и 5 таблицы). • Вычисляем разности рангов Di = Rxi - Ryi( столбец 6). • Возводим разности в квадрат (столбец 7) и находим сумму : 76 • По формуле определяем ранговый коэффициент корреляции:
Вывод: полученный коэффициент корреляции свидетельствует об отсутствии статистически значимой корреляционной зависимости между результатами гимнастов 11 -12 лет в прыжках с места и местами, занятыми на соревнованиях.
Определение значимости коэффициента корреляции Для проверки значимости коэффициента корреляции, задаем значение доверительной вероятности, например Р=0, 95 (или уровень значимости р=0, 05), находим по таблице значение критического (граничного) значения критерия Стьюдента tкр и сравниваем его с расчетным значением tр , которое определяется по формуле Если tp > tkp, т. е. происходит маловероятное событие, предположение о некоррелированности признаков необоснованно и коэффициент корреляции считается значимым. Если же tp < tkp, коэффициент корреляции считается незначимым.


