Скачать презентацию КОРРЕЛЯЦИОННЫЙ АНАЛИЗ Выполнила студентка 5 курса педиатрического факультета Скачать презентацию КОРРЕЛЯЦИОННЫЙ АНАЛИЗ Выполнила студентка 5 курса педиатрического факультета

корреляционный анализ.pptx

  • Количество слайдов: 39

КОРРЕЛЯЦИОННЫЙ АНАЛИЗ Выполнила студентка 5 курса педиатрического факультета Левина А. А. КОРРЕЛЯЦИОННЫЙ АНАЛИЗ Выполнила студентка 5 курса педиатрического факультета Левина А. А.

КОРРЕЛЯ ЦИЯ (ОТЛАТ. CORRELATIO — СООТНОШЕНИЕ, ВЗАИМОСВЯЗЬ) Это согласованное изменение двух признаков, при котором КОРРЕЛЯ ЦИЯ (ОТЛАТ. CORRELATIO — СООТНОШЕНИЕ, ВЗАИМОСВЯЗЬ) Это согласованное изменение двух признаков, при котором изменчивость одного признака находится в соответствии с изменчивостью другого. Впервые в научный оборот термин «корреляция» ввёл французский палеонтолог Жорж Кювье в XVIII веке. Он разработал «закон корреляции» частей и органов живых существ, с помощью которого можно восстановить облик ископаемого животного, имея в распоряжении лишь часть его останков. В статистике слово «корреляция» первым стал использовать английский биолог и статистик Фрэнсис Гальтон в конце XIX века.

ТИПЫ СВЯЗИ При анализе результатов медицинских исследований часто возникает необходимость определения достоверности полученных данных. ТИПЫ СВЯЗИ При анализе результатов медицинских исследований часто возникает необходимость определения достоверности полученных данных. Известны два вида связи между явлениями (признаками): функциональная и корреляционная.

ФУНКЦИОНАЛЬНАЯ СВЯЗЬ Функциональная - когда любому значению одного из признаков соответствует точное значение другого ФУНКЦИОНАЛЬНАЯ СВЯЗЬ Функциональная - когда любому значению одного из признаков соответствует точное значение другого (определенному радиусу круга соответствует определенная площадь). Такая связь характерна для физикохимических явлений. В общем виде y = f(x), где y – зависимая переменная, или функция от независимой переменной x

КОРРЕЛЯЦИОННАЯ СВЯЗЬ Корреляционная - это вид проявления количественной связи между признаками. Она характерна для КОРРЕЛЯЦИОННАЯ СВЯЗЬ Корреляционная - это вид проявления количественной связи между признаками. Она характерна для медико-биологических и социально-гигиенических исследований. Возникает тогда, когда значению средней величины одного признака соответствуют несколько значений другого взаимосвязанного с ним признака (рост и масса, уровень гемоглобина и насыщенность крови кислородом). Корреляционную связь можно представить с помощью таблицы, графика.

НАПРАВЛЕННОСТЬ СВЯЗИ Для количественных, порядковых и дихотомических переменных используются понятия прямой и обратной связи. НАПРАВЛЕННОСТЬ СВЯЗИ Для количественных, порядковых и дихотомических переменных используются понятия прямой и обратной связи. Связь между количественными и/или порядковыми переменными является прямой, если значения двух переменных одновременно возрастают или убывают; обратной - если возрастание значений одной переменной сопровождается убыванием значений второй. Для дихотомических переменных связь является прямой, если измеряемые ими свойства объектов чаще встречаются или не встречаются одновременно, чем порознь; обратной - если соответствующие свойства чаще встречаются порознь.

ПРАКТИЧЕСКОЕ ЗНАЧЕНИЕ: -Для выявления причинно-следственных связей между факторными и результативными признаками (оценка физического развития, ПРАКТИЧЕСКОЕ ЗНАЧЕНИЕ: -Для выявления причинно-следственных связей между факторными и результативными признаками (оценка физического развития, определения связи между условиями труда и состоянием здоровья). -Зависимость параллельных изменений нескольких признаков от какой-то величины (при воздействии 1 факторного признака изменились значения нескольких результативных признаков).

КОРРЕЛЯЦИОННОЕ ПОЛЕ Представляет собой график, отображающий распределение значений Y и Х в виде точек КОРРЕЛЯЦИОННОЕ ПОЛЕ Представляет собой график, отображающий распределение значений Y и Х в виде точек с соответствующими абсциссами 0 х и ординатами 0 у. Разброс точек на графике визуально представляет тесноту(плотность) связи

КОРРЕЛЯЦИОННОЕ ПОЛЕ С МАЛОЙ ПЛОТНОСТЬЮ СВЯЗИ 12 10 8 6 Значения Y 4 2 КОРРЕЛЯЦИОННОЕ ПОЛЕ С МАЛОЙ ПЛОТНОСТЬЮ СВЯЗИ 12 10 8 6 Значения Y 4 2 0 0 2 4 6 8 Значения Х 10 12

КОРРЕЛЯЦИОННОЕ ПОЛЕ СИЛЬНОЙ ЛИНЕЙНОЙ ПРЯМОЙ СВЯЗИ 3. 5 3 2. 5 2 1. 5 КОРРЕЛЯЦИОННОЕ ПОЛЕ СИЛЬНОЙ ЛИНЕЙНОЙ ПРЯМОЙ СВЯЗИ 3. 5 3 2. 5 2 1. 5 Значения Y 1 0. 5 0 0 2 4 Значения Х 6 8

КОРРЕЛЯЦИОННОЕ ПОЛЕ С СИЛЬНОЙ ЛИНЕЙНОЙ ОБРАТНОЙ СВЯЗЬЮ 7 6 5 4 3 Значения Y КОРРЕЛЯЦИОННОЕ ПОЛЕ С СИЛЬНОЙ ЛИНЕЙНОЙ ОБРАТНОЙ СВЯЗЬЮ 7 6 5 4 3 Значения Y 2 1 0 0 2 4 Значения Х 6 8

КОРРЕЛЯЦИОННЫЙ АНАЛИЗ Корреляционный анализ — статистический метод анализа данных, предназначенный для исследования взаимозависимости выборок. КОРРЕЛЯЦИОННЫЙ АНАЛИЗ Корреляционный анализ — статистический метод анализа данных, предназначенный для исследования взаимозависимости выборок. Основной показатель — выборочный коэффициент корреляции. Корреляционный анализ является составной частью любого статистического исследования

ЦЕЛЬ КОРРЕЛЯЦИОННОГО АНАЛИЗА Обеспечить получение некоторой информации об одной переменной с помощью другой переменной. ЦЕЛЬ КОРРЕЛЯЦИОННОГО АНАЛИЗА Обеспечить получение некоторой информации об одной переменной с помощью другой переменной. В случаях, когда возможно достижение цели, говорят, что переменные коррелируют. В самом общем виде принятие гипотезы о наличии корреляции означает, что изменение значения переменной X, произойдет одновременно с пропорциональным изменением значения Y.

КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ Коэффициент корреляции измеряет силу и направление связи между двумя переменными. Обозначения: Выборочный КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ Коэффициент корреляции измеряет силу и направление связи между двумя переменными. Обозначения: Выборочный коэффициент корреляции Пирсона Коэффициент корреляции генеральной совокупности Спирмена ρ r

МЕТОДИЧЕСКИЕ ТРЕБОВАНИЯ К ИСПОЛЬЗОВАНИЮ КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ измерение связи возможно только в качественно однородных совокупностях МЕТОДИЧЕСКИЕ ТРЕБОВАНИЯ К ИСПОЛЬЗОВАНИЮ КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ измерение связи возможно только в качественно однородных совокупностях (например, измерение связи между ростом и весом в совокупностях, однородных по полу и возрасту) § расчет может производиться с использованием абсолютных или производных величин § для вычисления коэффициента корреляции используются не сгруппированные вариационные ряды (это требование применяется только при вычислении коэффициента корреляции по методу квадратов) §

ФОРМУЛА ДЛЯ ВЫЧИСЛЕНИЯ R Коэффициент корреляции вычисляется по формуле: Это, так называемый, коэффициент корреляции ФОРМУЛА ДЛЯ ВЫЧИСЛЕНИЯ R Коэффициент корреляции вычисляется по формуле: Это, так называемый, коэффициент корреляции Пирсона, равный произведению моментов. Он назван по имени статистика Карла Пирсона, который первый провел исследования в этой области.

ВТОРАЯ ФОРМУЛА ДЛЯ ВЫЧИСЛЕНИЯ R После несложных преобразований, из первой формулы можно получить другую ВТОРАЯ ФОРМУЛА ДЛЯ ВЫЧИСЛЕНИЯ R После несложных преобразований, из первой формулы можно получить другую формулу для коэффициента. Как мы увидим, она более пригодна для вычисления коэффициента при помощи таблиц.

ЗНАЧЕНИЯ КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ Коэффициент корреляции изменяется на отрезке от – 1 до+1. Если между ЗНАЧЕНИЯ КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ Коэффициент корреляции изменяется на отрезке от – 1 до+1. Если между переменными существует сильная положительная связь, то значение r будет близко к+1. Если между переменными существует сильная отрицательная связь, то значение r будет близко к – 1. Когда между переменными нет линейной связи или она очень слабая, значение r будет близко к 0.

ИНТЕРПРЕТАЦИЯ КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ ПО ШКАЛЕ ЧЕДДОКА: Значение r 0, 75 – 1. 00 0, ИНТЕРПРЕТАЦИЯ КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ ПО ШКАЛЕ ЧЕДДОКА: Значение r 0, 75 – 1. 00 0, 50 – 0. 74 0, 25 – 0. 49 0, 00 – 0. 24 0, 00 – -0. 24 -0, 25 – -0. 49 -0, 50 – -0. 74 -0, 75 – -1. 00 Уровень связи между переменными Очень высокая положительная Высокая положительная Средняя положительная Слабая отрицательная Средняя отрицательная Высокая отрицательная Очень высокая отрицательная

ПРИМЕР ВЫЧИСЛЕНИЯ Например, требуется определить зависимость числа ошибок ( х ), допускаемых операторами в ПРИМЕР ВЫЧИСЛЕНИЯ Например, требуется определить зависимость числа ошибок ( х ), допускаемых операторами в корректурных пробах, от длительности работы на компьютере ( у ).

РАСЧЕТ ЛИНЕЙНОЙ КОРРЕЛЯЦИИПИРСОНА (N = 10 ) РАСЧЕТ ЛИНЕЙНОЙ КОРРЕЛЯЦИИПИРСОНА (N = 10 )

СОГЛАСНО ФОРМУЛЕ, ПОЛУЧАЕМ: Как видно из полученного результата, между числом ошибок и длительностью работы СОГЛАСНО ФОРМУЛЕ, ПОЛУЧАЕМ: Как видно из полученного результата, между числом ошибок и длительностью работы есть прямая корреляционная связь средней силы. В данном случае, по всей вероятности, можно говорить о причинно-следственной связи между этими факторами. Вместе с тем, утверждать, что показатели утомляемости связаны только с длительностью работы нельзя.

КОЭФФИЦИЕНТ ДЕТЕРМИНАЦИИ ( 2) R С его помощью можно определить долю влияния анализируемого факторного КОЭФФИЦИЕНТ ДЕТЕРМИНАЦИИ ( 2) R С его помощью можно определить долю влияния анализируемого факторного признака на результативный признак. r 2 = 0, 412 =0, 17 r 2 показывает долю тех изменений, которые обусловлены анализируемым фактором, следовательно, доля влияния продолжительности рабочего дня на развитие усталости у операторов 17%

ОЦЕНКА ЗНАЧИМОСТИ КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ ОЦЕНКА ЗНАЧИМОСТИ КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ

ИНТЕРПРЕТАЦИЯ КРИТЕРИЯ ДОСТОВЕРНОСТИ Критерий достоверности Вероятность безошибочного прогноза t= 1 68% t<2 Менее 95% ИНТЕРПРЕТАЦИЯ КРИТЕРИЯ ДОСТОВЕРНОСТИ Критерий достоверности Вероятность безошибочного прогноза t= 1 68% t<2 Менее 95% t≥ 2 95% и более T≥ 3 99% и более Так критерий достоверности t < 2, то с вероятностью безошибочного прогноза менее 95% можно утверждать, что различия в средних значениях числа ошибок ( х ), допускаемых операторами в корректурных пробах, обусловлено длительностью работы на компьютере ( у )

МЕТОД РАНГОВОЙ КОРРЕЛЯЦИИ СПИРМЕНА § Метод ранговой корреляции Спирмена позволяет определить тесноту (силу) и МЕТОД РАНГОВОЙ КОРРЕЛЯЦИИ СПИРМЕНА § Метод ранговой корреляции Спирмена позволяет определить тесноту (силу) и направление корреляционной связи между двумя признаками или двумя профилями (иерархиями) признаков.

ОПИСАНИЕ МЕТОДА § § Для подсчета ранговой корреляции Спирмена необходимо располагать двумя рядами значений, ОПИСАНИЕ МЕТОДА § § Для подсчета ранговой корреляции Спирмена необходимо располагать двумя рядами значений, которые могут быть проранжированы. Такими рядами значений могут быть: два признака, измеренные в одной и той же группе испытуемых; две индивидуальные иерархии признаков, выявленные у двух испытуемых по одному и тому же набору признаков две групповые иерархии признаков; индивидуальная и групповая иерархии признаков. Вначале показатели ранжируются отдельно по каждому из признаков. Как правило, меньшему значению признака начисляется меньший ранг.

ОГРАНИЧЕНИЯ КОЭФФИЦИЕНТА РАНГОВОЙ КОРРЕЛЯЦИИ по каждой переменной должно быть представлено не менее 5 наблюдений; ОГРАНИЧЕНИЯ КОЭФФИЦИЕНТА РАНГОВОЙ КОРРЕЛЯЦИИ по каждой переменной должно быть представлено не менее 5 наблюдений; коэффициент ранговой корреляции Спирмена при большом количестве одинаковых рангов по одной или обеим сопоставляемым переменным дает огрубленные значения. В идеале оба коррелируемых ряда должны представлять собой две последовательности несовпадающих значений.

ЗАДАЧА - ЭТАЛОН Определить характер и размер связи между явлениями путем вычисления коэффициента ранговой ЗАДАЧА - ЭТАЛОН Определить характер и размер связи между явлениями путем вычисления коэффициента ранговой корреляции, оценить его достоверность и сделать соответствующие выводы.

РЕЗУЛЬТАТЫ ИЗУЧЕНИЯ ЗАВИСИМОСТИ МЕЖДУ СТАЖЕМ РАБОТЫ В ГОДАХ И ЧИСЛОМ ТРАВМ Стаж работы в РЕЗУЛЬТАТЫ ИЗУЧЕНИЯ ЗАВИСИМОСТИ МЕЖДУ СТАЖЕМ РАБОТЫ В ГОДАХ И ЧИСЛОМ ТРАВМ Стаж работы в годах Число травм До 1 года 24 1 -2 16 3 -4 12 5 -6 12 7 и более 6

РЕШЕНИЕ ЗАДАЧИ-ЭТАЛОНА: Каждый из рядов парных признаков обозначить через х ( стаж работы в РЕШЕНИЕ ЗАДАЧИ-ЭТАЛОНА: Каждый из рядов парных признаков обозначить через х ( стаж работы в годах) и через у ( число травм ). Величину варианта каждого из признаков заменить ранговым номером. Определить разность рангов d= ( х- у ) Разность рангов возвести в квадрат и получить сумму квадратов рангов.

ТАБЛИЦА ПОЛУЧЕННЫХ РЕЗУЛЬТАТОВ Стаж работы в годах Число травм Порядковые ранги Разность рангов х ТАБЛИЦА ПОЛУЧЕННЫХ РЕЗУЛЬТАТОВ Стаж работы в годах Число травм Порядковые ранги Разность рангов х у Квадрат разности рангов d До 1 года 24 1 5 -4 16 1 -2 16 2 4 -2 4 3 -4 12 3 2, 5 +0, 5 0, 25 5 -6 12 4 2, 5 +1, 5 2, 25 7 и более 6 5 1 +4 16

РЕШЕНИЕ: РЕШЕНИЕ:

РЕШЕНИЕ: РЕШЕНИЕ:

2 -Й СПОСОБ : По таблице 2 -Й СПОСОБ : По таблице "Стандартных коэффициентов корреляции": при числе степеней свободы (n - 2) = 5 - 2 = 3 наш расчетный коэффициент корреляции рху = - 0, 92 больше табличного 0, 878 и меньше 0, 933, что соответствует вероятности безошибочного прогноза больше 95% и меньше 98%. Это позволяет считать полученный коэффициент ранговой корреляции достоверным.

СТАНДАРТНЫЕ КОЭФФИЦИЕНТЫ КОРРЕЛЯЦИИ ПО КАМИНСКОМУ: СТАНДАРТНЫЕ КОЭФФИЦИЕНТЫ КОРРЕЛЯЦИИ ПО КАМИНСКОМУ:

ВЫВОД: С вероятностью безошибочного прогноза (р) больше 95% установлено, что чем больше стаж работы, ВЫВОД: С вероятностью безошибочного прогноза (р) больше 95% установлено, что чем больше стаж работы, тем меньше частота травм, связь обратная, сильная, достоверная корреляционная: рху = - 0, 92, p > 95%.

МНОЖЕСТВЕННАЯ КОРРЕЛЯЦИЯ Данный метод обычно применяется для характеристики совместного, совокупного влияния всего комплекса факторов МНОЖЕСТВЕННАЯ КОРРЕЛЯЦИЯ Данный метод обычно применяется для характеристики совместного, совокупного влияния всего комплекса факторов на результативный признак. Изменяется величина коэффициента множественной корреляции по абсолютному значению в таких же пределах ( от 0 до 1 ).

СПАСИБО ЗА ВНИМАНИЕ СПАСИБО ЗА ВНИМАНИЕ