
кореляция регрес анализ.pptx
- Количество слайдов: 16
СЕМИНАР КОРРЕЛЯЦИОННЫЙ АНАЛИЗ РЕГРЕССИОННЫЙ АНАЛИЗ
Пример: Определить существует ли связь между результатами в беге на 30 м и на 100 м для школьников n = 10 Задача 4. 1 n xi(30 м) Yi(100 м) xi 2 yi 2 xi*yi 1 4, 6 12, 4 21, 16 153, 76 57, 04 2 4, 6 12, 7 21, 16 161, 29 58, 42 3 4, 7 13, 0 22, 09 169 61, 10 4 4, 8 13, 3 23, 04 176, 89 63, 84 5 4, 8 13, 1 23, 04 171, 61 62, 88 6 4, 8 13, 2 23, 04 174, 24 63, 36 7 4, 9 13, 5 24, 01 182, 25 66, 15 8 4, 9 13, 5 24, 01 182, 25 66, 15 9 4, 9 13, 6 24, 01 184, 96 66, 64 10 5 13, 7 25, 01 187, 69 68, 50 ∑ 48 132 230. 56 1743, 94 634. 08
Используем преобразованную формулу rэкс=0, 97 Констатируем сильную положительную степень связи (Помним что корреляционный интервал от [-1 до +1] rэкс=0, 97 то число положительное говорит что связь положительная, и то число приближено к единице говорит что связь очень сильна, практически функциональная )
Построим корреляционный график Рисунок 1 корреляционное поле х-бег 30 м у - бег 100 м 14. 4 13. 9 13. 4 12. 9 12. 4 11. 9 11. 4 4. 5 4. 6 4. 7 4. 8 4. 9 5. 0 5. 1 Корреляционное поле похоже на эллипс - соответственно связь линейная. Точки стремятся к линии значит имеем сильную статистическую связь. Линяя восходящая – связь положительная.
В некоторых случаях тесноту взаимосвязи определяют на основании коэффициента детерминации D, который вычисляется по формуле: Этот коэффициент определяет часть общей вариации одного показателя, которая объясняется вариацией другого показателя. Например, коэффициент корреляции r = 0, 97 (между результатами в беге на 30 м с ходу и беге на 100 м). Коэффициент детерминации равен: D=(0, 97)2*100%=94% 94 % рассеяния спортивного результата в беге на 100 м объясняется изменением результатов в беге на 30 м
Коэффициент Спирмена 1. Записываем рады значений х и у. Присваиваем им ранги отдельно по каждому параметру. 2. Находим разницу соответствующих параметров Rdi = rx-ry 3. Подставляем в формулу Спирмена 4. Для того что бы проверить значимость коэффициента, его нужно сравнить с табличным значением. Если |rs|>rкр =>критерий значимо отличается от 0
Заметим, что при равных показателях у нескольких участников им присваивается один общий ранг, равный среднему арифметическому соответствующих возможных мест. При наличии одинаковых рангов рассчитываются поправки: где a, b – объем каждой группы одинаковых рангов в ранговых рядах А и В; и в этом случае коэффициент ранговой корреляции Спирмена рассчитывается по формуле
пример: Рассчитаем корреляцию по Спирмену для задачи 4. 1. Присваиваем ранги последовательностям Х и У. Получаем две последовательности с повторяющимися рангами 4, 6 1, 5 12, 4 1, 5 12, 7 бег 30 м ранг 30 м бег 100 м ранг 100 м 4, 7 4, 8 4, 9 5 13, 3 5 13, 1 5 13, 2 8 13, 5 8 13, 6 10 13, 7 3 1 2 3 6 4 5 7, 5 9 10 Rd 0, 5 -0, 5 0 -1 1 0 0, 5 -1 0 Rd 2 0, 25 0 1 1 0 0, 25 1 0 4 Находим разницу рангов Rd, возводим их в квадрат Rd 2 находим их сумму Rd 2 Высчитываем поправку по формуле Та=Тb=(а-1)*а*(а+1) Ранг 1, 5 повторяется 2 раза Ta=(2 -1)*2*(2+1)/12=0, 5 ранг 5 повторяется 3 р Ta=(3 -1)*3*(3+1)/12=2 ранг 8 повторяется 3 р Ta=(3 -1)*3*(3+1)/12=2 Во второй последовательности ранг 7, 5 повторяется 2 раза, соответственно Тb=(2 -1)*2*(2+1)/12=0, 5
Формула Спирмена Подставляем в формулу Наблюдаем сильную положительную связь. Проверяем на значимость коэффициента: коэффициент значимо отличается от 0
Регрессионный анализ - ПОКАЗЫВАЕТ КАК МОЖНО ПРЕДСКАЗАТЬ ПОВЕДЕНИЕ ОДНОЙ ИЗ ДВУХ ГРУПП ПЕРЕМЕННЫХ ИЛИ УПРАВЛЯТЬ ЕЮ С ПОМОЩЬЮ ДРУГОЙ Регрессия – зависимость среднего значения х от величины у.
Уравнение регрессии – конечный результат регрессионного анализа. Простая форма линейной взаимосвязи у=b 0+b 1 x где b является начальной ординатой и дает значение y при х=0 является коэффициентом регрессии. Показывает на сколько в среднем изменится величина у если х изменится на единицу. где b 1 – среднее значение переменной У b 0 – угловой коэффициент линии регрессии(показывает на сколько в среднем изменяется величина (у) при изменении величины (х)
Составим уравнение регрессии для задачи 4. 1 На основании графика 1 делаем вывод о линейной зависимости. Формула лин. зав. у=b 0+b 1 x 1. Рассчитываем среднее арифметическое Х и У. Х=4, 8 У=13, 2 2. Находим b 1 Для этого находим интересующие нас единицы 4, 6 4, 7 4, 8 бег 30 м(х) бег 100 м(у) 12, 4 12, 7 13 13, 1 4, 8 4, 9 5 48 13, 2 13, 5 13, 6 13, 7 132 х*у 57, 04 58, 42 61, 1 63, 84 62, 88 63, 36 66, 15 66, 64 68, 5 634, 08 х2 21, 16 22, 09 23, 04 24, 01 25 230, 56 Подставляем значения Находим b 0 Подставляем
Итак все неизвестные для уравнения прямой известны, теперь мы можем спрогнозировать результаты при одной неизвестной переменной. Допустим мы хотим узнать какие результаты наши подопытные покажут в беге на 100 м. ( у) если х в беге на 30 м будет =4, 5 с. Подставляем в уравнение: у=b 0+b 1* х у=(-1. 2)+3*4, 5=12, 3 с. Итак при улучшении среднего времени пробегания дистанции на 30 м до 4, 5 с, время пробегания 100 м улучшиться до 12. 3 с.
Ну и рассмотрим пример когда при известном значении у нам нужно спрогнозировать значение х Тогда действуем по формуле х = (у –b 0)/b Если у = 14. 0 то х = (14 -(-1, 2))/3=5 с.
Удобным и наглядным способом представления информации при наличии более двух переменных служат корреляционные матрицы. Пример : Покажем это на следующем примере. По результатам соревнований три арбитра оценили мастерство 10 фигуристов, получивших три последовательности рангов: Найдём двух арбитров, оценки которых наиболее согласуются, и построим матрицу ранговой корреляции Спирмена. ранг орбитра А Ранг арбитра В Ранг арбитра С 1 2 3 4 5 6 7 8 9 10 3 10 6 2 8 5 7 9 1 4 6 3 1 2 9 4 5 7 10 8
Представим полученный результат в виде матрицы ранговой корреляции Спирмена, которая выглядит следующим образом Из корреляционной матрицы видно, что коэффициент r 1, 3 = 0, 61 является максимальным и, следовательно, оценки арбитров А и С наиболее согласуются.