8 Основы регр анализа.ppt
- Количество слайдов: 30
Основы корреляционного и регрессионного анализа
План лекции: 1. Способы изучения корреляционных зависимостей. 2. Определение коэффициента парной линейной корреляции. 3. Этапы регрессионного анализа 4. Уравнение регрессии 5. Метод наименьших квадратов 6. Оценка качества уравнения регрессии
ВИДЫ ЗАВИСИМОСТЕЙ Функциональная Корреляционная При функциональных зависимостях каждому значению одной переменной величины соответствует одно вполне определенное значение другой переменной (функции). Корреляционные (статистические) связи характеризуются тем, что численному значению одной переменной соответствует много значений (распределение) другой переменной.
Изучение корреляционных зависимостей l Табличный метод а) для небольшого количества измерений, не сгруппированных в классы № 1 2 3 4 5 6 7 8 9 Х (рост) 158 161 166 170 174 178 166 174 170 у(вес) 59 60 61 65 70 69 63 65 67
l Табличный метод б) для большого количества измерений х у 70 75 80 85 90 18 5 7 22 46 29 26 1 72 29 30 8 3
l Графический метод У У r=0 Х l Аналитический метод ( в виде математической формулы) r=+0, 5 Х
ЗАДАЧИ КОРРЕЛЯЦИОННОГО АНАЛИЗА l Определение тесноты (степени сопряженности) между варьируемыми признаками l Определение формы и направления связи КОРРЕЛЯЦИЯ бывает: положительной (прямой) и отрицательной (обратной) По форме – линейной и нелинейной.
Нахождение коэффициента корреляции ковариация для выборки из n опытов
коэффициент корреляции так как и то На практике коэффициент корреляции считают по формуле:
Коэффициент корреляции является безразмерной характеристикой, которая используется в качестве меры линейной зависимости случайных величин. Одним из подходов к интерпретации корреляции является вычисление доли объясняемой дисперсии, т. е. доли вариабельности одного признака, зависящего от вариабельности второго признака. Эта мера вычисляется по формуле: r 2 100 (%). Если l r < 0, 3 – связь слабая; l 0, 3 ≤ r ≤ 0, 75 – связь умеренная; l 0, 75 ≤ r < 1 – связь сильная; l r = 0 – связь отсутствует; l r = 1 – связь функциональная.
Пример: Определить наличие связи между величиной годовой прибыли (Y) и затратами на функционирование (Х) аптеки за 5 лет. Оценить достоверность полученных результатов. X 6 3 7 5 10 Y 33 22 32 28 42
График зависимости годовой прибыли от затрат аптеки
N 1 2 3 4 5 Σ Xi 3 5 6 7 10 31 B 961 Yi 22 28 33 32 42 157 C 24649 Xi Yi 66 140 198 224 420 1048 A (Xi)2 9 25 36 49 100 219 D (Yi)2 484 784 1089 1024 1769 5145 E
r > 0, 9 – связь сильная r 2=96% Полученный коэффициент корреляции является выборочным, поэтому он имеет свою ошибку – “ошибку” выборочности. Эта ошибка является мерой расхождения между коэффициентом корреляции выборки (r) и коэффициентом корреляции генеральной совокупности (обозначим его ). Согласно нулевой гипотезе предполагается, что в генеральной совокупности нет связи между варьирующими признаками ( =0). Тогда критерий нормированного отклонения:
Для малых выборок (n<30) ошибку коэффициента корреляции sr можно определить по формуле: где n-число пар измерений t 0. 95; 3=3, 18 tэксп > tтабл нулевая гипотеза отвергается, связь достоверна, т. е. с увеличением затрат увеличивается и годовая прибыль аптеки.
КОРРЕЛЯЦИЯ РАНГОВ rp - коэффициент Спирмена для непараметрических показателей. d=xρ- yρ ; n – объем выборки. Коэффициент достоверности (для числа пар рангов больше 9):
Р n=5 n=6 n=7 n=8 0, 95 1 0, 89 0, 75 0, 71 1 0, 84 0, 86 0, 99 n≥ 9 0, 999 Вывод: с вероятностью большей 0, 95 можно сказать, что между окрасом лис и их агрессивностью существует прямая положительная связь
Этапы регрессионного анализа l Метод регрессии позволяет установить, как количественно меняется один признак при изменении другого на единицу. Этапы регрессионного анализа: l выбор формы зависимости (типа уравнения); l вычисление коэффициентов выбранного уравнения; l оценка достоверности полученного уравнения.
Уравнение регрессии l Уравнением регрессии у по х называется уравнение вида = f(х), устанавливающее зависимость между значениями независимой переменной х и условными средними зависимой переменной. l Для линейной регрессии зависимость между х и у выражается уравнением: у = а + bx, где b характеризует скорость изменения зависимой переменной у при изменении переменной х (b=tg ); a – начальная ордината, определяет значение у при х = 0.
График линейной зависимости у У=а+bх φ а х Коэффициент b называется коэффициентом линейной регрессии
МЕТОД НАИМЕНЬШИХ КВАДРАТОВ где уi – экспериментальные точки; у(хi) – зависимость у(хi)=а+bхi
Для определения коэффициентов а и b необходимо решить систему линейных уравнений: Решение этой системы:
ПРИМЕР: В 100 частях воды растворяется следующее число условных частей азотнокислого натрия Na. NO 3 (у) при соответствующих температурах (х). Na. NO 3 (y) Tº (x) 5 7 7 8 6 1 0 4 1 1 0 5 8 6 2 1
Зависимость содержания Na. NO 3 от Tº Эмпирическая кривая регрессии
Расчет коэффициентов уравнения регрессии xi 0 4 10 15 21 50 A yi 56 71 76 81 86 yi xi 0 284 760 1215 1806 0 16 100 225 441 370 B 4065 C 782 D
Коэффициенты регрессии: Уравнение регрессии: Y=61, 1+1, 29*X
Построим теоретическую линию регрессии: при х=0, y=61, 1+1, 29*0=61, 1 при х=10, y=61, 1+1, 29*10=74
Уравнение регрессии позволяет вычислять теоретические (вероятные) значения зависимой переменной по заданным значениям независимых переменных в области их изменения. Как правило, оно применяется только внутри этой области. Рассчитаем содержание Na. NO 3 при Т=18º С Y=61, 1+1, 29*18=84, 4
l Так как уравнение регрессии определялось нами на основе выборочной совокупности, оно может в той или иной мере представлять уравнение истинной регрессии в генеральной совокупности. l Коэффициенты а и b, как и другие статистические параметры, имеют ошибки выборочности. Поэтому необходимо доказать статистическую значимость полученных коэффициентов регрессии или уравнения регрессии.
РЕКОМЕНДУЕМАЯ ЛИТЕРАТУРА: Основная литература: l Павлушков И. В. Основы высшей математики и математической статистики. М. , ГЭОТАР-Медиа, 2005, с. 289 -320. Учебно–методические пособия: l Шапиро Л. А. , Шилина Н. Г. Руководство к практическим занятиям по медицинской и биологической статистике Красноярск: ООО «Поликом» . – 2003.


