КОРРЕЛЯЦИОННО- РЕГРЕССИОННЫЙ АНАЛИЗ n взаимосвязанные показатели n часто


















КОРРЕЛЯЦИОННО-РЕГРЕССИОННЫЙ АНАЛИЗ.ppt
- Количество слайдов: 18
КОРРЕЛЯЦИОННО- РЕГРЕССИОННЫЙ АНАЛИЗ n взаимосвязанные показатели n часто связь усложняется наслоением действием других причин (факторов) n Изучить, насколько изменение одного показателя зависит от изменения другого (или нескольких), - одна из важнейших задач Статистики
функциональные и корреляционные n каждому значению n одному значению одного переменной (х) строго может соответствует соответствовать определенное множество значение другого значений другой переменной (у)
n Наиболее простым случаем корреляционной зависимости является парная корреляция, т. е. зависимость между двумя признаками (результативным и одним из факторных).
Основными задачами при изучении корреляционных зависимостей являются: 1) отыскание формы связи в виде математической формулы, выражающей эту зависимость у от х; 2) измерение тесноты такой зависимости
Возможны различные формы связи: прямолинейная: криволинейная в виде: а) параболы второго порядка (или высших порядков); б) гиперболы в) показательной функции
метод наименьших квадратов (МНК)
Линейный коэффициент корреляции можно выразить формулами:
Оценка значимости (существенности) n линейного коэффициента корреляций основана на сопоставлении значения r с его средней квадратической ошибкой (σr).
Средняя ошибка коэффициента корреляции при п > 50 рассчитывается приближенно по формуле
n Если при этом коэффициент корреляции r превышает свою среднюю ошибку σr больше чем в 3 раза, т. е. если то он считается Значимым, а связь реальной.
n При n< 30 значимость коэффициента корреляции проверяется на основе критерия Стьюдента. Для этого рассчитывается фактическое (расчетное) значение критерия
n Если tфакт>tтабл коэффициент корреляции r считается значимым, а связь — реальной. n Если tфакт
ИТАК: На первом шаге регрессионного анализа идентифицируют переменные , от которых зависит , т. е. определяют те существенные факторы, которые воздействуют на этот показатель. Символически этот факт записывается так:
На втором шаге регрессионного анализа требуется спецификация формы связи между т. е. определение вида функции. Ориентиром для определения вида зависимости являются содержание решаемой задачи, результаты наблюдений за поведением показателя относительно изменения факторов на основе статистических данных.
n Задача третьего шага регрессионного анализа заключается в определении конкретных числовых значений параметров на основе статистических данных о наблюдениях значений и. n На практике регрессия чаще всего ищется в виде линейной функции: (линейная регрессия), наилучшем образом приближающей искомую кривую. Делается это с помощью метода наименьших квадратов.
наиболее важные параметры регрессионной модели Multiple R - коэффициент множественной корреляции, который характеризует тесноту линейной связи между зависимой и всеми независимыми переменными. Может принимать значения от 0 до 1. R 2 - коэффициент детерминации. Численно выражает долю вариации зависимой переменной, объясненную с помощью регрессионного уравнения. Чем больше R 2, тем большую долю вариации объясняют переменные, включенные в модель. Например R 2=0, 76 - значит уравнение описывает 76% общей дисперсии модели.
наиболее важные параметры регрессионной модели При поиске лучшей регрессионной модели следует руководствоваться следующими наиболее общими требованиями (Дрейпер, Смит, 1981): n. Регрессионная модель должна объяснять не менее 80% вариации зависимой переменной, т. е. R 2 0. 8. n. Стандартная ошибка оценки зависимой переменной по уравнению должна составлять не более 5% среднего значения зависимой переменной; n. Коэффициенты уравнения регрессии и его свободный член должны быть значимы на 5%-ом уровне. n. Остатки от регрессии должны быть без заметной автокорреляции (r<0, 30), нормально распределены и без систематической составляющей.
Проверка значимости модели Часто F-критерий можно рассчитать через коэффициент корреляции r: m – число параметров в уравнении регрессии Расчетное F сопоставляется с табличным, определяемым по таблице для числа степеней свободы υ1=m-1 и υ2=n-m при заданном уровне значимости (например α= 0, 05). Если Fрасч > Fтабл, то уравнение считается значимым.

