
множественная регрессия.ppt
- Количество слайдов: 35
Множественная регрессия и корреляция 1. Спецификация модели. Отбор факторов при построении уравнения множественной регрессии 2. Метод наименьших квадратов (МНК). 3. Проверка существенности факторов и показатели качества регрессии
1. Спецификация модели. Отбор факторов при построении уравнения множественной регрессии
Парная регрессия может дать хороший результат при моделировании, если влиянием других факторов, воздействующих на объект исследования, можно пренебречь. Если же этим влиянием пренебречь нельзя, то в этом случае следует попытаться выявить влияние других факторов, введя их в модель, т. е. построить уравнение множественной регрессии
y=f(x 1, x 2, …, xk) где – зависимая переменная (результативный признак), – независимые, или объясняющие, переменные (признаки-факторы).
Построение уравнения множественной регрессии начинается с решения вопроса о спецификации модели. Он включает в себя два круга вопросов: • отбор факторов • выбор вида уравнения регрессии.
При отборе факторов также рекомендуется пользоваться следующим правилом: число включаемых факторов обычно в 6– 7 раз меньше объема совокупности, по которой строится регрессия. Если это соотношение нарушено, то параметры уравнения регрессии оказываются статистически незначимыми, а F-критерий меньше табличного значения.
2. Метод наименьших квадратов (МНК).
Возможны разные виды уравнений множественной регрессии: линейные и нелинейные. Ввиду четкой интерпретации параметров наиболее широко используется линейная функция.
Параметры уравнения регрессии можно определить 3 способами: 1. С помощью системы уравнений. 2. С помощью уравнения в стандартизованном виде. 3. Средствами матричного исчисления.
1. Для нахождения параметров уравнения необходимо решить систему уравнений:
Для двухфакторной модели данная система будет иметь вид:
Можно воспользоваться готовыми формулами:
Где
и
2. Уравнение множественной регрессии в стандартизованном виде: где стандартизированные переменные; -стандартизированные коэффициенты.
Стандартизованные коэффициенты регрессии показывают, на сколько единиц изменится в среднем результат, если соответствующий фактор изменится на одну единицу при неизменном среднем уровне других факторов.
Для двухфакторной модели уравнение примет вид: Где ;
3. Средствами матричного исчисления коэффициенты уравнения находят из формулы:
Где Матрица значений переменных
-матрица значений результативного признака.
3. Проверка существенности факторов и показатели качества регрессии
Практическая значимость уравнения множественной регрессии оценивается с помощью показателя множественной корреляции и его квадрата – показателя детерминации. Показатель множественной корреляции характеризует тесноту связи рассматриваемого набора факторов с исследуемым признаком или, иначе, оценивает тесноту совместного влияния факторов на результат.
Где - общая дисперсия результативного признака - остаточная дисперсия.
Границы изменения индекса множественной корреляции от 0 до 1. Чем ближе его значение к 1, тем теснее связь результативного признака со всем набором исследуемых факторов.
При линейной зависимости признаков формула индекса множественной корреляции может быть представлена следующим выражением:
Формула скорректированного индекса множественной детерминации имеет вид: где m – число параметров при переменных ; n – число наблюдений.
величину скорректированного индекса детерминации можно представить в виде:
Его значение показывает величину квадрата индекса множественной корреляции при добавлении в модель еще одного фактора.
Как было показано выше, ранжирование факторов, участвующих во множественной линейной регрессии, может быть проведено через стандартизованные коэффициенты регрессии ( -коэффициенты). Эта же цель может быть достигнута с помощью частных коэффициентов корреляции.
Частные коэффициенты корреляции характеризуют тесноту связи между результатом и соответствующим фактором при устранении влияния других факторов, включенных в уравнение регрессии.
При двух факторах формула расчета частных коэффициентов корреляции примет вид:
частные коэффициенты корреляции можно также определить по формулам:
Значимость уравнения множественной регрессии в целом, так же как и в парной регрессии, оценивается с помощью Fкритерия Фишера: где – индекс множественной детерминации, – число наблюдений, – число параметров при переменной
Фактическое значение F-критерия Фишера сравнивается с табличным значением Где И n-количество наблюдений m-количество параметров при х
множественная регрессия.ppt