Тема 3. Множественная регрессия. Для учета влияния



















4-Лекция -множ регр.ppt
- Количество слайдов: 19
Тема 3. Множественная регрессия. Для учета влияния нескольких факторов, воздействующих на объект исследования используется множественная регрессия: yi = a 0 + a 1· xi 1 + a 2· xi 2 + … + + aj · xij +…+ am· xim + εi , где i = 1, 2, …, n – номер наблюдения, j = 1, 2, …, m – номер фактора,
yi – значение признака-результата, xij – значение j - го фактора для i –го наблюдения, εi – случайная составляющая, a 0 – свободный член, показывает среднее значение yi при x 1 = x 2 =… xm = 0, aj – коэффициент регрессии при j – ом факторе, характеризует среднее измене- ние признака-результата y с изменением xj на одну единицу, при условии, что прочие факторы не изменяются.
Матричная форма записи Используется для компактной записи и упрощения выполнения вычислительных процедур. Уравнение множественной регрессии в матричной форме: Y = X·A + ε , где Y – вектор-столбец (nx 1) зависимой переменной; X – матрица n x (m+1) независимых переменных зна- чений факторов; A – вектор-столбец (m +1) x 1 неизвестных коэффици- ентов регрессии; ε – вектор-столбец (nx 1) случайных отклонений.
X= A= Параметры системы нормальных уравнений находятся с помощью МНК по формуле: A = (X’·X)-1·X’·Y. u К факторам, включаемым в модель регрессии предъявляются следующие требования: Ø Должны иметь количественную оценку; Ø Должна быть тесная связь каждого фактора с
Мультиколлинеарность - линейная или близкая к ней связь между факторами. u Наличие мультиколлинеарности затрудняет или вовсе исключает возможность вычисления параметров модели, а также усложняет интерпретацию полученных резуль-татов. u Мультиколлинеарность считается установленной, если rxi, xk > 0, 8 u Если все, или хотя бы одно из неравенств: ry, xi > rxi, xk ; ry, xk > rxi, xk ; rxi, xk < 0, 8 не выполняется, то в модель включается фактор, который наиболее тесно связан с Y. Интеркорреляция – корреляция между объясняющими
Оценка качества модели регрессии выполняется по следующим направлениям: q Проверяется качество всего уравнения (по коэф-фициенту множественной корреляции (индексу корреля-ции) R и коэффициенту детерминации R 2 см. т. 3); q Проверяется значимость всего уравнения (по F - критерию Фишера см. т. 3); q Проверяется значимость коэффициентов урав-нения (по t - статистике проверкой гипотезы о равенстве нулю j- го параметра модели кроме свободного члена ).
, где Sε - станд. ошибка оценки Здесь bjj – диагональный элемент матрицы (X’·X)-1. Если tрасч > tтабл, то коэффициент регрессии считается значимым и этот фактор остается в модели, в противном случае он исключается; q Проверяется выполнение предпосылок МНК Елисеева с. 184 Остатки ε должны удовлетворять пяти предпосылкам МНК: Øотсутствие автокорреляции (остатки распределены независимо друг от друга), Øслучайный характер остатков, Øсредняя величина остатков (мат. ожидание) равна нулю, Øгомоскедакстичность – дисперсия каждого отклонения одинакова для всех x,
Отсутствие автокорреляции (зависимость остатков ε) проверяется по d - критерию Дарбина-Уотсона: , где εi = yiфакт – yi расч. Значение d – критерия распределено в интервале 0… 4. Если d < 2, то присутствует положительная автокорре-ляция между остатками уровней и
Если 0 < d 1 , то остатки содержат автокорреляцию, Если d 1 < d 2 , то имеется неопределенность и тогда рассчитывается первый коэффициент автокорреляции: Рассчитанное значение r(1) сопоставляется с r(1)табличным, и если r(1) < r(1)табл, то автокорреляция отсутствует, в против-ном случае присутствует. Если d 2 < d < 2 , то ряд остатков не коррелирован. Если d > 2, то d - критерий пересчитывается по 2 формуле: d’ = 4 – d и дальнейшие выводы делают по d’.
Случайный характер остатков εi проверяется по графику. Если на графике нет направленности в расположении точек εi , то εi – случайные величины и применение МНК оправдано (теоретические y
Частные случаи зависимости εi от теоретических y: а) остатки неслучайны, б) систематический характер остатков, в) остатки с непостоянной дисперсией.
Средняя величина остатков равна нулю Если расположение остатков на графике не имеет направ-ленности, то они независимы от значений факторов xi.
Проверка гомоскедастичности остатков Гомоскедастичность – дисперсия каждого отклонения одинакова для всех x. Гетероскедастичность – разная дисперсия для различных x: а) дисперсия остатков растет с ростом x, б) дисперсия максимальная при средних значениях x, в) дисперсия уменьшается с ростом x.
Трехмерное изображение гомос- и гетероскедастичности Гомоскедастичность остатков Гетероскедастичность остатков
Обнаружение гетероскедастичностивыявить тремя Гетероскедастичность можно тестами: q тест Голдфельда-Квандта (применяется при малом объеме выборки, нормальном распределении ε и дисперсии остатков пропорциональной квадрату фактора); q тест ранговой корреляции Спирмена; q тест Глейзера. Тест Голдфельда-Квандта: 1. Наблюдения ранжируются в порядке возрастания x; 2. Все наблюдения делятся на две группы (с большими и малыми значениями x) и для каждой из них определяются уравнения регрессии;
4. Вычисляются F распределения Fнабл = или Fнабл = из условий, что в числителе должна быть большая сумма квадратов. Полученные отношения имеют F распределение Фишера со степенями свободы k 1=n 1 - m и k 2 = n - n 1 - m. Здесь m – число оцениваемых параметров в уравнении регрессии.
Оценка влияния отдельных факторов на зависимую переменную по уравнению множественной регрессии Поскольку коэффициенты модели регрессии имеют разные степени колеблемости и единицы измерения, то они непосредственно не отражают степень влияния факторов xj на зависимую переменную y. В связи с этим для оценки влияния факторов применяются: ü частные коэффициенты эластичности Эj= aj·xj ср / yср , где aj – коэффициент уравнения регрессии, xj ср , yср – средние значения j – го фактора и зависимой переменной. Коэффициенты эластичности показывают на сколько процентов в среднем изменится y при изменении j –го
ü бета-коэффициенты βj = aj · Sx j / Sy , где, Здесь Sxj , Sy - среднеквадратические отклонения xj и y. Бета-коэффициенты показывают на какую часть СКО S y изменяется зависимая переменная y c изменением не-зависимой переменной x j на величину своего СКО при неизменных остальных независимых переменных. Коэффициенты Эj и βj позволяют проранжировать факто-ры по степени их влияния на y. 2
Анализ и прогнозирование с помощью многофакторных моделей регрессии Прогнозирование – научно-обоснованное предсказание состояния экономической системы в будущем, при условии сохранения в прогнозируемом периоде ранее существовавших связей. При прогнозировании учитывают два источника ошибок: § рассеивание наблюдений относительно линии регрессии; § математический аппарат построения линии регрессии. Для получения точечного прогноза в уравнение регрессии yi = a 0 + a 1· xi 1 + a 2· xi 2 + … + aj · xij +…+ am· xim + εi , подставляется значение факторов xij на прогнозируемом шаге. Но поскольку вероятность точечного прогноза близка к

