Тема 3. Множественная регрессия. Для учета влияния

yi – значение признака-результата, xij – значение j - го фактора для i –го

Матричная форма записи Используется для компактной записи и упрощения выполнения вычислительных процедур.

X= A= Параметры системы нормальных уравнений находятся

Мультиколлинеарность - линейная или близкая к ней связь между факторами. u

Оценка качества модели регрессии выполняется по следующим

, где Sε - станд. ошибка оценки Здесь bjj –

Отсутствие автокорреляции (зависимость остатков ε) проверяется по d - критерию Дарбина-Уотсона:

Если 0 < d 1 , то остатки содержат автокорреляцию, Если d 1 <

Случайный характер остатков εi проверяется по графику. Если на графике нет направленности в расположении

Частные случаи зависимости εi от теоретических y: а) остатки неслучайны,

Средняя величина остатков равна нулю Если расположение остатков на графике не имеет направ-ленности,

Проверка гомоскедастичности остатков Гомоскедастичность – дисперсия каждого отклонения одинакова

Трехмерное изображение гомос- и гетероскедастичности Гомоскедастичность остатков Гетероскедастичность остатков

Обнаружение гетероскедастичностивыявить тремя Гетероскедастичность можно тестами: q тест Голдфельда-Квандта (применяется при

4. Вычисляются F распределения Fнабл = или Fнабл =

Оценка влияния отдельных факторов на зависимую переменную по уравнению множественной регрессии Поскольку

ü бета-коэффициенты βj = aj · Sx j / Sy , где, Здесь

Анализ и прогнозирование с помощью многофакторных моделей регрессии Прогнозирование –

Скачать презентацию Тема 3. Множественная регрессия. Для учета влияния

4-Лекция -множ регр.ppt

Количество слайдов: 19

>Тема 3. Множественная регрессия. Для учета влияния нескольких факторов, воздействующих на Тема 3. Множественная регрессия. Для учета влияния нескольких факторов, воздействующих на объект исследования используется множественная регрессия: yi = a 0 + a 1· xi 1 + a 2· xi 2 + … + + aj · xij +…+ am· xim + εi , где i = 1, 2, …, n – номер наблюдения, j = 1, 2, …, m – номер фактора,

>yi – значение признака-результата, xij – значение j - го фактора для i –го yi – значение признака-результата, xij – значение j - го фактора для i –го наблюдения, εi – случайная составляющая, a 0 – свободный член, показывает среднее значение yi при x 1 = x 2 =… xm = 0, aj – коэффициент регрессии при j – ом факторе, характеризует среднее измене- ние признака-результата y с изменением xj на одну единицу, при условии, что прочие факторы не изменяются.

> Матричная форма записи Используется для компактной записи и упрощения выполнения вычислительных процедур. Матричная форма записи Используется для компактной записи и упрощения выполнения вычислительных процедур. Уравнение множественной регрессии в матричной форме: Y = X·A + ε , где Y – вектор-столбец (nx 1) зависимой переменной; X – матрица n x (m+1) независимых переменных зна- чений факторов; A – вектор-столбец (m +1) x 1 неизвестных коэффици- ентов регрессии; ε – вектор-столбец (nx 1) случайных отклонений.

> X= A= Параметры системы нормальных уравнений находятся X= A= Параметры системы нормальных уравнений находятся с помощью МНК по формуле: A = (X’·X)-1·X’·Y. u К факторам, включаемым в модель регрессии предъявляются следующие требования: Ø Должны иметь количественную оценку; Ø Должна быть тесная связь каждого фактора с

>Мультиколлинеарность - линейная или близкая к ней связь между факторами. u Мультиколлинеарность - линейная или близкая к ней связь между факторами. u Наличие мультиколлинеарности затрудняет или вовсе исключает возможность вычисления параметров модели, а также усложняет интерпретацию полученных резуль-татов. u Мультиколлинеарность считается установленной, если rxi, xk > 0, 8 u Если все, или хотя бы одно из неравенств: ry, xi > rxi, xk ; ry, xk > rxi, xk ; rxi, xk < 0, 8 не выполняется, то в модель включается фактор, который наиболее тесно связан с Y. Интеркорреляция – корреляция между объясняющими

> Оценка качества модели регрессии выполняется по следующим Оценка качества модели регрессии выполняется по следующим направлениям: q Проверяется качество всего уравнения (по коэф-фициенту множественной корреляции (индексу корреля-ции) R и коэффициенту детерминации R 2 см. т. 3); q Проверяется значимость всего уравнения (по F - критерию Фишера см. т. 3); q Проверяется значимость коэффициентов урав-нения (по t - статистике проверкой гипотезы о равенстве нулю j- го параметра модели кроме свободного члена ).

> , где Sε - станд. ошибка оценки Здесь bjj – , где Sε - станд. ошибка оценки Здесь bjj – диагональный элемент матрицы (X’·X)-1. Если tрасч > tтабл, то коэффициент регрессии считается значимым и этот фактор остается в модели, в противном случае он исключается; q Проверяется выполнение предпосылок МНК Елисеева с. 184 Остатки ε должны удовлетворять пяти предпосылкам МНК: Øотсутствие автокорреляции (остатки распределены независимо друг от друга), Øслучайный характер остатков, Øсредняя величина остатков (мат. ожидание) равна нулю, Øгомоскедакстичность – дисперсия каждого отклонения одинакова для всех x,

>Отсутствие автокорреляции (зависимость остатков ε) проверяется по d - критерию Дарбина-Уотсона: Отсутствие автокорреляции (зависимость остатков ε) проверяется по d - критерию Дарбина-Уотсона: , где εi = yiфакт – yi расч. Значение d – критерия распределено в интервале 0… 4. Если d < 2, то присутствует положительная автокорре-ляция между остатками уровней и

>Если 0 < d 1 , то остатки содержат автокорреляцию, Если d 1 < Если 0 < d 1 , то остатки содержат автокорреляцию, Если d 1 < d 2 , то имеется неопределенность и тогда рассчитывается первый коэффициент автокорреляции: Рассчитанное значение r(1) сопоставляется с r(1)табличным, и если r(1) < r(1)табл, то автокорреляция отсутствует, в против-ном случае присутствует. Если d 2 < d < 2 , то ряд остатков не коррелирован. Если d > 2, то d - критерий пересчитывается по 2 формуле: d’ = 4 – d и дальнейшие выводы делают по d’.

>Случайный характер остатков εi проверяется по графику. Если на графике нет направленности в расположении Случайный характер остатков εi проверяется по графику. Если на графике нет направленности в расположении точек εi , то εi – случайные величины и применение МНК оправдано (теоретические y

>Частные случаи зависимости εi от теоретических y: а) остатки неслучайны, Частные случаи зависимости εi от теоретических y: а) остатки неслучайны, б) систематический характер остатков, в) остатки с непостоянной дисперсией.

> Средняя величина остатков равна нулю Если расположение остатков на графике не имеет направ-ленности, Средняя величина остатков равна нулю Если расположение остатков на графике не имеет направ-ленности, то они независимы от значений факторов xi.

> Проверка гомоскедастичности остатков Гомоскедастичность – дисперсия каждого отклонения одинакова Проверка гомоскедастичности остатков Гомоскедастичность – дисперсия каждого отклонения одинакова для всех x. Гетероскедастичность – разная дисперсия для различных x: а) дисперсия остатков растет с ростом x, б) дисперсия максимальная при средних значениях x, в) дисперсия уменьшается с ростом x.

>Трехмерное изображение гомос- и гетероскедастичности Гомоскедастичность остатков Гетероскедастичность остатков Трехмерное изображение гомос- и гетероскедастичности Гомоскедастичность остатков Гетероскедастичность остатков

> Обнаружение гетероскедастичностивыявить тремя Гетероскедастичность можно тестами: q тест Голдфельда-Квандта (применяется при Обнаружение гетероскедастичностивыявить тремя Гетероскедастичность можно тестами: q тест Голдфельда-Квандта (применяется при малом объеме выборки, нормальном распределении ε и дисперсии остатков пропорциональной квадрату фактора); q тест ранговой корреляции Спирмена; q тест Глейзера. Тест Голдфельда-Квандта: 1. Наблюдения ранжируются в порядке возрастания x; 2. Все наблюдения делятся на две группы (с большими и малыми значениями x) и для каждой из них определяются уравнения регрессии;

>4. Вычисляются F распределения Fнабл = или Fнабл = 4. Вычисляются F распределения Fнабл = или Fнабл = из условий, что в числителе должна быть большая сумма квадратов. Полученные отношения имеют F распределение Фишера со степенями свободы k 1=n 1 - m и k 2 = n - n 1 - m. Здесь m – число оцениваемых параметров в уравнении регрессии.

> Оценка влияния отдельных факторов на зависимую переменную по уравнению множественной регрессии Поскольку Оценка влияния отдельных факторов на зависимую переменную по уравнению множественной регрессии Поскольку коэффициенты модели регрессии имеют разные степени колеблемости и единицы измерения, то они непосредственно не отражают степень влияния факторов xj на зависимую переменную y. В связи с этим для оценки влияния факторов применяются: ü частные коэффициенты эластичности Эj= aj·xj ср / yср , где aj – коэффициент уравнения регрессии, xj ср , yср – средние значения j – го фактора и зависимой переменной. Коэффициенты эластичности показывают на сколько процентов в среднем изменится y при изменении j –го

>ü бета-коэффициенты βj = aj · Sx j / Sy , где, Здесь ü бета-коэффициенты βj = aj · Sx j / Sy , где, Здесь Sxj , Sy - среднеквадратические отклонения xj и y. Бета-коэффициенты показывают на какую часть СКО S y изменяется зависимая переменная y c изменением не-зависимой переменной x j на величину своего СКО при неизменных остальных независимых переменных. Коэффициенты Эj и βj позволяют проранжировать факто-ры по степени их влияния на y. 2

> Анализ и прогнозирование с помощью многофакторных моделей регрессии Прогнозирование – Анализ и прогнозирование с помощью многофакторных моделей регрессии Прогнозирование – научно-обоснованное предсказание состояния экономической системы в будущем, при условии сохранения в прогнозируемом периоде ранее существовавших связей. При прогнозировании учитывают два источника ошибок: § рассеивание наблюдений относительно линии регрессии; § математический аппарат построения линии регрессии. Для получения точечного прогноза в уравнение регрессии yi = a 0 + a 1· xi 1 + a 2· xi 2 + … + aj · xij +…+ am· xim + εi , подставляется значение факторов xij на прогнозируемом шаге. Но поскольку вероятность точечного прогноза близка к