2-Лекция -множ регр.ppt
- Количество слайдов: 50
Регрессионный анализ Предназначен для исследования зависимости исследуемой переменной от различных факторов и отображения их взаимосвязи в форме регрессионной модели. u Зависимая (объясняемая) переменная = > Y u Независимые (объясняющие) переменные =>X u По виду функции различают модели: – линейные; – нелинейные. u. По количеству включенных факторов: - однофакторные (парной регрессии); - многофакторные (множественной регрессии). 1
2
Спецификация модели множественной регрессии u Матричная форма 3
u u u Матрица регрессоров Х – детерминированная полного ранга первый столбец матрицы при наличии в спецификации свободного члена 4
5
Множественная регрессия. Для учета влияния нескольких факторов, воздействующих на объект исследования используется множественная регрессия: u yi = b 0 + b 1· xi 1 + b 2· xi 2 + … + u + bj · xij +…+ bm· xim + εi , u где u i = 1, 2, …, n – номер наблюдения, j = 1, 2, …, m – номер фактора 6
yi – значение признака-результата, xij – значение j - го фактора для i –го наблюдения, εi – случайная составляющая, в 0 – свободный член, показывает среднее значение yi при x 1 = x 2 =… xm = 0, bj – коэффициент регрессии при j – ом факторе, характеризует среднее изменение признака-результата y с изменением xj на одну единицу, при условии, что прочие факторы не изменяются. 7
8
9
10
11
12
13
14
Матричная форма записи Используется для компактной записи и упрощения выполнения вычислительных процедур. Уравнение множественной регрессии в матричной форме: Y = X·В + ε , где Y – вектор-столбец (nx 1) зависимой переменной; X – матрица n x (m+1) независимых переменных значений факторов; В – вектор-столбец (m +1) x 1 неизвестных коэффициентов регрессии; ε – вектор-столбец (nx 1) случайных отклонений. 15
X= B= Параметры системы нормальных уравнений находятся с помощью МНК по формуле: B = (X’·X)-1·X’·Y. u К факторам, включаемым в модель регрессии предъявляются следующие требования: Ø Должны иметь количественную оценку; Ø Должна быть тесная связь каждого фактора с 16
Мультиколлинеарность - линейная или близкая к ней связь между факторами. Наличие мультиколлинеарности затрудняет или вовсе исключает возможность вычисления параметров модели, а также усложняет интерпретацию полученных резуль-татов. u Мультиколлинеарность считается установленной, если rxi, xk > 0, 8 u Если все, или хотя бы одно из неравенств: ry, xi > rxi, xk ; ry, xk > rxi, xk ; rxi, xk < 0, 8 не выполняется, то в модель включается фактор, который наиболее тесно связан с Y. Интеркорреляция – корреляция между объясняющими 17 u
Оценка качества модели регрессии Качество модели оценивается на основе анализа остаточной компоненты (εi = yi – yр ): Качество модели регрессии оценивается по следующим направлениям: u проверка качества всего уравнения регрессии; u проверка значимости всего уравнения регрессии; u проверка статистической значимости коэффициентов уравнения регрессии; u проверка выполнения предпосылок МНК. 18
Оценка качества модели регрессии выполняется по следующим направлениям: q Проверяется качество всего уравнения (по коэф-фициенту множественной корреляции (индексу корреля-ции) R и коэффициенту детерминации R 2); q Проверяется значимость всего уравнения (по F - критерию Фишера); q Проверяется значимость коэффициентов урав-нения (по t - статистике проверкой гипотезы о равенстве нулю j- го параметра модели кроме свободного члена ). 19
, где Sε - станд. ошибка оценки Здесь bjj – диагональный элемент матрицы (X’·X)-1. Если tрасч > tтабл, то коэффициент регрессии считается значимым и этот фактор остается в модели, в противном случае он исключается; q Проверяется выполнение предпосылок МНК Елисеева с. 184 Остатки ε должны удовлетворять пяти предпосылкам МНК: Ø отсутствие автокорреляции (остатки распределены независимо друг от друга), Ø случайный характер остатков, Ø средняя величина остатков (мат. ожидание) равна нулю, Ø гомоскедакстичность – дисперсия каждого отклонения одинакова для всех x, 20
21
22
23
24
25
26
27
Нарушение предпосылок Гаусса-Маркова Гетероскедастичность случайного возмущения 28
ОПРЕДЕЛЕНИЕ ГЕТЕРОСКЕДАСТИЧНОСТИ Гетероскедастичность – это неоднородность наблюдений. Она характеризуется тем, что не выполняется предпосылка 20 использования МНК: Выполнимость предпосылки 20 называется гомоскедастичностью. 29
Проверка гомоскедастичности остатков Гомоскедастичность – дисперсия каждого отклонения одинакова для всех x. Гетероскедастичность – разная дисперсия для различных x: а) дисперсия остатков растет с ростом x, б) дисперсия максимальная при средних значениях x, в) дисперсия уменьшается с ростом x. 30
Трехмерное изображение гомос- и гетероскедастичности Гомоскедастичность остатков Гетероскедастичность остатков 31
Причины гетероскедастичности u Характер данных u Неоднородность исследуемых объектов u Y – спрос, X – доход Y X 32
Причины гетероскедастичности Причиной непостоянства дисперсии эконометрической модели часто является ее зависимость от масштаба рассматриваемых явлений. 33
Последствия гетероскедастичности МНК оценки параметров несмещённые Гетероскедастичность не приводит к смещению оценок коэффициентов регрессии. Стандартные ошибки коэффициентов (вычисленные в предположении. гомоскедастичности) будут занижены. Это приведет к завышению t-статистик и даст неправильное (завышенное) представление о 34
Обнаружение гетероскедастичности Предварительная работа: 1. Нет ли очевидных ошибок спецификации? 2. Можно ли содержательно предполагать какой-то вид гетероскедастичности? 3. Рассмотрение графиков остатков: 35
График остатков 36
Обнаружение гетероскедастичности Тесты: 1. Тест ранговой корреляции Спирмена. 2. Тест Парка. 3. Тест Глейзера. 4. Тест Голдфелда-Квандта. 5. Тест Уайта. 6. Тест Бреуша-Пагана. 37
Тест Голдфельда – Квандта Предпосылки теста: 1. Дисперсия возмущений пропорциональна одному из регрессоров. Стандартные отклонения остатков пропорциональны фактору пропорциональности Z, т. е. u 2. Случайный член имеет нормальное распределение и отсутствует автокорреляция остатков (предпосылка 30). 38
Тест Голдфельда – Квандта Алгоритм применения 1. Выделяют фактор пропорциональности Z = X k. Данные упорядочиваются в порядке возрастания величины Z. 2. Отбрасывают среднюю треть упорядоченных наблюдений. Для первой и последней третей строятся две отдельные регрессии, используя ту же спецификацию модели регрессии. 39
Тест Голдфельда – Квандта Алгоритм применения 4. Берутся суммы квадратов остатков для регрессий по первой трети RSS 1 и последней трети RSS 3. Рассчитывают их отношение: 5. Используем F-тест для проверки гомоскедастичности. Если статистика GQ удовлетворяет неравенству 40
Определение критического значения F - статистики в Excel u Категория — Статистические u Функция — Fраспобр Параметры функции Fраспобр: 1. Вероятность (уровень значимости ) 2. Число степеней свободы 1 (v 1 = m k) 41
Нарушение предпосылок Гаусса-Маркова Автокорреляция 42
Отсутствие автокорреляции (зависимость остатков ε) проверяется по d - критерию Дарбина-Уотсона: , где εi = yiфакт – yi расч. Значение d – критерия распределено в интервале 0… 4. Если d < 2, то присутствует положительная автокорре-ляция между остатками уровней и 43
Если 0 < d 1 , то остатки содержат автокорреляцию, Если d 1 < d 2 , то имеется неопределенность и тогда рассчитывается первый коэффициент автокорреляции: Рассчитанное значение r(1) сопоставляется с r(1)табличным, и если r(1) < r(1)табл, то автокорреляция отсутствует, в против-ном случае присутствует. Если d 2 < d < 2 , то ряд остатков не коррелирован. Если d > 2, то d - критерий пересчитывается по 2 формуле: d’ = 4 – d и дальнейшие выводы 44 делают по d’.
Случайный характер остатков εi проверяется по графику. Если на графике нет направленности в расположении точек εi , то εi – случайные величины и применение МНК оправдано (теоретические y 45
Частные случаи зависимости εi от теоретических y: а) остатки неслучайны, б) систематический характер остатков, в) остатки с непостоянной дисперсией. 46
Средняя величина остатков равна нулю Если расположение остатков на графике не имеет направ-ленности, то они независимы от значений факторов xi. 47
Оценка влияния отдельных факторов на зависимую переменную по уравнению множественной регрессии Поскольку коэффициенты модели регрессии имеют разные степени колеблемости и единицы измерения, то они непосредственно не отражают степень влияния факторов xj на зависимую переменную y. В связи с этим для оценки влияния факторов применяются: ü частные коэффициенты эластичности Эj= aj·xj ср / yср , где aj – коэффициент уравнения регрессии, xj ср , yср – средние значения j – го фактора и зависимой переменной. Коэффициенты эластичности показывают на сколько процентов в среднем изменится y при изменении j –го 48
бета-коэффициенты βj = aj · Sx j / Sy , где, ü Здесь Sxj , Sy - среднеквадратические отклонения xj и y. Бета-коэффициентыпоказываютнакакую часть СКО Sy изменяется зависимая переменная y c изменением не-зависимой переменной xj на величину своего СКО при неизменных остальных независимых переменных. Коэффициенты Эj и βj позволяют проранжировать факто-ры по степени их влияния на y. 2 49
Анализ и прогнозирование с помощью многофакторных моделей регрессии Прогнозирование – научно-обоснованное предсказание состояния экономической системы в будущем, при условии сохранения в прогнозируемом периоде ранее существовавших связей. При прогнозировании учитывают два источника ошибок: § рассеивание наблюдений относительно линии регрессии; § математический аппарат построения линии регрессии. Для получения точечного прогноза в уравнение регрессии yi = в 0 + a 1· xi 1 + a 2· xi 2 + … + aj · xij +…+ am· xim + εi , подставляется значение факторов xij на прогнозируемом шаге. Но поскольку вероятность точечного прогноза близка к 50


