Скачать презентацию Регрессионный анализ Предназначен для исследования зависимости исследуемой переменной Скачать презентацию Регрессионный анализ Предназначен для исследования зависимости исследуемой переменной

2-Лекция -множ регр.ppt

  • Количество слайдов: 50

Регрессионный анализ Предназначен для исследования зависимости исследуемой переменной от различных факторов и отображения их Регрессионный анализ Предназначен для исследования зависимости исследуемой переменной от различных факторов и отображения их взаимосвязи в форме регрессионной модели. u Зависимая (объясняемая) переменная = > Y u Независимые (объясняющие) переменные =>X u По виду функции различают модели: – линейные; – нелинейные. u. По количеству включенных факторов: - однофакторные (парной регрессии); - многофакторные (множественной регрессии). 1

2 2

Спецификация модели множественной регрессии u Матричная форма 3 Спецификация модели множественной регрессии u Матричная форма 3

u u u Матрица регрессоров Х – детерминированная полного ранга первый столбец матрицы при u u u Матрица регрессоров Х – детерминированная полного ранга первый столбец матрицы при наличии в спецификации свободного члена 4

5 5

Множественная регрессия. Для учета влияния нескольких факторов, воздействующих на объект исследования используется множественная регрессия: Множественная регрессия. Для учета влияния нескольких факторов, воздействующих на объект исследования используется множественная регрессия: u yi = b 0 + b 1· xi 1 + b 2· xi 2 + … + u + bj · xij +…+ bm· xim + εi , u где u i = 1, 2, …, n – номер наблюдения, j = 1, 2, …, m – номер фактора 6

yi – значение признака-результата, xij – значение j - го фактора для i –го yi – значение признака-результата, xij – значение j - го фактора для i –го наблюдения, εi – случайная составляющая, в 0 – свободный член, показывает среднее значение yi при x 1 = x 2 =… xm = 0, bj – коэффициент регрессии при j – ом факторе, характеризует среднее изменение признака-результата y с изменением xj на одну единицу, при условии, что прочие факторы не изменяются. 7

8 8

9 9

10 10

11 11

12 12

13 13

14 14

Матричная форма записи Используется для компактной записи и упрощения выполнения вычислительных процедур. Уравнение множественной Матричная форма записи Используется для компактной записи и упрощения выполнения вычислительных процедур. Уравнение множественной регрессии в матричной форме: Y = X·В + ε , где Y – вектор-столбец (nx 1) зависимой переменной; X – матрица n x (m+1) независимых переменных значений факторов; В – вектор-столбец (m +1) x 1 неизвестных коэффициентов регрессии; ε – вектор-столбец (nx 1) случайных отклонений. 15

X= B= Параметры системы нормальных уравнений находятся с помощью МНК по формуле: B = X= B= Параметры системы нормальных уравнений находятся с помощью МНК по формуле: B = (X’·X)-1·X’·Y. u К факторам, включаемым в модель регрессии предъявляются следующие требования: Ø Должны иметь количественную оценку; Ø Должна быть тесная связь каждого фактора с 16

Мультиколлинеарность - линейная или близкая к ней связь между факторами. Наличие мультиколлинеарности затрудняет или Мультиколлинеарность - линейная или близкая к ней связь между факторами. Наличие мультиколлинеарности затрудняет или вовсе исключает возможность вычисления параметров модели, а также усложняет интерпретацию полученных резуль-татов. u Мультиколлинеарность считается установленной, если rxi, xk > 0, 8 u Если все, или хотя бы одно из неравенств: ry, xi > rxi, xk ; ry, xk > rxi, xk ; rxi, xk < 0, 8 не выполняется, то в модель включается фактор, который наиболее тесно связан с Y. Интеркорреляция – корреляция между объясняющими 17 u

Оценка качества модели регрессии Качество модели оценивается на основе анализа остаточной компоненты (εi = Оценка качества модели регрессии Качество модели оценивается на основе анализа остаточной компоненты (εi = yi – yр ): Качество модели регрессии оценивается по следующим направлениям: u проверка качества всего уравнения регрессии; u проверка значимости всего уравнения регрессии; u проверка статистической значимости коэффициентов уравнения регрессии; u проверка выполнения предпосылок МНК. 18

Оценка качества модели регрессии выполняется по следующим направлениям: q Проверяется качество всего уравнения (по Оценка качества модели регрессии выполняется по следующим направлениям: q Проверяется качество всего уравнения (по коэф-фициенту множественной корреляции (индексу корреля-ции) R и коэффициенту детерминации R 2); q Проверяется значимость всего уравнения (по F - критерию Фишера); q Проверяется значимость коэффициентов урав-нения (по t - статистике проверкой гипотезы о равенстве нулю j- го параметра модели кроме свободного члена ). 19

, где Sε - станд. ошибка оценки Здесь bjj – диагональный элемент матрицы (X’·X)-1. , где Sε - станд. ошибка оценки Здесь bjj – диагональный элемент матрицы (X’·X)-1. Если tрасч > tтабл, то коэффициент регрессии считается значимым и этот фактор остается в модели, в противном случае он исключается; q Проверяется выполнение предпосылок МНК Елисеева с. 184 Остатки ε должны удовлетворять пяти предпосылкам МНК: Ø отсутствие автокорреляции (остатки распределены независимо друг от друга), Ø случайный характер остатков, Ø средняя величина остатков (мат. ожидание) равна нулю, Ø гомоскедакстичность – дисперсия каждого отклонения одинакова для всех x, 20

21 21

22 22

23 23

24 24

25 25

26 26

27 27

Нарушение предпосылок Гаусса-Маркова Гетероскедастичность случайного возмущения 28 Нарушение предпосылок Гаусса-Маркова Гетероскедастичность случайного возмущения 28

ОПРЕДЕЛЕНИЕ ГЕТЕРОСКЕДАСТИЧНОСТИ Гетероскедастичность – это неоднородность наблюдений. Она характеризуется тем, что не выполняется предпосылка ОПРЕДЕЛЕНИЕ ГЕТЕРОСКЕДАСТИЧНОСТИ Гетероскедастичность – это неоднородность наблюдений. Она характеризуется тем, что не выполняется предпосылка 20 использования МНК: Выполнимость предпосылки 20 называется гомоскедастичностью. 29

Проверка гомоскедастичности остатков Гомоскедастичность – дисперсия каждого отклонения одинакова для всех x. Гетероскедастичность – Проверка гомоскедастичности остатков Гомоскедастичность – дисперсия каждого отклонения одинакова для всех x. Гетероскедастичность – разная дисперсия для различных x: а) дисперсия остатков растет с ростом x, б) дисперсия максимальная при средних значениях x, в) дисперсия уменьшается с ростом x. 30

Трехмерное изображение гомос- и гетероскедастичности Гомоскедастичность остатков Гетероскедастичность остатков 31 Трехмерное изображение гомос- и гетероскедастичности Гомоскедастичность остатков Гетероскедастичность остатков 31

Причины гетероскедастичности u Характер данных u Неоднородность исследуемых объектов u Y – спрос, X Причины гетероскедастичности u Характер данных u Неоднородность исследуемых объектов u Y – спрос, X – доход Y X 32

Причины гетероскедастичности Причиной непостоянства дисперсии эконометрической модели часто является ее зависимость от масштаба рассматриваемых Причины гетероскедастичности Причиной непостоянства дисперсии эконометрической модели часто является ее зависимость от масштаба рассматриваемых явлений. 33

Последствия гетероскедастичности МНК оценки параметров несмещённые Гетероскедастичность не приводит к смещению оценок коэффициентов регрессии. Последствия гетероскедастичности МНК оценки параметров несмещённые Гетероскедастичность не приводит к смещению оценок коэффициентов регрессии. Стандартные ошибки коэффициентов (вычисленные в предположении. гомоскедастичности) будут занижены. Это приведет к завышению t-статистик и даст неправильное (завышенное) представление о 34

Обнаружение гетероскедастичности Предварительная работа: 1. Нет ли очевидных ошибок спецификации? 2. Можно ли содержательно Обнаружение гетероскедастичности Предварительная работа: 1. Нет ли очевидных ошибок спецификации? 2. Можно ли содержательно предполагать какой-то вид гетероскедастичности? 3. Рассмотрение графиков остатков: 35

График остатков 36 График остатков 36

Обнаружение гетероскедастичности Тесты: 1. Тест ранговой корреляции Спирмена. 2. Тест Парка. 3. Тест Глейзера. Обнаружение гетероскедастичности Тесты: 1. Тест ранговой корреляции Спирмена. 2. Тест Парка. 3. Тест Глейзера. 4. Тест Голдфелда-Квандта. 5. Тест Уайта. 6. Тест Бреуша-Пагана. 37

Тест Голдфельда – Квандта Предпосылки теста: 1. Дисперсия возмущений пропорциональна одному из регрессоров. Стандартные Тест Голдфельда – Квандта Предпосылки теста: 1. Дисперсия возмущений пропорциональна одному из регрессоров. Стандартные отклонения остатков пропорциональны фактору пропорциональности Z, т. е. u 2. Случайный член имеет нормальное распределение и отсутствует автокорреляция остатков (предпосылка 30). 38

Тест Голдфельда – Квандта Алгоритм применения 1. Выделяют фактор пропорциональности Z = X k. Тест Голдфельда – Квандта Алгоритм применения 1. Выделяют фактор пропорциональности Z = X k. Данные упорядочиваются в порядке возрастания величины Z. 2. Отбрасывают среднюю треть упорядоченных наблюдений. Для первой и последней третей строятся две отдельные регрессии, используя ту же спецификацию модели регрессии. 39

Тест Голдфельда – Квандта Алгоритм применения 4. Берутся суммы квадратов остатков для регрессий по Тест Голдфельда – Квандта Алгоритм применения 4. Берутся суммы квадратов остатков для регрессий по первой трети RSS 1 и последней трети RSS 3. Рассчитывают их отношение: 5. Используем F-тест для проверки гомоскедастичности. Если статистика GQ удовлетворяет неравенству 40

Определение критического значения F - статистики в Excel u Категория — Статистические u Функция Определение критического значения F - статистики в Excel u Категория — Статистические u Функция — Fраспобр Параметры функции Fраспобр: 1. Вероятность (уровень значимости ) 2. Число степеней свободы 1 (v 1 = m k) 41

Нарушение предпосылок Гаусса-Маркова Автокорреляция 42 Нарушение предпосылок Гаусса-Маркова Автокорреляция 42

Отсутствие автокорреляции (зависимость остатков ε) проверяется по d - критерию Дарбина-Уотсона: , где εi Отсутствие автокорреляции (зависимость остатков ε) проверяется по d - критерию Дарбина-Уотсона: , где εi = yiфакт – yi расч. Значение d – критерия распределено в интервале 0… 4. Если d < 2, то присутствует положительная автокорре-ляция между остатками уровней и 43

Если 0 < d 1 , то остатки содержат автокорреляцию, Если d 1 < Если 0 < d 1 , то остатки содержат автокорреляцию, Если d 1 < d 2 , то имеется неопределенность и тогда рассчитывается первый коэффициент автокорреляции: Рассчитанное значение r(1) сопоставляется с r(1)табличным, и если r(1) < r(1)табл, то автокорреляция отсутствует, в против-ном случае присутствует. Если d 2 < d < 2 , то ряд остатков не коррелирован. Если d > 2, то d - критерий пересчитывается по 2 формуле: d’ = 4 – d и дальнейшие выводы 44 делают по d’.

Случайный характер остатков εi проверяется по графику. Если на графике нет направленности в расположении Случайный характер остатков εi проверяется по графику. Если на графике нет направленности в расположении точек εi , то εi – случайные величины и применение МНК оправдано (теоретические y 45

Частные случаи зависимости εi от теоретических y: а) остатки неслучайны, б) систематический характер остатков, Частные случаи зависимости εi от теоретических y: а) остатки неслучайны, б) систематический характер остатков, в) остатки с непостоянной дисперсией. 46

Средняя величина остатков равна нулю Если расположение остатков на графике не имеет направ-ленности, то Средняя величина остатков равна нулю Если расположение остатков на графике не имеет направ-ленности, то они независимы от значений факторов xi. 47

Оценка влияния отдельных факторов на зависимую переменную по уравнению множественной регрессии Поскольку коэффициенты модели Оценка влияния отдельных факторов на зависимую переменную по уравнению множественной регрессии Поскольку коэффициенты модели регрессии имеют разные степени колеблемости и единицы измерения, то они непосредственно не отражают степень влияния факторов xj на зависимую переменную y. В связи с этим для оценки влияния факторов применяются: ü частные коэффициенты эластичности Эj= aj·xj ср / yср , где aj – коэффициент уравнения регрессии, xj ср , yср – средние значения j – го фактора и зависимой переменной. Коэффициенты эластичности показывают на сколько процентов в среднем изменится y при изменении j –го 48

бета-коэффициенты βj = aj · Sx j / Sy , где, ü Здесь Sxj бета-коэффициенты βj = aj · Sx j / Sy , где, ü Здесь Sxj , Sy - среднеквадратические отклонения xj и y. Бета-коэффициентыпоказываютнакакую часть СКО Sy изменяется зависимая переменная y c изменением не-зависимой переменной xj на величину своего СКО при неизменных остальных независимых переменных. Коэффициенты Эj и βj позволяют проранжировать факто-ры по степени их влияния на y. 2 49

Анализ и прогнозирование с помощью многофакторных моделей регрессии Прогнозирование – научно-обоснованное предсказание состояния экономической Анализ и прогнозирование с помощью многофакторных моделей регрессии Прогнозирование – научно-обоснованное предсказание состояния экономической системы в будущем, при условии сохранения в прогнозируемом периоде ранее существовавших связей. При прогнозировании учитывают два источника ошибок: § рассеивание наблюдений относительно линии регрессии; § математический аппарат построения линии регрессии. Для получения точечного прогноза в уравнение регрессии yi = в 0 + a 1· xi 1 + a 2· xi 2 + … + aj · xij +…+ am· xim + εi , подставляется значение факторов xij на прогнозируемом шаге. Но поскольку вероятность точечного прогноза близка к 50