Скачать презентацию ПРАКТИКУМ ПО ПРИКЛАДНЫМ ЭКОНОМИЧЕСКИМ ИССЛЕДОВАНИЯМ Часть 2 ЛЕКЦИЯ Скачать презентацию ПРАКТИКУМ ПО ПРИКЛАДНЫМ ЭКОНОМИЧЕСКИМ ИССЛЕДОВАНИЯМ Часть 2 ЛЕКЦИЯ

bae24c1c8494e1ccc3c37122adb2b009.ppt

  • Количество слайдов: 51

ПРАКТИКУМ ПО ПРИКЛАДНЫМ ЭКОНОМИЧЕСКИМ ИССЛЕДОВАНИЯМ Часть 2 ЛЕКЦИЯ 2 ТЕСТИРОВАНИЕ РЕГРЕССИОННЫХ ОСТАТКОВ НА НАЛИЧИЕ ПРАКТИКУМ ПО ПРИКЛАДНЫМ ЭКОНОМИЧЕСКИМ ИССЛЕДОВАНИЯМ Часть 2 ЛЕКЦИЯ 2 ТЕСТИРОВАНИЕ РЕГРЕССИОННЫХ ОСТАТКОВ НА НАЛИЧИЕ ВЫБРОСОВ, НОРМАЛЬНОСТЬ, ГОМОСКЕДАСТИЧНОСТЬ Демидова О. А. , demidova@hse. ru Каф. Математической экономики и эконометрики, доцент Лаборатория «Эмпирический анализ предприятий и рынков» , заведующий

Тестирование регрессионных остатков на гомоскедастичность Тестирование регрессионных остатков на гомоскедастичность

Гетероскедастичность Y X b 2 = b 1 + Y b 1 X 2 Гетероскедастичность Y X b 2 = b 1 + Y b 1 X 2 X 3 X 4 X 5 X Одно из условий теоремы Гаусса – Маркова состоит в том, что возмущения u имеют нулевое математическое ожидание и одинаковую дисперсию. 2

Гетероскедастичность Y X b 2 = b 1 + Y b 1 X 2 Гетероскедастичность Y X b 2 = b 1 + Y b 1 X 2 X 3 X 4 X 5 X Было сделано также дополнительное предположение о нормальном законе распределения возмущений. 3

Гетероскедастичность Y X b 2 = b 1 + Y b 1 X 2 Гетероскедастичность Y X b 2 = b 1 + Y b 1 X 2 X 3 X 4 X 5 X Свойство одинаковой дисперсии возмущений называется гомоскедастичностью. 4

Гетероскедастичность Y X b 2 = b 1 + Y b 1 X 2 Гетероскедастичность Y X b 2 = b 1 + Y b 1 X 2 X 3 X 4 X 5 X Линия теоретической регрессии Y = b 1 + b 2 X, которую мы не можем провести и проверить, одинаково ли распределены возмущения. 5

Гетероскедастичность Y X b 2 = b 1 + Y b 1 X 2 Гетероскедастичность Y X b 2 = b 1 + Y b 1 X 2 X 3 X 4 X 5 X Если дисперсии возмущений различны, то это явление называется гетероскедастичностью. 6

Гетероскедастичность Y X b 2 = b 1 + Y b 1 X 2 Гетероскедастичность Y X b 2 = b 1 + Y b 1 X 2 X 3 X 4 X 5 X Наличие гетероскедастичности можно заподозрить, если отклонение наблюдений от линии выборочной регрессии (остатки) достаточно сильно различаются. 7

Гетероскедастичность Y X b 2 = b 1 + Y b 1 X 2 Гетероскедастичность Y X b 2 = b 1 + Y b 1 X 2 X 3 X 4 X 5 X Однако ответ на вопрос, имеет ли место гетероскедастичность, можно получить только с помощью тестов. 8

Последствия гетероскедастичности Если предположение об одинаковых дисперсиях возмущений не выполняется, то • стандартные ошибки Последствия гетероскедастичности Если предположение об одинаковых дисперсиях возмущений не выполняется, то • стандартные ошибки коэффициентов регрессии вычисляются по неверным формулам • t – тесты для проверки гипотез о конкретных значениях коэффициентов не дают правильных результатов • F – тесты для проверки гипотез о линейных ограничениях на коэффициенты регрессии не дают правильных результатов • Оценки МНК коэффициентов регрессии больше не являются BEST, теряется эффективность оценок. 9

Пример Данные для 30 стран в 1997. 10 Пример Данные для 30 стран в 1997. 10

Пример Взглянув на этот рисунок, можно сделать предположение, что с ростом ВВП дисперсия возмущений Пример Взглянув на этот рисунок, можно сделать предположение, что с ростом ВВП дисперсия возмущений увеличивается. 11

Пример South Korea Mexico Сравним Южную Корею и Мексику с приблизительно одинаковым уровнем ВВП. Пример South Korea Mexico Сравним Южную Корею и Мексику с приблизительно одинаковым уровнем ВВП. 12

Пример Singapore Greece Другая пара для сравнения – Сингапур и Греция, также с почти Пример Singapore Greece Другая пара для сравнения – Сингапур и Греция, также с почти одинаковым уровнем ВВП. Очевидно, что для первой пары с большим ВВП и разница больше. Можно предположить наличие гетероскедастичности. 13

Тест Голдфелда – Квандта Y X b 2 = b 1 + Y b Тест Голдфелда – Квандта Y X b 2 = b 1 + Y b 1 X 2 X 3 X 4 X 5 X Гетероскедастичность – различие дисперсий возмущений для различных наблюдений. Ясно, что видов гетероскедастичности может быть сколь угодно много. 1

Тест Голдфелда – Квандта Y X b 2 = b 1 + Y b Тест Голдфелда – Квандта Y X b 2 = b 1 + Y b 1 X 2 X 3 X 4 X 5 X Однако одним из самых распространенных видов гетероскедастичности является пропорциональность стандартного отклонения возмущений одной из объясняющих переменных. 2

Тест Голдфелда – Квандта Y X b 2 = b 1 + Y b Тест Голдфелда – Квандта Y X b 2 = b 1 + Y b 1 X 2 X 3 X 4 X 5 X Этот тип гетероскедастичности иллюстрируется на приведенной диаграмме. Дисперсия возмущений пропорциональна переменной Х. 3

Тест Голдфелда – Квандта Основная и альтернативная гипотезы в тесте Голфелда – Квандта (и Тест Голдфелда – Квандта Основная и альтернативная гипотезы в тесте Голфелда – Квандта (и во всех остальных тестах, в которых проверяется, имеет ли место гетероскедастичность) формулируются следующим образом: H 0: гомоскедастичность H 1: гетероскедастичность Однако сам тест зависит от того, какой вид гетероскедастичности мы предполагаем в альтернативной гипотезе. 4

Тест Голдфелда – Квандта H 0 : H 1 : 4 Тест Голдфелда – Квандта H 0 : H 1 : 4

Тест Голдфелда – Квандта Для проведения теста Голдфелда – Квандта все наблюдения делятся на Тест Голдфелда – Квандта Для проведения теста Голдфелда – Квандта все наблюдения делятся на 3 части. Если выборка небольшая, то выделяют приблизительно 3/8 части всех наблюдений для первой и третьей части и приблизительно 1/4 в середине. 5

Пример проведения теста Голдфелда – Квандта Для 28 стран оценивается зависимость выпуска продукции обрабатывающей Пример проведения теста Голдфелда – Квандта Для 28 стран оценивается зависимость выпуска продукции обрабатывающей промышленности от ВВП. Выделено 11 стран с маленьким ВВП, 6 со средним и 11 с большим. 6

Пример проведения теста Голдфелда – Квандта Отдельно оцениваются регрессии для 11 стран с маленьким Пример проведения теста Голдфелда – Квандта Отдельно оцениваются регрессии для 11 стран с маленьким ВВП и для 11 стран с большим ВВП. 7

Пример проведения теста Голдфелда – Квандта RSS 1 = 157, 000 RSS 2 = Пример проведения теста Голдфелда – Квандта RSS 1 = 157, 000 RSS 2 = 13, 518, 000 Для каждой регрессии находятся суммы квадратов остатков RSS 1 и RSS 2. 8

Пример проведения теста Голдфелда – Квандта RSS 1 = 157, 000 RSS 2 = Пример проведения теста Голдфелда – Квандта RSS 1 = 157, 000 RSS 2 = 13, 518, 000 Если имеет место гомоскедастичность, RSS 1 и RSS 2 не должны сильно различаться (если число наблюдений в оцениваемых регрессиях совпадает). 9

Пример проведения теста Голдфелда – Квандта RSS 1 = 157, 000 RSS 2 = Пример проведения теста Голдфелда – Квандта RSS 1 = 157, 000 RSS 2 = 13, 518, 000 Однако в рассматриваемом примере RSS 2 значительно превышает RSS 1. 10

Тестовая статистика в тесте Голдфелда - Квандта RSS 1 = 157, 000 RSS 2 Тестовая статистика в тесте Голдфелда - Квандта RSS 1 = 157, 000 RSS 2 = 13, 518, 000 Тестовая статистика F рассчитывается по приведенной выше формуле. В числителе – оценка дисперсии возмущений по последним n 2 наблюдениям, а в знаменателе - оценка дисперсии возмущений по первым n 1 наблюдениям. K – число параметров в модели. 11

Тестовая статистика в тесте Голдфелда - Квандта RSS 1 = 157, 000 RSS 2 Тестовая статистика в тесте Голдфелда - Квандта RSS 1 = 157, 000 RSS 2 = 13, 518, 000 Тестовая F – статистика превышает критическое значение даже при уровне значимости 0. 1%. Нулевая гипотеза о гомоскедастичности отвергается. 12

Формальное описание теста Голфелда - Квандта • Оценивается регрессия по всем наблюдениям. • Полезно Формальное описание теста Голфелда - Квандта • Оценивается регрессия по всем наблюдениям. • Полезно взглянуть на график остатков. Может появиться предположение, что дисперсия возмущений увеличивается с ростом некоторой переменной. • Упорядочиваем все наблюдения по модулю подозрительной переменной. • Делим все наблюдения на три группы (если наблюдений достаточно много, то приблизительно на трети). Удобно, если в первой и третьей группах количество наблюдений одинаково. • Наблюдениями средней группы пренебрегаем, а по первым n 1 и последним n 2 наблюдениям оцениваем отдельные регрессии. • Используя суммы квадратов остатков (RSS) в оцененных регрессиях, рассчитываем тестовую статистику по формуле • Сравниваем полученное значение F – статистики с критическим (при выбранном уровне значимости). • Если значение F – статистики превышает критическое, нулевая гипотеза о гомоскедастичности отвергается. 13

Тест Глейзера Дисперсия возмущений не обязательно пропорциональна какомулибо фактору, может быть и другой вид Тест Глейзера Дисперсия возмущений не обязательно пропорциональна какомулибо фактору, может быть и другой вид зависимости, для определения которой используется тест Глейзера. 2

Тест Глейзера H 0 : H 1 : 3 Тест Глейзера H 0 : H 1 : 3

Формальное описание теста Глейзера • Оценивается регрессия по всем наблюдениям. • Сохраняются остатки регрессии Формальное описание теста Глейзера • Оценивается регрессия по всем наблюдениям. • Сохраняются остатки регрессии ei. • Оцениваются регрессии • Если коэффициент β значим хотя бы в одной из трех регрессий (значимость коэффициента проверяется как обычно с помощью t – статистики), то имеет место гетероскедастичность (соответствующего вида). 4

Тест Уайта Содержательный смысл теста Уайта состоит в следующем: если в модели дисперсия возмущений Тест Уайта Содержательный смысл теста Уайта состоит в следующем: если в модели дисперсия возмущений каким-то, возможно, достаточно сложным образом зависит от регрессоров, то это должно каким-то образом отражаться в остатках обычной регрессии исходной модели. 1

Тест Уайта H 0: гомоскедастичность H 1: гетероскедастичность Вид гетероскедастичности не конкретизируется. 2 Тест Уайта H 0: гомоскедастичность H 1: гетероскедастичность Вид гетероскедастичности не конкретизируется. 2

Формальное описание теста Уайта • Оценивается регрессия по всем наблюдениям. • Сохраняются остатки регрессии Формальное описание теста Уайта • Оценивается регрессия по всем наблюдениям. • Сохраняются остатки регрессии ei. • Оцениваются регрессия квадратов остатков на все регрессоры, их квадраты, попарные произведения и константу. • В последней оцененной регрессии находим коэффициент множественной детерминации R 2 • Вычисляем тестовую статистику по формуле n. R 2. Тестовая статистика имеет распределение «хи – квадрат» с k-1 степенями свободы, где k – число оцениваемых коэффициентов. • Сравниваем полученное значение тестовой статистики с критическим при выбранном уровне значимости. Если значение тестовой статистики превышает критическое, то нулевая гипотеза о гомоскедастичности отвергается. 3

Тест Уайта Привлекательной чертой теста Уайта является его универсальность. Однако этот тест не является Тест Уайта Привлекательной чертой теста Уайта является его универсальность. Однако этот тест не является конструктивным. Если гетероскедастичность выявлена, то тест Уайта не дает указания на функциональную форму гетероскедастичности. Единственным способом коррекции является применение стандартных ошибок в форме Уайта. 4

Тест Бройша - Пагана H 0 : H 1 : Вид функции f может Тест Бройша - Пагана H 0 : H 1 : Вид функции f может быть любой. 1

Формальное описание теста Бройша - Пагана • Оценивается регрессия по всем наблюдениям. Сохраняются остатки Формальное описание теста Бройша - Пагана • Оценивается регрессия по всем наблюдениям. Сохраняются остатки регрессии ei, i = 1, …, n. Находится RSS. • Находится оценка дисперсии возмущений по формуле ^ • Оценивается регрессия e 2 на Z 1, …, Zr, находится ESS 0. 2

Формальное описание теста Бройша - Пагана • Тестовая статистика • Имеет распределение «хи – Формальное описание теста Бройша - Пагана • Тестовая статистика • Имеет распределение «хи – квадрат» с r степенями свободы. • Если при выбранном уровне значимости, то гипотеза H 0 о гомоскедастичности отвергается. 3

Что делать в случае гетероскедастичности? Предположим, что нам известны дисперсии возмущений si 2 для Что делать в случае гетероскедастичности? Предположим, что нам известны дисперсии возмущений si 2 для всех наблюдений i = 1, …, n. 1

Разделим обе части равенства на si для каждого наблюдения. 2 Разделим обе части равенства на si для каждого наблюдения. 2

Тогда дисперсии возмущений в новой регрессии станут одинаковыми и равными 1. 3 Тогда дисперсии возмущений в новой регрессии станут одинаковыми и равными 1. 3

Преобразование переменных Все сводится к оценке новой регрессии с преобразованными факторами, оцениваем регрессию Y' Преобразование переменных Все сводится к оценке новой регрессии с преобразованными факторами, оцениваем регрессию Y' на X' и H, которые определенны выше. Отметим, что в новой регрессии нет константы. b 1 становится коэффициентом наклона перед переменной 1/si. 4

Взвешенный метод наименьших квадратов Указанный метод называется взвешенным методом наименьших квадратов. Наибольший вес 1/si Взвешенный метод наименьших квадратов Указанный метод называется взвешенным методом наименьших квадратов. Наибольший вес 1/si получают наблюдения с наименьшей дисперсией возмущений si. 5

Взвешенный метод наименьших квадратов Однако на практике стандартные отклонения возмущений обычно неизвестны. Но, оказывается, Взвешенный метод наименьших квадратов Однако на практике стандартные отклонения возмущений обычно неизвестны. Но, оказывается, достаточно знать эти стандартные отклонения с точностью до постоянного множителя. Предположим, что стандартные отклонения возмущений пропорциональны некоторой известной переменной Zi. 6

Взвешенный метод наименьших квадратов В этом случае мы достигаем гомоскедастичности остатков, разделив все переменные Взвешенный метод наименьших квадратов В этом случае мы достигаем гомоскедастичности остатков, разделив все переменные на Zi. 7

Взвешенный метод наименьших квадратов Действительно, как показано выше, дисперсии новых остатков одинаковы и равны Взвешенный метод наименьших квадратов Действительно, как показано выше, дисперсии новых остатков одинаковы и равны l 2. Нам нет необходимости знать l 2. Достаточно того, что это константа (т. е. одинаковые дисперсии для всех возмущений, гомоскедастичность). 8

Взвешенный метод наименьших квадратов Если после выполнении теста Голдфелда – Квандта гипотеза о гомоскедастичности Взвешенный метод наименьших квадратов Если после выполнении теста Голдфелда – Квандта гипотеза о гомоскедастичности отвергается, то в качестве Z может быть использована переменная Xj. 9

Взвешенный метод наименьших квадратов На практике вместо si часто используют их оценки. Например, если Взвешенный метод наименьших квадратов На практике вместо si часто используют их оценки. Например, если после проведения теста Глейзера гипотеза о гомоскедастичности была отвергнута, поскольку в регрессии ^ ^ коэффициент β значим, то σi = |ei|, i = 1, . . , n 10

История, произошедшая на Нью-Йорской фондовой бирже Securities and Exchange Commission vs Antitrust division of История, произошедшая на Нью-Йорской фондовой бирже Securities and Exchange Commission vs Antitrust division of the US Department of Justice Биржевой комитет: Комиссионные брокерам не являются объектом соглашения между брокерами и клиентами, а устанавливаются биржевым комитетом Подразделение министерства юстиции: Цены комиссионных д. б. либерализованы 2

История, произошедшая на Нью-йоркской фондовой бирже Биржевой комитет: где Y – доход брокерских компаний, История, произошедшая на Нью-йоркской фондовой бирже Биржевой комитет: где Y – доход брокерских компаний, Х – количество акций в сделке. Вывод: естественная монополия, не надо либерализовывать цены. 3

История, произошедшая на Нью-Йорской фондовой бирже Подразделение министерства юстиции : Дисперсия ошибок зависит от История, произошедшая на Нью-Йорской фондовой бирже Подразделение министерства юстиции : Дисперсия ошибок зависит от объема сделки. Надо поделить все переменные на . Новое оцененное уравнение: Вывод: это не естественная монополия, надо либерализовать цены. 4