Эконометрика Лекция 6 Гетероскедастичность Предпосылки

Скачать презентацию Эконометрика Лекция 6 Гетероскедастичность Предпосылки

л6_Экон(Кон)_гетероск_2012.ppt

Количество слайдов: 37

Эконометрика Лекция № 6

Гетероскедастичность

Предпосылки МНК (Условия Гаусса – Маркова) Гомоскедастичность Отсутствие автокорреляции 50. Модель является линейной относительно параметров 3

Множественная регрессия Ковариационная матрица случайных ошибок 4

Определение гетероскедастичности Гетероскедастичность – это неоднородность наблюдений. Она характеризуется тем, что не выполняется предпосылка 20 использования МНК: 5

Иллюстрация гетероскедастичности 6

Примеры моделей с гетероскедастичным случайным членом а) б) в) а) Дисперсия 2 растет по мере увеличения значений объясняющей переменной X б) Дисперсия 2 имеет наибольшие значения при средних значениях X, уменьшаясь по мере приближения к крайним значениям в) Дисперсия ошибки наибольшая при малых значениях X, быстро уменьшается и становится однородной по мере увеличения X 7

Виды гетероскедастичности 1. Истинная гетероскедастичность Вызывается непостоянством дисперсии случайного члена, ее зависимостью от различных факторов. 2. Ложная гетероскедастичность Вызывается ошибочной спецификацией модели регрессии. 8

Факт неоднородности остатков по дисперсии мало сказывается на качестве оценок регрессии, если эти дисперсии не скоррелированы с независимыми факторами. Это — случай гетероскедастичности «без негативных последствий» . 9

Источники гетероскедастичности – 1 Истинная гетероскедастичность возникает в перекрестных выборках при зависимости масштаба изменений зависимой переменной от некоторой переменной, называемой фактором пропорциональности (Z). Очень часто Z совпадает (функционально связан) с одной из независимых переменных 10

Замечание: Следует заметить, что факт зависимости дисперсий ошибок от независимых факторов в экономике весьма распространен. В экономике одинаковыми по дисперсии скорее являются относительные (ε/Y) , а не абсолютные (ε) ошибки. Поэтому, когда оценивается модель на основе данных по предприятиям, которые могут иметь (и, как правило, имеют) различные масштабы, гетероскедастичности с негативными последствиями просто не может не быть. 11

Источники гетероскедастичности – 2 Истинная гетероскедастичность возникает внутри любой модели в случае, если качество данных варьируется внутри выборки. 12

Последствия гетероскедастичности 1. Истинная гетероскедастичность не приводит к смещению оценок коэффициентов регрессии 2. Гетероскедастичность увеличивает дисперсии оценок коэффициентов регрессии 13

следовательно 1. Стандартные ошибки коэффициентов (вычисленные в предположении. гомоскедастичности) будут занижены 2. Это приведет к завышению t-статистик и даст неправильное (завышенное) представление о точности оценок 14

Обнаружение гетероскедастичности Предварительная работа: 1. Нет ли очевидных ошибок спецификации? 2. Можно ли содержательно предполагать какой-то вид гетероскедастичности? 3. Рассмотрение графиков остатков 15

Графический анализ остатков При множественной регрессии вместо объясняющих переменных Xj по оси абсцисс откладывают значения Yi, получаемые из уравнения регрессии. 16

Формальное обнаружение гетероскедастичности (статистические тесты) 1. 2. 3. 4. 5. 6. Тест Тест ранговой корреляции Спирмена. Парка. Глейзера. Голдфелда-Квандта. Уайта. Бреуша-Пагана. 17

Тест ранговой корреляции Спирмена В случае гетероскедастичности абсолютные величины остатков ei и значения регрессоров xi будут коррелированны. Остатки гомоскедастичны 1. Значения xi и ei ранжируются (упорядочиваются по величине) 2. Определяется коэффициент ранговой корреляции di – разность между рангами (например, если х20 является 25 по величине среди всех наблюдений Х, а е 20 является 32, то di = 25 – 32 = -7) 3. Вычислить статистику 18

5. Сравнить найденную статистику с критической распределения Стьюдента Если Гипотеза об отсутствии гетероскедастичности отклоняется. Гетероскедастичность присутствует! 19

Тест Парка Здесь предполагается, что дисперсии связаны с фактором пропорциональности Z в виде: Т. к. дисперсии неизвестны, то их заменяют оценками квадратов ошибок. 20

Тест Парка. Алгоритм применения 1. Строится уравнение регрессии: и вычисляются остатки 2. Выбирается фактор пропорциональности Z и оценивают вспомогательное уравнение регрессии: 21

3. Проверяют значимость коэффициента при Значимость коэффициента на основе t статистики означает наличие гетероскедастичности. 22

Тест Голдфелда-Квандта. Алгоритм применения 1. Выделяют фактор пропорциональности Данные упорядочиваются в порядке возрастания величины Z. (Z =Xk). 2. Отбрасывают среднюю треть упорядоченных наблюдений. Для первой и последней третей строятся две отдельные регрессии, используя ту же спецификацию модели регрессии. 3. Количество наблюдений в этих подвыборках должно быть одинаково. Обозначим его l. 23

Тест Голдфелда-Квандта. Алгоритм применения 4. Берутся суммы квадратов остатков для регрессий по первой трети RSS 1 и последней трети RSS 3. Рассчитывают их отношение: 5. Используем F-тест для проверки гомоскедастичности. Если статистика GQ удовлетворяет неравенству то гипотеза гомоскедастичности остатков отвергается на уровне значимости . 24

Тест Голдфелда-Квандта. Замечание Тест Голдфелда-Квандта применим и для случая обратной пропорциональности: При этом используется та же процедура, но тестовая статистика равна: 25

Тест Уайта Предполагается, что дисперсии объясняющими переменными в виде: связаны с где f( ) – квадратичная функция от аргументов. Т. к. дисперсии неизвестны, то их заменяют оценками квадратов отклонений ei 2. 26

Тест Уайта. Алгоритм применения (на примере трех переменных) 1. Строится уравнение регрессии: и вычисляются остатки. 2. Оценивают вспомогательное уравнение регрессии: 27

Тест Уайта. Алгоритм применения (на примере трех переменных) 3. Определяют из вспомогательного уравнения тестовую статистику 4. Проверяют общую значимость уравнения с помощью критерия 2. Если то гипотеза гомоскедастичности отвергается. Число степеней свободы k равно числу объясняющих переменных вспомогательного уравнения. В частности, для рассматриваемого случая k = 9. 28

Тест Глейзера Здесь предполагается, что дисперсии связаны с фактором пропорциональности Z в виде: Т. к. средние квадратические отклонения неизвестны, то их заменяют модулями оценок отклонений. 29

Тест Глейзера. Алгоритм применения 1. Строится уравнение регрессии: и вычисляются остатки. 2. Выбирается фактор пропорциональности Z и оценивают вспомогательное уравнение регрессии: Изменяя , строят несколько моделей: 3. Статистическая значимость коэффициента 1 в каждом случае означает наличие гетероскедастичности. 4. Если для нескольких моделей будет получена значимая оценка 1 , то характер гетероскедастичности определяют по наиболее значимой из них. 30

Тест Бреуша-Пагана Тест применим в предположении, что: Дисперсии зависят от некоторых дополнительных переменных : 31

Тест Бреуша-Пагана. Алгоритм применения 1. Строится уравнение регрессии: и вычисляются остатки: 2. Вычисляют оценку дисперсии остатков: 3. Строят вспомогательное уравнение регрессии: 32

Тест Бреуша-Пагана. Алгоритм применения 4. Для вспомогательного уравнения регрессии определяют объясненную часть вариации ESS. 5. Находим тестовую статистику: 6. Если верна гипотеза H 0: гомоскедастичность остатков, то статистика BP имеет распределение. Т. е. о наличии гетероскедастичности остатков на уровне значимости свидетельствует: 33

Средства при гетероскедастичности 1. Использовать обобщенный метод наименьших квадратов. 2. Переопределить переменные. 3. Вычисление стандартных ошибок с поправкой на гетероскедастичность (метод Уайта). 34

Метод взвешенных наименьших квадратов Если ошибки не коррелированны, а модель гетероскедастична, т. е. ковариационная матрица диагональная: В этом случае гетероскедастичность устраняется нормированием (взвешиванием) по 35

Например, для парной регрессии Вводя новые переменные Получим уравнение регрессии с гомоскедастичным случайным членом 36

Практика использования В силу того, что значения обычно неизвестны используют либо их оценки, либо (чаще) предположения о характере их зависимости от хi Например: Получают МНК оценки для уравнения 37