Скачать презентацию Тема 2 П РИМЕНЕНИЕ ПАРНОЙ РЕГРЕССИИ В ЭКОНОМЕТРИЧЕСКИХ Скачать презентацию Тема 2 П РИМЕНЕНИЕ ПАРНОЙ РЕГРЕССИИ В ЭКОНОМЕТРИЧЕСКИХ

Тема2 Парная регрессия 2012-2013.ppt

  • Количество слайдов: 80

Тема 2 П РИМЕНЕНИЕ ПАРНОЙ РЕГРЕССИИ В ЭКОНОМЕТРИЧЕСКИХ ИССЛЕДОВАНИЯХ 1. 2. 3. 4. 5. Тема 2 П РИМЕНЕНИЕ ПАРНОЙ РЕГРЕССИИ В ЭКОНОМЕТРИЧЕСКИХ ИССЛЕДОВАНИЯХ 1. 2. 3. 4. 5. 6. 7. 8. Выбор типа математической функции при построении уравнения регрессии. Оценка параметров уравнения парной линейной регрессии. Показатели силы связи в моделях парной регрессии. Показатели тесноты связи в моделях парной регрессии. Статистическая оценка достоверности регрессионной модели. Интервальная оценка параметров уравнения парной регрессии. Использование модели парной регрессии для прогнозирования. Визуальный анализ остатков.

ПАРНАЯ РЕГРЕССИЯ И КОРРЕЛЯЦИЯ p Регрессный анализ заключается в определении аналитического выражения связи между ПАРНАЯ РЕГРЕССИЯ И КОРРЕЛЯЦИЯ p Регрессный анализ заключается в определении аналитического выражения связи между явлениями, в котором изменение одной величины (зависимой) обусловлено влиянием одной или нескольких независимых величин

Условия применения корреляционнорегрессионного метода Наличие данных по достаточно большой совокупности p Однородность совокупности p Условия применения корреляционнорегрессионного метода Наличие данных по достаточно большой совокупности p Однородность совокупности p Необходимость подчинения распределения совокупности по факторному и результативному признакам нормальному закону распределения p

Задачи корреляционно-регрессионн анализа Измерение параметров уравнения, выражающего связь между признаками. Эта задача решается оценкой Задачи корреляционно-регрессионн анализа Измерение параметров уравнения, выражающего связь между признаками. Эта задача решается оценкой параметров уравнения регрессии. p Измерение тесноты связи между признаками. Данная задача решается с помощью показателей корреляции. p

Виды функций, наиболее часто используемы эконометрическом моделировании p Линейная p Гипербола Парабола второго порядка Виды функций, наиболее часто используемы эконометрическом моделировании p Линейная p Гипербола Парабола второго порядка p p Логарифмическая функция p p Степенная функция Показательная функция Экспонента Обратная функция

Методы выбора типа математической функции • • • Аналитический метод (теоретический анализ связи рассматриваемого Методы выбора типа математической функции • • • Аналитический метод (теоретический анализ связи рассматриваемого фактора и результата) Графический метод Экспериментальный метод

ЛИНЕАРИЗАЦИЯ НЕЛИНЕЙНЫХ УРАВНЕНИЙ ЛИНЕАРИЗАЦИЯ НЕЛИНЕЙНЫХ УРАВНЕНИЙ

Оценивание параметров моделей p p Эконометрическое оценивание моделей включает два основных этапа: Теоретический. Считается, Оценивание параметров моделей p p Эконометрическое оценивание моделей включает два основных этапа: Теоретический. Считается, что определена генеральная совокупность. Зная те или иные статистические свойства этой совокупности, можно теоретически определить параметры модели. Эмпирический. Исследователь использует лишь выборочные данные. На этом этапе можно оценить, но нельзя точно определить значения параметров модели, поскольку они являются случайными величинами.

Согласно выборочному методу статистики характеристики генеральной совокупности принято называть параметрами, а характеристики выборочной совокупности Согласно выборочному методу статистики характеристики генеральной совокупности принято называть параметрами, а характеристики выборочной совокупности – оценками. p Оценка генеральных параметров может быть получена двумя методами: p n n а) методом наименьших квадратов (МНК) б) методом максимального правдоподобия

Свойства оценок p Несмещенность p Эффективность p Состоятельность Свойства оценок p Несмещенность p Эффективность p Состоятельность

Несмещенность p Несмещенность означает, что Несмещенность p Несмещенность означает, что "в среднем" оценка соответствует параметру при любом объеме выборки

Эффективность Несмещенная оценка называется эффективной, если она имеет минимальную дисперсию по сравнению с другими Эффективность Несмещенная оценка называется эффективной, если она имеет минимальную дисперсию по сравнению с другими выборочными оценками. p Та из оценок, которая имеет меньшую дисперсию является более эффективной. p

Состоятельность p Оценка называется состоятельной, если при увеличении объема выборки она стремится к оцениваемому Состоятельность p Оценка называется состоятельной, если при увеличении объема выборки она стремится к оцениваемому параметру. p Другими словами когда. не отличается от ,

Оценка параметров уравнения парной линей регрессии Для оценки параметров функций, линейных по параметрам, используется Оценка параметров уравнения парной линей регрессии Для оценки параметров функций, линейных по параметрам, используется метод наименьших квадратов (МНК). p МНК позволяет получить такие оценки параметров, при которых сумма квадратов отклонений фактических значений результативного признака от теоретических минимальна: p

Оценка параметров уравнения парной линей регрессии Для линейных и нелинейных уравнений, приводимых к линейным, Оценка параметров уравнения парной линей регрессии Для линейных и нелинейных уравнений, приводимых к линейным, решается следующая система относительно и :

Формулы расчета параметров уравнени парной регрессии p p - свободный член уравнения регрессии (пересечение, Формулы расчета параметров уравнени парной регрессии p p - свободный член уравнения регрессии (пересечение, intercept). Экономически не интерпретируется. - наклон линии регрессии (slope) или коэффициент регрессии. Он является мерой зависимости переменной от переменной. В линейном уравнении регрессии параметр является абсолютным показателем силы связи.

Линия регрессии Линия регрессии

Условия применения МНК p p p Модель регрессии должна быть линейной по параметрам. x Условия применения МНК p p p Модель регрессии должна быть линейной по параметрам. x – не стохастическая переменная. Значения ошибки (остатка)- случайные. Их изменение не образует определенной модели. Число наблюдений должно быть больше числа оцениваемых параметров (в 5 -6 раз). Значения переменной x не должны быть одинаковыми.

Условия применения МНК Изучаемая совокупность должна быть однородной. p Отсутствие взаимосвязи между фактором x Условия применения МНК Изучаемая совокупность должна быть однородной. p Отсутствие взаимосвязи между фактором x и остатком. p Модель регрессии должна быть корректно специфицирована. p В модели не должно наблюдаться тесной взаимосвязи между факторами (это условие для множественной регрессии). p

Пример Инвестиции в основной капитал на Федеральный округ душу населения, тыс. руб. 2009 г. Пример Инвестиции в основной капитал на Федеральный округ душу населения, тыс. руб. 2009 г. Центральный 51, 9 Северо-Западный 69, 4 Южный 51, 7 Северо-Кавказский 20 Приволжский 42, 4 Уральский 109, 1 Сибирский 42, 7 Дальневосточный 106, 4 Валовой региональный продукт на душунаселения, тыс. руб. 2009 г. 308, 3 253, 2 145 86, 3 163, 3 358, 4 173, 4 268, 3

Пример № 1 2 3 4 5 6 7 8 Итого Среднее значение y Пример № 1 2 3 4 5 6 7 8 Итого Среднее значение y 308, 3 253, 2 145, 0 86, 3 163, 3 358, 4 173, 4 268, 3 1756, 2 x 51, 9 69, 4 51, 7 20, 0 42, 4 109, 1 42, 7 106, 4 493, 6 yx x 2 16000, 77 2693, 61 17572, 08 4816, 36 7496, 50 2672, 89 1726, 00 400, 00 6923, 92 1797, 76 39101, 44 11902, 81 7404, 18 1823, 29 28547, 12 11320, 96 124772 37427, 68 219, 525 61, 7 15596, 5 4678, 46

Пример Парная регрессия. Линейная зависимость Пример Парная регрессия. Линейная зависимость

Пример № y x lgy lgx lgy*lgx (lgx)2 y 2 1 51, 9 2, Пример № y x lgy lgx lgy*lgx (lgx)2 y 2 1 51, 9 2, 488974 1, 715167 4, 269006 2, 941799 95048, 89 2 253, 2 69, 4 2, 403464 1, 841359 4, 425641 3, 390605 64110, 24 3 145, 0 51, 7 2, 161368 1, 713491 3, 703484 2, 93605 21025 4 86, 3 20, 0 1, 936011 1, 30103 2, 518808 1, 692679 7447, 69 5 163, 3 42, 4 2, 212986 1, 627366 3, 601338 2, 64832 26666, 89 6 358, 4 109, 1 2, 554368 2, 037825 5, 205354 4, 15273 128450, 6 7 173, 4 42, 7 2, 239049 1, 630428 3, 650608 2, 658295 30067, 56 8 Итого Среднее значение 308, 3 268, 3 106, 4 2, 428621 2, 026942 4, 922672 4, 108492 71984, 89 1756, 2 493, 6 18, 42484 13, 89361 32, 29691 24, 52897 444801, 7 219, 525 61, 7 2, 303105 1, 736701 4, 037114 3, 066121 55600, 22

Продолжение примера Парная регрессия. Степенная зависимость Продолжение примера Парная регрессия. Степенная зависимость

Пример Парная регрессия. Степенная зависимость Расчет параметров Пример Парная регрессия. Степенная зависимость Расчет параметров

Пример Парная регрессия. Степенная зависимость Пример Парная регрессия. Степенная зависимость

Показатели силы связи в моделях парной регрессии. p p Абсолютные. Показывают, на сколько единиц Показатели силы связи в моделях парной регрессии. p p Абсолютные. Показывают, на сколько единиц в среднем меняется результативный признак при изменении факторного признака на одну единицу. В линейном уравнении параметр абсолютный показатель силы связи. Относительные (коэффициенты эластичности). Показывают, на сколько процентов в среднем меняется результативный признак при изменении факторного признака на один процент.

Абсолютные и относительные показатели сил связи для основных видов функций Абсолютные и относительные показатели сил связи для основных видов функций

Продолжение примера p Линейная функция: С увеличением инвестиций в основной капитал на 1 тыс. Продолжение примера p Линейная функция: С увеличением инвестиций в основной капитал на 1 тыс. руб. ВРП на душу населения возрастает в среднем на 2, 354 тыс. руб.

Продолжение примера Линейная функция: Степенная функция: Продолжение примера Линейная функция: Степенная функция:

Показатели тесноты связи в моделях парной регрессии Коэффициент детерминации – обобщающий показатель оценки построенного Показатели тесноты связи в моделях парной регрессии Коэффициент детерминации – обобщающий показатель оценки построенного уравнения регрессии

ПРАВИЛО СЛОЖЕНИЯ ДИСПЕРСИЙ p -общая сумма квадратов отклонений (total sum of squares); p - ПРАВИЛО СЛОЖЕНИЯ ДИСПЕРСИЙ p -общая сумма квадратов отклонений (total sum of squares); p - факторная сумма квадратов отклонений (sum of squares due to regression); p - остаточная сумма квадратов отклонений (sum of squares due to error).

ПРАВИЛО СЛОЖЕНЯ ДИСПЕРСИЙ ПРАВИЛО СЛОЖЕНЯ ДИСПЕРСИЙ

Коэффициент детерминации Коэффициент детерминации

Коэффициент детерминации pпоказывает долю вариации (дисперсии) результативного признака, объясняемую регрессией, в общей вариации результата Коэффициент детерминации pпоказывает долю вариации (дисперсии) результативного признака, объясняемую регрессией, в общей вариации результата

Индекс корреляции Индекс корреляции

Коэффициент корреляции Коэффициент корреляции

Шкала значений коэффициента (инд корреляции p До 0, 3 связь слабая p 0, 3 Шкала значений коэффициента (инд корреляции p До 0, 3 связь слабая p 0, 3 -0, 5 связь умеренная p 0, 5 -0, 7 связь заметная p 0, 7 -0, 9 связь высокая p 0, 9 -1, 0 связь весьма высокая, близкая к функциональной

Свойства линейного коэффициент корреляции p p Это стандартизованный коэффициент регрессии Сравним для признаков, имеющих Свойства линейного коэффициент корреляции p p Это стандартизованный коэффициент регрессии Сравним для признаков, имеющих различные единицы измерения Если связь между y и x отсутствует, то , но не всегда означает отсутствия связи (связь может быть нелинейной)

Продолжение примера Линейная функция Продолжение примера Линейная функция

Продолжение примера Продолжение примера

Продолжение примера. Расчет теоретических значений результативного при линейной функции Продолжение примера. Расчет теоретических значений результативного при линейной функции

Продолжение примера. Расчет коэффициента детерминации для линей функции Продолжение примера. Расчет коэффициента детерминации для линей функции

Продолжение примера. Расчет теоретических значений результативного при степенной функции Продолжение примера. Расчет теоретических значений результативного при степенной функции

Продолжение примера Продолжение примера

Продолжение примера. Расчет индекса детерминации для степенной функции Продолжение примера. Расчет индекса детерминации для степенной функции

Продолжение примера. Расчет показателей корреляции Продолжение примера. Расчет показателей корреляции

СТАТИСТИЧЕСКАЯ ПРОВЕРКА ГИПОТЕЗ p Статистической гипотезой называется предположение о свойстве генеральной совокупности, которое можно СТАТИСТИЧЕСКАЯ ПРОВЕРКА ГИПОТЕЗ p Статистической гипотезой называется предположение о свойстве генеральной совокупности, которое можно проверить, опираясь на данные выборки. Обозначается буквой H (лат. hypothesis).

Этапы проверки статистических гипо формулируется в виде статистической гипотезы задача исследования; p выбирается статистическая Этапы проверки статистических гипо формулируется в виде статистической гипотезы задача исследования; p выбирается статистическая характеристика гипотезы; p выдвигаются испытуемая и альтернативная гипотезы; p определяется область допустимых значений, критическая область и критическое значение статистического критерия; p

Этапы проверки статистических гипо вычисляется фактическое значение статистического критерия; p испытуемая гипотеза проверяется на Этапы проверки статистических гипо вычисляется фактическое значение статистического критерия; p испытуемая гипотеза проверяется на основе сравнения значений фактического и критического критерия, и в зависимости от результатов проверки гипотеза либо отклоняется, либо принимается. p

Статистическая оценка достоверности регрессионной модели p Выдвигается H 0 : r 2 в генеральной Статистическая оценка достоверности регрессионной модели p Выдвигается H 0 : r 2 в генеральной совокупности = 0 p Выдвигается H 1: r 2 в генеральной совокупности 0 p p Определяется уровень значимости доверительная вероятность). (1 минус p Рассчитывается критерий Фишера p Определяется табличное значение критерия Фишера Fтабл. p Фактическое значение сравнивается с табличным

Критическая область –это область, попадание значения статистического критерия в которую приводит к отклонению H Критическая область –это область, попадание значения статистического критерия в которую приводит к отклонению H 0. Вероятность попадания значения критерия в эту область равна приятому уровню значимости (1 минус доверительная вероятность). p Область допустимых значений область, попадание значения статистического критерия в которую приводит к принятию нулевой гипотезы. p

Оценка значимости уравнения парн регрессии p Если F>Fтабл. , то гипотеза о случайной природе Оценка значимости уравнения парн регрессии p Если F>Fтабл. , то гипотеза о случайной природе оцениваемых характеристик отклоняется и признается статистическая значимость и надежность уравнения. p Если F

p p Число степеней свободы (degrees of freedom - df) - число свободно варьируемых p p Число степеней свободы (degrees of freedom - df) - число свободно варьируемых переменных

Дисперсии на одну степень свобод Дисперсии на одну степень свобод

F-критерий Фишера p - число единиц совокупности; p - число параметров при переменных(число факторов) F-критерий Фишера p - число единиц совокупности; p - число параметров при переменных(число факторов) p

Продолжение примера p Для линейной функции: p Для степенной функции: Продолжение примера p Для линейной функции: p Для степенной функции:

Таблица дисперсионного анализа Таблица дисперсионного анализа

Оценка качества модели на основе ош аппроксимации Оценка качества модели на основе ош аппроксимации

Расчет ошибки аппроксимации № x y 1 51, 9 308, 3 196, 4526 111, Расчет ошибки аппроксимации № x y 1 51, 9 308, 3 196, 4526 111, 8474 36, 2788 2 69, 4 253, 2 237, 6476 15, 5524 6, 1423 . 51, 7 145, 0 195, 9818 -50, 9818 35, 1599 . 20, 0 86, 3 121, 36 -35, 06 40, 6257 . 42, 4 163, 3 174, 0896 -10, 7896 6, 6072 109, 1 358, 4 331, 1014 27, 2986 7, 6168 42, 7 173, 4 174, 7958 -1, 3958 0, 8050 106, 4 Х 268, 3 324, 7456 -56, 4456 21, 0382 Х Х Х 154, 2739 Итого

Оценка значимости коэффициенто регрессии Выдвигается : коэффициент регрессии в генеральной совокупности равен 0 p Оценка значимости коэффициенто регрессии Выдвигается : коэффициент регрессии в генеральной совокупности равен 0 p Выдвигается : коэффициент регрессии в генеральной совокупности не равен 0 p Определяется уровень значимости p

Оценка значимости коэффициенто регрессии p p p Определяется критическое значение критерия Стьюдента Рассчитывается критерий Оценка значимости коэффициенто регрессии p p p Определяется критическое значение критерия Стьюдента Рассчитывается критерий Стьюдента - случайная ошибка коэффициента регрессии

Расчет случайной ошибки параметра a Расчет случайной ошибки параметра a

Оценка значимости коэффициенто регрессии p Если t>tтабл. , то отклоняется, то есть параметр не Оценка значимости коэффициенто регрессии p Если t>tтабл. , то отклоняется, то есть параметр не случайно отличается от нуля, и сформировался под влиянием систематически действующего фактора. p Если t

Продолжение примера Продолжение примера

Продолжение примера p tтабл. =2, 447 p t>tтабл. Продолжение примера p tтабл. =2, 447 p t>tтабл.

Построение доверительных интервалов для коэффициентов регрессии Построение доверительных интервалов для коэффициентов регрессии

Продолжение примера Продолжение примера

Проверка достоверности коэффициента корре Проверка достоверности коэффициента корре

Использование модели парной регре для прогнозирования Использование модели парной регре для прогнозирования

Использование модели парной регре для прогнозирования Использование модели парной регре для прогнозирования

95%-ый доверительный интервал 95%-ый доверительный интервал

Продолжение примера Продолжение примера

Продолжение примера Продолжение примера

Продолжение примера Продолжение примера

Свойства остатков p p p Отсутствие связи между остатками и объясняющей переменной. Отсутствие связи Свойства остатков p p p Отсутствие связи между остатками и объясняющей переменной. Отсутствие связи между остатками и предсказанными значениями. Математическое ожидание остатков равно нулю. Остатки имеют постоянную дисперсию. Дисперсия остатков равна единице. Постоянство дисперсии остатков называют гомоскедастичностью остатков. Если же дисперсия остатков непостоянна, то имеет место гетероскедастичность остатков. Остатки не коррелированны между собой. Остатки распределены по нормальному закону распределения

График остатков ( residual plot ) (случай гомоскедастичности) p+ p+ pх p- p- p- График остатков ( residual plot ) (случай гомоскедастичности) p+ p+ pх p- p- p-

Зависимость остатков от выровненного значения результата нет зависимости (гомоскедастичность) дисперсия остатков увеличивается с увеличением Зависимость остатков от выровненного значения результата нет зависимости (гомоскедастичность) дисперсия остатков увеличивается с увеличением выровненного значения результата (один из случаев гетероскедастичности