Нелинейная регрессия n Один из недостатков

Скачать презентацию Нелинейная регрессия   n Один из недостатков Скачать презентацию Нелинейная регрессия n Один из недостатков

8 Нелинейная регрессия.ppt

  • Количество слайдов: 51

>Нелинейная регрессия Нелинейная регрессия

> n Один из недостатков линейного регрессионного анализа состоит в том,  что он n Один из недостатков линейного регрессионного анализа состоит в том, что он может быть применен только к линейным уравнениям. n Очень часто зависимости между экономическими факторами являются нелинейными Уравнения являются нелинейными

>n  Нелинейность по переменным всегда можно свести к линейной путём использования  n Нелинейность по переменным всегда можно свести к линейной путём использования соответствующих определений. n Например, предположим, что соотношение имеет вид: y=α+βx 2 n Если определить z= x 2 , то уравнение y=α+βz будет линейным

>Пример Исследуем соотношение между ежегодным потреблением  бананов  и годовым доходом.  В Пример Исследуем соотношение между ежегодным потреблением бананов и годовым доходом. В таблице приведены наблюдения для десяти семей

> n  Уравнения линейной регрессии между y и x: На рисунке представлены точки, n Уравнения линейной регрессии между y и x: На рисунке представлены точки, соответствующие наблюдениям, а также график уравнения регрессии между y и x: Из рисунка видно, что график уравнения регрессии не вполне соответствует точкам наблюдений. Очевидно, что точки наблюдения лежат на кривой, тогда как уравнение регрессии характеризуется прямой

> n  Не трудно заметить,  что функциональная зависимость между y  и n Не трудно заметить, что функциональная зависимость между y и x определена неправильно n То, что допущена ошибка можно также понять с помощью анализа остатков. Значения остатков приведены в таблице Остатки должны чередоваться случайным образом. Как видно из таблицы, сначала остатки отрицательны, затем становятся положительными, достигают максимума, а потом снова уменьшаются и становятся отрицательными: это свидетельствует о неверном выборе вида зависимости.

>n  Предполагаем, что истинное соотношение имеет вид  Если мы знаем это и n Предполагаем, что истинное соотношение имеет вид Если мы знаем это и определим то уравнение примет линейный вид

>n  Значение z для каждой семьи посчитано в таблице n Значение z для каждой семьи посчитано в таблице

>  Оценив регрессию между y и z, получим Подставив  имеем:  Оценив регрессию между y и z, получим Подставив имеем:

>n  На рисунках показаны регрессионная зависимость и точки наблюдений для x, y, z: n На рисунках показаны регрессионная зависимость и точки наблюдений для x, y, z:

>  Логарифмические   преобразования n  Рассмотрим функции,  которые являются нелинейными Логарифмические преобразования n Рассмотрим функции, которые являются нелинейными как по параметрам, так и по переменным q. Это соотношение может быть преобразовано в линейное уравнение путем логарифмирования обеих частей соотношения.

>n  Если обозначить то уравнение можно будет записать в виде n Если обозначить то уравнение можно будет записать в виде

>Процедура оценивания регрессии будет следующей. n  С начала вычислим y’ и z для Процедура оценивания регрессии будет следующей. n С начала вычислим y’ и z для каждого наблюдения с помощью логарифмов от исходных значений. n Затем оценим регрессионную зависимость y’ от z. n Коэффициент при z будет представлять собой непосредственно оценку β. Постоянный член является оценкой ά. n Для получения оценки необходимо взять антилогарифм, т. е. , вычислить.

>Моделирование эластичности  n  Функции этого вида часто встречаются в   Моделирование эластичности n Функции этого вида часто встречаются в экономике. n Эта общая форма кривых Энгеля, y представляет собой спрос на товар, x-доход, а β-эластичность спроса по доходу. n Докажем указанное свойство эластичности.

>n  Независимо от математической связи между y и x или определения величин y n Независимо от математической связи между y и x или определения величин y и x, эластичность y по x рассчитывается как относительное изменение y на единицу относительного изменения x: Таким образом, если y-это спрос, а х- доход, то выражение определяет эластичность спроса на данный товар по доходу.

>  n  Выражение для эластичность можно   переписать в следующем виде n Выражение для эластичность можно переписать в следующем виде С функцией спроса его можно представить как соотношение предельной склонности к потреблению товара к средней склонности к потреблению данного товара.

>n  Если соотношение между y и x имеет вид n Если соотношение между y и x имеет вид

> n  Таким образом,  если имеется кривая Энгеля  вида , n Таким образом, если имеется кривая Энгеля вида , nэто означает, что эластичность спроса по доходу = 0, 3.

>n Функция этого вида может также      применяться к кривым n Функция этого вида может также применяться к кривым спроса, где y- спрос на товар, х-цена товара, β - эластичность спроса по цене.

>n Что произойдёт,  если математическая  связь между y и x будет другая. n Что произойдёт, если математическая связь между y и x будет другая. n Предположим, имеется обычное линейное уравнение y=α+βx следовательно эластичность определяется следующим образом: В этом случае значение эластичности в любой точке будет зависеть не только от значения β , но также от значений y и x.

> Показательные функции n  Показательные  (экспоненциальные) функции – это функции вида: Показательные функции n Показательные (экспоненциальные) функции – это функции вида:

>n  Наиболее общим их приложением является случай, когда  предполагается,  что переменная n Наиболее общим их приложением является случай, когда предполагается, что переменная y имеет постоянный темп прироста во времени, в этом случае вместо х обычно используется время (t), а вместо β - постоянный темп прироста (r):

>n  Если имеются значения y для       нескольких n Если имеются значения y для нескольких временных периодов( 1, …, T ), то параметры α и r можно оценить, если прологарифмировать (по основанию e) обе части уравнения:

>n  Если определить ά=log α и y’=log y , то получим:  y’= n Если определить ά=log α и y’=log y , то получим: y’= ά+rt n Таким образом, оценивая регрессию между логарифмом и t мы непосредственно y получаем оценку темпа прироста r. n Обычно оценка имеет второстепенное значение, но если она представляет интерес, то можно получить её, взяв антилогарифм α от ά.

>   Пример n  Кривая Энгеля была построена для расходов на питание Пример n Кривая Энгеля была построена для расходов на питание в США за период с 1959 по 1983 г.

>n  Однако вместо линейной функции в данном случае использовалась не линейная,  а n Однако вместо линейной функции в данном случае использовалась не линейная, а приведённая к линейному виду, путём логарифмирования. n Преобразованное выражение имело вид: Выполнив обратное преобразование, получим:

>n  Полученный результат предполагает,  что эластичность спроса на продукты питания по доходу n Полученный результат предполагает, что эластичность спроса на продукты питания по доходу составляет 0, 55 что означает, что увеличение личного располагаемого дохода на 1% приведёт к увеличению расходов на питание на 0, 55%. n Коэффициент 3, 32 помогает прогнозировать значения при заданных значениях x, y приводя их к единому масштабу.

>   Случайный член n  Основное требование состоит в том,  чтобы Случайный член n Основное требование состоит в том, чтобы случайный член в преобразованном уравнении присутствовал в виде слагаемого и удовлетворял условиям Гаусса-Маркова. n В противном случает мы не сможем привести уравнение к линейному виду.

>n  Например , если исходное уравнение имеет такой вид   В этом n Например , если исходное уравнение имеет такой вид В этом случае проблем нет, т. к. уравнение преобразуется к линейному путем замены z=1/x и аддитивный случайный член этому не мешает.

>n  Если используется модель вида:  y= α x β и мы собираемся n Если используется модель вида: y= α x β и мы собираемся преобразовать его к линейному путем логарифмирования , то случайный член должен быть мультипликативным y=αxβ v. n В этом случае мы получаем соотношение: Следовательно, для получения аддитивного случайного члена в уравнении регрессии мы должны начинать с мультипликативного случайного члена в исходном уравнении.

> Нелинейная регрессия. Общий случай  n  Предположим, что переменная y связана Нелинейная регрессия. Общий случай n Предположим, что переменная y связана с переменной x следующим соотношением: и нужно получить оценки α β γ , имея значения y и x. Такое уравнение не может быть преобразовано в уравнение линейного вида. Тем не менее для получения оценок параметров мы можем применить принцип минимизации суммы квадратов отклонений.

>n  Процедура состоит из последовательности шагов. n  1.  Принимаются некоторые правдоподобные n Процедура состоит из последовательности шагов. n 1. Принимаются некоторые правдоподобные исходные значения параметров. n 2. Вычисляются предсказанные значения y по фактическим значениям х с использованием этих значений параметров. n 3. Вычисляются остатки для всех наблюдений в выборке и, следовательно, S- сумма квадратов остатков. n 4. Вносятся небольшие изменения в одну или более оценку параметров.

>n  5.  Вычисляются новые предсказанные значения y, остатки и S.  n n 5. Вычисляются новые предсказанные значения y, остатки и S. n 6. Если S меньше, чем прежде, то новые оценки параметров лучше прежних и их следует использовать в качестве новой отправной точки.

>n  7.  Шаги 4,  5 и 6 повторятся вновь до тех n 7. Шаги 4, 5 и 6 повторятся вновь до тех пор, пока не окажется невозможным внести такие изменения в оценки параметров, которые привели бы к уменьшению S. n 8. Делается вывод о том, что величина S минимизирована и конечные оценки параметров являются оценками по методу наименьших квадратов.

>    Пример n  Вернемся к примеру с бананами,  где Пример n Вернемся к примеру с бананами, где y и x связаны между собой зависимостью: Предположим, что мы знаем, что α=12 ; значит нам надо определить только один неизвестный параметр. Предположим, что мы поняли, что зависимость имеет вид такой , однако не будем приводить уравнение к линейному виду. Вместо этого мы применяем нелинейную регрессию.

>n  Значения S ,  которые будут получены при любом возможном выборе b n Значения S , которые будут получены при любом возможном выборе b при значениях и x , приведенные в y таблице:

>n  Предположим, что мы начнем, приняв b равным -6.  n  Уравнение n Предположим, что мы начнем, приняв b равным -6. n Уравнение при этом примет вид:

>n  Вычислим предсказанные значения y и     остатки на основании n Вычислим предсказанные значения y и остатки на основании последних вычислим значение S=24, 02. n Затем подставим b=-7. Теперь величина S равна 13, 401, т. е. она уменьшилась. n Значит, мы движемся в правильном направлении. n Подставим b=-8, тогда S=5, 87. n Продолжим дальше. При b=-9 значение S равно 1, 44 ; при b=-10 значение S составит 0, 12; при b=-11 оно будет 1, 89.

>n  Очевидно,  что,  выбрав b=-11 ,  мы перестарались,  т. n Очевидно, что, выбрав b=-11 , мы перестарались, т. к. значение S вновь начало расти. n Будем двигаться назад, но более мелкими шагами, например по 0, 1 , беря значение -10, 9; -10, 8 и т. д. n Продолжим движение назад до тех пор, пока опять не будет «перебора» , затем вновь начнем двигаться вперед еще более мелкими шагами.

>n  Каждый раз,  когда будет наблюдаться  «перебор» ,   будем n Каждый раз, когда будет наблюдаться «перебор» , будем изменять направление на противоположное, сокращая размер шага. n Будем продолжать делать это до тех пор, пока не достигнем требуемой точности вычисления оценки.

> n  Последовательность шагов показана в  таблице. Процесс в таблице был прекращен n Последовательность шагов показана в таблице. Процесс в таблице был прекращен после 32 итераций, было видно, что оценка находится между -9, 92 и -9, 94. Если дальше продолжать итерационный процесс, то можно получить более высокую точность.

>n  Хотя полученная оценка близка к истинному значению 10,  она не совпадает n Хотя полученная оценка близка к истинному значению 10, она не совпадает с оценкой, полученной для уравнения Расхождение вызвано тем, что мы предположили, что α =12 , а не оценили его. Если бы мы искали наилучшие значения α и β нелинейным методом, то тогда мы бы получили оценку α = 12, 08, и оценку β= -10, 08.

>n  Основной недостаток нелинейной регрессии состоит в том,  что она оценивается значительно n Основной недостаток нелинейной регрессии состоит в том, что она оценивается значительно медленнее, чем линейная регрессия, особенно в том случае, когда приходится оценивать несколько параметров.

>  Выбор функции: тесты Бокса-    Кокса n  Проблема выбора Выбор функции: тесты Бокса- Кокса n Проблема выбора вида зависимости сложна и если значение коэффициента детерминации R 2 для разных моделей примерно равны, то проблема выбора может быть решена с помощью теста Бокса –Кокса (Box, Cox 1964)

>n  Если сравнивать модели  с использованием y и log  y в n Если сравнивать модели с использованием y и log y в качестве зависимой переменной, то можно использовать вариант теста, разработанный Полом Зарембкой (Zarembka 1968). n Этот тест предполагает такое преобразование масштаба наблюдений y , при котором обеспечивалась бы возможность непосредственного сравнения СКО ( RSS) в линейной и логарифмических моделях.

>n  Процедура включает следующие шаги: 1.  Вычисляется среднее геометрическое  значений y n Процедура включает следующие шаги: 1. Вычисляется среднее геометрическое значений y в выборке.

>2.  Пересчитываются наблюдения yi путем  деления на среднее геометрическое 2. Пересчитываются наблюдения yi путем деления на среднее геометрическое

>3.  Оценивается регрессия для линейной модели с использованием y * и для 3. Оценивается регрессия для линейной модели с использованием y * и для логарифмической модели с использованием log(y*). Теперь СКО (RSS) для двух регрессий сравнимы и, следовательно, модель с меньшей суммой квадратов отклонений обеспечивает лучшее соответствие.

>Более общий тест Бокса-Кокса n  Y и log y – это специальные случаи Более общий тест Бокса-Кокса n Y и log y – это специальные случаи функции ( Y λ -1)/ λ , из которой при λ =1 получается функция y , а при λ стремящемся к 0 функция log y. n Следует попробовать ряд значений λ , чтобы определить , какое из них дает минимальной значение СКО. n Это называется решетчатым поиском.

>     СКО λ  Продукты питания  жилье 1, 00 СКО λ Продукты питания жилье 1, 00 0, 0119 0, 0341 0, 75 0, 0117 0, 0304 0, 5 0, 0117 0, 0272 0, 25 0, 0118 0, 0244 0, 0119 0, 0221 -0, 25 0, 0122 0, 0202 -0, 5 0, 0127 0, 0187 -0, 75 0, 0132 0, 0178 -1, 0 0, 0139 0, 0174

>n  В таблице оптимальное значение  λ для продуктов питания составляет 0, 5 n В таблице оптимальное значение λ для продуктов питания составляет 0, 5 , что говорит о примерно одинаковой приемлемости линейной и логарифмической регрессий. n Для расходов на жилье регрессия обратных величин переменных дает более точный прогноз.