8 Нелинейная регрессия.ppt
- Количество слайдов: 52
Нелинейная регрессия
Один из недостатков линейного регрессионного анализа состоит в том, что он может быть применен только к линейным уравнениям. n Очень часто зависимости между экономическими факторами являются нелинейными n Уравнения являются нелинейными
n n n Нелинейность по переменным всегда можно свести к линейной путём использования соответствующих определений. Например, предположим, что соотношение имеет вид: y=α+βx 2 Если определить z= x 2 , то уравнение y=α+βz будет линейным
Пример Исследуем соотношение между ежегодным потреблением бананов и годовым доходом. В таблице приведены наблюдения для десяти семей
n Уравнения линейной регрессии между y и x: На рисунке представлены точки, соответствующие наблюдениям, а также график уравнения регрессии между y и x: Из рисунка видно, что график уравнения регрессии не вполне соответствует точкам наблюдений. Очевидно, что точки наблюдения лежат на кривой, тогда как уравнение регрессии характеризуется прямой
n n Не трудно заметить, что функциональная зависимость между y и x определена неправильно То, что допущена ошибка можно также понять с помощью анализа остатков. Значения остатков приведены в таблице Остатки должны чередоваться случайным образом. Как видно из таблицы, сначала остатки отрицательны, затем становятся положительными, достигают максимума, а потом снова уменьшаются и становятся отрицательными: это свидетельствует о неверном выборе вида зависимости.
n Предполагаем, что истинное соотношение имеет вид Если мы знаем это и определим то уравнение примет линейный вид
n Значение z для каждой семьи посчитано в таблице
Оценив регрессию между y и z, получим Подставив имеем:
n На рисунках показаны регрессионная зависимость и точки наблюдений для x, y, z:
Логарифмические преобразования n Рассмотрим функции, которые являются нелинейными как по параметрам, так и по переменным q. Это соотношение может быть преобразовано в линейное уравнение путем логарифмирования обеих частей соотношения.
n Если обозначить то уравнение можно будет записать в виде
Процедура оценивания регрессии будет следующей. n С начала вычислим y’ и z для каждого наблюдения с помощью логарифмов от исходных значений. n Затем оценим регрессионную зависимость y’ от z. n Коэффициент при z будет представлять собой непосредственно оценку β. Постоянный член является оценкой ά. n Для получения оценки необходимо взять антилогарифм, т. е. , вычислить.
Моделирование эластичности n n n Функции этого вида часто встречаются в экономике. Эта общая форма кривых Энгеля, y представляет собой спрос на товар, x-доход, а β-эластичность спроса по доходу. Докажем указанное свойство эластичности.
n Независимо от математической связи между y и x или определения величин y и x, эластичность y по x рассчитывается как относительное изменение y на единицу относительного изменения x: Таким образом, если y-это спрос, а х- доход, то выражение определяет эластичность спроса на данный товар по доходу.
n Выражение для эластичность можно переписать в следующем виде С функцией спроса его можно представить как соотношение предельной склонности к потреблению товара к средней склонности к потреблению данного товара.
n Если соотношение между y и x имеет вид
n Таким образом, если имеется кривая Энгеля вида , nэто означает, что эластичность спроса по доходу = 0, 3.
Функция этого вида может также применяться к кривым спроса, где y- спрос на товар, х-цена товара, β - эластичность спроса по цене. n
Что произойдёт, если математическая связь между y и x будет другая. n Предположим, имеется обычное линейное уравнение y=α+βx следовательно эластичность определяется следующим образом: n В этом случае значение эластичности в любой точке будет зависеть не только от значения β , но также от значений y и x.
Показательные функции n Показательные (экспоненциальные) функции – это функции вида:
n Наиболее общим их приложением является случай, когда предполагается, что переменная y имеет постоянный темп прироста во времени, в этом случае вместо х обычно используется время (t), а вместо β - постоянный темп прироста (r):
n Если имеются значения y для нескольких временных периодов(1, …, T), то параметры α и r можно оценить, если прологарифмировать (по основанию e) обе части уравнения:
n n n Если определить ά=log α и y’=log y , то получим: y’= ά+rt Таким образом, оценивая регрессию между логарифмом y и t мы непосредственно получаем оценку темпа прироста r. Обычно оценка имеет второстепенное значение, но если она представляет интерес, то можно получить её, взяв антилогарифм α от ά.
Пример n Кривая Энгеля была построена для расходов на питание в США за период с 1959 по 1983 г.
n n Однако вместо линейной функции в данном случае использовалась не линейная, а приведённая к линейному виду, путём логарифмирования. Преобразованное выражение имело вид: Выполнив обратное преобразование, получим:
n n Полученный результат предполагает, что эластичность спроса на продукты питания по доходу составляет 0, 55 что означает, что увеличение личного располагаемого дохода на 1% приведёт к увеличению расходов на питание на 0, 55%. Коэффициент 3, 32 помогает прогнозировать значения y при заданных значениях x, приводя их к единому масштабу.
Случайный член n n Основное требование состоит в том, чтобы случайный член в преобразованном уравнении присутствовал в виде слагаемого и удовлетворял условиям Гаусса-Маркова. В противном случает мы не сможем привести уравнение к линейному виду.
n Например , если исходное уравнение имеет такой вид В этом случае проблем нет, т. к. уравнение преобразуется к линейному путем замены z=1/x и аддитивный случайный член этому не мешает.
n n Если используется модель вида: y=αxβ и мы собираемся преобразовать его к линейному путем логарифмирования, то случайный член должен быть мультипликативным y=αxβ v. В этом случае мы получаем соотношение: Следовательно, для получения аддитивного случайного члена в уравнении регрессии мы должны начинать с мультипликативного случайного члена в исходном уравнении.
Нелинейная регрессия. Общий случай n Предположим, что переменная y связана с переменной x следующим соотношением: и нужно получить оценки α β γ , имея значения y и x. Такое уравнение не может быть преобразовано в уравнение линейного вида. Тем не менее для получения оценок параметров мы можем применить принцип минимизации суммы квадратов отклонений.
n n n Процедура состоит из последовательности шагов. 1. Принимаются некоторые правдоподобные исходные значения параметров. 2. Вычисляются предсказанные значения y по фактическим значениям х с использованием этих значений параметров. 3. Вычисляются остатки для всех наблюдений в выборке и, следовательно, S- сумма квадратов остатков. 4. Вносятся небольшие изменения в одну или более оценку параметров.
n n 5. Вычисляются новые предсказанные значения y, остатки и S. 6. Если S меньше, чем прежде, то новые оценки параметров лучше прежних и их следует использовать в качестве новой отправной точки.
n n 7. Шаги 4, 5 и 6 повторятся вновь до тех пор, пока не окажется невозможным внести такие изменения в оценки параметров, которые привели бы к уменьшению S. 8. Делается вывод о том, что величина S минимизирована и конечные оценки параметров являются оценками по методу наименьших квадратов.
Пример n Вернемся к примеру с бананами, где y и x связаны между собой зависимостью: Предположим, что мы знаем, что α=12 ; значит нам надо определить только один неизвестный параметр. Предположим, что мы поняли, что зависимость имеет вид такой , однако не будем приводить уравнение к линейному виду. Вместо этого мы применяем нелинейную регрессию.
n Значения S, которые будут получены при любом возможном выборе b при значениях y и x, приведенные в таблице:
n n Предположим, что мы начнем, приняв b равным -6. Уравнение при этом примет вид:
n n n Вычислим предсказанные значения y и остатки на основании последних вычислим значение S=24, 02. Затем подставим b=-7. Теперь величина S равна 13, 401, т. е. она уменьшилась. Значит, мы движемся в правильном направлении. Подставим b=-8, тогда S=5, 87. Продолжим дальше. При b=-9 значение S равно 1, 44; при b=-10 значение S составит 0, 12; при b=-11 оно будет 1, 89.
n n n Очевидно, что, выбрав b=-11, мы перестарались, т. к. значение S вновь начало расти. Будем двигаться назад, но более мелкими шагами, например по 0, 1, беря значение -10, 9; -10, 8 и т. д. Продолжим движение назад до тех пор, пока опять не будет «перебора» , затем вновь начнем двигаться вперед еще более мелкими шагами.
n n Каждый раз, когда будет наблюдаться «перебор» , будем изменять направление на противоположное, сокращая размер шага. Будем продолжать делать это до тех пор, пока не достигнем требуемой точности вычисления оценки.
n Последовательность шагов показана в таблице. Процесс в таблице был прекращен после 32 итераций, было видно, что оценка находится между -9, 92 и -9, 94. Если дальше продолжать итерационный процесс, то можно получить более высокую точность.
n Хотя полученная оценка близка к истинному значению 10, она не совпадает с оценкой, полученной для уравнения Расхождение вызвано тем, что мы предположили, что α=12 , а не оценили его. Если бы мы искали наилучшие значения α и β нелинейным методом, то тогда мы бы получили оценку α = 12, 08, и оценку β= -10, 08.
n Основной недостаток нелинейной регрессии состоит в том, что она оценивается значительно медленнее, чем линейная регрессия, особенно в том случае, когда приходится оценивать несколько параметров.
Выбор функции: тесты Бокса. Кокса n Проблема выбора вида зависимости сложна и если значение коэффициента детерминации R 2 для разных моделей примерно равны, то проблема выбора может быть решена с помощью теста Бокса –Кокса (Box, Cox 1964)
n n Если сравнивать модели с использованием y и log y в качестве зависимой переменной, то можно использовать вариант теста, разработанный Полом Зарембкой (Zarembka 1968). Этот тест предполагает такое преобразование масштаба наблюдений y, при котором обеспечивалась бы возможность непосредственного сравнения СКО (RSS) в линейной и логарифмических моделях.
n 1. Процедура включает следующие шаги: Вычисляется среднее геометрическое значений y в выборке.
2. Пересчитываются наблюдения yi путем деления на среднее геометрическое
Оценивается регрессия для линейной модели с использованием y* и для логарифмической модели с использованием log(y*). Теперь СКО (RSS) для двух регрессий сравнимы и, следовательно, модель с меньшей суммой квадратов отклонений обеспечивает лучшее соответствие. 3.
Более общий тест Бокса-Кокса n n n Y и log y – это специальные случаи функции (Yλ-1)/λ , из которой при λ=1 получается функция y , а при λ стремящемся к 0 функция log y. Следует попробовать ряд значений λ, чтобы определить, какое из них дает минимальной значение СКО. Это называется решетчатым поиском.
СКО λ Продукты питания жилье 1, 00 0, 0119 0, 0341 0, 75 0, 0117 0, 0304 0, 0272 0, 25 0, 0118 0, 0119 0, 0244 0, 0221 -0, 25 -0, 5 0, 0122 0, 0127 0, 0202 0, 0187 -0, 75 -1, 0 0, 0132 0, 0139 0, 0178 0, 0174
n n В таблице оптимальное значение λ для продуктов питания составляет 0, 5 , что говорит о примерно одинаковой приемлемости линейной и логарифмической регрессий. Для расходов на жилье регрессия обратных величин переменных дает более точный прогноз.