Модель парной линейной регрессии Инструментом для создания регрессионных

Скачать презентацию Модель парной линейной регрессии Инструментом для создания регрессионных

Модель парной линейной регрессии.ppt

Количество слайдов: 31

Модель парной линейной регрессии Инструментом для создания регрессионных моделей является корреляционно-регрессионный анализ случайных величин.

• Существуют различные виды зависимостей 2 -х величин друг от друга. • Первая из них – функциональная зависимость, когда определенному значению одной из величин х ставится в соответствие единственное значение другой величины у, т. е. у = f(x).

• В экономических и социальных процессах функциональная зависимость встречается редко. • Здесь, как правило, зависимость между двумя величинами является стохастической – неоднозначной и зависящей от случайных воздействий. • При этом различают регрессионную и корреляционную зависимости и соответствующие им модели.

• В случае регрессионной зависимости предполагается, что одна из величин (х) является неслучайной и независимой от другой (у). Тогда каждому значению х соответствует совокупность случайных значений у, подчиняющихся некоторому закону распределения с определенным математическим ожиданием и дисперсией.

• Регрессионная модель отражает зависимость среднего значения у от фактора х. • Корреляционная модель предполагает, что обе величины являются выборкой из двумерного распределения. В этом случае существуют две линии регрессии – линия зависимости среднего значения у от х и линия зависимости среднего значения х от у.

• • • На практике для описания экономических процессов чаще используют регрессионную модель. Разработка модели состоит из нескольких этапов. Первый этап – спецификация, заключающаяся в решении двух основных задач: а) выбор факторов, влияющих на исследуемую характеристику; б) определение вида уравнения регрессии.

• • • Второй этап – оценивание параметров уравнения. Рассмотрим модель парной линейной регрессии. Исходными данными для ее построения являются две совокупности наблюдений: 1) х1, х2, …, хn - значения независимого фактора х; 2) у1, у2, …, уn - значения исследуемой характеристики у для соответствующих значений х.

• При этом для каждого i = 1, …, n yi = α + βxi + εi, где εi – i-я реализация случайного возмущения ε. Относительно ε делаются следующие предположения: 1) ε – случайная величина, распределенная по нормальному закону; 2) М(ε) = 0; Д(ε) = const; 3) последовательные значения ε не зависят друг от друга.

• Уравнение линейной регрессии ищется в виде • ŷ = а + bx • К параметрам а и b также предъявляются требования: • 1) несмещенности, т. е. М(а) = α; • М(b) = β; • 2) состоятельности, т. е.

• Это значит, что с ростом числа наблюдений дисперсии оценок параметров стремятся к нулю; • 3) эффективности – это значит, что оценки параметров имеют минимальную дисперсию по сравнению с любыми другими оценками данных параметров.

• Оценки параметров уравнения регрессии можно получить с помощью метода наименьших квадратов (МНК), который заключается в минимизации суммы квадратов отклонений наблюдаемых значений исследуемой характеристики у от ее значения, рассчитанного по уравнению регрессии для того же значения х.

• Для реализации этого метода построим функцию • Q(a, b) = • и потребуем ее минимизации, т. е. решим задачу на экстремум

• Для этого найдем частные производные • и приравняем их нулю. Получим следующую систему уравнений:

• Сократим оба уравнения на (-2) и подействуем знаком суммы на каждое слагаемое отдельно. Затем перенесем отрицательные слагаемые в правую часть. • Получим систему нормальных уравнений для определения параметров a и b:

• Решается эта система разными методами: подстановки, с помощью определителей и др.

• В результате получаем ее решение:

Оценка качества уравнения регрессии • Дисперсия фактических отклонений от линии регрессии определяется следующим образом:

• Формулы для расчета дисперсий параметров a и b выглядят соответственно • Тогда для всего уравнения регрессии

• Доверительный интервал линии при значении параметра k определяется по формуле: • где tα – табличное значение t – критерия Стьюдента для доверительной вероятности α и числа степеней свободы • m = n – 2, а - дисперсия линии регрессии в точке хk.

• Тогда доверительный интервал для прогноза в точке хk:

• Итак, мы рассмотрели модель парной линейной регрессии. • В случае нелинейной зависимости у от х исходное уравнение следует сначала привести к линейному виду либо использовать нелинейный МНК.

• Прогноз с помощью модели парной регрессии осуществляется в такой последовательности: • 1. Определяется значение фактора х, для которого необходимо получить прогнозное значение у. Значение х может планироваться, прогнозироваться либо быть фактически известным.

• 2. Подстановкой полученного значения х в уравнение регрессии вычисляется среднее (расчетное) значение ŷ. • 3. Определяется доверительный интервал прогноза. • Применение модели регрессии в прогнозировании предполагает ее адекватность экономическому процессу.

• В полной мере это может быть проверено лишь опытным путем. • Однако существуют формальные способы оценок качества построенной модели. • Все критерии оценки качества подбора уравнения регрессии можно разбить на 2 группы:

• 1) критерии, оценивающие степень тесноты связи между у и х; • 2) критерии, оценивающие качество подбора формы кривой. • 1. Коэффициент корреляции • Оценивает степень линейной зависимости между у и х:

• -1 ≤ r ≤ 1. • При r = ± 1 имеет место функциональная положительная или отрицательная связь; при r = 0 линейная связь отсутствует. • В общем случае существенность r можно определить с помощью t – критерия Стьюдента, который вычисляется по формуле:

• Это значение сравнивается с табличным значением критерия tα, которое выбирается из таблицы для доверительной вероятности α и числа степеней свободы (n-2). • Если t > tα, то можно считать, что коэффициент корреляции r существенно больше нуля и между у и х существует линейная связь.