
Регрессионный анализ.pptx
- Количество слайдов: 19
Регрессионный анализ. Многофакторная модель. Коновалова Ольга Сергеевна ВМБ-1
ТЕМА: Анализ связи курса доллара в РФ, биржевой стоимости золота, стоимости нефти марки Brent, индекса Доу Джонса за период 2007 -2014 гг. по данным Интернета
Цель работы: определить зависимость курса доллара в РФ (целевой функции) от биржевой стоимости золота, стоимости нефти марки Brent, индекса Доу Джонса за период 2007 -2014 гг. по данным информационных агентств Интернета
Задачи работы: определить целевую функцию и факторы, влияющих на целевую функцию; выявить зависимость факторов между собой; составить уравнение регрессии; проверить адекватность полученной модели.
Алгоритм регрессионного анализа: ü Определение факторов ü Определение модели ü Определение взаимосвязи коэффициентов ü Определение параметров множественной регрессии и их проверка ü Определение критерия Фишера и проверка модели на адекватность ü Определение величины средней ошибки аппроксимации
1. Определение факторов Исходя из цели и задач исследования были определены факторы, влияющие на изменение курса доллара в РФ: Ф 1 - биржевая стоимости нефти марки Brent (долларов/баррель); Ф 2 - Dow Jones Index (пунктах); Ф 3 – биржевая стоимость золота (рублей/ грамм).
1. Определение факторов (продолжение) На основе анализа данных Интернета построена таблица: Период Курс доллара (руб. ) Стоимость нефти марки Brent (долл. /баррель) Dow Jones Index (пункт) Биржевая стоимость золота (руб. /грамм) i y x 1 x 2 x 3 1 3 квартал 2007 25, 50 88, 56 13 516, 90 553, 06 2 4 квартал 2007 24, 65 96, 94 12 386, 38 621, 17 3 1 квартал 2008 24, 25 121, 40 12 510, 91 727, 45 4 2 квартал 2008 23, 62 114, 40 11 322, 40 689, 95 5 3 квартал 2008 24, 23 54, 66 8 810, 05 676, 33 … … 27 1 квартал 2014 35, 14 109, 70 16 603, 50 1 458, 03 28 2 квартал 2014 35, 02 101, 82 16 954, 39 1 426, 41
2. Определение модели 2. В учебных целях предположим, что все данные могут быть аппроксимированы прямой линией. Таким образом мы будем рассматривать линейную многофакторную модель регрессии. Необходимо проверить гипотезу о линейной значимости Y от X 1, Х 2, ХЗ, т. е. y=b 0+b 1 x 1+b 2 x 2+b 3 x 3+
3. Определение взаимосвязи коэффициентов
3. Определение взаимосвязи коэффициентов (продолжение)
3. Определение взаимосвязи коэффициентов (продолжение) Определим коэффициенты корреляции для каждой пары Xi. Y и Xi. Xj и по результатам расчетов составим таблицу коэффициенты корреляции: y Y x 1 x 2 x 3 0, 388 0, 063 0, 653 x 1 0, 388 1 0, 729 0, 535 x 2 0, 063 0, 729 1 0, 564 x 3 1 0, 653 0, 535 0, 564 1 В нашем случае rx 1 x 2 имеют |r|>0. 7, что говорит о мультиколлинеарности факторов и о необходимости исключения одного из них из дальнейшего анализа
3. Определение взаимосвязи коэффициентов (продолжение) Проверим значимость полученных парных коэффициентов корреляции с помощью t-критерия Стьюдента. Коэффициенты, для которых значения t-статистики по модулю больше найденного критического значения, tкрит(n-m-1; α/2) считаются значимыми. Связь между (y и xx 1 ), (y и xx 3 ) является существенной. Наибольшее влияние на результативный признак оказывает фактор x 3 (r = 0. 65). Можно сделать вывод, что при построении регрессионного уравнения следует отобрать факторы x 1 , x 3 y=b 0+b 1 x 1+b 3 x 3+
4. ОПРЕДЕЛЕНИЕ ПАРАМЕТРОВ МНОЖЕСТВЕННОЙ РЕГРЕССИИ И ИХ ПРОВЕРКА Произведем вычисление параметров линейного уравнения множественной регрессии с помощью инструмента анализа данных Регрессия в MS Excel.
4. ОПРЕДЕЛЕНИЕ ПАРАМЕТРОВ МНОЖЕСТВЕННОЙ РЕГРЕССИИ И ИХ ПРОВЕРКА (продолжение)
4. ОПРЕДЕЛЕНИЕ ПАРАМЕТРОВ МНОЖЕСТВЕННОЙ РЕГРЕССИИ И ИХ ПРОВЕРКА (продолжение) Анализ полученных результатов q Множественный коэффициент корреляции R = 0, 825, т. е. связь между признаками тесная. q F = 3. 79246 E-06%, т. е. R 2 и уравнение регрессии в целом статистически значимы с надежностью 95%. q Уравнение регрессии: Y = 0. 257 + 0. 531 X 1 - 0. 766 X 2 + 0. 708 X 3 q Доверительный интервал для коэффициентов регрессии. 0. 164 ≤ b 1 ≤ 0. 897 -1. 129 ≤ b 2 ≤ -0. 403 0. 450 ≤ b 3 ≤ 0. 966
5. ОПРЕДЕЛЕНИЕ КРИТЕРИЯ ФИШЕРА И ПРОВЕРКА МОДЕЛИ НА АДЕКВАТНОСТЬ Проверка модели осуществляется с помощью F-статистики распределения Фишера. Если F < Fkp = Fα ; n-m-1, то нет оснований для отклонения гипотезы H 0. F = R 21 - R 2(n - m -1)m = 0. 6811 - 0. 68128 -3 -13 = 17. 06 Табличное значение при степенях свободы k 1 = 3 и k 2 = nm-1 = 28 - 3 - 1 = 24, Fkp(3; 24) = 3. 01 Поскольку фактическое значение F > Fkp, то коэффициент детерминации статистически значим и уравнение регрессии статистически надежно.
6. ОПРЕДЕЛЕНИЕ ВЕЛИЧИНЫ СРЕДНЕЙ ОШИБКИ АППРОКСИМАЦИИ Средняя ошибка аппроксимации - среднее отклонение расчетных значений от фактических. = 4, 78 % Значение средней ошибки аппроксимации до 15% свидетельствует о хорошо подобранной модели уравнения.
Заключение По результатам исследования пришли к выводу, что наиболее близки к описанию линейная полиномиальная модель. На основе обработанных данных были рассчитаны коэффициенты модели, проверены по критерию Стьюдента, адекватность модели проверена по критерию Фишера. Однако, несмотря на адекватность модели, для того чтобы сделать прогноз нужно чтобы были известны влияющие факторы, а если речь идет о временном ряде и соответственно прогнозе на будущее, например, на следующий год или месяц, то далеко не всегда можно узнать какие будут влияющие факторы, что подтверждается резким ростом курса доллара отмечающимся в этом году, как впрочем и в период 2008 -2009 гг.
Спасибо за внимание!
Регрессионный анализ.pptx