Лекция 4
Оценки коэффициентов парной регрессии Y b 1 b 2 X 1 Xn X 12
Разделим числитель и знаменатель на n-1 11
Средняя ошибка аппроксимации Проверить значимость уравнения регрессии – значит установить, соответствует ли математическая модель, выражающая зависимость между переменными, экспериментальным данным и достаточно ли включенных в уравнение объясняющих переменных (одной или нескольких) для описания зависимой переменной. Чтобы иметь общее суждение о качестве модели из относительных отклонений по каждому наблюдению, определяют среднюю ошибку аппроксимации: (1) Средняя ошибка аппроксимации не должна превышать 8– 10%.
Полезные результаты относительно регрессий Доказательство Линия регрессии проходит через точку 2
Полезные результаты относительно регрессий Доказательство Отсутствует систематическая ошибка 3
Полезные результаты относительно регрессий Доказательство Сумма всех значений Y совпадает с суммой всех выровненных Y. 4
Полезные результаты относительно регрессий Доказательство Среднее арифметическое по всем значениям Y совпадает со средним арифметическим по всех выровненным Y. 5
Полезные результаты относительно регрессий Доказательство 6
Полезные результаты относительно регрессий Доказательство 7
Оценка существенности параметров линейной регрессии и корреляции После того как найдено уравнение линейной регрессии, проводится оценка значимости как уравнения в целом, так и отдельных его параметров. Оценка значимости уравнения регрессии в целом производится на основе F -критерия Фишера, которому предшествует дисперсионный анализ. В математической статистике дисперсионный анализ рассматривается как самостоятельный инструмент статистического анализа. В эконометрике он применяется как вспомогательное средство для изучения качества регрессионной модели.
Дисперсионный анализ 8
Дисперсионный анализ 9
Дисперсионный анализ 10
Согласно основной идее дисперсионного анализа, общая сумма квадратов отклонений переменной y от среднего значения раскладывается на две части – «объясненную» и «необъясненную» : где – общая сумма квадратов отклонений; – сумма квадратов отклонений, объясненная регрессией (или факторная сумма квадратов отклонений); – остаточная сумма квадратов отклонений, характеризующая влияние неучтенных в модели факторов.
Показатель качества подгонки регрессии R 2 является отношением ESS к TSS, (или долей дисперсии Y, объясненной с помощью регрессии). Очевидно, это неотрицательная величина. 11
Показатель качества подгонки регрессии R 2 Другое выражение для R 2, из которого следует, что R 2 не превышает 1. 12
Показатель качества подгонки регрессии R 2 действительно является квадратом, а именно, квадратом выборочного коэффициента корреляции X и Y (без доказательства). 13