РА.ppt
- Количество слайдов: 16
РЕГРЕССИОННЫЙ АНАЛИЗ Любой объект исследования характеризуется уравнением связи: Y = F(X)|z, w Цель регрессионного анализа – установить, как факторы группы Х влияют на функцию цели Y при заданных факторах группы Z в условиях действия случайных факторов W.
Так как Х – неслучайная величина, а Y из-за влияния факторов группы W является случайной величиной, то зависимость Y=F(X) представляет собой уравнение регрессии. Таким образом, в регрессионном анализе определяется связь между наиболее вероятным значением случайной величины Y и величиной X:
Регрессионный анализ может быть: § однофакторным (ищется зависимость функции цели от одного варьируемого фактора); § многофакторным (ищется зависимость функции цели от ряда варьируемых факторов). Основой для нахождения регрессии является экспериментальный материал, то есть N точек в плоскости X -Y. X 1 Y 1 X 2 Y 2 …… …. . Xu Yu …. . XN YN
Регрессионный анализ проводится в три этапа: 1. Постулируется вид уравнения регрессии. Это уравнение, кроме X и Y, включает несколько неизвестных параметров или коэффициентов. 2. Определяются неизвестные коэффициенты, входящие в уравнение регрессии. 3. Проводится статистический анализ регрессии с целью доказательства ее адекватности.
Однофакторный регрессионный анализ 1 ЭТАП Чаще всего уравнение регрессии постулируется в виде полинома. Когда мы ищем зависимость, не зная её вида, обычно используется разложение в ряд.
Наиболее удобные и распространенные регрессионные модели: § регрессия первого порядка, линейная относительно коэффициентов: § регрессия второго порядка, линейнаяотносительно коэффициентов: § регрессия первого порядка, нелинейная относительно коэффициентов:
2 ЭТАП Постулируем регрессию в виде: Находим коэффициенты: (1) Если опыты дублировались, то: - среднее средних
Дублирование опытов X 1 X 2 … Xu … XN Y 11 Y 21 … Yu 1 … YN 1 … … … Y 1 i Y 2 i … Yui … Y Ni … … …
3 ЭТАП На этом этапе нужно ответить на следующие вопросы: 1. Все ли коэффициенты значимо отличны от нуля, т. е. не является ли их отличие от 0 фиктивным, обусловленным естественным разбросом случайной величины Y? 2. Удачно ли выбрана исходная модель, т. е. адекватно ли отражает полученная регрессия экспериментальный материал, положенный в ее основу? 3. Какова точность полученной регрессии, т. е. каков доверительный интервал для каждого предсказанного ей значения?
Так коэффициенты Bi определены через случайную величину Y, то они также являются случайными величинами. Чтобы оценить доверительный интервал, необходимо найти дисперсии коэффициентов:
Для выборки: Число степеней свободы f. В 0 = f. В 1 = f. Y
Проверка значимости коэффициентов проводится по критерию Стьюдента: Если T < t. Т, то отличие Bi от 0 случайно (нулевая гипотеза не отвергается). Если T > t. Т, то отличие Bi от 0 не случайно, т. е. коэффициенты признаются значимыми.
Проверка адекватности регрессии проводится с помощью критерия Фишера путем сравнения дисперсии воспроизводимости с дисперсией адекватности. Дисперсия воспроизводимости характеризует влияние на Y случайных факторов. Дисперсия адекватности оценивает разброс опытных значений Y относительно линии регрессии и вычисляется по формуле: fад = N – 2
Если то дисперсии однородны, следовательно, наблюдаемый разброс Y и может быть объяснен влиянием случайных факторов. Если то значимо больше есть принятая модель неадекватна. , то
Оценка точности регрессии
РА.ppt