дисперсионный анализ.ppt
- Количество слайдов: 22
ОСНОВЫ ДИСПЕРСИОННОГО АНАЛИЗА
План лекции: Виды дисперсионного анализа, его характеристики, основные понятия Этапы дисперсионного анализа. Факторная и случайная дисперсия Однофакторный дисперсионный анализ. Основные формулы Список используемой литературы
Виды дисперсионного анализа, его характеристики, основные понятия Раздел статистики, изучающий влияние факторов на изменчивость случайной величины, называется дисперсионным анализом. ДИСПЕРСИОННЫЙ АНАЛИЗ ОДНОФАКТОРНЫЙ МНОГОФАКТОРНЫЙ
Условия: изучаемые факторы должны быть независимыми; распределение выборочных данных должно соответствовать нормальному распределению или сводится к нему путем соответствующих преобразований х – =А+е, где – средняя арифметическая генеральной совокупности; х – конкретное значение переменной; А – доля отклонения переменной, связанная с влиянием данного конкретного фактора; е – остаточная часть отклонения, не объяснимая влиянием данного фактора.
Признаки, изменяющиеся под влиянием тех или иных причин, называются результативными. Сами причины называются факторами. Конкретное числовое значение фактора называется градацией (или уровнем) фактора. Степень изменения всех признаков и отклонение их от средней арифметической ряда характеризуется дисперсией D(х):
- критерий Фишера Нулевая гипотеза: регулируемый фактор не оказывает систематического действия на признак. Наблюдаемые различия между групповыми средними случайны.
Нулевая гипотеза
Этапы дисперсионного анализа: Представить данные в виде таблицы. Номер Уровни фактора(i) наблюдения 1 2 3 . . . I a (j) 1 x 11 x 21 x 31 xi 1 xa 1 2 x 12 x 22 x 32 xi 2 xa 2 . . . j x 1 j x 2 j x 3 j xij xaj n x 1 n x 2 n x 3 n xin xan Суммы по x 1 x 2 x 3 xi xa группам: Средние по группам: i – индекс уровня фактора (от 1 до а); j – индекс варианта (от 1 до n).
Общее варьирование всех вариантов (хij), независимо от того, в какой группе они находятся, вокруг общей средней характеризуется дисперсией Dобщ. где N=a∙n– число всех вариант; dfобщ. = N– 1 – число степеней свободы.
Варьирование групповых средних или средних каждого уровня данного изучаемого фактора вокруг общей средней , характеризуется факторной дисперсией Dфакт. dfфакт= a – 1– число степеней свободы. ni – среднее число вариант в каждой группе, n – если число варианта в группах одинаково.
Варьирование вариант хij внутри каждой группы вокруг каждой групповой средней характеризует случайная или остаточная дисперсия Dслуч. df случ =N - a – число степеней свободы.
Формулы для однофакторного дисперсионного анализа Источник Сумма Число степеней Формулы для варьирования квадратов SS свободы df дисперсии (числитель) (знаменатель) MS Общее (все варианты) N – 1 Групповые средние (фактор А) a – 1 Варианты внутри групп (случайные отклонения) N – a
Пример. Провести однофакторный дисперсионный анализ для выяснения влияния реагентов на синтез лекарственного препарата (выход-усл. ед). F 1 F 2 F 3 F 4 № x 1 j x 2 j x 3 j x 4 j 1 5 4 7 8 2 3 3 6 7 3 4 4 5 9 4 4 2 6 7 = 4 3, 25 6 7, 75 Предположения: • В генеральной совокупности выборки подчиняются нормальному закону распределения • Выборки однородны (дисперсии равны)
Таблица 1 Таблица 2 F 1 F 2 F 3 F 4 F 1 F 2 F 3 F 4 № № x 1 j x 2 j x 3 j x 4 j x 21 j x 22 j x 23 j x 24 j 1 5 4 7 8 1 25 16 49 64 2 3 6 7 2 9 9 36 49 3 4 5 9 3 16 16 25 81 4 4 2 6 7 4 16 4 36 49 = 4 3, 25 6 7, 75 66 45 146 243 = 16 13 24 31 169 576 961
Вычисления: Сумма квадратов SSобщ для общей вариации: l Сумма квадратов SSфакт для вариации между группами: (е x ) 1 2 = е е x)- 1 ( 2 7056 SSфак i = ij 1962 - = 49. 5 n N 4 16 Средний квадрат, характеризующий факторную дисперсию MSфакт. : SS фак , 49. 5 МS фак = = = 16, 5 df фак 3
Сумма квадратов SSслуч для вариации внутри групп: SSсл=SSобщ – SSфак = 59 – 49, 5=9, 5 l Сумма квадратов SSслуч для вариации внутри групп: т. к MSслуч< MSфак, а Fтабл=3, 49 для Р=0, 95 и dfсл=12 и dfфак=3 ВЛИЯНИЕ ФАКТОРА ДОСТОВЕРНО!
Сила влияния фактора определяется: где В нашем случае Dфакт. h = 2 Dфакт. + Dслуч. А
Вывод: 83% от действия всех факторов приходится на вид реагента, 17% – приходится на долю случайных факторов. Для выявления наиболее эффективного реагента построим график
Значимость влияния фактора Дисперсионный анализ позволяет установить, существуют ли значимое различие между отдельными уровнями фактора. n – число вариант в каждой группе.
Коэффициент Q, рассчитан для разного количества групп а и степеней свободы dfслуч. d 12=4 -3, 25=0, 7; d 23=6 -3, 25=2, 75; Q=4, 2 для dfслуч=12 и а=4; t 12< Q, разница не достоверна! t 23> Q, разница достоверна!
Вывод: Вид реагента достоверно влияет на выход лекарственного препарата. Наибольшую эффективность имеет фактор (реагент), градация которого равна F 4.
РЕКОМЕНДУЕМАЯ ЛИТЕРАТУРА: Шеффе Г. Дисперсионный анализ М. : Наука, 1980. -512 с. : ил. Павлушков И. В. Основы высшей математики и математической статистики. М. , ГЭОТАР-Медиа, 2005, с. 338 -349.


