Дисперсионный анализ.ppt
- Количество слайдов: 31
Дисперсионный анализ Задача дисперсионного анализа: сравнить две или более выборочные дисперсии и оценить существенность различий между средними значениями результативного признака в группах. Используемые критерии: 2 группы – критерий Стьюдента (t-критерий) Более 2 групп – критерий Фишера (F-критерий) 1
Однофакторный дисперсионный анализ Пусть на некоторый признак Y воздействует фактор X, который имеет m постоянных уровней (градаций). Число наблюдений на каждом уровне n 1, n 2, …nm. Требуется выяснить, оказывает ли существенное влияние фактор X на изучаемую величину Y.
Обозначения: yij – значение результативного признака j-го элемента в i-й группе i – номер группы j – номер элемента, j=1, 2, …, ni ni – численность i-й группы yi – средняя величина результативного признака в i-й группе y – общая средняя результативного признака
Математическая модель Наблюдаемое значение где yij – значение результативного признака в j-м испытании при i-м уровне фактора i – среднее значение результативного признака при i-м уровне фактора – общее среднее значение всей совокупности опытных данных i= i- - величина, характеризующая влияние i-го уровня фактора на общее среднее значение ij=yij- i – ошибка 4
Математическая модель Нулевая гипотеза H 0: различия между уровнями фактора не превосходят случайные различия (исследуемый фактор не влияет на результативный признак), т. е. уровни фактора не влияют на общее среднее значение результата эксперимента Альтернативная гипотеза H 1: различия между уровнями фактора достоверно превосходят случайные различия (исследуемый фактор влияет на результативный признак). 5
Расчетные формулы 1) Групповая средняя 2) Общая средняя результативного признака 6
Расчетные формулы 3) Общая сумма квадратов отклонений наблюдаемых значений от общей средней 4) Факторная сумма квадратов отклонений групповых средних от общей средней (межгрупповая сумма квадратов) 5) Остаточная сумма квадратов отклонений наблюдаемых значений от своей групповой средней (внутригрупповая сумма квадратов) 7
Расчетные формулы SSфакт SSост характеризует влияние фактора характеризует воздействие случайных причин Число степеней свободы: 8
Дисперсии 6) Общая 8) Остаточная 7) Факторная 9) Критерий Фишера Если Fнабл>Fкрит, то H 0 отвергается. 9
Пример Методом дисперсионного анализа определить достоверность генетического влияния отцов на массу телят при рождении. Принять уровень значимости =0, 05. Уровень фактора Результативный признак yij - масса телёнка, кг Численность группы, ni А 40; 38; 43; 42 4 Б 38; 32; 40; 34; 35 5 В 37; 30; 31; 32; 35 5 Выдвигаются гипотезы: H 0: телята от разных отцов не отличаются по массе при рождении. H 1: телята от разных отцов отличаются по массе при рождении 10
Решение задачи с помощью Пакета анализа MS Excel 1. Загрузить Пакет анализа MS Excel , выполнив действия: Данные → Анализ данных. 2. Ввести данные в ячейки A 1: F 4, как показано на рис. 1. Рис. 1. 3. Выбрать инструмент «Однофакторный дисперсионный анализ» . Нажать кнопку ОК. 11
Решение задачи с помощью Пакета анализа MS Excel 4. Ввести в окне диалога в разделе Входные данные: в поле Входной интервал: $A$2: $F$4; в поле Группирование выбрать: по строкам. Отметить: Метки в первом столбце. Задать Альфа: 0, 05. 5. В разделе Параметры вывода в поле Выходной интервал указать, например, I 2. Нажать кнопку ОК. Появятся результаты, представленные на рис. 3. Рис. 2. 12
Решение задачи с помощью Пакета анализа MS Excel Рис. 3. 13
Сравнение групповых средних дисперсионного комплекса 1) Метод Дж. Тьюки (1949 г. ) Область применения: проверка нулевой гипотезы при сравнении групповых средних и равновеликих групп. Критерий оценки: Если t. Q Qкр ( , k=N-a), то нулевую гипотезу отвергают (a – число градаций фактора). 14
Сравнение групповых средних дисперсионного комплекса 2) Метод Г. Шеффе (1953 г. ) Область применения: проверка нулевой гипотезы при сравнении групповых средних и равновеликих и неравновеликих групп. Критерий оценки: Нулевую гипотезу отвергают, если , где a – число градаций фактора, Fкр определяют по таблице для принятого , k 1=a-1, k 2=N-a. 15
Двухфакторный дисперсионный анализ Сочетание факторов AB Фактор A Результативный признак x Фактор B Прочие факторы e 16
Двухфакторный дисперсионный анализ 17
Двухфакторный дисперсионный анализ без повторений. Математическая модель
Оценки средних
Суммы квадратов отклонений
Формулы для расчёта дисперсий
Правило проверки гипотез
Двухфакторный дисперсионный анализ с повторениями. Математическая модель
Суммы квадратов отклонений
Оценка средних
Схема анализа и порядок вычисления сумм
Пример 2
Решение задачи с помощью Пакета анализа MS Excel 29
Решение задачи с помощью Пакета анализа MS Excel Рис. 1 B – качество кормления Рис. 2 A – метод содержания Взаимодействие Aи. B Рис. 3 30
Пример Исследовать влияние качественного раствора A, который варьируется на четырёх уровнях, на накопление микроорганизмов. Уровень фактора Результативный признак a 1 1, 30; 1, 50; 1, 70; 1, 90 a 2 2, 70; 2, 00; 2, 20; 2, 40 a 3 2, 20; 2, 00; 2, 10 a 4 2, 10; 1, 70; 1, 40; 1, 80 Численность группы n 1=n 2=n 3=n 4=4 31
Результаты дисперсионного анализа Групповые средние: 1, 60; 2, 33; 2, 08; 1, 75 Общая средняя 1, 94 Отклонения групповых средних от общей средней -0, 34; 0, 39; 0, 14; -0, 19 Сумма квадратов Степень свободы Дисперсии Fнабл Fкр Фактор A 1, 272 3 0, 424 6, 83 3, 48 Ошибка 0, 745 12 0, 062 Так как Fнабл>Fкрит, то влияние фактора признаётся значимым. 32