• Дисперсионный анализ – статистический метод












ЛЕКЦИЯ 6 Дисперсионный анализ.ppt
- Количество слайдов: 12
• Дисперсионный анализ – статистический метод измерения связи между результативным и качественным признаком. • Позволяет оценить существенность влияния некоторого качественного фактора на изучаемую величину, точнее на ее результирующие количественные показатели. • В зависимости от глубины исследования может оценивать влияние одного или нескольких факторных признаков (многофакторный анализ).
• Условия применения дисперсионного анализа: • Нормальность распределения анализируемых групп или соответствие выборочных групп генеральным совокупностям с нормальным распределением. • Независимость (не связанность) распределения наблюдений в группах. • Основная идея дисперсионного анализа - сравнение отклонений, вызываемых воздействием факторного признака (фактора), с величиной отклонений, вызываемых случайными обстоятельствами. Если отклонения, вызываемые факторным признаком более существенны, чем случайные отклонения, то считается, что фактор оказывает существенное влияние на результирующий признак.
Разложение общей дисперсии в однофакторном комплексе: Dобщ=Dфакт+ Dост Dобщ - общая дисперсия, наблюдаемых значений (вариант), характеризуется разбросом вариант от общего среднего; Dфакт - факторная (межгрупповая) дисперсия, характеризуется разбросом групповых средних от общего среднего; Dост - остаточная (внутригрупповая) дисперсия, которая характеризует рассеяние вариант внутри групп. Иногда её называют дисперсией ошибки, поскольку она обычно не может быть предсказана или точно объяснена.
Разложение общей дисперсии в двухфакторном комплексе: Dобщ =Dост + DА+ DВ +DАВ Dобщ - общая дисперсия, наблюдаемых значений (вариант), характеризуется разбросом вариант от общего среднего; DА - дисперсия фактора А; DB - дисперсия фактора B ; DAB - дисперсия эффекта взаимодействия факторов А и В ; Dост - остаточная (внутригрупповая) дисперсия. Разложение общей дисперсии в трехфакторном комплексе: Dобщ =Dост + DА+ DВ +DС +DAB+DBC+DAC
Последовательные этапы дисперсионного анализа: анализа 1) Вычисление средних квадратов отклонений; 2) Вычисление дисперсий; 3) Сравнение факторной (факторных) и остаточной дисперсий; 4) Оценка результатов с помощью теоретических значений распределения Фишера-Снедекора.
• Вычисление средних квадратов отклонений при наблюдениях с повторностями включает: 1). Вычисление общей суммы квадратов отклонений наблюдаемых вариант от общего среднего: p - число повторностей, q - число групп факторного признака, -суммы квадратов наблюдаемых значений (вариант V) по группам, , - суммы наблюдаемых значений по группам. 2). Вычисление факторной суммы квадратов отклонений групповых средних от общего среднего, которая характеризует разброс между группами (межгрупповая сумма квадратов):
• (Продолжение) • Вычисление средних квадратов отклонений • включает: 3). Остаточную (внутригрупповую) сумму квадратов отклонений вычисляют из разности Sост=Sобщ-Sфакт Примечание. В специальной литературе и пособиях можно встретить обозначение средних квадратов отклонений в виде символов SS от английского Sum of Squares (сумма квадратов).
Например: Требуется проверить гипотезу о равенстве средней продолжительности заболеваний хроническим бронхитом рабочих основных профессиональных групп: станочники, слесари, прочие. Выборки сделаны на предприятии из 4 цехов с близкими условиями и характером труда работников, или с 4 повторностями. Длительность заболевания хроническим бронхитом (в днях временной нетрудоспособности) Факторный признак (профессия) Номер цеха Уровни фактора (группы наблюдений) (повторности) Станочники Слесари Прочие 1 10 5 4 2 14 11 6 3 9 7 11 4 12 8 4 В среднем по 11 8 6 группам Мгрi Общее среднее M=8, 42
Длительность заболевания хроническим бронхитом (Исходные данные уменьшены на величину среднего арифметического М=8, 42) Факторный признак (профессия) Номер цеха Уровни фактора (группы наблюдений) (повторности) Станочники Слесари Прочие 1 1, 6 -3, 4 -4, 4 2 5, 6 2, 6 -2, 4 3 0, 6 -1, 4 2, 6 4 3, 6 -0, 4 -4, 4 Суммы наблюдаемых 11, 4 -2, 7 -8, 7 значений Ri Квадраты сумм наблюдаемых значений 128, 4 7, 1 75, 1 Ri 2 Ri 2 =210, 7
Длительность заболевания хроническим бронхитом. бронхитом (Предыдущие данные возведены в квадрат) Факторный признак (профессия) Номер цеха Уровни фактора (повторности) Станочники Слесари Прочие 1 2, 5 11, 7 19, 5 2 31, 2 6, 7 5, 8 3 0, 3 2, 0 6, 7 4 12, 8 0, 2 19, 5 Суммы квадратов наблюдаемых 46, 9 20, 5 51, 5 значений P 2 i P 2=118, 9
• Учитывая, что число уровней фактора 3, число повторов 4, получаем: • Общую сумму квадратов отклонений: • Sобщ=118, 9 -0=118, 9 • Факторную сумму квадратов: • Sфакт=210, 7/4 -0=52, 7 • Находим остаточную сумму квадратов отклонений: • Sост=Sобщ-Sфакт=118, 9 -52, 7=66, 3 • Находим факторную и остаточную дисперсии • Dфакт =52, 7/(3 -1)=26, 3 Dост =66, 3/3(4 -1)=7, 4 • Учитывая, что число степеней свободы числителя равно 2 (число групп-1), а знаменателя 9(число всех наблюдений-1), при уровне значимости 0, 05 , с помощью встроенной функции Microsoft Exel или по таблице находим критическую точку F=4, 3.
Итоги однофакторного дисперсионного анализа в MS Excel Источник P F SS df MS F вариации Значение критическое Между группами 52, 7 2 26, 3 3, 6 0, 1 4, 3 Внутри групп 66, 3 9 7, 4 Итого 118, 9 11

