
Лекция_8-Дисперсионный анализ.ppt
- Количество слайдов: 31
Тема № 3. Многомерный статистический анализ Вопрос 1. Дисперсионный анализ
• F-критерий, который мы использовали при сравнении дисперсий, может применяться для сравнения трех и более средних. • Этот метод называется дисперсионным анализом или в англоязычной аббревиатуре ANOVA (Analysis of Variance). • F-критерий можно использовать при сравнении двух средних. Но в этом случае он становится идентичным t-критерию.
• Дисперсионный анализ, который рассматривает только одну переменную называется одномерным дисперсионным анализом (One-Way ANOVA). • Дисперсионный анализ может также применяться в случае двух переменных - это двумерный дисперсионный анализ (Two-Way ANOVA).
Представление данных в однофакторном анализе
Условия применения: 1. Генеральные совокупности, из которых формируются выборки, должны быть нормально распределены. 2. Выборки должны быть независимы. 3. Дисперсии генеральных совокупностей должны быть равны.
Методика проведения исследования • Берутся две различные оценки дисперсии генеральной совокупности: межгрупповая дисперсия и внутригрупповая дисперсия. • Если нет разницы в средних, то оценки межгрупповой и внутригрупповой дисперсий приблизительно равны и значение F-критерия близко к 1, поэтому нулевая гипотеза принимается. • Если различие в средних значительно, межгрупповая дисперсия будет гораздо больше, чем внутригрупповая. Значение F-критерия будет значительно больше 1 и нулевая гипотеза будет отвергнута.
Степени свободы F-распределения задаются двумя значениями: Числителя: Знаменателя: df = k – 1 df = N – k
Критическая область Уравнение критической области (правосторонняя):
Межгрупповые и внутригрупповые отклонения • Межгрупповая сумма квадратов отклонений: • Внутригрупповая сумма квадратов отклонений: • Общая сумма квадратов отклонений:
Факторная и остаточная дисперсия. • Межгрупповая (факторная) дисперсия: • Внутригрупповая (остаточная) дисперсия:
Критерий однофакторного дисперсионного анализа
Таблица результатов
Основные этапы проведения однофакторного дисперсионного анализа
Постановка проблемы для двухфакторного дисперсионного анализа
• При применении двухфакторного дисперсионного анализа исследователь проверяет влияние двух независимых переменных (факторов) на зависимую переменную. Может быть изучен также эффект взаимодействия двух переменных.
• Пример Компания хочет проверить эффективность своей рекламы. Выбран продукт, и созданы два типа рекламных роликов: серьезный и смешной. Реклама размещена в рабочие и выходные дни. Выбраны 16 потенциальных клиентов и наугад распределены на 4 группы. После того, как каждый покупатель просмотрел ролик, его просят оценить эффективность рекламы по двадцатибалльной шкале. Различные баллы даются за привлекательность, ясность, краткость ролика и т. д. Данные приведены ниже. При α = 0, 01 проанализируйте данные, используя двусторонний дисперсионный анализ. Влияние типа ролика и дня на эффективность рекламы
Эффект обработки Исследуемые группы называют эффектами обработки Группа 1: Смешной ролик, рабочий день Группа 2: Смешной ролик, выходной день Группа 3: Серьезный ролик, рабочий день Группа 4: Серьезный ролик, выходной день • Зрители распределяются по группам случайным образом. Схема 2× 2, переменная состоит из двух уровней, или двух разных вариантов обработки.
Эффект взаимодействия
Двухфакторный дисперсионный анализ типа 3 х2 и 3 х3 В 1 В 2 В 3 А 1 А 2 А 3
Условия применения метода • Генеральные совокупности, из которых извлечены выборки, имеют нормальное распределение. • Выборки независимы. • Дисперсии генеральных совокупностей равны. • Выборки (группы) имеют одинаковый объем.
Гипотеза об эффекте взаимодействия между двумя переменными.
Проверка двух гипотез для каждой независимой переменной.
Таблица результатов
• SSA – сумма квадратов для фактора А • SSB – сумма квадратов для фактора В • SSAx. B – сумма квадратов для взаимодействия факторов • SSerror – сумма квадратов для ошибки • а – количество уровней фактора А • b – количество уровней фактора В • n – количество объектов в каждой группе
Основные этапы проведения двухфакторного дисперсионного анализа
df. N. = b – 1 df. D. = ab(n – 1) df. N. = (a – 1)(b – 1) df. D. = ab(n – 1) df. N. = a – 1 df. D. = ab(n – 1)
Источники изменчивости в модели двухфакторного анализа