Л_10_ДА.ppt
- Количество слайдов: 24
Однофакторный дисперсионный анализ (лекционное занятие) Учебные вопросы: 1. Понятие о дисперсионном анализе 2. Пример дисперсионного анализа 1
Лекция: Однофакторный дисперсионный анализ в правовой статистике Учебный вопрос 1: Понятие о дисперсионном анализе 2
Понятие о дисперсионном анализе • Пусть генеральные совокупности X 1, Х 2, . . . , Хp распределены нормально и имеют одинаковую, хотя и неизвестную, дисперсию • Математические ожидания также неизвестны, но могут быть различными • Требуется: при заданном уровне значимости по выборочным средним проверить нулевую гипотезу Н 0: М (X 1) = М (Х 2) =. . . = М(Хр) о равенстве всех математических ожиданий 3
Понятие о дисперсионном анализе • Другими словами: - требуется установить, значимо или незначимо различаются выборочные средние • Казалось бы, для сравнения нескольких средних (р > 2) можно сравнить их попарно • Однако с возрастанием числа средних возрастает и наибольшее различие между ними: - среднее новой выборки может оказаться больше наибольшего или меньше наименьшего из средних, полученных до нового опыта • По этой причине для сравнения нескольких средних пользуются другим методом, который основан на сравнении дисперсий и поэтому назван дисперсионным анализом (в основном развит английским статистиком Р. Фишером) 4
Понятие о дисперсионном анализе • На практике дисперсионный анализ применяют, чтобы установить, оказывает ли существенное влияние некоторый качественный фактор F, который имеет р уровней F 1, F 2, . . . , Fp на изучаемую величину X. • Например, если требуется выяснить, какой вид преступлений встречается наиболее часто, то фактор F - преступление, а его уровни - виды преступлений 5
Понятие о дисперсионном анализе • Основная идея дисперсионного анализа состоит в сравнении «факторной дисперсии» , порождаемой воздействием фактора, и «остаточной дисперсии» , обусловленной случайными причинами • Если различие между этими дисперсиями значимо, то фактор оказывает существенное влияние на X; в этом случае средние наблюдаемых значений на каждом уровне (групповые средние) различаются 6 также значимо
Понятие о дисперсионном анализе • Если уже установлено, что фактор существенно влияет на X, а требуется выяснить, какой из уровней оказывает наибольшее воздействие, то дополнительно производят попарное сравнение средних 7
Понятие о дисперсионном анализе • Иногда дисперсионный анализ применяется, чтобы установить однородность нескольких совокупностей (дисперсии этих совокупностей одинаковы по предположению; если дисперсионный анализ покажет, что и математические ожидания одинаковы, то в этом смысле совокупности однородны) • Однородные же совокупности можно объединить в одну и тем самым получить о ней более полную информацию, следовательно, и более надежные выводы8
Понятие о дисперсионном анализе • В более сложных случаях исследуют воздействие нескольких факторов на нескольких постоянных или случайных уровнях и выясняют влияние отдельных уровней и их комбинаций (многофакторный анализ) • На лекции ограничимся рассмотрением простейшего случая однофакторного анализа, когда на X воздействует только один фактор, который имеет р постоянных 9 уровней
Понятие о дисперсионном анализе • Пусть на количественный нормально распределенный признак X воздействует фактор F, который имеет р постоянных уровней • Будем предполагать, что число наблюдений (испытаний) на каждом уровне одинаково и равно q 10
Понятие о дисперсионном анализе • Пусть: - наблюдалось n = pq значений хij признака X, где i - номер испытания (i = 1, 2, . . . , p); j - номер уровня фактора (j = 1, 2, . . . , р) • Результаты наблюдений приведены в таблице на следующем слайде 11
Понятие о дисперсионном анализе • Номер испытания Уровни фактора Fj F 1 F 2 … Fp 1 x 12 … x 1 p 2 x 21 x 22 … x 2 p … … … q xq 1 xq 2 … xqp … Xгр ср p Групповая средняя Xгр ср1 Xгр ср2 12
Понятие о дисперсионном анализе • Введем, по определению, соотношение для расчета общей суммы квадратов отклонений наблюдаемых значений от общей средней х: 13
Понятие о дисперсионном анализе • Введем, по определению, соотношение для расчета факторной суммы квадратов отклонений групповых средних от общей средней, которая характеризует рассеяние «между группами» : 14
Понятие о дисперсионном анализе • Введем, по определению, соотношение для расчета остаточной суммы квадратов отклонений наблюдаемых значений группы от своей групповой средней, которая характеризует рассеяние «внутри групп» : 15
Понятие о дисперсионном анализе • Практически остаточную сумму находят по равенству: Sост = Sобщ – Sфакт • Элементарными преобразованиями можно получить формулы, более удобные для расчетов: 16
Понятие о дисперсионном анализе • В приведенных формулах: - это сумма квадратов значений признака на уровне Fj ; - это сумма значений признака на уровне Fj 17
Понятие о дисперсионном анализе • Для упрощения вычислений вычитают из каждого наблюдаемого значения одно и то же число С, примерно равнее общей средней • Если уменьшенные значения уij = хij - С, то: 18
Понятие о дисперсионном анализе • В приведенных формулах: - сумма квадратов уменьшенных значений признака на уровне Fj; - сумма уменьшенных значений признака на уровне Fj 19
Понятие о дисперсионном анализе • Разделив уже вычисленные факторную и остаточную суммы на соответствующее число степеней свободы, находят факторную и остаточную дисперсии: 20
Понятие о дисперсионном анализе • Завершающим этапом дисперсионного анализа является: -Сравнение факторной и остаточной дисперсий по критерию Фишера-Снедекора - Если Fнабл < Fкр, различие групповых средних незначимое; - Если Fнабл > Fкр, различие групповых средних значимое 21
Понятие о дисперсионном анализе • Если факторная дисперсия окажется меньше остаточной, то это свидетельствует о справедливости нулевой гипотезы о равенстве групповых средних, поэтому дальнейшие вычисления (сравнение дисперсий с помощью критерия Фишера) излишни 22
Понятие о дисперсионном анализе • Если наблюдаемые значения xij являются десятичными числами с k знаками после запятой, то целесообразно перейти к целым числам: yij = 10 k xij – C, где C – примерно среднее значение чисел 10 k xij • При этом факторная и остаточная дисперсии увеличатся каждая в 102 k раз, но их отношение не изменится 23
Лекция: Однофакторный дисперсионный анализ в правовой статистике Учебный вопрос 2: Пример дисперсионного анализа 24
Л_10_ДА.ppt