Скачать презентацию Анализ мощности Введение При статистическом исследовании некоторого Скачать презентацию Анализ мощности Введение При статистическом исследовании некоторого

анализ мощности.ppt

  • Количество слайдов: 43

Анализ мощности Анализ мощности

Введение При статистическом исследовании некоторого параметра (например, среднего) мы, на основе некоторой выборки, строим Введение При статистическом исследовании некоторого параметра (например, среднего) мы, на основе некоторой выборки, строим статистику. Конечно, значение выборочной статистику будет отличаться от реального значения параметра. Хотелось бы знать: Насколько точно параметр оценивается статистикой данной выборки некоторого размера? А также, какого размера должна быть выборка для указанной точности.

Глава 1 Элементы математической статистики Глава 1 Элементы математической статистики

Теория оценивания Рассмотрим основные моменты теории оценивания Пусть задана некоторая статистическая модель F схемы Теория оценивания Рассмотрим основные моменты теории оценивания Пусть задана некоторая статистическая модель F схемы повторных независимых наблюдений над некоторой случайной величиной и X=(X 1, …, X 2) – выборка из распределения L( ) F. Будем рассматривать различные функции (статистики) T=T(X) от выборки, которые сами являются случайными величинами (FT(t)=P(T(X) t)) Часто требуется по выборке Х сделать те или иные выводы об истинном значении g 0 некоторой неизвестной теоретической характеристики g=g(F) наблюдаемой случайной величины.

Теория оценивания Под этим понимается задача оценить это значение g 0, то есть построить Теория оценивания Под этим понимается задача оценить это значение g 0, то есть построить такую статистику T(X), значение которой t=T(X) при наблюдавшейся реализации x выборки X можно было бы считать разумным приближением для g 0: t g 0. В этом случае говорят, что статистика T(X) есть оценка g. Сформулированная задача является задачей точечного оценивания неизвестных параметров распределения.

Теория оценивания Любая точечная оценка является случайной, и при каждой реализации х выборки Х Теория оценивания Любая точечная оценка является случайной, и при каждой реализации х выборки Х эта функция определяет единственное значение t=T(x) оценки, принимаемое за приближенное значение оцениваемой характеристики. Хотелось бы знать возможную погрешность, возникающую при использовании предлагаемой оценки, например, указать интервал, внутри которого с высокой вероятностью находится точное значение оцениваемого параметра. Имеем другой подход – интервальное (доверительное) оценивание, соответствующий интервал называется доверительным (то есть с вероятностью этот интервал накрывает истинный параметр)

Способы оценки Рассмотрим способы оценки параметров ТОЧЕЧНОЕ ОЦЕНИВАНИЕ ИНТЕРВАЛЬНОЕ ОЦЕНИВАНИЕ Способы оценки Рассмотрим способы оценки параметров ТОЧЕЧНОЕ ОЦЕНИВАНИЕ ИНТЕРВАЛЬНОЕ ОЦЕНИВАНИЕ

Теория проверки гипотез Сейчас необходимо вспомнить о статистических гипотезах Параметрические гипотезы (сложная и простая) Теория проверки гипотез Сейчас необходимо вспомнить о статистических гипотезах Параметрические гипотезы (сложная и простая) Примеры гипотез: нормальное распределение имеет заданные среднее и дисперсию нормальное распределение имеет заданное среднее распределение нормально два неизвестных непрерывных распределения одинаковы

Теория проверки гипотез При проверке гипотезы выполняется следующая процедура Выборочное пространство W (возможные наборы Теория проверки гипотез При проверке гипотезы выполняется следующая процедура Выборочное пространство W (возможные наборы наблюдений) W Разделяем W на две области

Теория проверки гипотез Если наблюдаемая выборочная точка х попадает в одну из этих областей Теория проверки гипотез Если наблюдаемая выборочная точка х попадает в одну из этих областей w, то гипотеза Н 0 отвергается, а если х попадает в область W-w, то гипотеза принимается КРИТИЧЕСКАЯ область Область ПРИНЯТИЯ W-w w

Два типа ошибок Ошибки, возникающие при проверке статистической гипотезы, могут быть двух типов Ошибочное Два типа ошибок Ошибки, возникающие при проверке статистической гипотезы, могут быть двух типов Ошибочное отвержение гипотезы, когда она верна (ошибка I-ого рода, ) Ошибочное принятие неверной гипотезы (ошибка II-ого рода, ) Стоит отметить, что можно определить размер области w так, чтобы при выполнении Н 0 вероятность отвергнуть гипотезу была равна заданной величине (размер критерия).

Ошибка второго рода Вероятность ошибки второго рода зависит от рассматриваемой альтернативной гипотезы Н 1. Ошибка второго рода Вероятность ошибки второго рода зависит от рассматриваемой альтернативной гипотезы Н 1. То есть P{x W-w | H 1}= , или P{x w | H 1}= 1 - Мощность критерия для проверки гипотезы Н 0 против альтернативной гипотезы Н 1 – это вероятность 1 -

Функция мощности Почему ФУНКЦИЯ Из определения следует, что мощность является явной функцией от Н Функция мощности Почему ФУНКЦИЯ Из определения следует, что мощность является явной функцией от Н 1. Если Н 1 образуется в результате изменения значений набора параметров , то мощность критерия для проверки гипотезы Н 0: = 0, против простой альтернативы Н 1 : = 1 0, будет зависеть от значения 1.

Глава 2 Теоретический пример Глава 2 Теоретический пример

Пример задачи Рассмотрим задачу проверки гипотезы о среднем значении нормального распределения с единичной дисперсией. Пример задачи Рассмотрим задачу проверки гипотезы о среднем значении нормального распределения с единичной дисперсией. То есть, при заданном распределении d. F(x) требуется проверить гипотезу Это простая гипотеза, так как она 0 H 0: = определяет F(x) полностью. В качестве альтернативы мы возьмем также простую гипотезу H 1: = 0 > 0 Таким образом, задача заключается в том, чтобы выбрать в качестве среднего значения либо меньшее из двух заданных значений ( 0), либо большее ( 1).

Графическое решение Рассмотрим случай выборки n=2 На рисунке показаны возможные совокупности выборочных точек при Графическое решение Рассмотрим случай выборки n=2 На рисунке показаны возможные совокупности выборочных точек при большом числе повторений. Нижнее скопление соответствует выполнению гипотезы H 0, а верхнее – H 1.

Графическое решение В этом случае, при гипотезе Н 1 Чтобы выбрать критическую область, доля Графическое решение В этом случае, при гипотезе Н 1 Чтобы выбрать критическую область, доля случаев, найти мы должны когда отвергается плоскости (выше желтой прямой для второй. область на Н 0 для такой области больше, чем розовой), Следовательно, значение 1 - (т. е. мощность) для такой содержащую долю распределения Н 0, причем эта область области будет больше. должна содержать наибольшее число скоплений Н 1.

Функция мощности Зная функцию мощности критерия, мы можем поставить вопрос о нахождении объема выборки, Функция мощности Зная функцию мощности критерия, мы можем поставить вопрос о нахождении объема выборки, необходимого для проверки гипотезы Н 0 с заданным размером и мощностью. Существует возможность в явном виде найти мощность критерия 1 - = Ф(n, , 0, , ).

Итог Размер выборки и мощности Зная размер выборки, можно найти соответствующую мощность. Для каждого Итог Размер выборки и мощности Зная размер выборки, можно найти соответствующую мощность. Для каждого значения мощности можно найти необходимый размер выборки

Итог Для вычисления мощности (функции мощности) необходимо знать следующие факторы Тип статистического теста (на Итог Для вычисления мощности (функции мощности) необходимо знать следующие факторы Тип статистического теста (на практике, различные тесты обладают различной мощностью). Размер выборки. Конечно, размер выборки прямо пропорционален мощности. Но часто бывает, что увеличение размера выборки сопряжено со значительными материальными и финансовыми затратами. Разница между гипотезами. «Величина отличия» нулевой гипотезы прямо пропорциональна мощности. Уровень ошибки экспериментальных измерений (стандартное отклонение). Ошибки в измерениях являются «шумом» , которые скрывают Обратная задача: для данного значения функции мощности результат эксперимента находится размер выборки Кроме этого: повышение точности и устойчивости измерений влечет повышение статистической мощности. (все остальные параметры прежние)

Глава 3 Расчет объема выборки Глава 3 Расчет объема выборки

Регистр Диабета «Регистр Диабета» является локальной БД, содержащей данные о заболеваемости диабетом в г. Регистр Диабета «Регистр Диабета» является локальной БД, содержащей данные о заболеваемости диабетом в г. Москве. Один из показателей в таблице данных - значение Возраста, в котором у больного поставлен диагноз диабета. На основе данных было определено значение «критического возраста» , т. е Возраста при котором зарегистрировано наибольшее количество заболеваний. Необходимо определить размер выборки, по которой можно было бы установить значение «критического возраста» для населения с заданной вероятностью ошибки.

Размер выборки Рассмотрим задачу определения оптимального размера выборки. Имея выборку полученного размера, мы можем Размер выборки Рассмотрим задачу определения оптимального размера выборки. Имея выборку полученного размера, мы можем с заданной вероятностью определить возраст, при котором регистрируются наибольшее количество заболеваний диабетом.

Предварительный анализ Сначала, на основе исходных данных определим значение стандартного отклонения Предварительный анализ Сначала, на основе исходных данных определим значение стандартного отклонения

Описательные статистики Дополнительно найдем доверительные границы среднего Воспользуемся функцией Описательные Статистики для переменной Возраст Описательные статистики Дополнительно найдем доверительные границы среднего Воспользуемся функцией Описательные Статистики для переменной Возраст

Первые результаты анализа Получили, что: Среднее значение = 58. 27 Доверительный интервал = (58. Первые результаты анализа Получили, что: Среднее значение = 58. 27 Доверительный интервал = (58. 02 ; 58. 52), то есть с вероятностью 0. 95 этот интервал накрывает истинное среднее Стандартное отклонение = 14. 37 (ст. откл. =

Анализ мощности Переключимся в модуль «Анализ мощности» и выберем функцию оценки объема выборки Анализ мощности Переключимся в модуль «Анализ мощности» и выберем функцию оценки объема выборки

Анализ мощности Зададим параметры: Mu 0 = 0 Mu = 0. 5 Alpha = Анализ мощности Зададим параметры: Mu 0 = 0 Mu = 0. 5 Alpha = 0. 05 Sigma = 14. 3 Ищем «критический» возраст «с точностью» до полугода Ошибка первого рода, т. е. принятие гипотезы Н 1, когда верна гипотеза Н 2 Стандартное отклонение Power Goal = 0. 95 Мощность = 1 -

Результат анализа В итоге, мы получили таблицу со значением требуемого размера выборки Результат анализа В итоге, мы получили таблицу со значением требуемого размера выборки

Алгоритм действия Для вычисления размера выборки необходимо выполнить следующую последовательность действий: Выбрать функцию Определение Алгоритм действия Для вычисления размера выборки необходимо выполнить следующую последовательность действий: Выбрать функцию Определение размера выборки. Указать статистический метод. Задать параметры. Рассмотреть результаты анализа в графическом или аналитическом виде.

Глава 4 Расчет мощности критерия Глава 4 Расчет мощности критерия

Мощность критерия Рассмотрим теперь обратную задачу определения мощности критерия. Зная размер выборки, можно вычислить Мощность критерия Рассмотрим теперь обратную задачу определения мощности критерия. Зная размер выборки, можно вычислить мощность соответствующего критерия.

Анализ мощности Переключимся в модуль «Анализ мощности» и выберем функцию вычисления мощности t-критерия Анализ мощности Переключимся в модуль «Анализ мощности» и выберем функцию вычисления мощности t-критерия

Анализ мощности Зададим параметры: Mu 0 = 0 «Разница» между гипотезами Mu = 0. Анализ мощности Зададим параметры: Mu 0 = 0 «Разница» между гипотезами Mu = 0. 5 Sigma = 14. 3 Ошибка первого рода, т. е. принятие гипотезы Н 1, когда верна гипотеза Н 2 Стандартное отклонение N = 8597 Размер выборки Alpha = 0. 05

Анализ мощности Указываем дополнительные параметры и нажимаем на кнопку «Calculate Power» Анализ мощности Указываем дополнительные параметры и нажимаем на кнопку «Calculate Power»

Результат анализа В итоге, мы получили таблицу со значением мощности критерия Результат анализа В итоге, мы получили таблицу со значением мощности критерия

Графический подход Кроме вычисления значения мощности критерия, используя графические средства STATISTICA, можно построить график Графический подход Кроме вычисления значения мощности критерия, используя графические средства STATISTICA, можно построить график зависимости мощности от объема выборки.

Анализ мощности Указываем необходимые параметры и нажимаем на кнопку «Power vs. N» Анализ мощности Указываем необходимые параметры и нажимаем на кнопку «Power vs. N»

Функция мощности Значение МОЩНОСТИ Размер Выборки С помощью данного графика можно быстро определить мощность Функция мощности Значение МОЩНОСТИ Размер Выборки С помощью данного графика можно быстро определить мощность критерия при данном объеме выборки

Глава 5 Дополнительные функции Глава 5 Дополнительные функции

Дополнительные функции К дополнительным функциям модуля «Анализ мощности» относятся: Интервальное оценивание (для заданного критерия) Дополнительные функции К дополнительным функциям модуля «Анализ мощности» относятся: Интервальное оценивание (для заданного критерия) Калькулятор вероятностных распределений

Интервальное оценивание Указав наблюдаемое значение t-статистики, размер выборки и доверительный уровень, получаем границы доверительного Интервальное оценивание Указав наблюдаемое значение t-статистики, размер выборки и доверительный уровень, получаем границы доверительного интервала.

Калькулятор вероятностных распределений позволяет работать с выборочным распределением (то есть распределением наблюдаемой статистики в Калькулятор вероятностных распределений позволяет работать с выборочным распределением (то есть распределением наблюдаемой статистики в повторяющихся выборках)