
Основная параметрическая статистика_new_12_05_17.pptx
- Количество слайдов: 41
ОСНОВЫ ПРАКТИЧЕСКОЙ БИОМЕДИЦИНСКОЙ СТАТИСТИКИ СЕРИЯ 3 t-критерий Стьюдента. Условия применимости. Интерпретация результатов. Примеры использования. Множественные сравнения. Поправка Бонферрони. Дисперсионный анализ. Примеры использования. Попарные сравнения по результатам дисперсионного анализа. Примеры использования. Трактовка результатов.
http: //www. ats. ucla. edu/stat/sas/whatsta t/default. htm
НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ (ДА, ОПЯТЬ!) Среднее 68% данных Стандартное отклонение 95% данных 99. 7% данных Нормальное распределение
Стандартизованное Z-значение 1. Ответ на вопрос «как далеко от среднего находится данное значение» , выраженный в относительных (стандартизованных) единицах; 2. Зная m и s, каждое значение х может быть преобразовано в значение z, и на основании таблиц площади под стандартизованной нормальной кривой; 3. В результате возможно ответить на вопрос «какова вероятность наблюдать подобное (или меньшее) значение x в совокупности с данными характеристиками (m и s).
Тестирование гипотез - пример
Тестирование статистических гипотез (прод. ) • Случайная простая выборка из 10 человек сделана из некоторой популяции. Средний возраст в выборке равен 27. Можем ли мы сделать заключение, что средний возраст популяции не равен 30? Дисперсия известна и равна 20. Пусть α=0. 05
Тестирование статистических гипотез (прод. ) •
Тестирование статистических гипотез (прод. ) Решение (прод. ): • Статистика теста: • Распределение статистики теста: если предположения верны и H 0 верна, статистика теста следует нормальному распределению • Критерии принятия решения: • Отвергнуть H 0, если рассчитанное z попадает в область неприятия гипотезы • Невозможность отвергнуть H 0, если рассчитанное z попадает в область приятия гипотезы
Тестирование статистических гипотез (прод. ) • В силу структуры H 0 данный тест относится к двусторонним. Т. о. H 0 будет отвергнута в обоих случаях: если z ≤ -1. 96 или z ≥ 1. 96 • Результат: H 0 отвергнута для уровня значимости α=0. 05. Заключение: μ≠ 30, р=0. 034
Доверительный интервал для среднего СТАТИСТИЧЕСКИЙ ТЕСТ НАОБОРОТ! Когда мы приводим 1 -α процентный доверительный интервал для среднего, мы утверждаем, что вероятность того, что истинное среднее находится в этом интервале равна 1 -α. Т. е. если мы возьмем из совокупности ВСЕ выборки и для каждой рассчитаем доверительный интервал, то истинное среднее будет содержаться в 1 -α интервалов.
http: //www. ats. ucla. edu/stat/sas/whatsta t/default. htm
t-критерий Стьюдента: - анализ одной зависимой количественной переменной обладающей нормальным распределением; - одна независимая категориальная переменная из двух уровней (бинарная); - равенство дисперсий Среднее 68% данных Стандартное отклонение 95% данных 99. 7% данных Нормальное распределение
t-критерий Стьюдента для несвязанных совокупностей: • Исследовалась длительность госпитализации пациентов с острым пиелонефритом в группах «правильного» и «неправильного» лечения. «Правильным» считалось лечение в соответствии с «Настольным справочником врача» . • Средняя длительность госпитализации составила: • В группе леченных «правильно» 4, 51+/-1, 98 сут. • В группе леченных «неправильно» 6, 28+/-2, 54 сут. • Можно ли считать эти различия случайными?
t-критерий Стьюдента: Пример приведен из: С. Гланц. Медико-биологическая статистика. – М. Практика, 1998
Статистика t-критерия: •
Предположения (ограничения) для t-теста для независимых совокупностей 1. Выборки сделаны случайным образом (или, как минимум, являются репрезентативными) из соответствующих популяций 2. Выборки не связаны между собой (если субъекты попарно подобраны, или это измерения по типу «допосле» , должен быть использован парный критерий 3. Наблюдения внутри каждой выборки были получены независимо друг от друга (выбор одного не изменяет вероятность попасть в группу для других) 4. Данные получены из выборки с (приблизительно) нормальным распределением. Для больших выборок это не столь важное требование 5. SD двух популяций должна быть равны (иначе использовать модифицированный t-тест) 6. Гомоскедастичность
http: //www. ats. ucla. edu/stat/sas/whatsta t/default. htm
Анализ для связанных совокупностей: 1. Анализ показателя у каждого пациента до и после вмешательства 2. Набор пациентов попарно, с учетом таких показателей, как возраст, диагноз, пол и т. п. 3. Измерение показателя у близнецов или у пар родитель/ребенок 4. В целом – при любой ситуации, когда есть основания думать, что значение показателя конкретного субъекта из группы А «ближе» к значениям показателя другого (а не случайно выбранного) субъекта из группы В
Предположения (ограничения) для парного t-теста: 1. Пары должны быть случайным образом отобраны из популяции большего размера (или, как минимум, быть репрезентативны по отношению к ней) 2. Наблюдения должны быть попарно сгруппированы, это делается при планировании эксперимента, и нельзя делать после получения данных 3. Каждая пара должна быть отобрана независимо от других пар 4. Распределение разности между парными значениями в популяции должно аппроксимироваться нормальным распределением
Парный t-критерий Стьюдента Стандартное отклонение изменений признака: Чувствительность выше!
Дисперсионный анализ (one-way ANOVA): •
Дисперсионный анализ (one-way ANOVA): • Исследовалась длительность госпитализации пациентов с острым пиелонефритом в группах «правильного» и «неправильного» лечения. «Правильным» считалось лечение в соответствии с «Настольным справочником врача» . • Средняя длительность госпитализации составила: • В группе леченных «правильно» 4, 51+/-1, 98 сут. • В группе леченных «неправильно» 6, 28+/-2, 54 сут. • Можно ли считать эти различия случайными?
Дисперсионный анализ (one-way ANOVA): Пример приведен из: С. Гланц. Медико-биологическая статистика. – М. Практика, 1998
Дисперсионный анализ – анализ выборок по разности дисперсий для n уровней фактора! S 2 вну= (S 21+ S 22+…+ S 2 n)/n νмеж = m – 1 νвну = m (n – 1), где m – число групп, n – число случаев в каждой группе (меньшее) Далее – попарные сравнения!
P<0, 01
Длительность госпитализации: итоги Леченные правильно находились в больнице меньше чем, леченные неправильно и различия эти статистически значимы. Значит ли это, что благодаря правильному лечению больные выздоравливают быстрее? Увы, нет. Как это всегда бывает в обсервационном исследовании, мы не можем исключить того, что группы различались чем-то еще кроме лечения. Может быть, врачи, которые лечат «по справочнику» просто более склонны быстрее выписывать своих больных?
Требования для дисперсионного анализа: 1. Наблюдения независимо отобраны из большей популяции или (как минимум) репрезентативны по отношению к ней 2. Выборки получены независимо (если субъекты отобраны попарно, или наблюдения носят характер «до-после» , необходимо использовать ANOVA с повторными измерениями 3. Наблюдения внутри каждой выборки получены независимо друг от друга, связи между наблюдениями в группе должны быть равны (2 пациента измеренные 2 раза ≠ 4 измерениям) 4. Данные получены из выборки с распределением показателя, близким к нормальному, SD для всех популяций должны быть идентичны
Основная параметрическая статистика_new_12_05_17.pptx