1511.ppt
- Количество слайдов: 44
БИОСТАТИСТИКА План лекции 1. Основные понятия 2. Основные процедуры 3. Планирование исследования
Литература 1. 2. 3. Власов В. В. Введение в доказательную медицину. М. Медиа Сфера. 2001. – 392 с. Лапач С. Н. , Чубенко А. В. , Бабич П. Н. Основные принципы приме нения статистических методов в клинических испытаниях. – К. : МОРИОН, 2002. – 160 с. Лях Ю. Е. , Гурьянов В. Г. Хоменко В. Н. , Панченко О. А. Основы компьютерной биостатистики. Анализ информации в биологии, медицине и фармации статистическим пакетом Med. Stat. – Д. : Папакица Е. К. , 2006. – 214 с.
Cтатистический анализ информации является чрезвычайно сложной и обязательной процедурой современной биомедицины. Поэтому, для получения правильного биомедицинского результата необходимо сознательно выбрать разумный компромисс между Сциллой – сложностью, неоднозначностью, нелинейностью биологических объектов, процессов и явлений, с одной стороны, и Харибдой – ограниченностью строго определенными математическими условиями применения и весьма условной биологической адекватностью используемых статистических методов, с другой стороны. Естественно, что работа биостатистика является творческой, а саму биостатистику можно определить как искусство и науку анализа биомедицинской информации.
Что должен знать о биостатистике врач? Иметь представление об основных понятиях статистики, включая некоторые (но не обязательно все) детали, четко представлять себе все возможности и ограничения используемых статистических методов и их адекватность решаемым биологическим задачам. Осознавать случайность и неопределенность многих аспектов окружающего нас мира. Более того, необходимо: • понимать (оценивать) и употреблять в качестве базовой информации для своей деятельности результаты биостатистического анализа; • принимать непосредственное участие в биостатистическом исследовании в процессе сбора и анализа данных; • четко представлять себе биологическую (клиническую и др. ) суть проводимого исследования.
Что для этого нужно? Уметь интерпретировать полученные результаты, ориентироваться в основных положениях биостатистики и современных компьютерных пакетах. Результаты должны иметь достаточно простое непосредственное и логическое объяснение (даже если соответствующая теория намного сложнее). Руководствоваться принятии решения следующими принципами: Критически оценивать полученные статистические материалы, обязательно учитывать биологический или другой предметный смысл полученных данных! Сохранять профессиональный здравый скептицизм. Не позволять ввести себя в заблуждение с помощью на первый взгляд оригинального статистического анализа. Он может опираться на заведомо нереальные или неподходящие биологические или математические предположения.
Обобщающие показатели При анализе результатов исследований самым эффективным приемом «увидеть целиком всю картину» является обобщение, то есть использование одного или нескольких отобранных или рассчитанных значений для характеристики полученного набора данных. Одна из целей статистики состоит как раз в том, чтобы свести имеющийся набор данных к одному числу (или нескольким), которое выражает самые общие и фундаментальные их свойства. Методы, наиболее подходящие для анализа одномерного набора данных, включают определение следующих показателей.
Типическое значение Среднее, медиана и мода – это различные способы выбора единственного числа, которое лучше всего описывает все значения в наборе данных. Такой показатель называется типическим значением или центром.
Какой показатель следует выбирать? Какой же показатель из трех перечисленных (среднее, медиана или мода) следует выбирать в конкретных обстоятельствах?
Мода, Среднее, Медиана? n n n Моду можно вычислить для любого одномерного набора данных (хотя, в случае количественных данных, может быть несколько значений моды). Среднее можно вычислить только для количественных данных (следует отметить, что среднее, в свою очередь, может быть арифметическим, взвешенным, геометрическим или гармоническим). Медиана вычисляется для всех типов данных, кроме номинальных (неупорядоченных категорий).
Нормальное или асимметричное распределения В случае нормального распределения количественных данных все три характеристики совпадают. Однако в случае асимметричного распределения данных эти характеристики могут заметно различаться.
Среднее (арифметическое) следует выбирать, когда набор данных подчиняется нормальному распределению (или не сильно отличается), поскольку в этом случае среднее является самой эффективной оценкой. Среднее также следует вычислять и в тех ситуациях, где необходимо сохранить или предсказать общую сумму значений данных, так как другие характеристики не позволяют это сделать.
Медиана служит хорошей характеристикой асимметричного распределения, поскольку на него не влияет небольшое число данных с выделяющимися значениями. В случае сильной асимметрии медиана значительно лучше среднего характеризует большинство данных. Медиана также полезна при наличии выбросов значений, так как она устойчива к их влиянию. Она может использоваться и для описания порядковых данных (упорядоченные категории), хотя в зависимости от конкретной задачи можно использовать и моду.
Мода Моду применяют при наличии номинальных данных, так как в этом случае нельзя вычислить среднее и медиану. Она также полезна для порядковых данных, когда требуется определить наиболее распространенную категорию.
Оценка изменчивости Изменчивость можно определить как степень различий между отдельными значениями. Подобный смысл имеют также такие понятия как разнообразие, неопределенность, рассеяние и разброс. Степень изменчивости можно описать различными способами.
Среднее квадратическое Стандартное отклонение или среднее квадратичное отклонение используют наиболее часто. Этот показатель описывает, насколько сильно результат наблюдений обычно отличается от среднего значения. Квадрат стандартного отклонения называется дисперсией. Размерность стандартного отклонения такая же, как и среднего значения. Биологический смысл показателя заключается в характеристике вариабельности процесса.
Размах легко вычисляется, однако дает несколько поверхностное представление об изменчивости данных и имеет ограниченное применение. Этот параметр представляет собой разницу между минимальным и максимальным значениями и характеризует возможные пределы изменения данных в наборе.
Стандартная ошибка среднего(m) Стандартная ошибка среднего – отражает точность оценки среднего значения признака в популяции по его выборке. Небольшая стандартная ошибка (существенно меньше соответствующего среднего значения) означает достаточно точную оценку. Стандартная ошибка (m) уменьшится, т. е. оценка станет более точной, если объем выборки увеличится или данные имеют небольшое рассеяние (дисперсию). При неограниченном увеличении объема выборки стандартная ошибка среднего обращается в 0. Следовательно, эта величина не имеет никакого биологического смысла.
Коэффициент вариации Выбирается в качестве относительной меры изменчивости. Он показывает, насколько сильно обычно отличается результат конкретного наблюдения от среднего значения, в процентном отношении к среднему; при этом используется отношение стандартного отклонения к среднему значению. Иногда он применяется в случае, когда необходимо сравнить между собой изменчивость объектов, имеющих различную физическую размерность, например, рост в см и масса в кг.
Перцентиль (процентиль) n n Обобщает информацию о рангах, характеризуя значение, достигаемое заданным процентом общего количества данных, после того, как данные упорядочиваются (ранжируются) по возрастанию. Перцентили (процентили) выражают ранги элементов в виде процентов от 0 до 100%, а не в виде чисел от 1 до n, таким образом, что наименьшему значению соответствует нулевой перцентиль, наибольшему – 100 й перцентиль, медиане – 50 й перцентиль и т. д.
Статистические оценки являются только предположениями!!! Биостатистика может пролить свет на многие ситуации, предоставив хорошо обоснованное предположение, исходя из надежности данных. Необходимо четко представлять себе, что все статистические оценки являются только предположениями, а, следовательно, часто бывают неточны. Однако они служат поставленным целям только в тех случаях, если достаточно близки к соответствующим неизвестным величинам. Если известно, насколько (приближенно) точны эти оценки, то можно решить, в какой мере их стоит принимать во внимание.
Точечная и интервальная оценка неизвестной величины Оценка неизвестной величины представляет собой наиболее обоснованное из всех имеющихся данных предположение о возможном её значении. Поэтому необходимо оценивать те параметры, которые невозможно определить точно, например, количество осложнений после оперативного вмешательства, сроки выздоровления, количество лейкоцитов при определенном заболевании и многое другое.
Точечная и интервальная оценка неизвестной величины При описании популяции в большинстве случаев оценивают положение центра и степени разброса значений вокруг этого центра. С этой целью используется точечная и интервальная оценка параметров популяции на основании вычисления соответствующих параметров изучаемых выборочных совокупностей. В случае нормального распределения в качестве таких точечных оценок служат выборочное среднее и выборочная дисперсия.
Интервальная оценка Выборка из популяции позволяет получить точечную оценку интересующего нас параметра и вычислить стандартную ошибку для того, чтобы указать точность оценки. Следует отметить, что для большинства исследований стандартная ошибка как таковая неприемлема, поскольку она, в отличие от стандартного отклонения, не отражает вариабельность в значениях данных. Гораздо полезнее объединить эту меру точности с интервальной оценкой для параметра популяции.
Доверительный интервал (ДИ) Для этого нужно вычислить доверительный интервал (ДИ), который дает вероятное значение верхней и нижней границ оцениваемой неизвестной величины. Обычно доверительные интервалы показывают, насколько надежной в действительности является статистическая оценка.
Важность вычисления ДИ Можно проверить, попадает ли вероятное значение для параметра популяции в пределы ДИ. Если да, то результаты согласуются с этим вероятным значением. Если нет, то маловероятно (для 95% ДИ шанс меньше 5%), что параметр имеет это значение. Следует отметить, что в современной литературе по биостатистике подчеркивается важность обязательного вычисления ДИ для любых, а не только среднего и дисперсии, полученных в результате исследований статистических показателей и параметров.
Интерпретация ДИ При интерпретации ДИ исследователь формулирует следующие вопросы. n 1) насколько широк ДИ? Широкий ДИ указывает на менее точную оценку, узкий – на более точную оценку; n 2) какой клинический (биологический) смысл можно извлечь из рассмотрения ДИ? Верхние и нижние пределы показывают, будут ли результаты клинически (биологически) значимы; n 3) включает ли ДИ какие-либо значения, представляющие особый интерес?
Причины редкого использования интервальных оценок. Несмотря на очевидные преимущества, редко используются на практике, что вызвано следующими причинами: n Традиция. В традиционных подходах критериям значимости уделяется существенно больше внимания, чем интервальному оцениванию. n Прагматизм. Интервальные оценки иногда являются смущающим исследователя фактором. Например, если они узки но лежат близко к нулю, то такой результат может быть статистически "высоко значимыми", но тривиальным. Если ДИ широкий, то он выдает неточность исследования. n Отсутствие информации. Пользователи просто не осведомлены о доступных интервальных процедурах оценивания. Например, в большинстве книг по многомерному анализу даже на упоминается о том, что можно вычислить ДИ для квадрата коэффициента множественной корреляции. n Недоступность. Немногие из замечательных процедур интервального оценивания включены в стандартные пакеты статистического анализа данных.
Проверка статистических гипотез Многие типы статистического анализа направлены на сравнение двух видов лечения, процедур или групп пациентов. Численное значение, которое суммирует интересующие исследователя различия, называется эффектом. В других исследованиях эффектом может являться коэффициент корреляции, отношение шансов или относительный риск. Затем мы выдвигаем нулевую (H 0) и альтернативную гипотезы (H 1). Обычно H 0 гласит, что эффекта нет (различия между группами равны нулю, относительный риск равен единице, коэффициент корреляции равен нулю), альтернативная гипотеза H 1 предполагает, что эффект есть.
Оценка причинности в наблюдательных исследованиях Единственно правильное и убедительное доказательство причинной роли того или иного фактора при заболевании обычно извлекают из экспериментальных исследований. Информацию, полученную из других наблюдений можно использовать только в том случае, если она отвечает ряду условий, что зачастую не соблюдается исследователями. Этой проблеме посвящено значительное количество работ, в которых сформулирован целый ряд простых критериев оценки причинности, которые во многом совпадают из за своей очевидности. В качестве примера приведем наиболее известные в биостатистике и тривиальные критерии для оценки причинной обусловленности, которые чаще всего используются в той или иной степени.
Критерии оценки причинной обусловленности 1) Причина должна обязательно предшествовать результату. 2) Взаимосвязь должна быть правдоподобной, т. е. результаты должны быть биологически целесообразными. 3) Результаты ряда исследований, выполненных по одному дизайну, должны быть совместимы. 4) Связь между причиной и результатом (следствием) должна быть достаточно сильной. 5) Соотношение между дозой воздействия и результатом (эффектом), т. е. более высокая доза воздействия должна привести к более тяжелому поражению или к более быстрому началу заболевания. 6) Удаление действующего фактора должно уменьшить риск заболевания или другого исхода. К сожалению, приходится констатировать, что 6 е (да зачастую и другие!) положение практически никогда не обсуждается авторами многих исследований и, как результат, появляются псевдонаучные количественные зависимости там, где на самом деле они не существуют.
Планирование эксперимента Когда необходимо рассчитывать размер выборки? Размер выборки требуется определить перед началом большинства количественных исследований. Расчет размера выборки не обязательно выполнять перед проведением предварительных, пилотных исследований (однако такие исследования обычно выполняются перед реальным планированием научного исследования).
Почему размер выборки важен для исследователя? В исследованиях, направленных на выявление эффекта (например, разность эффективности двух методов лечения, относительный риск заболевания при наличии или отсутствии фактора риска) оценка размера выборки важна для того, чтобы удостовериться в том, что если клинически или биологически важный эффект существует, то он с высокой степенью вероятности будет обнаружен, иными словами анализ даст статистически значимые результаты. Если размер выборки невелик, то даже в случае значительных различий между группами будет невозможно доказать, что они являются следствием чего-то иного, кроме как выборочной вариабельности.
От чего зависит размер выборки? Изучаемые переменные и их типы Необходимая мощность исследования Необходимый уровень статистической значимости Размер эффекта, который имеет клиническую значимость Стандартное отклонение для количественных переменных Будет ли использоваться одно- или двусторонний тест значимости Дизайн исследования, иными словами является ли исследование: Рандомизированным контролируемым испытанием Кластерным рандомизированным исследованием Исследованием эквивалентности Нерандомизированным исследованием вмешательства Обсервационным исследованием Исследованием распространенности Изучением чувствительности и специфичности теста
Какие статистические термины используются при описании процесса планировании размера выборки?
Доверительная вероятность (р-оценка) р оценка это вероятность наблюдения в исследовании такого же или более сильного эффекта при условии справедливости нулевой гипотезы. Обычно выражается как пропорция (например, р=0. 03)
Уровень значимости n n Уровень значимости это пороговое значение для р оценки, ниже которого нулевая гипотеза должна быть отвергнута и сделано заключение о том, что имеются доказательства эффекта. Обычно уровень значимости устанавливается на значении 5%. Если наблюдаемое значение меньше 5%, то имеется незначительная вероятность, что в исследовании были бы получены такие результаты, если бы истинного эффекта не было. Поэтому принимается гипотеза о наличии эффекта Уровень значимости 5% также означает, что имеется практически 5% вероятность сделать вывод о наличии эффекта, хотя на самом деле его нет. Иногда более адекватным является использование 1% уровня значимости, особенно если очень важно избежать заключения о том, что эффект существует тогда, когда на самом деле его нет.
Мощность это вероятность того, что нулевая гипотеза будет адекватно отвергнута, иными словами это возможность обнаружить клинический эффект. Ее можно рассматривать как "100 процентов минус вероятность пропуска истинного эффекта". Поэтому чем выше мощность, тем меньше вероятность пропуска истинного эффекта. Мощность обычно фиксируется на уровне 80%, 90% или 95%. Мощность не должна быть меньше 80%. Если крайне важно, чтобы исследование не пропустило существующего эффекта, надо стремиться достичь мощности 90% или более.
Клинически важный размер эффекта Это наименьшие различия между средними групп или процентами событий в них (для отношений шансов самый близкий к единице риск), которые еще можно рассматривать как биологически или клинически значимые. Должна быть сформирована выборка такого размера, чтобы если подобные различия существуют, то в исследовании были бы получены статистически значимые результаты.
Какие переменные должны учитываться при расчете размера выборки Расчет размера выборки должен базироваться на анализе основной переменной исхода в данном исследовании. Если в исследование будут включены дополнительные переменные, которые также рассматриваются, как имеющие важное научное значение, то размер выборки должен быть таковым, чтобы позволить провести адекватный анализ этих переменных. Для всех важных в научном плане переменных должен быть проведен и представлен расчет размера выборки.
Соответствие целям исследования и методам статистического анализа Адекватность размера выборки должна также быть оценена в соответствии с целью исследования. Например, если целью исследования является демонстрация того, что новое лекарство лучше существующего, необходимо добиться того, чтобы размер выборки позволял обнаружить клинически значимые различия между двумя методами лечения. Однако иногда требуется продемонстрировать, что два лекарственных средства клинически эквивалентны. Этот тип исследований часто называют испытанием эквивалентности или "негативным" испытанием. Размер выборки в исследованиях, направленных на демонстрацию эквивалентности лекарств больше, чем в исследованиях, которые направлены на выявление различий в эффективности.
ДВАДЦАТЬ ОШИБОК СТАТИСТИЧЕСКОГО АНАЛИЗА, КОТОРЫЕ ЛЕГКО ОБНАРУЖИТЬ В БИОМЕДИЦИНСКИХ СТАТЬЯХ С распространением движения доказательной медицины возросло понимание актуальности проблем, связанных с низким качеством изложения статистического материала. В основе доказательной медицины лежит использование опубликованных в медицинской литературе исследований, поэтому она зависит от методологического качества статей.
Ошибка 1. Количественные данные представлены с излишней точностью Ошибка 2. Непрерывные данные представлены в виде порядковых без объяснения причин и способа преобразования Ошибка 3. Представлены средние групповые значения для парных данных без сообщения размера изменений внутри групп Ошибка 4. Неправильно используются статистические характеристики данных Ошибка 5. Стандартная ошибка средней величины используется для описательного анализа данных или в качестве показателя точности оценки
Ошибка 6. Для описания различий между группами используется только величина р Ошибка 7. Отсутствует подтверждение того, что анализируемые данные соответствуют предположениям, лежащим в основе использованных статистических методов Ошибка 8. Использование линейной регрессии без подтверждения линейного характера связи Ошибка 9. В анализ включены не все данные и не все участники Ошибка 10. Не указано, использовалась ли поправка на многократность проверки гипотез Ошибка 11. Ненужное сравнение исходных характеристик в рандомизированных клинических испытаниях
Ошибка 12. Не указаны критерии нормы и отклонения от нормы при оценке эффективности диагностических методов Ошибка 13. Отсутствует объяснение, каким образом неопределенные (сомнительные) результаты учтены при вычислении операционных характеристик диагностического теста (чувствительность и специфичность) Ошибка 14. Рисунки и таблицы используются лишь для хранения данных, а не с целью облегчить восприятие материала Ошибка 15. Несоответствие между внешним видом графика или диаграммы и данными, на которых они основаны Ошибка 16. Нечеткое определение понятия «объект исследования» Ошибка 17. Интерпретация статистически незначимых или полученных в исследованиях с малой статистической мощностью результатов как отрицательных, а не недостаточных Ошибка 18. Непонимание различий между объяснительными (идеальная эффективность вмешательства) и прикладными (реальная эффективность вмешательства) исследованиями при планировании и интерпретации исследований Ошибка 19. Представление результатов не в клинически важных единицах Ошибка 20. Смещение понятий статистической и клинической значимости
1511.ppt