Скачать презентацию Описательные статистки Лекция для студентов 1 курса лечебного Скачать презентацию Описательные статистки Лекция для студентов 1 курса лечебного

3 Описательные статистки.pptx

  • Количество слайдов: 57

Описательные статистки Лекция для студентов 1 курса лечебного факультета Дисциплина доказательная медицина Заведующий кафедрой Описательные статистки Лекция для студентов 1 курса лечебного факультета Дисциплина доказательная медицина Заведующий кафедрой общественного здоровья и здравоохранения Шульмин А. В.

План лекции • 1. Понятие об описательной статистике. • 2. Шкалы измерения переменных (качественные План лекции • 1. Понятие об описательной статистике. • 2. Шкалы измерения переменных (качественные и количественные). • 3. Относительные величины: виды определение, методы расчета, области применения. • 4. Вариационные ряды: определение, структура, виды. • 5. Понятие о средних величинах (средняя арифметическая, мода, медиана), их применение в здравоохранении и деятельности врача. • 6. Ознакомление с основными видами распределений переменных. • 7. Критерии разнообразия признака в совокупности (дисперсия, лимит, амплитуда, среднее квадратичное отклонение, стандартная ошибка коэффициент вариации, перцентили). • 8. Понятие о доверительном интервале и доверительной вероятности.

Для чего нужны описательные статистики? Для чего нужны описательные статистики?

Для чего нужно описательные статистики? Анализ информации Анализ в Энциклопедическом словаре: Анализ (от греч. Для чего нужно описательные статистики? Анализ информации Анализ в Энциклопедическом словаре: Анализ (от греч. analysis разложение) 1) расчленение (мысленное или реальное) объекта на элементы; анализ неразрывно связан с синтезом(соединением элементов в единое целое). 2) Синоним научного исследованиявообще. 3) В формальной логике уточнение логической формы (структуры)рассуждения.

Дедукция Логическое умозаключение, переход от общих положений, законов и т. п. к частному, конкретному Дедукция Логическое умозаключение, переход от общих положений, законов и т. п. к частному, конкретному выводу. Индукция Логическое умозаключение от частного к общему, от единичного наблюдения к обобщению.

Учетные признаки Качественные Количественные Альтернативная (номинальная) шкала (пол) Интервальные (шкала Цельсия) Шкала рангов (порядковая) Учетные признаки Качественные Количественные Альтернативная (номинальная) шкала (пол) Интервальные (шкала Цельсия) Шкала рангов (порядковая) (стадии болезни) Относительные шкалы (наличие нулевой точки)

Абсолютные величины – могут быть простыми (имеют именованные единицы измерения сантиметры, дни, случаи заболевания Абсолютные величины – могут быть простыми (имеют именованные единицы измерения сантиметры, дни, случаи заболевания и т. п. ) и сложными (выражаются произведениями единиц различной размерности человеко-часы, потерянные годы жизни и т. п. ).

9 9

Относительные величины. Статистические коэффициенты. Относительные величины. Статистические коэффициенты.

Относительные величины (статистические коэффициенты) широко используются в официальной статистике для оценки медико-демографической и санитарно-эпидемиологической Относительные величины (статистические коэффициенты) широко используются в официальной статистике для оценки медико-демографической и санитарно-эпидемиологической ситуации, оценки деятельности медицинских учреждений и т. п.

Относительной статистической величиной называется отношение двух чисел, выражающих меру какихлибо явлений. Смысл получения относительных Относительной статистической величиной называется отношение двух чисел, выражающих меру какихлибо явлений. Смысл получения относительных величин – нахождение общей меры, приведение к общему знаменателю.

Динамика обеспеченности населения врачами. Показатель 2000 г. Физические лица (абсолютное число) Обеспеченность на 10 Динамика обеспеченности населения врачами. Показатель 2000 г. Физические лица (абсолютное число) Обеспеченность на 10 тыс. населения 2010 г. 10277 10221 37, 2 37, 9 Численность 2762634 2696834

Интенсивные коэффициенты показывают размер явления (частоту, уровень, распространенность) явления в среде которая продуцирует его. Интенсивные коэффициенты показывают размер явления (частоту, уровень, распространенность) явления в среде которая продуцирует его. Эти коэффициенты отвечают на вопрос, как часто явление встречается в известной среде.

Как сравнить? Популяция 1 2 из 10 Популяция 2 2 из 5 15 Как сравнить? Популяция 1 2 из 10 Популяция 2 2 из 5 15

Привести к общему знаменателю Популяция 1 Риски смерти соотносятся как 0, 2 и 0, Привести к общему знаменателю Популяция 1 Риски смерти соотносятся как 0, 2 и 0, 4 Популяция 2 16

Мерой смертности является интенсивный коэффициент, представляющий собой отношение числа умерших на отрезке времени наблюдения Мерой смертности является интенсивный коэффициент, представляющий собой отношение числа умерших на отрезке времени наблюдения (за год) к средней численности изучаемого населения или соответствующие его группы: Общий показатель = смертности число умерших за год х1000 среднегодовая численность населения 17

РОЖДАЕМОСТЬ И СМЕРТНОСТЬ НАСЕЛЕНИЯ КРАСНОЯРСКОГО КРАЯ В 1991 -2010 ГГ. (0/00) Смертность Рождаемость 18 РОЖДАЕМОСТЬ И СМЕРТНОСТЬ НАСЕЛЕНИЯ КРАСНОЯРСКОГО КРАЯ В 1991 -2010 ГГ. (0/00) Смертность Рождаемость 18

Экстенсивные коэффициенты отражают структуру, распределение. Они характеризуют отношение части статистической совокупности к целой совокупности Экстенсивные коэффициенты отражают структуру, распределение. Они характеризуют отношение части статистической совокупности к целой совокупности (долю, удельный вес, часть от целого), то есть отношение отдельного элемента к итогу. Выражаются только в процентах к итогу.

СТРУКТУРА ОБЩЕЙ СМЕРТНОСТИ В КРАСНОЯРСКОМ КРАЕ В 2010 ГОДУ (%) 20 СТРУКТУРА ОБЩЕЙ СМЕРТНОСТИ В КРАСНОЯРСКОМ КРАЕ В 2010 ГОДУ (%) 20

Вариационный ряд (frequency table)ранжированный ряд распределения по величине какого-либо признака. Этот признак носит название Вариационный ряд (frequency table)ранжированный ряд распределения по величине какого-либо признака. Этот признак носит название варьирующего, а его отдельные числовые значения называются вариантами и обозначаются через “V”. Число, показывающее, сколько раз данная варианта встречается в вариационном ряду, называется частотой и обозначается через "р"

Сжатие (свертка, редукция) статистических данных • Статистика – любая функция от вероятностных переменных, порождающих Сжатие (свертка, редукция) статистических данных • Статистика – любая функция от вероятностных переменных, порождающих статистические данные. • Простейший пример - выборочное среднее: • Оно порождается вероятностной переменной: 22

Рост студентов Высота (V или Х) Частота (Р) Рост студентов Высота (V или Х) Частота (Р)

Кривая нормального распределения Нормальное (гауссово, симметричное, колообразное) распределение – описывает совместное воздействие на изучаемое Кривая нормального распределения Нормальное (гауссово, симметричное, колообразное) распределение – описывает совместное воздействие на изучаемое явление небольшого числа случайно сочетающихся факторов (по сравнению с общей суммой факторов), число которых неограничено велико. Встречается в природе наиболее часто, за что и получило название «нормального» . Характеризует распределение непрерывных случайных величин. Р х – значения случайной величины; р – вероятность появления данного значения в совокупности. Х

Асимметрия Эксцесс Асимметрия Эксцесс

Критерии нормальности Критерий Шапиро-Уилка (W-test, Shapiro-Wilk test) Разработан в 1965 году, является до сих Критерии нормальности Критерий Шапиро-Уилка (W-test, Shapiro-Wilk test) Разработан в 1965 году, является до сих пор самым мощным тестом на нормальность. Основа – оценка линейности регрессионной кривой на вероятностных графиках. Модификация – критерий Шапиро. Франциа (Shapiro-Francia test)

Описательная статистика 1. Меры центральной тенденции 1. Среднее значение (математическое ожидание) 2. Мода 3. Описательная статистика 1. Меры центральной тенденции 1. Среднее значение (математическое ожидание) 2. Мода 3. Медиана 2. Меры разброса 1. Дисперсия (среднее квадратичное отклонение) 2. Стандартное отклонение 3. Среднее отклонение 4. Квантильные оценки (квартили, децили, процентили) 5. Максимум, минимум и размах выборкии

Вариационный ряд можно разбивать на отдельные (по возможности равные) части, которые называются квантилями (quantile). Вариационный ряд можно разбивать на отдельные (по возможности равные) части, которые называются квантилями (quantile). Наиболее часто употребляемые квантили: Название квантилей Число частей, на которые разбивается ряд Медиана 2 Терциль 3 Квартиль 4 Дециль 10 Процентиль 100

Медиана (Me)(median) -варианта, которая делит вариационный ряд на две равные части. Медиана используется: ¡ Медиана (Me)(median) -варианта, которая делит вариационный ряд на две равные части. Медиана используется: ¡ - при необходимости знать, какая часть вариант лежит выше и ниже срединного значения ; ¡ - для характеристики центральной тенденции при ассиметричных распределениях.

Мода (Мо) (mode)- наиболее часто встречающаяся в вариационном ряду варианта. Мода используется: ¡ - Мода (Мо) (mode)- наиболее часто встречающаяся в вариационном ряду варианта. Мода используется: ¡ - при малом числе наблюдений, когда велико влияние состава совокупности на среднюю ; ¡ - для характеристики центральной тенденции при ассиметричных распределениях, когда велико влияние на среднюю крайних вариант;

Стандартный вариант графика с диапазоном Шаг = 1, 5 МКД Внешний предел = 2 Стандартный вариант графика с диапазоном Шаг = 1, 5 МКД Внешний предел = 2 шагам от 1(3) квартиля Внутренний предел = 1 шагу от 1(3) квартиля МКД (межквартильный диапазон) разница между значением 1 го и 3 го квартилей Области: Смежная – от МКД до внутреннего предела Внешняя – от внутреннего до внешнего предела Удаленная – дальше внешнего предела Умеренный аутсайдер – во внешней области (кружок) Выраженный аутсайдер – в удаленной области (звездочка)

Ящичная диаграмма Ящичная диаграмма

Основные параметры непрерывных вариационных рядов Количество значений (N) ¡ Минимум и максимум ¡ Средняя Основные параметры непрерывных вариационных рядов Количество значений (N) ¡ Минимум и максимум ¡ Средняя арифметическая (М) ¡ Ошибка средней арифметической (м) ¡ Среднее квадратическое отклонение (σ) ¡ Параметры распределения ¡ l l l Асимметрия и эксцесс Нормальность Медиана и центили

Основные характеристики нормального распределения Среднее арифметическое значение (М) Стандартное (среднеквадратическое) отклонение (σ) Количество наблюдение Основные характеристики нормального распределения Среднее арифметическое значение (М) Стандартное (среднеквадратическое) отклонение (σ) Количество наблюдение (n)

Определение нормальности распределения 1. По числам Вестергарда при нормальном распределении в пределах: ¡ х Определение нормальности распределения 1. По числам Вестергарда при нормальном распределении в пределах: ¡ х ± 0. 3 σ находится 25 % всех единиц наблюдения; ¡ х ± 0. 7 σ находится 50 % всех единиц наблюдения; ¡ х ± l, l σ находится 75 % всех единиц наблюдения; ¡ х ± 3, 0 σ находится 99 % всех единиц наблюдения. ¡

68. 3 % всех вариант отклоняются от своей средней не более, чем на σ 68. 3 % всех вариант отклоняются от своей средней не более, чем на σ 95. 4% вариант находятся в пределах X ± 2σ 99. 7% вариант находятся в пределах X ± 3σ. Отклонение параметра от его средней арифметической в пределах σ расценивается как норма, субнормальным считается отклонение в пределах ± 2σ и патологическим сверх этого предела, т. е. > ± 2σ" (рис. ) Правило «трех сигм» ( SD – стандартное отклонение)

На тощак Критическая точка 3, 3 5, 5 ммоль/л 6, 1 ммоль/л 4, 4± На тощак Критическая точка 3, 3 5, 5 ммоль/л 6, 1 ммоль/л 4, 4± 0, 55 ммоль/л После еды Критическая точка 3, 3 – 7, 8 ммоль/л. 11, 0 ммоль/л 5, 55± 1, 125 ммоль/л

Доверительные интервалы для долей Доверительный интервал (confidence interval) для доли – это диапазон значений, Доверительные интервалы для долей Доверительный интервал (confidence interval) для доли – это диапазон значений, в пределах которого с заданной вероятностью (обычно 95%) находится истинная популяционная доля. Для достаточно больших выборок распределение выборочных долей можно считать нормальным. Тогда: Доверительный интервал для доли: ДИ=p±zsp

Доверительные интервалы для долей, рассчитанные выше, являются лишь приблизительными. Точные доверительные интервалы рассчитываются, исходя Доверительные интервалы для долей, рассчитанные выше, являются лишь приблизительными. Точные доверительные интервалы рассчитываются, исходя из биномиального распределения. Вручную их можно определить по специальным номограммам, а на практике – в компьютерных статистических пакетах. Доверительные интервалы должны в обязательном порядке указываться для всех переменных при описании данных.

Доверительные интервалы для долей Пример: Исследователь указывает, что он исследовал 10 больных до и Доверительные интервалы для долей Пример: Исследователь указывает, что он исследовал 10 больных до и после лечения. Затем в таблице мы увидим, что до лечения боли в животе были у 70%, а после лечения – лишь у 20%. Данные выглядят очень убедительно - различия составляют 50%!. Теперь укажем доверительные интервалы: До лечения - 70% (35% - 93%), после лечения - 20% (25% - 56%). Доверительные интервалы даже перекрываются! Поэтому проверим значимость различий: различия действительно значимы (p=0. 02). Применение доверительных интервалов показывает, какой диапазон значений может принимать показатель в популяции, а не в конкретной выборке.

Доверительные интервалы для долей График без доверительных интервалов – дает представление только о выборке, Доверительные интервалы для долей График без доверительных интервалов – дает представление только о выборке, изученной исследователем.

Доверительные интервалы для долей Тот же график, но уже с границами доверительных интервалов – Доверительные интервалы для долей Тот же график, но уже с границами доверительных интервалов – диапазон, который могут принимать истинные значения в популяции.

Благодарю за внимание Благодарю за внимание

Подзаголовок презентации Подзаголовок презентации

Заголовок слайда р величина показателя изучаемого признака; q (100 p); t доверительный коэффициент, показывающий Заголовок слайда р величина показателя изучаемого признака; q (100 p); t доверительный коэффициент, показывающий какова веро ятность того, что размеры показателя не будут выходить за гра ницы предельной ошибки (обычно берется t = 2, что обеспечива ет 95% вероятность безошибочного прогноза); — предельная ошибка показателя.

σ — показатель вариабельности признака (среднеквадратическое отклонение), который можно получить из предыдущих ис следований σ — показатель вариабельности признака (среднеквадратическое отклонение), который можно получить из предыдущих ис следований либо на основании пробных (пилотажных) исследо ваний. 57