л-4_2003.ppt
- Количество слайдов: 31
Основи статистичних методів обробки медико-біологічних даних Лекція № 4 з дисципліни “Медична інформатика” для студентів 2 курсу медичного факультету
План лекції 1. Статистика. Етапи статистичного аналізу даних. 2. Статистичні терміни, що використовуються при аналізі медико-біологічних даних 3. Діагностичні параметри тестів
«статистика - це сукупність методів, які дають нам можливість ухвалювати рішення в умовах невизначеності» . А. Вальд А прем'єр-міністр Англії Б. Дізраелі сказав: «Існує три види брехні: брехня, передвиборі обіцянки і статистика» .
На практиці для лікаря обробка й аналіз даних зводяться до вирішення наступних задач: • одержання методи; уяви про основні статистичні • засвоєння пакету прикладних програм; • аналіз та досліджень. інтерпретації результатів
Етапи аналізу даних з використанням статистичного пакету • планування дослідження; • підготовка даних до аналізу; • попередній аналіз даних; • вибір методу аналізу та його реалізація; • інтерпретація результатів; • подання результатів.
П а р а м е те р Стан людського організму визначається сукупністю властивостей (температура, артеріальний тиск, число клітин крові і т. д. )? Властивості, які піддаються оцінці в будьякій формі (якісній або кількісній) називаються параметрами .
Випадкова величина - величина, яка в результаті експерименту, повторюваного при незмінних умовах велику кількість разів, може приймати значення х1, х2, . . . , хn. Випадкова величина Дискретна випадкова величина Неперервна випадкова величина кількість дітей, які народилися за добу у м. Києві маса тіла і новорождених вага
Статистична сукупність - група, що складається з великого числа відносно однорідних елементів (об'єктів), узятих разом у відомих межах часу або простору. Приклади: -Контингент хворих, що у поточний момент знаходяться на лікуванні в стаціонарі; - група призовників, які пройшли медичне обстеження у військкоматі за рік; - сукупність мікрофотографій якоїсь тканини, взятої у деякого числа хворих
Генеральная сукупність Генеральна сукупність - сукупність, яка складається з усіх одиниць спостереження, які можуть бути до неї віднесені у відповідності з метою дослідження. Наприклад, якщо б можна було вивчити всіх хворих на туберкульоз у світі, то така група хворих склала б генеральну сукупність.
Вибірка (вибіркова сукупність) - частина генеральної сукупності, за властивостями якої судять про генеральної сукупності Однорідність Репрезентативність (від фр. representant — представник) — здатність вибіркової сукупності повно та адекватно відображати основні характеристики генеральної сукупності.
Варіаційний ряд Припустимо, що ми виміряли АТ у 10 -ти пацієнтів з метою отримати верхній поріг АТ (систолічний тиск): 1 2 3 4 5 6 7 8 9 10 120 115 120 125 120 115 120
Щоб отримати варіаційний ряд артеріального тиску, необхідно розташувати дану статистичну сукупність в порядку зростання або спадання значень 1 2 3 115 115 4 5 120 6 120 7 8 120 9 120 10 125 Сукупність значень вивченого в даному експерименті або спостережуваного параметра, проранжованого по величині (зростання або зменшення) називається варіаційним рядом
Середня величина - узагальнююча числова характеристика якісно однорідних величин, що характеризує одним числом всю статистичну сукупність за однією ознакою. Середня величина виражає те спільне, що характерно для ознаки в даній сукупності спостережень. Середня величина Мода Медіана Средньоарифметична величина
Середня величина Мода - значення, яке найбільш часто зустрічається в серії спостережень. Медіана - значення, щои ділить розподіл на дві рівні частини, центральне або серединне значення серії спостережень, упорядкованих за зростанню або спаданню. Середня арифметична величинарозраховується за формулою.
Частота - абсолютна чисельність окремих варіант в сукупності, яка вказує, скільки разів зустрічається дана варіанта в варіаційному ряду Найбільш повну характеристику розмаїтості ознаки в сукупності дає середнє квадратичне відхилення.
Абсолютне відхилення Відхилення варіанти від середнього значення називається абсолютним відхиленням і позначається . d
Середньоквадратичне або (стандартне) відхилення при Среднє квадратичне відхилення характеризує ступінь розсіювання варіаційного ряду навколо середньої
Коефіцієнт варіації - величина, необхідна для порівняння ступеня різноманітності ознак, виражених у різних одиницях виміру спостерігається слабка різноманітність ознаки спостерігається середня ознаки різноманітність спостерігається сильна різноманітність ознаки
Помилка репрезентативності (стандартна помилка) – величина, необхідна для оцінки достовірності результатів дослідження
• Довірчий інтервал- інтервал значень в який попадають значення вимірюваної величини з певною імовірністю, яка називається довірчою імовірністю • Коефіцієнт Стьюдента
Таблиця значень коефіцієнта Стьюдента , % Число ступеней вільності 95 99 99. 9 1 12, 71 63, 66 64, 60 18 2, 10 2, 88 3, 92 2 4, 30 9, 92 31, 60 19 2, 09 2, 86 3, 88 3 3, 18 5, 84 12, 92 20 2, 09 2, 85 3, 85 4 2, 78 4, 60 8, 61 21 2, 08 2, 83 3, 82 5 2, 57 4, 03 6, 87 22 2, 07 2, 82 3, 79 6 2, 45 3, 71 5, 96 23 2, 07 2, 81 3, 77 7 2, 37 3, 50 5, 41 24 2, 06 2, 80 3, 75 8 2, 31 3, 36 5, 04 25 2, 06 2, 79 3, 73 9 2, 26 3, 25 4, 78 26 2, 06 2, 78 3, 71 10 2, 23 3, 17 4, 59 27 2, 05 2, 77 3, 69 11 2, 20 3, 11 4, 44 28 2, 05 2, 76 3, 67 12 2, 18 3, 05 4, 32 29 2, 05 2, 76 3, 66 13 2, 16 3, 01 4, 22 30 2, 04 2, 75 3, 65 14 2, 98 4, 14 40 2, 02 2, 70 3, 55 15 2, 13 2, 95 4, 07 60 2, 66 3, 46 16 2, 12 2, 92 4, 02 120 1, 98 2, 62 3, 37 17 2, 11 2, 90 3, 97 1, 96 2, 58 3, 29
Діагностичні параметри тестів Таблиця 1. Розподіл результатів досліджень Дослідження Результати досліджень Всього Позитивні Негативні Хворі (Х) Істинно (ІП) Помилково (ПН) ІП+ПН Нехворі (НХ) Помилково (ПП) Істинно (ІН) ПП+ІН Всього ІП+ПП ПН+ІН ІП+ПП+ПН+ІН
Таблиця 2. Результати проведення тестів у хворих з лихоманкою невідомого походження і у людей, що страждаючих іншими хворобами з одним із симптомів лихоманки Дослідження Досліджув ані Результати досліджень Позитивні Негативні Хворі 7 13 Нехворі 2 15 Антинейтрофільн е цитоплазматичне антитіло Хворі 10 20 Кріоглобулін Хворі 50 0 Нехворі 3 0 Антиядерні антитіла
1. Діагностична чутливість (ДЧ) процентний вираз частоти істинно позитивних результатів тесту у хворих даною хворобою: 2. Діагностична специфічність (ДС) процентний вираз частоти істинно негативних результатів тесту у осіб, що не страждають хворобою
3. Передбачувана (прогностична) значущість позитивних результатів (ПЗ+)процентне співвідношення істинно позитивних результатів до загального числа позитивних результатів: 4. Передбачувана (прогностична) значущість негативних результатів (ПЗ-) – процентне співвідношення істинно негативних результатів до загального числа негативних результатів:
5. Діагностична ефективність тесту (ДЕ) - процентне відношенням дійсних (тобто відповідних стану обстежуваних пацієнтів) результатів тесту до загального числа отриманих результатів:
Таблиця. Вибір методу для розв'язання задачі про порівняння параметрів розподілу вибірки Порівняння Перевірка Нормальний закон -критерій показників гіпотези про розподілу вибірки до і рівність середніх Ст’юдент після в двох залежних а для експеримент вибірках зв'язних у вибірок Чи можна Перевірка Нормальний закон -критерій вважати, що гіпотези про розподілу (Ст'юден середнє рівність середньої та) значення константі показника дорівнює певному номінальном у значенню?
Таблиця Вибір методу для розв'язання задачі про порівняння параметрів розподілу вибірки Формулювання задачі в прикладній постановці Порівняння показників контрольної та експериментальної вибірок Формулювання задачі в статистичній постановці Додаткові умови Перевірка гіпотези про Нормальний Дисперсії рівність середніх закон вибірок рівні (центрів розподілу) в розподілу двох незалежних вибірках Дисперсії вибірок не рівні Без припущення про дисперсії (але при однаковому розмірі вибірок) Метод, що застосовується -критерій Ст’юдента при рівних дисперсіях -критерій Ст’юдента при нерівних дисперсіях -критерій Ст’юдента без припущення про дисперсії
Таблиця. Вибір методу для розв'язання задачі про порівняння параметрів розподілу вибірки Порівняння розсіювання показників двох вибірок Перевірка гіпотези про рівність дисперсій (про належність дисперсій до однієї генеральної сукупності) Чи можна Перевірка гіпотези вважати, що в про рівність декількох середніх (про вибірках має належність місце одне і середніх до однієї теж значення генеральної показника? сукупності) Нормальний закон розподілу -критерій Фішера Нормальний закон розподілу Дисперсійний аналіз
л-4_2003.ppt