КУРС Медицинская информатика Лекция 5 Теория вероятностей

Скачать презентацию КУРС Медицинская информатика Лекция 5 Теория вероятностей

Слайды Мединформатика-Лекция 5+ Леч Теория вероятности .pptx

Количество слайдов: 39

КУРС «Медицинская информатика»

Лекция 5 Теория вероятностей Законы распределения случайных величин Основы статистики Ред 1. 6 31. 03. 2014 г (с) Голубев А. Н.

Наука о событиях Теория вероятностей - это раздел математики, изучающий закономерности случайных явлений: случайные события, случайные величины, их свойства и операции над ними.

Применение теории вероятностей 4. Сельское хозяйство. В начале 20 века в Англии была поставлена задача сравнения эффективности различных методов ведения сельского хозяйства. Для ее решения была развита теория планирования экспериментов и дисперсионный анализ. Основная заслуга в развитии этого направления принадлежит сэру Рональду Фишеру, астроному(!) по образованию, а в дальнейшем фермеру, статистику, генетику, президенту английского Королевского общества. Эти направления развивались в Англии Карлом Пирсоном, Уильямом Госсетом – он же Стьюдент. 5. Промышленность. Методы статистического контроля на производстве (контрольные карты Шухарта) позволили сократить количество испытаний качества продукции. Они оказываются уже настолько важными, что их стали засекречивать. Так книга с описанием новой методики, позволявшей сократить количество испытаний (“Последовательный анализ” Вальда), была издана только после окончания второй мировой войны в 1947 году. 6. Медицина. Широкое применение статистических методов в медицине началось сравнительно недавно (вторая половина 20 века). Развитие эффективных методов лечения (антибиотики, инсулин, эффективная анестезия, искусственное кровообращение) потребовало методов оценки их эффективности. Возникло новое понятие “Доказательная медицина”. Начал развиваться более формальный, количественный подход к терапии многих заболевании – введение протоколов, guide lines. 7. Биоинформатика. С середины 1980 -х годов возник новый и важнейший фактор, революционизировавший все приложения теории вероятностей – возможность широкого использования быстрых и доступных компьютеров. Начиная с 1980 -х годов количество известных последовательностей белков и нуклеиновых кислот стремительно возрастает. Объем накопленной информации таков, что только компьютерный анализ этих данных может решать эти задачи.

Испытание Под испытанием (опытом) в теории Вероятностей понимают процесс появления какого-либо события при соблюдении определенного комплекса условий В результате испытания событие может появиться, а может и нет. Тогда его называют случайным Вообще, в результате испытания могут появляться разные события Например, выполнение штрафного броска в баскетболе есть испытание, а попадание в кольцо –Событие. Не попадание -тоже Событие. Контролируемые факторы это условия. А не контролируемые факторы условиями не являются, но влияют возможность появления события Число неконтролируемых факторов, бывает трудно или невозможно учесть.

Обозначение событий Опыт (испытание) – это действие при осуществлении определенного набора условий. Событие - это результат испытания (любой факт действительности). События обозначаются большими латинскими буквами A, B, С. . . - Событие А называется достоверным, если оно обязательно произойдёт в условиях данного опыта. Например: в опыте бросания костей выпадет число от 1 до 6. - Событие А называется невозможным, если оно в условиях данного опыта заведомо не произойдёт. Например: выпадение 0 в испытании бросания костей. - Событие А называется случайным, если оно может либо произойти, либо не произойти в данном опыте. Например: выпадение 6 и 6 в испытании бросания 2 -х кубиков. Достоверное событие обозначается буквой W, Невозможное событие – символом ∅ – пустое множество.

Виды событий 1. Совместные и несовместные события Случайные события А и В называются Несовместными если появление одного исключает появление другого. Например, одновременное выпадение цифры 5 и 6. В противном случае они называются совместными. Например, выпадение цифры 6 совместимо с событием выпадение четного числа очков. 2. Равновозможные события Если, по условиям испытания нет никаких оснований предполагать, что один из исходов появляется чаще других, то все исходы являются равновозможными. Например, выпадение чисел от 1 до 6 является равновозможным событием.

Виды событий 3. Независимые события Два события А и В называются независимыми, если появление одного из них не изменяет вероятности появления другого. 4. Противоположные события Два события А и В называются противоположными другу, если в данном испытании они несовместимы и одно из них обязательно происходит. Событие, противоположное А, обозначается . Если общее число исходов некоторого испытания равно n и событию А благоприятствуют m исходов, то, очевидно, событию благоприятствуют n - m исходов. 5. Полная группа событий Это система случайных событий такая, что в результате произведенного эксперимента непременно произойдет одно из них. Например, проводится подбрасывание монеты. В результате этого эксперимента обязательно произойдет одно из следующих событий: A: монета упадет орлом; B: монета упадет решкой; C: монета упадет на ребро; Таким образом, система {A, B, C} является полной группой событий.

Действия над событиями Совмещением (или произведением) двух событий A и В называется событие, состоящее в совместном наступлении как события A, так и события В. Это событие будем обозначать АВ или ВА. Аналогично, совмещением нескольких событий, например A, В и С, называется событие D=ABC, состоящее в совместном наступлении событий A, В и С. Объединением (или суммой) двух событий A и В называется событие С, заключающееся в том, что произойдет по крайней мере одно из событий A или В. Это событие обозначается так: С=А+В. Объединением нескольких событий называется событие, состоящее в появлении по крайней мере одного из них. Запись D=A+B+C означает, что событие D есть объединение событий A, В и С. Два события A и В называются несовместными, если наступление события A исключает наступление события В. Отсюда следует, что если события A и В несовместны, то событие AB - невозможное.

Пример действий над событиями Будем следить за движением какой-нибудь определенной молекулы газа, заключенного в некоторый объем. Внутри этого объема выделим объемы α и β, частично перекрывающие друга. Пусть событие A - попадание молекулы в объем α, событие В - попадание молекулы в объем β. Совмещением (произведением) событий A и В является попадание молекулы в общую часть объемов α и β. D=AB = Объединением (суммой) событий A и В (событием D) является попадание молекулы или только в объем α, или только в объем β, или же в их общую часть. D=A+B = Если объемы α и β не имеют общих точек, то ясно, что события A и В несовместны. Поэтому B = A и A = B

Измерение событий Теория вероятностей рассматривает случайные события. При этом предполагается, что испытание может быть повторено неограниченное (по крайней мере, теоретически) число раз. Классическими примерами случайных событий являются: - Падение монеты орлом или решкой при ее подбрасывании - Выпадение определенного числа очков (от 1 до 6) при бросании игральной кости – кубика Результаты испытаний можно охарактеризовать качественно и количественно. Качественная характеристика заключается в словесном описании результата наблюдения (быстро/медленно, высоко/низехонько и т. д. ) Количественная – числом (5 баллов, 10 м/сек, 120 мм. Hg и т. д. )

Классическое определение вероятности события Вероятность какого либо события – это численное выражение возможности его наступления. Обозначается латинской буквой Р(А) В простейших случаях вероятности событий могут быть легко определены исходя из условий испытаний. В общем случае: Пусть испытание имеет n возможных несовместных исходов, т. е. отдельных событий, могущих появиться в результате данного испытания. Причем при каждом повторении испытания возможен один и только один из этих исходов. Кроме того, пусть по условиям испытания, нет никаких оснований предполагать, что один из исходов появляется чаще других, т. е. все исходы являются равновозможными. Допустим, что при n равновозможных несовместных исходах интерес представляет некоторое событие А, появляющееся при каждом из m исходов и не появляющееся при остальных n–т исходах. Тогда принято говорить, что в данном испытании имеется n случаев, из которых т благоприятствуют появлению события А. Вероятность события А равна отношению числа исходов, благоприятствующих событию А, к общему числу всех равновозможных несовместных исходов опыта. Формула Лапласа.

Вычисление классической вероятности Испытание – бросание монеты. Возможное число вариантов событий n = 2. Благоприятное событие (А) выпадение герба m= 1. Вероятность P(A) = ½ = 0, 5 = 50% Испытание – бросание кубика (игральной кости). Возможное число вариантов событий n = 6. Благоприятное событие (А) выпадение цифры 6 m = 1. Вероятность события А - выпадения цифры 6 при бросании кубика составляет Р(А)=1/6 = 0, 17 = 17%.

Аксиомы теории вероятностей Аксиома 1. Каждому случайному событию A соответствует определенное число Р(А), называемое его вероятностью и удовлетворяющее условию : 0 ≤ P(A) ≤ 1 Аксиома 2. Вероятность достоверного события равна единице, а невозможного нулю: Р(W) = 1; P(∅ ) = 0. Аксиома 3. Для любого события вероятность противоположного события выражается равенством Так, если вероятность попадания при выстреле в мишень равна P(A) = 0, 7, то вероятность промаха равна 0, 3. (1 - 0, 7 = 0, 3).

Аксиомы теории вероятностей Аксиома 4 - сложения вероятностей. Пусть A и В — несовместные события. Тогда вероятность того, что произойдет хотя бы одно из этих двух событий, равна сумме их вероятностей: P(A+B)=P(A)+P(B) Аксиома 4 допускает обобщение на случай нескольких событий, а именно: если события A 1, A 2, . . . , An, попарно несовместны, то: Например: В урне 2 зеленых, 7 красных, 5 коричневых и 10 белых шаров. Какова вероятность появления цветного шара? Решение: Находим соответственно вероятности появления зеленого, красного и коричневого шаров при возможных исходах n=2+7+5=24: Р(зел. )=2/24; Р(кр. )=7/24; Р(кор. )=5/24. Так как рассматриваемые события, несовместны, то, применяя аксиому сложения, найдем вероятность появления цветного шара: = 0, 58 = 58%

Вычисление вероятности простых событий Пример: На шести одинаковых карточках написаны буквы А, В, К, С, О, М. Карточки перемешиваются и раскладываются в ряд случайным образом. Какова вероятность, что получилось слово "МОСКВА"? Решение. Обозначим благоприятный исход события «Получилось слово МОСКВА» знаком А, он является единственным, m=1. Найдем n - общее число исходов как число возможных перестановок. В комбинаторике число перестановок обозначается Pn=n! = n, где n! = 1 * 2 * 3 * … * n - число элементов в перестановке (читается "эн факториал"). Если случайным выбором раскладывают 6 карточек в ряд, то число возможных исходов будет равно количеству перестановок из шести элементов: n = Р 6 = 6! = 1· 2· 3· 4· 5· 6 = 720. (6! – это факториал шести) Благоприятный исход всего один - когда получилось слово «Москва» , т. е. m=1. Вероятность = Ответ: P(A) = 1 / 720 = 0, 001389 = 0. 1%

Вычисление вероятности сложных событий Пример: В ящике перемешаны 10 синих и 8 зеленых носков. Наугад вынимаются 2 носка. Какова вероятность, что они: а)оба синие; б)одного цвета; в) разных цветов? Решение. События, вероятность событий которые надо найти в пунктах а), б), в) обозначим соответственно А, В, С. Поскольку во всех трех случаях из n=18 носков выбирается k=2, то в комбинаторике общее число исходов определяется числом возможных сочетаний выборки без возвращения n. ABC = Ckn, по формуле: n. ABC = Число благоприятных исходов в случае а): m. A в случае б): m. B 73, в случае в) по правилу произведения: m. C=10*8=80 Вероятности = Ответ: P(A) = 0, 3 P(B) = 0, 48 P(C) = 0. 52

Задания на вычисление вероятности событий ЗАДАЧА 1 В 30 экзаменационных билетах содержатся по три вопроса, которые не повторяются. Студент знает ответы на 45 вопросов. Какова вероятность того, что доставшийся ему билет состоит из подготовленных им вопросов? ЗАДАЧА 2 На блюде 30 пирожков, из них 6 с грибами, а остальные с картошкой. С этого блюда взяли наугад 3 пирожка. Какова вероятность того, что хоть один пирожок окажется с грибами? ЗАДАЧА 3 Молодой человек забыл номер телефона своего приятеля, но помнит из него первые 4 цифры. В телефонном номере 7 цифр. Какова вероятность, что молодой человек дозвонится до своего приятеля, если наберёт забытые 3 цифры номера случайными цифрами?

Условная вероятность Теорема Байеса (формула Байеса) — одна из основных теорем теории вероятностей, которая позволяет определить вероятность того, что произошло какое-либо событие при наличии косвенных тому подтверждений, которые могут быть неточны (вероятностны). Формула названа в честь ее автора - Томаса Байеса. Его работа «An Essay towards solving a Problem in the Doctrine of Chances» впервые опубликована в 1763 году, через 2 года после смерти автора. Полученную по формуле Байеса вероятность можно вычислять повторно и уточнять ее, принимая во внимание данные новых наблюдений. Т. е. проводить «обучение» системы.

Теорема Байеса Пусть A 1, A 2, . . . , An — некоторые попарно несовместимые события, хотя бы одно из которых обязательно наступает, и В — некоторое событие. Тогда, согласно теоремы Байеса, условная вероятность Ак при условии, что наступило В, может быть определена по формуле В теореме Байеса события Ак называют «гипотезами» , вероятности Р (Ак) — априорными вероятностями гипотез и вероятности Р (Ак|В) — апостериорными вероятностями этих гипотез (при условии, что фактически наблюдено событие В).

Формула Байеса где P(A) — априорная (расчетная) вероятность гипотезы A; P(A|B) — вероятность гипотезы A при наступлении события B (апостериорная вероятность); P(B|A) — вероятность наступления события B при истинности гипотезы A; P(B) — вероятность наступления события B. Формула Байеса позволяет «переставить причину и следствие» : по известному факту события вычислить вероятность того, что оно было вызвано данной причиной. События, отражающие действие «причин» , в данном случае обычно называют гипотезами, так как они — предполагаемые события, повлекшие данное. Безусловную вероятность справедливости гипотезы называют априорной (насколько вероятна причина вообще), а условную — с учетом факта произошедшего события — апостериорной (насколько вероятна причина оказалась с учетом данных о событии).

Вычисление вероятности события по Формуле Байеса Пример. В аптеку поставляется лекарство, изготовленное на трёх заводах, причем 40% упаковок поступает с завода № 1, 50 % – с завода № 2 и 10% – с завода № 3. На каждом заводе возможно изготовление бракованных упаковок, при этом доля брака в упаковках изготовленных на заводе № 1=1%, на заводе № 2=2%, на заводе № 3=4% Взятая упаковка лекарства оказалась качественной. Определить вероятность того, что она изготовлена на заводе № 1. Решение. Пусть событие A – взятая качественная упаковка. Возможны три гипотезы H 1, H 2 , H 3 – лекарство изготовлено, соответственно на 1 -м 2 -м и 3 -м заводе. Вероятности каждой из этих гипотез по условию задачи составляют: Соответствующие вероятности события А если упаковки лежат отдельно: Полная вероятность события A (взята качественная упаковка): Условная вероятность гипотезы H 1:

Следствие теоремы Байеса Формула полной вероятности Вероятность наступления события B, зависящего от ряда гипотез Ai, если известны степени достоверности этих гипотез (например, измерены экспериментально) равна Пример: Вам нужно открыть 3 двери в темноте имея 3 близких по форме ключа. В темноте ключ выбирается случайным образом. На открытие каждой из дверей тратится 5 сек. Найти вероятность того, что вы откроете все двери за 15 сек. Решение. Пусть событие А – “открыты все двери”. Разобьем это событие на более простые. Пусть В – “открыта 1 -я“, С – “ открыта 2 -я“, а D – “ открыта 3 -я“. Тогда, А=ВСD по определению произведения событий. Следовательно Р(А)=Р(ВСD). По теореме о вероятности произведения независимых событий Р(ВСD) = Р(В) * Р(C) * Р(D). Вычислим вероятности событий В, C и D. В этом примере имеется 3 равновозможных (каждый ключ выбираем из 3 -х) исходов опыта. Каждому из событий В, C и D благоприятствует 1 из них, поэтому = 0, 037 = 3, 7%

Задачи на вычисление условной вероятности события по Формуле Байеса ЗАДАЧА 1 Для сдачи экзамена по информатике студентам нужно было выучить 45 билетов. Из 30 студентов 15 выучили все билеты; 8 студентов – 30 билетов; 6 студентов – 20 билетов и 1 студент – 10 билетов. Студент успешно сдал экзамен. Найти вероятность того, что он знал всего 20 билетов. ЗАДАЧА 2 В медицинском колледже 67% учащихся девочки. 89% девочек и 78% мальчиков получили билеты в театр. В деканат принесли кем-то потерянный билет. Какова вероятность того, что билет принадлежит девочке?

Теорема Бернулли Закон больших чисел Теорема Бернулли опубликована после его смерти, в 1713 году. Она была обобщена Пуассоном, в 1837 году, который ввел термин «закон больших чисел» . Более общее понимание этого термина основано на работе П. Л. Чебышева «О средних величинах» (1867). Пусть проводятся независимые испытания, при каждом из которых вероятность события А неизменна. Справедливо утверждение: если N достаточно велико, то с вероятностью сколь угодно близкой к единице, отличие относительной частоты от вероятности Р(А) меньше любого наперед заданного положительного числа. В математической записи: Где: Е - произвольно малое положительное число. Т. е. при большом числе измерений в опыте , например, много раз подбрасывая монету, “почти наверняка” в разных сериях будут получены примерно равные частоты выпадения герба.

Закон больших чисел Всегда найдётся такое количество испытаний, при котором с любой заданной наперёд вероятностью относительная частота появления некоторого события будет сколь угодно мало отличаться от его вероятности. Общий смысл закона больших чисел — совместное действие большого числа случайных факторов приводит к результату, почти не зависящему от случая. На практике поступают следующим образом. Чтобы найти вероятность выздоровления без осложнений болезни, проверяют некоторую группу больных, например, из N=200 человек и определяют количество больных, выздоровевших без осложнений. Допустим, их количество – n. N = 190. Относительная частота = 190/200 = 0, 95. Это число и принимают приближенно за вероятность P(A) выздоровления без осложнений. Для получения большей точности можно повторить опыт, но в результате будет получено аналогичное число с незначительным отклонением от указанного.

Статистическая вероятность Вероятностью события А в данном испытании называется число Р(А), около которого группируются значения относительной частоты при большом числе опытов. Будем фиксировать число испытаний, в результате которых появилось некоторое событие А. Пусть было проведено N испытаний, в результате которых событие А появилось ровно n. N раз. Тогда число n. N называется частотой события, а отношение - относительной частотой события. Экспериментальным фактом является то, что относительная частота события при большом числе повторений испытания начинает мало изменяться и стабилизируется около некоторого определенного значения, в то время как при малом числе повторений она принимает различные, совершенно случайные значения. Поэтому ясно, что если при неограниченном повторении испытания относительная частота события будет стремиться к вполне определенному числовому значению, и это значение можно принять и качестве объективной характеристики события А. Такое число, связанное с событием А, называется статистической вероятностью события Р(А). В математике неограниченное число повторений испытания записывается знаком предела (lim) при N, стремящемся к бесконечности ( ):

Вычисление статистической вероятности Пусть в 3 -х сериях опытов при бросании монеты в 1 -й серии из n=4040 раз герб выпал m=2048 раз. Частота появления герба в данной серии опытов равна Р(А)=2048/4040=0, 5069. При бросании той же монеты во 2 -й серии n=2000 раз герб выпал m=6019 раз. Следовательно, в этой серии частота Р(А)=6019/12000=0, 5016. Наконец, в 3 -й серии при n=24000 бросаний герб появился m=2012 раз с частотой Р(А)=0, 5005. Таким образом, при большом числе бросаний монеты частота появления герба обладает устойчивостью, т. е. мало отличается от числа 0, 5. Это отклонение частоты от числа 0, 5 уменьшается с увеличением числа испытаний. Наблюдаемое в этом примере свойство устойчивости частоты является общим свойством массовых случайных событий, а именно, всегда существует такое число, к которому приближается частота появления данного события, мало отличаясь от него при большом числе испытаний. Поэтому это число называется статистической вероятностью события. Оно выражает объективную возможность появления события. В рассмотренном примере классическая вероятность появления герба P(A)=m/n=1/2 =0, 5 и статистическая вероятность равна Р(А)=0, 5 или 50% ДОМА ПОВТОРИТЕ ЭТОТ ОПЫТ (не менее 100 подбрасываний)

Случайная величина – это количественная характеристика события демонстрирующая уровень какого-либо явления, при данном испытании. Случайная величина в теории вероятностей, величина, принимающая в зависимости от случая те или иные значения с определёнными вероятностями. (БСЭ) Например: - число подтягиваний на перекладине - время на беговой дистанции - артериальное давление пациента, частота пульса и др. В силу действия большого числа неконтролируемых факторов эти величины могут принимать различные значения в результате испытания. Причем до испытания невозможно предсказать их точное значение.

Функция распределения случайной величины Если ξ- случайная величина, то функция F(x) = Fξ (x) = P(ξ < x) называется функцией распределения случайной величины ξ. Здесь P(ξ < x) - вероятность того, что случайная величина ξ принимает значение, меньшее x. Каждая случайная величина полностью определяется своей функцией распределения т. е. является ее “паспортом” и содержит всю информация об этой величине. Поэтому изучение случайной величины заключается в исследовании ее функции распределения, которую часто называют просто распределением. Различают два типа случайных величин: ДИСКРЕТНЫЕ И НЕПРЕРЫВНЫЕ. Дискретные случайные величины принимают в результате испытания одно из изолированного дискретного множества значений. Они применяются для описания результатов измерений, связанных с подсчетом и выражаются целыми числами (баллами). Например: оценка успеваемости студента, число попаданий в мишень, группа инвалидности, степень тяжести заболевания и др. Непрерывные случайные величины в результате испытания могут принимать любые значения из некоторого интервала и выражаются дробными значениями. Например: спортивный результат в беге или прыжках, рост и масса тела человека, сила мышц и др.

Функция распределения дискретной случайной величины Рассмотрим случайную величину ξ , возможные значения которой образуют конечную последовательность чисел x 1, x 2, . . . , xn, . . . Пусть задана функция p(x), значение которой в каждой точке x=xi (i=1, 2, . . . ) равно вероятности того, что величина ξ примет значение xi Для дискретной случайной величины вероятность принятия каждого из возможных ее значений больше нуля. Так как в каждом из испытаний случайная величина принимает всегда какое-либо значение из области ее изменения, то Обычно закон распределения дискретной величины записывается в виде таблицы : Значения x 1 x 2. . . xn Вероятности p(xi) p 1 p 2 . . . pn

Пример функции распределения дискретной случайной величины Пример Пусть Х – число очков выпавшее на игральной кости при одном броске. Тогда, случайная величина игральной кости распределена по закону Х Р(Х) 1 1/6 2 1/6 3 1/6 4 1/6 5 1/6 6 1/6 Если такую таблицу изобразить диаграммой, мы получим график функции распределения дискретной случайной величины:

Функция распределения непрерывной случайной величины Рассмотрим вероятность того, что случайная величина X окажется меньше или равной некоторому заданному числу х, т. е. Таким образом, функция F(х) определена на всей числовой оси, и ее значение в точке х равно вероятности того, что случайная величина примет значение, меньшее чем х. Если эту функцию преобразовать в дифференциальную форму плотности распределения непрерывной случайной величины получим: Исходя из геометрического смысла интеграла как площади, можно сказать, что вероятность выполнения неравенств x 1 ≤ X ≤ x 2 равна площади криволинейной трапеции с основанием [x 1, x 2], ограниченной сверху кривой Гаусса 5. 39

Теоретические распределения В медицинских исследованиях встречаются несколько видов распределений: - альтернативный, - дискретный, - нормальный (симметричный), - асимметричный (правосторонний, левосторонний, бимодальный и др. ) Тип распределения Графическое изображение Примеры Исход лечения: выздоровление / ухудшение состояния II Нормальный (симметричный) У большинства изучаемых явлений III Асимметричный I Альтернативный 1. Левосторонний Кратность случаев временной нетрудоспособности 2. Правосторонний Кратность прививок 3. Двугорбый (бимодальный) Неоднородная группа

Распределение Гаусса (нормальное распределение) Большинство экспериментальных исследований, в том числе в области медицины и биологии, связано с измерениями, результаты которых выражаются непрерывными величинами. Поэтому, в основном, в дальнейшем будут рассматриваться непрерывные случайные величины и связанные с ними непрерывные распределения. Одним из основных непрерывных распределений в математической статистике является нормальное, или по автору распределение Гаусса. Оно является самым важным в статистике вследствие следующих причин: 1. Многие случайные величины характеризующие параметры экспериментальных наблюдений подчиняются закону нормального распределения. Однако, не существует распределений значений параметров эмпирических данных, которые были бы в точности были нормальными, поскольку нормально распределенная случайная величина находится в пределах от до , чего никогда не бывает на практике. Однако нормальное распределение очень часто хорошо подходит как приближение. 2. Нормальное распределение хорошо подходит в качестве приближенного описания других распределений (например, биномиального). 3. Многие распределения, связанные со случайной выборкой, при увеличении объема наблюдения переходят в нормальное.

Анализ вида распределения признака (проверка на нормальность распределения ) Анализ характера распределения данных (его еще называют проверкой на нормальность распределения) осуществляется по каждому параметру. Для проверки на нормальность используют: 1. Визуальные методы: построение гистограммы распределения; 2. Статистические методы: - критерий асимметрии и эксцесса - тест Колмогорова - Смирнова, - критерий Шапиро – Уилкса и др. Чтобы уверенно судить о соответствии распределения параметра нормальному закону, необходима достаточно многочисленная выборка (не менее 50 значений).

Проверка на нормальность распределения по графику Весь диапазон полученных результатов наблюдений Хmax … Хmin разделяют на r интервалов шириной ΔXi(i=1, 2, …, r) и подсчитывают частоты mi, равные числу результатов, лежащих в каждом i-м интервале, т. е. меньших или равных его правой и больших левой границы. n 40 – 100 – 500 – 10000 Отношения: r 7– 9 8 – 12 10 – 16 12 – 22 где n – общее число наблюдений, называются частостями и представляют собой статистические оценки вероятностей попадания результата наблюдений в i-й интервал. Распределение частот по интервалам образует статистическое распределение результатов наблюдений.

Визуальная проверка на нормальность распределения Если разделить частость на длину интервала, то получим величины: являющиеся оценками средней плотности распределения в интервале ΔXi. Отложим вдоль оси результатов наблюдений интервалы ΔXi в порядке возрастания индекса i и на каждом интервале построим прямоугольник с высотой, равной pi*. Полученный график называется гистограммой статистического распределения. 6. 14 После построения гистограммы подбирается теоретическая кривая распределения, которая выражала бы существенные черты статистического распределения, сглаживала случайности, связанные с недостаточным объемом экспериментальных данных.

5. Медицинская информатика СПАСИБО ЗА ВНИМАНИЕ! ДО СВИДАНИЯ!