ОБС_04_2015.ppt
- Количество слайдов: 57
ОБС 4 ОСНОВЫ БИОСТАТИСТИКИ http: //www. hydrobiology. spb. ru БИБЛИОТЕКА Biostat-1 Biostat-2 Biostat-3 Biostat-4 Фото: Risto Vainola
ВЕРОЯТНОСТЬ СОБЫТИЯ – числовая мера объективной возможности осуществления события X при единичном испытании Обозначается символом Р(x), и определяется по отношению числа исходов , благоприятствующих осуществлению события A (m) , к числу всех равновозможных и несовместимых исходов (k): Р(A) = m/k.
ЗАКОН БОЛЬШИХ ЧИСЕЛ Частость (выраженная в долях) m/k-го события X будет сколь угодно близкой к его вероятности Р, если число испытаний неограниченно возрастает. ЗАКОН РАСПРЕДЕЛЕНИЯ СЛУЧАЙНЫХ ВЕЛИЧИН Функция f(x), связывающая значения Xi переменной случайной величины с их вероятностью " P " , называется законом распределения этой случайной величины. ЗАКОН НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ. Вероятность отклонения любой варианты Хi от центра распределения ( ) , является функцией нормированного отклонения (t).
Статистика - любая функция, зависящая только от наблюдений ВЫБОРОЧНЫЙ ПОКАЗАТЕЛЬ (распределение статистики) ОШИБКА СРЕДНЕЙ
законы распределения случайных величин
ЭМПИРИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ Полигон распределения Гистограмма распределения ВАРИАЦИОННАЯ КРИВАЯ (КРИВАЯ РАСПРЕДЕЛЕНИЯ)
Классовые значения вариант Пример нахождения кумуляты: Классовые значения вариант Накопленные частоты КУМУЛЯТА ОГИВА Накопленные частоты Хi 1 2 3 4 5 6 7 fi 12 16 26 52 48 32 14 ffi 12 28 54 106 154 186 200 ffi(%) 6 14 27 53 77 93 100
ФОРМА ЭМПИРИЧЕСКИХ РАСПРЕДЕЛЕНИЙ эмпирические распределения делят на: симметричные и асимметричные – показатели: АСИММÉТРИЯ островершинные и плосковершинные ЭКСЦЕСС
ФОРМА РАСПРЕДЕЛЕНИЯ АСИММЕТРИЯ Аs + Мо Х Хi Х Мо Хi ПРАВОСТОРОНЯЯ ЛЕВОСТОРОНЯЯ ПОЛОЖИТЕЛЬНАЯ ОТРИЦАТЕЛЬНАЯ
БОЛЬШИЕ ВЫБОРКИ МАЛЫЕ ВЫБОРКИ (n < 30)
|As| < 0, 25 - асимметрия незначительная |As| > 0, 5 - асимметрия сильная По оси ординат – частота появления данного значения признака в выборке. По оси абсцисс – значения признака.
КАЖУЩАЯСЯ АСИММЕТРИЯ ПРИМЕР (Лакин, 1990) : 1522 фасолины Хi – длина боба : 8, 75 - 9, 75 - 10, 75 - 11, 75 - 12, 75 - 13, 75 - 14, 75 - 15, 75 - 16, 75 fi: 2 48 314 809 316 30 6 2 M = 12, 25; s = 0, 82; Аs = 0, 17 : 9 - 10 - 11 - 12 - 13 - 14 - 15 - 16 - 17 fi : 7 67 468 761 201 15 4 1 М=12, 25; s=0, 82; Аs=0, 75
Асимметрия кривых распределения при доминировании гена усилителя и гена ослабителя Сложные эффекты взаимодействия генов. Взаимодействующие гены могут как усиливать эффект действия какого-либо гена, так и ослаблять его. В результате кривые распределения генотипов в потомстве не будут столь идеально соответствовать кривой нормального распределения, как при чисто аддитивном наследовании Распределения могут оказаться асимметричными Асимметрия в результате действия движущей формы отбора А � - отбор при стабильных условиях (стабилизирующая форма отбора); 1 � вариационная кривая всех особей; 2 � вариационная кривая особей, выживающих и оставляющих потомство ( � норма� ) А В М http: //www. macroevolution. narod. ru/factory 04. htm Заштрихована область элиминации. М` В � - отбор при изменении этих условий в определенном направлении (движущая форма отбора): 1 � вариационная кривая всех особей; 2 � вариационная кривая особей, выживающих и оставляющих потомство в новых условиях (новая � норма� )
Примеры асимметричных эмпирических распределений По оси абсцисс - число краж на 100 000 жителей. По оси ординат – число регионов соответствующее числу краж. Военное училище. Информатика. Распределение числа лекций в конспектах курсантов. Распределения длины побегов в разные периоды вегетации у сортов Мускат белый (слева) и Хиндогны (справа). Южный берег Крыма, 1969 г. http: //rudocs. exdat. com/docs/index-19914. html? page=7
ПРИМЕР 2: РАЗМЕЩЕНИЕ ОСОБЕЙ В ПРОСТРАНСТВЕ СЛУЧАЙНОЕ РЕГУЛЯРНОЕ АГРЕГИРОВАННОЕ РАЗМЕЩЕНИЕ ОСОБЕЙ =1 -- случайное <1 -- регулярное >1 – агрегированное (контагеозное, групповое)
П. П. Стрелков, В. М. Хайтов Images on the right from http: //www. arkive. org варианты организации локальных скоплений Mytilus edulis
ПРИМЕР Задача: Изучение поселения Mya arenaria БЕСПОВТОРНЫЙ ПОЛНОСТЬЮ СЛУЧАЙНЫЙ ОТБОР ПРОБ 13 9 4 10 7 3 n = 10 1 2 ПРИЗНАК – ЧИСЛО ОСОБЕЙ В РАМКЕ 11 14 0. 25 м 2
Примеры агрегированного размещения особей в местообитаниях Macoma balthica f Hydrobia ulvae f По осям ординат: - число рамок с определенным числом особей
положительный ЭКСЦЕСС Es БОЛЬШИЕ ВЫБОРКИ МАЛЫЕ ВЫБОРКИ (n<30) отрицательный
IЕs. I<0. 5 слабый эксцесс IЕs. I от 0. 5 до 1. 0 – средний эксцесс IЕs. I более 1. 0 – сильный эксцесс. Отрицательный эксцесс не может быть меньше "- 2". По правилу Лапиталя пределы числителя и знаменателя стремятся к одной величине
платикуртозис Смешивание наблюдений, принадлежащих нескольким популяциям, может привести не только к эффектам лепто- и платикуртозиса, но также послужить причиной асимметрии и полимодальности: лептокуртозис http: //sixsigmaonline. ru/load/22 -1 -0 -278
ТРАНСГРЕССИЯ ВАРИАЦИОННЫХ РЯДОВ – НЕПОЛНОЕ РАСХОЖДЕНИЯ ВАРИАЦИОННЫХ РЯДОВ Лакин, 1990)
ЗАКОНЫ РАСПРЕДЕЛЕНИЯ СЛУЧАЙНЫЙ ЭКСПЕРИМЕНТ ДОСТОВЕРНЫЕ СОБЫТИЯ - СОБЫТИЯ, ИСХОД КОТОРЫХ ЗАРАНЕЕ ПРЕДОПРЕДЕЛЕН ИЛИ ПРЕДСКАЗУЕМ НЕВОЗМОЖНОЕ СОБЫТИЕ – СОБЫТИЕ КОТОРОЕ НЕ МОЖЕТ ПРОИЗОЙТИ ПРИ БЕСКОНЕЧНО БОЛЬШОМ ЧИСЛЕ ИСПЫТАНИЙ СЛУЧАЙНОЕ СОБЫТИЕ - НЕПРЕДСКАЗУЕМЫЙ РЕЗУЛЬТАТ ИСПЫТАНИЯ НЕСОВМЕСТНЫЕ СОБЫТИЯ - ЕСЛИ В СЕРИИ ИСПЫТАНИЙ КАЖДЫЙ РАЗ МОЖЕТ ОСУЩЕСТВИТЬСЯ ТОЛЬКО ОДНО ИЗ СЛУЧАЙНЫХ СОБЫТИЙ, ТО ТАКИЕ СОБЫТИЯ НАЗЫВАЮТ НЕСОВМЕСТНЫМИ СОВМЕСТНЫЕ СОБЫТИЯ - СОБЫТИЯ, КОТОРЫЕ В ДАННЫХ УСЛОВИЯХ МОГУТ ПРОИЗОЙТИ ОДНОВРЕМЕННО
«What does a statistician call it when the heads of 10 rats are cut off and 1 survives? - Nonsignificant. »
ВЕРОЯТНОСТЬ (P) - ЧИСЛОВАЯ МЕРА ОБЪЕКТИВНОЙ ВОЗМОЖНОСТИ ОСУЩЕСТВЛЕНИЯ СОБЫТИЯ " А " ПРИ ЕДИНИЧНОМ ИСПЫТАНИИ m – ЧИСЛО ПОЛОЖИТЕЛЬНЫХ ИСХОДОВ k – ЧИСЛО ВСЕХ ОДНОВРЕМЕННО РАВНОВОЗМОЖНЫХ И НЕСОВМЕСТИМЫХ ИСХОДОВ ПРИМЕР: В ЕМКОСТИ НАХОДИТСЯ 5 БЕЛЫХ И 15 ЧЕРНЫХ ШАРОВ – ВСЕГО 20. КАКОВА ВЕРОЯТНОСТЬ ТОГО, ЧТО ПЕРВЫЙ ЖЕ ВЫНУТЫЙ ШАР ОКАЖЕТСЯ БЕЛЫМ? m = 5 k = 20 Р= 5/20 = 0, 25
ПРИМЕР: Объект: cпат Mytilus edulis S = 0, 01 м 2 n=200 Р 50 - вероятность того, что при одном испытании в рамке окажется 50 особей Р 50=40/200=0, 2 (20%) Х – число особей в рамке, шт.
It is 1941 and the Germans are bombing Moscow. Most people in Moscow flee to the underground bomb shelters at night, except for a famous Russian statistician who tells a friend that he is going to sleep in his own bed, saying that "There is only one of me, among five million other people in Moscow. What are the chances I'll get hit? " He survives the first night, but the next evening he shows up at the shelter. His friend asks why he has changed his mind. "Well, " says the statistician, "there are five million people in this city, and one elephant in the Moscow Zoo. Last night, THEY GOT THE ELEPHANT!"
ПРИМЕР: АЛЬТЕРНАТИВНОЕ РАСПРЕДЕЛЕНИЕ ПРИЗНАКА ЭТО РАСПРЕДЕЛЕНИЕ ДИСКРЕТНОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ ИМЕЮЩЕЙ ТОЛЬКО ДВА ПРОТИВОПОЛОЖНЫХ ЗНАЧЕНИЯ (ДА –НЕТ или 0 - 1). ПРИМЕР: ПРОВЕДЕН ОТЛОВ ПОЛЕВОК В МЕСТООБИТАНИИ. ПОЛУЧЕНО: 120 САМОК И 80 САМЦОВ. НАС ИНТЕРЕСУЕТ РАСПРЕДЕЛЕНИЕ САМОК. Р = 120/200 = 0, 6 - ЭТО ДОЛЯ САМОК И СРЕДНЯЯ РЯДА. Доля самцов (Q) = 0, 4 СКО
ПРИМЕР: ПОЛИНОМИАЛЬНОЕ РАСПРЕДЕЛЕНИЕ КАЧЕСТВЕННЫХ ПРИЗНАКОВ, ИМЕЮЩИХ БОЛЬШЕ ДВУХ АЛЬТЕРНАТИВ (k > 2). Пример: В ВЫБОРКЕ ИЗ 64 СЕГОЛЕТКОВ ЖИВОРОДЯЩЕЙ ЯЩЕРИЦЫ ОБНАРУЖЕНО 4 ВАРИАНТА КОНТАКТА ЛОБНЫХ ЩИТКОВ. K = 4. Выборка представляется рядом частостей встречаемости признаков (mi/n). ВЫБОРОЧНЫЕ ПОКАЗАТЕЛИ РАСПРЕДЕЛЕНИЯ: СРЕДНЕЕ ЧИСЛО ФЕНОТИПОВ ДОЛЯ РЕДКИХ МОРФ
Умножение вероятностей Пусть события А и В независимые, причем вероятности этих событий известны. Надо найти вероятность совмещения событий. УМНОЖЕНИЕ ВЕРОЯТНОСТЕЙ Теорема. Вероятность совместного появления двух независимых событий равна произведению вероятностей этих событий: Следствие. Вероятность совместного появления нескольких независимых событий равна произведению вероятностей этих событий: СЛОЖЕНИЕ ВЕРОЯТНОСТЕЙ Теорема. Вероятность суммы конечного числа несовместных событий равна сумме их вероятностей:
ЗАКОНЫ РАСПРЕДЕЛЕНИЯ
А. Кетле (1835) ОБЩЕЕ СВОЙСТВО ВАРИАЦИОННЫХ РЯДОВ: - накапливание вариант в центральных классах и постепенное убывание их численности по мере удаления от центра ряда - В СТАТИСТИЧЕСКОЙ СОВОКУПНОСТИ: - БОЛЬШАЯ ЧАСТЬ ВАРИАНТ ОКАЗЫВАЕТСЯ СРЕДНЕЙ ВЕЛИЧИНЫ ИЛИ БЛИЗКИ К НЕЙ. - ЧЕМ ДАЛЬШЕ ВАРИАНТА ОТСТОИТ ОТ СРЕДНЕГО УРОВНЯ, ТЕМ РЕЖЕ ОНА ВСТРЕЧАЕТСЯ. БОЛЬШИХ ЧИСЕЛ ЗАКОН,
«. . . внутренний закон, регулирующий случайные явления, становится видимым лишь тогда, когда они охватываются в больших массах. . . » К. Маркс Karl Heinrich Marx 1818 - 1883
Pierre-Simon Laplace (1749 -1827) Siméon Denis Poisson (1781 – 1840) Чебышёв Пафну тий Льво вич (1821 – 1894) Марков Андрей Андреевич (1856 – 1922) Ляпуно в Алекса ндр Миха йлович (1857 – 1918) ПРЕДЕЛЬНЫЕ ТЕОРЕМЫ ТЕОРИИ ВЕРОЯТНОСТЕЙ: 1 -я группа теорем составляет "закон больших чисел". Закон больших чисел формулирует условия, при которых совокупное действие большого числа случайных факторов приводит к результату почти не зависящему от случая (т. е. практически постоянный результат) 2 -я группа теорем связана с выяснением вопроса о распределении сумм большого числа случайных величин. В этих теоремах выясняется, какие законы распределения может иметь сумма случайных величин, если число слагаемых неограниченно увеличивается.
Jakob Bernoulli, 1713 ЗАКОН БОЛЬШИХ ЧИСЕЛ Пафнутий Львович Чебышёв , 1867 Siméon-Denis Poisson, 1837 Теорема Обобщение теоремы Бернули и появление термина Бернули ЗАКОН БОЛЬШИХ ЧИСЕЛ Общее (современное) понимание ЗАКОНА БОЛЬШИХ ЧИСЕЛ ЗАКОН БОЛЬШИХ ЧИСЕЛ ЧАСТОСТЬ m/k СОБЫТИЯ А БУДЕТ СКОЛЬ УГОДНО БЛИЗКОЙ К ЕГО ВЕРОЯТНОСТИ, ЕСЛИ ЧИСЛО ИСПЫТАНИЙ НЕОГРАНИЧЕННО ВОЗРАСТАЕТ.
ВЕРОЯТНОСТЬ (P) - ЧИСЛОВАЯ МЕРА ОБЪЕКТИВНОЙ ВОЗМОЖНОСТИ ОСУЩЕСТВЛЕНИЯ СОБЫТИЯ " А " ПРИ ЕДИНИЧНОМ ИСПЫТАНИИ m – ЧИСЛО ПОЛОЖИТЕЛЬНЫХ ИСХОДОВ k – ЧИСЛО ВСЕХ ОДНОВРЕМЕННО РАВНОВОЗМОЖНЫХ И НЕСОВМЕСТИМЫХ ИСХОДОВ ПРИМЕР: В ЕМКОСТИ НАХОДИТСЯ 5 БЕЛЫХ И 15 ЧЕРНЫХ ШАРОВ – ВСЕГО 20. КАКОВА ВЕРОЯТНОСТЬ ТОГО, ЧТО ПЕРВЫЙ ЖЕ ВЫНУТЫЙ ШАР ОКАЖЕТСЯ БЕЛЫМ? m = 5 n = 20 Р= 5/20 = 0, 25
n = 20(5 белых + 15 черных) =0, 25 Можно провести серию (j) испытаний P(о)1=0, 18; P(о)2=0, 21 P(о)3=0, 34… P(о)j=0, 26 N Если в серии из «j» попыток вслепую отбирать из мешка по 20 шаров, то выборочный показатель приобретает разные значения. 0, 25
ЗАКОН РАСПРЕДЕЛЕНИЯ СЛУЧАЙНЫХ ВЕЛИЧИН Функция f(X), связывающая значения Xi переменной случайной величины X с их вероятностями Pi , называется законом распределения этой величины.
ДИСКРЕТНЫЙ ВАРИАЦИОННЫЙ РЯД Xi ffi % 1 12 6 2 16 28 14 3 26 54 27 4 52 106 53 5 48 154 77 6 32 186 93 7 14 200 100 0, 25 0, 20 0, 15 0, 10 0, 05 0 0 20 40 60 80 Xi
НЕПРЕРЫВНЫЙ ВАРИАЦИОННЫЙ РЯД ФУНКЦИЯ РАСПРЕДЕЛЕНИЯ Р кумулята ПЛОТНОСТЬ РАСПРЕДЕЛЕНИЯ Р -->
функция плотности вероятности 0, 25 (Рi) 0, 20 0, 15 0, 10 0, 05 0 0 20 40 X i 60 80 i
КВАНТИЛЬ ФОРМАЛЬНОЕ ОПРЕДЕЛЕНИЕ Квантиль - числовая характеристика случайной величины. Если функция распределения случайной величины Х непрерывна, то квантиль Kp порядка р определяется как такое число, для которого вероятность неравенства Х < Kp равна р.
КВАНТИЛИ ( ПРОЦЕНТНЫЕ ТОЧКИ) РАСПРЕДЕЛЕНИЯ КВАНТИЛЬ - значение признака с определенной встречаемостью в ранжированном вариационном ряду, отсекающее от общего объема вариационного ряда определенную часть вариант. 3 КВАРТИЛЯ – делят ряд на 4 равные по числу вариант части 9 ДЕЦИЛЕЙ - делят ряд на 10 равных по числу вариант частей 99 ПЕРЦЕНТИЛЕЙ - делят ряд на 100 равных по числу вариант частей
25% 25% КВАРТИЛЬ 1 КВАРТИЛЬ 2 ДЕЦИЛЬ 5 ПЕРЦЕНТИЛЬ 50 медиана КВАРТИЛЬ 3 Х
НАХОЖДЕНИЕ ИСКОМОГО ПЕРЦЕНТИЛЯ: n = 200 Xi ffi % Xн - нижняя граница класса, 1 12 6 содержащего перцентиль Pi 2 16 28 14 - классовый интервал; 3 26 54 27 4 52 106 53 fp - частота класса перцентиля Pi 5 48 154 77 f - сумма накопленных частот i 6 32 186 93 к классу перцентиля Pi 7 14 200 100 К = Pin/100 P 20= 2, 5+1(40 -28)/26=2, 72
МАТЕМАТИЧЕСКОЕ ОЖИДАНИЕ Выборочный показатель вероятности
МАТЕМАТИЧЕСКОЕ ОЖИДАНИЕ Генеральная средняя Х Математическое ожидание 0, 25 0, 20 0, 15 0, 10 0, 05 0 0 20 40 60 0 80 X i 0 20 40 60 80 Xi
МОДЕЛИ РАСПРЕДЕЛЕНИЯ НЕПРЕРЫВНЫХ СЛУЧАЙНЫХ ВЕЛИЧИН. 1 - Описание реального явления. В этом случае модель - это закон распределения вероятностей непосредственно изучаемой случайной величины. (нормальное, биномиальное, логнормальное и т. д. ) 2 - Использование моделей распределения как вспомогательное средство при реализации доказательной функции матстатистики. распределение: Гауса, Стьюдента, Хи-квадрат, Снедекора-Фишера и т. д.
МОДЕЛИ РАСПРЕДЕЛЕНИЯ Непрерывные случайные величины. НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ ОЧЕНЬ ЧАСТО вероятность Pi любого значения Xi непрерывно меняющейся случайной величины X, находящегося в интервале от X до Х+d. Х, выражается Формулой: нормированное отклонение
Согласно нормальному закону, ВЕРОЯТНОСТЬ ОТКЛОНЕНИЯ ЛЮБОЙ ВАРИАНТЫ XI ОТ ЦЕНТРА РАСПРЕДЕЛЕНИЯ М, ЯВЛЯЕТСЯ ФУНКЦИЕЙ НОРМИРОВАННОГО ОТКЛОНЕНИЯ Johann Carl Friedrich Gauss
Свойства нормального распределения Согласно нормальному закону, ВЕРОЯТНОСТЬ ОТКЛОНЕНИЯ ЛЮБОЙ ВАРИАНТЫ XI ОТ ЦЕНТРА РАСПРЕДЕЛЕНИЯ М, ОПРЕДЕЛЯЕТСЯ ФУНКЦИЕЙ НОРМИРОВАННОГО ОТКЛОНЕНИЯ СВОЙСТВА НОРМАЛЬНОЙ КРИВОЙ 1. - ПРИ ИЗМЕНЕНИИ СРЕДНЕЙ ФОРМА КРИВОЙ НЕ МЕНЯЕТСЯ, ОНА ПРОСТО СМЕЩАЕТСЯ ПО ОСИ АБСЦИСС 2. ПРИ ИЗМЕНЕНИИ СРЕДНЕГО КВАДРАТИЧЕСКОГО ОТКЛОНЕНИЯ МЕНЯЕТСЯ ШИРИНА КРИВОЙ
Свойства нормального распределения
Свойства нормального распределения 1. ЛЮБУЮ НОРМАЛЬНУЮ КРИВУЮ МОЖНО ПРИВЕСТИ К СТАНДАРТНОЙ ФОРМЕ СТАНДАРТИЗИРОВАННАЯ НОРМАЛЬНАЯ КРИВАЯ =0 и =1
Свойства нормального распределения n=100; M = 10; s = 4; λ=2; Расчет теоретических частот Xi fi t=I(Xi-M)/s. I f(t) = Pi 4 5 I-1, 5 I 0, 1295 100 x 0, 13 x 2/4= 6, 5 8 19 I-0, 5 I 0, 3521 100 x 0, 35 x 2/4=17, 5 . . . 12 17 I+0, 5 I 0, 3521 100 x 0, 35 x 2/4=17, 5 ПРАВИЛО ТРЕХ СИГМ Р ( -t< Xi-M < +t)=0. 6827 Р (-2 t< Xi-M <+2 t)=0. 9545 Р (-3 t< Xi-M <+3 t)=0. 9973 99, 7% всех вариант нормально распределенной совокупности находится в пределах
Свойства нормального распределения СТАНДАРТИЗИРОВАННАЯ НОРМАЛЬНАЯ КРИВАЯ P= 0. 6827 P = 0. 9545 P = 0. 9973
Свойства нормального распределения -∞ -3 t -2 t -t 0 +t +2 t +3 t ∞ -3 -2 -1 0 +1 +2 +3 квантили распределения, t (z)
Old statisticians never die they just become nonsignificant.
ОБС_04_2015.ppt