ОБС 5 ОСНОВЫ БИОСТАТИСТИКИ http: //www. hydrobiology. spb.

ОБС 5 ОСНОВЫ БИОСТАТИСТИКИ http: //www. hydrobiology. spb. ru БИБЛИОТЕКА Biostat-1 Biostat-2 Biostat-3 Biostat-4 Biostat-5 Фото: Risto Vainola

ЗАКОН БОЛЬШИХ ЧИСЕЛ Частость (выраженная в долях) m/k-го события X будет сколь угодно близкой к его вероятности Р, если число испытаний неограниченно возрастает. ЗАКОН РАСПРЕДЕЛЕНИЯ СЛУЧАЙНЫХ ВЕЛИЧИН Функция f(x), связывающая значения Xi переменной случайной величины с их вероятностью " P " , называется законом распределения этой случайной величины. ЗАКОН НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ. Вероятность отклонения любой варианты Хi от центра распределения ( ) , является функцией нормированного отклонения (t).

А. Кетле (1835) ОБЩЕЕ СВОЙСТВО ВАРИАЦИОННЫХ РЯДОВ: - накапливание вариант в центральных классах и постепенное убывание их численности по мере удаления от центра ряда - В СТАТИСТИЧЕСКОЙ СОВОКУПНОСТИ: - БОЛЬШАЯ ЧАСТЬ ВАРИАНТ ОКАЗЫВАЕТСЯ СРЕДНЕЙ ВЕЛИЧИНЫ ИЛИ БЛИЗКИ К НЕЙ. - ЧЕМ ДАЛЬШЕ ВАРИАНТА ОТСТОИТ ОТ СРЕДНЕГО УРОВНЯ, ТЕМ РЕЖЕ ОНА ВСТРЕЧАЕТСЯ. БОЛЬШИХ ЧИСЕЛ ЗАКОН, общий принцип, в силу которого совокупное действие большого числа случайных факторов приводит, при некоторых весьма общих условиях, к результату, почти не зависящему от случая.

Pierre-Simon Laplace (1749 -1827) Siméon Denis Poisson (1781 – 1840) Чебышёв Пафну тий Льво вич (1821 – 1894) Марков Андрей Андреевич (1856 – 1922) Ляпуно в Алекса ндр Миха йлович (1857 – 1918) ПРЕДЕЛЬНЫЕ ТЕОРЕМЫ ТЕОРИИ ВЕРОЯТНОСТЕЙ: 1 -я группа теорем составляет "закон больших чисел". Закон больших чисел формулирует условия, при которых совокупное действие большого числа случайных факторов приводит к результату почти не зависящему от случая (т. е. практически постоянный результат) 2 -я группа теорем связана с выяснением вопроса о распределении сумм большого числа случайных величин. В этих теоремах выясняется, какие законы распределения может иметь сумма случайных величин, если число слагаемых неограниченно увеличивается.

Jakob Bernoulli, 1713 ЗАКОН БОЛЬШИХ ЧИСЕЛ Пафнутий Львович Чебышёв , 1867 Siméon-Denis Poisson, 1837 Теорема Обобщение теоремы Бернули и появление термина Бернули ЗАКОН БОЛЬШИХ ЧИСЕЛ Общее (современное) понимание ЗАКОНА БОЛЬШИХ ЧИСЕЛ ЗАКОН БОЛЬШИХ ЧИСЕЛ ЧАСТОСТЬ m/k СОБЫТИЯ А БУДЕТ СКОЛЬ УГОДНО БЛИЗКОЙ К ЕГО ВЕРОЯТНОСТИ, ЕСЛИ ЧИСЛО ИСПЫТАНИЙ НЕОГРАНИЧЕННО ВОЗРАСТАЕТ.

ВЕРОЯТНОСТЬ (P) - ЧИСЛОВАЯ МЕРА ОБЪЕКТИВНОЙ ВОЗМОЖНОСТИ ОСУЩЕСТВЛЕНИЯ СОБЫТИЯ " А " ПРИ ЕДИНИЧНОМ ИСПЫТАНИИ m – ЧИСЛО ПОЛОЖИТЕЛЬНЫХ ИСХОДОВ k – ЧИСЛО ВСЕХ ОДНОВРЕМЕННО РАВНОВОЗМОЖНЫХ И НЕСОВМЕСТИМЫХ ИСХОДОВ ПРИМЕР: В ЕМКОСТИ НАХОДИТСЯ 5 БЕЛЫХ И 15 ЧЕРНЫХ ШАРОВ – ВСЕГО 20. КАКОВА ВЕРОЯТНОСТЬ ТОГО, ЧТО ПЕРВЫЙ ЖЕ ВЫНУТЫЙ ШАР ОКАЖЕТСЯ БЕЛЫМ? m = 5 n = 20 Р= 5/20 = 0, 25

Можно провести серию (j) испытаний 1 - Б; 2 – Ч; 3 - Ч…; J - Б =0, 25 Можно провести серию (j) испытаний P(о)1=0, 18; P(о)2=0, 21 P(о)3=0, 34… P(о)j=0, 26 N Если в серии из «j» попыток вслепую отбирать из мешка по 20 шаров, то выборочный показатель приобретает разные значения. 0, 25

«. . . внутренний закон, регулирующий случайные явления, становится видимым лишь тогда, когда они охватываются в больших массах. . . » К. Маркс Karl Heinrich Marx 1818 - 1883 ЗАКОН РАСПРЕДЕЛЕНИЯ СЛУЧАЙНЫХ ВЕЛИЧИН Функция f(X), связывающая значения Xi переменной случайной величины X с их вероятностями Pi , называется законом распределения этой величины.

ДИСКРЕТНЫЙ ВАРИАЦИОННЫЙ РЯД Xi ffi % 1 12 6 2 16 28 14 3 26 54 27 4 52 106 53 5 48 154 77 6 32 186 93 7 14 200 100 0, 25 0, 20 0, 15 0, 10 0, 05 0 0 20 40 60 80 Xi

НЕПРЕРЫВНЫЙ ВАРИАЦИОННЫЙ РЯД ФУНКЦИЯ РАСПРЕДЕЛЕНИЯ Р кумулята ПЛОТНОСТЬ РАСПРЕДЕЛЕНИЯ Р -->

функция плотности вероятности 0, 25 (Рi) 0, 20 0, 15 0, 10 0, 05 0 0 20 40 X i 60 80 i

МАТЕМАТИЧЕСКОЕ ОЖИДАНИЕ Выборочный показатель вероятности

МАТЕМАТИЧЕСКОЕ ОЖИДАНИЕ Генеральная средняя Х Математическое ожидание 0, 25 0, 20 0, 15 0, 10 0, 05 0 0 20 40 60 0 80 X i 0 20 40 60 80 Xi

МОДЕЛИ РАСПРЕДЕЛЕНИЯ НЕПРЕРЫВНЫХ СЛУЧАЙНЫХ ВЕЛИЧИН. 1 - Описание реального явления. В этом случае модель - это закон распределения вероятностей непосредственно изучаемой случайной величины. (нормальное, биномиальное, логнормальное и т. д. ) 2 - Использование моделей распределения как вспомогательное средство при реализации доказательной функции матстатистики. распределение: Гауса, Стьюдента, Хи-квадрат, Снедекора-Фишера и т. д.

МОДЕЛИ РАСПРЕДЕЛЕНИЯ Непрерывные случайные величины. НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ очень часто вероятность Pi любого значения Xi непрерывно меняющейся случайной величины X, находящегося в интервале от X до Х+d. Х, выражается Формулой: нормированное отклонение

Согласно нормальному закону, ВЕРОЯТНОСТЬ ОТКЛОНЕНИЯ ЛЮБОЙ ВАРИАНТЫ XI ОТ ЦЕНТРА РАСПРЕДЕЛЕНИЯ М, ЯВЛЯЕТСЯ ФУНКЦИЕЙ НОРМИРОВАННОГО ОТКЛОНЕНИЯ Johann Carl Friedrich Gauss

Свойства нормального распределения Согласно нормальному закону, ВЕРОЯТНОСТЬ ОТКЛОНЕНИЯ ЛЮБОЙ ВАРИАНТЫ XI ОТ ЦЕНТРА РАСПРЕДЕЛЕНИЯ М, ОПРЕДЕЛЯЕТСЯ ФУНКЦИЕЙ НОРМИРОВАННОГО ОТКЛОНЕНИЯ СВОЙСТВА НОРМАЛЬНОЙ КРИВОЙ 1. - ПРИ ИЗМЕНЕНИИ СРЕДНЕЙ ФОРМА КРИВОЙ НЕ МЕНЯЕТСЯ, ОНА ПРОСТО СМЕЩАЕТСЯ ПО ОСИ АБСЦИСС 2. ПРИ ИЗМЕНЕНИИ СРЕДНЕГО КВАДРАТИЧЕСКОГО ОТКЛОНЕНИЯ МЕНЯЕТСЯ ШИРИНА КРИВОЙ

Свойства нормального распределения

Свойства нормального распределения 1. ЛЮБУЮ НОРМАЛЬНУЮ КРИВУЮ МОЖНО ПРИВЕСТИ К СТАНДАРТНОЙ ФОРМЕ СТАНДАРТИЗИРОВАННАЯ НОРМАЛЬНАЯ КРИВАЯ =0 и =1

Свойства нормального распределения n=100; M = 10; s = 4; λ=2; Xi fi t=I(Xi-M)/s. I f(t) = Pi 4 5 I-1, 5 I 0, 1295 100 x 0, 13 x 2/4= 6, 5 8 19 I-0, 5 I 0, 3521 100 x 0, 35 x 2/4=17, 5 . . . 12 17 I+0, 5 I 0, 3521 100 x 0, 35 x 2/4=17, 5 Р ( -t< Xi-M < +t)=0. 6827 Р (-2 t< Xi-M <+2 t)=0. 9545 Р (-3 t< Xi-M <+3 t)=0. 9973 ПРАВИЛО ТРЕХ СИГМ: 99, 7% всех вариант нормально распределенной совокупности находится в пределах

Р (t=-1)< Xi-M <(t=+1)=0. 6827 Р (t=-2)< Xi-M <(t=+2)=0. 9545 Р (t=-3)< Xi-M <(t=+3)=0. 9973 ПРАВИЛО ТРЕХ СИГМ: 99, 7% всех вариант нормально распределенной совокупности находится в пределах

Свойства нормального распределения СТАНДАРТИЗИРОВАННАЯ НОРМАЛЬНАЯ КРИВАЯ P= 0. 6827 P = 0. 9545 P = 0. 9973

Свойства нормального распределения -3 t -2 t -t 0 +t +2 t +3 t -3 -2 -1 0 +1 +2 +3 квантили распределения, t (z)

Old statisticians never die they just become nonsignificant.

Модели распределений дискретных случайных величин. БИНОМИАЛЬНЫЙ ЗАКОН Jakob Bernoulli 1654 -1705 - n случайных испытаний, - вероятность появления некоторого события А равна p, - вероятность его непоявления q=1 -p. - теоретические частоты, с которыми данное событие в к испытаниях появится 0, 1, 2. . m раз, равны соответствующим числам разложения бинома (q+p)k Sir Isaac Newton - (бином Ньютона) (1642 - 1727)

БИНОМИАЛЬНЫЙ ЗАКОН Свойства биномиального распределения Pk(m) = (p+q)k = 1 Формула бинома Ньютона (р+q)k - Частота m появления ожидаемого события А в k независимых испытаний определяется его вероятностью р , постоянной в каждом испытании. - Характер биномиальной кривой определяется двумя величинами: числом испытаний (k) и вероятностью р ожидаемого результата. p=q ПРИ БИНОМИАЛЬНАЯ КРИВАЯ СТРОГО СИММЕТРИЧНА ОТНОСИТЕЛЬНО МАКСИМАЛЬНОЙ ОРДИНАТЫ, ЯВЛЯЮЩЕЙСЯ ЦЕНТРОМ РАСПРЕДЕЛЕНИЯ. ПРИ р<>q БИНОМИАЛЬНАЯ КРИВАЯ АСИММЕТРИЧНА.

БИНОМИАЛЬНЫЙ ЗАКОН - случайное событие А - k независимых испытаний - в каждом испытании вероятность p (А) постоянна. - два исхода: появление события А или события А*. - Вероятность события А* равна q. р+q=1 - если в k испытаниях событие А появится m раз, то событие А* появится k-m раз. - вероятность появление события А в k испытаниях m раз (pk(m)) выражается произведением рmqk-m, умноженным на биномиальный коэффициент , ФОРМУЛА БЕРНУЛИ P(A)=Сkm рmqk-m

Треугольник Паскаля Б. Паскаль «Трактат об арифметическом треугольнике» (1655).

БИНОМИАЛЬНЫЙ ЗАКОН Пример 2 : Какова вероятность появления 0, 1, 2, 4 или 5 особей мужского пола в числе 5 новорожденных? Событие А (рождение мальчика) – m меняется от 0 до 5 случаев К = 5 Событие А* (рождение девочки) m меняется от 0 до 5 случаев В каждом наблюдении p(А) = q(А*) = 0, 5. Р(0) = 0, 03125; Р(1) = 0, 15625; Р(2) = 0, 3125; Р(3) = 0, 3125; Р(4) = 0, 15625 Р(5) = 0, 03125.

Треугольник Паскаля Б. Паскаль «Трактат об арифметическом треугольнике» (1655).

БИНОМИАЛЬНЫЙ ЗАКОН Пример 3: В. И. Романовский 20160 раз подбросил четыре одинаковых монетки, учитывая каждый раз комбинации "орел-решка". Выпало: вместе гербов решек Частости Вероятность частота исхода, события % % 4 0 1181 6 6, 25 3 1 4909 24 25, 00 2 2 7533 38 37, 50 1 3 5085 25, 00 0 4 1402 7 6, 25 всего: 20160 100, 00

БИНОМИАЛЬНЫЙ ЗАКОН Пример 4. РАЗМЕЩЕНИЕ ОСОБЕЙ В ПРОСТРАНСТВЕ СЛУЧАЙНОЕ РЕГУЛЯРНОЕ АГРЕГИРОВАННОЕ РАЗМЕЩЕНИЕ ОСОБЕЙ =1 -- случайное <1 -- регулярное >1 – агрегированное (контагеозное, групповое)

БИНОМИАЛЬНЫЙ ЗАКОН Пример 3 P=0 0 1 2 3 4 5 6 7 8 Х – число особей в рамке

БИНОМИАЛЬНЫЙ ЗАКОН РЕГУЛЯРНОЕ РАЗМЕЩЕНИЕ ОСОБЕЙ модель ПОЛОЖИТЕЛЬНОЕ БИНОМИАЛЬНОЕ РАСПРЕДЕЛЕНИЕ (q+p)k p - вероятность попадания одной особи в выборочную площадку; q - вероятность того, что в выборочную площадку не попадет ни одна особь; k - максимально возможное число особей в выборочной площадке. 2 2 k = M /(M - s ); p = M/k; M = kp; s 2 = kpq; p+q = 1; .

модель СЛУЧАЙНОЕ РАЗМЕЩЕНИЕ ОСОБЕЙ РАСПРЕДЕЛЕНИЕ ПУАССОНА Р(X)= e- ( k/X!) Siméon-Denis Poisson (1781 - 1840) m=s 2=M p - вероятность попадания одной особи в выборочную площадку; q - вероятность того, что в выборочную площадку не попадет ни одна особь; при р -->0 и k-->. q-->1 при s 2 -->M. р =М/k М, или s 2 – наивероятнейшая частота ожидаемого события.

Распределение Пуассона Условия коректности описания эмпирического распределения моделью Пуассона 1. Вероятность оккупирования одной особью выбранной площадки мала и постоянна. 2. M < Xmax 3. Присутствие особи в выборочной площадке не должно влиять на вероятность попадания особи в соседнюю площадку. 4. n<<<N 5. При (s 2, M) >10 распределение Пуассона асимптотически приближается к нормальному

БИНОМИАЛЬНЫЙ ЗАКОН Агрегированное размещения особей модель ОТРИЦАТЕЛЬНОЕ БИНОМИАЛЬНОЕ РАСПРЕДЕЛЕНИЕ (q-p)-k p - вероятность попадания одной особи в выборочную площадку; q - вероятность того, что в выборочную площадку не попадет ни одна особь; к - степень агрегации 2 -S 2/n)/(s 2 -M); (M k= p = 1/(1 -M/k); M = kq/p; s 2 = kpq

СТАТИСТИЧЕСКОЕ ОЦЕНИВАНИЕ

A Physicist, a Biologist, and a Statistician see two people enter a house, and then after some time, they see three people leave the house. The Physicist concludes, "My initial observation must have been incorrect. " The Biologist concludes, "Clearly, the two reproduced. . . " The Statistician concludes, "Well, if one more person enters the house, then there will be no one in the house!"

Условия корректности процедур в биометрии 1. - независимость вариант друг от друга (случайность наблюдений); 2. 3. 2. - “нормальность” или возможность нормализации вариационных рядов; 3. - независимостью выборочных показателей распределения друг от друга; 4. - аддитивностью компонентов вариансы, т. е. сложимости эффектов основных воздействий на изучаемый признак в статистическом комплексе; 5. - равенство варианс выборок.

Pierre-Simon Laplace (1749 -1827) Siméon Denis Poisson (1781 – 1840) Чебышёв Пафну тий Льво вич (1821 – 1894) Марков Андрей Андреевич (1856 – 1922) Ляпуно в Алекса ндр Миха йлович (1857 – 1918) ПРЕДЕЛЬНЫЕ ТЕОРЕМЫ ТЕОРИИ ВЕРОЯТНОСТЕЙ: 1 -я группа теорем составляет "закон больших чисел". Закон больших чисел формулирует условия, при которых совокупное действие большого числа случайных факторов приводит к результату почти не зависящему от случая (т. е. практически постоянный результат) 2 -я группа теорем связана с выяснением вопроса о распределении сумм большого числа случайных величин. В этих теоремах выясняется, какие законы распределения может иметь сумма случайных величин, если число слагаемых неограниченно увеличивается.

МЕСТО НОРМАЛЬНОГО ЗАКОНА В БИОСТАТИСТИКЕ ЦЕНТРАЛЬНАЯ ПРЕДЕЛЬНАЯ ТЕОРЕМА (Лаплас, 1813 г. ) Интегральная предельная теорема Муавра-Лапласа является частным случаем общей и универсальной центральной предельной теоремы. Обобщение ЦПТ на случай независимых разнораспределенных слагаемых Ляпунов, 1912 Pierre-Simon Laplace (1749 — 1827) Ляпуно в Алекса ндр Миха йлович (1857 – 1918)

МЕСТО НОРМАЛЬНОГО ЗАКОНА В БИОСТАТИСТИКЕ ЦЕНТРАЛЬНАЯ ПРЕДЕЛЬНАЯ ТЕОРЕМА Ляпуно в Алекса ндр Миха йлович (1857 – 1918) Один из основных постулатов ЦПТ : …. закон распределения суммы большого числа нормированных случайных слагаемых (=распределений) практически вне зависимости от типа распределения самих слагаемых стремится по мере роста числа слагаемых к нормальному (гауссовскому) распределению

Следствие ЦПТ: … средние больших случайных выборок, полученных из одной генеральной совокупности, будут распределены нормально, и независимо от типа распределения вариант в каждой выборке. . . “Каждый уверен в справедливости нормального закона: экспериментаторы – потому, что они думают, что это математическая теорема; математики потому, что они думают, что экспериментальный Gabriel Lipman факт” ? Jules Henri Poincaré 1854 - 1912 1845 - 1921

ОДНО ИЗ ГЛАВНЫХ УСЛОВИЙ КОРРЕКТНОСТИ ПРОЦЕДУР В МАТСТАТИСТИКЕ . . “НОРМАЛЬНОСТЬ” ИЛИ ВОЗМОЖНОСТЬ НОРМАЛИЗАЦИИ ИСХОДНЫХ ВАРИАЦИОННЫХ РЯДОВ. . . МОЖНО ВЫПОЛНИТЬ ВСПОМНИВ, ЧТО. . А) существуют прямые и косвенные оценки, позволяющие обойти сложные процедуры, предписанные для включения «ненормальных» данных в статистический анализ. Б) даже в случае доказанного отклонения исследуемых экспериментальных распределений от нормального закона есть по крайней мере два пути его целесообразной эксплуатации:

1. - использование нормального закона в качестве первого правдоподобного приближения. 2. - подбор такого преобразования исследуемой случайной величины, которое превращает исходный “ненормальный” ряд распределения в «нормальный» . .