Скачать презентацию Лекция 4 Основные понятия теории вероятностей 1 2 Скачать презентацию Лекция 4 Основные понятия теории вероятностей 1 2

КТММ Лекция 21.10 2016.ppt

  • Количество слайдов: 41

Лекция 4 Основные понятия теории вероятностей 1. 2. 3. 4. Понятие случайного события и Лекция 4 Основные понятия теории вероятностей 1. 2. 3. 4. Понятие случайного события и случайной величины Вероятность события и способы ее вычисления. Логические действия над событиями. Функция распределения и плотность вероятности случайной величины. 1

2 2

Причина (А) функциональные B = f(A) ЗАКОНЫ Следствие (В) статистические B = f(A) + Причина (А) функциональные B = f(A) ЗАКОНЫ Следствие (В) статистические B = f(A) + E 3

n Разнообразные случайные факторы, которые трудно поддаются учету, но существенно влияющие на происходящий процесс, n Разнообразные случайные факторы, которые трудно поддаются учету, но существенно влияющие на происходящий процесс, называются стохастическими. n Закономерности, обусловленные влиянием стохастических факторов, называются статистическими. 4

Испытание — это наблюдение какоголибо явления в рамках определенного числа контролируемых факторов Случайным называется Испытание — это наблюдение какоголибо явления в рамках определенного числа контролируемых факторов Случайным называется событие, которое при осуществлении совокупности условий может произойти либо не произойти 5

Результат испытания Количественные характеристики Качественные характеристики Случайные величины Случайные события Дискретные Достоверные Непрерывные Невозможные Результат испытания Количественные характеристики Качественные характеристики Случайные величины Случайные события Дискретные Достоверные Непрерывные Невозможные Рановозможные Несовместимые Совместимые 6

Величина, которая в результате испытания может принимать некоторое заранее неизвестное значение, называется случайной Дискретные Величина, которая в результате испытания может принимать некоторое заранее неизвестное значение, называется случайной Дискретные случайные величины принимают при измерениях одно из дискретного множества значений. n Непрерывные случайные величины принимают разные возможные значения из непрерывного промежутка. n 7

n Вероя тность (вероятностная мера) — численная мера возможности наступления некоторого события. n Тео n Вероя тность (вероятностная мера) — численная мера возможности наступления некоторого события. n Тео рия вероя тностей — это наука, изучающая закономерности случайных явлений: случайные события, случайные величины, их свойства и операции над ними. 8

Число бросков Число орлов Относительная частота решек 10 7 3 0, 3 100 39 Число бросков Число орлов Относительная частота решек 10 7 3 0, 3 100 39 61 0, 61 1000 565 445 0, 445 10000 4968 5032 0, 5032 9

Классическое определение вероятности сводится к модели Лапласа. В модели Лапласа вероятностью события А называют Классическое определение вероятности сводится к модели Лапласа. В модели Лапласа вероятностью события А называют отношение числа благоприятствующих этому событию исходов к общему числу всех равновозможных несовместных элементарных исходов, образующих полную группу: где: т – число элементарных исходов, благоприятствующих наступлению события А; п – число всех возможных элементарных исходов испытания. 10

Свойства вероятности n Вероятность достоверного события равна единице n Вероятность невозможного события равна нулю Свойства вероятности n Вероятность достоверного события равна единице n Вероятность невозможного события равна нулю Вероятность случайного события есть положительное число, заключенное между нулем и единицей n 11

Относительной частотой события называют отношение числа испытаний, в которых событие появилось, к общему числу Относительной частотой события называют отношение числа испытаний, в которых событие появилось, к общему числу фактически произведенных испытаний где т- число появлений события А, n - общее число испытаний. 12

Число испытаний Частота появления «герба» Статистическа я вероятность Опыт Бюффона 4 040 2 048 Число испытаний Частота появления «герба» Статистическа я вероятность Опыт Бюффона 4 040 2 048 0, 5069 Опыт Керриха 10 000 5 087 0, 5087 Опыт Пирсона № 1 12 000 6 019 0, 5016 Опыт Пирсона № 2 24 000 12 0, 5005 Название опыта 13

Операции над событиями: объединение, пересечение, разность и отрицание Если A и B – события Операции над событиями: объединение, пересечение, разность и отрицание Если A и B – события ( ), то = {произошло хотя бы одно из событий A или B} = {одновременно происходят события A и B} = {произошло событие A , но не произошло B} 14

Функцией распределения случайной величины Х называется функция F(X), выражающая вероятность того, что Х принимает Функцией распределения случайной величины Х называется функция F(X), выражающая вероятность того, что Х принимает значение, меньшее или равное заданному числу х F(X)=P(X≤xi) Величина, равная производной от функции распределения, называется плотностью вероятности случайной величины 15

Наиболее распространенные распределения непрерывных случайных величин: ~ Равномерное распределение ~ Экспоненциальное (показательное) распределение ~ Наиболее распространенные распределения непрерывных случайных величин: ~ Равномерное распределение ~ Экспоненциальное (показательное) распределение ~ Распределение хи-квадрат (c 2 - распределение) ~ F-распределение Фишера ~ Распределение Парето ~ Логистическое распределение ~ Логнормальное распределение ~ Вета-распределение ~ Распределение Вейбулла ~ Распределение Коши ~ Гамма-распределение ~ Распределение Лапласа ~ Нормальное распределение 16

17 17

Разные методы определения вероятности как численной меры степени объективной возможности события n Формула полной Разные методы определения вероятности как численной меры степени объективной возможности события n Формула полной вероятности n Формула Бернулли , где q = 1 - p 18

n Статистические данные – это все собранные сведения, которые в дальнейшем подвергаются статистической обработке. n Статистические данные – это все собранные сведения, которые в дальнейшем подвергаются статистической обработке. n Статистический признак – это общее свойство, присущее нескольким статистическим данным. n Статистической совокупностью называют несколько статистических данных, объединенных в группу хотя бы одним статистическим признаком. 19

Число данных в статистической совокупности называют ее объемом и обозначают n. Различают следующие совокупности: Число данных в статистической совокупности называют ее объемом и обозначают n. Различают следующие совокупности: n бесконечные — n →∞ n конечные — n – конечное число; n генеральные — содержащие все данные, обусловленные постановкой задачи; n выборочные — репрезентативные части генеральных совокупностей. n большие — n > 30; n малые — n ≤ 30; 20

Виды представления статистических данных: n текстовый вид; n табличный вид; n вариационный ряд; n Виды представления статистических данных: n текстовый вид; n табличный вид; n вариационный ряд; n графический вид. xi ~ 2, 3, 3, 5, 5, 6, 6, 7 (неубывающая совокупность) xi ~ 7, 6, 6, 6, 5, 5, 3, 3, 3, 2 (невозрастающая совокупность). Ранжирование – это операция расположения чисел в порядке/ возрастания / убывания. Место каждой варианты в ранжированном ряду называется рангом. 21

1, 25 1, 30 1, 32 1, 36 1, 38 1, 40 1, 42 1, 25 1, 30 1, 32 1, 36 1, 38 1, 40 1, 42 1, 45 1, 30 1, 32 1, 36 1, 36 1, 38 1, 40 xi 1, 25 ni 3 1, 30 1, 32 1, 36 1, 38 1, 40 1, 42 1, 45 5 6 9 8 5 4 3 n = 43 Вариационный ряд — это двойной столбец ранжированных чисел, где слева стоит собственно показатель — вариант, а справа — его количество — частота. 22

23 23

Основные задачи анализа данных Описание статистической совокупности Определение параметров генеральной совокупности по выборочным данным Основные задачи анализа данных Описание статистической совокупности Определение параметров генеральной совокупности по выборочным данным Определение достоверности различий между статистическими совокупностями Определение наличия и характера взаимосвязи между признаками Определение степени влияния множества факторов на результативный признак 24

Данные Количественные Дискретные (точные) Непрерывные (приближенные) Качественные Порядковые Номинальные 25 Данные Количественные Дискретные (точные) Непрерывные (приближенные) Качественные Порядковые Номинальные 25

Классификация данных по количеству переменных: Данные Одномерные Двумерные Многомерные 26 Классификация данных по количеству переменных: Данные Одномерные Двумерные Многомерные 26

Группы числовых характеристик вариационного ряда Группы Показатели положения Показатели рассеяния Показатели асимметрии Показатели распределен Группы числовых характеристик вариационного ряда Группы Показатели положения Показатели рассеяния Показатели асимметрии Показатели распределен Назначение Характеристики М – математическое ожидание Определяют центр распределения Ме – медиана Мо – мода D – дисперсия - стандартное Определяют степень разброса отклонение данных относительно цента V – коэффициент распределения вариации R – размах вариации As – коэффициент асимметрии Положение медианы Определяют неравномерность разброса данных относительно центра математического ожидания на числовой оси F(x) – интегральная функция Определяют закон (функцию) 27 распределения значения

28 28

n Медиана (Ме) - это такое значение признака Х, когда одна половина значений экспериментальных n Медиана (Ме) - это такое значение признака Х, когда одна половина значений экспериментальных данных меньше ее, а другая половина - больше (среднее значение вариационного ряда). Порядковый номер медианы в вариационном ряду (ранг) определяется как: Если выборка содержит парное число членов, то медианой принято считать среднее арифметическое средних членов выборки. n Мода (Мо) - это значение признака, который встречается в выборке чаще всего. 29

Средним арифметическим называется частное от деления суммы всех значений вариант рассматриваемой совокупности на их Средним арифметическим называется частное от деления суммы всех значений вариант рассматриваемой совокупности на их число: где Σ – знак суммирования xi – варианты или значения признака n – объем выборки 30

2. Дисперсия и стандартное отклонение (среднее квадратическое отклонение) – указывают на варьирование, т. е. 2. Дисперсия и стандартное отклонение (среднее квадратическое отклонение) – указывают на варьирование, т. е. рассеивание исходных данных относительно средней арифметической величины 2. Среднее квадратическое (или стандартное) отклонени 31

3. Стандартная ошибка или ошибка репрезентативности: 4. Коэффициент вариации: Если, от 0 до 10 3. Стандартная ошибка или ошибка репрезентативности: 4. Коэффициент вариации: Если, от 0 до 10 - группа однородная; от 10 -15 - средняя степень однородности; > 15 - группа неоднородная. 32

ПОНЯТИЕ О СТАТИСТИЧЕСКОЙ ДОСТОВЕРНОСТИ Статистически достоверным различием выборок называется такое, при котором они различаются ПОНЯТИЕ О СТАТИСТИЧЕСКОЙ ДОСТОВЕРНОСТИ Статистически достоверным различием выборок называется такое, при котором они различаются значимо и принципиально, т. е. принадлежат к разным генеральным совокупностям. x y 33

n Определение критерия Стьюдента 1. Находим критерий Стьюдента t по следующей формуле: 2. Практика n Определение критерия Стьюдента 1. Находим критерий Стьюдента t по следующей формуле: 2. Практика в ФКС показала, что для спортивной работы достаточно принять надежность счета Р= 0, 95. Для надежности счета: Р = 0, 95 (α = 0, 05), при числе степеней свободы k = n 1 + n 2 - 2 по таблице находим величину граничного значения критерия (tгр). 3. На основании свойств нормального закона распределения в критерии Стьюдента осуществляется сравнение t и tгр. 4. Делаем выводы: - если t tгр, то различие между сравниваемыми выборками статистически достоверно; - если t < tгр, то различие статистически недостоверно. 34

n Определение критерия Фишера 1. Находим критерий Фишера F по формуле: , при D n Определение критерия Фишера 1. Находим критерий Фишера F по формуле: , при D 1 > D 2 2. Задаем надежность счета: Р = 0, 95 — и определяем числа степеней свободы для обеих выборок: k 1 = n 1 – 1; k 2 = n 2 - 1. 3. По таблице находим граничное значение критерия Fгр. 4. Сравнение критериев F и Fгр позволяет сформулировать выводы: - если F Fгр, то различие между выборками статистически достоверно; - если F < Fгр, то различие между выборками статистически недостоверно 35

4. КОРРЕЛЯЦИОННЫЙ АНАЛИЗ - ОЦЕНКА ВЗАИМОСВЯЗИ МЕЖДУ ИЗУЧАЕМЫМИ ПРИЗНАКАМИ. n Цель заключается в определении 4. КОРРЕЛЯЦИОННЫЙ АНАЛИЗ - ОЦЕНКА ВЗАИМОСВЯЗИ МЕЖДУ ИЗУЧАЕМЫМИ ПРИЗНАКАМИ. n Цель заключается в определении формы, направленности, а также тесноты существующей взаимосвязи между варьирующими признаками. n Под корреляционной зависимостью понимается зависимость между переменными случайными величинами, при которой каждому значению одной из них соответствует определенная групповая средняя из множества значений другой. 36

Коэффициент линейной корреляции для различных видов корреляционных полей 37 Коэффициент линейной корреляции для различных видов корреляционных полей 37

Коэффициент корреляции Пирсона Свойства коэффициента корреляции Коэффициент корреляции находится в пределах – 1 ≤ Коэффициент корреляции Пирсона Свойства коэффициента корреляции Коэффициент корреляции находится в пределах – 1 ≤ rxy ≤ 1. Если rxy = 0, то связь между признаками отсутствующий. rxy = ± 1, то связь между признаками очень тесна. 3. Принято считать, что rxy = 0, 20 -0, 49 представляет слабую связь, rxy = 0, 50 -0, 69 представляет среднюю связь, rxy = 0, 70 -0, 99 представляет тесную связь. 2. Если 4. Знак коэффициента корреляции отображает направление связи - положительное или отрицательное. 38

Коэффициент ранговой корреляции Спирмена Это непараметрический критерий, который определяет степень связи между признаками по Коэффициент ранговой корреляции Спирмена Это непараметрический критерий, который определяет степень связи между признаками по парному сравнению показателей их рангов. n Данный метод может быть использован не только для количественно выраженных данных, но также и в случаях, когда регистрируемые значения признаков являются номинальными n 39

Эмпирическое значение коэффициента Спирмена n – число парных наблюдений di = dxi - dyi Эмпирическое значение коэффициента Спирмена n – число парных наблюдений di = dxi - dyi представляет собой разность где рангов сравниваемых пар i=1, 2, …, n 40

Алгоритм определения коэффициента ранговой корреляции Спирмена n n n Сопоставить каждому из признаков их Алгоритм определения коэффициента ранговой корреляции Спирмена n n n Сопоставить каждому из признаков их порядковый номер (ранг) по возрастанию (или убыванию). Определить разности рангов каждой пары сопоставляемых значений. Возвести в квадрат каждую разность и суммировать полученные результаты. Вычислить коэффициент корреляции рангов по приведенной формуле. оценить по таблице степень связи между признаками 41