Лекция 2н ММСП СО зо.pptx
- Количество слайдов: 31
Лекция 2 Основные понятия математической статистики
СОДЕРЖАНИЕ 1. Выборки и их характеристики 2. Коэффициент корреляции Выход 2
ВЫБОРКИ Обычно совокупность исследуемых в статистике данных бывает очень большой. Такая совокупность называется генеральной (т. е. все находящиеся в ней объекты подлежат исследованию). Но невозможно обработать объекты, если их несколько тысяч или десятков тысяч. 3
ВЫБОРКИ В этом случае обрабатывают часть объектов. Существует много способов выбрать часть из генеральной совокупности, например, с помощью случайных чисел. Совокупность, состоящая из случайным образом отобранных объектов называется выборочной или просто выборкой. 4
ВЫБОРКИ (ОКОНЧАНИЕ) Если вычислены характеристики выборочной совокупности, то с некоторой вероятностью можно сказать, что их можно распространить и на всю генеральную совокупность. Чаще всего для выборочной совокупности определяют не само значение М(Х) или D(X), а интервал, в который они попадают (т. н. интервальные характеристики) 5
ХАРАКТЕРИСТИКИ ВЫБОРКИ Порядок исследования выборки: выборки 1) Отбирают выборочную совокупность любым образом (повторно или бесповторно) 2) Создают вариационный ряд соответствия значений выборки количест ву таких значений 6
ХАРАКТЕРИСТИКИ ВЫБОРКИ (ПРОДОЛЖЕНИЕ) 3) Находят соответствия значений исследуемого признака количеству таких значений, создавая следующую таблицу: 7
ХАРАКТЕРИСТИКИ ВЫБОРКИ (ПРОДОЛЖЕНИЕ) … … Относительн ая частота … 8
ХАРАКТЕРИСТИКИ ВЫБОРКИ (ПРОДОЛЖЕНИЕ) 4) Определяют выборочную среднюю 9
ХАРАКТЕРИСТИКИ ВЫБОРКИ (ПРОДОЛЖЕНИЕ) 5) Вычисляют выборочную дисперсию 6) Находят исправленную выборочную дисперсию 10
ХАРАКТЕРИСТИКИ ВЫБОРКИ (ПРОДОЛЖЕНИЕ) 7) Находят выборочное среднее квадратическое отклонение и исправленное среднее квадратическое отклонение Реальные и σ неизвестны. 11
ХАРАКТЕРИСТИКИ ВЫБОРКИ (ПРОДОЛЖЕНИЕ) 8) С вероятностью =0, 95 (или 95% - это обычный процент вероятности для научно-технических задач) вычисляют интервал, куда попадает математическое ожидание и среднее квадратическое отклонение случайной величины при неизвестном среднем квадратическом отклонении всей генеральной совокупности σ: 12
ХАРАКТЕРИСТИКИ ВЫБОРКИ (ПРОДОЛЖЕНИЕ) В этой формуле t - коэффициент Стьюдента (зависит от количества элементов в выборке и от вероятности погрешности расчета), он дается в приложениях в литературе [1] и [2], т. е. во всех учебниках и задачниках по статистике и теории вероятностей 13
ХАРАКТЕРИСТИКИ ВЫБОРКИ (ПРОДОЛЖЕНИЕ) 14
ХАРАКТЕРИСТИКИ ВЫБОРКИ (ПРОДОЛЖЕНИЕ) 15
ХАРАКТЕРИСТИКИ ВЫБОРКИ (ПРОДОЛЖЕНИЕ) 16
ХАРАКТЕРИСТИКИ ВЫБОРКИ (ПРОДОЛЖЕНИЕ) 17
ХАРАКТЕРИСТИКИ ВЫБОРКИ (ПРОДОЛЖЕНИЕ) Получают такую таблицу: Интервальн ые границы ……. 18
ХАРАКТЕРИСТИКИ ВЫБОРКИ (ПРОДОЛЖЕНИЕ) 19
ХАРАКТЕРИСТИКИ ВЫБОРКИ (ПРОДОЛЖЕНИЕ) 20
ХАРАКТЕРИСТИКИ ВЫБОРКИ (ПРОДОЛЖЕНИЕ) Гистограмма интервальных частот ni инт 5. 0 4. 5 4. 0 3. 5 3. 0 ni инт 2. 5 2. 0 1. 5 1. 0 0. 5 0. 0 1 -2 2 -3 3 -4 4 -5 5 -6 6 -7 21
ХАРАКТЕРИСТИКИ ВЫБОРКИ (ОКОНЧАНИЕ) На предыдущем слайде размещена гистограмма интервальных частот некоторой выборочной совокупности, по виду которой можно сделать вывод, что закон распределения совокупности тяготеет к нормальному. 22
КОРРЕЛЯЦИОННЫЙ АНАЛИЗ В случае двух СВ требуется еще оценить тесноту корреляционной зависимости для оценки количественной характеристики Y от X. Для этого вводится понятие коэффициента корреляции. 23
КОРРЕЛЯЦИОННЫЙ АНАЛИЗ (ПРОДОЛЖЕНИЕ) Так как в статистике изучают не всю совокупность объектов, а выборку их них, вводится понятие выборочного коэффициента линейной корреляции 24
КОРРЕЛЯЦИОННЫЙ АНАЛИЗ (ПРОДОЛЖЕНИЕ) 25
КОРРЕЛЯЦИОННЫЙ АНАЛИЗ (ПРОДОЛЖЕНИЕ) 26
КОРРЕЛЯЦИОННЫЙ АНАЛИЗ (ПРОДОЛЖЕНИЕ) Если находим корреляционную зависимость Y от X, то это прямая регрессия (зависимость называется регрессионной и уравнение называется уравнением регрессии, а коэффициент – корреляционным, поэтому и анализ называется корреляционным). 27
СВОЙСТВА КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ 28
СТАТИСТИЧЕСКАЯ ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ Статистической гипотезой называется любое утверждение о виде или свойствах распределения CВ на основе некоторой выборки. Проверяемая гипотеза называется основной (нулевой) и обозначается H 0, конкурирующая – альтернативной и обозначается H 1. 29
СТАТИСТИЧЕСКАЯ ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ Данный материал оставляется на самостоятельное изучение. 30
СПИСОК ЛИТЕРАТУРЫ 1. Письменный Д. Т. Конспект лекций по теории вероятностей, математической статистике и случайным процессам – М. : Айрис-Пресс, 2008. – 288 с. Дополнительная 2. В. Е. Гмyрман. Теория вероятностей и математическая статистика. – М. : Высш. обр. изд. 10, исправ. - 2008. -480 с. 3. Гмурман В. Е. Руководство к решению задач по теории вероятностей и математической статистике. Учебное пособие для студентов вузов; 11 -е изд. , перераб. - М. : Высш. обр. 2009 31