L 10 T 7 .pptx
- Количество слайдов: 21
Теория вероятностей и математическая статистика Тема 7. Основные понятия математической статистики
Лекция 10 Основные понятия математической статистики • Основные задачи математической статистики • Генеральная и выборочные совокупности Тема 7. Основные понятия математической статистики
Литература [1] C. 18 -28 [2] C. 131 -133 [3] C. 187 -190 1. Горяинов, В. Б. , и др. , Математическая статистика, под ред. В. С. Зарубин and А. П. Крищенко. 2001, М. : Издательство МГТУ им. Н. Э. Баумана. 424. 2. Фигурин, В. А. and В. В. Оболонкин, Теория вероятностей и математическая статистика. 2000, Минск: ООО "Новое знание". 207. 3. Гмурман, В. Е. , Теория вероятностей и математическая статистика. 2003, Москва: Высшая школа. 480. Тема 1. Основные понятия теории вероятностей
Основные задачи математической статистики Математическая статистика — раздел математики, разрабатывающий методы регистрации, описания и анализа данных наблюдений и экспериментов с целью построения вероятностных моделей массовых случайных явлений. Математическая статистика предполагает вероятностную природу данных наблюдений, поэтому она основана на понятиях и методах теории вероятностей. Во многих своих разделах математическая статистика опирается на теорию вероятностей, однако задачи математической статистики являются «обратными» к задачам теории вероятностей Тема 7. Основные понятия математической статистики
Основные задачи математической статистики Задачи математической статистики (МС)– «обратные» к задачам теории вероятностей (ТВ) ТВ: вероятностная модель событий задана, необходимо рассчитать вероятности событий. МС: вероятностная модель не задана, в результате эксперимента известны реализации каких-либо случайных событий, необходимо подобрать вероятностную модель Тема 7. Основные понятия математической статистики
Основные задачи математической статистики Примеры постановки задач ТВ: Вероятность выпадения „герба" при подбрасывании монеты известна и равна р. Какова вероятность того, что при n подбрасываниях монеты герб выпадет k раз, где 0 < к < n? МС: Монету подбрасывали n раз, и „герб" выпал k раз. Что можно сказать о вероятности выпадения герба при одном подбрасывании? Тема 7. Основные понятия математической статистики
Генеральная и выборочная совокупности Генеральная совокупность * — множество возможных значений случайной величины X. Распределение (з-н распределения) генеральной совокупности X – распределение вероятностей случайной величины X. Cтатистические (экспериментальные) данные - значения случайной величины, полученные в результате повторений случайного эксперимента. Предполагаем, что эксперимент хотя бы теоретически может быть повторен сколько угодно раз в одних и тех же условиях. Под словами „в одних и тех же условиях" будем понимать, что распределение случайной величины Xi, i= 1, 2, . . . , заданной на множестве исходов i-го эксперимента, не зависит от номера испытания и совпадает с распределением генеральной совокупности X. ______ * Генеральная совокупность (в англ. — population) — совокупность всех объектов (единиц), которые подлежат изучению. Тема 7. Основные понятия математической статистики
Генеральная и выборочная совокупности . Совокупность независимых случайных величин X 1, …Xn, каждая из которых имеет тоже распределение, что и генеральная совокупность X, называется случайной выборкой из генеральной совокупности X. n – объем выборки, Xi – элементы cлучайной выборки Любое возможное значение случайно выборки будем называть выборкой из генеральной совокупности или реализацией случайной выборки . Числа - элементы выборки . ______ * Иногда просто Тема 7. Основные понятия математической статистики
Выборочный метод Интерпретация: Выборка - это совокупность n чисел x 1, …. , xn, полученных в результате проведения n повторных независимых наблюдений над случайной величиной X. Выборочный метод: Свойства случайной величины X устанавливаются путем изучения тех же свойств на случайной выборке. Выборочный метод – основа любых статистических выводов (i. e. выводов о вероятностных свойствах генеральной совокупности X). Тема 7. Основные понятия математической статистики
Выборка должна быть репрезентативной (представительной). В силу закона больших чисел можно утверждать, что выборка будет репрезентативной, если ее осуществлять случайно. Выборка может быть повторной, если объект возвращается в генеральную совокупность перед произведеление следующего отбора. Бесповторной называют выборку, при которой отобранный объект в генеральную совокупность не возвращается. Способы отбора. • Отбор, не требующий расчленения генеральной совокупности на части. o. Простой случайный бесповторный отбор; o. Простой случайный повторный отбор. • Отбор, при котором производится расчленение генеральной совокупности на части. o. Типический отбор; o. Механический отбор; o. Серийный отбор. Тема 7. Основные понятия математической статистики
Статистическая модель Множество возможных значений случайной выборки называют выборочным пространством . Любую функцию случайной выборки называют статистикой или выборочной характеристикой. Ее распределение называют выборочным распределением. Тема 7. Основные понятия математической статистики
Статистическая модель О распределении случайной величины может быть известно очень мало, например, что она является дискретной или непрерывной, или же может быть известно ее распределение с точностью до параметра. Например, генеральная совокупность имеет нормальное распределение с неизвестными параметрами. Параметры σ, μ- неизвестны, значит мы можем говорить только о семействе (классе) распределений случайной выборки. Выборочное пространство, на котором задан класс распределений называется статистической моделью. Статистическая модель полностью определена функцией распределения. Будем обозначать статистическую модель {F(x)}, поскольку она полностью определена функцией распредлеения F(x) генеральной совокупности. Тема 7. Основные понятия математической статистики
Статистическая модель Если функция распределения задана с точностью до неизвестного параметра (в общем случае вектор параметров c множеством возможных значений , то статистическую модель называют параметрической. Статистическую модель называют непрерывной или дискретной, если случайная величина X является непрерывной или дискретной. В случае непрерывной статистической модели распределение задается плотностью распределения. В дальнейшем будем использовать p(x) (p(x, θ)) для параметрических моделей) как для вероятностей, так и для плотности распределения случайных величин. Тема 7. Основные понятия математической статистики
Статистическая модель Пример. Известно, генеральная совокупность случайной величины X распределена по нормальному закону с известной дисперсией и неизвестным средним θ. Тогда статистическая параметрическая модель {F(x; θ)} может быть задана с помощью плотности распределения Если неизвестны оба параметра – среднее и среднее квадратичное отклонение, то статистическая модель имеет вид и плотность распределения содержит два неизвестных параметра. Все вышесказанное распространяется и на многомерные случайные величины. В математической статистике обычно используются законы распределения случайных величин, имеющие общепринятые названия. Статистические модели называют соответствующим образом: нормальная модель, биномиальная модель. Тема 7. Основные понятия математической статистики
. Задачи математической статистики • Оценка неизвестных параметров • Проверка статистических гипотез • Установление формы и степени связи между случайными величинами Тема 7. Основные понятия математической статистики
. Оценка неизвестных параметров. Точечная оценка Функция распределения известна с точностью до параметра θ. Нужно найти такую статистику , выборочное значение которой для рассматриваемой реализации случайной выборки можно было бы считать приближенным значением параметра θ. Статистику , выборочное значение которой для рассматриваемой реализации случайной выборки принимают за приближенное значение параметра θ, называют его точечной оценкой или просто оценкой, - значением точечной оценки. Тема 7. Основные понятия математической статистики
. Оценка неизвестных параметров. Интервальная оценка Возможным является и другой подход к решению задачи. Найти такие статистики , что бы с вероятностью γ выполнялось неравенство В этом случае говорят об интервальной оценке для θ. Доверительным интервалом для θ называют . γ – коэффициент доверия Тема 7. Основные понятия математической статистики
. Проверка статистических гипотез Статистической гипотезой называют любое предположение о распределении вероятностей наблюдаемой случайной величины. В некотором смысле задача проверки статистической гипотезы является обратной к задаче оценивания параметра. При оценивании параметра мы ничего не знаем о его истинном значении. При проверке статистической гипотезы мы из каких-то соображений предполагаем известным его значение и хотим по результатам эксперимента проверить наше предположение. Примеры гипотез. 1. µ=µ 0, µ - математическое ожидание случайной величины (гипотеза о величине математического ожидания). 2. σ 21=σ22 , где σ 21 и σ22 - дисперсии двух случайных величин X 1 и X 2 (гипотеза об однородности дисперсий). 3. F(x)=Ft(x), где F(x) – функция распределения случайной величины, Ft(x) – некоторая предполагаемая функция распределения (гипотеза о функции распределения). Тема 7. Основные понятия математической статистики
. Установление формы и степени связи между случайными величинами Смысл таких задач поясним на примере. Пусть Y – случайная величина, поведение которой мы хотели бы определить по значениям других величин X и Z. Например – степень шума двигателя автомашины в зависимости от пробега и веса груза в нем. Корреляционный анализ помогает установить, есть ли связь между этими величинами Тема 7. Основные понятия математической статистики
. Предварительная обработка результатов измерения Вариационный ряд. Наиболее простое преобразование статистических данных – их порядочивание по величине. Элементы выборки можно расположить в неубывающем порядке: x 1< x 2< x 3<…< xi<…< xn (*) x 1 –наименьший из элементов выборки, xn - наибольший из элементов выборки. Последовательность чисел x 1, x 2, x 3, …, xi, …, xn , если она удовлетворяет условию (*) называется вариационным рядом. Аналогично можно ввести понятие вариационного ряда для случайной выборки. Переход от случайной выборки к вариационному ряду не приводит к потере информации, однако функции распределения случайных величин уже не совпадают с функцией распределения генеральной совокупности. Тема 7. Основные понятия математической статистики
. Предварительная обработка результатов измерения Статистический ряд. Среди элементов выборки, а значит, и среди членов вариационного ряда могут быть повторяющиеся величины. Статистическим рядом для выборки называют таблицу, которая содержит элементы выборки и числа, показывающие, сколько раз это значение повторялось при проведении измерения. Статистические данные, представленные в виде статистического ряда называются группированными. Исходные данные группируют обычно при больших объемах выборки. Данные можно группировать не только в виде статистического ряда, но и в виде интервального статистического ряда. Для построения интервального статистического ряда, отрезок содержащий все выборочные значения J=[x 1, xn] разбивают на несколько равных интервалов. Подсчитывают сколько элементов попадают в данный интервал и данные записывают в виде таблицы. В верхней строчке таблицы можно указывать как интервал, так и его среднее значение. В нижней иногда указываются относительные частоты nk/n. Тема 7. Основные понятия математической статистики


