LekcijaNo5_Osnovnye_ponjatija_MS_-2013.pptx
- Количество слайдов: 54
ОСНОВНЫЕ ПОНЯТИЯ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ
Случайные величины
Классическое определение вероятности. l Вероятность случайного события равна отношению числа исходов m, благоприятствующих событию А, к числу всех возможных, исходов n.
Статистическое определение вероятности: l Вероятностью события А называется предел отношения числа испытаний m в которых событие А произошло к общему числу испытаний n, при условии что общее число испытаний n стремится к бесконечности.
Пример таблицы статистического обследования
Понятие случайной величины Случайная величина - это количественный признак (параметр, переменная), который принимает численные значения случайным образом из всех возможных значений.
Дискретные и непрерывные случайные величины Случайная величина называется дискретной, если она принимает строго определенные значения и других значений между ними быть не может.
Случайная величина называется непрерывной, если она может принимать любое значение в заданном интервале.
Генеральная и выборочная совокупности l Совокупность всех значений какогото признака объектов называется генеральной совокупностью. l Выборка – часть генеральной совокупности, взятая для исследования.
Выборка, отражающая свойства генеральной совокупности называется представительной или репрезентативной.
Распределение случайной величины Описание совокупности значений случайной величины с указанием вероятности каждого значения называется законом распределения этой величины.
Способы задания закона распределения случайной величины l Табличный (в виде таблицы с указанием значений случайной величины и их вероятностей или частот. На практике такие таблицы называют вариационные ряды. )
l Графический (в виде графика отражающего закон распределения случайной величины. На практике строят графики – Полигон и Гистограмма).
l Аналитический (в виде формул или специальных параметров, отражающих закон распределения случайной величины. На практике для симметричных распределений определяют величины: математическое ожидание и дисперсия.
Вариационные ряды В результате наблюдений или экспериментов получают данные, которые представляют собой множество расположенных в беспорядке чисел. Такой ряд данных обычно называют статистическим рядом.
Статистический ряд, упорядоченный в порядке возрастания или убывания называется вариационным рядом.
l Виды вариационных рядов: l 1. Сгруппированный дискретный вариационный ряд l 2. Сгруппированный интервальный вариационный ряд
Полигон
Гистограмма
Гистограмма и полигон грубо задают распределение случайной величины. Гистограмма и полигон могут быть построены и для дискретной и для непрерывной случайной величины. На практике чаще для дискретной случайной величины строят полигон, а для непрерывной – гистограмму.
Плотность вероятности плотность вероятности f – это параметр, показывающий, какая вероятность приходится на единицу масштаба измерения любой случайной величины, и который позволяет всегда корректно характеризовать распределение этой случайной величины.
Нормальное распределение случайной величины. Числовые характеристики нормального распределения
Если вид кривой описывается формулой , то распределение случайной величины называется нормальным. Данную функцию называют функцией Гаусса. Графиком нормального распределения является колокол симметричный относительно центра распределения.
Нормальное распределение имеет два признака: l 1. Чем дальше от центра, тем ниже опускаются ветви графика, что свидетельствует о снижении вероятности появления случайной величины, при сильном отклонении ее от центрального значения. l 2. График симметричен относительно центра, что говорит о равных вероятностях появления значений случайной величины как слева от центра, так и справа от него.
l В формулу Гаусса входят две величины, которые являются числовыми характеристиками случайной величины или параметрами случайной величины. От их значения зависит вид графика распределения.
l Первый параметр, обозначаемый как а, называется математическим ожиданием. Он характеризует центр распределения случайной величины. Для нахождения математического ожидания используется формула , l где хi - значение случайной величины – роста, веса и т. д. , pi – вероятность появления значения случайной величины.
l Если учесть, что , l то получим формулу , l из которой видно, что математическое ожидание – это среднее значение случайной величины во всей ее генеральной совокупности.
l Другой числовой характеристикой случайной величины является дисперсия, обозначаемая буквой D или σ2 (D=σ2).
l где N объем генеральной совокупности. Эта величина отражает меру рассеяния значений случайной величины возле центра распределения.
l Корень квадратный из дисперсии называется средним квадратичным отклонением (С. К. О. ) или стандартным отклонением и обозначается буквой σ ( ), тогда
f(x) σ1 σ2 σ3 a x
Теория оценок в математической статистике
Точечные оценки параметров генеральной совокупности по выборкам Оценка среднего для генеральной совокупности (т. е. математического ожидания), вычисленная по выборке, называется выборочным средним.
Выборочное среднее обозначают и вычисляют по формуле: где n — объем выборки.
Оценка стандартного отклонения называется выборочным стандартным отклонением Sx и определяется следующим образом: Т. е. Sx точнее соответствует σ, если в знаменателе стоит не n, а n – 1. Приближенно можно считать
Выборочное стандартное отклонение в квадрате – это выборочная дисперсия Dx. Т. е. Dx≈D
Понятие стандартной ошибки l стандартная ошибка среднего – позволяет оценить точность, с которой выборочное среднее характеризует значение среднего всей генеральной совокупности.
носит название стандартной ошибки среднего.
Интервальные оценки параметров генеральной совокупности
l Интервальной оценкой СВ называется множество точечных оценок, которые накрывают неизвестный параметр.
интервал расположен симметрично относительно центра нормального распределения, так что влево и вправо от а взяты одинаковые отрезки ∆x (см. рис. ), то ширина интервала будет 2∆x.
Функция Лапласа l Для решения задачи интервального оценивания перейдем от переменной x к переменной t в функции Гаусса.
Используя параметр t, можно произвести замену переменной в функции Гаусса
график сдвигается в начало координат в точку с координатой t=0 с границами интервала – t и + t f(t) 0 -t t +t
Тогда для нахождения вероятности попадания значения СВ в интервал от –t до +t, проинтегрируем функцию плотности вероятности в данных пределах
Учитывая симметричность интервала, найдем площадь от 0 до t и умножим на два
Подставим в данное выражение функцию Гаусса
Значения данного интеграла для разных t вычислил Лаплас и представил их в виде таблицы. Эту таблицу можно найти в любом математическом справочнике (см. Табл. 1). Поскольку значения этого интеграла зависят от величины верхнего предела t, то интеграл от функции Гаусса стали называть функцией Лапласа и обозначать как
Таблица значений функции Лапласа Ф(t) =
l Таким образом, вероятность нахождения неизвестного значения оцениваемого параметра генеральной совокупности можно найти по формуле: Р=2 Ф(t).
Интервальные оценки математического ожидания нормального распределения при известном σ
Варианты задачи интервального оценивания при известном σ
Вариант 1 l Пусть необходимо найти доверительный интервал х в котором заключено отдельное значение некоторого параметра, для заданной доверительной вероятности Р, если стандартное отклонение σ известно. l По заданной вероятности, следует найти функцию Лапласа Ф(t)=Р/2 (вероятность нужно выражать не в процентах, а в виде десятичного числа: 0, 95; 0, 90 и т. д. ). l По таблице Лапласа для данного значения Ф(t) выбирается t. l Определить полуширину доверительного интервала по формуле: l l Определить границы доверительного интервала: l xл= a – х, xп= a + х.
Вариант 2 l Пусть необходимо найти доверительную вероятность Р того, что отдельное значение некоторого параметра заключено в доверительном интервале х , при известном значении σ. l По известному значению х определить параметр t по формуле: l l По таблице Лапласа для данного значения t выбирается Ф(t). l Определить доверительную вероятность по формуле: Р=2 Ф(t).


