ЛЕКЦИЯ 1 Случайная величина и выборка

ЛЕКЦИЯ 1 • Случайная величина и выборка • Определение и свойства функции распределения. • Выборочная функция распределения. • Определение и свойства плотности распределения. • Гистограмма. 1

Цель и задачи дисциплины 1. Дисциплина «Программные статистические комплексы» (ОПД. Ф. 06) относится к циклу общепрофессиональных дисциплин. Целью изучения дисциплины является подготовка студентов к выполнению обязанностей инженера по качеству и инженера по стандартизации в следующих видах профессиональной деятельности: организационно-управленческой; производственнотехнологической; научно-исследовательской и проектной. Задачи дисциплины: изучить современные программные статистические комплексы, применяемые для оценки качества изделий. 2

Требования к уровню освоения содержания дисциплины В результате изучения дисциплины студент должен иметь представление: • о современных программных статистических комплексах; • об их математическом и алгоритмическом обеспечении; знать и уметь использовать: • пакет анализа MS Excel для оценки постоянных и переменных величин, проведения дисперсионного и регрессионного анализа; • систему STATISTICA для анализа данных, построения контрольных карт, экспериментальных исследований связей между двумя переменными. 3

ВАРИАНТ 1 ВАРИАНТ 2 Определение и свойства функции распределения случайной величины Определение и свойства плотности распределения случайной величины Определение математического ожидания случайной величины Определение дисперсии случайной величины Свойства нормального распределения Как записывается интегральная функция нормального распределения? 4

Данные для математической статистики • количественные переменные являются числовыми, могут быть упорядочены и для них имеют смысл различные вычисления (например, среднее значение); • номинальные переменные (например: пол, вид, цвет) являются нечисловыми, они означают принадлежность к некоторым классам и не могут быть упорядочены или непосредственно использованы в вычислениях; • ранговые переменные занимают промежуточное положение: их значения упорядочены (например: состояние больного, степень предпочтения), но не могут быть с уверенностью измерены и сопоставлены количественно. Ранговые и номинальные значения при вводе данных следует обозначать целыми числами. 5

Порядковая статистика пример (дебит скважины м 3/сут. ) Случайная величина X Вариационный ряд: Выборка: x 1*= 115 Опыт 1 x 1= 135 x 2*= 125 Опыт 2 x 2= 125 Опыт 3 x 3= 145 Опыт 4 x 4= 155 Опыт 5 x 5= 115 ………………. . . Опыт n xn= 125 x 3*= 125 x 4*= 135 …. . . xn*= 155 6

ИНТЕГРАЛЬНАЯ ФУНКЦИЯ РАСПРЕДЕЛЕНИЯ НЕПРЕРЫВНОЙ СВ F(x) = P(X< x) 7

Свойства функции распределения • неубывающая; • F(- )=0 (невозможное событие); • F(+ )=1(достоверное событие). 8

Вероятность попадания случайной величины на заданный интервал F(x) = P(X <x) F( )-F( ) 9

Вероятность попадания случайной величины на заданный интервал P( Х < )=F( )-F( ) Вероятность попадания случайной величины на заданный интервал равна приращению функции распределения на этом интервале. 10

Описательная статистика (descriptive statistics) Выборочная (эмпирическая) функция распределения вариационный ряд из выборки: Х 1……Хn ® X(1)<X(2)<……<X(n) , Fn(x)=P*(Xi<x) P*- частота 1 mi/n х X (1) X(2) X(3) mi - число данных, меньших X(i) n - общее число данных 11

Пример: построение выборочной функции распределения размера обуви студентов 12

ПЛОТНОСТЬ РАСПРЕДЕЛЕНИЯ Плотность распределения p(x)=F/(x) F(x)= p(t)dt 13

Вероятность попадания случайной величины на заданный интервал ее значений от до -элемент вероятности P( <Х< )= p(x)dx 14

Свойства плотности 1) площадь под кривой=1 (т. к. сумма вероятностей несовместных событий = 1); 2) всегда лежит выше оси абсцисс, т. к. F(x) неубывающая. 15

Частотное распределение x 1*= 115 x 2*= 125 x 3*= 125 x 4*= 135 …. . . xn*= 155 1/n x 1* xср x xn* 16

Частотное распределение p(x) Плотность распределения x 1* xср x xn* Частота результата опыта pi = mi/n 17

ГИСТОГРАММА(Histogram)– ЭМПИРИЧЕСКАЯ ПЛОТНОСТЬ РАСПРЕДЕЛЕНИЯ диапазон выборочных значений разбивается на некоторое число равных интервалов и подсчитывается число значений, попадающих в каждый интервал 18

Алгоритм построения гистограммы 1) Вычисляется размах x max-xmin. 2)Вычисляется число интервалов группирования: k = 1+3. 32*log 10 n n-длина выборки При этом 20 k 6, т. е. , если число интервалов в результате расчета больше 20, то принимается число 20, а если меньше 6, то 6. 3)Вычисляется длина интервала группирования d= (x max-xmin)/k 4)Устанавливается правило для значений, попадающих на границу (относить вправо или влево). 19

Алгоритм построения гистограммы В Excel - СЕРВИС->АНАЛИЗ ДАННЫХ-> ГИСТОГРАММА 20

Литература • Н. В. Макарова В. Я. Трофимец. Статистика в Excel М. Финансы и статистика 2002. • Гусейнзаде М. А. , Калинина Э. В. , Добкина М. Б. Методы математической статистики в нефтяной и газовой промышленности • В. Боровиков. STATISTICA искусство анализа данных на компьютере. Питер. 2003. 21

ВОПРОСЫ К СЕМИНАРУ 1)Чему равна вероятность попадания случайной величины в интервал от x 1 до x 2? (приведите два способа вычисления) 2) Как строится выборочная функция распределения? 3)Что означает число один для функции и плотности распределения? 4)По каким формулам вычисляется интервал группирования данных при построении гистограммы? 5)Чему будет соответствовать гистограмма распределения при бесконечно большом числе опытов? 22