Л2. Случайные величины.ppt
- Количество слайдов: 51
Лекция 2. Случайные величины. Основные вопросы, рассматриваемые в лекции 1. Основные понятия. Термины. Классификация 2. Числовые характеристики случайной величины 3 Законы распределения случайных величин. Параметры распределения 4. Многомерные случайные величины 4. Корреляционная зависимость 1
1. Основные понятия. Термины. Классификация Случайная величина (далее СВ)- величина, численное значение которой зависит от результата стохастического эксперимента. Примеры случайных величин: • - оценка на экзамене -положительное число (от 2 до 5); • - продолжительность работы телевизора до выхода из строя любое неотрицательное число. Случайные величины обозначают заглавными греческими ( , , ) или латинскими (X, Y, Z) буквами , а их возможные значения – соответствующими прописными буквами (x, y, z). Случайные величины делятся на две большие группы – дискретные СВ и непрерывные СВ. Дискретная СВ - величина, возможные значения которой образуют конечное или бесконечное счётное множество. На числовой оси представляются точками. Непрерывные СВ задаются на всей числовой оси или на заданном интервале или отрезке 2
Две СВ могут иметь одинаковые возможные значения, но принимать их с различными вероятностями. Например, результаты экзамена, который сдают разные студенты. Значения оценок, СВ принадлежат множеству {2, 3, 4, 5), но вероятность оценки для каждого студента разная. Поэтому необходимо знать как возможные значения СВ, так и вероятности, с которыми она может их принять. Для дискретной СВ зависимость между случайной величиной и вероятностью, с которой она может принять это значение называют законом распределения. Для непрерывной СВ эту зависимость называют плотностью распределения (функция f(x)). В любом случае справедливо правило нормировки Дискретная СВ Непрерывная СВ Наряду с законом распределения (плотностью распределения), случайные величины описываются при помощи функции распределения F(x) 3
Дискретные случайные величины Закон распределения дискретной случайной величины может быть задан графически, аналитически или таблично. Пример 1. Абитуриент сдаёт два вступительных экзамена: по математике и физике. Составить закон распределения случайной величины , числа полученных пятёрок, если вероятность получения пятёрки по математике равна 0. 8, а по физике – 0. 6. Пусть А 1 –событие, математика сдана на отлично; А 2 – физика сдана на отлично. События независимы и совместны. Решение. Очевидно, возможные значения есть 0, 1, 2, а их вероятности соответственно равны. • Полученные данные занесем в таблицу, которая задает закон распределения дискретной СВ – числа полученных пятерок 0 1 2 p 0. 08 0. 44 0. 48 • • . 4
Функция распределения F(x) случайной величины равна вероятности того, что случайная величина примет значение, меньшее х Функцию распределения F(x) дискретной случайной величины можно задать аналитически, графически, таблично. При известном законе распределения функция распределения дискретной случайной величины имеет вид где (хi<х) означает, что суммирование ведётся по всем индексам i, для которых это неравенство выполняется. Функция распределения дискретной случайной величины ступенчатая. Сохраняет постоянное значение на каждом интервале и терпит в точках хi разрыв (скачок), равный рi. . Функция распределения примера 1 p 0 1 2 0. 08 0. 44 0. 48 F(x) < хi 0 0. 08 0. 52 F(x) x>2 =1 5
• График функции распределения примера 1 Функция распределения дискретной случайной величины ступенчатая, изменяется от 0 до 1. Сохраняет постоянное значение на каждом интервале и терпит в точках хi разрыв (скачок), равный рi. . 6
Непрерывные случайные величины Случайная величина примера 1 являются дискретной, имеет фиксированные значения на числовой оси. Ее мы описали при помощи закона распределения и функции распределения. Во многих экспериментах случайные величины являются непрерывными, на интервале или на всей числовой оси Непрерывная случайная величина задается двумя зависимостями: 1. Функцией распределения. функция распределений сохраняет свой смысл: F(x)=p(
• Свойства функции распределения F(x) • 1. Функция распределения F(x) определена на всей числовой оси и ее область значений равна [0, 1]: • 2. F(x) – неубывающая функция, то есть для x 1 x 2 • Событие <- невозможное и его вероятность равна 0, а событие <+ достоверно и его вероятность равна 1 • 3. Вероятность попадания случайной величины в интервал [x 1, x 2] равна приращению функции распределения на этом интервале: 8
• Свойства плотности вероятности f(x) • 1. Плотность вероятности f(x)– неотрицательная функция. Это следует из того, что функция распределения – неубывающая, и поэтому ее производная (плотность вероятности) больше или равна нулю. • 2. Вероятность попадания случайной величины в интервал [x 1, x 2] равна интегралу от плотности вероятности по этому интервалу • 3. Определенный интеграл от плотности по всей числовой оси равен единице (условие нормировки). • Это утверждение означает, что площадь фигуры, ограниченной графиком f(x) и осью OX, равна единице. 9
• Пример 2. Найдем плотность распределения случайной величины f(x), если задана функция распределения F(x). Построим графики этих функция. 10
3. Числовые характеристики случайной величины • • • Случайная величина полностью определяется своим законом распределения, но для многих задач эта информация бывает излишней. С другой стороны, на практике часто закон распределения не известен и приходится довольствоваться меньшими сведениями. В таких случаях пользуются некоторыми суммарными числовыми характеристиками случайной величины. К важнейшим из них относятся математическое ожидание, дисперсия и среднеквадратическое отклонение, СКО. 1. Математическим ожиданием дискретной случайной величины называют сумму произведений всех ее возможных значений на их вероятности: Математическим ожиданием непрерывной случайной величины называют интеграл 11
Математическое ожидание - среднее значение, вокруг которого распределены все возможные значения СВ Существуют различные аналогии этого термина. В механике каждому возможному значению СВ (координате на оси х) приписывают массу, имеющую вероятностный смысл. В этом случае математическое ожидание является аналогом понятия центра масс или момента, то есть, является тем средним центральным значением, вокруг которого распределены все возможные значения случайной величины. В теории вероятностей по аналогии с механикой математическое ожидание называют начальным моментом первого порядка и обозначают m 1. 12
Свойства математического ожидания 1. Математическое ожидание постоянной равно самой постоянной 2. Постоянный множитель можно выносить за знак математического ожидания 3. Математическое ожидание суммы конечного числа случайных величин равно сумме математических ожиданий слагаемых 4. Математическое ожидание произведения конечного числа независимых в совокупности случайных величин равно произведению математических ожиданий сомножителей Знание только среднего значения (математического ожидания) СВ чаще всего недостаточно. Необходимо иметь количественную характеристику разброса возможных значений случайной величины относительно математического ожидания, знания о форме распределения 13
• Пример 3. Закон распределения дискретной случайной величины задан таблично (пример 1): p 0 1 2 0. 08 0. 44 0. 48 • Найти математическое ожидание. • Решение. По определению получаем • Пример 4. Задана плотность вероятности случайной величины (пример 2). • Найти математическое ожидание. • Решение. Воспользуемся определением математического ожидания и разобьем интеграл по всей оси на три, учитывая, что на крайних интервалах плотность вероятности равна нулю. 14
Пример 5. Задача о двух стрелках Известны законы распределения случайных величин X и Y , числа очков выбиваемых двумя стрелками. Определить, кто стреляет лучше. Для этого определим математическое ожидание (среднее значение) СВ X и Y Первый стрелок, X, Математическое ожидание = 5, 36 xi 0 1 2 3 4 5 6 7 8 9 10 pi 0, 15 0, 11 0, 04 0, 05 0, 04 0, 10 0. 04 0, 05 0. 12 0, 20 Второй стрелок, yi 0 pi 0. 01 Y Математическое ожидание = 5, 36 1 2 3 4 5 6 7 8 9 10 0, 03 0, 05 0, 09 0, 11 0, 24 0, 21 0, 10 0, 04 0, 02 Вывод – в среднем стрелки стреляют одинаково 15
2. Дисперсия случайной величины Рассмотрим СВ , возможные значения которой равны разности ξ-m 1. Здесь m 1 - математическое ожидание СВ ξ. Математическое ожидание квадрата разности отклонения случайной величины от ее математического ожидания называют дисперсией случайной величины: • Дисперсия дискретной случайной величины • Дисперсия непрерывной случайной величины 16
Свойства дисперсии 1. Дисперсия постоянной равна нулю D(C)=0. 2. Постоянный множитель можно выносить за знак дисперсии, возведя его в квадрат D(Cξ)=C 2 D(ξ). 3. Дисперсия алгебраической суммы конечного числа независимых в совокупности случайных величин равна алгебраической сумме дисперсий слагаемых 3. Среднеквадратическое отклонение Размерность дисперсии СВ равна квадрату размерности самой случайной величины, поэтому удобнее пользоваться корнем из дисперсии. Эта характеристика имеет ту же размерность, что и сама случайная величина, и ее называют среднеквадратическим отклонением, СКО Из свойств дисперсии следуют свойства СКО 17
9. 3 Некоторые законы распределения и их числовые характеристики • Биномиальное распределение К этому распределению приводит схема Бернулли. Пусть производится n независимых, однородных испытаний, в каждом из которых событие A может произойти с вероятностью p(A)=p, а противоположное ему – с вероятностью Рассмотрим дискретную случайную величину , равную числу появлений события A при n испытаниях. Возможными значениями являются все целые числа от 0 до n, а вероятность того, что примет значение m, определяется формулой Бернулли • Математическое ожидание и дисперсия случайной величины, имеющей биномиальное распределение, равны: 18
Распределение Пуассона –закон редких событий Дискретная случайная величина называется распределенной по закону Пуассона, если ее возможными значениями являются целые неотрицательные числа, а вероятность того, что случайная величина примет значение m, определяется формулой Пуассона К этому закону можно прийти от биномиального, если устремить вероятность р к нулю, принять , что Числовые характеристики: 19
• Равномерное распределение Случайную величину называют равномерно распределенной на интервале [a, b], если ее плотность вероятности равна некоторой константе на этом интервале и нулю вне его. Пример 2 - частный случай равномерного распределения для интервала [0, 2]. Расчетные соотношения для общего случая приведены на рис. 8. Равномерное распределение используется в анализе ошибок округления 20
• Показательное распределение • Непрерывная случайная величина имеет показательное распределение, если ее плотность вероятности имеет вид • Функция распределения и числовые характеристики 21
• Нормальное распределение (Гаусса) - Играет особую роль в теории вероятностей и ее приложениях. Наиболее часто встречающийся закон распределения. Нормальному закону подчиняется, при соблюдении определенных условий, распределение суммы достаточно большого числа случайных величин, каждая из которых может иметь произвольное распределение. - Нормальное распределение задается параметрами: математическим ожиданием m и среднеквадратическим отклонением • Плотность вероятности f(X): σ Функция вероятности F(x) 22
- Изменение m приводит к параллельному переносу графика плотности вероятности вдоль оси OX. - Изменение параметра σ приводит тому, что при уменьшении σ возрастает максимальное значение плотности вероятности и график становится уже, при возрастании σ график ниже и шире. При этом площадь фигуры, ограниченная графиком плотности вероятности и осью OX, в силу условия нормировки, равна 1. 23
Интеграл от плотности вероятности нормального распределения не имеет точного представления через элементарные функции. Поэтому функция распределения выражается через функцию Лапласа Φ(x), значения которой можно найти из таблиц Применяя функцию Лапласа можно вычислить вероятность попадания СВ в заданный интервал Воспользуемся этим соотношением и получим так называемое вероятность попадания случайной величины в интервал +- 3 (правило трех . ) Для этого найдем 24
• Полученный результат говорит о том, что практически достоверно то, что нормально распределенная величина примет значение, отличающееся от ее математического ожидания по модулю не более чем на 3 , или практически невозможно появления значения, выходящего за пределы этого интервала. • Последнее обстоятельство находит широкое применение в практических приложениях. 25
• Стандартное нормальное распределение • Как было сказано, нормальное распределение задается математическим ожиданием m, среднеквадратическим отклонением σ и дисперсией D = σ2. При нормировке • Плотность вероятности f(z) : • Математическое ожидание и дисперсия равны: Функция вероятности F(z) 26
• График плотности вероятности стандартного нормального распределения (красным цветом) представлен ниже. Можно увидеть, что максимальное значение равно 0. 4, среднеквадратическое отклонение равно 1, значения случайной величины за пределами (- 3 , 3 ) практически отсутствуют 27
Другие непрерывные распределения В ТВ и в МС широкое применение нашли следующие законы распределения: 1. Показательный (экспоненциальный) закон 2. Логарифмически-нормальное распределение (логнормальное распределение) 3. Распределение Пирсона (хи-квадрат) 4. Распределение Стъюдента, t - распределение 5. Распределение Фишера, F распределение Анализ графиков f (x) (плотности распределения) этих законов говорит о том, что все перечисленные , (кроме t), распределения, являются несимметричными. Распределение Стъюдента симметрично, но ниже и шире нормального закона распределения. Эти обстоятельства привели к появлению других числовых мер оценки случайных величин 28
Мода, медиана, математическое ожидание – меры положения случайной величины Мода СВ, Мо(Х) – наиболее вероятное ее значение, при котором f(x) достигает максимума Медиана Ме(Х) – такое значение Х, для которого P(Х< Ме(Х) ) = P(Х> Ме(Х) ) = 0. 5. Очевидно, F (Me (X) ) = 0. 5 Очевидно, что вертикальная прямая х= Ме(Х) делит площадь под прямой f(x) на две равные части Математическое ожидание М(Х) –первый начальный момент m 1 - среднее значение, центр распределения случайной величины Для симметричного распределения все три параметра совпадают 29
Меры формы. Эксцесс Е является мерой крутости вершины. Эксцесс теоретического распределения определяется по формуле Для нормального распределения эксцесс равен нулю. Знак параметра показан на рисунке 30
Меры формы. Асимметрия А Асимметрией теоретического распределения называют отношение центрального момента третьего порядка к кубу среднеквадратического отклонения: А=0 симметрия плотности распределения f(x). Знак As определяют по кривой распределения f(x) относительно моды если «длинная часть» кривой расположена правее моды, то асимметрия положительна (рис. 10, а), если слева — отрицательна (рис. 10, б). 31
4. Многомерные случайные величины Систему из конечного числа случайных величин называют nмерной случайной величиной. Так, заказывая партию костюмов, торговая фирма должна иметь некоторую информацию о распределении у потенциальных покупателей хотя бы двух случайных параметров - размера и роста. В дискретном случае возможные значения двумерной случайной величины ( , ) можно рассматривать как координаты случайной точки на плоскости - (хi, уj). Чтобы задать случайную величину, надо указать перечень возможных значений и вероятности того, что компоненты и примут значения xi и yj соответственно. 32
• Как и в одномерном случае, это можно сделать в виде таблицы или аналитически: x 1 … xn y 1 p 11 … p 1 n … … ym pm 1 … pmn • Условие нормировки • Функция распределения • Значение функции распределения в точке (х, у) равно вероятности того, что случайная точка с координатами ( , ) попадёт в квадрант с вершиной в точке (х, у). 33
Свойства функция распределения двумерной случайной величины: 1. 2. F(х, у) - функция, не убывающая по каждому аргументу. 3. 4. Обозначим одномерные функции распределения компонент и двумерной случайной величины соответственно Fξ(x) и Fη(y), тогда 5. Вероятность попадания случайной точки в прямоугольник равна Компоненты двумерной случайной величины и независимыми, если 34
Если функция распределения F(x, y) имеет смешанную частную производную второго порядка, то ее называют плотностью вероятности двумерной случайной величины: Свойства функции f(x, y): 1. 2. 3. Следствие 4. Плотности вероятностей fξ(x) и fη(x) компонент и 35
Функциональная, корреляционная, статистическая зависимости между случайными величинами 1. Функциональная зависимость – каждому значению одной переменной соответствует определенное значение другой 2. Корреляционная зависимость – функциональная зависимость между одной из них и условным математическим ожиданием другой Корреляционная зависимость может быть представлена в виде уравнение регрессии Y по X (*) уравнение регрессии X по Y (**) Статистические связи между переменными можно изучать методами корреляционного и регрессионного анализа. Основная задача корреляционного анализа – выявление связи между случайными величинами и оценка их тесноты. Основная задача регрессионного анализа – установление формы зависимости между переменными 3. Статистическая (стохастическая) зависимость – зависимость между одной из переменных и условным распределением другой 36
5. Корреляционная зависимость двумерной случайной величины Двумерная случайная величина ( , ) задана плотностью вероятности f(x, y). Математическое ожидание произведения отклонений компонент от их математических ожиданий можно вычислить по формуле В общем случае математическое ожидание произведения не равно произведению математических ожиданий сомножителей, то есть полученная разность не равна нулю. Величину этой разности называют ковариацией случайных величин и и обозначают. Очевидно, для независимых случайных величин и Дисперсию суммы (разности ) компонент двумерной случайной величины вычисляют по формуле. Очевидно, что дисперсия суммы (разности) двух независимых случайных величин равна сумме их дисперсий 37
5. Элементы корреляционного анализа Исходные данные эксперимента сначала заносятся в так называемую корреляционную таблицу. Для большей наглядности данные изображаются графически, строится поле корреляции, по которому качественно можно судить о наличии корреляционной связи между переменными. Приняв ось абсцисс за х, а ось ординат - за у, наносят точки (xi, yi) По виду полученной корреляционной диаграммы судят о наличии или отсутствии корреляционной связи 38
5. Элементы корреляционного анализа Исходные данные эксперимента сначала заносятся в так называемую корреляционную таблицу. В результате обработки вычисляются групповые средние Для большей наглядности данные изображаются графически, строится поле корреляции, по которому качественно можно судить о наличии корреляционной связи между переменными. Для оценки тесноты линейной связи вычисляется выборочный коэффициент корреляции r. Коэффициент корреляции может быть вычислен : а) через ковариацию и среднеквадратические отклонения б)через коэффициенты регрессии и среднеквадратические отклонения 39
Коэффициент корреляции является безразмерной характеристикой Свойства коэффициента корреляции 1. Коэффициент корреляции меняется в границах -1 <= r <= 1 - r = 0 - необходимое, но недостаточное условие независимости двух СВ. В этом случае говорят, что СВ и не коррелированны • - если коэффициент корреляции r отличен от нуля и при этом по модулю меньше единицы • то компоненты двумерной случайной величины корреляционно зависимы. - если коэффициент корреляции по модулю равен единице то между случайными величинами X и Y имеется функциональная зависимость, т. е. каждому значению одной компоненты соответствует вполне определённое значение другой. 40
Коэффициент корреляции Ковариация cov(ξ, η) является размерной величиной (её размерность совпадает с размерностью произведения случайных величин), поэтому вводится безразмерная характеристика, которую называют коэффициентом корреляции Свойства коэффициента корреляции 1. Для независимых случайных величин . 2. Для зависимых случайных величин Равенство нулю коэффициента корреляции является необходимым но не достаточным условием независимости двух случайных величин. Из не следует независимость и . В этом случае говорят, что и не коррелированны. 3. Коэффициент корреляции по модулю не превосходит единицы 4. Если то между и имеется функциональная зависимость. 41
Подчеркнем еще раз свойства коэффициента корреляции 1. Коэффициент корреляции меняется в границах -1 <= r <= 1 2. r = 0 - необходимое, но недостаточное условие независимости двух СВ. В этом случае говорят, что СВ и не коррелированны 3. Если коэффициент корреляции r отличен от нуля и при этом , • то компоненты двумерной случайной величины корреляционно зависимы. 4. Если коэффициент корреляции по модулю равен единице, то тогда и только тогда между и имеется функциональная зависимость. Функциональная зависимость между двумя переменными наблюдается только тогда, когда каждому значению одной компоненты соответствует вполне определённое значение другой. 42
Элементы регрессионного анализа Связь между условным математическим ожиданием одной из компонент, например =х при заданном значении другой компоненты =у, (или компоненты , при заданном значении =х ) является функцией СВ =у величины на величину и обозначается • • • Условное математическое ожидание M(ξ|η=y) является некоторой функцией от значения случайной величины =у и, следовательно, так же является случайной величиной. Эта функция называется и называется функцией регрессии величины на величину Аналогично определяется функция регрессии величины на величину 43
Элементы регрессионного анализа Как было сказано выше (слайд 36), между одной из переменных и условным математическим ожиданием другой может существовать функциональная зависимость или Зависимости эти могут быть линейными или нелинейными Особый интерес представляет линейная парная регрессия Выборочное уравнение линейной регрессии Y по X может быть записано yx =b 0 + b 1 x или Коэффициент регрессии Y по X b 1 (byx) показывает , на сколько единиц в среднем изменяется переменная Y при увеличении переменной X на одну единицу Для вычисления коэффициентов b 0 и квадратов b 1 применяется метод наименьших 44
• • • Графики этих функций называются линиями регрессии соответственно на и на (рис. 13). Вид функций регрессии определяет характер корреляционной зависимости случайных величин и . Наиболее простым случаем является линейная регрессия, имеющая самостоятельное значение и служащая первым приближением в более сложных ситуациях. В случае линейной регрессии, линии регрессии на прямые (в общем случае различные), а функции регрессии линейные. Уравнения прямых регрессии на соответственно имеют вид 45
Элементы регрессионного анализа В случае линейной модели графики функций , являются прямыми линиями и могут быть описаны через коэффициент регрессии, математические ожидания и СКО В случае парной линейной регрессии уравнение регрессии yx = b 0 +b 1 x задается в стандартном формате Коэффициенты b 0 и b 1(выборочный коэффициент регрессии ) вычисляются методом наименьших квадратов. Суть метода заключается в том, чтобы сумма квадратов отклонений эмпирических средних от значений yx , найденных по уравнению регрессии , была минимальной 46
6. Сглаживание экспериментальных зависимостей методом наименьших квадратов. Задача 5 по ТВ В рассматриваемом примере уравнение регрессии записано в виде y = ax +b. Здесь a – выборочный коэффициент регрессии Для определения параметров а и Ь применяют метод наименьших квадратов, согласно которому минимизируется суммарное квадратическое отклонение экспериментальных данных от выбранной сглаживающей функции. Следовательно, нужно найти минимум суммы: • Задача сводится к решению системы уравнений 47
• • Пример. Проведена серия опытов, результат заносится в таблицу ( на слайде – первые три столбца). Требуется по методу наименьших квадратов подобрать линейную функцию, выражающую у через х. Решение. Искомые величины связаны линейной зависимостью: у=ах+Ь, коэффициенты которой и требуется определить. Сумма квадратов невязок равна: • Система нормальных уравнений • • 48
i xi yi xi 2 yi 2 xiyi 1 0, 342 2, 10 0, 1170 4, 41 0, 718 2 0, 417 4, 70 0, 1739 22, 09 1, 960 3 0, 675 6, 05 0, 4556 36, 60 4, 084 4 0, 867 8, 65 0, 7517 74, 82 7, 500 5 1, 000 10, 00 1, 0000 100, 00 10, 000 6 1, 158 12, 60 1, 3410 158, 76 14, 591 7 1, 283 12, 08 1, 6461 145, 93 15, 499 8 1, 500 14, 68 2, 2500 215, 50 22, 020 9 1, 733 16, 65 3, 0033 277, 22 28, 854 10 2, 008 19, 25 4, 0321 370, 56 38, 654 11 2, 083 19, 98 4, 3389 399, 20 41, 618 12 2, 242 23, 20 5, 0266 538, 24 52, 014 13 2, 508 23, 93 6, 2901 572, 64 60, 016 1, 370 13, 37 224, 31 22, 887 2, 3405 49
• • Пример. Проведена серия опытов, результат заносится в таблицу ( на слайде – первые три столбца). Требуется по методу наименьших квадратов подобрать линейную функцию, выражающую у через х. Решение. Искомые величины связаны линейной зависимостью: у=ах+Ь, коэффициенты которой и требуется определить. Сумма квадратов невязок равна: • Система нормальных уравнений • • 50
• Раскрывая скобки и группируя, в результате получим следующую систему двух линейных уравнений для определения коэффициентов а и Ь: • Решая эту систему, получим: а=9. 86; Ь=-0. 14 y=9. 89 x-0. 14 51


