Теоретические распределения случайных величин Зачем Теоретические распределения часто

Скачать презентацию Теоретические распределения случайных величин Зачем Теоретические распределения часто

Лекция 4_Теор_ распределения_непрерывн.ppt

Количество слайдов: 48

Теоретические распределения случайных величин Зачем? Теоретические распределения часто (но не всегда, а только если удастся обосновать возможность их использования) позволяют генерировать последовательности данных, обладающих примерно теми же свойствами, что и факторы, имеющие место в действительности. В каких задачах это требуется? Основной потребитель – задачи принятия решений «на будущее» : если создается проект нового объекта или если принимается решение на предстоящий период времени, то для обоснования решений нужно поместить модель решаемой задачи в виртуальную среду, имитирующую реальность (в том числе имитирующую случайные факторы – например: аварии оборудования, колебания качества сырья, изменения условий эксплуатации, качество технического обслуживания, периодичность ремонтов… ) Какие задачи должны быть решены? (тема лекции) 1. Нужно иметь библиотеку теоретических распределений, для которых известен опыт их успешного использования и область задач, для которых они полезны и уметь выбрать подходящее (соответствующее имеющимся экспериментальным данным). 2. Если подобрать теоретическое распределение не удается – уметь построить «своё» теоретическое распределение по экспериментальным данным. 3. Нужно обладать аппаратом, позволяющим генерировать случайные величины, подчиняющиеся выбранному или сконструированному самостоятельно теоретическому распределению. 4. Нужно доказать, что подмена реальности теоретическим распределением корректна.

Библиотека теоретических распределений случайных величин Непрерывные распределения (т. е. распределения величин, принимающих непрерывные (не квантованные) значения) Дискретные распределения (т. е. распределения величин, принимающих значения, квантованные по уровню сигнала) Непрерывные распределения (формулы, статистические характеристики, область применения) 1. Нормальное распределение (иначе - распределение Гаусса) 2. Логарифмическое нормальное распределение (сокращенно – логнормальное распределение) (входят в группу нормальных распределений) 3. Распределение 2 4. Распределение Стьюдента (иначе – t-распределение) 5. Распределение Фишера (иначе – f-распределение) 6. Экспоненциальное распределение (входят в группу 7. Распределение Вейбулла - Гнеденко. гаммараспределений) 8. Равномерное распределение Имеется большое число других распределений – Коши, Парето, Колмогорова, гамма- распределение…

Непрерывные распределения, продолжение 1. Нормальное распределение (иначе - распределение Гаусса) Пример: путь проводится эксперимент по исследованию погрешности прибора (путем сравнения его показаний с эталонным прибором). Получим: Мы видим, что большинство измерений сосредоточились в окрестности среднего значения. Имеется зона, выход за пределы которой происходит сравнительно редко. Имеются и очень редкие выбросы, выходящие за пределы этой зоны. Построим гистограмму (в частостях, т. е. укажем долю каждого значения погрешности в общем количестве измерений): Получим изображение, обладающее симметрией: количество измерений с погрешностью, превышающей среднее значение, примерно равно количеству измерений с погрешностью меньше средней; наибольшее количество измерений (мода) соответствует среднему числу измерений; большие отклонения от среднего значения в обе стороны невелики; чем дальше удалены значения погрешности от среднего, тем меньше их количество.

Непрерывные распределения, продолжение 1. Нормальное распределение (иначе - распределение Гаусса), продолжение Приведенный пример иллюстрирует следующие общие свойства ЭД: 1. В ЭД объективно присутствует сильная тенденция группироваться вокруг центра; 2. Положительные и отрицательные отклонения от центра равновероятны; 3. Частота отклонений быстро падает, когда отклонения от центра становятся большими; 4. Отклонения от центра объясняются множеством факторов, в числе которых нет превалирующих (т. е. оказывающих влияние существенно сильнее других); действие факторов на результат аддитивно (т. е. влияния факторов суммируются ) Если ЭД обладают такими свойствами, то для описания их свойств подходит нормальное распределение (доказательство – в Центральной предельной теореме) Пусть наблюдения X 1, X 2, …, Xn принадлежат одной и той же генеральной совокупности (поэтому имеют одинаковые математические ожидания m и средние квадратические отклонения ) и являются независимыми друг от друга. Тогда для любого заданного числа x существует предел (отклонение каждого элемента ЭД от математического ожидания) (функция стандартного нормального распределения, т. е. такого, для которого m =0, =1)

Непрерывные распределения, продолжение 1. Нормальное распределение (иначе - распределение Гаусса), продолжение Формула и свойства плотности нормального распределения независимых одинаково распределенных ЭД X 1, X 2, …, Xn с одинаковыми математическими ожиданиями m и средними квадратическими отклонениями ): Функция распределения (интеграл от плотности, показывающий, с какой вероятностью случайная величина меньше заданного x) не вычисляется с помощью элементарных функций; специально введенная функция – интеграл вероятности) (например, вероятность получить значение ЭД меньше 3 равна 0. 5)

Непрерывные распределения, продолжение 1. Нормальное распределение (иначе - распределение Гаусса), продолжение Замечательное свойство нормального распределения, обеспечивающее, в частности, ему широкое распространение в работах теоретического характера: Аналогично можно показать, что выборочная средняя имеет математическое ожидание, равное истинному математическому ожиданию, а Линейная система среднее квадратическое отклонение выборочного Вход – случайный, закон Вопрос: каковым получится закон среднего меньше среднего квадратического распределения нормальный распределения выхода? отклонения ЭД в квадратный корень из числа данных (этот результат мы уже получали ранее, при изучении Ответ: при линейном преобразовании входного сигнала, имеющего нормальное свойств выборочной средней). Выборочная средняя – распределение, результат преобразования также имеет нормальное распределение (в линейное преобразование, поэтому распределена общем случае с другим математическим ожиданием и другим средним квадратическим отклонением). по нормальному закону, если ЭД – независимы, одинаково распределены и имеют нормальное распределение. Пример: пусть имеется два результата опытов X 1 и X 2, для которых известны математические ожидания m 1 и m 2, а также дисперсии 12 и 22. Линейное преобразование: X 1+X 2. Найдем математическое ожидание и среднее квадратическое отклонение суммы X 1+X 2: (это – математическое ожидание суммы) (это – дисперсия; математическое ожидание перекрестного произведения = 0, т. к. предполагается независимость X 1 и X 2)

Непрерывные распределения, продолжение 1. Нормальное распределение (иначе - распределение Гаусса), продолжение Точечные оценки нормального распределения: m 1 < m 2

Непрерывные распределения, продолжение 1. Нормальное распределение (иначе - распределение Гаусса), продолжение Точечные оценки нормального распределения, окончание Медиана равна математическому ожиданию: Me = m (количество данных, превышающих среднее значение, = количеству данных меньше среднего) Мода равна математическому ожиданию: Mо = m (наиболее «модное» значение, т. е. такое, плотность вероятности которого максимальна, равна среднему значению) Асимметрия равна нулю (плотность распределения симметрична относительно прямой, проведенной параллельно оси ординат через абсциссу, равную математическому ожиданию) Эксцесс равен нулю (вернее, принят за нуль: среднее значение 4 -го момента, разделенного на 4 -ю степень среднего квадратического отклонения, равно 3. Поэтому из формулы для оценки эксцесса вычитается 3. Получается, что эксцесс нормального распределения = 0, а эксцессы остальных распределений сравниваются с эксцессом нормального распределения).

Непрерывные распределения, продолжение 1. Нормальное распределение (иначе - распределение Гаусса), окончание Генерация случайных величин, распределенных по нормальному закону, может быть сделана с помощью пакетов Math. CAD (функция rnorm( )) или MS Excel, пакет «Анализ данных» , опция «Генерация случайных величин» ). Здесь покажем общий принцип генерации случайных величин, пригодных для использования не только когда теоретическое распределение известно, но и если теоретическое распределение «самодельное» , не относящееся к известным (это – метод обратной функции, подробно излагаемый в дисциплине «Моделирование систем» ) Если подать на вход машинные случайные числа (равномерно «освещающие» ординату) и найти соответствующие значения абсцисс, то каждому машинному числу соответствует значение абсциссы, которое можно считать экземпляром случайного числа, подчиняющегося данному закону распределения. (в примере показана генерация случайных нормально распределенных чисел: видно «сгущение» вокруг цента и «прореживание» при удалении от него)

Непрерывные распределения, продолжение 2. Логарифмическое нормальное распределение (кратко - логнормальное распределение) Вспомним, что нормальное распределение применимо, если факторы, влияющие на объект, аддитивны (т. е. их действия суммируются). Реальные задачи не всегда обладают таким свойством. Пример 1. Доход = Цена·[Объем продажи]. Факторы входят не аддитивно, а мультипликативно (т. е. в форме произведения) Пример 2. Зарплата = [оплата 1 й детали, руб/шт] ·[производительность труда, шт/ч)·[число часов в месяц, ч/мес]. Факторы также входят мультипликативно. Пусть остальные предположения о применимости нормального закона выполняются. Тогда естественный путь обойти мультипликативность – использовать логарифмирование (т. е. вместо распределения переменных, на которых построены ЭД, будем искать распределение логарифмов этих переменных). Получится логнормальный закон распределения, применимый для ЭД, которые принципиально неотрицательны. Пример 3. Размеры частиц при дроблении материала в шаровых мельницах имеют логнормальное распределение (доказательство принадлежит А. Н. Колмогорову)

Непрерывные распределения, продолжение 2. Логнормальное распределение, продолжение 1. Плотность распределения вероятностей: Логнормальное распределение Нормальное распределение с теми же математическим ожиданием и дисперсией (логнормальное распределение имеет положительную асимметрию и эксцесс) 2. Функция распределения вероятностей: Здесь (интеграл не вычисляется с помощью элементарных функций; введена специальная функция, так называемая функция ошибки, Error. Function, она табулирована и доступна в Math. CAD)

Непрерывные распределения, продолжение 2. Логнормальное распределение, продолжение Точечные оценки логнормального распределения 1. Математическое ожидание = 2. Медиана = Трактовка: среднее значение натурального логарифма ЭД 3. Мода = 4. Дисперсия = Трактовка: дисперсия натурального логарифма ЭД 5. Коэффициент асимметрии = 6. Коэффициент эксцесса = Вид графика ЭД, распределенных по логнормальному закону Для сравнения: ЭД, распределенные по нормальному закону (значения математических ожиданий и дисперсий одинаковы)

Непрерывные распределения, продолжение 3. Распределение 2 (хи-квадрат) Выше мы рассмотрели вопрос о качестве оценки математического ожидания (по величине выборочной средней). В частности, мы показали, что среднее квадратическое отклонение оценки математического ожидания от его истинного значения в раз меньше, чем среднее квадратическое отклонение данных. Естественно задать себе тот же вопрос - о качестве оценки дисперсии по величине выборочной дисперсии (количество данных) (элемент ряда наблюдений) (выборочное среднее) Предварительные замечания: важное понятие «Число степеней свободы» Определение: число степеней свободы у какого-либо параметра определяют числом опытов, по которым рассчитывают данный параметр, минус количество констант, найденных по этим опытам независимо друг от друга Пример: пусть имеются n экспериментальных данных, по которым мы рассчитали выборочную среднюю и выборочную дисперсию. Поскольку вычисление выборочной дисперсии зависит от вычисления выборочной средней, число независимых констант в этом случае равно 1. Число степеней свободы = n 1.

Непрерывные распределения, продолжение 3. Распределение 2 (хи-квадрат) Рассмотрим закон распределения суммы квадратов независимых центрированных случайных значений, одинаково распределенных (т. е. принадлежащих одной и той же генеральной совокупности) по нормальному закону, среднее квадратическое отклонение которых равно 1 (используется общепринятое обозначение нормального закона, в скобках указывается математическое ожидание и среднее квадратическое отклонение, в данном случае N(0, 1) X = X 12 + X 22+…+ Xn 2 (центрирование) Мы видим, что эта формула соответствует формуле для выборочной дисперсии; число степеней свободы для нее, как мы видели выше, равно n – 1 (т. к. на этих же данных была рассчитана оценка математического ожидания, «отнявшая» одну степень свободы) Определение: 2 -распределение с n степенями свободы – это распределение суммы квадратов n независимых стандартных нормальных величин, т. е. имеющих распределение N(0, 1) Плотность распределения вероятностей (найдена К. Пирсоном): Здесь (гамма-функция; одна из специальных функций, т. е. не входящих в число элементарных)

Непрерывные распределения, продолжение 3. Распределение 2 (хи-квадрат), продолжение Плотность 2 распределения вероятностей (найдена К. Пирсоном): Здесь (гамма-функция; одна из специальных функций, т. е. не входящих в число элементарных) Область определения аргумента: x 0 (естественно: квадраты значений неотрицательны) При малом числе степеней свободы 2 - распределение существенно отличается от нормального При малом числе степеней свободы распределение резко асимметрично; при увеличении числа степеней свободы распределение становится всё более симметричным. При увеличении числа степеней свободы 2 - распределение приближается к нормальному (при больших n практически не отличается от нормального)

Непрерывные распределения, продолжение 3. Распределение 2 (хи-квадрат), продолжение Плотность 2 распределения вероятностей (найдена К. Пирсоном): Здесь (гамма-функция; одна из специальных функций, т. е. не входящих в число элементарных) Область определения аргумента: x 0 (естественно: квадраты значений неотрицательны) Функция 2 распределения вероятностей: Здесь (неполная гамма-функция; одна из специальных функций, т. е. не входящих в число элементарных) На рисунке также видно, что при увеличении числа степеней свободы 2 - распределение приближается к нормальному (при больших n практически не отличается от нормального) Пример ЭД, распределенных по хи-квадрат; степень свободы = 4, резкая асимметрия относительно математического ожидания

Непрерывные распределения, продолжение 3. Распределение 2 (хи-квадрат), продолжение Плотность 2 распределения вероятностей (найдена К. Пирсоном): Здесь (гамма-функция; одна из специальных функций, т. е. не входящих в число элементарных) Область определения аргумента: x 0 (естественно: квадраты значений неотрицательны) Функция 2 распределения вероятностей: Здесь Точечные статистические характеристики (n – число степеней свободы): 1. Математическое ожидание = n 4. Мода = n – 2, определяется при n > 2 2. Дисперсия = 2·n 5. Коэффициент асимметрии = 3. Медиана 6. Коэффициент эксцесса = (уменьшаются с ростом n, по мере приближения к нормальному закону) (неполная гамма-функция; одна из специальных функций, т. е. не входящих в число элементарных)

Непрерывные распределения, продолжение 3. Распределение 2 (хи-квадрат), окончание Плотность 2 распределения вероятностей (найдена К. Пирсоном): Здесь (гамма-функция; одна из специальных функций, т. е. не входящих в число элементарных) Важное свойство распределения 2 Распределение устойчиво относительно суммирования, т. е. если X 1 и X 2 независимы и если X 1 принадлежит распределению 2 , рассчитанному для степени свободы n 1, а X 2 принадлежит распределению 2 , рассчитанному для степени свободы n 2, то сумма X 1+X 2 тоже принадлежит распределению 2 , рассчитанному для степеней свободы n 1+n 2. (дисперсия суммы X 1+X 2 будет больше, чем дисперсия каждого слагаемого) Пример прикладной задачи, для решения которой можно использовать распределение 2 Пример прикладной задачи, для которой может быть использовано распределение хи-квадрат: Пусть фирма выпустила новый процессор. Предположим, что каждый год цена процессора падает на случайную величину, распределенную нормально со средним значением 10%. Тогда количество процессоров, которые можно купить на фиксированную сумму, может быть описано с помощью распределения 2.

Непрерывные распределения, продолжение Зачем? 4. Распределение Стьюдента (t-распределение) При изучении нормального закона распределения мы видели, что сумма нормально распределенных величин (следовательно, и выборочная средняя) также распределены нормально. Поэтому (казалось бы) мы легко можем определить, в каком интервале находится неизвестное нам математическое ожидание. Интуитивно ясно, что чем больше сделано опытов, тем уже будут границы этого интервала. Но в число параметров нормального закона входит среднее квадратическое отклонение, которое тоже нам неизвестно. В этом случае уже нельзя утверждать, что выборочная средняя распределена по нормальному закону. В исследовании, выполненном В. Госсетом (псевдоним Стьюдент), было найдено соответствующее распределение, получившее впоследствии его имя. В настоящее время это – одно из самых полезных для решения задач анализа ЭД (получение доверительных интервалов для точечных оценок, проверка гипотезы о величине математического ожидания, оценка однородности выборок и обнаружение тренда…; с некоторыми применениями мы знакомимся на лабораторных занятиях ). Определение: пусть X 0, X 1, …, Xn (всего n+1 значений) – независимые стандартные нормально распределенные данные, т. е. имеющие нулевое математическое ожидание и дисперсию, равную 1, ранее соответствующее распределение обозначалось N(0, 1). Тогда случайная величина имеет распределение Стьюдента с n степенями свободы.

Непрерывные распределения, продолжение 4. Распределение Стьюдента (t-распределение), продолжение Определение: пусть X 0, X 1, …, Xn (всего n+1 значений) – независимые стандартные нормально распределенные данные, т. е. имеющие нулевое математическое ожидание и дисперсию, равную 1, ранее соответствующее распределение обозначалось N(0, 1). Тогда случайная величина (1) имеет распределение Стьюдента с n степенями свободы. Обратим внимание, что число степеней свободы на 1 меньше количества ЭД (это объясняется тем, что для вычисления t(n) нужна операция центрирования, а для него используется выборочное среднее, «отнимающее» одну степень свободы) Формула (1) годится для любого из ЭД X 0, X 1, …, Xn ; важно только, чтобы ЭД, использованное в числителе, отсутствовало бы при суммировании в знаменателе. Плотность tраспределения вероятностей (найдена В. Госсетом ( «Стьюдентом» ): Здесь (гамма-функция; одна из специальных функций, т. е. не входящих в число элементарных)

Непрерывные распределения, продолжение 4. Распределение Стьюдента (t-распределение), продолжение Плотность t- распределения вероятностей (найдена В. Госсетом ( «Стьюдентом» ): Здесь График плотности t- распределения является унимодальным и симметричным; ось симметрии – по значению абсциссы = 0. При увеличении числа степеней свободы (числа ЭД) пик плотности распределения увеличивается, «хвосты» укорачиваются (кажется, что график сжимается с боков) – это показывает, что дисперсия уменьшается, стремится к 1). При относительно больших степенях свободы (n>30) плотность распределения Стьюдента близка к нормальной плотности распределения с нулевым математическим ожиданием и единичной дисперсией.

Непрерывные распределения, продолжение 4. Распределение Стьюдента (t-распределение), продолжение Плотность t- распределения Здесь вероятностей (найдена В. Госсетом ( «Стьюдентом» ): Сравнение ЭД, подчиненных распределению Стьюдента, с ЭД, распределенных по нормальному закону При малых значениях степени свободы видно, что разброс ЭД, подчиненных распределению Стьюдента, больше разброса при нормальном распределении (хотя заметно и сходство обеих выборок: сосредоточение вокруг математического ожидания)

Непрерывные распределения, продолжение 4. Распределение Стьюдента (t-распределение), окончание Плотность t- распределения вероятностей (найдена В. Госсетом ( «Стьюдентом» ): Здесь Функция t- распределения вероятностей: (интеграл не вычисляется в элементарных функциях) Область определения аргумента: < x < Математическое ожидание, мода, медиана, асимметрия = 0 Дисперсия = Эксцесс = (может быть определена только при n > 2; при увеличении n стремится к 1) (может быть определен только при n > 4; при увеличении n стремится к нулю)

Непрерывные распределения, продолжение Зачем? 5. Распределение Фишера (F-распределение) В лабораторной работе № 2 для обнаружения тренда необходимо было установить, одинаковы ли дисперсии в двух выборках. На практике такая же задача возникает, если нужно доказать, что новая технология приводит к уменьшению разброса показателей качества продукции. Если провести два опыта – один со старой технологией, а другой – с новой, а затем рассчитать оценки дисперсии показателей качества, то они окажутся разными. Но является ли это различие значимым (или отличия являются случайными, а обе оценки - приближениями к одной и той же истинной дисперсии? ) Для ответа на этот вопрос используется распределение Р. Фишера (ему же принадлежит и критерий, позволяющий определить, значим ли отличаются друг от друга дисперсии; в последующих лекциях, посвященных проверке гипотез, мы вернемся к этому вопросу). Определение: пусть Y 1 и Y 2 – экземпляры двух выборок независимых ЭД; выборки имеют степени свободы d 1 и d 2 соответственно; случайные ЭД в обеих выборках подчинены 2 - распределению. Тогда случайная величина имеет распределение Фишера со степенями свободы d 1 и d 2.

Непрерывные распределения, продолжение 5. Распределение Фишера (F-распределение) , продолжение Определение: пусть Y 1 и Y 2 – экземпляры двух выборок независимых ЭД; выборки имеют степени свободы d 1 и d 2 соответственно; случайные ЭД в обеих выборках подчинены 2 - распределению. Тогда случайная величина имеет распределение Фишера со степенями свободы d 1 и d 2. Плотность F- распределения вероятностей : Здесь (распределение несимметричное, по мере увеличения количества ЭД асимметрия «смягчается» ) (гамма-функция; одна из специальных функций, т. е. не входящих в число элементарных)

Непрерывные распределения, продолжение 5. Распределение Фишера (F-распределение) , продолжение Плотность F- распределения вероятностей : Здесь (распределение несимметричное, по мере увеличения количества ЭД асимметрия «смягчается» ) Функция F- распределения вероятностей: (интеграл не вычисляется в элементарных функциях; можно записать через неполную бета - функцию, одну из специальных функций)) (гамма-функция; одна из специальных функций, т. е. не входящих в число элементарных)

Непрерывные распределения, продолжение 5. Распределение Фишера (F-распределение) , окончание Плотность F- распределения вероятностей : При увеличении числа ЭД дисперсия уменьшается, распределение становится более симметричным. Область определения аргумента: 0 < x < Математическое ожидание = Мода = Дисперсия = (для медианы и эксцесса формулы не выведены) Асимметрия =

Группа гамма - распределений 1. Экспоненциальное распределение 2. Распределение Вейбулла - Гнеденко. 3. Гамма-распределение

Непрерывные распределения, группа гамма - распределений 1. Экспоненциальное распределение Пример: представим себе, что мы в течение длительного времени собираем статистику о продолжительности работы компьютера без вмешательства вирусов. Пусть среднее значение этой продолжительности T = 100 (часов), тогда интенсивность заражения (количество заражений в час) равна: (число событий в час) Пусть 500 студентов, сидя в компьютерных классах, фиксируют время между двумя последовательными вирусными атаками. Получится, что в большинстве случаев время между заражениями меньше среднего значения, но случаются и редкие «счастливые» случаи, когда это время существенно больше среднего. Построим гистограмму по ЭД и заметим, что ее огибающая напоминает экспоненту. Подберем математическую функцию, хорошо аппроксимирующую гистограмму. Это и будет плотность экспоненциального распределения.

Непрерывные распределения, группа гамма - распределений , продолжение 1. Экспоненциальное распределение, продолжение Определение: пусть известна средняя продолжительность Т между двумя последовательными совершениями одного и того же событиями или интенсивность потока событий . Экспоненциальным (иначе – показательным) распределением называется абсолютно непрерывное распределение, моделирующее время между двумя последовательными совершениями одного и того же события. Плотность экспоненциального распределения вероятностей : Функция экспоненциального распределения вероятностей: Пример: Мы видим, что вероятность получения значения времени между событиями меньше 10 часов при интенсивности 0. 1 равна 0. 632, а при интенсивности 0. 2 равна 0. 865

Непрерывные распределения, группа гамма - распределений , продолжение 1. Экспоненциальное распределение, продолжение Экспоненциальным (иначе – показательным) распределением называется абсолютно непрерывное распределение, моделирующее время между двумя последовательными совершениями одного и того же события. Плотность Функция экспоненциального Экспоненциального распределения вероятностей : вероятностей: Экспоненциальное распределение называют «распределением редких событий» (термин «редкий» означает, что (а) никогда не происходит 2 одинаковых события в один и тот же момент времени(как если бы мы интересовались интенсивностью пассажиропотока на посадку в самолет, когда через металлоискатель может проходить в каждый момент времени только 1 пассажир ); (б) по сравнению с нормальным законом «спад» графика плотности вероятностей у экспоненциального распределения происходит гораздо медленнее (имеет место положительная сильная асимметрия). Пример: вероятность значения, в 4 раза превышающего математическое ожидание, при нормальном законе распределения = 0. 00135, а при экспоненциальном (имеющим такую же дисперсию и такое же математическое ожидание) = 0. 018, т. е. в 14 раз больше. Точечные статистические характеристики: Математическое ожидание = Среднее квадратическое отклонение тоже = ( «фирменный» признак экспоненциального распределения, по которому его можно опознать по ЭД) Медиана = Асимметрия = 2 Мода = 0 Эксцесс = 6 Область определения аргумента: 0 < x <

Непрерывные распределения, группа гамма - распределений , продолжение 1. Экспоненциальное распределение, продолжение Экспоненциальным (иначе – показательным) распределением называется абсолютно непрерывное распределение, моделирующее время между двумя последовательными совершениями одного и того же события. Свойства экспоненциального распределения: 1. Отсутствие последействия. (Такое свойство называется марковостью в честь А. А. Маркова) Пояснения: пусть X - случайное значение ЭД, распределенных экспоненциально. Тогда (условная вероятность того, что ЭД примет значение большее, чем заданное x+ , если известно, что значение ЭД больше, чем заданное x) Пример трактовки: пусть автобусы подходят к остановке случайно с фиксированной интенсивностью . Пусть один из пассажиров подошел к остановке в момент x и ожидал прихода автобуса уже минут. Пусть в момент x + к остановке подходит другой пассажир. Время ожидания транспорта для них одинаково (они сядут в один и тот же автобус), поэтому и вероятность такая же, какова она была для первого пассажира (несмотря на то, что второй пришел позднее и, казалось бы, для него вероятность была бы больше ). 2. Минимум независимых ЭД, количество которых n и которые распределены экспоненциально с интенсивностями i , i = 1, …, n, также имеет экспоненциальное распределение с интенсивностью 3. Сумма независимых одинаково распределенных ЭД Xi интенсивностями имеет Гамма-распределение с одинаковыми (это распределение описано дальше)

Непрерывные распределения, группа гамма - распределений , продолжение 1. Экспоненциальное распределение, окончание Экспоненциальным (иначе – показательным) распределением называется абсолютно непрерывное распределение, моделирующее время между двумя последовательными совершениями одного и того же события. Применение экспоненциального распределения в теории надежности Экспоненциальное распределение используется для оценки вероятности периода безотказной работы механизма, устройства, системы… Исходные ЭД: оценка интенсивности отказов (среднего числа отказов оборудования в единицу времени). Пример: пусть по наблюдениям за оборудованием получено значение =0. 02 (1/час) Получить: А) Среднюю продолжительность безотказной работы (час). Б) Вероятность безотказной работы за заданное число часов (например, за 100 часов) Известно, что в период нормальной эксплуатации (т. е. не в начале эксплуатации приработке оборудования и не в конце жизненного цикла оборудования) интенсивность отказов примерно постоянна, а распределение вероятностей – экспоненциально. А) Интенсивность отказов известна, соответственно средняя продолжительность безотказной работы = (час) Б) Используя формулу для распределения вероятностей, получим:

Непрерывные распределения, группа гамма - распределений , продолжение 2. Распределение Вейбулла - Гнеденко При рассмотрении экспоненциального закона распределения мы предполагали, что интенсивность отказов не зависит от режима эксплуатации оборудования и может быть представлена константой. На самом деле интенсивность отказов – не константа, а функция времени. Различают следующие три характерных периода: 1. Период t 0 t < t 1: начальный. Для него характерны частые ранние отказы из-за дефектов материала или технологии изготовления. Ранние отказы (приработка) Отказы из-за износа Эксплуатационные отказы 2. Период t 1 t < t 2: период случайных отказов с практически одинаковой интенсивностью. Причины отказов: отклонения режима эксплуатации от номинального, непредсказуемые изменения рабочих нагрузок… 3. Период t > t 2: период износовых отказов, возникающих из-за проявления различных эффектов старения оборудования. Для моделирования процессов работы оборудования с непостоянной интенсивностью отказов используется распределение Вейбулла – Гнеденко.

Непрерывные распределения, группа гамма - распределений , продолжение 2. Распределение Вейбулла – Гнеденко, продолжение Мысленно проведем 3 опыта. Пусть по данным нормальной эксплуатации (2 й период, т. е. не начало и не конец) интенсивность отказов (среднее число отказов за сутки) = 1. 1. Соберем статистику отказов на периоде 1 (приработка оборудования) и построим гистограмму: 2. Аналогичную статистику соберем на периоде 2 (нормальная эксплуатация), построим гистограмму: 3. Аналогичную статистику соберем на периоде 3(период старения) и построим гистограмму: Период 2 Период 1 Период 3 Мы видим, что в периоде 2 гистограмма напоминает экспоненциальное распределение; левый график (период 1) имеет большую интенсивность отказов и меньшую дисперсию; правый график (период 3) характеризуется значительным разбросом значений ЭД. Осталось сконструировать функцию распределения вероятностей, которая будет обладать похожими особенностями, что и выполнили Вейбулл и Гнеденко. Период 1 Период 2 с Период 3

Непрерывные распределения, группа гамма - распределений , продолжение 2. Распределение Вейбулла – Гнеденко, продолжение Плотность распределения Вейбулла: Функция распределения вероятностей Вейбулла: График плотности распределения сильно различается для трех перечисленных режимов. Эти отличия получаются при различных диапазонах значений отношения соответствует начальному периоду; соответствует периоду нормальной эксплуатации; соответствует периоду старения оборудования.

Непрерывные распределения, группа гамма - распределений , продолжение 2. Распределение Вейбулла – Гнеденко, окончание Свойство распределения Вейбулла-Гнеденко: Экспоненциальное распределение является частным случаем распределения Вейбулла (при k/ = 1) Точечные статистические характеристики: Область определения аргумента: 0 < x < Математическое ожидание Здесь (гамма-функция; одна из специальных функций, т. е. не входящих в число элементарных) Дисперсия Медиана = Асимметрия = Мода = (определяется для k >1, т. е. для участка старения оборудования) Эксцесс не рассчитан

Непрерывные распределения, группа гамма - распределений 3. Гамма - распределение Гамма-распределение относится к числу наиболее полезных для решения практических задач: Гамма – распределению подчинены: Общий срок службы изделия; Длина цепочки токопроводящих пылинок; Время достижение изделием предельного состояния при коррозии; Время наработки до k-го отказа, k = 1, 2, … Продолжительность жизни больных хроническими заболеваниями; Время достижения определенного эффекта при лечении; Оценка спроса на продукцию в задачах управления запасами (логистики)… Плотность гаммараспределения Параметр «ответствен» за форму графика плотности распределения; параметр k «ответствен» за постепенное приближение к нормальному распределению.

Непрерывные распределения, группа гамма - распределений 3. Гамма - распределение , продолжение Функция гаммараспределения вероятностей : Здесь (гамма-функция и неполная гамма – функция (входят в состав специальных функций, т. е. не входящих в число элементарных) Точечные статистические характеристики: Область определения аргумента: 0 < x < Математическое ожидание = k· Дисперсия = k· 2 Мода = (k – 1)· , определима при k 1. Асимметрия = Эксцесс =

Непрерывные распределения, группа гамма - распределений 3. Гамма - распределение , продолжение Свойства гамма - распределения 1. О распределении суммы Y независимых ЭД Xi, i=1, …, n, имеющих гамма – распределение с параметрами ki , i: также имеет гамма – распределение с параметрами: 2. Об умножении на скаляр: если Xi, i=1, …, n – независимые одинаково распределенные ЭД, имеющие гамма – распределение с параметрами k , , то распределение ЭД ·Xi, i=1, …, n также имеет гамма-распределение с параметрами k , · Связь с другими распределениями 1. Экспоненциальное распределение с параметром – частный случай гамма – распределения с параметрами k = 1, = 1/. 2. Распределение 2 с параметром n является частным случаем гамма - распределения с параметрами k = n/2, = 1/2. 3. При больших k гамма – распределение с параметрами k , может быть приближенно заменено нормальным распределением с математическим ожиданием k · и дисперсией k · 2 (при k ). Это – одна из иллюстраций огромной популярности нормального закона, следствие центральной предельной теоремы.

Непрерывные распределения, группа гамма - распределений 3. Гамма - распределение , окончание Благодаря «всеядности» гамма – распределения (т. е. возможности получить много других полезных распределений из гамма – распределения) с его помощью можно имитировать ЭД с разнообразными свойствами: ЭД с сильной асимметрией относительно математического ожидания ЭД с умеренной асимметрией ЭД, почти симметричные относительно математического ожидания (почти как нормально распределенные ЭД)

Непрерывные распределения (вне группы нормальных и гамма – распределений) Равномерное распределение Пример 1 (иллюстративный): при поломке часов минутная стрелка будет занимать случайное положение, причем вероятность «застыть» в любом положении одинакова, а значения возможных положений стрелки ограничены циферблатом. Пример 2: на пункт обслуживания поверки партия измерительных приборов. Известно время обслуживания одного прибора. Тогда момент времени, в который будет осуществлена поверка конкретного прибора, является случайной величиной, распределенной на интервале между моментом начала поверки первого прибора и окончанием работы в целом, а вероятность того, что данный прибор будет поверен первым, одинакова для всех приборов. Если мы смоделируем последовательность экспериментальных данных, обладающих свойствами, которые описаны в примерах, то мы увидим, что при большом числе опытов результаты заполнят диапазон возможных значений с равномерной плотностью, что и дало название распределению: равномерное распределение вероятностей. Плотность равномерного распределения: Значение плотности вероятности в диапазоне [A, B] тем больше, чем уже интервал допустимых значений (площадь под графиком = 1).

Непрерывные распределения (вне группы нормальных и гамма – распределений) Равномерное распределение, продолжение Плотность равномерного распределения: Функция равномерного распределения вероятностей : Точечные статистические характеристики: Область определения аргумента: A x B Математическое ожидание = Медиана = Дисперсия = Асимметрия = 0 Мода - любое значение из отрезка [A, B] Эксцесс = По сравнению с нормальным распределением, имеющим такие же значения математического ожидания и дисперсии, равномерное распределение имеет сильно уплощенную форму, что и проявляется в отрицательности коэффициента эксцесса.

Непрерывные распределения (вне группы нормальных и гамма – распределений) Равномерное распределение , продолжение Применение равномерного распределения в моделировании Для генерации случайных данных с различными законами распределения используются машинные псевдослучайные числа, распределенные равномерно (термин псевдо относится к факту одинаковой воспроизводимости последовательности чисел после включения компьютера; для того чтобы исключить это, в каждый язык программирования встроена процедура рандомизации, использующая многократную прокрутку генератора псевдослучайных чисел, в которой число циклов «привязано» к единственному неповторимому событию – текущему моменту времени). Процедура генерации псевдослучайных чисел встроена практически во все ЭП (rand() в Math. CAD, rnd() в Basic, слчис() в MS Excel…. ) Требования к генератору случайных чисел Полученные с помощью идеального генератора псевдослучайные последовательности чисел должны: 1. состоять из квазиравномерно распределенных чисел (термин квази относится к невозможности получить непрерывное распределение из-за ограниченности числа разрядов машинного слова); 2. содержать статистически независимые числа; 3. быть воспроизводимыми; 4. иметь неповторяющиеся числа; 5. получаться с небольшими затратами машинного времени; 6. занимать малый объем машинной памяти.

Непрерывные распределения (вне группы нормальных и гамма – распределений) Равномерное распределение , продолжение Применение равномерного распределения в моделировании Примеры способов генерации псевдослучайных чисел: Используются 3 способа генерации: аппаратный, табличный, алгоритмический. 1. Аппаратный способ. Генерация случайных чисел вырабатываются специальной электронной приставкой - генератором (датчиком) случайных чисел, служащей в качестве одного из внешних устройств компьютера. Реализация этого способа генерации не требует дополнительных вычислительных операций ЭВМ по выработке случайных чисел, а необходима только операция обращения к внешнему устройству (датчику). В основе лежит один из физических эффектов, при которых имеет место случайность. Чаще всего используются шумы в электронных и полупроводниковых приборах, явления распада радиоактивных элементов. Достоинства: 1. Запас чисел не ограничен; 2. Расходуется мало операций; 3. Не расходуется память для хранения чисел. Недостатки: 1. Требуется периодическая проверка; 2. Нельзя воспроизводить одинаковые последовательности; 3. Используется специальное устройство; 4. Необходимы меры по обеспечению стабильности.

Непрерывные распределения (вне группы нормальных и гамма – распределений) Равномерное распределение , продолжение Применение равномерного распределения в моделировании Примеры способов генерации псевдослучайных чисел: Используются 3 способа генерации: аппаратный, табличный, алгоритмический. 2. Табличный способ. Случайные числа, представленные в виде таблицы, помещаются в память ЭВМ. Этот способ получения случайных чисел обычно используют при сравнительно небольшом объеме таблицы и файла чисел. Достоинства: 1. Требуется только однократная проверка табличных данных на соответствие равномерному распределению и отсутствии корреляции между числами; 2. Можно воспроизводить одинаковые последовательности чисел многократно. Недостатки: 1. Запас чисел ограничен; 2. Таблица занимает большой объем памяти в ОЗУ; 3. Снижается быстродействие из-за необходимости частого обращения к ячейкам памяти.

Непрерывные распределения (вне группы нормальных и гамма – распределений) Равномерное распределение , продолжение Применение равномерного распределения в моделировании Примеры способов генерации псевдослучайных чисел: Используются 3 способа генерации: аппаратный, табличный, алгоритмический. 3. Алгоритмический способ основан на формировании случайных чисел в ЭВМ с помощью специальных алгоритмов и реализующих их программ. Каждое случайное число вычисляется с помощью соответствующей программы по мере возникновения потребностей при моделировании системы на ЭВМ. Достоинства: 1. Требуется только однократная проверка табличных данных на соответствие равномерному распределению и отсутствии корреляции между числами; 2. Можно воспроизводить одинаковые последовательности чисел многократно. 3. Алгоритмы занимают мало места в памяти; 4. Не требуются специальные внешние устройства. Недостатки: 1. Запас чисел ограничен периодом последовательности; 2. Расходуется машинное время.

Непрерывные распределения (вне группы нормальных и гамма – распределений) Равномерное распределение , окончание Применение равномерного распределения в моделировании Используются 3 способа генерации: аппаратный, табличный, алгоритмический. 3. Алгоритмический способ основан на формировании случайных чисел в ЭВМ с помощью специальных алгоритмов и реализующих их программ. Каждое случайное число вычисляется с помощью соответствующей программы по мере возникновения потребностей при моделировании системы на ЭВМ. Пример : Линейный конгруэнтный алгоритм (один из очень многих, простейший) Для реализации алгоритма необходимо задать 4 параметра: 1. Диапазон значений m, m > 0. Итеративный алгоритм: 2. Множитель a (0 a m). Xi+1 = (a·Xi + c) mod m (оператор mod 3. Инкрементирующее значение c (0 c m). означает остаток от деления нацело, 4. Начальное значение X 0 (0 X 0 < m). i=1, …, N, N – нужное количество чисел, i – номер сгенерированного числа) Метод недостаточно надежен, вероятны повторения серий сгенерированных чисел. Имеются гораздо более совершенные алгоритмы. Но с помощью арифметических методов нельзя построить по настоящему случайную последовательность чисел. Высказывание Джона Фон Неймана: «Anyone who uses arithmetic methods to produce random numbers is in a state of sin» ( «Каждый, кто использует арифметические методы для генерации случайных чисел, по определению является грешником)» .