
Seminar_1_Statisticheskoe_otsenivanie.pptx
- Количество слайдов: 28
Семинар 1 Элементы теории верятностей
Случайное событие Событие называется случайным, если оно при данных условиях может либо произойти, либо не произойти Каждое явление, в котором может осуществиться или не осуществиться случайное событие, называется испытанием
Случайное событие Относительная частота события Вероятность события h = m/n p = h при n→∞ n – число испытаний m – число успехов 0 ≤ p ≤ 1 p = 0 – невозможное событие p = 1 – достоверное событие Вероятность ненаступления события q=1 -p
Случайная величина Закон (функция) вероятностей для дискретной случайной величины Значения случайной величины • x: x 1, x 2, …, xk, … Вероятности значений • p: p 1, p 2, …, pk, … Плотность (функция) вероятностей для непрерывной случайной величины p = p(x)
Функция распределения вероятностей (кумулятивная функция вероятности) F(x)= P(x≤X) Дискретная случайная величина Непрерывная случайная величина
Характеристики унимодального распределения
Характеристики унимодального распределения 1 Объем 2 Среднее значение (среднее арифметическое) 4 Дисперсия 5 Стандартное отклонение 6 Медиана Me 7 Мода Mo 8 Коэффициент вариации (изменчивости) 9 Геометрическое среднее 10 Размах
Характеристики унимодального распределения 1 Объем 2 Среднее значение (среднее арифметическое) 3 Отклонение от среднего 4 Стандартное отклонение 5 Дисперсия 6 Медиана Me N величина, которая делит распределение на две равные части таким образом, что каждая часть содержит 50% всего распределения 7 Мода Mo равна тому значению, частота которого максимальна Пример: 4 6 2 5 3 8 2 1 4 5
Характеристики унимодального распределения 8 Коэффициент вариации (изменчивости) 9 Геометрическое среднее 10 Размах 11 Взвешенное среднее R = xmax-xmin 12 Взвешенное стандартное отклонение Пример: n 1=8 n 2=10 n 3=6 x 1=9 x 2=7 x 3=8 s 12=4 s 22=1 s 32=4
Характеристики унимодального распределения 13. Арифметическое среднее с весами Измерения неравной точности
Основные законы распределения случайных величин
Дискретные распределения 1. Биномиальное распределение (распределение Бернулли) для каждого испытания существует только два возможных исхода: Успех – вероятность p Неудача – вероятность q=1 -p Pn, p(x)=Cxn px qn-x вероятность того, что в n опытах успех наступит x раз (а неудача – n-x раз) Параметры распределения – p, n Среднее значение μ=np Дисперсия σ2 = np(1 -p) = npq
2. Распределение Пуассона описание редких событий – множество возможных исходов с очень маленькими вероятностями их наступления Плотность вероятности Кумулятивная функция Параметр распределения - λ Среднее значение μ=np=λ Дисперсия σ2 = np(1 -p) = λ(1 -λ/n)≈λ
Непрерывные распределения Плотность вероятности 1. Нормальное распределение (Гаусса) Общий вид уравнения нормальной кривой Если a и b выбраны так, чтобы площадь под кривой равнялась 1, то Кумулятивная функция параметры распределения - среднее значение, σ – стандартное отклонение Стандартное (нормированное) нормальное распределение: замена z=(x-μ)/σ: среднее значение =0 ст. отклонение = 1
Плотность вероятности нормального распределения
Плотность вероятности 2. Логнормальное распределение Асимметрия Наличие ограничений по x Кумулятивная функция
Плотность вероятности 3. Равномерное распределение Кумулятивная функция
СТАТИСТИЧЕСКОЕ ОЦЕНИВАНИЕ 1. Оценка параметров по выборочным данным Выборка и генеральная совокупность. основные характеристики ВЫБОРОЧНОЙ совокупности: Среднее значение (среднее арифметическое) Стандартное отклонение Дисперсия: основные характеристики ГЕНЕРАЛЬНОЙ совокупности: Генеральное среднее μ Стандартное отклонение генерального среднего σ выборочные параметры являются статистическими оценками генеральных параметров
2. Стандартная ошибка среднего Чем больше объем выборки, тем меньше вероятность того, что выборочное среднее будет значительно отличаться от генерального среднего с ростом объема выборки оценки параметров стремятся к параметрам генеральной совокупности стандартная ошибка среднего показывает, насколько выборочное значение может отклоняться от генерального Результаты записывают в виде
Стандартные ошибки сложных средних Если z = a+x, где a – константа, x – переменная, то Если z = ax z=a ebx z=a lg (bx), z=xm z=x±y
Стандартные ошибки сложных средних z=xy или z=x/y Закон преобразования ошибок степенных произведений. Пусть h = kxaybzc… где x, y, z – переменные, k, a, b, c – константы средняя относительная ошибка
3. Доверительный интервал выборочные параметры являются статистическими оценками генеральных параметров Интервал, в котором с заданной вероятностью заключен параметр генеральной совокупности (например, генеральное среднее), называется доверительным Для случайной величины, подчиняющейся нормальному распределению: Вероятность того, что интервал содержит генеральное среднее равна площади под кривой плотности распределения от до
Доверительный интервал и доверительная вероятность для нормально распределенной случайной величины Доверительный интервал Доверительная вероятность Уровень значимости (p, α) (Статистическая надежность) (Вероятность ошибки) ≈ 68. 3 % ≈ 31. 7 % ≈ 90 % ≈10 % ≈ 95. 4 % ≈ 4. 6 % ≈ 99 % ≈ 1 % ≈ 99. 7 % ≈ 0. 27 % ≈ 99. 9 % ≈ 0. 1 %
Насколько высока надежность требования p<5%? Pn, p(x)=Cxn px qn-x Нуль-гипотеза: выпадение герба четыре раза подряд является случайным P 4(x=4)=(1/2)4=1/16=0. 0625=6. 25%>5% - нуль-гипотеза не может быть отвергнута. Нуль-гипотеза: выпадение герба пять раз подряд является случайным P 5(x=5)=(1/2)5=1/32=0. 03125=3. 1%<5% - нуль-гипотеза д. б. отвергнута появление герба пять раз – событие неслучайное
4. Распределение Стьюдента Плотность вероятности ДИ: Если n большое, значение τ можно найти из стат. таблиц для нормального распределения, которые дают площади под нормальной кривой Если n малое – нужно использовать распределение Стьюдента (tраспределение) Функция распределения Единственный параметр – число степеней свободы f=n-1
Чем меньше число степеней свободы, тем сильнее отклонение от нормального распределения При большом числе степеней свободы t-распределение сходится к нормальному
Критические значения t-распределения для 95 -% доверительной вероятности f t 0. 95 1 12. 71 14 2. 15 27 2. 05 2 4. 30 15 2. 13 28 2. 05 3 3. 18 16 2. 12 29 2. 04 4 2. 78 17 2. 11 30 2. 04 5 2. 57 18 2. 10 40 2. 02 6 2. 45 19 2. 09 50 2. 01 7 2. 37 20 2. 09 60 2. 00 8 2. 31 21 2. 08 80 1. 99 9 2. 26 22 2. 07 100 1. 98 10 2. 23 2. 07 120 1. 98 11 2. 20 24 2. 06 200 1. 97 12 2. 18 25 2. 06 500 1. 96 13 2. 16 26 2. 06 >> 1. 96 критические значения t-статистики особенно сильно зависят от числа степеней свободы при малом объеме выборки
Если случайная величина не подчиняется нормальному распределению, для расчета стандартных ошибок и доверительных интервалов нужно использовать другие формулы!
Seminar_1_Statisticheskoe_otsenivanie.pptx