Описательные статистики.ppt
- Количество слайдов: 14
Задачи математической статистики. • указать способ сбора и группирования статистических сведений; • разработать метод анализа в зависимости от цели исследования. • Задача статистического моделирования состоит в создании методов сбора и обработки статистической информации для получения научных и практических выводов. Лекция № 2, ТВи. МС, Лакман И. А. 1
Статистическое распределение выборки Определение: Выборочной совокупностью (выборкой) называется совокупность случайно отобранных объектов из генеральной совокупности. К выборке предъявляется условие представительности, т. е. выборка должна правильно представлять генеральную совокупность, для этого необходимо, чтобы объекты выборки были отобраны случайно. Определение: Генеральной совокупностью называется совокупность, из которой производиться выборка. Пусть из генеральной совокупности извлечена выборка, причем значение Х 1 наблюдалось n 1 раз, Х 2 -- n 2 раз, …, Хk -- nk раз. Тогда: , где n - общее число наблюдений (объем выборки). Лекция № 2, ТВи. МС, Лакман И. А. 2
Статистическое распределение выборки Определение: Наблюдаемые значения Хi называют вариантами, а последовательность вариант, записанных в возрастающем порядке – вариационным рядом. Число наблюдений ni называют частотами, а их отношение к объему выборки называют относительными частотами. Определение: Статистическим распределением выборки называют перечень вариант и соответствующих им относительных частот. Пусть известно статическое распределение частот количественного признака Х. Пусть nх - число наблюдений, при которых наблюдалось значение признака X меньшее х; n – общее число наблюдений, тогда относительная частота события Х<х равна Лекция № 1, ТВи. МС, Лакман И. А. . 3
Статистическое распределение выборки Определение: Эмпирической функцией распределения (функцией распределения выборки) называется функция F*(x), определяющая для каждого значения х относительную частоту появления события Х<х. Для наглядности статистического распределения в случае дискретного распределения признака Х строят полигон (ломанная, где длина Х откладывается на оси абсцисс, а на оси ординат соответствующие им частоты ni). В случае непрерывного распределения признака Х строят гистограммы. Для построения гистограммы все наблюдаемые значения признака разбивают на несколько i частичных интервалов длиной h, и для каждого интервала сумму частот вариант попавших в i интервал отмечают по оси ординат. Гистограммой распределения частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длиной h, а высоты равны отношению частот). Лекция № 1, ТВи. МС, Лакман И. А. (плотность 4
Построение гистограмм Задача 1. Даны данные о количестве ежедневных звонков абонента с сотового телефона: 5, 6, 10, 12, 4, 6, 0, 3, 15, 20, 14, 13, 11, 8, 10, 7, 6, 10, 12, 16, 18, 10, 14, 12, 5, 7, 16, 8, 9, 12. Построить гистограммы частот и относительных частот распределения телефонных звонков в месяц. Решение: Объем выборки п=30. Выберем длину частичного интервала h в 4 звонка. Тогда получим следующее распределение выборки. Номер Частичный интервала, i интервал xi – xi+1 1 2 3 4 5 0– 4 5– 8 9 – 12 13 – 16 17 – 20 Сумма частот вариант интервала, ni 3 9 10 6 2 Плотность Относительчастоты, ni/h ные частоты, wi=ni/n 0, 75 2, 25 2, 5 1, 5 0, 5 ∑ ni =30 Лекция № 1, ТВи. МС, Лакман И. А. 0, 1 0, 33 0, 2 0, 07 ∑ wi =1 5
Построение гистограмм Строим гистограмму распределения частот, откладывая по оси абсцисс заданные интервалы длиной h=4, а параллельно оси ординат высоты длиной ni/h. Для построения гистограммы распределения относительных частот – откладываем параллельно оси ординат высоты длиной wi=ni/n. Гистограмма распределения частот звонков. Гистограмма распределения относительных частот звонков. Лекция № 2, ТВи. МС, Лакман И. А. 6
Свойства оценок Пусть имеются данные выборки, например значения некоторого признака, Х 1, Х 2, …, Хn, полученные в результате n наблюдений. Для того чтобы найти статистическую оценку θ неизвестного параметра теоретического распределения через эти данные необходимо найти функцию от наблюдаемых случайных величин, которые дают приближенное значение оцениваемого параметра. Статистическую оценку, которая определяется одним числом, называют точечной. Полученные оценки должны быть достоверными, т. е. обладать свойствами несмещенности, эффективности и состоятельности. • Несмешанной называют статистическую оценку θ*, математическое ожидание которой равно оценивающему параметру θ при любом объеме выборки, т. е. М(θ*)= θ. • Эффективной оценкой называют статистическую оценку θ*, которая при заданном объеме выборки n имеет наименьшую возможную дисперсию. • Состоятельной называют статистическую оценку, которая при n→ ∞ и стремится по вероятности к оцениваемому параметру, т. е. . Лекция № 1, ТВи. МС, Лакман И. А. 7
Средняя величина Определение: Генеральной средней называется среднее арифметическое значение признаков генеральной совокупности: , (1) где N – объем генеральной совокупности. Если х1 встречается N 1 раз, х2 – N 2 раз и т. д. , то (1) можно переписать в виде: (1) Определение: Несмещенной оценкой генеральной средней служит выборочная средняя, определяемая как среднее арифметическое значение признаков выборки (ni частоты появления признака): или (2). Средняя величина позволяет сделать вывод о центральном или наиболее общем значении, найденном для совокупности данных. Лекция № 1, ТВи. МС, Лакман И. А. 8
Дисперсия Определение: Генеральной дисперсией арифметическое квадратов отклонений совокупности от ее среднего значения. называют среднее признака генеральной (3) Определение: Смещенной оценкой генеральной дисперсии служит выборочная дисперсия, определяемая как: . (4) Определение: Несмещенной оценкой генеральной дисперсии служит исправленная выборочная дисперсия, определяемая: (5) • Мера рассеяния (дисперсия) показывает, насколько данные распределены относительно среднего значения признака. Лекция № 1, ТВи. МС, Лакман И. А. 9
Описательные статистики вариации Генеральное среднеквадратичное соответственно по формулам: , отклонение. определяется Определение: Несмещенной оценкой среднего квадратического отклонения является стандартное отклонение, определяемое по формуле: (6) Определение: Модой называется это наиболее часто наблюдаемая величина случайной переменной, обозначается М 0. Определение: Медианой называется значение наблюдения, которое находиться в середине ранжированного ряда данных, т. е. наблюдение, занимающее серединное значение, обозначается как Ме. Лекция № 1, ТВи. МС, Лакман И. А. 10
Асимметрия может быть как положительной, так и отрицательной. Когда асимметрии нет, то говорят, что сдвиг в рассеянии данных отсутствует. положительная асимметрия (средняя > медиана) отрицательная Симметрично асимметрия (средняя < медиана) (сдвига нет) Лекция № 1, ТВи. МС, Лакман И. А. 11
Коэффициент асимметрии Определение: Коэффициент асимметрии показывает, есть ли смещение (скошенность) в рассеянии данных. Коэффициент асимметрии определяется: (7) Коэффициент асимметрии Спирмена определяется как: (8) Коэффицент асимметрии является моментом третьего порядка Лекция № 1, ТВи. МС, Лакман И. А. 12
Эксцесс Определение: Показатель эксцесса описывает «пиковость» распределения частот. Распределения, имеющие более выраженный пик, называются островершинными. Те же распределения, у которых степень вытянутости вдоль оси ординат меньше, называют плосковершинными. Плосковершинное Островершинное Лекция № 1, ТВи. МС, Лакман И. А. 13
Коэффициент эксцесса определяется по формуле: (8) Дисперсия является моментом второго порядка. Коэффициент асимметрии является моментом третьего порядка. Коэффициент эксцесса является моментом четвертого порядка. Лекция № 1, ТВи. МС, Лакман И. А. 14
Описательные статистики.ppt