12. Описательная статистика.ppt
- Количество слайдов: 18
Описательная статистика 1
Основные понятия Переменная = одна характеристика объекта или события p Количественные: возраст, ежегодный доход p Качественные: пол, раса человека Таблица частот = таблица, в которой собраны сведения о том, сколько раз встречаются данные с определенной величиной. 2
Статистические параметры распределения p Персентиль – это такое значение заданного распределения, которое больше «р» процентов всех значений распределения. p Квартили – значения, соответствующие 25, 50 и 75 -й персентилям, т. е. четвертям распределения. p Интерквартильный диапазон – разница между первой и третьей квартилями. p Медиана - середина распределения , т. е. одна половина заданного набора данных имеет меньшие значения, а другая – большие значения. 3
Среднее значение = сумма значений, деленная на их количество. n сумма всех значений X = Х 1 + Х 2 +…+Хn i=1 = = общее количество наблюдений ∑ xi n n Усеченное среднее – среднее для набора данных, из которого исключены несколько процентов значений с обоих концов распределения. n p Среднее геометрическое (Х )*…*(Х ) p 1 2 n 4
Меры изменчивости 5
Основные понятия p p Изменчивость характеризует различия между данными или разброс от центра Диапазон = разница между максимальным и минимальным значениями распределения. Отклонение = наиболее распространенная мера изменчивости Стандартное отклонение 6
Вероятность 7
Основные понятия Случайные события - события, в которых нельзя точно определить отдельные исходы, но суммарный исход имеет определенную закономерность. Определение вероятности = количество успешных исходов на их общее число. Относительная частота = количество повторений события на общее число испытаний. 8
Распределение вероятностей = набор вероятностей для нескольких событий p Вероятность каждого события или комбинации событий должна находиться в диапазоне от 0 до 1. p Сумма вероятностей всех возможных событий должна быть равна 1. 9
Случайные переменные Случайная переменная - переменная, которая принимает значения случайным образом в соответствии с распределением вероятностей. p Дискретная случайная переменная принимает значения в соответствии с дискретным распределением вероятностей. p Непрерывная случайная переменная - в соответствии с непрерывным распределением вероятностей. p 10
Случайные выборки данных Наблюдение - каждое зарегистрированное значение, которое принимает случайная переменная. p Выборка - набор нескольких таких наблюдений. p Случайная выборка - если наблюдения генерируются совершенно случайным образом и без какой-либо тенденции. p 11
Доверительные интервалы 12
Свойства распределений и выборок 1. Выборочное среднее приблизительно удовлетворяет нормальному распределению со средним μ и стандартным отклонением σ / √ n, где μ — среднее распределения, из которого сделана выборка, σ — стандартное отклонение распределения, из которого сделана выборка, п — размер выборки. В общем это свойство обозначается следующим выражением: х = N ( μ, σ / √ n) В нормальном распределении около 95% значений попадают в диапазон двух стандартных отклонений от среднего. 13
Пример доверительного интервала p p Если σ ( σ — стандартное отклонение распределения, из которого сделана выборка) = 10 , а п (п — размер выборки ) = 25 , то выборочное среднее приблизительно удовлетворяет нормальному распределению со средним μ и стандартным отклонением 2, т. е. с вероятностью 95% выборочное среднее попадает в диапазон отклонения на 4 единицы от μ. Это значит, что если выборочное среднее равно 20, то μ ( μ — среднее распределения, из которого сделана выборка) с вероятностью 95% находится в диапазоне от 16 до 24. Этот диапазон называется доверительным интервалом (x- μ / (σ / √ n)) – N (0; 1) 14
Проверка гипотез 15
Четыре основных элемента 1. 2. 3. 4. Формулировка нулевой гипотезы Но. Формулировка альтернативной гипотезы На. Вычисление статистики теста. Определение области непринятия гипотезы. 16
Типы ошибок p p Никогда нет абсолютной уверенности в том, что выводы не содержат ошибок, но вероятность ошибок можно сократить. Во время проверки гипотез может возникнуть два типа ошибок. Ошибка первого типа заключается в отказе от нулевой гипотезы, которая на самом деле является истинной. Ошибка второго типа заключается в принятии нулевой гипотезы, тогда как на самом деле истинной является альтернативная гипотеза. Вероятность возникновения ошибки первого типа обозначается греческой буквой а, а вероятность возникновения ошибки второго типа — буквой ß. 17
Пример проверки гипотезы p p p Фабрика по производству резисторов: количество дефектных резисторов в партии соответствует нормальному распределению со средним 50 и стандартным отклонением 15. На фабрике предлагается внедрить новый технологический процесс, который позволяет сократить количество дефектных резисторов с экономией материалов. После анализа выборки из 25 партий среднее количество дефектных резисторов в партии равно 45. Можно ли на основании этих данных утверждать, что новый технологический процесс позволяет сократить количество дефектных резисторов или число 45 является результатом допустимого случайного отклонения, а внедренный технологический процесс ни на что не влияет? 18


