Скачать презентацию Описательная статистика 1 Основные понятия Переменная Скачать презентацию Описательная статистика 1 Основные понятия Переменная

12. Описательная статистика.ppt

  • Количество слайдов: 18

Описательная статистика 1 Описательная статистика 1

Основные понятия Переменная = одна характеристика объекта или события p Количественные: возраст, ежегодный доход Основные понятия Переменная = одна характеристика объекта или события p Количественные: возраст, ежегодный доход p Качественные: пол, раса человека Таблица частот = таблица, в которой собраны сведения о том, сколько раз встречаются данные с определенной величиной. 2

Статистические параметры распределения p Персентиль – это такое значение заданного распределения, которое больше «р» Статистические параметры распределения p Персентиль – это такое значение заданного распределения, которое больше «р» процентов всех значений распределения. p Квартили – значения, соответствующие 25, 50 и 75 -й персентилям, т. е. четвертям распределения. p Интерквартильный диапазон – разница между первой и третьей квартилями. p Медиана - середина распределения , т. е. одна половина заданного набора данных имеет меньшие значения, а другая – большие значения. 3

Среднее значение = сумма значений, деленная на их количество. n сумма всех значений X Среднее значение = сумма значений, деленная на их количество. n сумма всех значений X = Х 1 + Х 2 +…+Хn i=1 = = общее количество наблюдений ∑ xi n n Усеченное среднее – среднее для набора данных, из которого исключены несколько процентов значений с обоих концов распределения. n p Среднее геометрическое (Х )*…*(Х ) p 1 2 n 4

Меры изменчивости 5 Меры изменчивости 5

Основные понятия p p Изменчивость характеризует различия между данными или разброс от центра Диапазон Основные понятия p p Изменчивость характеризует различия между данными или разброс от центра Диапазон = разница между максимальным и минимальным значениями распределения. Отклонение = наиболее распространенная мера изменчивости Стандартное отклонение 6

Вероятность 7 Вероятность 7

Основные понятия Случайные события - события, в которых нельзя точно определить отдельные исходы, но Основные понятия Случайные события - события, в которых нельзя точно определить отдельные исходы, но суммарный исход имеет определенную закономерность. Определение вероятности = количество успешных исходов на их общее число. Относительная частота = количество повторений события на общее число испытаний. 8

Распределение вероятностей = набор вероятностей для нескольких событий p Вероятность каждого события или комбинации Распределение вероятностей = набор вероятностей для нескольких событий p Вероятность каждого события или комбинации событий должна находиться в диапазоне от 0 до 1. p Сумма вероятностей всех возможных событий должна быть равна 1. 9

Случайные переменные Случайная переменная - переменная, которая принимает значения случайным образом в соответствии с Случайные переменные Случайная переменная - переменная, которая принимает значения случайным образом в соответствии с распределением вероятностей. p Дискретная случайная переменная принимает значения в соответствии с дискретным распределением вероятностей. p Непрерывная случайная переменная - в соответствии с непрерывным распределением вероятностей. p 10

Случайные выборки данных Наблюдение - каждое зарегистрированное значение, которое принимает случайная переменная. p Выборка Случайные выборки данных Наблюдение - каждое зарегистрированное значение, которое принимает случайная переменная. p Выборка - набор нескольких таких наблюдений. p Случайная выборка - если наблюдения генерируются совершенно случайным образом и без какой-либо тенденции. p 11

Доверительные интервалы 12 Доверительные интервалы 12

Свойства распределений и выборок 1. Выборочное среднее приблизительно удовлетворяет нормальному распределению со средним μ Свойства распределений и выборок 1. Выборочное среднее приблизительно удовлетворяет нормальному распределению со средним μ и стандартным отклонением σ / √ n, где μ — среднее распределения, из которого сделана выборка, σ — стандартное отклонение распределения, из которого сделана выборка, п — размер выборки. В общем это свойство обозначается следующим выражением: х = N ( μ, σ / √ n) В нормальном распределении около 95% значений попадают в диапазон двух стандартных отклонений от среднего. 13

Пример доверительного интервала p p Если σ ( σ — стандартное отклонение распределения, из Пример доверительного интервала p p Если σ ( σ — стандартное отклонение распределения, из которого сделана выборка) = 10 , а п (п — размер выборки ) = 25 , то выборочное среднее приблизительно удовлетворяет нормальному распределению со средним μ и стандартным отклонением 2, т. е. с вероятностью 95% выборочное среднее попадает в диапазон отклонения на 4 единицы от μ. Это значит, что если выборочное среднее равно 20, то μ ( μ — среднее распределения, из которого сделана выборка) с вероятностью 95% находится в диапазоне от 16 до 24. Этот диапазон называется доверительным интервалом (x- μ / (σ / √ n)) – N (0; 1) 14

Проверка гипотез 15 Проверка гипотез 15

Четыре основных элемента 1. 2. 3. 4. Формулировка нулевой гипотезы Но. Формулировка альтернативной гипотезы Четыре основных элемента 1. 2. 3. 4. Формулировка нулевой гипотезы Но. Формулировка альтернативной гипотезы На. Вычисление статистики теста. Определение области непринятия гипотезы. 16

Типы ошибок p p Никогда нет абсолютной уверенности в том, что выводы не содержат Типы ошибок p p Никогда нет абсолютной уверенности в том, что выводы не содержат ошибок, но вероятность ошибок можно сократить. Во время проверки гипотез может возникнуть два типа ошибок. Ошибка первого типа заключается в отказе от нулевой гипотезы, которая на самом деле является истинной. Ошибка второго типа заключается в принятии нулевой гипотезы, тогда как на самом деле истинной является альтернативная гипотеза. Вероятность возникновения ошибки первого типа обозначается греческой буквой а, а вероятность возникновения ошибки второго типа — буквой ß. 17

Пример проверки гипотезы p p p Фабрика по производству резисторов: количество дефектных резисторов в Пример проверки гипотезы p p p Фабрика по производству резисторов: количество дефектных резисторов в партии соответствует нормальному распределению со средним 50 и стандартным отклонением 15. На фабрике предлагается внедрить новый технологический процесс, который позволяет сократить количество дефектных резисторов с экономией материалов. После анализа выборки из 25 партий среднее количество дефектных резисторов в партии равно 45. Можно ли на основании этих данных утверждать, что новый технологический процесс позволяет сократить количество дефектных резисторов или число 45 является результатом допустимого случайного отклонения, а внедренный технологический процесс ни на что не влияет? 18