Эмпирические распределения. Вариационный ряд и его графическая интерпретация
aspir_met_1_2.ppt
- Количество слайдов: 32
Эмпирические распределения
Вариационный ряд и его графическая интерпретация Метод средних величин Генеральная и выборочная совокупности. Способы организации выборки Выборочный метод. Доверительный интервал
Группа чисел, относящихся к одному и тому же признаку, называется статистической совокупностью Каждый элемент совокупности называется вариантой – Хi Количество повторений вариант в совокупности называется частотой – ni Количество элементов в совокупности (сумма частот) называется объемом совокупности – n
1. Ранжирование – запись данных в порядке возрастание или убывания 2. Запись данных в виде вариационного ряда. Это двойной числовой ряд, где в один столбец (строку) записываются варианты, а в другой столбец (строку) их частоты соответственно. Вариационные ряды бывают: интервальными безинтервальными
У спортсменов зарегистрировано время восстановления пульса после прохождения дистанции (с): 81, 78, 84, 90, 78, 81, 74, 90, 74, 81, 84, 81, 90, 81 Объем совокупности – n = 14
Ранжирование: 74 74 78 78 81 81 81 81 81 84 84 90 90 90
П о л и г о н ч а с т о т
Г и с т о г р а м м а
К у м у л я т а (полигон накопленных частот)
Среднее арифметическое – такое значение признака, сумма отклонений от которого всех остальных значений равна нулю с учетом знака отклонения Характеристики (параметры) вариационного ряда
Мода – вариант, который имеет наибольшую частоту, т.е. чаще всего встречается в нашей совокупности Если мода и медиана равны или близки по значению среднему арифметическому, то группу данных можно считать однородной Медиана – вариант, который делит вариационный ряд пополам, т.е. соответствует средней частоте
Ранжирование: 74 74 78 78 81 81 81 81 81 84 84 90 90 90
Дисперсия – средний квадрат отклонений значений признака от среднего арифметического Если n>=30, то делим на n, Если n<30, то делим на (n - 1)
Среднее квадратическое отклонение (стандартное отклонение) Дисперсия и стандартное отклонение показывают рассеивание эмпирических данных вокруг среднего арифметического
Коэффициент вариации – показывает какую часть среднее квадратическое отклонение (рассеивание) составляет от среднего арифметического в процентах Если V <= 10% - статистическую совокупность можно считать однородной Если V > 10% - статистическую совокупность считают неоднородной
Метод средних величин позволяет производить анализ и разделение с помощью характеристик вариационных рядов, а также решать задачи на нормирование и сравнение признаков
Пример: Чтобы проверить ловкость поступающих в секцию баскетбола, им предложили преодолеть бегом определенный маршрут с ведением мяча и у 20 человек зафиксировали время – Хi (c). 20, 24, 12, 20, 24, 28, 30, 20, 28, 24, 18, 20, 24, 30, 20, 18, 20, 24, 30, 20 n = 20
Записываем вариационный ряд и рассчитываем его характеристики
Мо = 20 Ме = (20+24)/2=22
Генеральная совокупность – наиболее общая совокупность объектов, объединенная каким-либо признаком Выборочная совокупность (выборка) – часть генеральной, которая подлежит исследованию
Существуют два требования при составления выборки: Все элементы выборки должны быть подобраны случайно; Количество элементов в выборке должно быть таким, чтобы она достаточно точно представляла генеральную совокупность и, в тоже время, не осложняло исследования.
Способы организации выборки: Жеребьевка (повторный и бесповторный способ) Механический отбор Типический отбор Серийный отбор С помощью таблицы случайных чисел
Для выполнения второго условия необходимо знать следующее: Если в выборке меньше 10 элементов (n<=10), то она не может представлять генеральную совокупность Если в выборке 20 элементов, то она может представлять генеральную совокупность, но только в том случае когда эта совокупность распределена в соответствии с нормальным законом Только при объеме выборки равном 30 (n=30) она может достаточно точно представлять генеральную совокупность
Основная задача выборочного метода – нахождение средних значений (среднее арифметическое и среднее квадратическое отклонение) генеральной совокупности по средним значениям выборочной
Как бы хорошо выборка не представляла генеральную совокупность, их средние значения не будут равны
Вычисляем ошибку репрезентативности, которая показывает величину различия между средними значениями генеральной и выборочной совокупности Если n>=30, то делим на n, Если n<30, то делим на (n - 1)
Надежность (доверительная вероятность) – вероятность, с которой гарантируется точность расчетов при определении средних значений генеральной совокупности по средним выборочной Р = 0,95 Р = 0,99 Р = 0,999 мы рассматриваем три уровня надежности:
Уровень значимости ( ) – дополняет надежность до единицы
Для каждого уровня надежности в специальных таблицах представлен критерий надежности (t) – величина, которая показывает взаимосвязь между объемом выборки и доверительной вероятностью Английский математик Вильям Госсет, известный под псевдонимом Стьюдент определил взаимосвязь между объемом выборки и доверительной вероятностью
Произведение ошибки репрезентативности на критерий Стьюдента (m · t) – абсолютная погрешность вычислений Интервал, в котором с заданной надежностью находится оцениваемый генеральный параметр (среднее арифметическое или стандартное отклонение) называется доверительным интервалом Доверительный интервал можно использовать как основу для модельной характеристики
Пример. Подготовить основу для модельной характеристики функциональных систем легкоатлетов бегунов на 1500 м (І разряд) по показанию жизненной емкости легких (ЖЕЛ) – Хі , л, у 30 легкоатлетов аналогичной специализации 5,46 5,16 5,35 5,42 5,50 5,21 5,16 5,42 5,35 5,21 5,16 5,35 5,10 5,46 5,35 5,21 5,21 5,35 5,42 5,46 5,21 5,42 5,35 5,42 5,21 5,35 5,16 5,46 5,35 5,10
При Р=0,95 по таблице находим t = 2,05