Сводка, группировка и распределение.pptx
- Количество слайдов: 17
Тема 3. Сводка и группировка статистических данных 1. Понятие о сводке и группировке данных 2. Алгоритм проведения группировки данных 3. Ряды распределения и их значение в статистике
Статистическая сводка это комплекс последовательных операций по обобщению конкретных единичных фактов, образующих совокупность, для выявления типичных черт и закономерностей, присущих изучаемому явлению в целом. Сводка включает в себя систематизацию и группировку данных, составление таблиц, подсчет групповых и общих итогов, расчет производных показателей (средних, относительны величин), ранжирование данных, т. е. их расположение в порядке возрастания или убывания.
Группировка — это часть сводки данных, при которой множество единиц изучаемой совокупности делится на однородные группы по определенным существенным для них признакам. В основе метода группировки «группировочный признак» . лежит понятие
Группировочный признак — это признак, по которому происходит объединение отдельных единиц совокупности в однородные группы. Виды группировочных признаков количественные дискретные непрерывные качественные (атрибутивные) альтернативные номинальные
Пример типологической группировки данных
Пример структурной группировки данных
Пример аналитической группировки данных
Алгоритм проведения группировки данных 1. Выделить группировочный признак (или признаки), который будет положен в основание группировки, и определить его вид. для количественного признака для качественного признака 2. Проранжировать (упорядочить) исходные данные от наименьшего значения признака к ____ наибольшему. 3. Определить количество групп Если число изучаемых единиц менее 30 единиц, Количество групп для качественного признака то целесообразно выделить три группы. определяется числом категорий существующих Если изучаемая совокупность велика, то число значений данного признака. групп определяется по формуле Стерджесса: где n – количество единиц в изучаемой (выборочной) статистической совокупности. 4. Определить величину интервалов групп Величина интервалов в этом случае принимается равной для всех групп и определяется по формуле: _____ где xmax и xmin – это максимальное и минимальное значения признака в совокупности; m – число групп. 5. По каждой группе и по совокупности изучаемых единиц рассчитать общие итоги.
При построении группировок также необходимо соблюдать следующие правила: 1. В основу группировки необходимо положить наиболее существенные признаки, отвечающие задачам исследования и учитывающие особенности изучаемых явлений. 2. Необходимо брать не один, а несколько группировочных признаков, что позволит всесторонне, лучше и глубже характеризовать сложные явления; 3. Приступая к расчетам по формуле Стерджесса, можно использовать следующий вариант зависимости: 15 -25 25 -45 45 -90 90 -180 180 -360 360 -720 n m 5 6 7 8 9 10 4. Если значение изучаемого признака попадает на границу между интервалами, то необходимо воспользоваться принципом единообразия — левая граница интервала включает в себя обозначенное значение, а правая — не включает.
Ряд распределения это ряд показателей, представляющих распределение единиц совокупности по одному существенному признаку, значения которого расположены в определенной последовательности. Ряд распределения включает два элемента: 1. варианта (x) значения признака; 2. вес или частота (f) – это численность отдельных групп, т. е. числа, которые показывают, сколько раз данное значение признака встречается в исследуемой совокупности. Частоты, выраженные в виде относительных величин (долях единиц, процентах), называются частостями. Сумма всех частот ряда называется его численностью или объемом распределения (n).
Виды рядов распределения вариационные (построены по количественному признаку) дискретные интервальные атрибутивные (построены по качественному признаку)
Например, известен стаж работы персонала организации: 1, 1, 2, 3, 3, 3, 4, 4, 5, 5, 7, 7, 7. Этот ранжированный ряд гораздо легче анализировать, если его преобразовать в ряд распределения. Дискретный вариационный ряд Стаж работы, лет Интервальный вариационный ряд Стаж работы, лет х 1 Кол-во чел. f 4 x До 3 Кол-во чел. f 5 2 1 3 -5 5 3 3 5 -7 2 4 2 5 2 7 и более 3 6 0 Всего 15 7 3 Всего 15
Графическое изображение рядов распределения 1. Дискретные вариационные ряды распределения изображаются с помощью полигона распределения 2. Интервальные вариационные ряды распределения изображаются с помощью гистограммы распределения Гистограмма распределения может быть преобразована в полигон
Графическое изображение рядов распределения Кумулята (кривая «меньше, чем» ) Огива (кривая «больше, чем» )
Кривые распределения нормальное распределение данных несимметричное распределение данных


