004 Сводка и группировка.ppt
- Количество слайдов: 92
“ Add your company slogan ” Сводка и группировка статистических данных LOGO 1
План: 1 Понятие статистической сводки Программа и план сводки 2 Группировка как основа сводки Задачи и виды группировок 3 Определение количества выделяемых групп 2
План: 4 Ряды распределения 5 Вторичная группировка 6 Понятие статистической таблицы. Виды таблиц 7 Правила составления таблиц 3
1. Понятие о статистической сводке. Программа и план сводки ü Статистическая сводка – это второй этап статистического исследования. В результате проведения статистического наблюдения получают первичную информацию, характеризующую отдельные единицы изучаемой совокупности 4
ü Дальнейшая задача статистики: первичные данные систематизируются и с помощью обобщающих показателей дается сводная характеристика всей совокупности 5
Статистическая сводка научно-организованная обработка материалов наблюдения, включающая подсчет групповых и общих итогов, систематизацию, группировку данных, составление таблиц 6
Различают сводку простую и сложную ü При простой сводке ü При сложной сводке производится подсчет только общих итогов по изучаемой совокупности производится: группировка единиц наблюдения; подсчет итогов по каждой группе и по всей совокупности; представление результатов группировки в виде статистических таблиц 7
üПо технике выполнения сводка бывает ручной и механизированной üСтатистическая сводка должна проводиться по определенной программе и плану 8
Содержание сводки: Сводка состоит из следующих этапов: 1. Выбор группировочного признака 2. Определение порядка формирования групп 3. Разработка системы статистических показателей для характеристики отдельных групп и совокупности в целом 4. Разработка макетов статистических таблиц для представления результатов сводки 9
План статистической сводки Содержит указания о последовательности и сроках выполнения отдельных частей сводки, ее исполнителях, о порядке изложения и представления результатов 10
2. Группировка как основа сводки. Задачи и виды группировок ü Группировка представляет собой метод, при котором вся исследуемая совокупность разделяется на группы по какому-то существенному признаку 11
Основание группировки üПризнак, лежащий в основе группировки, называется группировочным или основанием группировки üВ зависимости от вида группировочных признаков различают группировки по количественным и качественным (атрибутивным) признакам 12
С помощью метода группировки решаются следующие задачи: ü выделение социально-экономических типов явлений ü изучение структуры явления и структурных сдвигов, происходящих в нем ü выявление связей и зависимостей между отдельными признаками явлений 13
Виды группировки В зависимости от решаемых задач различают типологические, структурные и аналитические группировки 14
Типологическая группировка Это разделение исследуемой совокупности на однородные группы, социально-экономические типы. Примером типологической группировки может служить группировка предприятий России по формам собственности в 2006 г. : 15
Всего Число предприятий и организаций, В процентах к итогу тыс. 4767, 3 100 в том числе по формам собственности: Таблица 1 государственная 160, 4 3, 4 муниципальная 252, 1 5, 3 частная 3837, 6 80, 5 собственность общественных и религиозных организаций (объединений) 252, 5 прочие формы собственности, включая смешанную российскую, иностранную, совместную российскую и иностранную 264, 7 5, 3 Распределение предприятий и организаций РФ по формам собственности (на 1 января 2006 г. ) 5, 6 Источник: Россия в цифрах. Краткий статистический сборник. -Москва, 2006 г. , с. 164 16
Структурная группировка Это группировка, в которой происходит разделение однородной совокупности на группы, характеризующие ее структуру по какому-то варьирующему признаку. Примером структурной группировки может служить группировка населения России по размеру среднедушевого денежного дохода в 2006 г. : 17
Таблица 2 Распределение населения РФ по величине среднедушевых денежных доходов в 2006 году (в процентах к итогу) Все население, 100 в том числе со среднедушевыми денежными доходами в месяц, руб. : до 1000, 0 0, 4 1000, 1 -1500, 0 1, 3 1500, 1 -2000, 0 2, 4 2000, 1 -3000, 0 7, 4 3000, 1 -4000, 0 9, 1 4000, 1 -5000, 0 9, 3 5000, 1 -7000, 0 16, 8 7000, 1 -12000, 0 26, 8 свыше 12000, 0 26, 5 Источник: http: //www. gks. ru/bgd/regl/b 07_13/Iss. WWW. exe/Stg/d 02/06 -20. htm 18
Аналитическая группировка позволяет выявить взаимосвязи между изучаемыми явлениями и их признаками. Примером аналитической группировки может служить группировка действующих кредитных организаций по величине зарегистрированного уставного капитала: 19
Таблица 3 Группировка действующих кредитных организаций РФ по величине зарегистрированного уставного капитала на начало 2007 года Число действующих кредитных организаций - всего 1189 в том числе по величине уставного капитала, млн руб. : до 3 43 от 3 до 10 87 от 10 до 30 168 от 30 до 60 182 от 60 до 150 226 от 150 до 300 217 300 и выше 266 Источник: http: //www. gks. ru/free_doc/2007/grafik/22 -32. htm 20
ØВ зависимости от степени сложности массового явления и задач анализа группировки могут производиться по одному или нескольким признакам ØГруппировка по одному признаку называется простой. Группировка по двум и более признакам называется сложной (комбинационной) 21
От группировок следует отличать классификацию. Классификация – это систематизированное распределение явлений и объектов на определенные группы, классы, разряды с учетом их сходства и различия 22
Отличительные черты классификации: 1) в ее основу кладется качественный признак 2) классификации стандартны. Они устанавливаются органами государственной и международной статистики 3) классификации устойчивы. Они остаются неизменными в течение длительного времени 23
3. Определение количества выделяемых групп Важнейшим вопросом является определение количества выделяемых групп. Если в основании группировки лежит атрибутивный признак, то количество выделяемых групп определяется самим этим признаком. Например, производя группировку студентов, посещающих бассейн, по полу, выделяют две группы: мужчин и женщин 24
Если в основании группировки лежит количественный признак, то производят специальные расчеты для определения количества групп и величин интервалов группировки 25
Интервал группировки - это количественное значение, которое определяется как разность между максимальным и минимальным значениями признака в каждой группе Интервалы группировки могут быть: Равные Неравные 26
Группировки с равными интервалами применяются в тех случаях, когда вариация признака проявляется в сравнительно узких границах и распределение является практически равномерным 27
Размер равного интервала Для группировок с равными интервалами величина интервала h определяется как отношение разности между максимальным и минимальным значениями признака к количеству выделяемых групп: 28
29
где: R – разность между максимальным и минимальным значениями признака (размах вариации) Xmax – максимальное значение признака в совокупности Xmin – минимальное значение признака в совокупности n – количество выделяемых групп 30
üОптимальное количество групп определяется по формуле Стерджеса: n = 1 + 3, 322 lg. N, где: n – количество образуемых групп; N – число единиц совокупности 31
Пример 1 Если изучаемая совокупность состоит из 50 единиц, то число образуемых групп равно 7 Расчеты по формуле Стерджесса ü n = 1 + 3, 322 lg 50 = 7 32
Получаем следующее соотношение: Таблица 4 Определение количества групп по формуле Стерджесса N 15 -24 25 -44 45 -89 90 -179 180 -359 360 -719 n 5 6 7 8 9 10 Источник: результаты расчетов по формуле Стерджесса 33
Ø Интервалы групп могут быть открытые (указана одна из границ) и закрытые (указаны и верхняя и нижняя граница интервала). Величина открытого интервала приравнивается к величине смежного с ним интервала Ø После определения группировочного признака, количества групп и интервалов группировки данные сводки и группировки представляются в виде рядов распределения и оформляются в виде таблиц 34
4. РЯДЫ РАСПРЕДЕЛЕНИЯ Статистический ряд распределения представляет собой упорядоченное распределение единиц изучаемой совокупности на группы по определенному варьирующему признаку 35
Виды рядов распределения В зависимости от признака, положенного в основу образования ряда распределения, различают: Ряды распределения • атрибутивные • вариационные 36
Атрибутивными называют ряды распределения, построенные по качественным признакам. Примерами атрибутивного распределения может служить распределение населения по полу, национальности, месту проживания 37
Вариационными называются ряды распределения, построенные по количественному признаку (в порядке возрастания или убывания признака) Распределение студентов по возрасту, росту 38
варианты Вариационный ряд распределения частоты Ø Вариационный ряд распределения состоит из двух элементов: вариант и частот. Количественные значения признака в вариационном ряду распределения называются вариантами и обозначаются x. Частоты – это числа, показывающие: сколько раз в совокупности встречается данное значение признака, и обозначаются f 39
Сумма всех частот равна численности всей совокупности Частости – это частоты, выраженные в процентах к итогу или в долях. Сумма всех частостей, выраженных в процентах, равна 100 %, в долях – 1 40
ü В зависимости от характера вариации признака вариационные ряды распределения подразделяются на дискретные и интервальные ü Если варианты признаков представлены в виде целых чисел (например, число детей в семье), то такой вариационный ряд называется дискретным ü Когда значения признака выражены в виде интервалов, это интервальный ряд ü Вариационные ряды распределения представляют в виде таблицы, состоящей из двух колонок. В первой колонке приводятся отдельные значения варьирующего признака, т. е. варианты. Во второй – числа, показывающие, сколько раз в совокупности встречается данная варианта, т. е. частоты 41
Пример 2 Ø имеются результаты обследования 20 семей, в которых выяснялось количество детей: Ø 01231234101211031214 Ø Поскольку значения признака представлены в виде целых чисел, построим дискретный ряд распределения 42
Таблица 5 Распределение 20 семей по количеству детей Число семей 0 3 1 8 2 Источник: рассчитано по примеру 2. 4 3 3 4 2 Итого 20 43
Таблица 6 Микроперепись населения России в 1994 г. Домохозяйства, состоящие из (чел): Число домохозяйств в % 1 19, 2 2 26, 2 3 22, 6 4 20, 5 5 11, 5 Итого 100, 0 Источник: статистической информации - краткий статистический сборник "Россия в цифрах", Госкомстат, М. , 1998. v Для графического изображения дискретного вариационного ряда применяется полигон распределения v В качестве интервального вариационного ряда рассмотрим распределение 30 рабочих бригад по размеру зарплаты (см. пример 3) 44
Полигон распределения 45
Таблица 7 Распределение 30 рабочих бригад по размеру месячной заработной платы Заработная плата, руб. Число рабочих, чел. , f в месяц, x Накопленные частоты, S До 5000 3 3 5000 – 10000 12 15 10000 – 15000 10 25 15000 – 20000 5 30 Итого 30 Источник: Числа условные 46
Гистограмма
q Для графического изображения интервального вариационного ряда применяется гистограмма q Любую гистограмму можно преобразовать в полигон распределения. Для этого достаточно последовательно соединить середины верхних оснований образованных прямоугольников 48
Гистограмма
В ряде случаев для графического изображения интервальных вариационных рядов применяется кумулята. Для ее построения сначала необходимо рассчитать накопленные частоты. Они определяются путем последовательного суммирования частот предшествующих интервалов и обозначаются S. Накопленные частоты показывают, сколько единиц совокупности имеют значение признака не больше, чем рассматриваемое. Рассчитаем частоты для примера 3 50
Кумулята
Рассмотрим, как подсчитываются параметры кумуляты на примере таблицы 7 о распределении 30 рабочих по размеру заработной платы. Для первого интервала накопленная частота равна 3 (так как предшествующего интервала нет, 3 + 0 = 3), для второго интервала – 15 (3 + 12 = 15), для третьего – 25 (3 + 12 + 10 = 25 или 15 + 10 = 25), для последнего интервала накопленная частота равна 30 (3 + 12 + 10 + 5 = 30 или 25 + 5 = 30) 52
Накопленная частота последнего интервала должна быть равна сумме частот, т. е. численности единиц совокупности. При построении кумуляты нижней границе первого интервала присваивается накопленная частота, равная 0, и вся накопленная частота интервала присваивается его верхней границе. Для построения кумуляты на оси абцисс откладывают отрезки, соответствующие интервалам значений признака, на оси ординат – накопленные 53
ü На практике приходится пользоваться уже имеющимися группировками, которые могут быть несопоставимы из-за неодинаковых границ интервалов или различного количества выделяемых групп. Для приведения таких группировок к сопоставимому виду используется метод вторичной группировки 54
5. Вторичная группировка ü Вторичная группировка – это образование новых групп на основе ранее произведенной группировки. Применяют два способа образования новых групп на основе ранее произведенной группировки 55
Первый способ состоит в укрупнении называется методом долевой перегруппировки и первоначальных состоит в том, что за каждой интервалов. Это группой закрепляется наиболее простой и определенная доля единиц распространенный совокупности. Рассмотрим два способа на примере способ 56
Таблица 8 Имеется группировка сотрудников двух управлений одного из московских банков по размеру месячной заработной платы, тыс. руб. Кредитное управление Валютное управление Группы Размер зарплаты Число Групп работников, чел. ы Размер зарплаты Число работников, чел. 1 20 -25 2 1 20 -30 2 2 25 -30 4 2 30 -50 6 3 30 -40 6 3 50 -70 18 4 40 -50 8 4 70 и более 4 5 50 и более 4 - - Итого Источник: условные данные 24 Итого 30 57
ü Приведенные данные не позволяют сравнить распределение работников по размеру месячной заработной платы, так как величины интервалов различны, поэтому необходимо привести эти ряды распределения к сопоставимому виду. ü Произведем вторичную группировку, образовав группы с новыми укрупненными интервалами 58
Таблица 9 Группировка сотрудников двух управлений одного из московских банков по размеру месячной заработной платы, тыс. руб. Число работников N Размер группы зарплаты, Кредитное управления 1 до 30 6 в%к итогу 25, 00 2 30 -50 14 3 50 и выше Итого Валютное управления 2 в%к итогу 6, 67 58, 33 6 20, 00 4 16, 67 22 73, 33 24 100, 00 30 100, 00 чел. Источник: рассчитано по табл. 8 чел. 59
v При вторичной группировке методом долевой перегруппировки устанавливаем новые интервалы распределения работников по размеру месячной заработной платы, за каждым интервалом закрепляем определенную долю единиц совокупности. В нашем примере одну из группировок (по Кредитному управлению) оставляем без изменений 60
Ø По валютному управлению производим перегруппировку следующим образом. В первой группе с интервалом от 20 до 30 тыс. руб. частота равна 2. Применительно к группировке по кредитному управлению этот интервал необходимо разбить на два равных интервала : от 20 до 25 тыс. руб. и от 25 до 30 тыс. руб. , при этом исходная частота делится на поровну. Следующий интервал от 30 до 50 тыс. руб. соответственно надо разделить на два равных интервала: от 30 до 40 тыс. руб. и от 40 до 50 тыс. руб. , при этом исходная частота делится поровну (6 : 2 = 3). Последние две группы необходимо объединить в одну с интервалом 50 тыс. руб. и более 61
Таблица 10 Группировка сотрудников двух управлений одного из московских банков по размеру месячной заработной платы, тыс. руб. Число работников Групп ы Размер зарплаты Кредитное управления Валютное управления чел. в % к итогу 1 20 -25 2 8, 33 1 3, 33 2 25 -30 4 16, 67 1 3, 33 3 30 -40 6 25, 00 3 10, 00 4 40 -50 8 33, 33 3 10, 00 5 50 и выше 4 16, 67 22 73, 34 Итого 24 100, 00 30 100, 00 Источник: рассчитано по табл. 8 62
§ 6. Понятие статистической таблицы. Виды таблиц Особое место в статистике занимает табличный метод, который имеет универсальное значение. С помощью статистических таблиц осуществляется представление данных результатов статистического наблюдения, сводки и группировки
Статистическая таблица - форма компактного, наглядного представления статистических данных
Использование электронных таблиц позволяет не только представить результаты наблюдения, сводки и группировки, но и произвести в них сами операции сводки и группировки, а также расчет обобщающих показателей и характеристик, т. е. из пассивного средства представления информации статистические таблицы превратились в активный инструмент ее обработки и анализа
Анализ таблиц позволяет решать многие задачи при изучении изменения явлений во времени, структуры явлений и их взаимосвязей. Таким образом, статистические таблицы выполняют роль универсального средства рационального представления, обобщения и анализа статистической информации
§ Внешне статистическая таблица представляет собой систему построенных особым образом горизонтальных строк и вертикальных столбцов, имеющую общий заголовок, заглавия граф и строк, на пересечении которых и записываются статистические данные
§ Главный язык статистических таблиц – это язык "живых" цифр
Каждая цифра в статистических таблицах – это конкретный показатель, характеризующий размеры или уровни, динамику, структуру или взаимосвязи явлений в конкретных условиях места и времени, т. е. это определенная количественно-качественная характеристика изучаемого явления
В этом и состоит отличие статистических таблиц от других таблиц, например математических, характеризующих абстрактные цифры
Элементы статистической таблицы § Основные элементы, общий макет статистической таблицы представлены на следующем слайде
Таблица номер Общий заголовок (название таблицы) Заголовки граф (столбцов) Групп ы Размер зарплаты Кредитное управления Валютное управления чел. в % к итогу чел. Итого (итоговый столбец) 1 2 ( нумерация столбцов) 3 4 Наименование строк 41 16, 67 1 3, 33 3 30 -40 6 25, 00 Клетка 10, 00 4 40 -50 8 33, 33 3 10, 00 24 100, 00 30 100, 00 А Б Итого (итоговая строка) 1 Сноска Примечания Источник: рассчитано по табл. 8 72
Если таблица не заполнена цифрами, т. е. имеет только общий заголовок, заглавия граф и строк, то мы имеем макет статистической таблицы
Именно с разработки макета начинается процесс составления статистических таблиц. Содержание макета таблицы и порядок расположения показателей определяются задачами статистического исследования
§ Основными элементами статистической таблицы являются подлежащее и сказуемое таблицы
§ Подлежащее таблицы – это объект статистического изучения, т. е. отдельные единицы совокупности, их группы или вся совокупность в целом
Сказуемое таблицы – это статистические показатели, характеризующие изучаемый объект. Подлежащее и показатели сказуемого таблицы должны быть определены очень точно
Как правило, подлежащее располагается в левой части таблицы и составляет содержание строк, а сказуемое – в правой части таблицы и составляет содержание граф
Обычно при расположении показателей сказуемого в таблице придерживаются следующего правила
Правило расположения материала 1. Сначала приводят абсолютные показатели, характеризующие объем изучаемой совокупности. 2. Затем – расчетные относительные показатели, отражающие структуру, динамику и взаимосвязи между показателями
Правило расположения материала 3. Размещают средние показатели как обобщающие характеристики типичных размеров, уровней изучаемых явлений
Для последовательного решения задач исследования возможно и иное расположение показателей сказуемого статистической таблицы
Виды статистических таблиц § Вид статистической таблицы определяется характером разработки показателей ее подлежащего. Различают три вида статистических таблиц: простые, групповые и комбинационные
§ Простые таблицы имеют в подлежащем перечень единиц совокупности, времени или территорий. Отличительная черта простых таблиц – они не имеют в подлежащем группировки. § Если в подлежащем таблицы имеется перечень единиц совокупности, то она называется простой перечневой таблицей. Например:
Производство некоторых видов промышленной Произведено Виды продукции Электроэнерги я, млрд. к. Вт/ч 827 Добыча угля, млн. т 232 Выплавка стали, млн. т 43, 7 продукции в России в 1998 г.
Таблица 11 Производство основных продуктов животноводства в РФ Виды продукции В среднем за год По годам 1976 -1980 1996 -2000 2001 2006 Мясо, тыс. т 7361 4728 4451 5189 Молоко, млн т 48, 2 33, 6 32, 9 31, 4 Яйца, млрд шт. 36, 7 32, 8 35, 2 37, 9 Шерсть, тыс. т 222 53 40 49 Мед, тыс. т 53 50 53 55 Источник: http: //www. gks. ru/bgd/regl/b 07_13/Iss. WWW. exe/Stg/d 04/14 -39. htm 86
§ Если в подлежащем таблицы имеется перечень отдельных стран или территорий, то такая таблица называется простой территориальной таблицей. Например:
Taблица 12 Население G 7, млн чел. на начало 2007 г. Страны Население Занятые Безработные, % от рабочей силы Канада 32, 9 16, 5 6, 03 Франция 61, 7 25, 6 8, 30 Германия 82, 2 39, 1 8, 4 Италия 58, 7 23, 6 6, 0 Япония 127, 8 64, 1 3, 9 Великобритания 60, 8 29, 1 5, 4 США 302, 0 146, 0 4, 6 Источник: http: //www. imf. o rg/external/pubs/ft/weo/2008/01/weodata/
Если в подлежащем таблицы имеется перечень отдельных стран или территорий, то такая таблица называется простой территориальной таблицей. Например:
Taблица 13 Прием студентов в вузы РФ, тысяч чел. В том числе по специализации Производства и строительства Экономики и права Здравоохранения, физ-ры и спорта Искусства и кинематографии Годы Всего 1960 377, 3 166, 4 33, 5 19, 6 2, 5 1990 583, 9 231, 0 39, 6 40, 3 3, 9 2000 1140, 3 411, 6 151, 3 40, 3 9, 4 2001 1263, 4 457, 4 178, 5 41, 9 12, 6 2003 1411, 7 446, 6 303, 9 45, 4 13, 1 2004 1384, 5 463, 9 231, 1 46, 1 14, 4 Источник: http: //www. gks. ru/bgd/regl/b 07_13/Iss. W WW. exe/Stg/d 02/07 -52. htm
Групповые таблицы § Групповыми называются таблицы, имеющие в подлежащем группировку единиц совокупности по одному признаку. Например:
Taблица 14 Городское и сельское население РФ (на начало года) Годы Все население В том числе В процентах к итогу городское сельское 9. 2. 1897 67, 5 9, 9 57, 6 15 85 1914 89, 9 15, 7 74, 2 17 83 15. 1. 1970 129, 9 80, 6 49, 3 62 38 2001 146, 3 107, 1 39, 2 73 27 2007 142, 2 103, 8 38, 4 73 27 Примечание. Сведения за 1897 и 1914 годы даны в современных границах. Составлено по: http: //www. gks. ru/bgd/regl/ b 07_13/Iss. WWW. exe/Stg/d 01/04 -02. htm


