Л3 Сводка и группировка.ppt
- Количество слайдов: 53
СВОДКА И ГРУППИРОВКА СТАТИСТИЧЕСКИХ ДАННЫХ План: 1. Статистическая сводка: ее содержание и задачи. 2. Группировка – основа статистической сводки. Виды группировок. 3. Вторичные группировки. 4. Статистические ряды распределения. Основные характеристики рядов распределения. 5. Статистические таблицы и графики. Литература: Шмойлова Р. А. и др. Теория статистики. – М. : Финансы и статистика, 2006.
1. Статистическая сводка: ее содержание и задачи Задача сводки – перейти от характеристики каждой отдельной единицы совокупности к характеристике всей совокупности в целом. Для этого необходимо упорядочить и обобщить первичный материал и дать характеристику всего объекта при помощи обобщающих показателей. Одним из главных требований научного применения статистического метода является разделение совокупности на качественно однородные группы и их детальное изучение.
Сводка включает в себя: 1. Обязательный контроль собранных данных. 2. Систематизацию и группировку материала. 3. Составление статистических таблиц и получение графиков. 4. Подведение итогов результатов, т. е. получение вторичных показателей (средних и относительных величин).
Проведению сводки предшествует разработка ее программы: - выбор группировочных признаков; - определение порядка формирования групп; - разработка системы статистических показателей для характеристики групп и объекта в целом; - разработка системы макетов статистических таблиц, в которых будут даны результаты сводки.
Статистическая сводка – это научно организованная обработка материала статистических наблюдений по заранее организованной программе с целью обобщения конкретных индивидуальных данных на всю статистическую совокупность для изучений типичных черт и закономерности явления.
Классификация видов сводки Виды сводок Глубина обрабатываемого материала простая Технология обработки данных компьютерная Способы разработки сводки централизованная Д сложная яручная нецентрализованнаяецен трали-
2. Группировка – основа статистической сводки. Виды группировок Статистические группировки – это процесс образования однородных групп путем разбиения изучаемой совокупности на части по некоторому существенному признаку. Цель группировки – получить однородные по данному признаку группы. Признак, по которому производится распределение совокупности на группы, называется группировочным признаком (основанием группировки).
Метод группировки позволяет решить задачи: выделение социально-экономических типов явлений; n Изучение структуры совокупности и структурных сдвигов (т. е. Изменение в структуре); n выявление взаимосвязи между исследуемыми признаками. В соответствии с этими тремя задачами выделяют три вида группировок: n 1. типологическая; n 2. структурная; n 3. аналитическая. n
Типологическая группировка – это разделение исследуемой качественно разнородной совокупности на однородные группы единиц Группы образуются по определенным социально-экономическим типам. При построении типологической группировки в качестве группировочного признака могут выступать как качественные, так и количественные признаки. Группировка по качественному признаку предполагает, что число выделенных групп строго соответствует фактическому числу градаций этого признака.
Данные о численности гражданских служащих в федеральных государственных органах 2011 году Численность на конец периода тыс. в % от общей численности человек работников законодательной власти 2, 2 77, 4 исполнительной власти 29, 9 83, 7 судебной власти и прокуратуры 2, 3 51, 8 других государственных органах 1, 5 96, 8 37, 4 81, 2 Всего
Схематично типологическую группировку можно представить: + +
Структурная группировка – это распределение единиц однородной в качественном отношении совокупности в группы по определенному существенному признаку, характеризующему ее состав и структуру. При построении структурной группировки в качестве группировочного признака могут выступать как качественные, так и количественные признаки.
Схематично структурную группировку можно представить: + +
РАСПРЕДЕЛЕНИЕ НАСЕЛЕНИЯ ПО ВОЗРАСТНЫМ ГРУППАМ НА 1 ЯНВАРЯ 2010 г, тысяч человек 2009 Группы по возрасту 2010 Численность 0 -4 7692 7956 5 -9 6643 6881 10 -14 6757 6564 15 -19 9261 8496 20 -24 12573 12256 25 -29 11893 12257 30 -34 10680 10799 35 -39 9853 10069 40 -44 9401 9193 45 -49 11683 11247 50 -54 11197 11261 55 -59 9600 9748 60 -64 5773 6897 65 -69 5481 4479 70 и более 13417 13811
Аналитическая группировка используется для изучения взаимосвязи и зависимостей между изучаемыми социально-экономическими явлениями и признаками, которые характеризуют это явление. В основу кладется факторный признак, под его воздействием изменяются другие признаки, которые называются результативными. Особенности: А) Каждая выделенная группа характеризуется средним значением результативного признака. Б) Если между признаками существует взаимосвязь, то при изменении факторного признака от одной группы к другой среднее значение результативного признака будет систематически изменяться.
Качество продукции и продолжительных договорных связей поставщиков с магазином в kрайоне на 01. 10. 11 г Продолжитель Доля стандартной продукции, ность связей Число % магазинов с магази Всего по В среднем по 1 -му нов поставщиком, группе магазину лет До 3 -х лет 4 280 70 3 -7 9 720 80 7 -11 7 595 85 Свыше 11 5 460 92 итого 25 2055 82, 2
3. Вторичная группировка – операция по образованию новых групп на основе ранее построенной группировки. Перегруппировка необходима, когда имеющиеся группировки несопоставимы изза: 1) различного числа выделенных групп; 2) неодинаковых границ интервалов.
Имеется группировки кредитов по сроку выдачи за 1 и 2 месяцы 2011 г № п/п Группа кредитов Число заключенных договоров, в % к итогу Сумма выданных кредитов в % к итогу 1 1 – 3 87, 05 66, 87 2 3 – 6 10, 43 24, 86 3 6 – 12 1, 80 8, 17 4 Более 12 0, 72 0, 10 100 итого № п/п Группа кредитов Число заключенных договоров в % к итогу Сумма выданных кредитов в % к итогу 1 1 – 6 86, 54 97, 91 2 6 – 12 1, 92 1, 70 3 Более 12 11, 54 0, 39 100 итого
Группа Число заключенных № кредитов договоров, п/п в % к итогу 1 месяц 2 месяц Сумма выданных кредитов, в % к итогу 1 месяц 2 месяц 1 1 – 6 97, 48 86, 54 91, 73 97, 91 2 6 – 12 1, 80 1, 92 8, 17 1, 70 3 Более 12 0, 72 11, 54 0, 10 0, 39 100 100 итого
Принцип построения группировок. 1. Необходимо выбрать группировочный признак, отражающий существенность явления. 2. Исключить из совокупности аномальные наблюдения. Аномальные наблюдения - это те единицы совокупности, значения признаков которых резко выделяются из основной массы значений.
3. Определить число групп ФОРМУЛА СТЕРДЖЕССА n=1+3, 322 lg. N; где: n- число групп; N- число единиц совокупности 4. Определить величину (шаг) интервала h – шаг интервала; R – размах вариации; Xmax – максимальное значение признака в совокупности; Xmin – минимальное значение признака в совокупности; n – число интервалов.
5. Определить границы интервалов. 1 интервал: Xmin – Xmin +h 2 интервал: Xmin +h – Xmin +2 h 3 интервал: Xmin +2 h – Xmin +3 h ……………………………………………… n интервал: Xmin +(n-1)h – Xmax 6. Определить конкретные показатели, которые должны характеризовать выделенные группы и совокупность в целом.
4. Статистические ряды распределения. Основные характеристики рядов распределения Статистический ряд распределения – это упорядоченное распределение единиц изучаемой совокупности по определенному существенному признаку. Ряды распределения входят как составляющая часть в сводную обработку данных, но имеют и самостоятельное значение: n используются для изучения структуры исследуемой совокупности; n позволяют судить об однородности совокупности, колеблемости значений признаков и границ их изменения; n на их основе рассчитываются относительные величины структуры, средние показатели, устанавливается типичность обобщающих показателей.
Статистические ряды распределения в зависимости от признака, по которому выполнено распределение, разделяются на: - атрибутивные; - вариационные. Вариационный ряд – это ряд, построенный по количественному признаку. Существует две формы вариационного ряда: - дискретные; - интервальные.
Распределение семей по числу детей Группа семей по Число семей числу детей Тысячи % к итогу Xi Fi w 0 6 5, 9 1 28 27, 5 2 22 21, 6 3 20 19, 6 4 13 12, 7 5 8 7, 8 6 и более 5 4, 9 102 100, 0 Итого
Распределение семей по размеру жилой площади, приходящейся на одного человека № п/п 1 2 3 4 5 Группы семей по размеру жил. площади, приходящейся на одного человека, кв. м 3 -5 5 -7 7 -9 9 -11 11 -13 Итого Число семей с данными размерами жил. площади fi 10 20 30 40 15 115
По своей конструкции ряд распределения состоит из 2 -х видов элементов: -вариантов – значений признака, обозначаются xi ; -частот – численности группы, обозначаются fi. Ряд распределения, состоящий из N единиц, можно представить в следующем виде:
Ряд распределения, состоящий из N единиц, можно представить в следующем виде: Варианты xi Частота fi X 1 f 1 X 2 f 2 … … Xn fn
Распределение рабочих всего предприятия в целом по тарифному разряду. 1 – 5 разряд 2 – 3 разряд 3 – 5 4 – 2 ……………. . ……………… 215 – 3 разряд Первый шаг – ранжирование, т. е. расположение всех вариантов в возрастающем (убывающем) порядке: 2, 2, …, 2, 3, 3, …, 3, 4, … 4, 5, … 5, 6, …, 6 20 + 50 + 60 + 70 + 15 =215
Таблица 8 Распределение рабочих всего предприятия в целом по тарифному разряду Группы Численность рабочих по рабочих, чел. тарифному fi разряду 2 20 3 50 4 60 5 70 6 15 Итого 215
Распределения коммерческих банков по сроку функционирования В результате проведенного статистического наблюдения получены следующие данные: 1 банк – 3, 5 года 2 банк – 4, 1 года 3 банк – 2, 0 года 4 банк – 10, 0 года …………………. 30 банк – 8, 5 года Хmin=2 года; Xmax=10 лет. Разобьем банки по 4 -м группам со сроками функционирования 2 – 4; 4 – 6; 6 – 8; 8 – 10.
Таблица 9 Распределения коммерческих банков по сроку функционирования Группы банков по сроку функционирования, лет. Число банков, fi 2 – 4 5 4 – 6 7 6 – 8 12 8 – 10 6 Итого 30
При построении рядов распределения наряду с частотами fi используются частости wi, накопленные частоты Si и накопленные частости. или Накопленные частоты Si определяются последовательным суммированием частот всех предшествующих (i-1) интервалов. Накопленные частости рассчитываются по формуле : , .
Таблица 8 Распределение рабочих всего предприятия в целом по тарифному разряду Группы Численность Частости Накоплен рабочих по рабочих, ные в% , тарифному чел. частоты частости wi разряду fi Si в % 2 20 9, 30 3 50 23, 26 70 32, 56 4 60 27, 90 130 60, 46 5 70 32, 56 200 93, 02 6 15 6, 98 215 100 Итого 215 100
Таблица 9 Распределения коммерческих банков по сроку функционирования Группы банков по сроку функционирования, лет. Число банков, fi Частость Накоп в % к Накопленная итогу частость, частота, Wi в % к итогу Si 2 – 4 16, 67 5 16, 67 4 – 6 7 23, 33 12 40, 00 6 – 8 12 40, 00 24 80, 00 8 – 10 Итого 5 6 20, 00 30 100
Интервалы бывают открытые и закрытые. Распределение семей по размеру жилой площади, приходящейся на одного человека № п/п 1 2 3 4 5 Число семей с Группы данными Группы семей по размерами размеру жил. семей по жил. размеру площади, жил. , кв. м площади кв. м fi 3 -5 До 5 10 5 -7 20 7 -12 30 12 -15 40 15 -18 15 и более 15 Итого 115
Если используют ряд с неравными интервалами, то рассматривают не частоты, а плотности распределения. Абсолютная плотность распределения определяет, сколько единиц в каждой группе приходится на единицу длины интервала: Относительная плотность – частость, приходящаяся на единицу длины интервала:
Таблица 10 Распределение магазинов по размеру товарооборота Группы магазинов Величина Абсолютная Число по интервала, плотность № магазинов размеру млн. руб. , распределения fi т/о, hi fi/hi млн. руб. 50 0, 5 1 До 50 25 2 50 -120 45 70 3 120 -250 65 130 0, 64 0, 5 4 250 -450 80 200 0, 4 5 450 -980 20 530 итого 235 - 0, 04 -
Для обеспечения анализа вариационных рядов используют графическое изображение ряда, которое позволяет судить о форме распределений единиц совокупности. Дискретные вариационные ряды изображаются графиком, который называется полигоном распределения. Строится в декартовой системе координат. На оси абсцисс в одинаковом масштабе откладываются упорядоченные значения изменяющегося признака, а по оси ординат наносятся значения их частот. Точки, которые получены на пересечении абсциссы и ординаты соединяют прямыми линиями.
Для примера (см. табл. 6) полигон имеет вид:
Для интервальных вариационных рядов используют графическое изображение, которое называется гистограммою. При её построении на оси абсцисс откладываются значения интервалов, а частоты изображаются прямоугольниками, построенными на соответствующих интервалах, высота которых равна соответствующей частоте. В результате получаем график, на котором ряд распределения изображен в виде смежных друг с другом столбиков.
Для примера (см. табл. 7) гистограмма имеет вид:
Для графического изображения вариационного ряда можно использовать кумулятивную кривую, при помощи которой изображается ряд накопленных частот. При этом по оси абсцисс откладываются варианты ряда, а по оси ординат накопленные частоты, которые наносятся на графике в виде перпендикуляров к оси абсцисс в верхних границах интервалов. Затем эти перпендикуляры соединяют и получают ломаную линию т. е кумуляту.
Для примера (табл. 7) кумулята будет иметь следующий вид:
5. Статистические таблицы и графики В статистике таблицы используются для того, чтобы наиболее наглядно и рационально представить результаты сводки и группировки. Статистическая таблица отличается от других табличных форм: n - содержит результаты подсчета эмпирических данных; n - является итогом сводки первоначальной информации. Табличная форма представления числовой информации – это такая форма, когда число располагается на пересечение граф и строк. Основные элементы статистической таблицы составляют ее остов.
Название таблицы (общий заголовок) Содержание строк А 1 Наименования строк (боковые заголовки) Итоговая строка Наименование граф (верхние заголовки) 2 3 4 5 … Итоговая графа
По логическому содержанию таблица представляет собой статистическое предложение, основными элементами которого являются подлежащее и сказуемое. Подлежащим называют то, о чем речь идет в таблице. Подлежащее располагается слева и представляет собой содержимое строк, причем оно обозначается буквами (табл. 4) А, Б, В и т. д. Сказуемое образует система показателей, которые характеризуют объект изучения. Сказуемое представляет собой содержание граф, т. е оно несет информацию о том, какими признаками характеризуется подлежащее.
Существует 3 типа таблиц: -Простые -Групповые -Комбинационные Простые - это таблицы, подлежащее которых содержит перечень единиц изучаемого объекта по различному признаку (территориальному, временному и т. д. ) Простые таблицы содержат лишь описательные сведения, они не дают возможность выявить социально-экономические типы изучаемых явлений, их структуру и взаимосвязи между признаками.
Групповые - подлежащее содержит группировку единиц совокупности по одному количественному либо атрибутивному признаку. Примером являются вариационные ряды распределения. Групповая таблица может быть и более сложной, если в сказуемом приводится не только число единиц в каждой группе, но и ряд других показателей, количественно и качественно характеризующих группы подлежащего.
Комбинационные - подлежащее содержит группировку единиц совокупности по 2 -м или более признакам, причем каждая из групп, построенная по одному признаку, в свою очередь разбивается на подгруппы по какому либо другому признаку и т. д.
Правило построения таблиц 1. Таблица должна иметь общий заголовок, в котором отражается: n -объект наблюдения; n -признаки; n -единицы измерения; n -время, к которому относится наблюдение. 2. Заголовки граф и строк должны быть четкими и краткими. 3. Число показателей сказуемого т. е число граф должно быть ограниченным. 4. Округление чисел должно проводиться с одинаковой степенью точности (0 -1 -2 -3 знака после запятой).
5. Отсутствие данных может быть обусловлено различными причинами, что по разному отражается в таблице: - если данные признаки вообще не подлежат заполнению то ставится знак Х; - если сведения отсутствуют по какой-либо причине, то ставится … ; - если отсутствует явление, то ставится – ; - для отображения очень малых чисел используют следующие формы записей 0, 0; 0, 000 и т. д. 6. Информация, располагаемая в графах таблицы, завершается итоговой строкой с надписями «Итого» или «Всего» .


