лекция_3 и дом.задание.ppt
- Количество слайдов: 33
СВОДКА И ГРУППИРОВКА МАТЕРИАЛОВ СТАТИСТИЧЕСКОГО НАБЛЮДЕНИЯ 1. Сводка статистических данных, ее задачи и содержание. 2. Метод группировки и его место в системе статистических 3. 4. 5. 6. 7. 8. методов. Задачи, решаемые с помощью метода группировок. Виды статистических группировок. Принципы построения статистических группировок и классификаций. Сравнимость статистических группировок. Ряд распределения. Общие понятия. Графическое изображение рядов распределения.
Сводка статистических данных, ее задачи и содержание Статистическая сводка – это научно организованная обработка материалов наблюдения, включающая в себя: v систематизацию данных; v группировку данных; v составление таблиц; v подсчет групповых и общих интересов; v расчет производных показателей (средних и относительных величин). Статистическая сводка позволяет перейти к обобщающим показателям совокупности в целом и отдельных ее частей, осуществлять анализ и прогнозирование изучаемых процессов.
Классификация видов статистической сводки
Простая сводка есть операция по подсчету общих итогов по совокупности единиц наблюдения или общего объема изучаемого показателя (например, чтобы получить общую численность студентов вузов в РФ, достаточно сложить данные по всем вузам). o Сложная сводка – это комплекс операций, включающих группировку единиц наблюдения, подсчет итогов по каждой группе и по всему объекту и представление данных в виде статистических таблиц. o
o Децентрализованная сводка (именная она используется, как правило, при обработке статистической отчетности) – разработка материала производится последовательными этапами (например, отчеты предприятий сводятся территориальными органами Госкомстата России, а уже итоги по региону поступают в Госкомстат России, и там определяются показатели в целом по народному хозяйству страны). o Централизованная сводка – весь первичный материал поступает в одну организацию, где и подвергается обработке от начала до конца (например, применяется для обработки материалов единовременных статистических обследований).
Статистическая сводка проводится по определенной программе, по которой устанавливаются следующие этапы: Ø выбор группировочных признаков; Ø определение порядка формирования групп; Ø разработка системы статистических показателей для характеристики групп и объекта в целом; Ø разработка макетов статистических таблиц для представления результатов сводки.
План статистической группировки содержит указания: ü о последовательности выполнения отдельных частей сводки; ü о сроках выполнения отдельных частей сводки; ü об ее исполнителях; ü о порядке изложения результатов; ü о порядке представления результатов.
Метод группировки и его место в системе статистических методов Отдельные единицы объединяются в группы при помощи метода группировок. Это позволяет компактно представить информацию, полученную в ходе наблюдения, и на этой основе выявить закономерности, присущие изучаемому явлению. Статистическая группировка – это разделение общей совокупности единиц по одному или нескольким существенным признакам на однородные группы. Распределение единиц по группам осуществляется в соответствии со следующим принципом: различий между единицами внутри одной группы должно быть меньше, чем между единицами другой группы (например, группировка населения по размеру среднедушевого дохода; группировка коммерческих банков по сумме активов баланса). Классификация – (особый вид группировок), представляющая собой устойчивую номенклатуру классов и групп, образованных на основе сходства и различия единиц изучаемого объекта, и выступающая в роли своеобразного статистического стандарта, устанавливаемого на определенный промежуток времени (например, ЕГРПО, Общероссийский классификатор видов экономической деятельности, продукции и услуг – ОКПД классификация основных фондов в промышленности, в строительстве и т. д. ).
Отличительные черты классификации: в основе классификации лежит качественный признак; классификации стандартны – они устанавливаются органами государственной и международной статистики (в отличие от группировки для каждого конкретного исследования); классификации устойчивы в течение определенного времени (однако, если появляются новые группировки единиц, их классы, разряды, то вносятся соответствующие изменения).
Задачи, решаемые с помощью метода группировок: выделение социально-экономических типов явлений; изучение структуры явления и структурных сдвигов, происходящих в нем; выявление связи и зависимости между явлениями; создать основу для последующей сводки и анализа данных (тем самым определяется роль группировок как научной основы сводки).
Итак: o Группировки являются важнейшим статистическим методом обобщения данных, основой для правильного исчисления статистических показателей. o Выбор признака зависит от характера изучаемых явлений и целей группировки. Группировочный признак (основание группировки) – это признак, который служит основанием для распределения явлений по группам (от правильно выбора группировочного признака зависят выводы, которые получают в результате статистического исследования).
Виды статистических группировок
Типологическая – это разделение исследуемой качественно разнородной совокупности на классы, социально-экономические типы, однородные группы единиц в соответствии с правилами научной группировки. При этом под однородностью понимается подчинение всех единиц совокупности одному закону развития в отношении рассматриваемого свойства (например, такая задача ставится при выделении типов акционерных компаний с высокими, средними и низкими дивидендами и установлении распространенность каждого типа в данном регионе; деление населения на такие группы, как молодежь, лица среднего возраста и др. ). Типологические группировки позволяют проследить зарождение, развитие и отмирание различных типов явлений (например, развитие различных форм собственности, формирование новых слоев населения). При построении типологической группировки в качестве группировочного признака могут выступать как количественные, так и качественные (атрибутивные) признаки (например, группировка предприятий и организаций по формам собственности). Довольно часто между типологическими и качественными группировками ставят знак равенства. Это не совсем верно, поскольку некоторые типы явлений могут быть выделены и по количественному признаку (например, группировка предприятий на малые, средние крупные проводится по таким количественным признакам, как численность персонала, объем продукции, стоимость основных фондов). При анализе явлений часто используют пространственные группировки, основанные по географическому признаку.
Структурная – происходит разделение выделенных с помощью типологической группировки типов явлений, однородных совокупностей на труппы, характеризующие их структуру по какому-либо варьирующему признаку (например, группировка хозяйств по объему продукции). В качестве группировочных могут рассматриваться как количественные, так и качественные признаки. Практическое применение структурных группировок позволяет на локальном уровне раскрыть структуру совокупности, проанализировать изучаемые явления и процессы, изменение их во времени и закономерности изменения состава совокупности во времени, если совокупности прослеживаются за ряд последовательных периодов времени. Анализ структурных группировок, взятых за ряд периодов или моментов времени, показывает изменение структуры изучаемых явлений, т. е. структурные сдвиги. Аналитическая – характеризует взаимосвязь между двумя и более признаками, один из которых рассматривается в качестве результативного, а другой – в качестве факторного. Необходимо отметить, что деление группировок в зависимости от цели решаемых задач носит условный характер, т. к. группировка может быть универсальной, т. е. одновременно выделяя типы, показывать структуру совокупности и отражать закономерности изменения значений признака в зависимости от другого.
o Простая – группировка выполнена по одному признаку. o Сложная – группировка выполнена по двум и более признакам: – комбинированная (два – четыре признака) – принцип: сначала группы формируются по одному признаку, затем они делятся на подгруппы по другому признаку, а эти, в свою очередь, по третьему и т. д. Данная группировка позволяет изучить единицы совокупности одновременно по нескольким признакам (необходимо достаточно большое число наблюдений); – многомерная – классификация (группировка) на основе множества признаков (применяется для решения таких задач, как формирование однородных совокупностей, выбор существенных признаков, выделение типичных групп объектов по множеству существенных признаков и пр. ).
Принципы построения статистических группировок и классификаций Построение статистических группировок предполагает решение следующих задач: ü необходимо выбрать группировочный признак; ü определить число групп, на которые нужно разбить изучаемую совокупность; ü зафиксировать границы интервалов группировки; ü для каждой группировки найти конкретные показатели их систему, которые должны характеризовать выделенные группы.
Число групп зависит от задачи исследования и вида признака, положенного в основание группировки, численности совокупности, степени вариации признака. а) при построении группировки по качественному (атрибутивному) признаку групп (как правило) будет столько, сколько имеется градаций, видов, состояний у этого признака (например, в случае проведения группировки населения по полу можно образовать только две группы: мужчины и женщины). б) при построении группировки по количественному признаку необходимо соблюдать определенные правила: – необходимо тщательно изучить экономическую (социальную) сущность изучаемого явления, лишь после этого в соответствии с задачами исследования можно решать вопрос о числе групп, близких по значению к варьирующему признаку единиц совокупности; – при небольшом объеме совокупности не следует образовать большое число групп, так как группы малочисленными (поэтому показатели, рассчитанные для таких групп, не будут представительными и не позволят получить адекватную характеристику для изучаемого явления); – количество групп зависит в первую очередь от степени колеблемости группировочного признака (чем она больше, тем больше должно быть групп); – оптимальное число групп можно определить по формуле Стерджесса: (n – число групп; N – число единиц совокупности); недостаток этого способа заключается в том, что совокупность должна состоять из большого числа единиц, распределение единиц по признаку, положенному в основание группировки, должно быть близко к нормальному и можно получить «пустые» или малочисленные группы; – число групп определяется по показателю среднего квадратического отклонения : если величина интервала равна 0, 5 , то совокупность разбивается на 12 групп, если равна 2/3 – на 9 и если равна – на 9 групп; недостаток: можно получить «пустые» или малочисленные группы;
Интервал группировки – это интервал значений варьирующего признака, лежащих в пределах определенной группы. Каждый интервал имеет v ширину; v верхнюю границу; v нижнюю границу v или хотя бы одну из них. Ширина интервала – разность между верхней и нижней границами.
Равные интервалы Ширина определяется по следующей формуле: h = R/n, где R = Xmax–Xmin – размах варьирования (h называют еще шагом интервала). Правила определения шага: если 1 знак до запятой, то округляют до десятых долей; если 2 знака – то до целого числа, если 3 знака – то до ближайшего числа, кратного 100 или 50. Если у интервалов обозначены границы, то такие интервалы называются закрытыми, и границы групп обозначают так: 290– 540; 540– 790 и т. д. Открытые это те интервалы, у которых указана только одна граница: верхняя – у первого, нижняя у последнего; ширина открытого интервала принимается равной ширине смежного с ним интервала (обозначаются так: До 540; 540– 790; …; 1790 и более). o Если основанием группировки служит непрерывный признак, то верхняя граница j-го интервала равна нижней границе j+1 -го интервала (заметим, если нижняя граница формируется по принципу «включительно» , а верхняя – по принципу «исключительно» , то единицу объекта, значения признака, у которого совпадают с верхней границей интервала, то единицу включают в следующую группу). o Если в основании группировки лежит дискретный признак, то нижняя граница i-го интервала равна верхней границе i + 1 -го интервала, увеличенной на 1.
Неравные интервалы применяются в статистике в том случае, если значения признака варьируют неравномерно и в значительных размерах (например, при анализе макроэкономических показателей). Неравные интервалы могут быть прогрессивно возрастающие или убывающие в арифметической или геометрической прогрессии. Величина интервалов, изменяющихся в арифметической прогрессии, определяются так: , где а - число (константа), которое будет положительным при прогрессивно возрастающих интервалах и отрицательным при прогрессивно убывающих интервалах. В геометрической прогрессии: где q – положительное число (константа), которое при прогрессивно возрастающих интервалах будут больше 1, а при прогрессивно убывающих – меньше 1.
Пример построения групп с неравными интервалами Группа Интервал I 500 -800 II 800 -1300 III 1300 -2000 IV 2000 -2900 V : 2900 -4000 Величина каждого последующего интервала у этой группировки больше предыдущего на 200, т. е. увеличивается в арифметической прогрессии.
При определении границ интервалов группировок исходят из того, что изменение количественного признака приводит к появлению нового качества, т. е. в этом случае граница интервала устанавливается там, где происходит переход от одного качества к другому. Рамка границ зависит от условий места и времени (например, группировка предприятий по числу занятых показывает, что в промышленности и строительстве предприятия со среднесписочной численностью работающих 75 -100 человек относятся к группе малых предприятий, а в отраслях непроизводственной сферы и в розничной торговле – к крупным). Поэтому строя такую группировку, следует дифференцированно устанавливать границы для разных отраслей народного хозяйства (используя группировки со специализированными интервалами). Специализированными называются интервалы, применяющиеся для выделения из совокупности одних и тех же типов по одному и тому же признаку для явлений, находящихся в различных условиях (см. последний пример). Произвольными называются интервалы, ни прогрессивно возрастающие, ни прогрессивно убывающие. Применяются в группировках при изучении социальноэкономический явлений на макроуровне (например, при группировке рабочих по выработке продукции, предприятий по уровню рентабельности, прибыльности и др. )
Сравнимость статистических группировок Группировки, построенные за один и тот период времени, но для разных регионов или, наоборот, для одного региона, но за два разных периода времени, могут оказаться несопоставимыми из-за различного числа выделенных групп или неодинаковости границ интервалов. Для того чтобы привести такие группировки к сопоставимому виду (это позволяет провести их сравнительный анализ), используется метод вторичной группировки. Суть метода состоит в перегруппировке единиц объекта без обращения к первичным данным. Вторичная группировка – это операция по образованию новых групп на основе ранее построенной группировки. o o Применяются два способа образования новых групп. Объединение первоначальных интервалов (наиболее простой и распространенный способ). Применяется , когда нужно переход от мелких интервалов к более крупным интервалам, а также когда границы новых и старых интервалов совпадают. Долевая перегруппировка состоит в образовании новых групп на основе закрепления за каждой группой определенной доли единиц совокупности. Способ употребляется, когда необходимо в ходе перегруппировки данных определить, какая часть (доля) единиц совокупности перейдет из старых групп в новые.
Ряд распределения Статистическим рядом распределения - называется ряд цифровых показателей, представляющих распределение единиц совокупности по одному существенному признаку, разновидности которого расположены в определенной последовательности (другими словами, этот ряд представляет упорядоченное распределение единиц изучаемой совокупности на группы по определенному варьирующему признаку). Ряды распределения иногда входят в качестве составной части сводной обработки данных, при которых единицы совокупности характеризуются многими показателями (например, группы промышленных предприятий), иногда приобретают самостоятельное значение. Ряды распределения строятся с целью изучения ü состава исследуемой совокупности, ü однородности совокупности, ü колеблемости значений признаков и ü границ их изменения. На основе рядов распределения Ø рассчитываются относительные величины структуры, Ø средние показатели; Ø устанавливается типичность обобщающих показателей с позиций наблюдаемых единиц совокупности.
По своей конструкции ряд распределения состоит из двух элементов: вариантов (числовых значений количественного признака или числа групп по выделенному признаку); частот (численности отдельных вариантов или численности групп, т. е. числа элементов в каждой группе). Частости – частоты, выраженные в виде относительных величин (доли единиц – в этом случае сумма всех частот = 1, процентов – сумма = 100%). Ряд частостей обычно применяют, когда совокупность очень велика, кроме того; ряды частостей позволяют сравнивать распределения по одному и тому же признаку в разных по численности совокупностях. Объем распределения (или его численность) – это сумма всех частот. Накопленная частота (накопленная частость) для данного интервала получается суммированием (накапливанием) частот (частостей) у всех предшествующих интервалов, включая данный.
Вариационный ряд оформляется в виде статистической таблицы, например, для совокупности, состоящей из N единиц.
Атрибутивные – это ряды распределения, образованные по качественному (атрибутивному) признаку.
Вариационные – это ряды, образованные по количественному признаку.
При наличии достаточно большого количества вариантов значений признака первичный ряд становится трудно обозримым и непосредственное рассмотрение его не дает представления о распределении единиц по значению признака в совокупности, поэтому первым шагом в упорядочении первичного ряда является его ранжирование, т. е. расположение всех вариантов в возрастающем (или убывающем) порядке. По способу построения вариационные ряды делятся на дискретные и интервальные. Дискретный – в ряду группы составлены по признаку, изменяющемуся дискретно и принимающему только целые значения.
В случае непрерывной вариации величина признака у единиц совокупности может принимать в определенных пределах любые значения, отличающиеся друг от друга на сколько угодно малую величину. Интервальный – вариационный ряд, в котором группировочный признак, составляющий основание группировки, может принимать в определенном интервале любые значения; Строится прежде всего при непрерывной вариации признака, а также если дискретная вариация проявляется в широких пределах, т. е. число вариантов дискретного признака достаточно велико. Если интервальный вариационный ряд построен с равными интервалами, частоты позволяют судить о степени заполнения интервала единицами совокупности, при неравных интервалах – нельзя получить такую информацию, т. к. частоты в интервалах непосредственно несопоставимы. Для того чтобы частоты можно было бы сравнить, исчисляют плотность распределения. Абсолютная плотность распределения – это частота, приходящаяся на единицу интервала, т. е. Относительная плотность распределения – это частость, приходящаяся на единицу интервала, т. е. Плотность распределения используется в рядах с неравными интервалами для расчета моды.
Графическое изображение рядов распределения Графическое изображение облегчает анализ распределения и позволяет судить о форме распределений единиц совокупности по значениям групповых признаков. Для изображения вариационных рядов применяются линейные и плоскостные диаграммы: гистограмма, полигон, кумулята, огива, кривая Лоренца. Гистограмма (гр. histos – ткань, строение) представляет собой столбики с основаниями, равными ширине интервала, и высотой, соответствующей частоте (является разновидностью столбиковых диаграмм). При построении гистограммы ряда с неравными интервалами, на оси ординат наносят не частоты, а плотность распределения признака в соответствующих интервалах. Полигон представляет собой замкнутый многоугольник, абсциссами вершин которого являются значения варьирующих признаков, а ординатами – соответствующие им частоты или частоты (используется для изображения дискретных вариационных рядов). Гистограмма может быть преобразована в полигон распределения, если найти середины сторон прямоугольников и затем эти точки соединить прямыми линиями. Кумулята изображает ряд накопленных частот, и получают откладывая по оси абсцисс варианты ряда, а по оси ординат – накопленные частоты, которые наносят на поле графиков виде перпендикуляров к оси абсцисс в верхних границах интервалов и затем эти перпендикуляры соединяют и получают ломаную (например, в каком-то регионе жилой площадью на одного человека 7 кв. м. владеют не более чем в 40 семьях). Огива – это кумулятивная кривая, построенная откладыванием значений х (вариантов) на оси ординат, а накопленных частот (или частостей) на оси абсцисс (например, огивой можно наглядно изобразить распределение семей по размеру жилой площади, приходящейся на одного человека: предположим, в некотором регионе в 40 семьях размер жилой площади на одного человека не более 7 кв. м. ). Кривая Лорнеца – по оси абсцисс откладывают накопленные частоты, характеризующие распределение единиц совокупности, по оси ординат – кумулятивные доли значений признака в общем объеме. Применяется при исследовании вариационных рядов, когда требуется выяснить параллельное изменение нарастающих долей единиц совокупности и нарастающих долей значений признака в общем объеме (например, при исследовании распределения активов по банкам).
Задание на дом: По данным Лаб. работы № 1 (25 цифр) Произведите группировку своих данных. По полученной группировке определите: 1) Среднее значение показателя, модальное и медианное значение; 2) Показатели вариации абсолютные и относительные; 3) Изобразите полученный интервальный вариационный ряд графически и сделайте выводы о характере распределения.
Задание на дом: o Работу выполнить на отдельном листочке. o Сдать 23. 03. 2012 г. o За несвоевременно сданную домашнюю работу (после 23 марта) накладываются штрафные баллы.
лекция_3 и дом.задание.ppt