2.Сводки и группировки.ppt
- Количество слайдов: 60
СТАТИСТИКА 2. Представление статистических данных Канд. физ. -мат. наук, доцент Ананьева Миляуша Сабитовна
Вопросы 1. 2. 3. 4. Сводка и группировка данных статистического наблюдения. Понятие статистической сводки. Классификация и основные этапы сводки. Статистическая группировка, ее виды и принципы проведения. Основные виды статистической группировки. Группировочный признак. Формула Стерджесса Статистические таблицы и графики: понятие, основные элементы, классификация, принципы построения и анализ. Ряды распределения. Классификация рядов распределения и их элементы. Составляющие ряда распределения. Основные характеристики и графическое изображение вариационного ряда.
2. 2. Статическая сводка 4 Статистическая сводка – научная обработка первичных данных с целью: • получения обобщенных характеристик изучаемого социальноэкономического явления по ряду существенных для него признаков, • выявления типичных черт и закономерностей, присущих изучаемому явлению в целом 4 Статистическая сводка • специальным образом организованная первичная обработка данных статистического наблюдения, включающая: – систематизацию, – группировку данных, – подсчет групповых, итоговых и относительных (средних показателей )
2. 2. Статическая сводка 4 Виды сводок по глубине и точности обработки материала – Простая • операция включающая: – подсчет общих итогов по совокупности единиц наблюдения, – оформление материала в статистических таблицах. – Сложная • комплекс последовательных операций, включающих: – группировку полученных при наблюдении материалов, – составление системы показателей для характеристики типичных групп и подгрупп изучаемой совокупности явлений, – подсчет числа единиц и итогов по каждой группе и подгруппе, и по всему объекту, – представление результатов в виде статистических таблиц.
2. 2. Статическая сводка 4 Виды сводок по форме обработки материала : – централизованная • весь первичный материал поступает в одну организацию, подвергается в ней обработке от начала до конца; – децентрализованная • отчеты предприятий сводятся статистическими органами субъектов РФ, а полученные итоги поступают в Госкомстат РФ и там определяются итоговые показатели в целом по народному хозяйству страны.
2. 2. Статическая сводка 4 Этапы сводки: 1. выбор группировочного признака; 2. определение порядка формирования групп; 3. разработка системы статистических показателей для характеристики групп и объекта в целом; 4. разработка макетов статистических таблиц для представления результатов сводки.
2. 2. Статическая группировка 4 В сводке отдельные единицы статистической совокупности объединяются в группы при помощи метода группировок 4 Группировка – процесс образования однородных групп на основе расчленения статистической совокупности на части или объединения изучаемых единиц в частные совокупности по существенным признакам. 4 Задачи группировки: • выделение социально-экономических типов явлений; • изучение структуры явления и структурных сдвигов, происходящих в нем; • выявление связи и зависимости между явлениями.
2. 2. Статическая группировка 4 Виды группировок: – типологическая • разделение качественно разнородной совокупности на классы или однородные группы; – структурная • разделение однородной совокупности на группы, характеризующие ее структуру по какому-либо варьируемому признаку; – аналитическая • выявление взаимосвязи между изучаемыми явлениями и их признаками (факторными и результативными); – комбинированная, образованная по двум или более признакам.
2. 2. Виды группировок
2. 2. Виды группировок
2. 2. Виды группировок
2. 2. Виды группировок 4 В зависимости от числа признаков: – простые (по одному признаку) • ряды распределения (один показатель – численность группы) – сложные, многомерные (по двум и более признакам) • комбинационная группировка, базирующаяся на двух и более признаках, взятых во взаимосвязи. 4 По отношениям между признаками: – иерархические группировки (многомерная, зависимость второго признака от первого • классификация отраслей промышленности по подотраслям – неиерархические группировки (строгой зависимости второго признака от первого не существует)
2. 2. Виды группировок 4 По очередности обработки информации: – первичные, составленные на основе первичных данных, – вторичные, являющиеся результатом перегруппировки сгруппированного ранее материала. 4 В соответствии со временным критерием: – моментные (на определенный момент или за определенный период), – динамические, показывающие переходы единиц из одних групп в другие.
2. 2. Построение группировок
2. 2. Построение группировок 4 Выбор группировочного признака • основание (существенное свойство объекта) для разделения объектов на группы • признаки в основании группы: – количественные (имеют числовое выражение) » Объем выпускаемой продукции, возраст человека, доход сотрудника фирмы и т. д. ). – качественные (отражают состояние единицы совокупности) » пол, отраслевая принадлежность предприятия, форма собственности фирмы и т. д. 4 Определение количества групп: 4 Определение интервала группировки • значение варьирующего признака, лежащее в определенных границах 4 Вторичная группировка – Задачи: • приведение данных к сопоставимым результатам; • укрупнение интервалов; • долевая перегруппировка (образование новых групп с меньшими интервалами).
2. 2. Построение группировок 4 Определение числа групп: 4 Число групп выбирается так, чтобы отразить разнообразие значений признака в совокупности и в то же время закономерность распределении, его форму не исказить случайными колебаниями частот. – Если групп будет слишком мало, то не проявится закономерность вариации. – Если групп будет чрезмерно много, то случайные скачки частот исказят форму распределения. – Если основание – атрибутивный (качественный) признак, то число групп столько, сколько существует уровней данного признака. – Если основание – количественный признак, то число групп в каждом конкретном случае исходит из степени колеблемости признака, из особенностей объекта и цели исследования.
2. 2. Построение группировок
2. 2. Построение группировок
2. 2. Построение группировок 4 Интервал - количественные границы групп, промежуток между максимальным и минимальным значениями признака в группе. 4 Интервалы: • Равные и неравные • Закрытые (когда имеется верхняя и нижняя граница) и открытые (когда одна из границ отсутствует).
2. 2. Построение группировок
2. 2. Построение группировок
2. 2. Построение группировок
2. 2. Построение группировок
Построение группировок
Построение группировок
Пример 2 4 1) В качестве группировочного признака возьмем капитал банка. 4 2) Образуем четыре группы банков с равными интервалами. 4 3) Величину интервала определим по формуле: (323, 0– 156, 8)/4=41, 6 42. 4 Обозначим границы групп: • • 1 -я группа – 156– 198 2 -я группа – 198– 240 3 -я группа – 240– 282 4 -я группа – 282– 324
Пример 2
Пример 2
Пример 2
Пример 2. Структурная группировка, в % к итогу
Пример 2. Структурная группировка
Пример 2. Структурная группировка
Пример 2. Структурная группировка
Пример 2. Аналитическая группировка
Пример 2. Аналитическая группировка
Пример 2. Аналитическая группировка
2. 2. Вторичная группировка 4 Вторичная группировка – операция по образованию новых групп на основе ранее осуществленной группировки. • Причина перегруппировки: группировки, построенные за один и тот же период времени, но для разных объектов или, наоборот, для одного объекта, но за два разных периода времени могут оказаться несопоставимыми из-за различного числа выделенных групп или неодинаковости границ интервалов. • применяется для уточнения характеристики изучаемого явления (в случае, когда первоначальная группировка не позволяет четко выявить характер распределения единиц совокупности), либо для приведения к сопоставимому виду группировок и сравнительного анализа. 4 Способы образования новых групп: – изменение (чаще укрупнение) первоначальных интервалов; – долевая перегруппировка на основе закрепления за каждой группой определенной доли единиц совокупности.
2. 3. Формы представления статистических данных 4 Статистические данные должны быть представлены так, чтобы ими можно было пользоваться. 4 Формы представления данных: – Текстовая • включение данных в текст при малом количестве цифровых данных; – Табличная • представление данных в таблицах; • самая распространенная, • более эффективная форма – Графическая • выражение данных в виде графиков. 4 Статистическая таблица – это система строк и столбцов, в которых в определенной последовательности и связи излагается статистическая информация о социально-экономических явлениях. 4 Отличается от математических таблиц, которые по начальным условиям позволяют получить тот или иной результат.
2. 3. Статистическая таблица 4 Таблица представляет пересечение граф и строк, которые формируют остов таблицы. 4 Статистическая таблица содержит три вида заголовков: – общий • является внешним заголовком • отражает содержание всей таблицы (к какому месту и времени она относится) • располагается над макетом таблицы по центру. – верхние • характеризуют содержание граф (заголовки сказуемого) – боковые • боковые (заголовки подлежащего) – строк • являются внутренними заголовками 4 Макет таблицы – остов таблицы, заполненный заголовками, образует – если на пересечении граф и строк цифры, то статистическая таблица – полная
2. 3. Статистическая таблица
2. 3. Статистическая таблица 4 По логическому содержанию таблица представляет «статистическое предложение» , основными элементами которого являются подлежащее и сказуемое. 4 Подлежащее – – – объект, который характеризуется цифрами одна или несколько совокупностей, отдельные единицы совокупности в порядке их перечня или сгруппированные по каким-либо признакам, территориальные единицы и т. д. . обычно подлежащее таблицы дается в левой (реже в верхней) части, в наименовании строк. 4 Сказуемое статистической таблицы – система показателей, которыми характеризуется объект изучения, т. е. подлежащее таблицы. – – формирует верхние заголовки составляет содержание граф с логически последовательным расположением показателей слева направо. • обязателен заголовок таблицы, в котором указывается к какой категории и к какому времени относятся данные таблицы. 4 Расположение подлежащего и сказуемого может меняться местами для более полного и лучшего способа прочтения и анализа исходной информации об исследуемой совокупности.
2. 3. Статистическая таблица 4 Виды таблиц по характеру подлежащего: • простые – в подлежащем простой таблицы объект изучения не подразделяется на группы » монографические (подлежащее содержит одну группу единиц совокупности по одному признаку) » перечневые (подлежащее содержит перечень единиц совокупности или совокупность в целом) • групповые – объект изучения подразделяется на группы по одному признаку, а в сказуемом указываются число единиц в группах (абсолютное или в процентах) и сводные показатели по группам • комбинационные – в подлежащем комбинационной таблицы совокупность подразделяется на группы не по одному, а по нескольким признакам
2. 3. Статистическая таблица 4 Состав статистической таблицы – Заголовки столбцов • содержат названия показателей и их единицы измерения. – Итоговая строка • завершает таблицу и располагается в ее конце, но иногда бывает первой: в этом случае во второй строке делается запись «в том числе» , и последующие строки содержат составляющие итоговой строки. – Цифровые данные • записываются с одной и той же степенью точности в пределах каждого столбца, при этом разряды чисел располагаются под разрядами, а целая часть отделяется от дробной запятой. 4 Статистические таблицы, как средство наглядного представления цифровой информации, должны быть правильно оформлены. 4 В таблице не должно быть пустых клеток: если данные равны нулю, то ставится знак «–» (прочерк); если данные не известны, то делается запись «сведений нет» или ставится знак «…» (троеточие). Если значение показателя не равно нулю, но первая значащая цифра появляется после принятой степени точности, то делается запись 0, 0 (если, скажем, была принята степень точности 0, 1).
2. 3. Графики 4 Иногда статистические таблицы дополняются графиками, когда ставится цель 4 4 4 подчеркнуть какую-то особенность данных, провести их сравнение. Графическая форма является самой эффективной формой представления данных с точки зрения их восприятия. С помощью графиков достигается наглядность характеристики структуры, динамики, взаимосвязи явлений, их сравнения. Статистические графики – это условные изображения числовых величин и их соотношений посредством линий, геометрических фигур, рисунков или географических карт-схем. Графическая форма облегчает рассмотрение статистических данных, делает их наглядными, выразительными, обозримыми. Однако графики имеют определенные ограничения: прежде всего, график не может включить столько данных, сколько может войти в таблицу; кроме того, на графике показываются всегда округленные данные – не точные, а приблизительные. Таким образом, график используется только для изображения общей ситуации, а не деталей. Последний недостаток – трудоемкость построения графиков. Он может быть преодолен использованием персонального компьютера (например, «Мастером диаграмм» из пакета Microsoft Office Excel).
2. 3. Графики 4 Статистический график – условные изображения статистических данных в виде различных геометрических образов. 4 Графический образ (основа графика) – геометрические знаки – совокупность точек, линий, фигур, с помощью которых изображаются статистические показатели. 4 Главное достоинство графиков – наглядность 4 Виды графиков – – – График Гистограмма Ленточная диаграмма Круговая диаграмма Квадратная диаграмма и др.
2. 3. Графики 4 Вспомогательные элементы графика: – экспликация графика • словесное описание содержания, • включает в себя общий заголовок графика, подписи вдоль масштабных шкал и пояснения к отдельным частям графика. – пространственные ориентиры – масштабные ориентиры • масштабная шкала – линия, отдельные точки которой могут быть прочитаны как определённые числа • масштаб равномерной шкалы – длина отрезка (графический интервал), принятого за единицу и измеренного в каких-либо мерах. – Чем меньше масштаб, тем гуще располагаются на шкале точки, имеющие одно и тоже значение. • построить шкалу – значит на заданном носителе шкалы разместить точки и обозначить их соответствующими числами согласно условиям задачи. – поле графика • пространство, в котором размещаются образующие график геометрические знаки • характеризуется его форматом, т. е. размером и пропорциями (соотношением сторон). – удобен для восприятия глазом человека прямоугольный лист 1: 1, 474 (примерно 5: 7) – для копировально-множительной техники (формат А 4, т. е. 210 мм: на 297 мм).
2. 3. Графики 4 Виды графиков 4 по характеру графического образа: – объемные – линейные – плоскостные 4 по способу построения: – диаграммы • чертеж, показывающий соотношение статистических данных при помощи разнообразных геометрических и изобразительных средств – статистические карты • предназначены для графического изображения одноименных показателей, относящихся к разным территориям. • в основе изображения географическая карта • изображение на карте статистических данных называется картограммой или картодиаграммой.
2. 3. Графики
2. 3. Графики
2. 4. Статистическое распределение 4 Классификация – систематизированное распределение явлений и объектов на определенные группы, классы, разряды на основании их сходства и различия, удовлетворяющее условиям: – в основе лежит качественный признак; – стандартны и устанавливаются органами государственной и международной статистики; – устойчивы, так как остаются неизменными в течение длительного периода времени. 4 Ряды распределения – простейшие группировки, в которых каждая выделенная группа характеризуется только частотой – атрибутивные (по качественному признаку) – вариационные (по количественному признаку)
2. 4. Статистический ряд 4 Статистическая совокупность • множество социально-экономических объектов или явлений общественной жизни, объединенных качественной основой, но отличающихся друг от друга отдельными признаками 4 Член совокупности – отдельный объект множества 4 Варьирующий признак – количественный признак объекта 4 Ряд вариант – первичный перечень членов совокупности и соответствующих значений признака. 4 Вариационный ряд – ряд распределения, построенный по количественному признаку, состоящий из двух элементов: вариантов и частот. 4 Варианта xi – отдельное значение признака, которое он принимает в вариационном ряду, т. е. конкретное значение варьирующего признака. 4 Частоты – численности отдельных вариант или каждой группы вариационного ряда. Сумма всех частот определяет численность всей совокупности, ее объем.
2. 4. Статистический ряд
2. 4. Вариационный ряд 4 Дискретный вариационный ряд – это ряд распределения, в котором группы составлены по признаку, изменяющемуся прерывно, т. е. через определенное число единиц и характеризуют распределение единиц совокупности по дискретному признаку, принимающему только целые значения (группы студентов по баллам в сессию 5, 4, 3, 2). 4 Интервальный вариационный ряд – это ряд распределения, в котором группировочный признак, составляющий основание группировки, может принимать в интервале любые значения, отличающиеся друг от друга на сколь угодную малую величину. 4 Простой статистический ряд – результат статистического наблюдения в виде перечня n членов статистической совокупности, соответствующих им значений признака (вариант) xi (i=1, 2, …, n)
2. 4. Вариационный ряд 4 Графики 4 Полигон (многоугольник) распределения – используется при изображении дискретных вариационных рядов – для построения в прямоугольной системе координат по оси абсцисс в одинаковом масштабе откладываются ранжированные значения варьирующего признака, а по оси ординат наносится шкала частот, – полученные на пересечении оси абсцисс (х) и оси ординат (у) точки соединяются отрезками. 4 Гистограмма – применяется для изображения интервального вариационного ряда, – на оси абсцисс откладываются величины интервалов, а частоты изображаются прямоугольниками, построенным на соответствующих интервалах, высотой пропорциональной частотам – гистограмма преобразуется в полигон распределения, если середины верхних сторон прямоугольников соединить прямыми линиями – При построении гистограммы распределения вариационного ряда с неравными интервалами по оси ординат наносят не частоты, а плотность распределения признака в соответствующих интервалах.
2. 4. Вариационный ряд 4 Плотность распределения – это частота, рассчитанная на единицу ширины интервала, т. е. сколько единиц в каждой группе приходится на единицу величины интервала. 4 Кумулята – график, изображающий ряд накопленных частот. – при построении на оси абсцисс откладывают варианты ряда, по оси ординат накопленные частоты, которые наносят на поле графика в виде перпендикуляров к оси в верхних границах интервалов • Общая статистика – отрезки соединяют и получают ломаную линию – кумуляту. • Математическая статистика – кумулята – прерывная линия, состоящая из горизонтальных отрезков • Общая статистика – если при графическом изображении вариационного ряда в виде кумуляты оси х и у поменять местами, то получат огиву. • Математическая статистика – огива – плавная линия, огибающая кумуляту
2. 4. Вариационный ряд 4 Объем совокупности N – общее число членов совокупности; n – число вариант 4 Частота признака fi – число членов совокупности i-й группы
2. 4. Вариационный ряд 4 Частота признака fi – число членов совокупности i-й группы 4 Относительная частота рi (частость, доля) - отношение частоты признака к объему совокупности 4 Накопленная частота Fi - общее число членов совокупности, имеющих значение признака, меньшее или равное данному 4 Накопленная частость Рi - общее число членов совокупности, имеющих значение признака, меньшее или равное данному
Пример 3 4 Построить дискретный вариационный ряд и начертить полигон распределения размеров 45 пар мужской обуви, проданных магазином за день: 39, 41, 40, 42, 44, 40, 43, 42, 41, 43, 39, 42, 41, 42, 39, 41, 37, 43, 41, 38, 43, 42, 41, 40, 41, 38, 44, 40, 39, 41, 40, 42, 40, 41, 42, 40, 43, 38, 39, 41, 42
Пример 3 Размер обуви Кол-во проданных пар 37 38 39 40 41 42 43 44 1 3 5 8 12 9 5 2 Всего 45
Пример 4 4 Построить дискретный вариационный ряд и начертить полигон распределения 60 абитуриентов по числу баллов, полученных ими на приемных экзаменах: 20, 19, 22, 24, 21, 18, 23, 17, 20, 16, 15, 23, 21, 24, 21, 18, 23, 21, 19, 20, 24, 21, 20, 18, 17, 22, 20, 16, 22, 18, 20, 17, 21, 17, 19, 20, 21, 18, 22, 23, 21, 25, 22, 20, 19, 21, 24, 23, 21, 19, 22, 21, 19, 20, 23, 25, 21. 4 Построить графики вариационного ряда