![Скачать презентацию Первичная обработка данных статистического наблюдения ПО материалам Скачать презентацию Первичная обработка данных статистического наблюдения ПО материалам](https://present5.com/wp-content/plugins/kama-clic-counter/icons/ppt.jpg)
ОТС 3 Группировки.ppt
- Количество слайдов: 34
Первичная обработка данных статистического наблюдения
ПО материалам стат. наблюдения имеются следующие данные по совокупности предприятий одной из отраслей № п/п Среднегодовая стоимость основных производственн ых фондов, млн. руб. (х) Выпуск продукции, млн. руб. (у) №п/п Среднегодовая стоимость основных производственных фондов, млн. руб. (х) Выпуск продукции, млн. руб. (у) 1 98, 00 103, 00 17 132, 00 128, 00 2 117, 00 113, 00 18 147, 00 152, 00 3 121, 00 126, 00 19 115, 00 95, 00 4 128, 00 140, 00 20 149, 00 130, 00 5 80, 00 70, 00 21 167, 00 175, 00 6 135, 00 120, 00 22 112, 00 99, 00 7 139, 00 162, 00 23 87, 00 93, 00 8 102, 00 110, 00 24 152, 00 149, 00 9 127, 00 129, 00 25 135, 00 130, 00 10 148, 00 161, 00 26 125, 00 123, 00 11 50, 00 150, 00 27 95, 00 80, 00 12 163, 00 170, 00 28 131, 00 125, 00 13 122, 00 134, 00 29 153, 00 137, 00 14 135, 00 146, 00 30 180, 00 50, 00 15 156, 00 177, 00 31 145, 00 130, 00 16 180, 00 190, 00 32 104, 00 116, 00
Представим данную информацию в графическом виде , т. е. в виде точечной диаграммы
Избавляемся от аномальных единиц в первоначальной таблице и на графике (т. е. от предприятий, которые отличаются по своим качественным характеристикам от других предприятий) и получаем следующий график и таблицу
№ п/п Среднегодовая стоимость основных производственных фондов, млн. руб. (х) Выпуск продукции, млн. руб. (у) №п/п Среднегодовая стоимость основных производственных фондов, млн. руб. (х) Выпуск продукции, млн. руб. (у) 1 98, 00 103, 00 17 132, 00 128, 00 2 117, 00 113, 00 18 147, 00 152, 00 3 121, 00 126, 00 19 115, 00 95, 00 4 128, 00 140, 00 20 149, 00 130, 00 5 80, 00 70, 00 21 167, 00 175, 00 6 135, 00 120, 00 22 112, 00 99, 00 7 139, 00 162, 00 23 87, 00 93, 00 8 102, 00 110, 00 24 152, 00 149, 00 9 127, 00 129, 00 25 135, 00 130, 00 10 148, 00 161, 00 26 125, 00 123, 00 11 50, 00 150, 00 27 95, 00 80, 00 12 163, 00 170, 00 28 131, 00 125, 00 13 122, 00 134, 00 29 153, 00 137, 00 14 135, 00 146, 00 30 95, 00 80, 00 15 156, 00 177, 00 31 145, 00 130, 00 16 180, 00 190, 00 32 104, 00 116, 00
№ п/п Среднегодовая стоимость основных производственных фондов, млн. руб. (х) Выпуск продукции, млн. руб. (у) №п/п Среднегодовая стоимость основных производственных фондов, млн. руб. (х) Выпуск продукции, млн. руб. (у) 1 98, 00 103, 00 17 132, 00 128, 00 2 117, 00 113, 00 18 147, 00 152, 00 3 121, 00 126, 00 19 115, 00 95, 00 4 128, 00 140, 00 20 149, 00 130, 00 5 80, 00 70, 00 21 167, 00 175, 00 6 135, 00 120, 00 22 112, 00 99, 00 7 139, 00 162, 00 23 87, 00 93, 00 8 102, 00 110, 00 24 152, 00 149, 00 9 127, 00 129, 00 25 135, 00 130, 00 10 148, 00 161, 00 26 125, 00 123, 00 12 163, 00 170, 00 27 131, 00 125, 00 13 122, 00 134, 00 28 153, 00 137, 00 14 135, 00 146, 00 29 180, 00 50, 00 15 156, 00 177, 00 31 145, 00 130, 00 16 180, 00 190, 00 32 104, 00 116, 00
Проведем сортировку данных предприятий по среднегодовой стоимости основных производственных фондов в порядке возрастания ( используя в MS Excel функцию сортировка) № п/п Среднегодовая стоимость основных производственных фондов, млн. руб. (х) Выпуск продукции, млн. руб. (у) №п/п Среднегодовая стоимость основных производственных фондов, млн. руб. (х) Выпуск продукции, млн. руб. (у) 1 80, 00 70, 00 17 132, 00 128, 00 2 87, 00 93, 00 18 135, 00 120, 00 3 95, 00 80, 00 19 135, 00 146, 00 4 98, 00 103, 00 20 135, 00 130, 00 5 102, 00 110, 00 21 139, 00 162, 00 6 104, 00 116, 00 22 145, 00 130, 00 7 112, 00 99, 00 23 147, 00 152, 00 8 115, 00 95, 00 24 148, 00 161, 00 9 117, 00 113, 00 25 149, 00 130, 00 10 121, 00 126, 00 26 152, 00 149, 00 12 122, 00 134, 00 27 153, 00 137, 00 13 125, 00 123, 00 28 156, 00 177, 00 14 127, 00 129, 00 29 163, 00 170, 00 15 128, 00 140, 00 30 167, 00 175, 00 16 131, 00 125, 00 32 180, 00 190, 00
Определим величину интервала, а также нижнюю и верхнюю границы каждой группы предприятий по среднегодовой стоимости основных производственных фондов, образовав 5 групп с равными интервалами i= (Xmax-Xmin)/N=(180 -80)/5=20 №группы I II IV V нижняя верхняя граница 80 100 120 140 160 граница --100 --120 --140 --160 --180
Определив нижнюю и верхнюю границы, выделяем по ранжированной таблице предприятия попавшие в каждую группу по среднегодовой стоимости ОПФ различными цветами и определяем их число: № п/п Стоимость ОПФ Выпуск продукции 1 80, 00 70, 00 17 132, 00 128, 00 2 87, 00 93, 00 18 135, 00 120, 00 3 95, 00 80, 00 19 135, 00 146, 00 4 98, 00 103, 00 20 135, 00 130, 00 5 102, 00 110, 00 21 139, 00 162, 00 6 104, 00 116, 00 22 145, 00 130, 00 7 112, 00 99, 00 23 147, 00 152, 00 8 115, 00 95, 00 24 148, 00 161, 00 9 117, 00 113, 00 25 149, 00 130, 00 10 121, 00 126, 00 26 152, 00 149, 00 12 122, 00 134, 00 27 153, 00 137, 00 13 125, 00 123, 00 28 156, 00 177, 00 14 127, 00 129, 00 29 163, 00 170, 00 15 128, 00 140, 00 30 167, 00 175, 00 16 131, 00 125, 00 32 180, 00 190, 00
Макет аналитической таблицы № гр. Группы предприятий по стоимости ОПФ Число предприя тий Удельный вес группы предприятий Среднегодовая стоимость ОПФ Выпуск продукции Всего по группе На 1 предприятие I 80 – 100 4 4/30 =Σ =Σ/4 II 100 – 120 5 5/30 =Σ =Σ/5 III 120 – 140 11 11/30 =Σ =Σ/11 IV 140 – 160 7 7/30 =Σ =Σ/7 V 160 – 180 3 3/30 =Σ =Σ/3 30 1 Σ =Σ/30 Итого
Группировка предприятий по среднегодовой стоимости основных производственных фондов № гр. Группы предприятий по стоимости ОПФ Число предприя тий Удельный вес группы предприятий (%) Среднегодовая стоимость ОПФ (млн. руб. ) Выпуск продукции (млн. руб. ) Всего по группе На 1 предприятие I 80 – 100 4 13, 33 360 90 346 86, 5 II 100 – 120 5 16, 67 550 110 533 106, 6 III 120 – 140 11 36, 67 1430 1463 133 IV 140 – 160 7 23, 33 1050 1036 148 V 160 – 180 3 10, 00 510 170 535 178, 3 30 100, 00 3900 130 3913 130, 4 Итого
Гистограмма 12 10 8 6 Series 1 4 2 0 80 – 100 – 120 – 140 – 160 – 180
Круговая диаграмма 5 10% 1 13% 4 23% 2 17% 3 37%
Результатом первичной группировки собранных статистических данных является построение ряда распределения, под которым понимают группировку наблюдений за значениями одного и того же показателя в один и тот же момент времени по разным единицам совокупности. Ряд распределения всегда состоит из двух частей: значений вариант и соответствующих им частот (или частостей). Вариантой называется значение, которое может принимать признак в ряду распределения, частотой – количество единиц наблюдения, обладающих значением данной варианты. Сумма частот всегда равна объему совокупности. Иногда вместо частот рассчитывают частости – это частоты, выраженные либо в долях единицы (тогда сумма всех частостей равна 1), либо в процентах к объему совокупности (сумма частостей будет равна 100 %).
Ряды распределения делятся на атрибутивные и вариационные в зависимости от признака, положенного в основу построения ряда. Если признак качественный, то ряд распределения называется атрибутивным. Примером атрибутивного ряда является распределение предприятий и организаций по формам собственности.
Распределение предприятий и организаций по формам собственности на 1 января 2003 года Формы собственности Число предприятий и организаций, тыс. Государственная 157 Муниципальная 239 Собственность общественных и религиозных объединений (организаций) 244 Частная Прочие формы собственности Всего 2957 248 3845
Если признак, по которому строится ряд распределения, количественный, то ряд называется вариационным. Вариационные интервальные. ряды бывают дискретные и У дискретных рядов значения признака выражены конкретными числами, чаще всего целыми (варианты представляют собой перечень чисел), у интервальных рядов значения показателя задаются в виде интервалов.
Распределение работников предприятия по времени работы в страховой компании Число работающих Время работы в компании, полных лет (варианты) Человек (частоты) в % к итогу (частости) до 1 года (0) 1 2 3 4 5 6 15 17 19 26 10 18 24 11, 6 13, 2 14, 7 20, 2 7, 8 13, 9 18, 6 Итого 129 100, 0
Распределение предприятий-заемщиков по величине коэффициентов ликвидности Коэффициент ликвидности Количество предприятий, единиц Доля предприятий, % до 1, 4 -1, 6 -1, 8 -2, 0 и выше 20 38 44 67 35 9, 8 18, 6 21, 6 32, 8 17, 2 Итого 204 100, 0
Интервалы интервального вариационного ряда имеют две границы: нижнюю и верхнюю. Интервалы могут быть открытыми и закрытыми. У открытых нет одной из границ. При построении интервального ряда в зависимости от характера разброса значений признака используют как равные интервальные промежутки, так и неравные.
Если признак принимает ограниченное число значений, обычно не больше 10, строят дискретные ряды распределения. Если вариант больше, то дискретный ряд теряет свою наглядность и уже целесообразно использовать интервальную форму вариационного ряда. Кроме того, при непрерывной вариации признака, когда его значения в определенных пределах отличаются друг от друга на сколь угодно малую величину, также строят интервальный ряд распределения.
Пример. Предположим, что в результате статистического наблюдения получены следующие данные о средней величине процентной ставки 50 коммерческих банков (%): 14, 7 19, 0 24, 5 20, 8 12, 3 24, 6 17, 0 14, 2 19, 7 18, 8 18, 1 20, 5 21, 0 20, 7 20, 4 14, 7 25, 1 22, 7 19, 0 19, 6 19, 0 18, 9 17, 4 20, 0 13, 8 25, 6 13, 0 19, 0 18, 7 21, 1 13, 3 20, 7 15, 2 19, 9 21, 9 16, 0 16, 9 15, 3 21, 4 20, 4 12, 8 20, 0 14, 3 18, 0 15, 1 23, 8 18, 5 14, 4 21, 0 19, 0
Ход построения интервального ряда распределения с равными интервалами 1. Определим число интервалов. Число интервалов на практике часто задается самим исследователем исходя из задач каждого конкретного наблюдения, но может вычисляться и математически, если распределение значений признака близко к нормальному закону распределения, по формуле Стерджесса: где п – число интервалов, N – объем совокупности (число единиц наблюдения). Для нашего примера:
2. Определим величину интервалов (i) по формуле: Для нашего примера: Интервалы вариационного ряда наглядны, если их границы имеют «круглые» значения, поэтому округлим величину интервала « 1, 9» до « 2» , а минимальное значение признака « 12, 3» до « 12, 0» .
3. Определим границы интервалов. Интервалы, как правило, записывают таким образом, чтобы верхняя граница одного интервала являлась одновременно нижней границей следующего интервала. Для нашего примера получим: 12, 0 – 14, 0; 14, 0 – 16, 0; 16, 0 – 18, 0; 18, 0 – 20, 0; 20, 0 – 22, 0; 22, 0 – 24, 0; 24, 0 – 26, 0. Подобная запись означает, что признак непрерывный. Если же варианты признака принимают строго определенные значения, например, только целые, но их количество слишком велико для построения дискретного ряда, то можно создать интервальный ряд, где нижняя граница интервала не будет совпадать с верхней границей следующего интервала. Кроме того, в нашем примере мы могли бы сделать первый и последний интервалы открытыми, т. е. записать: «до 14, 0» , « 24, 0 и выше» .
4. Подсчитаем частоты. При подсчете частот, если значение признака попадает на границу интервала, то данная единица приписывается к тому интервалу, для которого ее значение является верхней границей, например, значение « 16, 0» в нашем примере будет относиться ко второму интервалу.
Результаты группировки: Распределение коммерческих банков по величине кредитной ставки Процентная ставка банка, % 12, 0 – 14, 0 – 16, 0 – 18, 0 – 20, 0 – 22, 0 – 24, 0 – 26, 0 – Количество банков, ед. 5 9 4 15 11 2 4 50
Пример. Известны следующие данные по основным показателям деятельности крупнейших банков одной из областей РФ: № банка Собственный капитал, млн. руб. Балансовая прибыль, млн. руб. 1 36, 1 40, 4 29, 4 20, 8 35, 4 18 40 37, 8 32, 1 25, 3 30, 1 39, 5 28, 4 18, 4 33, 4 12, 1 37, 8 41, 1 19, 2 39, 3 11 44, 5 22, 4 25, 7 41, 3 24, 8 19, 3 34, 5 48, 3 34, 6 50, 5 38, 6 20, 5 15, 3 38, 4 16, 8 24, 7 28, 8 42, 2 20, 3 42, 5 2 3 4 5 6 7 8 9 10 12 13 14 15 16 17 18 19 20
Необходимо сгруппировать коммерческие банки по величине собственного капитала, а также выполнить структурную группировку для определения состава группировки. По формуле Стерджесса определяем количество групп: n = 1 + 3, 322 lg N=1 + 3, 322 lg 20=5, 23 Зная количество групп, следует определить интервал группировки: млн. руб.
Рабочая таблица для группировки банков по величине собственного капитала. № группы Значение № банка Собственный Балансовая интервала капитал, млн. прибыль, млн. группы руб. 1 18 -24, 5 4 20, 8 18, 4 6 18 12, 1 12 22, 4 20, 5 Итого по группе: 3 29, 4 28, 4 25, 3 39, 3 25, 7 15, 3 15 24, 5 -31 24, 7 75, 7 13 2 19, 3 80, 5 10 Итого по группе: 16 4 24, 8 16, 8 4 105, 2 99, 8
3 31 -37, 5 9 17 19 5 1 32, 1 34, 5 34, 6 35, 4 36, 1 19, 2 28, 8 20, 3 33, 4 30, 1 Итого по группе: 4 37, 5 -44 5 8 7 2 14 172, 7 37, 8 40 40, 4 41, 3 131, 8 41, 1 37, 8 39, 5 38, 4 Итого по группе: 5 44 -50, 5 4 11 18 20 159, 5 44, 5 48, 3 50, 5 156, 8 38, 6 42, 2 42, 5 Итого по группе: 3 143, 3 123, 3
Структурные группировки используются для изучения строения изучаемой совокупности. Структурная группировка по признаку величина собственного капитала банков. Количество банков Интерв ал № п. п. группир единиц овки Собственный капитал Балансовая прибыль % млн. руб. % 1 18 -24, 5 4 20, 0 80, 5 12, 2 75, 7 12, 9 2 24, 5 -31 4 20, 0 105, 2 15, 9 99, 8 17, 0 3 31 -37, 5 5 25, 0 172, 7 26, 1 131, 8 22, 4 4 37, 5 -44 4 20, 0 159, 5 24, 1 156, 8 26, 7 5 44 -50, 5 3 15, 0 143, 3 21, 7 123, 3 21, 0 Итого - 20 100, 0 661, 2 100, 0 587, 4 100, 0
ОТС 3 Группировки.ppt