АНД_Лекция_1.ppt
- Количество слайдов: 19
АНАЛИЗ ДАННЫХ Основные понятия в статистике
Да нные (от англ. data) — это представление фактов и идей в формализованном виде, пригодном для передачи и обработки в некотором информационном процессе.
Статистика — общественная наука, изучающая количественную сторону качественно определенных массовых социальноэкономических явлений и закономерностей их развития в конкретных условиях места и времени.
Статистика изучает: массовые общественные явления при помощи статистических показателей (численность населения, количественно произведенной в стране конкретной промышленной, сельскохозяйственной, строительной и другой продукции за определенный период) и их динамику (изменение уровня жизни населения и т. д. ): - количественную сторону общественных явлений и дает количественное, числовое освещение общественных явлений; - количественную сторону общественных явлений в неразрывной связи с их качественным содержанием; - количественную сторону общественных явлений в конкретных условиях места и времени; - количественные связи между общественными явлениями с помощью специальной методологии.
В статистике пять основных понятий: Статистическая совокупность Единица совокупности Признак Статистический показатель Система статистических показателей
Признаки бывают: Дискретные - количественные признаки, которые могут принимать только отдельные значения, без промежуточных значений между ними. Непрерывные признаки - способны принимать любые значения в определенных границах.
Классификация статистических методов Статистические методы анализа данных Описательн ый анализ Основные статистики Таблицы Графики Проверка гипотез Т-критерий ANOVA U-критерий Хи-квадрат Критерий Краскелла. Уоллиса Критерий Уилкоксона Критерий Мак. Немара Определение размера выборки Для контроля качества Для тестирования нового продукта Для проведения опроса Для проверки гипотез Моделирова ние Корреляционно регрессионный анализ Дисперсионны й анализ Анализ временных рядов Дискриминант ный анализ Классификаци онные деревья Модели бинарного выбора (логит. пробит) Логлинейный анализ Анализ надежности Совместный Снижение размерности Разбиение на однородные группы Факторный анализ Кластерный анализ kсредних Анализ соответствий Многомерное шкалирование Кластерный анализ иерархический Кластерный анализ двушаговый Классификац ионные деревья Статистичес кий контроль Контрольные карты Измерители качества процесса Оценка качества измерител ьной системы Эксперимен ты Классические факторные эксперименты Центральные, композиционные эксперименты Эксперименты для смесей Эксперименты по Г. Тагучи Латинские квадраты
три основные стадии экономикостатистического исследования: сбор первичной статистической информации; статистическая сводка и обработка первичной информации; обобщение и интерпретация статистической информации.
Репрезентативность соответствие характеристик, полученных в результате выборочного наблюдения, показателям характеризующим всю совокупность.
Сводка особая стадия статистического исследования, в ходе которой систематизируются первичные материалы статистического наблюдения.
Группировка — объединение единиц совокупности в некоторые группы, имеющие свои характерные особенности, общие черты и сходные размеры изучаемого признака.
Число групп определяется: Если в основании группировки атрибутивный (качественный) признак, то количество групп равняется количеству значений этого признака Если в основании группировки лежит количественный признак, то число групп определяют по формуле Стерджесса: n = 1 + 3, 322*lg. N, где n – число групп N – количество единиц совокупности
Интервал группировки — это значение варьирующего признака, лежащее в определенных пределах. h=R|n = (Xmax-Xmin)|n
Правила округления интервалов: Если интервал имеет один знак до запятой, то полученное значение округляется до десятых (0, 88 = 0, 9; 8, 715 = 8, 7) Если величина интервала имеет два знака до запятой, то полученное значение округляется до целых (11, 11 = 11; 29, 98 = 30) Если интервал трех, четырех и более значимое число, то интервал принимают кратным 50 или 100
В зависимости от решаемых задач различают типологические, структурные и аналитические группировки: Типологическая группировка — представляет собой разделение исследуемой совокупности на однородные группы (группировка предприятий по формам собственности). Структурная группировка — группировка, в которой происходит разделение однородной совокупности на группы, характеризующие ее структуру по какому-то варьирующему признаку (группировка населения по уровню дохода). Аналитическая (факторная) группировка — позволяет выявить взаимосвязи между изучаемыми явлениями и их признаками (группировка банков по сумме уставного капитала, величине активов и балансовой прибыли).
Типологическая группировка Таблица 1 -Группировка полиграфических предприятий одного из городов России по формам собственности Число предприятий Тип собственности Федеральная Акционерная Частная Итого абсолютное 3 7 5 15 в процентах к итогу 20 46, 7 33, 3 100, 0
Структурная группировка Таблица 2 -Группировка населения России по размеру среднедушевого дохода (условные цифры) Численность населения Среднедушевой денежный доход, № п/п тыс. руб. в месяц всего, млн. человек в % к итогу 1. 2. 3. 4. 5. 6. 7. 8. До 1000– 1500– 1700– 2000– 3000– 3500– 5000 и более 3, 4 22, 4 34, 5 28, 7 21, 6 12, 6 9, 8 15, 4 2, 3 15, 2 23, 3 19, 4 14, 6 8, 3 6, 6 10, 3
Аналитическая группировка Таблица 3 -Группировка продолжительности договорных связей книжного магазина и качества продукции Число поставщиков Продолжительность договорных связей магазина с поставщиками, лет абсолютное в % к итогу Доля качественной стандартной книжной продукции, % До 2 3 14 65 3– 5 8 38 69 5– 8 6 29 74 Свыше 8 4 19 91 Итого 21 100 74, 8
Признаки: Факторные признаки — это те признаки, которые влияют на изучаемое явление (независимые признаки, оказывающие влияние на другие, связанные с ними признаки). Результативные признаки — это те признаки, которые изменяются под влиянием факторных признаков (зависимые признаки, которые изменяются под влиянием факторных признаков).