
Лекция 1.ppt
- Количество слайдов: 9
Тема 1. Задачі та методи багатовимірного статистичного аналізу 1. 1. Теоретичні основи багатовимірного статистичного аналізу (БСА), його місце в соціально-економічних дослідженнях 1. 2. Методи БСА 1. 3. Багатовимірний ознаковий простір. Особливості обробки багатовимірних статистичних даних
1. Теоретичні основи багатовимірного статистичного аналізу (БСА), його місце в соціально-економічних дослідженнях БСА слід розглядати як логічний розвиток методів традиційної статистики, узагальнених у курсі загальної теорії статистики. Принципова відмінність полягає в тому, що об'єкти, соціальні та економічні явища розглядаються з урахуванням не одногодвох, а одночасно декількох ознак. Це дозволяє досягати в дослідженнях повноти теоретичного опису спостережуваних об'єктів і об'єктивності наступних висновків. БСА – це сукупність глибоко формалізованих статистичних методів, які базуються на наданні вихідної інформації в багатовимірному геометричному просторі і дозволяють визначати неявні (латентні), але об'єктивно існуючі закономірності в організаційній структурі і тенденціях розвитку досліджуваних соціально-економічних явищ і процесів. 2
1. Теоретичні основи багатовимірного статистичного аналізу (БСА), його місце в соціально-економічних дослідженнях Для БСА, як самостійної галузі науки, характерні такі особливості: • Для методів БСА характерні, як правило, глибока формалізація, складна логіко-математична конструкція. Робота з цими методами вимагає поглиблених знань в галузі як економічної теорії, так і математики. • У БСА обробляються багатовимірні (багатоознакові) сукупності даних. Число ознак (або розмірність сукупності) при цьому може бути будь-яким - від 1 до 100 і більше, але звичайно більше двох, і максимально обмежується 20 - 33 ознаками. • Практичне застосування методів БСА вимагає обов'язкового використання обчислювальної техніки. Можна сказати, що ці методи, в силу складності і трудомісткості, не реалізовані без технічних засобів. 3
1. Теоретичні основи багатовимірного статистичного аналізу (БСА), його місце в соціально-економічних дослідженнях Класифікація методів багатовимірного статистичного аналізу (БСА) 4
2. Методи БСА Метод 1 Статистичне оцінювання багатовимірної випадкової величини Перевірка багатовимірних гіпотез Тип задачі 2 Оцінка параметрів багатовимірної сукупності Перевірка гіпотез про рівність параметрів багатовимірних сукупностей та відповідності деякому закону розподілу Множинний кореляційно- Вимірювання та регресійний аналіз моделювання зв’язків досліджуваних ознак чи об’єктів Багатовимірне Візуалізація даних, шкалювання моделювання складних систем Головних компонент Факторний аналіз Стиснення даних Коментарі 3 Визначення: багатовимірної середньої, матриці коваріацій, ймовірнісних оцінок --- Представлення даних в теоретичному просторі, опис процесів та явищ, які, зважаючи на свою складність чи нестабільність, не піддаються моделюванню традиційними методами. Зведення множини елементарних ознак до невеликої кількості значущих «узагальнених ознак» та виявлення латентних факторів. 5
2. Методи БСА 1 Багатовимірного групування (кластерний аналіз) 2 Групування багатовимірних об'єктів (або ознак) 3 Пошук еталонних груп Дискримінантний аналіз Групування з навчанням Класифікація нових об'єктів за відомими еталонними групами Канонічних кореляцій Стиснення даних і моделювання зв'язків узагальнених ознак Встановлюється форма зв'язку комплексів (наборів) залежних змінних з незалежними факторними змінними. Багатовимірний дисперсійний Оцінка і дослідження аналіз дисперсій комплексів ознак Багатовимірний коваріаційний аналіз Оцінка залежності варіації результативної ознаки від факторної --- Передбачає попередню класифікацію даних і пошук регресійних зв'язків для кожного класу. Потім обчислюються та аналізуються оцінки коваріацій 6
3. Багатовимірний ознаковий простір. Особливості обробки багатовимірних статистичних даних Методи БСА базуються на геометричному наведенні даних. Спостережувані об'єкти розташовуються в теоретичному просторі з розмірністю, що відповідає числу ознак (елементарних чи латентних), якими вони характеризуються. Розглянемо простий приклад, коли п'ять промислових підприємств послідовно характеризуються значеннями однієї, двох і трьох ознак. I. Одновимірний ознаковий простір Підприємство № п/п 1 2 3 4 5 Середньочасо вий рівень вироблення одного робочого (дол. США) 6 4 9 7 3 Його можна представити у вигляді однієї градуйованої шкали: 7
3. Багатовимірний ознаковий простір. Особливості обробки багатовимірних статистичних даних II. Двовимірний ознаковий простір Спостережувані об'єкти геометрично представляються на площині в двовимірній (декартовій) системі координат. Підприємство Середньо№ п/п часовий рівень вироблення робочого (дол. США) (X 1) 1 2 3 4 5 6 4 9 7 3 Середній стаж роботи на підприємстві робітника, років (X 2) 5 7 12 14 11 8
3. Багатовимірний ознаковий простір. Особливості обробки багатовимірних статистичних даних III. Тривимірний ознаковий простір. Спостережувані об'єкти представляються у тривимірній системі координат: Середньочасов ий рівень Підприє вироблення мство робочого, дол. № п/п США (X 1) 1 6 2 4 3 9 4 7 5 3 Середній стаж роботи на підприємстві робітників, років (X 2) 5 7 12 14 11 Середній рівень кваліфікації працівників за тарифним розрядом (X 3) 1, 2 1, 9 3, 5 2, 7 2, 8 9
Лекция 1.ppt