Технології інформаційних сховищ Луцько П. В. ФКН-502
Поняття сховища даних Визначення: Сховище даних – це аґреґований інформаційний ресурс, що містить консолідовану інформацію з усієї проблемної області та використовується для підтримки прийняття рішень. Властивості: 1) Предметна орієнтація – організація даних згідно понять притаманних конкретній предметній області; 2) Інтегрованість – узгодженість формату даних та зв'язків між ними; 3) Хронологічність – всі дані належать окремим часовим інтервалам; 4) Незмінність – дані не підлягають змінам.
Архітектура сховища даних 1)Підсистема накопичення – отримання даних з оперативних БД; 1)Підсистема очищення та форматування – перетворення даних до формату прийнятного для збереження в сховищі; 1)Підсистема зберігання даних Занесення даних до структурних елементів сховища; 1)Підсистема запитів – виконання зовнішніх запитів та представлення результатів.
Функціонування сховища даних 1)Циклічний збір даних з оперативних БД; 1)Форматування та денормалізація даних; 1)Збереження даних; 1)Аналітична обробка даних: Data Mining; OLAP; Проблемно-орієнтоване програмне забезпечення.
Моделі сховищ даних: Багатовимірна модель Основні категорії: вимір та показник; Інформаційні об'єкти складаються з властивостей(вимірів) та їх значень(показників); Застосовуються операції: об'єднання, обертання, розгортання та перетину; Недоліки: Резервує місце для відсутніх значень у неповних вимірах; Необхідний об'єм пам'яті стрімко зростає з підвищенням деталізації куба.
Моделі сховищ даних: Реляційна модель Основні категорії: таблиця та зв'язок; Основні елементи: таблиці фактів і таблиці вимірів; Застосовуються операції: об'єднання, перетину, відображення; Недоліки: Вимагає додаткових обчислювальних ресурсів для емуляції "багатовимірності"; Структура сховища денормалізована; Склідність запитів до сховища.
Різниця між сховищем та базою даних База даних Сховище даних Доступ Зчитування, запис, редагування, видалення. Зчитування Об'єм 100 МБ – ГБ 100 ГБ - ТБ Характер структури Нормалізована, програмноорієнтована Денормалізована, проблемноорієнтована Користувачі Офісні працівники, IT спеціалісти Експерти та аналітики Призначення Використання в щоденній діяльності Підтримка прийняття рішень
Використання сховищ даних
Переваги та недоліки технології Переваги: Забезпечення аналітичної бази прийняття рішень; Інтеграція в корпоративні системи; Автоматизація створення звітності. Недоліки: Необхідність використання великого об'єму пам'яті та/або обчислювальних ресурсів; Зростання кількості метаданих разом з об'ємом сховища; Концентрація конфіденційної інформації.
Дякую за увагу!