OLAP.pptx
- Количество слайдов: 10
OLAP технологии
OLAP - Технология комплексного многомерного анализа данных; это ключевой компонент организации хранилищ данных. Концепция OLAP была описана в 1993 году Эдгаром Коддом, известным исследователем баз данных и автором реляционной модели данных
OLAP - это технология, которой могут воспользоваться множество пользователей, работающих на различных платформах. Благодаря тому, что данные хранятся в одном месте - OLAPкубе, к данным и информации могут одновременно обращаться многие пользователи, не зависимо от их местонахождения. Основная функция OLAP - управление измерениями, которые применяются для моделирования основных характеристик бизнеса.
Хотя OLAP и не представляет собой необходимый атрибут хранилища данных, он все чаще применяется для анализа накопленных в этом хранилище сведений. Компоненты, входящие в типичное хранилище, представлены на рисунке.
• Классификация продуктов реализующих OLAP базируется на классификации модели данных СУБД, используемых этим продуктом. • 1. Многомерная OLAP (MOLAP) • 2. Реляционная OLAP (ROLAP) • 3. Гибридные OLAP (HOLAP)
1. Многомерная OLAP (MOLAP) Работают только со своими собственными многомерными БД. Основываются на патентованных технологиях для МСУБД и являются наиболее дорогими. Эти системы включают в себя интегрированный клиентский интерфейс, либо используют для связи с пользователем внешние программы работы с электронными таблицами. Для обслуживания таких систем как правило требуется специальный штат сотрудников, занимающихся установкой, сопровождением и формированием представлений данных для конечных пользователей. Примеры: ESSBase (Arbor Software), Oracle Express, SAS System (SAS Institute) SAS System (наиболее мощная и дорогая) состоит из множества подсистеммодулей, которые позволяют проектировать готовые решения, расширенное администрирование ИС дополнительные функции OLAP и ИАД. Благодаря такому подходу достигается компромисс между гибкостью настройки и простотой использования. Разработкой СППР занимается администратор на этапе проектирования, а аналитики работают с адаптированной для них системой.
2. Реляционная OLAP (ROLAP) Возникли после программной статьи Кодда 1993 года. Осуществляют представление данных хранимых в классической реляционной базе в многомерной форме. Примеры: DSS/Server, DSS/Agent (Micro Strategy); Meta. Cube (Informix); Decision Cube (Information Advantage). ROLAP системы хорошо приспособлены для работы с крупными хранилищами.
3. Гибридные OLAP (HOLAP) Разрабатывались с целью совмещения достоинств и минимизации недостатков присущих предыдущим классам. Детализированная информация хранится в РБД, а предвычисленные агрегированные значения в МБД.
Инструменты генерации запросов и отчетов для настольных ПК дополненные реализациями фуекций OLAP или интегрированные с внешними средствами выполняющими такие функции Эти системы осуществляют выборку данных из источников, преобразуют их и помещают в динамическую многомерную БД, функционирующую на клиентской станции конечного пользователя. Для работы с небольшими просто организованными базами эти средства подходят наилучшим образом. Примеры: Business Objects (Business Objects), Brio Query (Brio Technology), Power Play (Cognes).
Для определения OLAP обычно используют набор свойств OLAP систем или требований к ним. Краткая формулировка требований к OLAP заключена в так называемом тесте FASMI (1995) - Fast Analisys of Shared Multidimentional Information. 1) Fast (быстрый) Быстрой можно считать систему среднее время выдачи результатов обработки которой составляет порядка 5 с. Указываются также следующие показатели: время обработки наиболее простых запросов 1 с, наиболее сложных 20 с. Исследование реакции пользователей показывает, что неудачным считается время обработки запроса более 30 с. ИС, удовлетворяющая указанным требованиям производительности, однозначно будет воспринята пользователями лучше чем не удовлетворяющая даже более многофункциональная. 2) Analysis (анализ) Система может справляться с любым логическим и статическим анализом, характерным для данной предметной области. Этим определением одновременно ограничивается какой-то класс необходимых задач анализа и расширяются возможности системы до размеров этого класса. 3) Shared (разделяемая) ИС осуществляет все требования конфиденциальности и разделения доступа возможно до уровня ячейки. 4) Multidimensional (многомерный) Система должна обеспечивать многомерное, концептуальное разделение данных включая полную поддержку для иерархий и множественных иерархий. 5) Information (информация) По отношению к обрабатываемой в OLAP системе информации выделяют следующие специфические аспекты: · Дублирование данных; · Требуемая оперативная память; · Требуемое дисковое пространство; · Эксплуатационные показатели (например, временные); · Возможности интеграции с различными источниками данных и информационными фондами.