Что следует понимать под термином OLAP.ppt
- Количество слайдов: 22
Что следует понимать под термином OLAP? Лебедева И. А. 10. 02. 2018 1
Проблема n n n Решить является ли продукт "именно OLAP" становилось все сложнее в связи с тем, что все больше и больше поставщиков утверждали, что они имеют "именно OLAP", . Нельзя полагаться на собственные описания поставщиков независимо от их членства в Совете OLAP (OLAP Council); Правила Кодда также, как оказалось, не были удовлетворительным способом обнаружения "именно OLAP". 10. 02. 2018 2
Проблема Поскольку многие исследования показывают, что имеется много путей реализации OLAP приложений, то никакая конкретная технология не должна была быть обязательной, или даже рекомендованной. n Определение должно было быть коротким и простым. n Поэтому специалисты постарались резюмировать OLAP-определение только пятью ключевыми словами: Быстрый Анализ Разделяемой Многомерной Информации - или, кратко - FASMI (в переводе с английского: Fast Analysis of 10. 02. 2018 3 Shared Multidimensional Information). n
Тест FASMI FAST(Быстрый) - означает, что система должна обеспечивать выдачу большинства ответов пользователям в пределах приблизительно пяти секунд. При этом самые простые запросы обрабатываются в течение одной секунды и очень немногие - более 20 -ти секунд. n Такую скорость не просто достигнуть с большими количествами данных, особенно, если требуются специальные вычисления "на лету". Поставщики прибегают к широкому разнообразию методов, чтобы достигнуть этой цели, включая специализированные формы 4 10. 02. 2018 хранения данных, обширные предварительные n
Тест FASMI ANALYSIS (Анализ) означает, что система может справляться с любым логическим и статистическим анализом, характерным для данного приложения, и обеспечивает его сохранение в виде, доступном для конечного пользователя. n Не так важно, выполнен ли этот анализ в собственных инструментальных средствах поставщика или в связанном внешнем программном продукте типа электронной таблицы, просто все требуемые функциональные возможности анализа должны обеспечиваться интуитивным способом для 10. 02. 2018 5 конечных пользователей. n
Тест FASMI n n SHARED (Разделяемой) означает, что система осуществляет все требования защиты конфиденциальности (возможно до уровня ячейки) и, если множественный доступ для записи необходим, обеспечивает блокировку модификаций на соответствующем уровне главная слабость многих OLAP продуктов – это предполагать, что во всех приложениях OLAP требуется только чтение, и предоставляют упрощенные средства защиты. 10. 02. 2018 6
Тест FASMI n n MULTIDIMENSIONAL (Многомерной) - это ключевое требование. Если бы мы должны были определить OLAP одним словом, то выбрали бы его. Система должна обеспечить многомерное концептуальное представление данных, включая полную поддержку для иерархий и множественных иерархий, поскольку это определенно наиболее логичный способ анализировать бизнес и организации. 10. 02. 2018 7
Тест FASMI n n INFORMATION (Информации) - это все. Необходимая информация должна быть получена там, где она необходима. Однако многое зависит от приложения. Измеряем мощность различных продуктов Мощность продуктов весьма различна - самые большие OLAP продукты могут оперировать по крайней мере в тысячу раз большим количеством данных по сравнению с самыми маленькими. 10. 02. 2018 8
Заключение Тест FASMI - разумное и понятное определение целей, на достижение которых ориентированы OLAP. Специалисты предлагают пользователям и поставщикам принять это определение, которое позволяет избежать имеющихся противоречий. n Техника реализации включает много различных патентованных идей, которыми так гордятся поставщики: разновидности архитектуры "клиент-сервер", анализ 10. 02. 2018 временных рядов, объектная ориентация, 9 n
Правила и особенности Кодда n В 1993 Е. Ф. Кодд с партнерами опубликовали статью, инициированную компанией Arbor Software(сегодня это Hyperion Solutions), озаглавленную «Обеспечение OLAP (оперативной аналитической обработки) для пользователей - аналитиков» , как некий "мандат" информационной технологии. Доктор Кодд, конечно, хорошо известен, как классик теории реляционных баз данных, созданной в период 6080 -х годов, однако его требования к OLAP оказались достаточно спорными, так как были спонсированы поставщиком, а не обоснованы математически 10. 02. 2018 10
Кроме того, не очень ясно, насколько велика роль самого Кодда в написании этой статьи, есть основания полагать, что его роль, вероятно, не очень значительна. Эта статья воспринимается как документ, опубликованный поставщиком (а так оно и есть) скорее, нежели как научный труд (каковой эта публикация и не является). n Эта статья включала 12 правил, которые теперь хорошо известны. В 1995 году к ним были добавлены еще шесть (которые известны в значительно меньшей степени). Доктор Кодд разбил на четыре группы эти правила, назвав их "особенностями". Ниже дано краткое описание этих особенностей, однако следует заметить, что сегодня они редко цитируются и 11 10. 02. 2018 мало используются. n
Основные особенности(B): n n Многомерное концептуальное представление данных (Оригинальное правило 1). Вряд ли кто будет возражать против этого. Подобно д-ру Кодду, что эта особенность - сердцевина OLAP. Интуитивное манипулирование данными (Оригинальное правило 10). Д-р Кодд предпочитает, чтобы манипулирование данными осуществлялось посредством прямых действий над ячейками в режиме просмотра без использования меню и множественных операций. 10. 02. 2018 12
n Доступность: OLAP как посредник (Оригинальное правило 3). В этом правиле д-р Кодд особенно подчеркивает роль OLAP в качестве прослойки между гетерогенными источниками данных и представлением для конечного пользователя. Большинство продуктов обеспечивает это, но часто посредством гораздо более многочисленных этапов и пакетирования, чем хотел бы поставщик. 10. 02. 2018 13
n Пакетное извлечение против интерпретации (Новое). Это правило требует, чтобы продукт в равной степени эффективно обеспечивал доступ как к собственному хранилищу данных, так и к внешним данным. В сущности д-р Кодд настаивал на многомерном представлении данных с частичными предварительными вычислениями для больших многомерных баз данных, так чтобы любые детальные данные были прозрачны и доступны. 10. 02. 2018 14
n Модели анализа OLAP (Новое). Д-р Кодд требует, чтобы OLAP продукты поддерживали все четыре модели анализа, которые он описывает в своей статье (Категориальный, Толковательный, Умозрительный и Стереотипный). 10. 02. 2018 15
n Архитектура "клиент-сервер" (Оригинальное правило 5). Д-р Кодд требует, чтобы продукт был не только клиент-серверным, но и чтобы серверный компонент был бы достаточно интеллектуальным для того, чтобы различные клиенты могли подключаться с минимумом усилий и программирования. Это требование существенно сильнее, чем просто архитектура "клиент-сервер", и относительно небольшое количество продуктов удовлетворяют ему. Это требование гораздо жестче, чем необходимо. 10. 02. 2018 16
Прозрачность (Оригинальное правило 2). Это также очень сильное требование. Полное соответствие ему означает, что, скажем, пользователь электронной таблицы способен получить все необходимые данные из OLAPмашины, даже не подозревая, откуда они в конечном счете берутся. Чтобы выполнить это, продукт должен обеспечивать непосредственный живой доступ к гетерогенным источникам данных и одновременно иметь встроенную 10. 02. 2018 полнофункциональную электронную таблицу. 17 n
n Многопользовательская поддержка (Оригинальное правило 8). Д-р Кодд признает, что не все OLAP приложения работают только в режиме чтения данных, и этим правилом указывает стратегическое направление развития. Инструменты OLAP должны обеспечивать одновременный доступ (чтение и запись), интеграцию и конфиденциальность. 10. 02. 2018 18
Обработка ненормализованных данных (Новое). Оно указывает на необходимость интеграции между OLAP-машиной и ненормализованными источниками данных. Доктор Кодд указывает, что модификации данных, выполненные в среде OLAP не должны приводить к изменениям данных хранимых в исходных внешних системах. Сказанное им можно интерпретировать и как то, что не должны допускаться изменения данных, которые обычно расцениваются как расчетные 10. 02. 2018 19 ячейки в пределах базы данных OLAP. n
n Сохранение результатов OLAP: хранение их отдельно от исходных данных (Новое). В действительности это более относится к реализации, чем к сущности продукта, но не многие будут возражать против этого. В сущности д-р Кодд придерживается широко распространенного мнения о том, что OLAP приложения, работающие в режиме чтениязаписи не должны воздействовать напрямую на обрабатываемые данные, и данные, модифицированные в OLAP, должны сохраняться отдельно от данных транзакций. 10. 02. 2018 20
n Исключение отсутствующих значений (Новое). Все отсутствующие значения отбрасываются в представлении, определенном версией 2 реляционной модели данных. Стоит интерпретировать это так, что отсутствующие значения должны отличаться от нулевых значений. В действительности это интересно только с точки зрения компактности хранения данных, некоторые OLAP инструменты игнорируют это правило без больших потерь в функциональности. 10. 02. 2018 21
n Обработка отсутствующих значений (Новое). Все отсутствующие значения будут игнорироваться OLAP анализатором без учета их источника. Эта особенность связана с 11 -й и является почти неизбежным следствием того, как OLAPмашина обрабатывает все данные. 10. 02. 2018 22
Что следует понимать под термином OLAP.ppt