d5ad7d864cb87b3647e2f555d02591ce.ppt
- Количество слайдов: 14
Разработка модели родительской селективности для оптимизации запросов в XML базах данных Чернышев Г. А. 545 гр. Научный руководитель Барашев Д. В.
Селективность ¢ Количественная величина. ¢ Показывает распространенность объектов, удовлетворяющих заданным свойствам
Виды селективности ¢ Селективность узла n и набора предикатов s - количество узлов с тегом n, которые удовлетворяют набору предикатов s. ¢ Родительской селективностью узла n будет называться та часть узлов p, которая будет найдена при вычислении запроса (такого, что узел n – входит в запрос) выходящего из p.
XML алгебра ¢ Механизм оптимизации ¢ Правильный порядок вычислений может дать преимущество в скорости в десятки раз
Схема использования модели селективности
Вычисление родительской селективности Родительская селективность для дочернего узла n и родительского p показывает распространенность этой связки вершин. ¢ может быть вычислена по формуле: ¢
Построение оптимального плана ¢ Опр: суммарная стоимость вычисления двух путей, исходящих из одной вершины, будет сумма стоимостей вычисления первого снизу вверх и второго сверху вниз ¢ В общем случае: 1)Сортируем детей по родительской селективности 2)Вычисляем путь с наименьшей селективностью снизу вверх 3)Сверху вниз, в порядке возрастания, считаем остальные пути.
Как считать Fan-out(n, p)? (стандартная модель) ¢ Быстрое вычисление, могут пользоваться уже хранящимися данные ¢ Не точна, основана на “наивных” предположениях ¢ Дополнительной памяти не требует
Как считать Fan-out(n, p)? (предложенное решение)
Свойства полученной модели ¢ ¢ ¢ “Сжатие” статистики. Если в графе много похожих кустов, можно хранить данные о n самых частых, остальные вычислять старым методом Масштабируемость системы: выделяя больше памяти – получаем лучший результат Возможности для паралеллизации (хранение структуры, исполнение алгоритма)
Измерения ¢ Измерение количества проверок предикатов на истинность ¢ Количество требуемой памяти (максимальное) для хранения промежуточных результатов
Тесты
Тесты
Заключение ¢ Придумана модель селективности: структура данных ¢ Написана тестовая система ¢ Произведены тесты. Показано улучшение измеряемых характеристик
d5ad7d864cb87b3647e2f555d02591ce.ppt