Модель сущность-связь.pptx
- Количество слайдов: 23
Особенности некоторых информационных систем для обеспечения их работы нужны сравнительно низкие вычислительные мощности; данные, которые они используют, имеют сложную структуру; необходимы средства сохранения данных между последовательными запусками системы.
Информационная система требует создания в памяти ЭВМ динамически обновляемой модели внешнего мира с использованием единого хранилища - базы данных.
Предметная область часть реального мира, подлежащая изучению с целью организации управления и, в конечном счете, автоматизации.
Предметная область Фрагмент • Объект • Процесс • Пользователи
Метаданные Данные, содержащие информацию о пользователях, форматы отображения, статистику обращения к данным и др. сведения, хранящиеся в словаре базы данных. Система управления базой данных (СУБД) - важнейший компонент информационной системы, для создания и управления которой необходим транслятор.
Функции СУБД управление данными во внешней памяти (на дисках) управление данными в оперативной памяти поддержание языков БД (язык определения данных, язык манипулирован ия данными) журнализация изменений и восстановлени е базы данных после сбоев
Компоненты СУБД ядро процессор языка базы данных подсистему поддержки времени исполнения сервисные программы (внешние утилиты) отвечает за управление данными во внешней и оперативной памяти и журнализацию обеспечивающий оптимизацию запросов на извлечение и изменение данных и создание, как правило, машинно -независимого исполняемого внутреннего кода интерпретирует программы манипуляции данными, создающие пользовательский интерфейс с СУБД обеспечивают ряд дополнительных возможностей по обслуживанию информационной системы.
Компоненты СУБД
Типы данных • Конструируемые пользователем для решения конкретных задач. сложные Основные (простые) • формы представления которого определяется архитектурой ЭВМ
Структуры данных Массив (функция с конечной областью определения) • простая совокупность элементов данных одного типа, средство оперирования группой данных одного типа. Отдельный элемент массива задается индексом. Запись (декартово произведение) • совокупность элементов данных разного типа.
В простейшем случае запись содержит постоянное количество элементов, которые называют полями. Совокупность записей одинаковой структуры называется файлом. (Файлом называют также набор данных во внешней памяти, например, на магнитном диске). Для того, чтобы иметь возможность извлекать из файла отдельные записи, каждой записи присваивают уникальное имя или номер, которое служит ее идентификатором и располагается в отдельном поле. Этот идентификатор называют ключом. Такие структуры данных как массив или запись занимают в памяти ЭВМ постоянный объем, поэтому их называют статическими структурами. К статическим структурам относится также множество.
Бинарное дерево называют сбалансированным (balanced), если высота левого поддерева каждого узла отличается от высоты правого поддерева не более чем на 1. Если в дереве между порожденными узлами, имеющими общий исходный, считается существенным их порядок, то дерево называется упорядоченным. В-деревом порядка n называется сильно ветвящееся дерево степени 2 n+1, обладающее следующими свойствами:
Каждый узел, за исключением корня, содержит не менее n и не более 2 n ключей. Корень содержит не менее одного и не более 2 n ключей. Все листья расположены на одном уровне. Каждый нелистовой узел содержит два списка: упорядоченный по возрастанию значений список ключей и соответсвующий ему список указателей (для листовых узлов список указателей отсутствует).
Сбалансированное дерево
сравнительно просто может быть организован последовательный доступ, т. к. все листья расположены на одном уровне; при добавлении и изменении ключей все изменения ограничиваются, как правило, одним узлом.
В-дерево, в котором истинные значения содержатся только в листьях (концевых узлах), называется В+деревом. R-дерево (R-Tree) это индексная структура для доступа к пространственным данным, предложенная А. Гуттманом
Для представления данных используются записи, каждая из которых имеет уникальный идентификатор (tuple-identifier). В каждом концевом узле (листе) дерева содержится запись вида (I, tuple-identifier), где I - nмерный параллелепипед, содержащий указатели на пространственные данные (его также называют minimal bounding rectangle, MBR), а каждый элемент в tupleidentifier содержит верхнюю и нижнюю границу параллелепипеда в соответствующем измерении. Неконцевые узлы содержат записи вида (I, childnodepointer), где I минимальный ограничивающий параллелепипед для MBR всех узлов, производных по отношению к данному. Childnode-pointer - это указатель на производные узлы.
Свойства R-дерева R-Tree является сильно сбалансированным деревом, т. е. все листья находятся на одном уровне. Корневой узел имеет, как минимум, двух потомков. Для каждого элемента (I, childnode-pointer) в неконцевом узле I является наименьшим возможным параллелепипедом, т. е. содержит все параллелепипеды производных узлов. Каждый концевой узел (лист) содержит от m до M индексных записей. Для каждой индексной записи (I, tuple-identifier) в концевом узле I является параллелепипедом, который содержит n-мерный объект данных, на который указывает tuple-identifier
Хеширование Этот метод используется тогда, когда все множество ключей заранее известно и на время обработки может быть размещено в оперативной памяти. В этом случае строится специальная функция, однозначно отображающая множество ключей на множество указателей, называемая хешфункцией (от английского "to hash" - резать, измельчать). В общем случае ключевые данные, используемые для определения адреса записи организуются в виде таблицы, называемой хеш-таблицей.
Сущность-связь Модель "сущность-связь" основывается на некой важной семантической информации о реальном мире и предназначена для логического представления данных. Она определяет значения данных в контексте их взаимосвязи с другими данными.
Сущность (entity) • объект, который может быть идентифицирован неким способом, отличающим его от других объектов. • конкретный человек, предприятие, событие и т. д. Набор сущностей (entity set) • множество сущностей одного типа (обладающих одинаковыми свойствами). • все люди, предприятия, праздники и т. д.
Пример: рассмотрим множество работников некого предприятия. Каждого из них можно описать с помощью характеристик табельный номер, имя, возраст. Поэтому, сущность СОТРУДНИК имеет атрибуты ТАБЕЛЬНЫЙ_НОМЕР, ИМЯ, ВОЗРАСТ. Используя нотацию языка Pascal этот факт можно представить как: type employe = record number : string[6]; name : string[50]; age : integer; end;
Модель сущность-связь.pptx