L2.ppt
- Количество слайдов: 35
Модели и структуры данных 1. Многоуровневые модели предметной области 2. Идентификация объектов и записей 3. Поиск записей 4. Представление предметной области и модели данных 5. Структуры данных
Предметная область Модель данных ПО Модель данных СУБД Уровень объектов Пр. О Концептуальная схема Логический уровень Внутренняя схема Физический уровень Концептуальная схема - абстрагированное описание предметной области с фиксированной (логической) точки зрения. Логическое (концептуальное) проектирование - систематизация понятий и связей предметной области. Модель данных - совокупность функциональных характеристик объектов и особенностей представления информации, используемая при абстрагировании. Внутренняя схема - отображение концептуальной схемы на физический уровень.
Трехуровневое представление данных Внешняя схема Внешняя схема Концептуальная схема Внутренняя схема Логическая схема Глобальная внутренняя схема Внутренняя схема Локальная внутренняя схема Внешняя схема - отражение взгляда (точки зрения) отдельного пользователя на концептуальную схему (как вариант восприятия предметной области).
Системный аналитик, создающий модель предметной области, не обязательно должен быть специалистом в области программирования и вычислительной техники. Системный аналитик, как и конечный пользователь, не вмешивается во внутреннее представление данных Администратор БД, концептуальной должен представления обеспечивающий отражение схемы во внутреннюю, не беспокоиться о корректности предметной области Конечные пользователи, используя внешнюю схему, могут не вдаваться полностью в Пр. О, обращаясь только к необходимым составляющим. При этом исключается возможность несанкционированного обращения к данным вне объявленных внешней схемой
Идентификация объектов и записей Информация Объект Пр. О Свойство Значение Данные Запись Элементы данных
Поиск записей Прикладная программа сообщить системе имя записи или элемента данных и, возможно, организацию набора данных задать машинный адрес данных и в соответствии с физическим форматом записи прочитать значение Информация о структуре данных и организации набора
Первичный (главный) ключ, который идентифицирует запись единственным образом Вторичный (альтернативный) – ключ, идентифицирующий некоторую группу записей, имеющих определенное общее свойство 112 а/м ВАЗ 2110 … 113 а/м ВАЗ 2121 … 441 а/м ГАЗ 3110 … 456 а/м ВАЗ 2110 … 457 а/м ВАЗ 2121 … 678 а/м ВАЗ 2101 … 789 а/м ГАЗ 3110 … 889 а/м ВАЗ 2110 … 998 а/м ГАЗ 3102 …
Индекс – физическая реализация ключа – обеспечивает доступ к записям, ассоциированным с отдельным значением ключа Прямая форма индекса Инвертированная форма индекса 678 а/м ВАЗ 2101 678 112 а/м ВАЗ 2110 112, 456, 889 456 а/м ВАЗ 2110 а/м ВАЗ 2121 113, 457 889 а/м ВАЗ 2110 а/м ГАЗ 3102 998 113 а/м ВАЗ 2121 а/м ГАЗ 3110 441, 789 457 а/м ВАЗ 2121 998 а/м ГАЗ 3102 441 а/м ГАЗ 3110 789 а/м ГАЗ 3110
Типология простых (атомарных) запросов А(Е) = ? Каково значение атрибута А для объекта Е? А(? ) = V Какие объекты имеют значение атрибута равное V? ? (Е) = V Какие атрибуты объекта Е имеют значение равное V? ? (Е) = ? Какие значения атрибутов имеет объект Е? А(? ) = ? Какие значения имеет атрибут А в наборе? ? (? ) = V Какие атрибуты объектов набора имеют значение равное V?
Типы архитектур доступа к записям Системы с вторичными индексами: последовательность расположения записей соответствует последовательности значений первичного ключа. Как правило, используется один первичный индекс и несколько вторичных. Системы частично инвертированных файлов: записи могут располагаться в произвольной последовательности; первичный индекс отсутствует; вторичные индексы применяются и для прямой адресации записей. Системы полностью инвертированных файлов: предусмотрено наличие файлов, содержащих значения отдельных элементов данных, входящих в состав записей. Для ускорения процесса поиска в системе используют два набора индексов: индекс экземпляров (значений ключей) и индекс данных (инвертированный список). С помощью индекса экземпляров можно найти в файле элементы данных, имеющих заданное значение. С помощью индекса данных можно найти записи, связанные с заданными значениями элементов.
Представление предметной области и модели данных Предметная область Логические модели Преобразование типизированных данных в машинное представление Физические модели Формализация абстрактных понятий
Структура информации - схематичная форма представления сложных композиционных объектов и связей реальной Пр. О Уровень объектов Пр. О Структура данных - атрибутивная форма представления свойств и связей Пр. О, ориентированная на выражение описания данных средствами формальных языков Логический уровень Структура записей – целесообразная (учитывающая особенности физической среды) реализация способов хранения данных и организации доступа к ним как на уровне отдельных записей, так и на уровне элементов записей Физический уровень
Структура данных - способ отображения значений в памяти К л а с с и ф и к а ц и я По характеру взаимосвязи элементов структуры линейные нелинейные По характеру информации, представляемой структурой однородные неоднородные
Линейные структуры Массивы a[1] a[2] … a[i] S+ … S- a[N] … LIFO a[N] Q+ a[N] Последовательности … … FIFO … a[1] QТаблицы A B C D a 1 b 1 c 1 d 1 … … an bn cn dn
Нелинейные структуры Списки Д е р е в ь я
Нелинейные структуры Отношение «исходныйпорожденный» Простая сетевая структура Сложная сетевая структура
Физические модели баз данных 1. 2. 3. 4. 5. 6. Физическое представление иерархических структур Физическое представление сетевых структур Физическое представление с разделением данных и связей Организация данных на машинных носителях Архитектура файловой организации баз данных
Физическое представление древовидных структур Факультет (А) A 1 B 2 Специализация (В) C 5 C 6 C 1 B 3 B 1 C 3 C 9 C 4 C 2 C 7 C 8 Студент (С) A 1 B 2 C 5 C 1 C 6 B 1 C 3 C 9 B 3 C 4 C 2 1. Физически последовательное размещение
2. Использование одного указателя на запись А 1 . В 1 В 2 В 3 С 5 С 1 С 6 С 3 С 9 С 4 С 2 С 7 С 8 2. а. Указатели на исходную запись – один указатель на запись А 1 В 2 В 3 С 5 С 1 С 6 С 3 С 9 С 4 С 2 С 7 С 8 2. б. Один указатель на запись – левосписковая структура .
3. Использование указателей на «подобные» и «порожденные» А 1 . В 1 В 2 С 5 С 1 . В 3 С 6 . С 3 С 9 . С 4 С 2 С 7 С 8 3. а. Указатели на «порожденные» и «подобные» записи А 1. В 1 С 5 В 2 С 1 С 6 С 3 3. б. Кольцевые структуры С 9 .
Физическое представление сетевых структур Факультет (В) Место жительства (А) Студент (С) B 2 C 5 A 1 B 1 C 6 C 3 A 2 B 3 C 9 C 4 C 1 C 7 A 3 C 8
1. Физически последовательное размещение В 1 В 2 В 3 А 1 С 5 С 4 А 2 С 6 С 3 С 9 С 8 А 3 С 2 С 1 С 7 1. а. Указатели на «исходные» записи В 1 В 2 В 3 А 1 С 5 С 4 А 2 С 6 . С 3 С 9 . С 8. А 3 1. б. Указатели на «порожденные» и «подобные» записи
2. Указатели на «исходные» записи (простое отображение) В 1 В 2 В 3 С 5 С 4 А 1 А 2 А 3 С 6 С 3 С 9 С 8 С 2 С 1 С 7
3. Указатели на «исходные» , «порожденные» и «подобные» записи В 1 С 5 А 1 В 2 С 4 А 2 В 3 С 6 А 3 С 9 С 8 С 2 С 1 С 7
Физическое представление с разделением данных и связей Фамилия И. О. Год рожд. Должность Каф. № Иванов И. И. 1948 Зав. каф. 22 Сидоров С. С. 1953 Проф. 22 Гиацинтова Г. Г. 1945 Проф. 22 Цветкова С. С. 1960 Доцент 22 Козлов К. К. 1959 Доцент 23 Петров П. П. 1960 Ст. преп. 23 Лютикова Л. Л. 1977 Ассистент 23 Рыбин Р. Р. 1950 Зав. каф. 23 Китов К. К. 1944 Проф. 23
Долж. Каф. № Год р. Ф. И. О. Долж. Ф. И. О. Каф. № Ф. И. О. 1 1 3 1 5 1 1 8 5 4 1 2 1 2 4 1 3 2 2 9 1 4 9 7 2 1 4 7 3 2 1 8 4 6 2 1 5 8 3 7 1 9 Сидоров С. С. 6 7 5 2 6 4 4 1 2 3 Цветкова С. С. 5 8 1 2 7 6 4 3 2 5 7 4 3 2 7 9 4 8 2 6 3 1 4 2 8 5 5 6 2 7 1 1944 2 Иванов И. И. 2 1945 3 Китов К. К. 3 1948 4 Козлов К. К. 4 1950 5 Лютикова Л. Л. 5 1953 6 Петров П. П. 6 1959 7 Рыбин Р. Р. 7 1960 8 1977 8 9 1 Ассистент 1 22 2 Доцент 2 23 Год р. 3 3 Гиацинтова Г. Г. Ф. И. О. 2 1 3 Зав. каф. 4 Проф. 5 Ст. преп. Данные Связи
Организация данных на машинных носителях Выбор типа записи Выбор способа – единицы обмена размещения в операциях ввода- записей в файле вывода Выбор способа адресации и метода доступа к записям
Файл Потокориентированный Записей фиксированной длины С блокировкой записей фиксир. длины Типы записей Запись E O B Запись Записей переменной L длины С блокировкой L записей переменной длины Записей неопределенной длины Запись E O B Запись L Запись E O B … E O B E O F … Запись E O B Запись … L Запись E O B Запись Запись … L L Запись … Запись L Запись E O B
Организация файлов - способ размещения записей Страничная организация Записи Параллельная секционная организация Размещение соответственно частоте использования Индекс Данные
RAID-системы Логический файл 1 2 3 4 5 6 7 8 9 10 11 12 Очереди 10 11 12 RAID-0 самая высокая производительность при низкой стоимости Физические диски Время чтения Время установки головок чтения-записи
Логический файл 1 2 3 4 5 1 … 12 9 10 11 12 RAID-1 3 … 8 2 3 7 1 2 6 12 Зеркальный Физический физический диск Время установки головок чтения-записи Время чтения Наивысшая отказоустойчивость
Логический файл 1 2 3 4 5 6 7 8 9 10 11 1 1 2 2 3 3 4 4 5 5 6 6 … … 11 11 12 12 12 Зеркальный Физический физический диск RAID-10
Логический файл 1 2 3 4 5 6 7 8 9 1 2 3 КС 5 6 КС 4 9 КС 7 8 КС 10 11 12 Физические диски 10 11 12 RAID-5 Наилучшее соотношение стоимости, производительности и отказоустойчивости
Способы адресации и методы доступа к записям Последовательное сканирование файла Блочный поиск Двоичный поиск Индекснопоследовательные файлы … k Ks > k k Ks < k … Индекснопроизвольные файлы Адресация с помощью ключей, преобразуемых в адрес Хэширование
Архитектура файловой организации баз данных Файл-ориентированная организация данных Данные Индексы Метаданные Указатели «Сколько типов структур записей - столько и файлов» Страничная организация данных Э к с т е н т Стр1 Стр2 Заголовок Дескрипторы … Стр. N … Содержание


