Скачать презентацию 3 Внутренняя структура БД 3 1 Общая характеристика Скачать презентацию 3 Внутренняя структура БД 3 1 Общая характеристика

уд-4.ppt

  • Количество слайдов: 33

3 Внутренняя структура БД. 3. 1 Общая характеристика Физическое размещение данных в ИС ориентировано 3 Внутренняя структура БД. 3. 1 Общая характеристика Физическое размещение данных в ИС ориентировано на внешнюю память. Внутренняя схема базы данных включает три основные компоненты Системная информация по БД (каталог БД) - структура БД - ограничения целостности Информационные массивы данных . . . Прикладная и интерфейсная часть индексов. . . . - запросы. . . . - процедуры страницы - события (физ. записи) . . . - правила - код Единый файл Организация записей в страницах (расположение, добавление, корректировка, удаление) составляет физическую структуру данных, которая образуют третий уровень представления информации в ИС.

3. 2. Физические структуры данных Физические записи из внешней памяти считываются в оперативную память 3. 2. Физические структуры данных Физические записи из внешней памяти считываются в оперативную память и обработка их осуществляется в оперативной памяти, для чего СУБД образует и поддерживает специальные буферы. Физические структуры организации файлов данных делятся на линейные и нелинейные. 3. 2. 1 Линейные структуры данных В одну страницу объединяются записи одной таблицы, которые располагаются последовательно друг за другом. Удаление записей 1) автоматическая перезапись всех записей, расположенных за удаляемой 2) удаление записи без перезаписи 2 разновидности линейных структур в зависимости от корректировки записей Ø файл расширяется или уплотняется с автоматическим перезаписыванием Ø для каждой записи выделяется одинаковое дисковое пространство (формат dbf).

3. 2. 1 Нелинейные структуры данных В нелинейных структурах помимо информационных полей физические записи 3. 2. 1 Нелинейные структуры данных В нелинейных структурах помимо информационных полей физические записи включают одно или несколько полей указателей § на следующую запись объекта (односвязные списки) или § на связанные записи других информационных объектов (многосвязные списки, древовидные структуры). Достоинство - обеспечивается более эффективный доступ к данным, чем в линейных структурах Недостаток - растут затраты при любых операциях добавления, удаления и корректировки записей. Образование страниц физических записей рассмотрели на примере записей, связанных отношением «один-ко-многим» . Для формализованного описания нелинейных структур используют теорию графов. Количество уровней называют высотой дерева. Максимально возможное количество потомков у одного предка называют степенью дерева.

3. 3 Индексные массивы 3. 3. 1 Линейные структуры индексных массивов Инвертированный список строится 3. 3 Индексные массивы 3. 3. 1 Линейные структуры индексных массивов Инвертированный список строится по схеме таблицы с 2 -мя колонками - значение индексируемого поля и - номера строк. Для доступа к нужной строке сначала в упорядоченном инвертированном списке отыскивается строка с требуемым значением поля, затем считывается номер (номера) строки и по нему осуществляется доступ к искомой строке базовой таблицы. При добавлении новой строки в базовую таблицу значение ее индексируемого поля ищется в ранее составленном списке. Значение индексируемого поля 1952 1959 1960 1961 1962 Номера строк Значение индексируемого поля 1952 1959 1960 1961 1962 3 5, 17, 123, 256 31, 32 11, 45, 59, 167, 251 7, 8, 9, 10, 234 3 5, 17, 123, 256 31, 32, 261 11, 45, 59, 167, 251 7, 8, 9, 10, 234 Номера строк 3 5, 17, 123, 256 31, 32, 261 11, 45, 59, 167, 251 7, 8, 9, 10, 234

3. 32 Нелинейный структуры индексных массивов При организации индексов используют Б-деревья, которые представляют собой 3. 32 Нелинейный структуры индексных массивов При организации индексов используют Б-деревья, которые представляют собой корневые сбалансированные сильно ветвистые деревья. Каждая внутренняя вершина содержит информацию о n-1 различных последовательно возрастающих значениях индексируемого поля Pi Xi Pi+1 Xi+1 . . . Pn-1 Xn-1 Pn где Xi – i значение индексируемого поля, Pi – указатель на вершину, содержащую значение индексируемого поля, меньшие или равные Xi Листовая вершина содержит информацию о нахождении страницы в файле базы данных с записями, имеющими соответствующие значения индексируемого поля. Xi Pi Xi+1 Pi+1. . . Xn Pn где Pi – указатель страницу файла данных, содержащую строку (строки) со значением индексируемого поля, равным Xi

В оперативную память считывается страница с корневой вершиной и последовательно просматривается до первого значения, В оперативную память считывается страница с корневой вершиной и последовательно просматривается до первого значения, превышающего значение индексируемого поля нужной записи, при этом определяется ссылка (номер) страницы-потомка (внутренней или листовой). В оперативную память считывается страница потомок, если она внутренняя, ее обработка производится аналогично, если она является листовой, то она просматривается до нахождения нужного значения индексируемого поля и определяется номер страницы файла данных, которая содержит нужную запись. Фамилия 1. Иванов 2. Петров 3. Сидоров 4. Лаврентьев 5. Егоров 6. Максимов 7. Сергеев 8. Григорьев 9. Матвеев 10. Владимиров 11. Николаев 1961 1972 1968 1975 1980 1973 1963 1977 1979 1966 1964 12. Федоров 1974 1968 1975 Год рождения 1963 1979 1961(1) 1963(7) 1964(11) 1966(10) 1968(3) 1972(2) 1973(6) 1974(12) 1975(4) 1980(5) 1977(8) 1979(9)

3. 4 Растановка записей (хеширование) Основная задача расстановки записей - минимизация расходов на доступ 3. 4 Растановка записей (хеширование) Основная задача расстановки записей - минимизация расходов на доступ и изменение данных во внутренней и внешней памяти. Идея расстановки место для новых записей и поиск старых записей можно было осуществлять на основе некоторого преобразования их ключевых полей. Хеширование обеспечивает доступ к нужным записям за одно обращение в области размещения данных. 1 -я новая запись Кл 1 h(Кл 1) = n добавление новой записи по соотв. адресу M-я старая запись Кл. М h(Кл. М) = k считывание записи по соотв. адресу Выделенная под данные область памяти Номер(адрес) записи 1 … … 2 … … n … … k … …

4 ПРОЕКТИРОВАНИЕ БД 4. 1 Общие положения 4 ПРОЕКТИРОВАНИЕ БД 4. 1 Общие положения

Определяют следующие этапы создания БД: 1. формирование требований (обследование объекта, проведение НИР, разработка вариантов Определяют следующие этапы создания БД: 1. формирование требований (обследование объекта, проведение НИР, разработка вариантов концепции) 2. техническое задание (разработка и утверждение) 3. эскизный проект (разработка предварительных проектных решений: состав, функции и параметры основных программных средств);

4. технический проект - функционально-алгоритмическая структура системы, - функции персонала и организационная структура, - 4. технический проект - функционально-алгоритмическая структура системы, - функции персонала и организационная структура, - структура технических средств, - алгоритмы решения задачи и применяемые языки, - структура базы данных - система классификации и кодирования информации, - программное обеспечение; - разработка технической документации; 5. разработка рабочей документации, адаптация программы; 6. ввод в действие (подготовка к вводу в действие, подготовка персонала, проведение опытной эксплуатации); 7. сопровождение (выполнение работ в соответствии с гарантийными обязательствами).

Центральный элемент проектирования - разработка ТЗ, которое содержит следующие разделы: Øобщие сведения; Øназначение и Центральный элемент проектирования - разработка ТЗ, которое содержит следующие разделы: Øобщие сведения; Øназначение и цели создания системы; Øхарактеристика объектов автоматизации; Øтребования к системе; Øсостав и содержание работ по созданию системы; Øпорядок контроля и приемки системы; Øтребования к составу и содержанию работ по подготовке объекта автоматизации к вводу системы в действие; Øтребования к документированию; Øисточники разработки.

Требования к системе включают: oтребования к системе в целом (параметры и характеристики системы, требования Требования к системе включают: oтребования к системе в целом (параметры и характеристики системы, требования к структуре, функционированию, надежности, безопасности, численности и квалификации персонала и т. д. ); oтребования к функциям (перечень функций и задач, временной регламент каждой функции или задачи, требования к качеству реализации функции, к форме представления выходной информации, достоверности выдачи результатов, точности и времени выполнения); oтребования по видам обеспечения (по математическому, информационному, лингвистическому, программному, техническому, метрологическому, методическому и другим видам обеспечения системы)

Требования по информационному обеспечению: qсоставу, структуре и способам организации данных в системе (информационно-логическая схема); Требования по информационному обеспечению: qсоставу, структуре и способам организации данных в системе (информационно-логическая схема); qинформационному обмену между компонентами системы; qинформационной совместимости со смежными системами; qпо использованию общероссийских и других классификаторов; qпо применению систем управления базами данных; qк структуре процесса сбора, обработки, передачи данных в системе и представлению данных;

qк защите данных от разрушения при авариях и сбоях в питании электронных систем; qк qк защите данных от разрушения при авариях и сбоях в питании электронных систем; qк контролю, хранению, обновлению и восстановлению данных; qк процедуре придания юридической силы документам, создаваемым техническими средствами АС. На основе установленных в ТЗ основных требований на последующих этапах конкретизируются и непосредственно разрабатываются компоненты и элементы системы.

4. 2 Проектирование банков данных 4. 2 Проектирование банков данных

Базы данных – это часто основа систем представления и обработки информации. В организационном плане Базы данных – это часто основа систем представления и обработки информации. В организационном плане при их проектировании необходимы Øспециалисты по формализации предметной области(постановщики задачи, специалисты как в сфере программного обеспечения, так и в предметной области), Ø специалисты по программному обеспечению СУБД (профессиональные программисты, определяющие выбор СУБД и обеспечивающие построение ее в соответствии с концептуальной схемой, разработанной постановщиком задачи), Øтехнические дизайнеры и специалисты по эргономике, которые обеспечивают эстетическую и эргономическую сторону интерфейса пользователя с АИС.

4. 2. 1 Концептуальное проектирование 4. 2. 1 Концептуальное проектирование

Концептуальное проектирование - эвристический процесс, корректность построенной инфологической модели проверяется эмпирически по анализу и Концептуальное проектирование - эвристический процесс, корректность построенной инфологической модели проверяется эмпирически по анализу и проверке удовлетворения потребностей пользователей. Выделяют следующие этапы: vобзор и изучение области использования ИС; vформирование и анализ функций и задач ИС; vопределение основных объектов-сущностей предметной области и отношений между ними.

Обзор и изучение области использования ИС осуществляется при взаимодействии с заказчиком. - фрагментирование предметной Обзор и изучение области использования ИС осуществляется при взаимодействии с заказчиком. - фрагментирование предметной области (выделение лиц, подразделений, структур…), подлежащих отражению в ИС; - определение информационных потребностей и информационных результатов деятельности каждого фрагмента (какая информация, в какие сроки, в каком виде и т. п. ); - определение общих характеристик и содержания процессов потребления и обработки информации в каждом фрагменте (содержание информации, технология ее обработки, передачи, использования и т. п. ).

Формирование и анализ функций и задач ИС Производится последовательная декомпозиция цели создания АИС. Определяется Формирование и анализ функций и задач ИС Производится последовательная декомпозиция цели создания АИС. Определяется предварительный перечень пользователей системы и уточняются их информационные потребности.

Определение основных объектов-сущностей предметной области и отношений между ними Анализ информационно-справочных, нормативных, служебных документов Определение основных объектов-сущностей предметной области и отношений между ними Анализ информационно-справочных, нормативных, служебных документов позволяет сформировать перечень атрибутов, характеризующих те или иные объекты-сущности и отношения предметной области. Существует 2 подхода к формированию перечня сущностных объектов предметной области и их атрибутов – дедуктивный и индуктивный.

Дедуктивный подход 1. Выделяют основные понятия и категории, которыми оперируют фрагменты предметной области. Это Дедуктивный подход 1. Выделяют основные понятия и категории, которыми оперируют фрагменты предметной области. Это основа списка объектов-сущностей. 2. Далее на основе взаимодействия с заказчиком формируются атрибуты, характеризующие объектысущности. При этом используют принцип минимальной достаточности - «Не умножай число сущностей без необходимости» .

Индуктивный подход 1. На основе анализа всей информации выделяются все необходимые сведения, их характеристики, Индуктивный подход 1. На основе анализа всей информации выделяются все необходимые сведения, их характеристики, параметры и формируется общий перечень атрибутов предметной области. 2. Далее на основе эвристического анализа производится агрегация (группирование) атрибутов в отдельные группы, образующие объекты-сущности. Чаще всего выделение объектов-сущностей, их атрибутов и отношений осуществляется комбинированным способом, с многократным уточнением

Пример - БД по делопроизводству. Можно выделить такие понятия и категории – документ, реквизиты, Пример - БД по делопроизводству. Можно выделить такие понятия и категории – документ, реквизиты, исполнитель, подготовка, согласование, руководитель, утверждение, подписание, регистрация, резолюция и др. Часть из них являются объектами-сущностями (документ), часть (исполнитель, руководитель) можно обобщить одной сущностью (сотрудник). Часть понятий (исполнение, согласование, подписание, утверждение) выражает отношения между сущностями (документом и сотрудником)

В итоге перечень объектов сущностей и их атрибутов будет таков: - Документ (рег. №, В итоге перечень объектов сущностей и их атрибутов будет таков: - Документ (рег. №, дата, название вида, заголовок, гриф, текст) - Сотрудник (таб. №, ФИО, подразделение, должность, кабинет, телефон); - Подразделение (№, наименование); - Мероприятие (наименование, дата начала, дата окончания, завершенность); - Дело (№№, наименование, дата начала, дата окончания, гриф)

Отношения объектов сущностей можно выразить так Отношение 1 -й объект 2 -й объект Тип Отношения объектов сущностей можно выразить так Отношение 1 -й объект 2 -й объект Тип отнош-я Утвержден Сотрудник Документ Один-ко-многим Исполнен Сотрудник Документ Один-ко-многим Подписан Сотрудник Документ Многие-ко-многим

Формализованное описание предметной области проектируемой базы чаще всего дается с помощью ER-диаграмм или ER-моделей. Формализованное описание предметной области проектируемой базы чаще всего дается с помощью ER-диаграмм или ER-моделей. Объекты-сущности изображаются прямоугольниками, при необходимости в них вставляется перечень их атрибутов. Связи типа «Один-ко-многим» обозначаются линиями с парой символов (I ) на концах объектов. Связи типа «Многие-ко-многим» - линиями с парой символов ( ). Связи «Один-ко-одному» –парой (I I).

4. 2. 2 Проектирование и создание таблиц 4. 2. 2 Проектирование и создание таблиц

1. Для каждого объекта –сущности проектируется соответствующая таблица. 2. Поля таблиц определяются на основе 1. Для каждого объекта –сущности проектируется соответствующая таблица. 2. Поля таблиц определяются на основе атрибутов сущностей концептуальной модели. Определяют ключевые поля на основе смыслового анализа таблицы при соблюдении принципа минимальной достаточности. Иногда искусственно вводят в качестве ключа параметр, являющийся дополнительным полем типа «Счетчик» . Значения счетчика генерируются СУБД автоматически при образовании новой записи и только в возрастающем порядке.

Реляционная модель данных обеспечивает лишь 2 типа связей-отношений между таблицами: Один-ко-многим и Один-к-одному. Но Реляционная модель данных обеспечивает лишь 2 типа связей-отношений между таблицами: Один-ко-многим и Один-к-одному. Но связь типа Многие-ко-многим реализуются через создание двух связей Один-ко-многим, которые связывают исходные таблицы с третьей общей (связной) таблицей. Ключ связной таблицы состоит, по крайней мере, из двух полей, которые являются внешними ключами для связываемых исходных таблиц.

Пример реализации связи типа Многие-комногим, выражающей отношение Согласование между таблицами ДОКУМЕНТЫ и СОТРУДНИКИ. Документы Пример реализации связи типа Многие-комногим, выражающей отношение Согласование между таблицами ДОКУМЕНТЫ и СОТРУДНИКИ. Документы Рег № Название Сотрудники Поряд. № ФИО 1497 -е О поставке 132 Иванов И. Н. 1234 О сбыте 133 Петров П. П. 4774 О кредите 134 Сидоров С. С. Один сотрудник согласовал Один док-т согласован Согласование 2 -мя Рег № сотрудн-ми 1497 4774 Поряд № 132 133 132 Дата 15. 02 17. 02 16. 02 2 докум-та

3. Определяют необходимости индексирования полей таблиц. Ключевые поля в большинстве случаев являются индексируемыми автоматически, 3. Определяют необходимости индексирования полей таблиц. Ключевые поля в большинстве случаев являются индексируемыми автоматически, то есть поиск и доступ к записям базы данных производится прежде всего по значениям ключевых полей. 4. Выделяют полей с перечислительным (словарным, списковым) характером значений. Значения таких полей определяются из некоторого унифицированного списка-словаря (поле Образование имеет унифицированные значения – Начальное, Среднее, Среднеспециальное, Среднетехническое, Высшее) Списки-словари могут быть фиксированными (пользователь к ним доступа не имеет) и динамическими (иначе). .

5. Установление ограничений целостности по полям - уникальность ключевых полей - требование обязательности заполнения 5. Установление ограничений целостности по полям - уникальность ключевых полей - требование обязательности заполнения полей - ограничение по допустимым диапазонам значений полей (например, значение поля Оклад не может быть меньше величины МРОТ. и связям (целостность ссылок) - запрещается удалять запись таблицы, если на нее существует ссылка из связанных таблиц ; - при удалении записи с ключевым полем (номер отдела) значения внешних ключей связанной таблицы (СОТРУДНИКИ) автоматически становятся неопределенными; - осуществляется каскадное удаление записей связанных таблиц.