лекция 01. Основы теории баз данных.pptx
- Количество слайдов: 29
Основы теории баз данных Информационные технологии в экономике, Лекция 01
Понятийный аппарат База данных: совокупность данных, организованных по определенным правилам, предусматривающим общие принципы описания, хранения и манипулирования данными, независимая от прикладных программ [ГОСТ 20886] База данных: совокупность данных, хранимых в соответствии со схемой данных, манипулирование которыми выполняют в соответствии с правилами средств моделирования данных [ГОСТ Р ИСО/МЭК ТО 10032 -2007] 2
Понятийный аппарат Система управления базами данных (СУБД): Совокупность программ и языковых средств, предназначенных для управления данными в базе данных, ведения базы данных и обеспечения взаимодействия ее с прикладными программами [ГОСТ 20886] Система управления базами данных (СУБД): совокупность программных и лингвистических средств общего или специального назначения, обеспечивающих управление созданием и использованием базы данных [ГОСТ Р ИСО/МЭК ТО 10032 -2007] 3
Понятийный аппарат Модель данных: совокупность правил порождения структур данных в базе данных, операций над ними, а также ограничений целостности, определяющих допустимые связи и значения данных, последовательность их изменения. [ГОСТ 20886] 4
Понятийный аппарат Модель данных: формальная теория представления и обработки данных в системе управления базами данных (СУБД), которая включает, по меньшей мере, три аспекта: ◦ 1) аспект структуры: методы описания типов и логических структур данных в базе данных; ◦ 2) аспект манипуляции: методы манипулирования данными; ◦ 3) аспект целостности: методы описания и поддержки целостности базы данных. [http: //ru. wikipedia. org/wiki/Модель_данных] 5
Понятийный аппарат Модели данных : ◦ Инфологические Диаграммы Бахмана Модель «сущность-связь» ◦ Даталогические Документальные Ориентированные на формат документа Дескрипторные Тезаурусные Фактографические Теоретико-графовые Теоретико-множественные Объектно-ориентированные ◦ Физические Основанные на файловых структурах Основанные на странично-сегментной организации 6
Реляционная модель данных Прямое декартово произведение множеств А 1 , А 2 , … , Аn: множество А 1×А 2×…×Аn всех упорядоченных последовательностей [a 1, a 2, …, an], в которых a 1 А 1 , a 2 А 2 , …, an Аn. Отношение или сущность: некоторое подмножество прямого декартового произведения множеств. 7
Реляционная модель данных Множества А 1 , А 2 , … , Аn – домены или атрибуты отношения. Экземпляр отношения или кортеж – конкретный элемент этого отношения. 8
Реляционная модель данных Пример: Человек = {[a 1, a 2, a 3, a 4, a 5]}, где ◦ ◦ ◦ a 1 А 1 = серия паспорта a 2 А 2 = номер паспорта a 3 А 3 = фамилия a 4 А 4 = имя a 5 А 5 = отчество 9
Реляционная модель данных Представить отношение можно в виде таблицы: ◦ столбцы содержат значения атрибутов ◦ в заголовок столбца можно поместить наименование атрибута ◦ строки представляют экземпляры отношения 10
Реляционная модель данных Серия паспорта Номер паспорта Фамилия Имя Отчество 7601 123456 Иванович 4308 123456 Петрович 7601 451278 Сидорович 2508 774859 Петрович В каждом столбце по отдельности значения могут повторяться, но строки, как сочетания столбцов, повторяться в не должны. Это отличает некоторую произвольную таблицу от таблицы, представляющей отношение. 11
Реляционная модель данных Ключ (потенциальный ключ): неизбыточный набор атрибутов, значения которых в совокупности являются уникальными для каждого экземпляра сущности. Неизбыточность заключается в том, что удаление любого атрибута из ключа нарушает его уникальность. 12
Реляционная модель данных Ключ может состоять из одного атрибута, тогда он называется простым. Если ключ составляется из нескольких атрибутов, он называется составным. Если разработчик выбрал один из потенциальных ключей, то такой ключ называется первичным. 13
Реляционная модель данных Серия паспорта Номер паспорта Фамилия Имя Отчество 7601 123456 Иванович 4308 123456 Петрович 7601 451278 Сидорович 2508 774859 Петрович Ключом в данной таблице является пара полей – «серия паспорта» и «номер паспорта» . Можно ввести искусственный ключ, добавив поле «личный код» , который может заполняться с помощью счетчика. 14
Реляционная модель данных Между сущностями может устанавливаться связь. Точного определения связи нет. Возможно, связь – пересечение сущностей по какому-либо атрибуту. Связь отражает семантику структуры данных. 15
Реляционная модель данных Модальности связей: ◦ Должен: ◦ Может: Виды связей: ◦ Один-к одному ◦ Один-ко-многим ◦ Многие-ко-многим 16
Реляционная модель данных Для отображения структуры данных используется модель сущность-связь (entity-relation, ER-model, предложена Питером Ченом в 1976 году): сущность 1 связь N сущность 17
Реляционная модель данных Еще одна разновидность нотации – нотация Мартина ( «воронья лапка» ) Разновидности связей: ◦ ◦ II участие в связи только одного объекта ОI участие в связи не более одного объекта >I участие в связи не менее одного объекта >O участие в связи любого числа объектов сущность 18
Функциональная зависимость Атрибут Y функционально зависит от атрибута X, если по значению атрибута X можно однозначно восстановить значение атрибута Y. Обозначение: X→Y Зависимость может быть не от одного, а от группы атрибутов, например, (X, Y, Z)→U 19
Нормальные формы Первая нормальная форма, 1 NF: ◦ [строго] каждый кортеж отношения должен содержать только одно значение каждого из атрибутов ◦ [пояснение] каждая ячейка содержит только атомарные данные, нет списков 20
Нормальные формы Таблица не соответствует первой нормальной форме Район Фамилия Читинский Онегин, Ленский Агинский Ларина Чтобы избавиться от данной аномалии, значения в ячейках необходимо разносить, дублируя строки Район Фамилия Читинский Онегин Читинский Ленский Агинский Ларина 21
Нормальные формы Вторая нормальная форма, 2 NF: ◦ [строго] выполняется условие 1 NF и каждый неключевой атрибут неприводимо зависит от потенциального ключа (неприводимо = не от части, но от целого ключа, от всех его частей в совокупности) 22
Нормальные формы Таблица не соответствует второй нормальной форме (район зависит от серии паспорта, но не от серии паспорта и номера паспорта; фамилия же зависит от серии и номера паспорта в совокупности) Серия паспорта Номер паспорта Район Фамилия 7600 123456 Читинский Онегин 7605 159753 Читинский Ленский 4309 875421 Агинский Ларина Чтобы избавиться от данной аномалии, таблицу необходимо разбивать на части 23
Нормальные формы Таблицы соответствуют второй нормальной форме Серия паспорта Номер паспорта Фамилия 7600 123456 Онегин 7605 159753 Ленский 4309 875421 Ларина Серия паспорта Район 7600 Читинский 7605 Читинский 4309 Агинский 24
Нормальные формы Третья нормальная форма, 3 NF: ◦ [строго] выполняется условие 2 NF и ни один неключевой атрибут не находится в транзитивной функциональной зависимости от потенциального ключа (транзитивная зависимость: X→Y, Y→Z) 25
Нормальные формы Таблица не соответствует третьей нормальной форме (ключ – фамилия, от фамилии зависит кафедра, а от кафедры зависит телефон) Фамилия Кафедра Телефон кафедры Онегин Математики 35 -35 -35 Ленский Математики 35 -35 -35 Ларина Информатики 92 -92 -92 Чтобы избавиться от данной аномалии, таблицу необходимо разбивать на части 26
Нормальные формы Таблицы соответствуют третьей нормальной форме. В первой ключ – фамилия, во второй ключ - кафедра Фамилия Кафедра Онегин Математики Ленский Математики Ларина Информатики Кафедра Телефон кафедры Математики 35 -35 -35 Информатики 92 -92 -92 27
Нормализация Проверка таблиц на соответствие требованиям нормальных форма – нормализация. Нормальных форм больше: 4 NF, 5 NF, BKNF, DKNF, но нам будет достаточно приводить таблицы к третьей нормальной форме. 28
Этапы проектирования ИС Системный анализ и словесное описание информационных объектов предметной области. Проектирование инфологической модели предметной области: частично формализованное описание объектов предметной области в терминах семантической модели, например, в терминах ER-модели. Даталогическое или логическое проектирование БД, то есть описание БД в терминах принятой даталогической модели данных. Физическое проектирование БД, то есть выбор эффективного размещения БД на внешних носителях для обеспечения наиболее эффективной работы приложения 29
лекция 01. Основы теории баз данных.pptx