базы_данных.ppt
- Количество слайдов: 38
Базы данных Общее представление о системе баз данных
Данные и информация l ЧАСТО ТЕРМИНЫ ДАННЫЕ И ИНФОРМАЦИЯ ИСПОЛЬЗУЮТСЯ КАК СИНОНИМЫ. МЫ БУДЕМ ИХ РАЗЛИЧАТЬ ИНФОРМАЦИЯ ЭТО ДАННЫЕ И ЗНАНИЯ О КАКИХ-ЛИБО ОБЪЕКТАХ (ФАКТАХ, СОБЫТИЯХ) ДАННЫЕ ЭТО ИНФОРМАЦИЯ ПРЕДСТАВЛЕННАЯ В ФОРМАЛИЗОВАННОЙ ФОРМЕ , ПРИГОДНАЯ ДЛЯ РУЧНОЙ ИЛИ АВТОМАТИЧЕСКОЙ ОБРАБОТКИ
Базы данных l ПОД БАЗОЙ ДАННЫХ ПОНИМАЕТСЯ СОВОКУПНОСТЬ ДАННЫХ, ОРГАНИЗОВАННАЯ ПО ОПРЕДЕЛЕННЫМ ПРАВИЛАМ, ПРЕДУСМАТРИВАЮЩИМ ОБЩИЕ ПРИНЦИПЫ ОПИСАНИЯ, ХРАНЕНИЯ И МАНИПУЛИРОВАНИЯ ДАННЫМИ. ЭТА СОВОКУПНОСТЬ НЕЗАВИСИМА ОТ ПРИКЛАДНЫХ ПРОГРАММ.
алгоритмы обработки заметно различаются БАЗЫ ДАННЫХ
Позадачный подход: использование отдельного файла и программы для задачи (реализовано в первых АИС). Основная задача при работе с данными – получить задача 1 достоверные данные в нужное время, в нужном месте за приемлемую цену. l Недостатки: l l файл 1 ПРОГРАММА 1 - избыточность данных; - слабый контроль данных; - недостаточные возможности управления данными; - большие затраты труда программиста.
Два основных требования к организации данных в автоматизированных ИС (АИС): интеграция данных, независимость данных, когда все данные накапливаются и т. е. существует хранятся возможность нормального функционирования БД при централизованно, создавая динамически (в изменениях как со стороны логической, так и со реальном масштабе стороны физической модели, времени) обновляемую (логическая и физическая модель предметной независимость). области;
Требования к программным средствам разработки информационных систем l l обеспечить пользователя или прикладные программы языковыми средствами описания и манипулирования данными; обеспечить независимостью описания данных от прикладных программ; обеспечить поддержку логических моделей данных предметной области; обеспечить защиту и целостность (согласованность) данных при работе с БД.
При разработке большого проекта на основе общей БД. возникает необходимость в Разработка общей БД, с долгосрочной функции администрирования, которые выполняет администратор баз данных (АБД). . использованием СУБД Функции АБД: координация проектирования, реализации и ведения БД, определение структуры данных и правила доступа. Система управления базами данных (СУБД) – комплекс программно-аппаратных средств, обеспечивающих доступ к БД и управление данными
Основные функции СУБД l l l Непосредственное управление данными во внешней памяти. Эта функция включает обеспечение необходимых структур внешней памяти как для хранения данных, непосредственно входящих в БД, так и для служебных целей, например, для убыстрения доступа к данным в некоторых случаях (обычно для этого используются индексы). Управление буферами оперативной памяти. В развитых СУБД поддерживается собственный набор буферов оперативной памяти с собственной дисциплиной замены буферов. Управление транзакциями. Транзакция - это последовательность операций над БД, рассматриваемых СУБД как единое целое. Журнализация. Поддержка языков БД. Для работы с базами данных используются специальные языки, в целом называемые языками баз данных. Стандартным языком наиболее распространенных в настоящее время реляционных СУБД является язык SQL (Structured Query Language).
Типовая организация СУБД l Ядро СУБД (Data Base Engine) отвечает за управление данными во внешней памяти, управление буферами оперативной памяти, можно выделить компоненты ядра управление транзакциями и менеджер данных, журнализацию. Ядро СУБД является менеджер буферов, основной резидентной частью СУБД. менеджер транзакций и менеджер журнала l Компилятор языка БД (обычно SQL). l Набор утилит.
Модели данных. l. Термином сущность называют объект любой природы, о котором надо хранить информацию в БД. l. Свойства, характеризующие сущность, называют атрибутами. l Конкретный экземпляр – экземпляром сущности. Между различными сущностями ПО и их атрибутами могут существовать межсущностные и межатрибутные связи, информационно важные для пользователя БД. Cущности, атрибуты и связи должны быть каким-то образом описаны для представления в ЭВМ. Это описание делается в терминах той модели данных, которую поддерживает СУБД.
определение модели данных (логический уровень ) Модель определяется: допустимой структурой данных, разнообразием и количеством типов объектов, которые можно описать с помощью модели; l множеством допустимых операций над данными; l логические ограничения модели, накладываемые на данные, для сохранения непротиворечивости данных и обеспечения адекватного (целостного) отображения ПО в БД. Модели данных, поддерживаемые СУБД, делятся на реляционные и многомерные. l
Реляционная модель l В основе реляционной модели данных лежит понятие отношения. Отношение удобно представить в виде двумерной таблицы
Реляционная модель Замечание: математическое определение отношения не допускает наличия двух идентичных кортежей, однако некоторые СУБД это допускают. наборы терминов при математическом определении, графическом представлении и с точки зрения обработки данных: 1. отношение, таблица, файл - сущность; 2. кортеж, строка, запись - экземпляр сущности; 3. атрибут, столбец, поле - атрибут.
Ключи l. Любой набор атрибутов, однозначно определяющий каждый кортеж реляционной таблицы, называется первичным ключом. l Первичный ключ может быть составным или частичным, но в обоих случаях для задания первичного ключа используется минимальный набор атрибутов или минимальная часть атрибута.
Отношение «многие-ко-многим» в реляционной СУБД не поддерживается. Это отношение обычно заменяется двумя отношениями типа «один-ко-многим» . Для этого выбирается дополнительный объект - таблица пересечения. Она включает атрибуты таблиц, находящихся в отношении «многие-ко-многим» .
Схема данных учебной базы данных
Ограничения, накладываемые на таблицы реляционной моделью данных l l l не может быть одинаковых первичных ключей, т. е. все строки таблицы должны быть уникальны; все строки таблицы должны иметь одну и ту же структуру, т. е. одно и то же количество атрибутов с соответственно совпадающими именами; имена столбцов различны ( в разных таблицах могут совпадать); значения атрибутов должны быть атомарны, следовательно отношения не могут иметь в качестве компонент другие отношения; соблюдается отсылочная целостность для внешних ключей (нельзя ссылаться на несуществующий первичный ключ); порядок строк в таблице несущественен, так как влияет лишь на скорость доступа в строке.
Проектирование и разработка реляционных БД Основная задача: предусмотреть хранение всех взаимосвязанных, совместно используемых и контролируемых данных
Для ее решения необходимо: n n n определить данные и их свойства; исключить избыточность данных; определить логическую структуру БД в целом (разработать концептуальную схемы данных), включающую определения элементов данных и отношения между ними;
Для ее решения необходимо: n перейти от концептуальной схемы к реляционной схеме данных. n решить проблему целостности баз данных (точности и истинности хранящихся в БД); данных,
Поддержание целостности БД. (поддержание точности и истинности данных, хранящихся в БД). n Для реляционной модели должна выполняться категорная целостность, целостность на уровне ссылок, функциональные зависимости
n Правило категорной целостности - ни какой ключевой атрибут любой строки реляционной таблицы не может быть пустым. n Правило целостности на уровне ссылок - значение каждого внешнего ключа должно быть либо пустым, либо равным одному из текущих значений ключа другой таблицы. n При функциональной зависимости значение одного атрибута в кортеже однозначно определяет значение другого атрибута в кортеже – например, атрибут первичного или возможного ключа однозначно определяет кортеж, т. е. функциональная зависимость ключ любой не ключевой атрибут кортежа
На этапе преобразования концептуальной модели в реляционную проблему целостности можно в значительной степени решить за счет нормализации отношений n Нормализация отношений - это пошаговый процесс декомпозиции (разложения) исходных отношений БД на другие, более мелкие и простые отношения. Каждая нормальная форма ограничивает тип функциональной зависимости и устраняет соответствующие аномалии (нежелательные эффекты) при выполнении операций над отношениями БД.
Аномалии n n n Аномалия модификации из-за избыточности данных. Аномалия ввода: нельзя вводить данные о преподавателе, который не ведет предмета. Аномалия удаления: вместе с увольнением преподавателя могут исчезнуть данные о предмете
База данных Excel – Преподаватели_кафедры
Пять нормальных форм отношений n n Отношение находится в первой нормальной форме, когда оно содержит только скалярные величины, т. е. предусматривается атомарность хранимых данных. Например, в отношении Преподаватель есть поле Ф. И. О. следует разбить на три реквизита: Фамилия, Имя, Отчество, если возможно использование по отдельности фамилии, имени и отчества.
Пять нормальных форм отношений n Вторая нормальная форма – это первая нормальная форма, у которой каждый не ключевой атрибут функционально полно зависит от первичного ключа. Например, в отношении Преподаватель могут содержаться как сведения о преподавателе, так и месячная нагрузка. В качестве первичного ключа этой таблицы используется составной ключ, включающий Код_преподавателя и Календарный_месяц. Это отношение не находится во 2 НФ, потому что атрибуты, содержащие анкетные данные о преподавателе (Дата_рождения, адрес и др. ) функционально зависят от части составного ключа – Код_преподавателя. Отношение следует разбить на два: Преподаватель и Нагрузка преподавателя.
Требования для третьей нормальной формы - все не ключевые столбцы должны зависеть от первичного ключа таблицы, но не зависеть друг от друга (нет транзитивной зависимости). Транзитивная зависимость возникает, если не ключевой атрибут функционально зависит от одного и более не ключевых атрибутов. Например, в отношение Преподаватель могут быть введены атрибуты ученая степень, ученое звание, должность. Если предположить, что ученая степень и ученое звание однозначно определяют должность преподавателя, то отношение Преподаватель не находится в 3 НФ.
Разработка БД Для простых БД на этапе концептуального проектирования можно, минуя создание концептуальной модели данных, непосредственно разработать реляционную схему данных, состоящую из реляционных таблиц и связей между ними.
Построение базы данных в СУБД ACCESS. Основные понятия и возможности системы. n В Microsoft Access объектами называют все, Microsoft Access – это функционально что может иметь имя. полная реляционная СУБД. ним относятся: К В ней предусмотрены все необходимые таблица, запрос, средства для определения и обработки форма, отчет, данных, а также для управления ими при элементы работе с большими объемами информации. управления, n При проектировании БД используются элементы макрос и модуль. БД: объекты и связи между ними.
Объекты ACCESS. n Таблицы - основной компонентом Access. В поле таблицы могут быть представлены разные типы данных. Ключи задаются при описании таблиц. Для полей можно использовать индексы. Индекс - это средство, ускоряющее поиск и сортировку в таблице. Ключевое поле таблицы индексируется автоматически. Не допускается создание индексов для полей типа MEMO , Гиперссылка или полей объектов OLE. Для создания БД нужно описать таблицы и связать эти таблицы между собой с помощью схемы. Описание таблиц выполняется средствами языка, включенного в Access. Описать таблицы и установить связи можно с помощью операторов SQL.
Объекты ACCESS. n Запрос - это условие выбора информации из одной или нескольких различных таблиц для просмотра, анализа, изменения данных, выполнения сортировки, вычисления значений над группами записей, получения итоговых строк и представления результатов, как правило, в виде динамических (виртуальных) таблиц. Запросы используются в качестве источника данных для форм и отчетов. Вычисляемые поля в запросах нельзя изменять. Для составления отчетов используют языки QBE или SQL.
Объекты ACCESS. Форма является основным средством интерфейса пользователя в разных приложениях и предназначена для управления ходом выполнения приложения. Она может быть разных типов : для ввода данных в таблицу, кнопочная форма для открытия других форм и отчетов. n Отчет – это объект, предназначенный для создания документа, который в дальнейшем может быть распечатан или включен в документ другого приложения. Access позволяет использовать графические объекты, которые называются элементами управления. n
Объекты ACCESS. Макрос - это объект, представляющий собой структурированное описание одного или несколько действий. В Access макросом называют макрокоманду или набор макрокоманд, используемый для автоматического выполнения некоторых операций. n Модуль - это набор объявлений и процедур на языке Visual Basic для приложений, собранных в одну программную единицу. Microsoft Access позволяет также работать с данными других СУБД и приложениями Microsoft Office. Для этого имеются специальные команды импорта/экспорта данных. n
Основные функции ACCESS n n Организация данных – функция включает в себя создание таблиц данных и управление ими. Связывание таблиц и обеспечение доступа к данным – функция позволяет связывать таблицы по совпадающим значениям полей, с целью последующего соединения нескольких таблиц в одну временную таблицу. Временная таблица является объектом класса Recordset. Добавление и изменение данных – эта функция требует разработки и реализации представления данных, отличных от табличного представления (использовать формы). Вывод данных – СУБД должна создавать различные отчеты, хранящихся в таблицах или объектах Recordset
Логическую структуру БД можно построить, используя один из двух подходов к разработке: функциональноориентированный или ориентированный на данные. n n При первом подходе система рассматривается с точки зрения тех функций, которые выполняет ; Второй подход основное внимание уделяет данным. Второй подход предпочтительней, так как данные более стабильны, чем выполняемые ими функции средства передачи данных.
После начального этапа проектирования на концептуальном уровне, следует перейти к следующим этапам. В соответствии со стандартом ANSI/PARC, предусматривающим трехуровневую архитектуру базы данных, помимо концептуального уровня, рассматриваются внешний и внутренний уровни представления данных.
базы_данных.ppt