Лекция 8 - СУБД Access.ppt
- Количество слайдов: 45
Основы работы в системе управления базами данных (СУБД) MS Access
Данные — это результат фиксации, отображения информации на каком-либо материальном носителе, зарегистрированное на материальном носителе представление каких - либо сведений
Варианты хранения данных Вариант Бумага Преимущества Недостатки +++ ----- Таблица в текстовом файле (MS Word) + простота ввода Электронные таблицы (MS Excel) + структурированность данных + наглядность + простота вычислений База данных (MS Access) + неограниченный объем + структура связанных между собой данных любой сложности + нормализация данных + высокая скорость работы Образец минимальные возможности обработки - элементарная сортировка - только простейшие функции - относительные ограничения по объему ввода (Excel 2003: 256 x 65536, Excel 2007 -2010: 16384 x 1048576) - таблицы, не связанные между собой (возможна связь отдельных диапазонов ячеек) -таблицы ненормализованные - - трудность освоения -Коммент
База данных — интегрированная совокупность данных, предназначенная для хранения и многофункционального использования
База данных — организованная в соответствии с определёнными правилами и поддерживаемая на накопителях информации совокупность взаимосвязанных данных, характеризующая актуальное состояние некоторой предметной области и используемая для удовлетворения информационных потребностей пользователей
Отличительные признаки базы данных • • БД хранится и обрабатывается в вычислительной системе Данные в БД логически структурированы с целью обеспечения возможности их эффективного поиска и обработки (выделены составные элементы, связи между ними, проведена типизация элементов и связей) • БД включает метаданные, описывающие логическую структуру БД в формальном виде - метамодель данных
Модели организации данных Ядро любой БД – модель данных. Модель данных – набор принципов, определяющих организацию логической структуры хранения данных в базе. Модели БД определяются тремя компонентами: • Допустимой организацией данных; • Ограничениями целостности; • Множеством допустимых операций • • Классификация БД по модели данных Иерархическая Сетевая Реляционная Объектно-ориентированная
Иерархическая модель данных - все записи, агрегаты и атрибуты БД образуют такую структуру, в которой все элементы связаны отношениями подчиненности, при этом любой элемент может подчиняться только одному какому-нибудь другому элементу. Эту форму зависимости удобно отображать с помощью древовидного графа (схемы, состоящей из точек, стрелок, которые связаны и не имеют циклов).
Сетевая модель данных В сетевой структуре данных потомок может иметь любое число предков Сетевая БД состоит из набора записей заданных типов (из допустимого набора типов) и набора связей между ними из заданного набора типов связей
Реляционная модель данных - объекты и соотношения между ними представляются в виде таблиц, строки которых соответствуют записям, а столбцы – атрибутам отношений (полям). Реляционная модель ориентирована на организацию данных в виде двумерных таблиц. Каждая реляционная таблица – это двумерный массив Свойства реляционных таблиц: • каждый элемент таблицы - один элемент данных; • все столбцы в таблице однородные, т. е. все элементы в столбце имеют одинаковый тип (числовой, символьный и т. д. ) и длину; • каждый столбец имеет уникальное имя; • одинаковые строки в таблице отсутствуют; • порядок следования строк и столбцов может быть произвольным
Реляционная модель данных В реляционной БД каждая таблица должна иметь первичный ключ- поле или комбинацию полей, которые единственным образом идентифицируют каждую строку в таблице. Если записи однозначно определяются значениями нескольких полей, то такая БД имеет составной ключ. Чтобы связать две реляционные таблицы, необходимо ключ первой таблицы ввести в состав ключа второй таблицы (возможно совпадение ключей); в противном случае нужно ввести в структуру первой таблицы внешний ключ - ключ второй таблицы.
Схема реляционной модели данных
Пример реляционной модели, построенной на основе отношений: СТУДЕНТ, СЕССИЯ, СТИПЕНДИЯ Таблицы СТУДЕНТ и СЕССИЯ имеют совпадающие ключи (Номер), что дает возможность легко организовать связь между ними. Таблица СЕССИЯ имеет первичный ключ Номер и содержит внешний ключ Результат, который обеспечивает ее связь с таблицей СТИПЕНДИЯ.
Объектно-ориентированная модель данных - база данных, в которой данные моделируются в виде объектов, их атрибутов, методов и классов Обязательные характеристики ООБД (манифест объектно-ориентированных БД): • Поддержка сложных объектов. • Поддержка индивидуальности объектов. Поддержка инкапсуляции • Поддержка типов и классов. • Поддержка наследования типов и классов от их предков • Перегрузка в сочетании с полным связыванием • Вычислительная полнота • Набор типов данных должен быть расширяемым ( *языки программирования : Python, Java, C#, Visual Basic. NET, C++, Objective-C и Smalltalk или собственные языки программирования)
Классификация БД по степени распределенности централизованные – БД хранится в памяти одной вычислительной системы. Если эта вычислительная система является компонентом сети ЭВМ, возможен распределенный доступ к такой базе. Такой способ использования баз данных часто применяют в локальных сетях ПК. распределенные - база данных состоит из нескольких, возможно пересекающихся или даже дублирующих друга частей, хранимых в различных ЭВМ вычислительной сети. Работа с такой базой осуществляется с помощью системы управления распределенной базой данных (СУРБД).
Классификация БД по способу доступа к данным n n Встраиваемые (локальные) – и база данных и управляющая программа находятся на рабочей станции Файл-серверные - база данных находится на сервере, управляющая программа - на рабочей станции
Классификация БД по способу доступа к данным (продолжение) n Клиент-серверные – и база данных и управляющая программа находятся на сервере Рабочие станции (* специфика архитектуры клиент-сервер - использование языка запросов SQL)
Классификация БД по уровню нормализованности OLTP ( On-Line Transaction Processing - оперативная обработка транзакций) – сильно нормализованные (быстро и надежно выполняют много одновременных простых запросов) Использование: складской учет, системы продажи билетов, банковские системы и т. п. • OLАP (On-Line Analitical Processing -оперативная аналитическая обработка данных) – слабо нормализованные (быстро выполняют редкие, но сложные по структуре анализа данных запросы) Использование: системы поддержки принятия решений, системы интеллектуального анализа данных •
Уровни разработки базы данных Сама предметная область n Модель предметной области n Логическая модель данных (ER-диаграммы*) n Физическая модель данных n Собственно база данных и приложения n * Entity–Relation Сущность-Связь
Основные понятия ER-диаграмм n n n Сущность - это класс однотипных объектов, информация о которых должна быть учтена в модели в виде таблицы Экземпляр сущности - это конкретный представитель данной сущности (запись в таблице) Атрибут сущности - это именованная характеристика, являющаяся некоторым свойством сущности (поле таблицы) Ключ сущности - это неизбыточный набор атрибутов, значения которых в совокупности являются уникальными для каждого экземпляра сущности Связь - это некоторая ассоциация между двумя сущностями
Типы связей между сущностями (Может) Модальность 1 ∞ (Должен)
Нормализация базы данных – приведение структуры базы данных к виду, обеспечивающему минимальную логическую избыточность. Производится за счет декомпозиции сущностей так, чтобы в каждой из них хранились только первичные факты, не выводимые из других хранимых фактов.
Нормализация данных Первая нормальная форма n каждое поле таблицы должно содержать только одно значение (простой атрибут) n таблица не должна содержать повторяющихся столбцов с похожими группами данных Вторая нормальная форма n данные, не зависящие непосредственно от первичного ключа таблицы, должны быть перенесены в другую таблицу Третья нормальная форма n не должно быть полей, которые могут быть вычислены на основе значений, хранящихся в других полях этой же таблицы или в других таблицах базы данных.
Исходные данные Плоская таблица с типичными структурными ошибками. Анализ провести нельзя
Начало приведения к 1 НФ Часть полей пустая, анализ проводить сложно
Первая нормальная форма • каждое поле таблицы должно содержать только одно значение (простой атрибут) • таблица не должна содержать повторяющихся столбцов с похожими группами данных
Вторая нормальная форма n n Таблица обязательно должна иметь первичный ключ: одно или несколько полей с уникальными значениями в каждой записи. Это необходимо для идентификации конкретного объекта (конкретной строки в таблице) Поле с типом Счетчик (Auto. Number). Новая строка - значение автоматически увеличивается на единицу Составной первичный ключ - из нескольких полей. Неудобно поддерживать (ручной ввод), медленнее обрабатывается Для перевода из первой во вторую НФ таблицу надо разбить (декомпозиция). Первичному ключу одной таблицы должен соответствовать внешний ключ другой (но в этой другой таблице также должен быть свой первичный ключ) Данные, не зависящие непосредственно от первичного ключа таблицы, должны быть перенесены в другую таблицу n n n В одной таблице – однотипные объекты Одна строка – один объект Атрибуты объекта – простые (атомарные)
База данных «Услуги»
Схема базы данных «Услуги» Связи между таблицами: 1: 1 (используется редко) 1: М М: 1 М: М (требуется дополнительная промежуточная таблица)
Третья нормальная форма n Не должно быть полей, которые могут быть вычислены на основе значений, хранящихся в других полях этой же таблицы или в других таблицах базы данных Если известна стоимость каждого исследования и их количество, то не надо хранить стоимость услуги. Она может быть в любой момент вычислена (одно из исключений – бухгалтерские БД) Если есть поля "Доза на прием", "Число приемов с сутки" и "Длительность приема", то не должно быть отдельного поля "Курсовая доза", которое заполняется вручную. Оно должно быть вычисляемым. Вычисляемым может быть поле в таблице, поле в форме, поле в запросе или поле в отчете. В Access 2007 -2010 есть специальный тип поля – вычисляемое
Аномалии баз данных (устраняются после нормализации БД) • Аномалия обновления Хранение в таблице данных, не зависящих от первичного ключа, приводит к необходимости обновлять много записей при каждом изменении независимой информации. Иначе несоответствие обновленной записи другим записям таблицы (СПб. МАПО и СЗГМУ) • Аномалия вставки Если вычисляемое поле рассчитывается только в момент первичного заполнения, то возможна ошибка. Например, при исправлении поля "Длительность приема" надо не забывать исправлять значение в поле "Курсовая доза" или поручить эту задачу СУБД (в Excel для решения этой проблемы используется автоматическое обновление значений функций) • Аномалия удаления Если в таблице, содержащей адрес пациента, были удалены данные об его единственном посещении, то исчезнут не только сведения о посещении, но и о человеке. Поэтому, как правило, контактную
Основные функции СУБД Создание структуры новой базы данных n Первичный ввод, пополнение, редактирование данных n Создание запросов к базе данных n Создание форм n Создание отчетов n Визуализация информации n
Базы данных - Основная терминология n СУБД - система управления базами данных n БД - набор информации, относящийся к определенной теме или области деятельности n файл - одна БД может состоять из нескольких файлов (например, в одном файле - собственно данные, а в другом – формы ввода данных и отчеты) n таблица - в одной БД - множество таблиц, на таблицы из одной БД можно делать ссылки из другой БД (данные в одном месте, а используются разными системами) n запись(строка, ряд) n поле (столбец или пересечение строки и графы - терминологическая неоднозначность)
Таблицы баз данных Одним из самых естественных способов представления данных является двухмерная таблица Как правило, таблица содержит группу однородных информационных объектов. Одна строка - один объект Каждое поле- атрибут (характеристика, свойство) конкретного объекта Атрибуты могут быть простыми (человек - рост, вес) и сложными (человек - адрес, адрес состоит из нескольких полей: индекс, город, улица, номер дома, корпус, квартира) Как правило, сложные атрибуты должны быть разбиты на совокупность простых атрибутов (атомарные значения) Свойства таблиц БД • все элементы столбца имеют одинаковый тип данных (текст, число, дата и т. п. ) • столбцам присваиваются уникальные имена • в таблице нет двух одинаковых строк • порядок расположения строк и столбцов в таблице не имеет значения
Окно СУБД Access
Конструктор таблиц В записи таблицы могут содержаться данные разных типов
Схема данных
Связанные таблицы
Создание простого запроса с помощью мастера
Конструктор запросов
Создание запроса на подсчет итогов
Итоговый запрос
Форма пациента
Конструктор форм
Отчет по врачам
Лекция 8 - СУБД Access.ppt