Л1_Введение в базы данных.ppt
- Количество слайдов: 23
Базы данных
Введение в базы данных (БД) Информация, хранящаяся в БД, является отражением объектов реального мира. В традиционной терминологии объекты реального мира, сведения о которых хранятся в БД, называются сущностями (entities), а их актуальные признаки — атрибутами (attributes). Объекты реального мира связаны друг с другом множеством сложных зависимостей, которые необходимо учитывать в информационной деятельности. Важнейшая задача компьютерных систем — хранение и обработка данных. Для ее решения были предприняты усилия, которые привели к появлению в конце 60 -х годов специализированного программного обеспечения — систем управления базами данных (СУБД, database management systems).
Введение в базы данных (БД) СУБД позволяют структурировать, систематизировать и организовать данные для их компьютерного хранения и обработки. Невозможно представить себе деятельность современного предприятия или учреждения без использования профессиональных СУБД, которые составляют фундамент информационной деятельности во всех сферах — начиная с производства и заканчивая финансами и телекоммуникациями. Сердцевиной, центральным компонентом любой СУБД является сервер базы данных. Его техническое качество в решающей степени определяет главные характеристики системы, такие как производительность, надежность, безопасность и т. д.
Основные определения База данных — совместно используемый набор логически связанных данных (и описание этих данных), предназначенный для удовлетворения информационных потребностей организации. База данных — это единое, большое хранилище данных, которое однократно определяется, а затем используется одновременно многими пользователями из разных подразделений. Вместо разрозненных файлов с избыточными данными, здесь все данные собраны вместе с минимальной долей избыточности. База данных является общим корпоративным ресурсом и хранит не только данные, но и их описания. По этой причине базу данных еще называют набором интегрированных записей с самоописанием.
Основные определения Описание данных называется системным каталогом (system catalog), или словарем данных (data dictionary), а сами элементы описания принято называть метаданными (metadata), т. е. «данными о данных» . Именно наличие самоописания данных в базе данных обеспечивает независимость между программами и данными. База данных — это совокупность описаний объектов реального мира и связей между ними, актуальных для конкретной прикладной области. СУБД (Система управления базами данных) - это программное обеспечение, с помощью которого пользователи могут определять, создавать и поддерживать базу данных, а также осуществлять к ней контролируемый доступ.
Система управления базами данных СУБД – это ПО, которое взаимодействует с прикладными программами пользователя и БД и обладает следующими возможностями: Ø Позволяет определять БД, что осуществляется с помощью языка определения данных (DDL – Data Definition Language). Язык DDL предоставляет пользователям средства указания типа данных и их структуры, а также средства задания ограничений для информации, хранимой в базе данных. Ø Позволяет вставлять, обновлять и извлекать информацию из БД, - для этого служит язык управления данными (DML - Data Manipulation Language). Наличие централизованного хранилища всех данных и их описаний позволяет использовать DML как общий инструмент организации запросов, который иногда называют языком запросов.
Система управления базами данных Ø Предоставляет контролируемый доступ к базе данных с помощью перечисленных ниже средств: – системы обеспечения безопасности, предотвращающей несанкционированный доступ к базе данных со стороны пользователей; – системы поддержки целостности данных, обеспечивающей непротиворечивое состояние хранимых данных; – системы управления параллельной работой приложений, контролирующей процессы их совместного доступа к базе данных; – системы восстановления, позволяющей восстановить базу данных до предыдущего непротиворечивого состояния, нарушенного в результате сбоя аппаратного или программного обеспечения; – доступного пользователям каталога, содержащего описание хранимой в базе данных информации.
Этапы развития СУБД История развития СУБД насчитывает более 30 лет. В 1968 году была введена в эксплуатацию первая промышленная СУБД - система IMS фирмы IBM. В 1975 году появился первый стандарт ассоциации по языкам систем обработки данных — Conference of Data System Languages (CODASYL), который определил ряд фундаментальных понятий в теории систем баз данных, которые и до сих пор являются основополагающими для сетевой модели данных. В дальнейшее развитие теории баз данных большой вклад был сделан американским математиком Эдгаром Франком Коддом, который является создателем реляционной модели данных. В 1981 году Э. Ф. Кодд получил за создание реляционной модели и реляционной алгебры премию Тьюринга Американской ассоциации по вычислительной технике.
Этап развития БД на больших ЭВМ Первый этап связан с организацией БД на больших машинах типа IBM 360/370, ЕС-ЭВМ и мини-ЭВМ типа PDP 11 (фирмы Digital Equipment Corporation — DEC), разных моделях HP (фирмы Hewlett Packard). БД хранились во внешней памяти центральной ЭВМ, пользователями этих БД были задачи, запускаемые в основном в пакетном режиме. Интерактивный режим (режим взаимодействия системы с человеком, в частности, диалоговые) доступа обеспечивался с помощью консольных терминалов, которые служили только устройствами ввода-вывода для центральной ЭВМ. Эти системы можно было отнести к системам распределенного доступа, потому что БД была централизованной, хранилась на устройствах внешней памяти одной центральной ЭВМ, а доступ к ней поддерживался от многих пользователей-задач.
Особенности первого этапа развития Ø Все СУБД базируются на мощных мультипрограммных операционных системах (MVS, SVM, RTE, OSRV, RSX, UNIX). Ø Функции управления распределением ресурсов в основном выполняются операционной системой (ОС). Ø Поддерживаются языки низкого уровня манипулирования данными (навигационные методы). Ø Проводятся работы по обоснованию реляционной модели данных, была создана первая реляционная система (System R). Ø Проводятся теоретические работы по оптимизации запросов, было введено понятие транзакции. Ø Результаты теоретических исследований активно внедряются в коммерческие СУБД.
Эпоха персональных компьютеров Ø Все СУБД были рассчитаны на создание БД в основном с монопольным доступом. Ø Большинство СУБД имели развитый и удобный пользовательский интерфейс, большинство СУБД предлагали развитый и удобный инструментарий для разработки готовых приложений без программирования. Ø В настольных СУБД отсутствовали средства поддержки ссылочной и структурной целостности базы данных. Ø Наличие монопольного режима работы фактически привело к вырождению функций администрирования. Ø Скромные требования к аппаратному обеспечению со стороны настольных СУБД. Ø В принципе, их даже трудно назвать полноценными СУБД. Яркие представители этого семейства — очень широко использовавшиеся до недавнего времени СУБД Dbase (Dbase. III+, Dbase. IV), Fox. Pro, Clipper, Paradox.
Распределенные базы данных После процесса "персонализации" начался обратный процесс — интеграция. Множится количество локальных сетей, все больше информации передается между компьютерами, остро встает задача согласованности данных, хранящихся и обрабатывающихся в разных местах, но логически друг с другом связанных, возникают задачи, связанные с параллельной обработкой транзакций — последовательностей операций над БД, переводящих ее из одного непротиворечивого состояния в другое непротиворечивое состояние. Успешное решение этих задач приводит к появлению распределенных баз данных, сохраняющих все преимущества настольных СУБД и в то же время позволяющих организовать параллельную обработку информации и поддержку целостности БД.
Особенности данного этапа Ø Практически все современные СУБД обеспечивают поддержку полной реляционной модели, а именно: – структурной целостности — допустимыми являются только данные, представленные в виде отношений реляционной модели; – языковой целостности, то есть языков манипулирования данными высокого уровня (в основном SQL); – ссылочной целостности — контроля за соблюдением ссылочной целостности в течение всего времени функционирования системы. Ø Большинство современных СУБД рассчитаны на многоплатформенную архитектуру, то есть они могут работать на компьютерах с разной архитектурой и под разными операционными системами. Ø Развитые средств администрирования БД с реализацией общей концепции средств защиты данных.
Особенности данного этапа Ø Практически все современные СУБД имеют средства подключения клиентских приложений, разработанных с использованием настольных СУБД. Ø Именно к этому этапу можно отнести разработку ряда стандартов в рамках языков описания и манипулирования данными начиная с SQL 89, SQL 92, SQL 99 и технологий по обмену данными между различными СУБД, к которым можно отнести и протокол ODBC (Open Data. Base Connectivity), предложенный фирмой Microsoft. Ø Начало работ, связанных с концепцией объектноориентированных БД — ООБД. Ø Представителями СУБД, относящимся к этому этапу, можно считать MS Access 97 и все современные серверы баз данных Oracle, MS SQL, System 10, System 11, Informix, DB 2, SQL Base и другие современные серверы баз данных, которых в настоящий момент насчитывается несколько десятков.
Перспективы развития СУБД Этот этап характеризуется появлением новой технологии доступа к данным — интранет. Основное отличие этого подхода от технологии клиент-сервер состоит в том, что отпадает необходимость использования специализированного клиентского ПО. Для работы с удаленной БД используется стандартный браузер Интернета, например, Microsoft Internet Explorer.
Архитектура базы данных Самым жизнеспособным из всех подходов оказалась предложенная американским комитетом по стандартизации ANSI (American National Standards Institute) трехуровневая система организации БД. Логическая независимость Физическая независимость
Трехуровневая модель СУБД 1. Уровень внешних моделей — самый верхний уровень, где каждая модель имеет свое "видение" данных. Этот уровень определяет точку зрения на БД отдельных приложений. Например, система распределения работ использует сведения о квалификации сотрудника, но ее не интересуют сведения об окладе и домашнем адресе, которые используются в подсистеме отдела кадров. 2. Концептуальный уровень — центральное управляющее звено, здесь БД представлена в наиболее общем виде, который объединяет данные, используемые всеми приложениями, работающими с данной базой данных. Фактически концептуальный уровень отражает обобщенную модель предметной области (объектов реального мира), для которой создавалась база данных.
Трехуровневая модель СУБД 3. Физический уровень — собственно данные в файлах или в страничных структурах, расположенных на внешних носителях информации. Эта архитектура позволяет обеспечить логическую (между уровнями 1 и 2) и физическую (между уровнями 2 и 3) независимость при работе с данными. Логическая независимость предполагает возможность изменения одного приложения без корректировки других приложений, работающих с этой же БД. Физическая независимость предполагает возможность переноса хранимой информации с одних носителей на другие при сохранении работоспособности всех приложений, работающих с данной БД. Именно этого не хватало при использовании файловых систем. Выделение концептуального уровня позволило разработать аппарат централизованного управления БД.
Процесс прохождения пользовательского запроса Взаимодействие пользователя, СУБД и ОС при обработке запроса на получение данных:
Упрощённая схема прохождения запроса к БД 1. Пользователь посылает запрос СУБД. 2. Анализ прав пользователя и внешней модели данных, соответствующей данному пользователю. 3. В случае запрета СУБД сообщает пользователю об этом (12), в противном случае переходим на 4. 4. СУБД запрашивают информацию о части концептуальной модели. 5. СУБД получает эту информацию. 6. СУБД запрашивает информацию о местоположении данных на физическом уровне. 7. В СУБД возвращается информация о местоположении данных в терминах ОС. 8. СУБД «просит» ОС предоставить данные. 9. ОС пересылает данные в системный буфер. 10. ОС оповещает СУБД об окончании пересылки. 11. СУБД выбирает из доставленной информации в системном буфере, только то, что нужно пользователю, и пересылает эти данные в рабочую область пользователя.
Основные понятия реляционной модели Реляционная модель данных была разработана Коддом в 1970 году на основе математической теории отношений и опирается на систему понятий, важнейшими из которых являются таблица, отношение, строка, столбец, первичный ключ, внешний ключ. Реляционной считается такая база данных, в которой все данные представлены для пользователя в виде прямоугольных таблиц значений данных, и все операции над базой данных сводятся к манипуляциям с таблицами.
Основные понятия реляционной модели
Соответствие формальных реляционных терминов и их неформальных эквивалентов Формальный реляционный термин Неформальный эквивалент Отношение Кортеж Кардинальное число Атрибут Степень Первичный ключ Таблица Строка Количество строк Столбец Количество столбцов Уникальный идентификатор Совокупность допустимых значений Домен
Л1_Введение в базы данных.ppt