Л2-Архитектура бд.ppt
- Количество слайдов: 36
Введение в технологии баз данных Лекция 1 Прикладная информатика в экономике Кафедра ИС
"История исследований систем баз данных — это, по сути, история развития приложений, достигших исключительной производительности и оказавших потрясающее влияние на экономику. В 70 -е годы 20 века эта сфера была всего лишь областью фундаментальных научных исследований, то теперь на исследованиях баз данных основана целая индустрия информационных услуг, ежегодный бюджет которой только в США составляет 10 миллиардов долларов. Достижения в исследованиях баз данных стали основой фундаментальных разработок коммуникационных систем транспорта и логистики, финансового менеджмента, систем с базами знаний, методов доступа к научной литературе, а также большого количества гражданских и военных приложений. Они также послужили фундаментом значительного прогресса в ведущих областях науки — от информатики до биологии", — Зильбершац (Silbftischatz ct al. , 1991).
► Базы данных являются неотъемлемой частью нашей повседневной жизни. Можно рассматривать базу данных как некий набор связанных данных, а систему управления базами данных, или СУБД (Database Management System — DBMS), как программное обеспечение, которое управляет доступом к этой базе данных.
По мере развития информационных технологий совершенствовались методы решения экономических задач на компьютерах. ► На начальном этапе задачи решались изолированно, а прикладные программы, реализующие их, сами обеспечивали ввод и организацию необходимых данных. Такая технология приводила к значительному дублированию хранимых данных и затрудняла их обновление. ► Большие объемы экономической информации, ее относительно высокая стабильность, наряду с требованиями к актуальности и достоверности, привели к необходимости интеграции данных в единой базе, обеспечивающей решение всего комплекса задач определенной предметной области. ► В этой связи потребовалось разработать специальные методы и механизмы управления такого рода совместно используемыми ресурсами данных, которые стали называться базами данных (БД).
► На концепции БД базируются основные идеи современной информационной технологии. Согласно этой концепции, основой информационной технологии являются данные, которые должны быть организованы в БД с целью адекватного отображения изменяющегося реального мира и удовлетворения информационных потребностей пользователей.
► Увеличение объема и структурной сложности хранимых данных, расширение круга пользователей информационных систем выдвинуло требования создания удобных общесистемных средств интеграции хранимых данных и управления ими. Это и привело к появлению в конце 60 -х годов первых промышленных систем управления базами данных (СУБД) - специализированных программных средств, предназначенных для организации и ведения БД.
► Наряду с разработкой научных основ сформировалась и получила массовое распространение практическая технология баз данных со всеми ее ключевыми компонентами. ► Созданы методология проектирования и эксплуатации систем баз данных, а также развитые инструментальные средства для разработчиков таких систем и персонала администратора базы данных, для разнообразных по характеру потребностей и по уровню квалификации категорий пользователей.
В результате активной деятельности ряда крупных компаний США, большинство из которых выполняло военные заказы, стали появляться первые приложения, использующие принципы баз данных. В июне 1963 г. В Санта-Монике (штат Калифорния) компанией System Development Corporation (SDC) был организован, вероятно, первый симпозиум, посвященный проблематике баз данных. На симпозиуме обсуждался ряд докладов по использованию баз данных в военных приложениях, были представлены ранние программные системы, которые можно квалифицировать как СУБД. По мнению известного эксперта в области баз данных Т. Олле, именно в рамках разработок, представленных на этом симпозиуме, и родился термин «база данных» .
60 -ч гг. стал временем становления новых технологий, связанных с созданием, поддержкой и использованием баз данных. В начале 60 -х гг. были созданы первые системы управления базами данных. Среди них СУБД общего назначения IDS (Integrated Data Storage, 1963 г. ), разработанная в компании General Electric под руководством будущего Тьюринговского лауреата Чарльза Бахмана. Эта система интересна не только тем, что она была одной из первых коммерческих СУБД. Реализованные в ней принципы организации базы данных и манипулирования данными стали впоследствии основой сетевой модели данных CODASYL. ► Период
►В этот период начинают также формироваться основы методологии построения систем баз данных, которая вскоре стала играть основополагающую роль в разработке информационных систем самого различного назначения. Одним из ключевых элементов этой методологии является концепция модели данных. Термин «модель данных» вошел в лексикон специалистов в области баз данных несколько позднее – в 70 -е гг. , после публикации фундаментальной работы Эдгара Кодда о реляционной модели данных.
Рабочей группе CODASYL по базам данных (CODASYL DBTG), созданной в 1967 г. и преобразованной в последствии (в 1971 г. ) в Комитет по языку определения данных (Data Definition Language Committee, DDLC), принадлежит заслуга создания спецификаций сетевой модели данных. Эти спецификации стали фактически первым индустриальным стандартом в области систем баз данных. В спецификациях CODASYL DBTG сформулированы такие основополагающие принципы, как: отделение описания данных от прикладной программы и введение концепции схемы базы данных, строгое разграничение «логического» и «физического» представлений данных, обеспечение прозрачности представления в среде хранения для пользователя, концепции защиты целостности данных и управления доступом. Определены функции администрирования данными и принципы построения интерфейсов прикладного программирования СУБД, введена концепция процедуры баз данных – прообраза триггеров в SQL.
Трехуровневая архитектура СУБД, предложенная в спецификациях DBTG, без сомнения, оказала влияние на формирование архитектурной концепции известного отчета ANSI/X 3/SPARC [3] – «трехсхемной технологии» - и послужила ее прототипом.
Архитектура ANSI/X 3/SPARС. Цель трёхуровневой архитектуры. Уровни описания данных.
► База данных (database)- совокупность взаимосвязанных данных, организованных в соответствии со схемой базы данных таким образом, чтобы с ними мог работать пользователь. (ГОСТ 34. 321 -96 «Эталонная модель управления данными» ) ► Схема базы данных – формальное описание данных в соответствии с конкретной схемой данных (ГОСТ 34. 321 -96 «Эталонная модель управления данными» ) ► Схема данных – логическое представление организации данных (ГОСТ 34. 321 -96 «Эталонная модель управления данными» )
► При создании информационной системы требуется как согласование задач (функций), так и согласование данных. При этом были сформулированы основные требования к организации данных: ► интеграция данных; ► максимально возможная независимость данных от прикладных программ.
База данных – это совокупность данных, обладающих следующими свойствами: ► интегрированность, направленная на решение общих задач; ► модельность ( структурированность, отражающая некоторую часть реального мира); ► независимость описания данных от прикладных программ.
► База данных – это совместно используемый набор логически связанных данных (и описание этих данных), предназначенный для удовлетворения информационных потребностей пользователей.
► База данных (Data Base) – Организованная в соответствии с определенными правилами и поддерживаемая в памяти компьютера совокупность данных, характеризующая актуальное состояние некоторой предметной области и используемая для удовлетворения информационных потребностей пользователей. (М. Р. Когаловский, Энциклопедия технологий баз данных)
► Осознание важной роли, которую стали играть технологии баз данных в разработках информационных систем, и интенсивное расширение масштабов этих разработок, побудили и официальные органы стандартизации обратить внимание на эту сферу деятельности.
► Одной из первых попыток в этом направлении, предпринятых официальными органами стандартизации, принадлежит исследовательской группе по базам данных ANSI/X 3/SPARC. Эта группа стремилась выявить возможные субъекты стандартизации в технологиях баз данных. Результаты проведенной ею работы были представлены в знаменитом отчете (ANSI/X 3/SPARC Study Group on Data Base Management Systems Interim Report. FDT Bulletin, 7(2), 1975, pp. 1140), который дал путевку в жизнь концепциям трехсхемной технологии и способствовал широкому признанию принципов многоуровневого представления данных в системах баз данных.
► Для нас наиболее важным является идентификация трех уровней абстракции, т. е. трех различных уровней описания элементов данных. Эти уровни формируют трехуровневую архитектуру, которая охватывает внешний, концептуальный и внутренний уровни. ► Цель трехуровневой архитектуры заключается в отделении пользовательского представления базы данных от ее физического представления.
Трехуровневая архитектура описания данных. Внешний уровень Пользователь1 Представление 1 Концептуальный Пользователь 2 Представление 2 Концептуальная схема уровень Внутренний уровень Физическая Организация данных . . . Внутренняя схема БД Пользователь. N Представление N
► Каждый пользователь должен иметь возможность обращаться к одним и тем же данным, используя свое собственное представление о них. ► Каждый пользователь должен иметь возможность изменять свое представление о данных, причем это изменение не должно оказывать влияния на других пользователей.
► Пользователи не должны непосредственно иметь дело с такими подробностями физического хранения данных в базе, как индексирование и хеширование. Иначе говоря, взаимодействие пользователя с базой не должно зависеть от особенностей хранения в ней данных.
Администратор базы данных (АБД) должен иметь возможность изменять структуру хранения данных в базе, не оказывая влияния на пользовательские представления. ► Внутренняя структура базы данных не должна зависеть от таких изменений физических аспектов хранения информации, как переключение на новое устройство хранения. ► АБД должен иметь возможность изменять концептуальную или глобальную структуру базы данных без ►
► Уровень, на котором воспринимают данные пользователи, называется внешним уровнем (external level), ► тогда как СУБД и операционная система воспринимают данные на внутреннем уровне (internal level). Именно на внутреннем уровне данные реально сохраняются с использованием всех тех структур и файловой организации, которые рассматриваются. ► Концептуальный уровень (conceptual level) представления данных предназначен для отображения внешнего уровня на внутренний и обеспечения необходимой независимости их друг от друга.
► Внешний уровень - представление базы данных с точки зрения пользователей. Этот уровень описывает ту часть базы данных, которая относится к каждому пользователю. Внешний ypoвень состоит из нескольких различных внешних представлений базы данных.
► Концептуальный уровень обобщающее представление базы данных. Этот уровень описывает то, какие данные хранятся в базе данных, а также связи, существующие между ними. Этот уровень содержит логическую структуру всей базы данных (с точки зрения АБД). Фактически, это полное представление требований к данным со стороны организации, которое не зависит от любых соображений относительно способа их хранения.
На концептуальном уровне представлены следующие компоненты: ► все сущности, их атрибуты и связи; ► накладываемые на данные ограничения; ► семантическая информация о данных; ► информация о мерах обеспечения безопасности и поддержки целостности данных.
► Концептуальный уровень поддерживает каждое внешнее представление, в том смысле, что любые доступные пользователю данные должны содержаться (или могут быть вычислены) на этом уровне. Однако этот уровень не содержит никаких сведений о методах хранения данных.
► Внутренний уровень - физическое представление базы данных в компьютере. Этот уровень описывает, как информация хранится в базе данных. Внутренний уровень описывает физическую реализацию базы данных и предназначен для достижения оптимальной производительности и обеспечения экономного использования дискового пространства.
► Внутренний уровень содержит описание структур данных и организации отдельных файлов, используемых для хранения данных в запоминающих устройствах. На этом уровне осуществляется взаимодействие СУБД с методами доступа операционной системы (вспомогательными функциями хранения и извлечении записей данных) с целью размещения данных на запоминающих yстройствах, создания индексов, извлечения данных и т. д.
На внутреннем уровне хранится следующая информация: ► распределение дискового пространства для хранения данных и индексов; ► описание подробностей сохранения записей (с указанием реальных размеров сохраняемых элементов данных); ► сведения о размещении записей; ► сведения о сжатии данных и выбранных методах их шифрования.
► Ниже внутреннего уровня находится физический уровень (physical Level), который контролируется операционной системой, но под руководством СУБД. Однако функции СУБД и операционной системы на физическом уровне не вполне четко разделены и могут варьироваться от системы к системе. В одних СУБД используются многие предусмотренные в данной операционной системе методы доступа, тогда как в других применяются только самые основные и реализована собственная файловая организация.
Для отображения архитектуры ANSI-SPARC можно идентифицировать следующие три связанные модели: ► внешнюю модель данных, отображающую представления каждого существующего в организации типа пользователей (описание предметной области); ► концептуальную модель данных, отображающую логическое (или обобщенное) представление о данных, не зависимое от типа выбранной СУБД; ► внутреннюю модель данных, отображающую концептуальную схему определенным образом, понятным выбранной
►СПАСИБО ЗА ВНИМАНИЕ
Л2-Архитектура бд.ppt