Распределенные базы данных.ppt
- Количество слайдов: 21
Тема. Распределенные базы данных. Основы. В основе любой информационной системы лежит среда хранения и доступа к данным, которая должна обеспечивать уровень надежности хранения и эффективности доступа, соответствующий области применения информационной системы. В большинстве случаев наиболее надежным способом хранения информации является использование базы данных. 1
Децентрализованное хранение данных – обеспечение хранения данных в местах их возникновения или обработки. Для этого создаются распределенные многопользовательские базы данных (Ра. БД), а, следовательно, информационные системы поддерживаемые ими называются распределенными. 2
Распределенная обработка данных – это обработка данных, проводимая в распределенной системе, организованной в виде связанных между собой компьютеров. При распределенной обработке данных логические процессы БД распределяются среди двух или более физически независимых компьютеров, объединенных в сеть. 3
Таким образом, распределенная обработка данных: l обязательно требует распределенной обработки информации; l может быть основана на единственной БД, размещенной на одном компьютере; l для связывания всех компонентов необходима локальная сеть. 4
Распределенная база данных (Distributed Database – DDB) – это совокупность логически взаимосвязанных БД, распределенных в компьютерной сети. СУРа. БД управляет хранением и обработкой логически связанных данных в сетевых компьютерных системах, где как данные, так и функции обработки распределяются по нескольким узлам. В распределенных системах база данных состоит из нескольких частей, которые называются фрагментами БД. 5
Главный критерий распределения данных в сети - данные должны находиться там, где существует наибольшая частота обращения к ним. Такой подход обеспечивает быстрый и эффективный доступ к данным. Будучи фрагментом общего пространства данных, часть БД функционирует как полноценная локальная БД. Управление выполняется локально и независимо от других узлов системы. 6
Принципы создания и функционирования Ра. БД Впервые задача об исследовании основ и принципов создания и функционирования распределенных систем была поставлена известным специалистом в области баз данных К. Дейтом (1987 г. ). 7
12 требований к Ра. БД 1. Локальная автономия. Означает, что управление данными на каждом из узлов распределенной системы выполняется локально. 2. Независимость узлов. Предполагает, что все узлы равноправны и независимы, а расположенные на них базы являются равноправными поставщиками данных в общее пространство данных. БД на каждом из узлов включает полный собственный словарь данных и полностью защищена от несанкционированного доступа. 3. Непрерывность операций. Это возможность непрерывного доступа к данным в рамках Ра. БД вне зависимости от их расположения и вне зависимости от операций, выполняемых на локальных узлах. 8
4. Прозрачность расположения. Пользователь, обращающийся к БД, ничего не должен знать о реальном, физическом размещении данных в узлах информационной системы. 5. Прозрачная фрагментация. Это требование определяется как возможность распределенного (то есть на различных узлах) размещения данных, логически представляющих собой единое целое. 6. Независимое тиражирование. Предполагает перенос изменений объектов исходной БД в базы, расположенные на других узлах распределенной системы. 9
7. Обработка распределенных запросов. Заключается в возможности выполнения операций выборки данных из Ра. БД, посредством запросов на языке SQL. 8. Обработка распределенных транзакций. Предполагает выполнение операций обновления Ра. БД, не нарушающих целостность и согласованность данных. 9. Независимость от оборудования. Означает, что в качестве узлов распределенной системы могут выступать компьютеры любых моделей и производителей. 10
10. Независимость от операционных систем. Допускает многообразие операционных систем, управляющих узлами распределенной системы. 11. Прозрачность сети. Трактуется как возможность использования в распределенной системе любых сетевых протоколов. 12. Независимость от баз данных. Это требование означает, что в распределенной системе могут использоваться СУБД различных производителей, и возможны операции поиска и обновления в БД различных моделей и форматов. 11
Принципы построения РБД l Минимизация интенсивности обмена данными (сетевого трафика). l Оптимальное размещение серверных и клиентских приложений в сети. l Декомпозиция данных на часто и редко используемые сегменты (для правильной настройки репликации - размещение наиболее часто используемых данных на АРМ конечных пользователей). l Периодическое сохранение копий данных и выполнение действий по поддержке целостности распределенной информационной системы. 12
Распределенная СУБД (Distributed Database Management System – DDBMS) – совокупность программ, предназначенных для управления Ра. БД таким образом, чтобы ее распределенность была прозрачна для пользователей. Основная задача Ра. СУБД состоит в обеспечении средств интеграции локальных БД, располагающихся в различных узлах компьютерной сети, чтобы пользователь работал со всеми локальными базами как с единой БД. 13
СУРа. БД должна обладать следующими функциональными возможностями: l проверка достоверности при анализе запросов; l преобразования для выяснения, какие компоненты запроса являются распределенными, а какие локальными; l оптимизация запроса, гарантирующая выявление лучшей стратегии доступа; l отображение, позволяющее определить местоположение данных в локальных и удаленных фрагментах; l интерфейс ввода/вывода, обеспечивающий считывание/запись данных в постоянном месте хранения; l форматирование, подготавливающее данные для представления их конечному пользователю или для передачи в прикладные программы; l безопасность; l резервное копирование, которое гарантирует доступность и восстанавливаемость БД в случае аварии; l управление параллельным вычислением, обеспечивающее одновременный доступ к данным и гарантирующее целостность данных во всех фрагментах БД в данной СУРа. БД; l управление транзакциями, обеспечивающее переход данных из одного устойчивого состояния в другое. 14
Компоненты СУРа. БД l компьютерные рабочие станции (сайты, узлы), формирующие сетевую систему. Су. Ра. БД должна быть независимой от оборудования; l компоненты сетевого оборудования и программного обеспечения каждой рабочей станции. Сетевые компоненты позволяют всем узлам взаимодействовать друг с другом и обмениваться данными. Поскольку эти компоненты (компьютеры, ОМ, сети и т. д. ), скорее всего, поставляются различными производителями, желательно, чтобы функции Ра. БД могли выполняться на различных платформах; l коммуникационные устройства, которые переносят данные с одной рабочей станции на другую. СУРа. БД не должна зависеть от средств коммуникации, т. е. она должна поддерживать несколько типов коммуникационных устройств; 15
Компоненты СУРа. БД l процессор транзакций (TP), представляющий собой программный компонент, находящийся на каждом компьютере, где выполняется запрос данных. Процессор транзакции получает и обрабатывает данные запроса приложения. Процессор транзакций называют также процессором приложений или менеджером транзакций; l процессор данных (DP), представляющий собой программный компонент, расположенный на каждом компьютере, где хранятся и извлекаются данные, расположенные на данном узле. Процессор данных также называют менеджером данных. Процессор данных может даже представлять собой ЦСУБД. 16
Связь между ТР и DP позволяют установить протоколы, используемые в СУРа. БД. Протоколы определяют, как система Ра. БД: l организует интерфейс с сетью для передачи данных и команд между процессорами данных и процессорами транзакций; l синхронизирует все данные, полученные от DP(сторона TP), и маршрутизирует полученные данные на соответствующие TP (сторона DP); l обеспечивает функции общего управления БД в распределенной системе (безопасность, управление параллельным вычислением, создание резервных копий и восстановление). 17
Типы СУРа. БД По степени однородности Ра. БД классифицируют на гомогенные (однородные) и гетерогенные (неоднородные). Гомогенная Ра. БД – это такая система, в которой каждый узел имеет СУБД одного и того же типа. Гетерогенная Ра. БД – это система, объединяющая несколько различных типов БД. 18
По степени автономности Ра. БД классифицируют на БД с полным отсутствием локальной автономности и федеративные. Ра. СУБД с полным отсутствием локальной автономности имеет единую концептуальную схему данных, единый центр обработки запросов и транзакций, где части единой БД распределены по разным компьютерам. Ра. СУБД, которая хоть и имеет некоторую общую схему данных, но составлена из полностью автономных СУБД, называется федеративной. Федеративная СУБД может быть составлена из СУБД, поддерживающих различные модели данных, типы, ограничения и языки манипулирования данными. 19
Преимущества Ра. БД 1. Разделяемость и локальная автономия. 2. Быстрый доступ к данным. 3. Управление распределенными данными на разных уровнях прозрачности. 4. Увеличение стабильности и надежности системы. 5. Увеличение производительности системы. 6. Увеличение гибкости реорганизации за счет модульности системы. 20
Недостатки Ра. БД 1. Повышение сложности. 2. Усложнение контроля за целостностью данных. 3. Усложнение контроля за безопасностью и секретностью данных. 4. Высокая информационная квалификация. 21
Распределенные базы данных.ppt