БАЗЫ ДАННЫХ КОЛЛЕКТИВНОГО ПОЛЬЗОВАНИЯ_н.ppt
- Количество слайдов: 40
БАЗЫ ДАННЫХ КОЛЛЕКТИВНОГО ПОЛЬЗОВАНИЯ СУБД в архитектуре «клиент—сервер» Проблема коллективного доступа к базам данных в локальной сети Концепция открытых систем Основа этой концепции — упрощение комплексирования вычислительных систем при международной и национальной стандартизации аппаратных и программных интерфейсов Основа системных и прикладных программных средств открытых систем — стандартизованная операционная система Обеспечивается возможность производства программных средств, обладающих свойствами мобильности (portability) и интероперабельности (interoperability). Мобильность означает сравнительную простоту переноса программной системы в различные аппаратно-программные среды, соответствующие стандартам, интероперабельность — упрощение разработки новых программных систем на основе комплексирования готовых компонентов со стандартными интерфейсами
БАЗЫ ДАННЫХ КОЛЛЕКТИВНОГО ПОЛЬЗОВАНИЯ В основе широкого распространения локальных сетей компьютеров лежит известная идея разделения ресурсов Рабочая станция Сервер локальной сети Распределенные БД. Основная задача систем управления распределенными базами данных состоит в обеспечении средствами интеграции локальных БД, располагающихся в некоторых узлах вычислительной сети, с тем, чтобы пользователь, работающий в любом узле сети, имел доступ ко всем этим базам данных, как к единой БД. Однородные (одна модель СУБД) и неоднородные (разные модели) распределенные базы данных Интегрированные БД и мульти-БД необходимость комплексирования систем БД, основанных на разных моделях данных и управляемых разными СУБД
БАЗЫ ДАННЫХ КОЛЛЕКТИВНОГО ПОЛЬЗОВАНИЯ АРХИТЕКТУРА "КЛИЕНТ-СЕРВЕР" Клиент локальной сети - запрашивающий услуги у некоторого сервера Сервер — компонент локальной сети, оказывающий услуги некоторым клиентам. Доступ к БД от прикладной программы или пользователя осуществляется путем обращения к клиентской части системы. В качестве основного интерфейса между клиентской и серверной частями выступает язык баз данных SQL (Собирательное название SQL-сервер относится ко всем серверам баз данных, основанных на SQL_ Особенно важны в системах управления базами данных, основанных на архитектуре «клиент—сервер» , протоколы удаленного вызова процедур.
БАЗЫ ДАННЫХ КОЛЛЕКТИВНОГО ПОЛЬЗОВАНИЯ Рабочая станция предназначена для непосредственной работы пользователя или категории пользователей и обладает ресурсами, соответствующими локальным потребностям данного пользователя. Сервер локальной сети должен обладать ресурсами, соответствующими его функциональному назначению и потребностям сети =логический сервер (набор ресурсов и программных средств, обеспечивающих услуги при работе с этими ресурсами) : сервер телекоммуникаций, обеспечивающий услуги по связи данной локальной сети с внешним миром; вычислительный сервер, дающий возможность производить вычисления, которые невозможно выполнить на рабочих станциях; дисковый сервер, обладающий расширенными ресурсами внешней памяти и предоставляющий их в использование рабочим станциям и, возможно, другим серверам; файловый сервер, поддерживающий общее хранилище файлов для всех рабочих станций; сервер баз данных — фактически обычная СУБД, принимающая запросы по локальной сети и возвращающая результаты. Сервер локальной сети предоставляет ресурсы рабочим станциям и другим серверам
БАЗЫ ДАННЫХ КОЛЛЕКТИВНОГО ПОЛЬЗОВАНИЯ ЦЕЛИ СОЗДАНИЯ БАЗ ДАННЫХ КОЛЛЕКТИВНОГО ПОЛЬЗОВАНИЯ ДЛЯ ГИС – обеспечить выполнение пространственного анализа размещения, связей, динамики и иных отношений пространственных объектов – обеспечить интеграцию данных в ГИС, связанную с формированием инфраструктуры пространственных данных – обеспечить сочетаемость ГИС-пакета и системы управления базами данных (СУБД) для управления каждой составляющей данных
БАЗЫ ДАННЫХ И УПРАВЛЕНИЕ ИМИ Основные функции СУБД [Дейт, 2000]: ü управление данными во внешней памяти (структуриризация для хранения данных и для служебных целей); ü управление буферами оперативной памяти (для независимости от скорости работы устройств внешней памяти); ü операции над БД - обеспечение эффективности управления транзакциями* üобеспечение надежности хранения данных в БД – способность СУБД восстанавливать ее состояние после аппаратного или программного сбоя; ü поддержка специального языка управления БД – единый интегрированный язык, содержащий все необходимые средства для работы с БД, начиная от ее создания, и обеспечивающий пользовательский интерфейс с базами данных.
БАЗЫ ДАННЫХ КОЛЛЕКТИВНОГО ПОЛЬЗОВАНИЯ РСУБД Традиционно в информатике выделяют два класса систем, в зависимости от того, где происходит обработка основного объема информации: q системы, использующие архитектуру файл-сервер и характеризующиеся тем, что вся нагрузка по работе с данными ложится на компьютер клиента; q системы, основанные на технологии клиент-сервер – в них большая часть обработки данных выполняется на сервере, компьютер клиента при этом лишь принимает результаты вычислений и представляет в виде удобном для пользователя.
БАЗЫ ДАННЫХ КОЛЛЕКТИВНОГО ПОЛЬЗОВАНИЯ • Управление пространственными и атрибутивными данными с помощью ГИС-пакетов • Наиболее простой способ для управления данными, представлеными в виде набора файлов. • Управление пространственной и атрибутивной составляющими данных при этом осуществляется средствами ГИС-пакета. • Атрибутивная база данных, как правило, представлена либо одной, либо несколькими несвязанными между собой таблицами, информация из нее сохраняется либо в формате самого ГИС-пакета, либо в распространенных форматах табличных редакторов. • «Многопользовательская» работа осуществляется организацией файлового хранилища и предоставлением пользователям доступа к нему средствами операционной системы. • Недостатки такого подхода : возможность построения только простых моделей данных (отсутствует механизм контроля целостности данных); проблемы с одновременным редактированием данных и др. • НО подобная система может быть востребована для «локального» использования.
БАЗЫ ДАННЫХ КОЛЛЕКТИВНОГО ПОЛЬЗОВАНИЯ • Оптимизация работы с атрибутивной информацией. Гибридные системы Схема гибридной системы без использования сервера БД вся работе с атрибутивной информацией ложится на компьютер клиента
БАЗЫ ДАННЫХ КОЛЛЕКТИВНОГО ПОЛЬЗОВАНИЯ Схема гибридной системы с использованием сервера БД повышение производительности системы возможно за счет сокращения времени выполнения отдельных запросов
БАЗЫ ДАННЫХ КОЛЛЕКТИВНОГО ПОЛЬЗОВАНИЯ Расширения реляционных СУБД для работы с позиционной составляющей данных Возможности работы с пространственными данными могут быть реализованы как непосредственно в самой СУБД (например, Postgre. SQL), так и виде отдельного модуля, поставляемого лишь по требованию (например, Oracle Spatial). Схема решения с использованием расширений РСУБД
БАЗЫ ДАННЫХ КОЛЛЕКТИВНОГО ПОЛЬЗОВАНИЯ Преимущества использование расширений СУБД для хранения пространственных данных: q хранение пространственных данных в открытом, стандартизованном формате; q хранение позиционной и атрибутивной составляющих в единой СУБД; q стандартизованный, унифицированный доступ, как к пространственной, так и к атрибутивной составляющей через язык запросов; q обеспечение совместной работы с данными и разделение доступа на уровне СУБД; q поддержка со стороны крупнейших производителей ГИС; q надёжность, производительность и масштабируемость, обеспечиваемые серверами БД ИТОГ Системы с файловым хранением пространственной информации не подходят в силу своей громоздкости и необходимости использовать два программных продукта. Отказ от систем, реализующих архитектуру клиент-сервер, обусловлен высокой стоимостью программных продуктов. Свободно распространяемые аналоги подобных программ крайне редки и содержат ограниченный набор функций.
БАЗЫ ДАННЫХ КОЛЛЕКТИВНОГО ПОЛЬЗОВАНИЯ Использование архитектуры клиент-сервер для эффективной работы с пространственными данными Особый тип систем - системы, где вся нагрузка по обработке и пространственной, и атрибутивной составляющих данных ложится на сервер. На компьютер клиента передаются лишь результаты запроса. Здесь также можно выделить два варианта систем: qс приоритетом пространственной составляющей; qс приоритетом атрибутивной составляющей. Для их разработки используются программные продукты ведущих поставщиков ГИС-пакетов и СУБД соответственно. Объектно-ориентированный подход к работе с геоданными
БАЗЫ ДАННЫХ КОЛЛЕКТИВНОГО ПОЛЬЗОВАНИЯ Схема системы, использующей технологию Arc. SDE Технология Arc. SDE компании ESRI Трехзвенная архитектура - между клиентом и сервером БД находится "сервер приложений", обеспечивающий эффективную работу с данными, проверку прав доступа и тд.
БАЗЫ ДАННЫХ КОЛЛЕКТИВНОГО ПОЛЬЗОВАНИЯ Схема системы, использующей технологию Arc. SDE Spatial Database Engine (SDE) – это высокоэффективное средство для работы с большими объемами пространственных данных. По своей сути SDE является объектно-ориентированной системой, работающей со многими коммерческими реляционными системами управления базами данных. SDE обеспечивает геоинформационную систему реальной открытой клиент/серверной архитектурой. С его помощью вы можете разместить и эффективно управлять своими пространственными данными в стандартной СУБД вашего предприятия наравне с другой непространственной информацией.
БАЗЫ ДАННЫХ КОЛЛЕКТИВНОГО ПОЛЬЗОВАНИЯ Схема системы, использующей технологию Arc. SDE
БАЗЫ ДАННЫХ КОЛЛЕКТИВНОГО ПОЛЬЗОВАНИЯ Схема системы, использующей технологию Arc. SDE Преимущества от использования SDE. Эта технология: работает в среде открытых систем поддерживает очень большие базы пространственных данных (многие миллионы объектов и записей) интегрируется с программными продуктами, относящимися как к ГИС, так и к не-ГИС информационным технологиям работает чрезвычайно быстро осуществляет доступ к данным через локальную и глобальную сети спроектирована как действительно многопользовательская программа. Основное предназначение SDE - обеспечение наивысшей скорости доступа и работы с данными в пределах сети в режиме клиент/сервер.
БАЗЫ ДАННЫХ КОЛЛЕКТИВНОГО ПОЛЬЗОВАНИЯ Схема системы, использующей технологию Arc. SDE Задача SDE - принять запрос клиента на выдачу пространственных данных, перевести запрос на понятный серверу язык SQL, согласовать клиентскую и серверную задачу и передать клиенту результат выполнения запроса в требуемом виде. Взаимодействие клиента и сервера можно продемонстрировать на примере определения площади участков земли, попавших в некоторую буферную зону вокруг рек: q клиент посылает запрос на сервер; q сервер отправляет векторную карту выбранных рек клиенту; q клиент строит буферные зоны вокруг выбранных рек и отправляет построенные зоны обратно на сервер; q сервер выбирает участки, которые попадают в указанные границы или пересекаются буферными зонами, и отправляет их клиенту; q клиент режет участки границами буферных зон, вычисляет площади образовавшихся участков и выводит полученные объекты на экран.
БАЗЫ ДАННЫХ КОЛЛЕКТИВНОГО ПОЛЬЗОВАНИЯ Схема системы, использующей технологию Arc. SDE
БАЗЫ ДАННЫХ КОЛЛЕКТИВНОГО ПОЛЬЗОВАНИЯ Схема системы, использующей технологию Arc. SDE Пространственные данные в SDE представляются слоями и хранятся как совокупность трех основных таблиц: q бизнес-таблицы, в которой хранится атрибутивная информация, q таблицы объектов, в которой размещаются координаты объектов, q таблицы пространственного индекса. Все они связаны по одному общему полю - идентификатору объекта. Каждый географический объект занимает одну строку в таблице: в бизнес -таблице - строка атрибутов, в таблице объектов - строка с координатами. Кроме того, в SDE существуют еще две вспомогательные таблицы - таблица слоев и таблица версии, в которых хранится информация о слоях. Пользователь напрямую может работать только с бизнес-таблицей. Все остальные таблицы являются служебными
БАЗЫ ДАННЫХ КОЛЛЕКТИВНОГО ПОЛЬЗОВАНИЯ Схема системы, использующей технологию Arc. SDE
БАЗЫ ДАННЫХ КОЛЛЕКТИВНОГО ПОЛЬЗОВАНИЯ Схема системы, использующей технологию Arc. SDE Ключевой в SDE является таблица пространственного индекса, позволяющая оперировать огромным объемом пространственных данных, быстро выполнять запросы и оперативно отображать требуемую информацию. Пространственный индекс представляется в виде регулярной сетки, в ячейках которой хранятся идентификаторы объектов, попадающих внутрь ячеек. Он организован таким образом, что позволяет быстро и эффективно производить поиск объектов, удовлетворяющих заданным пространственным критериям, без просмотра всех объектов слоя. Обеспечение целостности данных при одновременном редактировании несколькими пользователями одного и того же слоя достигается при помощи пространственных блокировок.
БАЗЫ ДАННЫХ КОЛЛЕКТИВНОГО ПОЛЬЗОВАНИЯ СУБД, пригодные для работы с пространственными данными СУБД Postgre. SQL (Калифорнийский университет) "геометрические объекты", прямоугольная система координат, избыточность типов данных, наличие встроенных операций : вычисление метрических характеристик объектов (длины, ширины, периметра, площади, центроида); определение "геометрии" ( количества узлов, замкнутости/разомкнутости ломаных линий; расчет расстояния, определение пересечения объектов
БАЗЫ ДАННЫХ КОЛЛЕКТИВНОГО ПОЛЬЗОВАНИЯ СУБД, пригодные для работы с пространственными данными Oracle Spatial (Oracle) • работа с географическими объектами • поддержка более 1000 систем координат (с возможностью расширения); • поддержка топологической модели; • геокодирование. Средства для описания сетевых моделей для решение следующих задач: • самый короткий путь: кратчайший путь от узла A к узлу B; • анализ доступности: действительно ли узел A доступен из узла B; • связующее дерево (сети) с минимальной стоимостью: каким будет дерево с минимальной стоимостью, соединяющее все узлы сети; • анализ предельной стоимости: какие узлы находятся (при заданной стоимости) в пределах достижимости для заданного узла; • ближайшие соседи: какие узлы входят в число N ближайих соседей данного узла; • K кратчайших путей: какие K путей от узла A к узлу B являются кратчайшими; • операции с графами: объединение, пересечение и разность графов; • задача коммивояжера: определит маршрут с минимальной стоимостью, в результате которого будут посещены все города из заданного набора; • анализ максимальных потоков для единственного источника и единственного стока: каков максимально допустимый поток, который может течь от исходного узла до узла стока? Для редактирования и визуализации сетей - автономное приложение
БАЗЫ ДАННЫХ КОЛЛЕКТИВНОГО ПОЛЬЗОВАНИЯ Особенности проектирования БД для полевых исследований территории Специфика сбора данных при проведении комплексных полевых исследований Точки описаний Основной полевой фактический материал при любом территориальном охвате работ дают наблюдения на локальном участке, который трактуется как точка. Различают точки комплексных описаний: • основные; • картографирования; • опорные; • специализированные – точки описания отдельных объектов и явлений.
БАЗЫ ДАННЫХ КОЛЛЕКТИВНОГО ПОЛЬЗОВАНИЯ Основные точки – наиболее распространены при ландшафтном картографировании. Их выбирают в типичных местах с тем, чтобы полученные сведения могли быть распространены на значительную территорию, либо на небольшие, но часто повторяющиеся ПТК (доминантные или субдоминантные ПТК). На точках делают описание рельефа, закладывают и описывают почвенный разрез и геоботаническую площадку, фиксируют характер и степень увлажнения. При необходимости ведется сбор образцов почв, незнакомых растений для гербария. Определяют полное название фации. Точки картографирования –точки сжатых наблюдений и фиксирования информации в сжатой форме, или в полевом дневнике. Для определения почвы делают лишь неглубокую прикопку, фитоценоз описывают лишь по доминирующим видом без заложения площадки. Эти точки служат для экстраполяции данных, полученных на основных точках. Опорные точки (ключевые) характеризуются большей подробностью наблюдений и описаний по сравнению с предыдущими. Опорные точки используют для изучения геофизических и геохимических характеристик ПТК, позволяющих выявлять процессы функционирования и динамики природных процессов. Как правило, берутся образцы на сопряженные анализы (почв и почвообразующих пород, растений, вод), дают качественную и количественную характеристику
БАЗЫ ДАННЫХ КОЛЛЕКТИВНОГО ПОЛЬЗОВАНИЯ Особенности проектирования БД для полевых исследований территории • два этапа формирования информационного обеспечения и проектирования БД полевых физико-географических исследований: • создание серии специализированных баз данных, каждая из которых содержит описания объектов одной тематики исследования; • создание интегрированной базы данных полевых физико-географических описаний территории (частным случаем которой может быть специализированная БД). Возможны два варианта реализации системы Пространственная информация хранится в самой базе данных в формате известном как формат битовых объектов – BLOB (Binary Large Object – большой двоичный объект). Это тип данных, предназначенный для хранения больших объектов переменной длины и произвольного формата. Обычно он используется для хранения изображений, звуков, неформализованных документов и др. Объект BLOB, предназначенный для хранения пространственной информации, является файлом или частью файла ГИС-пакета, используемого для визуализации этой информации Получается своего рода репозиторий пространственных данных. Для эффективной работы необходимо, чтобы у большинства пользователей были права только на чтение этих данных и лишь у некоторых (например, картографов и специалистов именно в этой предметной области) - на редактирование.
БАЗЫ ДАННЫХ КОЛЛЕКТИВНОГО ПОЛЬЗОВАНИЯ Особенности проектирования БД для полевых исследований территории Схема клиент-серверной системы с хранением пространственной информации в виде двоичных объектов
БАЗЫ ДАННЫХ КОЛЛЕКТИВНОГО ПОЛЬЗОВАНИЯ Особенности проектирования БД для полевых исследований территории Для хранения пространственной информации разрабатывается специальная структура данных и базовые функции для реализации пространственных запросов. Схема клиент-серверной системы с хранением пространственной информации в полях специальных типов данных
БАЗЫ ДАННЫХ КОЛЛЕКТИВНОГО ПОЛЬЗОВАНИЯ Особенности проектирования БД для полевых исследований Для выбора из ведущих серверов БД для размещения на нем БД комплексных полевых исследований выполнено их сравнение по ряду признаков: • поддержка работы с атрибутивными данными; • поддержка работы с пространственными данными; • стоимость. Сравнивались: • Oracle (Oracle); • DB 2 (IBM); • SQL Server (Microsoft); • Sybase Adaptive Server (Sybase); • My. SQL; • Postgre. SQL; • Fire. Bird Требованиям низкой стоимости и широкого распространения удовлетворяет СУБД MS SQL Server; существуют свободно распространяемая ее редакция – MSDE (в версии 2005 – Express Edition), а также версия сервера для портативных (карманных) персональных компьютеров (КПК)
БАЗЫ ДАННЫХ КОЛЛЕКТИВНОГО ПОЛЬЗОВАНИЯ Особенности проектирования БД для полевых исследований территории Структура типового тематического блока Общая схема модели базового объекта заданного тематического направления
БАЗЫ ДАННЫХ КОЛЛЕКТИВНОГО ПОЛЬЗОВАНИЯ Все признаки описания можно объединить в несколько групп: Код (идентификатор) – уникальная символьная комбинация, однозначно определяющая базовый объект (в том числе его читабельность). Пространственная привязка – пара координат наблюдаемого объекта. поскольку размеры исследуемой территории несопоставимы с линейными размерами объектов, последние можно рассматривать как объекты точечные. (Если размеры исследуемой территории сопоставимы с размерами наблюдаемых объектов, разработка базы данных полевых исследований нецелесообразна (всю информацию о территории можно передать при помощи других средств, в том числе набора слоев БДГИС). Характеристика наблюдаемого объекта - набор качественных показателей, определяющих место наблюдаемого объекта в системе различного рода научных классификаций. Характеристика окружения наблюдаемого объекта – полный набор качественных и количественных показателей, неоднородный по своему составу. Особенностью базы данных полевых исследований является преобладание качественных показателей над количественными. Служебная информация – набор аналитических признаков, часто несвязанных с наблюдаемым объектом (дополнительная информация о самом наблюдении- время составления описания, идентификация наблюдателя, размеры наблюдаемой части объекта и пр. ), важна для оценки степени достоверности описания или изучения динамики объекта).
БАЗЫ ДАННЫХ КОЛЛЕКТИВНОГО ПОЛЬЗОВАНИЯ Для обеспечения интеграции данных полевых исследований разной тематики в модель введен обобщающий пространственный объект — «точка описания» (так же принято называть и локальные участки полевых физико-географических исследований) Пространственный объект «точка описания» представляет некоторую пространственную группировку базовых объектов, дает возможность объединять разрозненные частные описания наблюдаемых объектов в комплексные описания районов разной размерности. Точка описания в действительности соответствует локальному участку, полигональному объекту; введение термина оправдано тем, что данные собирают дискретно при описаниях шурфов, расчисток, разрезов и т. п. , которые в масштабе территории можно рассматривать как точки, либо в виде описания площадок, координированных по центральной точке. При сопровождении точки описания информацией о местоположении становится возможным оперировать отдельно наблюдаемыми объектами разной тематики как единым целым. Главное — данные о пространственной привязке позволяют формировать виртуальный слой «Точки описания» для связи с БД ГИС.
БАЗЫ ДАННЫХ КОЛЛЕКТИВНОГО ПОЛЬЗОВАНИЯ Общая структура базы данных; хранение: пространственной информации на район исследований – она должна использоваться специалистами в разных предметных областях. Справочников; позволяют использовать описания объектов разных предметных областей, выступатют в качестве таблиц классификаций и для тематических слоев.
БАЗЫ ДАННЫХ КОЛЛЕКТИВНОГО ПОЛЬЗОВАНИЯ Представление тематических классификаций объекта изучения в базах данных Справочники простой структуры
БАЗЫ ДАННЫХ КОЛЛЕКТИВНОГО ПОЛЬЗОВАНИЯ Представление иерархии в виде каскада справочников
БАЗЫ ДАННЫХ КОЛЛЕКТИВНОГО ПОЛЬЗОВАНИЯ Представление иерархии при помощи модели смежных вершин графа
БАЗЫ ДАННЫХ КОЛЛЕКТИВНОГО ПОЛЬЗОВАНИЯ Представление иерархии при помощи расширенной модели смежных вершин графа При работе с приложением пользователю должен быть доступен не только выбор из списка значений. Ему должна быть предоставлена возможность увидеть иерархические данные в виде дерева, чтобы, последовательно раскрывая значения верхнего уровня, он дошел до нужного ему листового значения
БАЗЫ ДАННЫХ КОЛЛЕКТИВНОГО ПОЛЬЗОВАНИЯ
БАЗЫ ДАННЫХ КОЛЛЕКТИВНОГО ПОЛЬЗОВАНИЯ
БАЗЫ ДАННЫХ КОЛЛЕКТИВНОГО ПОЛЬЗОВАНИЯ_н.ppt