
Bazy_dannykh_i_zn.ppt
- Количество слайдов: 37
БАЗЫ ДАННЫХ И ЗНАНИЙ
ИНФОРМАЦИЯ И ДАННЫЕ Под информацией понимают любые сведения о каком-либо событии, процессе, являющиеся объектом некоторых операций: восприятия, передачи, преобразования, хранения и использования. Данные – информация, представленная в определенной форме (формализованная), пригодной для последующей обработки, хранения и передачи. Понятие «данные» в концепции баз данных — это набор конкретных значений, параметров, характеризующих объект, условие, ситуацию или любые другие факторы. Примеры данных: Петров Николай Степанович, $30 и т. д. Данные не обладают определенной структурой, данные становятся информацией тогда, когда пользователь задает им определенную структуру, то есть осознает их смысловое содержание. Поэтому центральным понятием в области баз данных является понятие модели.
Банк данных (data bank) – разновидность информационной системы, в которой реализованы функции централизованного хранения и обработки информации, организованной в одну или несколько баз данных. Банк знаний • • • совокупность баз данных, а также программные, языковые и другие средства, предназначенные для централизованного накопления данных и их использования с помощью ЭВМ. Объектами хранилищ банков информации в банке документов являются документы или факты, извлекаемые из документов. автоматизированный банк информации, имеющий в своем составе интеллектуальный интерфейс, обеспечивающий непосредственное взаимодействие пользователей с вычислительной системой Банк документов Банк данных
ОСНОВНЫЕ ПОНЯТИЯ И ОПРЕДЕЛЕНИЯ ТЕОРИИ БАЗ ДАННЫХ Под базой данных По масштабу применения понимают совокупность разнообразных данных, Однополь. Многопольорганизованных по определенным правилам. зовательские Технология использования (персональные) • используются для управления БД БД реализуется • осуществляют информационных средствами систем управление БД, систем, управления базами данных работающей на одном функционирующих в компьютере. В (СУБД) состоящих из многокомпьютерных качестве примера совокупности языковых и системах, например, однопользовательских построенных на основе программных средств. СУБД можно привести архитектуры "клиент. СУБД предназначены для d. Base, MS Access, сервер". Например, создания, хранения и Paradox и Fox. Pro. Microsoft SQL Sewer, организации доступа к БД. Oracle, Sy. Base
МОДЕЛИРОВАНИЕ ДАННЫХ И ЗНАНИЙ Моделирование – процесс представления исследуемого объекта некоторой замещающей последовательностью других объектов или представлений, реализующих те или иные стороны изучаемого объекта с требуемой точностью. Модель всегда преследует определенную цель, и в зависимости от цели меняется сама модель. Модель никогда не отражает всю глубину изучаемого объекта. Различают следующие виды моделей: Модель предметной области Модель базы данных Модель базы знаний
МОДЕЛЬ ПРЕДМЕТНОЙ ОБЛАСТИ При моделировании предметной области используется два подхода: 1. анализ и интеграция информационных потребностей пользователей будущего банка данных; 2. анализ самой предметной области на основе методов системного анализа с привлечением методов экспертных оценок.
МОДЕЛЬ ДАННЫХ — это некоторая абстракция, которая, будучи приложима к конкретным данным, позволяет пользователям и разработчикам трактовать их уже как информацию, то есть сведения, содержащие не только данные, но и взаимосвязь между ними. – это совокупность правил определения структур данных, операций над ними и ограничений целостности. Модель базы данных является средством интерпретации содержимого базы данных и реализации требуемых операций по обработке и управлению данными.
КОМПОНЕНТЫ МОДЕЛИ Сущность – это абстракция реально существующего объекта. В качестве сущностей в моделях предметной области рассматриваются материальные объекты (предприятие, книга и т. д. ) и результаты интеллектуального труда (патент, реферат и т. д. ). Атрибут – это поименованная характеристика сущности, которая принимает значения из некоторого множества значений (домена). Чтобы задать атрибут, необходимо: присвоить ему имя; привести смысловое описание атрибута; определить множество его допустимых значений. Назначение атрибута - описывать свойства сущности. Один из атрибутов должен иметь уникальное значение и однозначно идентифицировать экземпляр сущности. Часто в роли таких специальных атрибутов выступают искусственно введенные атрибуты: шифр детали, код изделия и т. п. Связи выступают в качестве средства, с помощью которого представляют отношения между сущностями (ПО). Наиболее часто встречаются бинарные связи - связи между двумя сущностями.
ТРИ ОСНОВНЫЕ МОДЕЛИ ДАННЫХ Иерархическая модель основана на графическом способе связей данных, и схема взаимосвязей объектов имеет вид перевернутого дерева. Каждому элементу соответствует только одна связь от элемента более высокого уровня. Поиск данных происходит по одной из ветвей дерева. В сетевой модели данных каждый элемент может иметь более одного порождающего элемента, а графическое представление модели очень напоминает сеть. Она допускает усложнение «дерева» без ограничения количества связей, входящих в его вершину. Реляционной называется база данных, в которой все данные, доступные пользователю, организованы в виде таблиц, а все операции над данными сводятся к операциям над этими таблицами.
Примером реляционной базы данных может служить таблица «Сотрудники» , где одна строка (запись) — сведения об одном из сотрудников. Табельный № Фамилия Имя Отчество Дата рождения 1278 Петров Олег Сергеевич 15. 02. 1954 8562 Сидоров Иван Петрович 23. 02. 1976 4625 Панин Петр Борисович 07. 09. 1986
СТРУКТУРА ТАБЛИЦЫ Поле (столбец таблицы) — элементарная единица логической орга низации данных. Каждое поле таблицы имеет уникальное имя, при этом каждое из полей однородно, т. е. данные в нем имеют одинаковые тип и длину. Для описания поля используют имя и тип данных. Поле, значение которого однозначно определяет соответствующую запись, называется ключевым полем. Если ключевое поле одно, то это — простой ключ, если ключевых полей несколько, то ключ называется составным. Запись — это совокупность значений связанных элементов данных. Экземпляр записи — это отдельная строка таблицы, содержащая конкретные значения ее полей. Таблица базы данных — это совокупность экземпляров записей одной структуры. Описание структуры базы данных содержит перечень полей записи и их основные характеристики.
ПРИ МОДЕЛИРОВАНИИ ИСПОЛЬЗУЮТСЯ СЛЕДУЮЩИЕ ПРАВИЛА: только три конструктивных элемента участвуют в отдельном проектном представлении предметной области: сущность, атрибут, связь; выбор конструктивных элементов, особенно сущностей, должен производиться таким образом, чтобы избежать избыточности данных. При моделировании сложной предметной области проектировщик разбивает ее на ряд предметных областей - локальных представлений, таким образом, чтобы каждое представление содержало не более 6 -7 сущностей.
ПРИМЕР Рассмотрим ПО «Служащий» . Выделим на основании априорной информации, полученной от постоянных пользователей ПО две сущности: Служащий и Отдел
ДИАГРАММА ПО Элементы диаграмм:
МЕТОДЫ ДОСТУПА К ДАННЫМ Последовательный метод доступа заключается в просмотре всех записей таблицы в порядке очередности их вхождения. Этот метод является самым простым в организации и связан со значительными затратами времени на поиск, пропорциональными размеру таблицы. Прямой метод доступа состоит в нахождении нужной записи таблицы с помощью ключа (или индекса), содержащего ссылку на эту запись. При использовании данного метода просмотр других записей не выполняется, а осуществляется прямой доступ к записи на основании ссылки (смещения относительно начала таблицы). Индексно-последовательный метод доступа представляет собой объединение предыдущих методов, он используется при поиске группы записей. Применение данного метода возможно при наличии индекса, построенного по полям, значения которых должны быть найдены. При выборе данных последовательно перебираются индексы всех записей, удовлетворяющих заданным условиям, а по найденным индексам выбираются сами записи из таблицы (прямой доступ).
СПОСОБЫ ДОСТУПА К ДАННЫМ Навигационный способ доступа заключается в извлечении для обработки из БД каждой отдельной записи таблицы. В этом случае при необходимости обработать несколько записей запрос к БД будет выполняться многократно. Поэтому навигационный способ предпочтительно использовать в локальных БД. Например, в средах быстрой разработки приложений, таких как Delphi, данный способ доступа востребован компонентами-навигаторами для построчного редактирования записей. Реляционный способ доступа состоит в обработке сразу всей группы записей, при этом выдается один запрос к БД на получение всей группы записей. Указанный способ доступа более подходит для работы с удаленными БД. Здесь запрос на получение группы записей (в частном случае это может быть запрос на получение и одной записи) выполняется с привлечением средств языка SQL.
СВЯЗЫВАНИЕ ТАБЛИЦ Таблицы реляционной БД, как правило, взаимосвязаны. Организация связи (отношений) между таблицами называется связыванием или соединением таблиц. Связывание таблиц можно осуществлять при проектировании или при эксплуатации БД. Связывать можно две или несколько таблиц. Вместе с тем, в БД могут присутствовать отдельные таблицы, не соединенные ни с одной другой таблицей. Для связывания таблиц используются поля связи, которые должны быть индексированными. В подчиненной таблице для связи с главной таблицей берется индекс, который также называется внешним ключом. Состав полей этого индекса должен полностью или частично совпадать с составом полей индекса главной таблицы. Для организации связи в главной и подчиненной таблицах выбираются индексы, составленные по полям одного и того же типа, например, целочисленного.
КЛАССИФИКАЦИЯ БИНАРНЫХ СВЯЗЕЙ 1: 1 «Один к одному» . Каждому экземпляру сущности А соответствует один экземпляр сущности В и наоборот. Пример: Если студент обучается в одном вузе, то связь «СТУДЕНТ» «СТУДЕНЧЕСКИЙ БИЛЕТ» является связью 1: 1. 1: М «Один ко многим» . Каждому экземпляру сущности А соответствует один или несколько экземпляров сущности В. Пример: «МАТЬ» «РЕБЕНОК»
М: 1 «Многие к одному» . Каждый экземпляр сущности А связан с одним экземпляром сущности В, а каждый экземпляр сущности В связан с одним или несколькими экземплярами сущности А. Пример: «РЕБЕНОК» «МАТЬ» М: М «Многие ко многим» . Каждый экземпляр сущности А связан с одним или несколькими экземплярами сущности В и наоборот. Пример: «ВРАЧ» «ПАЦИЕНТ» , «СТУДЕНТ» «ПРЕПОДАВАТЕЛЬ» .
РАБОТА СО СВЯЗАННЫМИ ТАБЛИЦАМИ ИМЕЕТ НЕСКОЛЬКО ОСОБЕННОСТЕЙ При изменении (редактировании) поля связи может нарушиться связь между записями двух таблиц. Поэтому при редактировании поля связи записи главной таблицы нужно соответственно корректировать и значения полей связи всех подчиненных таблиц. При удалении записи главной таблицы следует удалять и соответствующие ей записи в подчиненной таблице (каскадное удаление). При добавлении записи в подчиненную таблицу значение ее поля связи должно быть установлено равным значению поля связи главной таблицы.
БИЗНЕС-ПРАВИЛА. Бизнес-правила представляют собой механизмы управления БД, которые, собственно, и предназначены для поддержания БД в целостном состоянии, а также для выполнения ряда других действий, например, накапливания статистики обращений к БД, и не имеют отношения к бизнесу в прямом смысле этого слова. В первую очередь, бизнес-правила реализуют ограничения БД, к которым относятся следующие: задание допустимого диапазона значений; установка значения по умолчанию; требование уникальности значения; запрет пустого значения; ограничения ссылочной целостности и др.
ПОЛЬЗОВАТЕЛИ БАНКОВ ДАННЫХ Конечные пользователи • Это основная категория пользователей, в интересах которых и создается банк данных. Это могут быть случайные пользователи, обращающиеся к БД время от времени за получением некоторой информации, а могут быть регулярные пользователи. Главный принцип состоит в том, что от конечных пользователей не должно требоваться каких-либо специальных знаний Администраторы банка данных. • Это группа пользователей, которая на начальной стадии разработки банка данных отвечает за его оптимальную организацию с точки зрения одновременной работы множества конечных пользователей, на стадии. эксплуатации отвечает за корректность работы данного банка информации в многопользовательском режиме. На стадии развития и реорганизации отвечает за возможность корректной реорганизации банка Разработчики и администраторы приложений • Это группа пользователей, которая функционирует во время проектирования, создания и реорганизации банка данных. Администраторы приложений координируют работу разработчиков при разработке конкретного приложения или группы приложений, объединенных в функциональную подсистему.
ОБОБЩЕННАЯ ТЕХНОЛОГИЯ РАБОТЫ С БД Технология работы с базами данных имеет несколько этапов: 1 этап построение инфологической модели БД, 2 этап обработка данных, содержащихся в таблицах 3 этап вывод информации из БД.
ПРОЕКТИРОВАНИЕ БАЗЫ ДАННЫХ Инфологический этап • о каких объектах или явлениях реального мира требуется накапливать и обрабатывать информацию (ПО); • какие основные характеристики и взаимосвязи будут учитываться (ограничения на ПО); • уточнения вводимых понятий об объектах и явлениях их характеристиках и взаимосвязях (словарь терминов и понятий). Даталогический этап • модели и методы представления и преобразования данных; • формулирование правила смысловой интерпретации данных.
ПОСТРОЕНИЕ ИНФОЛОГИЧЕСКОЙ МОДЕЛИ Для построения инфологической модели необходимо сделать анализ существующей базы данных, определить источник данных, посмотреть решаемые с помощью базы задачи и продумать проблемы, которые следует решать в будущем. Идентифицировав данные и задачи, которые следует решать, необходимо разделить их на группы, которые впоследствии станут таблицами БД. Студенты Дисциплины Оценки 1: М М: 1 1: М Преподаватели
СОЗДАНИЕ СТРУКТУРЫ ТАБЛИЦ базы данных предполагает определение групп и типов данных, которые будут храниться в таблицах, задание размера полей в каждой таблице и определение общих элементов таблиц-ключей. Имя поля Тип данных Размер поля Код студента Числовой Целое Фамилия Текстовый 15 Имя Текстовый 12 Отчество Текстовый 15 Группа Числовой Целое Телефон Текстовый 9 Стипендия Логический Да/Нет
ВВОД И РЕДАКТИРОВАНИЕ ДАННЫХ могут производиться двумя способами: с помощью специальных форм и непосредственно в таблице без использования форм. Код Фамилия Имя Отчество Дата рожд. Должность Дисциплина Телефон 1 Истомин Ремир Евгеньеви ч 23. 10. 54 Доцент Информатика 110 -44 -68 2 Миронов Павел Юрьевич 25. 07. 40 Профессор Экономика 312 -21 -40 3 Гришин Евгений Сергеевич 05. 12. 67 Доцент Математика 260 -23 -65
ОБРАБОТКА ИНФОРМАЦИИ в базе данных производится путем выполнения запросов или в процессе выполнения специально раз работанной программы. Запрос — это команда, формулируемая для СУБД, которая требует представить определенную, указанную в запросе информа цию. Язык SQL — это структурированный язык запросов (Structured Query Language). Запросы являются наиболее часто используемым аспектом SQL. Все запросы в SQL конструируются на базе коман ды. SELECT (выбор). Результатом выполнения запроса является таблица с временным набором данных (динамический набор). Записи динамического набора могут включать поля из одной или нескольких таблиц. На основе запроса можно построить отчет или форму. Рис. 6
ВЫВОД ИНФОРМАЦИИ Для вывода информации из базы данных существует специаль ное средство —отчеты. Они позволяют: • включать в отчет выборочную информацию из таблиц базы данных; • добавлять информацию, не содержащуюся в базе; • выводить итоговую информацию из базы данных; • располагать выводимую информацию в любом удобном виде; • включать в отчет информацию из разных таблиц
СИСТЕМА УПРАВЛЕНИЯ БАЗОЙ ДАННЫХ (СУБД) – программные средства, предназначенные для создания, наполнения, обновления и удаления баз данных. Различают три основных вида СУБД: промышленные универсального назначения; промышленные специального назначения; разрабатываемые для конкретного заказчика.
КАТЕГОРИИ СОВРЕМЕННЫХ БД 1. Программные продукты корпоративного направления — Oracle и MS SQL Server: 2. СУБД, предназначенные для работы с информационными массивами в небольших компаниях, — MS Access и Borland Interbase: должны быть надежными, что обеспечивается резервным копированием; безопасными — иметь защиту от несанкционированного доступа; работать с ог ромными объемами данных и обладать широкими функциональными возможностями. должны обладать не только надежностью и функциональностью, но и работать без выделенного сервера. 3. СУБД для Web, реализующих создание web-сайтов с небольшими базами данных, — My. SQL и опять-таки Borland Interbase: присуща высокая скорость обработки данных, нетребовательность к ресурсам и удобное удаленное администри рование.
СУБД ORACLE Oracle — одна из наиболее мощных современных СУБД, пред назначенных для реализации баз данных уровня корпорации, что предъявляет серьезные требования к серверу. Oracle может работать в большинстве операционных систем. Windows-NT, -2000, Linux, UNIX, AIX, Nowell Netware. А это в свою очередь позволяет выбирать наиболее удобную для корпора тивных задач платформу сервера. Например, если организация пред почитает использовать операционные системы не от Windows, то она легко может себе это позволить. Некоторые организации мо гут ориентироваться на решения на базе. UNIXсистем, славя щихся надежностью и устойчивостью в качестве серверной платформы, при этом продолжая использовать привычный пользова телям. Windows на клиентских компьютерах.
СУБД MS SQL SERVER-2000 MS SQL Server-2000 получила широкое распространение как у нас в стране, так и зарубежом, поскольку она предлагает широ кий спектр услуг администрирования и легко масштабируется. Этопозволяет использовать ее в информационных системах для сред него бизнеса и больших компьютерных информационных систе мах (КИС). В основе платформы MS SQL Server используется среда Windows. Главное преимущество программы — тесная интеграция с про граммными продуктами от. Microsoft и возможность экспорта/им порта данных в большинство распространенных форматов дан ных, что позволяет использовать MS SQL Server как центральное Хранилище данных.
СУБД BORLAND INTERBASE Borland Interbase содержит все, что требуется от СУБД, пред назначенной для нужд малого и среднего бизнеса. К тому же на чиная с версии 6. 0 программа стала бесплатной, что тоже суще ственно. Программа нетребовательна к аппаратной части — ми нимальная конфигурация: Pentium 100, оперативная память — 32 Мбайт, RAM (объем дисковой памяти), необходимой для хра нения базы, — 50 Мбайт. Borland Interbase поддерживается плат формами Windows и Linux, а также UNIX, Net. BSD, Free. BSD. Borland Interbase является одной из самых быстродействующих СУБД, уступая разве что My. SQL. Как существенное преимущество следует рассматривать то, что такие популярные языки программирования от Borland, как Delphi, Kylix и C++Builder, поставляются с компонентами, позволяю щими работать с данной СУБД. Именно это позволяет достичь очень высокого быстродействия программы.
СУБД MYSQL СУБД My. SQL заслужила популярность, благодаря своей вы сокой производительности при создании Web-приложений. Она получила широкое распространение в качестве средства работы с базами данных в Интернете. Программа совершенно нетребо вательна к ресурсам сервера, на котором работает, очень быст рая и к тому же совершенно бесплатная: исходные коды и дис трибутивы для различных платформ доступны на сайте в Ин тернете. My. SQL предназначена в первую очередь для работы в сети. Изначально программа была ориентирована на операционную систему Linux, но сейчас уже существуют версии программы для операционных систем Windows, UNIX, Net. BSD, Free. BSD, AIX. В последнее время программа завоевывает популярность у поль зователей. Macintosh с использованием операционной системой Mac OSX. И это происходит несмотря на то, что My. SQL не может Похвастаться очень богатым набором возможностей.
СУБД MS ACCESS Назначение этого широко известного программного продукта — решение локальных офисных задач с ограниченным объемом дан ных и формирование отчетов по результатам работы, при этом отчеты могут быть представлены в стандартном для офисных при ложений виде. Большинство пользователей знают MS Access как компонент MS Office, предназначенный для работы с базами данных. Мно гие ли знают о его возможностях, достоинствах и недостатках? А ведь MS Access — феноменальный программный продукт, реализованный по принципу «все в одном» . Он одновременно яв ляется и средой разработки на двух языках программирования (Visual Basic и сильно усеченный диалект SQL), и CASE-средством, а также мощным и наглядным средством создания отчетов по результатам работы.
Bazy_dannykh_i_zn.ppt