Лекция_8_семестр_2_Базы данных БЗ.ppt
- Количество слайдов: 17
Базы данных (БД) Системы управления базами данных (СУБД) и базами знаний (БЗ)
Одной из важнейших областей применения компьютеров является переработка и хранения больших объемов информации в различных сферах деятельности человека: в экономике, банковском деле, торговле, транспорте, медицине, науке и т. д. Эта проблема решается созданием информационных систем. Информационная система – это система, реализующая автоматизированный сбор, обработку и манипулирование данными и включающая технические средства обработки данных, программное обеспечение и обслуживающий персонал. Цель любой информационной системы – обработка данных об объектах реального мира. Основой информационной системы является база данных. База данных – это совокупность сведений о конкретных объектах реального мира в какой-либо предметной области. Под предметной областью принято понимать часть реального мира.
База данных – это организованная структура, предназначенная для хранения информации. Структурирование данных – это введение соглашения о способах представления данных. Работа с большими наборами данных автоматизируется проще, когда данные упорядочены, то есть образуют заданную структуру. Существует три основных типа структур данных: ь линейные структуры; ь иерархические структуры; ь табличные структуры. Линейные структуры – это списки, упорядоченные структуры, в которых адрес элемента однозначно определяется его номером. Иерархические структуры данных. В иерархической структуре адрес каждого элемента определяется путем доступа (маршрутом), ведущим от вершины структуры к данному элементу. Основным недостатком иерархической структуры является увеличенный размер пути доступа.
Табличные структуры (таблицы данных, матрицы данных) – это структуры, в которых элементы данных определяются адресом ячейки, который состоит не из одного параметра (как, например, в списках), а из нескольких. Для одномерных таблиц – это номер строки и столбца. Базами данных – называют данные, хранящиеся на запоминающих устройствах и организованные таким образом, что к ним могут иметь доступ различные программы. Средства управления этими базами данных получили название системы управления базами данных (СУБД). Система управления базами данных – это комплекс программных средств, предназначенных для создания, ведения и совместного применения базы данных многими пользователями. Система управления базами данных – это комплекс программных средств, позволяющий создавать структуру новой базы данных, наполнять базу данных ее содержимым, редактировать содержимое, проводить отбор данных в соответствии с заданным критерием, упорядочивать их и оформлять для последующей выдачи на устройства вывода или передачи по каналам связи.
По технологии обработки данных централизованные и распределенные. Централизованная база вычислительной системы. данных базы данных хранится в делятся памяти на одной Распределенная база данных состоит из нескольких возможно пересекающихся или даже дублирующих друга частей, хранимых в различных ЭВМ вычислительной сети. По способу доступа к данным базы данных делятся на базы данных с локальным доступом и базы данных с удаленным (сетевым доступом). Архитектура файл-сервер На одной машине хранится совместно используемая централизованная БД. Все другие машины сети выполняют функции рабочих станций. Архитектура клиент-сервер помимо хранения централизованной базы данных, центральная машина (сервер базы данных) должна обеспечивать выполнение основного объема обработки данных.
По степени универсальности различают два класса СУБД: ь системы общего назначения; ь специализированные системы. СУБД основывается на следующих моделях данных: иерархическая; сетевая; реляционная. Иерархическая модель организует данные в виде древовидной структуры. Сетевая модель организует данные в виде сетевой структуры. Реляционная модель данных организует данные в виде взаимосвязанных двумерных таблиц – объектов модели.
Основными средствами современных СУБД являются: ь средства задания (описания) структуры базы данных; ь средства конструирования экранных форм, предназначенных для ввода данных, просмотра и их обработки в диалоговом режиме; ь средства создания запросов для выборки данных при заданных условиях, а также выполнения операций по их обработке; ь средства создания отчетов и вывода на печать результатов обработки в удобном для пользователя виде; ь языковые средства – макросы, встроенный алгоритмический язык (Dbase, Visual Basic и др. ), язык запросов (QBE, SQL) и т. п. , которые используются для нестандартных алгоритмов обработки данных; ь средства создания приложений пользователя (генераторы приложений, средства создания меню и панелей управления приложениями), позволяющие объединить различные операции работы с базой данных в единый технологический процесс.
Используемые в настоящее время СУБД обладают обеспечения целостности данных и безопасности, средствами Обеспечение целостности данных – это характеристика, подразумевающая наличие средств, позволяющих удостовериться, что информация в базе данных всегда остается корректной и полной. Средства обеспечение безопасности обеспечивают выполнение следующих операций: ь шифрование прикладных программ; ь шифрование данных; ь защиту данных паролем; ь ограничение уровня доступа (к базе данных, к таблицам, к словарям, для пользователей различных категорий). Практически все современные многопользовательских средах, СУБД позволяют работать в Практически все современные СУБД обладают хорошими возможностями импорта-экспорта данных.
Важнейшей характеристикой является производительность СУБД, которая оценивается по следующим параметрам: ь время выполнения запросов; ь скорость поиска информации; ь время выполнения операций импортирования данных других форматов; ь скорость создания индексов и выполнение таких массовых операций, как обновление, вставка, удаление данных; ь максимальное число параллельных обращений к данным в многопользовательском режиме; ь время генерации отчета. Наибольшую популярность в настоящее время завоевали следующие СУБД: d. BASE, Fox. Pro, Paradox, Access, Oracle, Informix.
Сведения о реальном мире представляются в базах данных посредством определенного набора понятий. Наименьшей единицей описания данных предметной области является атрибут (аttribute) –, т. е. определенная, минимальная, желательно неделимая часть информации о некотором информационном объекте (отношении). Атрибут называют полем или неделимой единицей информации – реквизитом. Взаимосвязи между информационными объектами предметной области типизированы и бывают следующих видов: ь «один к одному» - одна запись одного из отношений может быть связана только с одной записью в другом отношении; ь «один ко многим» - одна запись одного отношения взаимосвязана со многими записями другого отношения; ь «многие ко многим» - одна и та же запись может входить в отношения со многими другими записями в различных отношениях.
В структуре записи файла указываются поля, значения которых являются ключами. Ключи бывают первичные и вторичные. Первичный ключ (ПК) – это одно или несколько полей, однозначно идентифицирующих запись. Если первичный ключ состоит из одного поля, он называется простым, если из нескольких полей – составным ключом. Вторичный ключ (ВК) – это одно или несколько полей, выполняющих роль поисковых или группированных признаков. В отличие от первичного, значение вторичного ключа может повторяться в нескольких записях таблицы, т. е. он является уникальным.
Одна из самых популярных СУБД - СУБД Access создает и обрабатывает реляционные базы данных, т. е. данные хранятся в нескольких таблицах и между ними устанавливается связь. Таблицы – они обладают структурой и содержанием. Вся информация, которая заносится в базу данных, сохраняется в таблицах. После того, как созданы таблицы для информационной системы, между ними устанавливают связи. Запросы – это объект для работы с уже заполненной базой данных. Они позволяют создать достаточно сложные выборки из взаимосвязанных таблиц и представить полученные данные в виде результирующей таблицы.
В СУБД Access проектирование запросов реализуется двумя способами: ь Запрос проектируется на основе бланка QBE (Query By Example). Пользователь при таком проектировании задает отдельные параметры запроса в окне проектирования с использованием подсказок и образцов; ь Запросы, проектируемые на основе структурированного языка запросов SQL (Structured Query Language). Формируя такой запрос, пользователь применяет инструкции и функции языка, выстраивая некоторое описание. Формы – с помощью форм данные заносят и отображают в удобном для пользователя виде. По сути, это трафарет для работы с данными в таблицах. Отчеты – служат для выдачи результатов работы в информационной системе на принтер.
Макросы – это средства для автоматизации работы с базой, которые позволяют упростить длинные последовательности действий. Модули – это программы, которые может написать пользователь (для СУБД Access на языке программирования Visual Basic for Application) для расширения возможностей стандартных средств Access Экспертные системы предназначены для анализа данных, содержащихся в базах знаний, и выдачи рекомендаций по запросу пользователя. Разработка баз знаний необходима, когда данные плохо формализуются. Создание интеллектуальных информационных технологий связано с решением комплекса проблем – синтеза базы знаний (БЗ) и экспертных систем (ЭС).
Эффективность ЭС в значительной степени определяется знаниями, введенными в БЗ. Создание и модификация БЗ осуществляются совместными усилиями эксперта и инженера по знаниям. Для этой цели создается интеллектуальный редактор БЗ, представляющий собой программу диалогового взаимодействия, облегчающую работу с БЗ. Один из блоков БЗ называется решатель – блок логического вывода, производит вывод, генерацию нового знания, т. е. решает поставленную задачу на основе знаний имеющихся в БЗ. При желании пользователь ЭС может получить объяснение того, как была решена задача. Для этого в ЭС включают блок объяснений. Взаимодействие с ЭС пользователя происходит при помощи интерфейса пользователя. Таким образом, ЭС состоит из центрального блока – БЗ, решателя – блока логического вывода и блока объяснений.
Знания – специальная форма представления информации, позволяющая человеческому мозгу хранить, воспроизводить и понимать ее. Знания есть особая информация, выраженная и зафиксированная в языке, поэтому основные типы знаний и типы отношений, определяющие связь знаний с внеязыковым миром, а также друг с другом и системой человеческих действий, должны подчиняться особым правилам: семантики, синтаксиса и прагматики. Знания – это особая форма информации, представляющая собой совокупность структурированных, теоретических и эмпирических положений предметной области, которые могут быть представлены в различной форме, обладают определенными свойствами, связаны синтаксическими, семантическими и прагматическими отношениями и позволяют решать прикладные задачи.
Знания имеют 5 важных свойств: Внутренняя интерпретируемость – вместе с информационной единицей, представляющей собой элемент данных в памяти ЭВМ, стало возможным хранить систему имен, связанную с такой информационной единицей. Рекурсивная структурированность – информационные единицы могут при необходимости расчленяться на мелкие и объединяться в крупные по принципу матрешки. Взаимосвязь единиц – между единицами возможно установление самых разнообразных отношений, отражающих семантику и прагматику связей, явлений и факторов. Наличие семантического пространства с метрикой – оно характеризует близость (удаленность) информационных единиц. Активность – знания в отличие от данных активны. Знания порождают знания.
Лекция_8_семестр_2_Базы данных БЗ.ppt