c3d397163dcab5b86e25275221378eac.ppt
- Количество слайдов: 24
Слайды по дисциплине Базы данных для спец. «ЭВМ» и «Прикладная информатика» Разработала Коптева Л. Г. , проф. кафедры «Вычислительная техника» РОАТ
Основные понятия • База данных (БД) – это поименованная совокупность данных, организованных по определенным правилам, предусматривающим общие принципы хранения, описания и манипулирование данными независимо от прикладных программ. • Информация – это совокупность знаний о фактических данных и зависимостях между ними. • Данные – это информация, представленная в форме, необходимая для ввода ее в ЭВМ, хранения, обработки и выдачи потребителям.
Основные понятия • СУБД – это совокупность программ и языковых средств, предназначенных для создания, ведения и использования БД. СУБД расширяет функции ОС по обработке БД. • Банки данных – это системы с высокой степенью интеграции данных и автоматизации управления данными. Типовой состав банка данных можно представить: n Бн. Д = {БД, СУБД, U (ППi)} i=1
Классификация данных: • • • Системы БД классифицируются в зависимости от модели данных, которая лежит в их основе. В общепринятой классификации в настоящее время известны следующие модели данных: иерархическая, сетевая, реляционная, объектно-ориентированная, объектно-реляционная.
Пример реляционной БД -
Пример РМД в составе двух отношений Сотрудник Финансы Борисов Квитко Сейфулин Год Телефон Должность Оклад 1970 458 -46 -10 Инженер инженер 2500 1969 792 -55 -66 Техник техник Фамилия 2000 секретарь 2200 1969 599 -99 -99 Инженер
Нормализация отношений Позволяет устранить избыточность хранимой информации и избежать аномалий в организации данных. Процесс нормализации представляет собой последовательное изменение структуры таблиц до тех пор, пока она не будет удовлетворять требованиям последней формы нормализации. Всего существует шесть форм нормализации: первая нормальная форма (First Normal Form — INF); вторая нормальная форма (Second Normal Form — 2 NF); третья нормальная форма (Third Normal Form — 3 NF); нормальная форма Бойса—Кодда (Brice—Codd Normal Form — BCNF); четвертая нормальная форма (Fourth Normal Form — 4 NF); пятая нормальная форма, или нормальная форма проекции-соединения (Fifth Normal Form - 5 NF, или PJ/NF). Хэширование Еще один интересный подход, применяемый для повышения эффективности доступа к данным, - хэш ирование (hashing). Для метода хэширования нет житейского аналога, Основная идея хэширования - организация ассоциативной памяти для хранения строк таблицы с определением места строки в таблице по значениям одного или нескольких ее ключевых атрибутов. Место строки вычисляется хэш-функцией, аргументы которой - значения атрибутов, а результат- целое число в диапазоне номеров строк таблицы БД
Одной из важнейших операций в системе обработки является ускоренный поиск данных В СУБД на ПК чаще всего используют следующие типы поисковых структур: • линейный список; • цепной список; • инвертированные файлы; • индексные файлы.
Инвертированный по полю «год» Фамилия 001 Квитко Год Телефон 1969 Простой индексный файл содержит два поля: поле, по которому упорядочивают и поле адресов. Должность 792 -55 -66 Техник Год 1969 002 Сейфулин 1969 003 Борисов 1970 Адрес 002 1969 003 1970 001 599 -99 -99 Инженер 458 -46 -10 Инженер
Пример сетевой структуры
Пример иерархической древовидной структуры БД
Отношения реляционной БД Связь (relationship) – это логическое отношение между таблицами (сущностями), выражающее некоторое ограничение или правило. Существуют следующие виды отношений: • Один к одному • Один ко многим • Многие ко многим. Такая связь может быть реализована через связи других типов, например, с помощью введения промежуточной таблицы эта связь приводится к двум отношениям один ко многим.
Постреляционные модели данных: Сегодня постреляционные модели данных представлены двумя основными моделями данных: объектно– ориентированной и объектно–реляционной. Объектно-ориентированная модель изначально строилась с учетом ее эволюции и расширения. Эта модель базируется на основных понятиях и методах, разработанных в объектно-ориентированном программировании (ОПП) и представленных в широко используемых языках объектно-ориентированного программирования, таких как С++, Java и др.
Классификация БД в зависимости от места функционирования: Б. Д. SQL-СЕРВЕРНЫЕ ЛОКАЛЬНЫЕ Local Inter Base Oracle DBase подобные Paradox Informix
Этапы проектирования базы данных
Структурированный язык запросов SQL. • • • В SQL можно выделить следующие группы операторов: операторы определения данных (DDL). средства управлениями транзакциями. операторы манипулирования данными (DMP). язык запросов (DQL) оператор – select. средства администрирования данных. программный SQL. Оператор Select [ALL/DISTINCT] (<список полей>) FROM <список таблиц> [WHERE <предикат – условие выборки или соединения>] [GROUP BY <список полей результата>] [HAVING <предикат – условие для группы>] [ORDER BY <список полей по которым можно упорядочить вывод>]
Агрегатные функции В SQL добавлены дополнительные функции, которые позволяют выч-ть обобщённые групповые значения. Суть операции группировки: При группировке всё множество столбцов таблицы разбивается на группы, в которые собираются столбцы, имеющие одинаковые значения, которые заданы в списке группировки. Получение групповых значений делается с помощью агрегатных функций: Count, sum, avg, min, max.
SQL – разработан исключительно для доступа к базам данных Чтобы использовать SQL в качестве языка программирования нужно рассмотреть возможности: -Можно встраивать жестко закодированные операторы SQL в программы записанные на другом языке – встроенный SQL -Можно писать программы, которые генерируют операторы SQL в процессе выполнения – динамичный SQL -Можно обращаться к специально разработанному интерфейсу прикладного программирования(API). Программа которая использует API может содержать как статические так и динамические SQL-код(динамические чаще).
Средства быстрой разработки приложений. RAD (Rapid Application Development). Отличительные черты RAD 1. Наличие объектно-ориентированного языка, которое позволяет эффективно использовать модульный принцип составления программ. 2. Визуальные средства разработки, которые дают возможность заменить написание программного кода, изображением пользовательского интерфейса и заданием необходимых функций. 3. Осуществляется поддержка стандартных протоколов обмена данными. Возможность компонентной технологии создания приложений. 4. Возможность создания приложений клиент-сервер. К быстрым средствам разработки фирмы Microsoft можно отнести: Access, SQL Server, Visual Basic, Visual Fox. Pro, Visual C++.
Продукт Основное назначение Основные преимущества 1. Access Создание отчетов произвольной формы Простота освоения, может быстро освоить . на основании различных данных, разработка некоммерческих приложений. 2. SQL Server непрофессиональный программист, имеют мощные средства подготовки отчетов. Хранение больших массивов данных, в Высокая степень защиты данных, высокая т. ч. данных, требующих соблюдения режима секретности. 3. Visual Basic производительность, мощные средства работы данных. Создание приложений для интеграции Невысокие требования к мощности ПК, всех компонентов office создаются приложения универсальность, возможность создания компонентов средней мощности, когда не нужна оле-технологий. интенсивность обработки. 4. Visual Fox. Pro Создание приложений масштаба предприятия возможно на разных платформах Многоплатформенность, высокая скорость обработки, интеграция объектно-ориентированного языка, x. Base, SQL. 5. Visual C++ Создание приложений и обеспечение функциональности недостижимой в других средствах разработки. Наибольшая скорость работы приложения, универсальность, огромная функциональность.
Системы OLTP и OLAP Можно выделить два класса СУБД: системы операционной обработки данных и системы, ориентированные на анализ данных и поддержку принятия решений. OLTP (On-Line Transaction Processing - оперативная обработка транзакций). Первые рассчитаны на быстрое обслуживание относительно простых запросов большого числа пользователей. Время ожидания выполнения типичных запросов в таких системах не должно превышать нескольких секунд. Сфера применения таких систем - это системы платежей, резервирования мест в поездах, самолетах, гостиницах, банковские и биржевые системы. Системы оперативной аналитической обработки (OLAP - On-Line Analysis Processing) / системы поддержки принятия решений (аналитические системы). Эти системы ориентированы на выполнение более сложных запросов, требующих статистической обработки исторических (накопленных за некоторый промежуток времени) данных, моделирования процессов предметной области, прогнозирования развития тех или иных явлений.
Транзакции Транзакцией называют неделимую с позиции воздействия на БД последовательность операций манипулирования данными С ростом сложности распределенных вычислительных систем возникают проблемы эффективного использования их ресурсов. Для решения этих проблем в состав распределенных OLTP-систем вводят дополнительный компонент - монитор транзакций (ТРМ - transaction processing monitor). Мониторы транзакций выполняют две основные функции: 1. динамическое распределение запросов в системе (выравнивание нагрузки) 2. оптимизация числа выполняющихся серверных приложений.
Модели данных, используемые для построения хранилищ В настоящее время существуют два подхода к построению хранилищ данных: подход, основанный на использовании многомерной модели БД (Multidimedsional OLAP - MOLAP), и подход, использующий реляционную модель БД (Relational OLAP - ROLAP) Методы аналитической обработки данных в хранилище Одна из важнейших составных частей современных аналитических систем - средства интеллектуального анализа данных. В аналитических системах для обработки данных используется очень широкая номенклатура методов: традиционные статистические методы регрессионного, факторного, дисперсионного анализа, анализа временных рядов, а также новые методы, основанные на искусственном интеллекте. Они именуются методами интеллектуального анализа данных (ИАД), "data mining" (дословно - добыча знаний). К последним, как правило, относят: нейронные сети, нечеткую логику, генетические алгоритмы, методы извлечения знаний.
Представление данных в виде гиперкуба
c3d397163dcab5b86e25275221378eac.ppt