КИС-ХД-ИПС!!!.ppt
- Количество слайдов: 28
ИОСП Слайд-лекция Тема: 1. Хранилища данных 2. Информационно-поисковые системы Автор: Проскурякова Л. Г. , канд. полит. наук, доцент
Содержание термина "информация"
Общая структурная схема информационной системы.
Процессы в информационных системах
Правила обработки документальной информации Графематический анализ Этап графематического анализа предназначен для выделения элементов структуры текста: параграфов, абзацев, предложений, отдельных слов и т. д. Морфологический анализ предназначен для определения по словоформе нормальной формы слова, его части речи и набора параметров
Разомкнутая ИС Информация является источником и основой такой деятельности человека как принятие решений и управление. Для того, чтобы осуществлять управление, любая информационная система должна обеспечивать следующую схему действий: Источник входной информации Прием информации Хранение и преобразование информации Вывод информации Потребитель информации Такая информационная система управления называется разомкнутой системой. Пример: различные справочные службы. Потребитель получает нужную ему информацию и прекращает взаимодействие со службой, никак не влияя на ее работу информацию, которой она располагает.
Замкнутая ИС В замкнутой системе между ней и потребителем существует взаимодействие, которое выражается в виде канала обратной связи. Информация от потребителя поступает по каналу обратной связи снова в аппаратнопрограммную часть системы, где происходит ее обработка совместно с информацией от источника. Схема замкнутой системы управления: Источник входной информации Прием информации Хранение и преобразование информации Вывод информации Потребитель информации Обратная связь Примером замкнутой системы управления служит организация работы железнодорожной кассы.
КИС ЕСМ-решения ERPконцепция BPМ КИС-корпоративная информационная система ЕСМ (Enterprise Content Management) – система управления документами (контентом) ERP (Enterprise Resource Planning ) –управление ресурсами предприятия Системы класса ERP – это комплекс интегрированных приложений, позволяющих создать единую среду для автоматизации планирования, учета, контроля и анализа всех основных бизнес-процессов предприятия BPM –Business Process Management - управление бизнес-процессами. Это методология реинжиниринга бизнес-процессов на предприятии.
ERP-концепция ERPII SCM CSRP CRM ERP MRPII MRP (Material Requirements Planning) - планирование потребностей в материалах. MRPII (Manufacturing Resource Planning) - планирование производственных ресурсов. CSRP (Customer Synchronized Resource Planning) - планирование ресурсов, синхронизированное с покупателем. CRM (Customer Relations Management) - управление отношениями с заказчиками. SCM (Supply Chain Management) - управление отношениями с поставщиками. Системы ERP призваны автоматизировать все процессы на предприятии, в то время как MRP уделяют внимание только производству.
КИС делятся на Front Office и Back Office - системы. Front Office - это системы, позволяющие предоставлять информацию внешнему окружению организации, а также получать информацию из внешней среды. В настоящее время такими КИС являются корпоративные Web-порталы предприятий, представленные в сети Интернет. Back Office-системы представлены либо ERP-системами, либо специальными аналитическими системами, которые разрабатываются под конкретного клиента и учитывают специфику решаемых компанией задач.
Типы информационных систем • локальные ИС БД и СУБД находятся на одном компьютере. • файл-серверные БД находится на сервере сети (файловом сервере), а СУБД на компьютере пользователя. • клиент-серверные БД и основная СУБД находятся на сервере, СУБД на рабочей станции посылает запрос и выводит на экран результат.
Локальные ИС БД СУБД § автономность (независимость) § с БД работает только один человек § сложно обновлять при большом количестве пользователей § практически невозможно «стыковать» изменения, вносимые несколькими пользователями
Файл-серверные ИС СУБД БД СУБД § несколько человек работают с одной базой § основную работу выполняют рабочие станции (РС), они должны быть мощными § для поиска строки на РС копируется вся БД – нагрузка на сеть § слабая защита от взлома (только на РС) § проблемы при одновременном изменении с разных РС
Клиент-серверные ИС СУБД-клиент БД запрос на SQL СУБД-сервер: • MS SQL Server • Oracle • My. SQL СУБД-клиент ответ СУБД-клиент SQL (Structured Query Language) – язык структурных запросов § § § § основную работу выполняет сервер проще модернизация (только сервер) по сети идут только нужные данные защита на сервере (сложнее взломать) разделение доступа (очередь заданий) сложность настройки высокая стоимость ПО (тысячи $)
Хранилища Данных Хранилище Данных (Data Warehouse , DW , ХД, информационное хранилище, склад данных) это: • централизованный фонд структурированного хранения и быстрого поиска информации, необходимой для анализа; • предметно-ориентированный, интегрированный, поддерживающий хронологию и неизменяемый набор данных, предназначенный для поддержки принятия решений. Прежде чем попасть в хранилище, данные должны быть соответствующим образом обработаны. Базы данных, в которых происходит накопление, обработка первичных данных, на основании которых строится хранилище, называются транзакционными. Связь между хранилищем данных и транзакционными БД изображена на следующем слайде
Общая схема хранилища данных Макет хранилища данных. Современное ХД содержит следующие компоненты: 1. 2. 3. 4. 5. источники данных; ETL-уровень; уровень хранения; уровень отчетности. информационно-поисковая система.
Структура хранилища данных ETL-средства обеспечивают три основных процесса, используемые при переносе данных из одного приложения или системы в другие: ETL-средства извлекают информацию из исходной БД, преобразуют ее в формат, поддерживаемый базой данных назначения; затем загружают в нее преобразованную информацию. ХД
Схема формирования и использования хранилищ данных в системах поддержки принятия решений Операционные данные Перемещение данных Отбор данных Загрузка данных оптимизация Поддержка принятия решения Операционные данные ХРАНИЛИЩЕ ДАННЫХ Операционные данные ХД
Схема процессов в информационно-поисковых системах
Общий принцип функционирования документальных ИПС на основе индексирования Процесс отображения документа в поисковом пространстве называется индексированием. Индексирование- это процесс присвоения каждому документу некоторого индекса-координаты в поисковом пространстве. Формализованное представление индекса документа называется поисковым образом документа (ПОД).
Структура информационных потоков при поиске документов в информационно -поисковой системе. Поисковое пространство, отображающее поисковые образы документов и реализующее механизмы информационного поиска документов так же, как и в фактографических ИС, строится на основе языков документальных баз данных, называемых информационно-поисковыми языками (ИПЯ). ИПС
Основными элементами ИПЯ являются: АЛФАВИТ, ЛЕКСИКА И ГРАММАТИКА. Алфавит ИПЯ - система знаков, используемых для записи слов и выражений ИПЯ. Лексика, или словарный состав ИПЯ, - совокупность слов, словосочетаний и выражений, используемых для построения текстов ИПЯ. Грамматика ИПЯ - совокупность средств и способов построения, изменения и сочетания лексических единиц. Грамматика включает морфологию и синтаксис. Морфология - совокупность средств и способов построения и изменения слов. Синтаксис - совокупность средств и способов соединения слов в выражения и фразы.
Простой набор элементов МЕТАДАННЫХ ДУБЛИНСКОГО ЯДРА (Dublin Core Metadata Element Set; DCMES) состоит из следующих 15 элементов метаданных: Title — название; Creator — создатель; Subject — тема; Description — описание; Publisher — издатель; Contributor — внёсший вклад; Date — дата; Type — тип; Format — формат документа; Identifier — идентификатор; Source — источник; Language — язык; Relation — отношения; Coverage — покрытие; Rights — авторские права ИПС
Основной классификатор Пользовательский классификатор Неклассифицированные объекты Схема классификации объектов
Основной классификатор Классификатор пользователя 1 Классификатор пользователя 2 Классификатор пользователя 3 Схема взаимодействия классификаторов
Модель поиска ДУБЛИНСКОЕ ЯДРО (Dublin Core Metadata Element Set; DCMES) Это простой набор элементов состоит из следующих 15 элементов метаданных: Title — название; Creator — создатель; Subject — тема; Description — описание; Publisher — издатель; Contributor — внёсший вклад; Date — дата; Type — тип; Format — формат документа; Identifier — идентификатор; Source — источник; Language — язык; Relation — отношения; Coverage — покрытие; Rights — авторские права
Иерархический метод классификации Количество уровней классификации, соответствующее числу признаков, выбранных в качестве основания деления, характеризует глубину классификации. Пример классификации: общероссийский классификатор видов экономической деятельности (ОКВЭД). В ОКВЭД использованы иерархический метод классификации и последовательный метод кодирования. Код группировок видов экономической деятельности состоит из двух-шести цифровых знаков и его структура может быть представлена в следующем виде: ХХ. – класс; ХХ. Х – подкласс; ХХ. ХХ – группа; ХХ. Х – подгруппа; ХХ. ХХ – вид.
Общероссийский классификатор органов государственной власти и управления (ОКОГУ) Условное обозначение – ОК 006 -93.