Скачать презентацию Лекции Раздел 1 Основные понятия 1 1 Скачать презентацию Лекции Раздел 1 Основные понятия 1 1

Лекция_Информационные системы и технологии.ppt

  • Количество слайдов: 162

Лекции Раздел 1 Основные понятия • 1. 1 Информатика – наука, предмет и задачи Лекции Раздел 1 Основные понятия • 1. 1 Информатика – наука, предмет и задачи • 1. 2 Информация • 1. 3 Система информации • 1. 4 Автоматизированная информационная система • 1. 5 Классификация информационных систем Раздел 2. Документальные информационные системы • 2. 1 Основные понятия • 2. 2 Информационно поисковый язык • 2. 3 Поисковый аппарат документальных информационно поисковых систем • 2. 4 Критерии оценки документальных систем • 2. 5 Информационно поисковые языки Internet • 2. 6 Программные средства реализации документальных ИС. Современное состояние ИПС Раздел 3. Фактографические системы • 3. 1 Основные понятия • 3. 2 Модели данных • 3. 3 Предметная область • 3. 5 Модель сущность связь • 3. 6 Программные средства реализации фактографических информационных систем

Новая цивилизация, на пороге которой мы стоим, будет представлять собой высокоавтоматизированное информационное общество, основанное Новая цивилизация, на пороге которой мы стоим, будет представлять собой высокоавтоматизированное информационное общество, основанное на широкомасштабном использовании информации и научных знаний. Информация станет глобальным ресурсом развития человека и общества в XXI веке.

Так, затраты на развитие информационной сферы в США сегодня превышает затраты на развитие топливно Так, затраты на развитие информационной сферы в США сегодня превышает затраты на развитие топливно энергетического комплекса этой страны. Прибыль в США от этой сферы больше, чем сферы развлечений и досуга.

Удельные объемы информации, получаемой обществом по традиционным информационным каналам (радио, телевидение, почта, связь) неуклонно Удельные объемы информации, получаемой обществом по традиционным информационным каналам (радио, телевидение, почта, связь) неуклонно сокращаются, а по компьютерным сетям возрастают и к 2030 году доля информации, получаемая по компьютерным сетям, возрастет до 90 -95%.

Информатика • достаточно новая научная дисциплина. • своим появлением она обязана развитию глобального процесса Информатика • достаточно новая научная дисциплина. • своим появлением она обязана развитию глобального процесса информатизации общества. • термин возник во Франции в 60 х годах Informatique, образованного в результате объединения двух терминов Information (информация) и Automatique (автоматика), • означает “автоматизированная переработка информации”. • в англоязычных странах этому термину соответствует синоним Computer Science (наука о компьютерной технике). • в нашей стране подобная трактовка термина “информатика” утвердилась с момента принятия решения в 1983 году на сессии годичного собрания АН СССР об организации нового отделения информатики, вычислительной техники и автоматики.

Сегодня вокруг информатики формируется целый комплекс новых направлений научных исследований в области информации: • Сегодня вокруг информатики формируется целый комплекс новых направлений научных исследований в области информации: • социальная информатика, • биологическая информатика, • прикладная информатика и так далее. Определений информатики как науки очень много, но их обобщение позволяет использовать следующую трактовку:

Информатика как наука • Информатика – наука о наиболее общих закономерностях построения и преобразования Информатика как наука • Информатика – наука о наиболее общих закономерностях построения и преобразования информационной модели мира, определяющая роль человека и технических средств в процессах обработки информации в технических, биологических, социальных и других системах. • Информатика – комплексное научное направление, имеющее междисциплинарный характер.

Основные задачи • • все аспекты разработки, проектирования, создания, оценки функционирования на ЭВМ систем Основные задачи • • все аспекты разработки, проектирования, создания, оценки функционирования на ЭВМ систем переработки информации, • их применение в различных областях человеческой деятельности.

 • мы постигаем мир, конструируя такие понятия, как объекты (предметы) и явления (действия, • мы постигаем мир, конструируя такие понятия, как объекты (предметы) и явления (действия, процессы и т. д. ). • наша задача состоит в том, чтобы научиться извлекать информацию о предметах и процессах, необходимую для достижения поставленной задачи.

 • Данные – факты или идеи, выраженные в формализованном виде, обеспечивающем возможность их • Данные – факты или идеи, выраженные в формализованном виде, обеспечивающем возможность их хранения, обработки и передачи. • Данные играют существенную роль в деятельности любого предприятия. • Из данных извлекается необходимая информация. • Данные можно рассматривать как сырье (ресурс) для производства информации. • В результате обработки данные приобретают смысл, то есть становятся информацией.

назад назад

Термин «информация» происходит от латинского слова «informatio» разъяснение, изложение, сведения. В качестве синонимов иногда Термин «информация» происходит от латинского слова «informatio» разъяснение, изложение, сведения. В качестве синонимов иногда используют такие понятия как «сообщение» и «данные» . Вместе с тем, следует отметить отличительные особенности этих терминов: Данные представляют собой набор символов или цифр, представляя соответственно текст или число. Сообщение включает в себя набор данных, объединенных общим контекстом или смыслом. Информация извлекается из сообщения и зависит от объекта воспринимающего (обрабатывающего) это сообщение. Результат зависит от свойств этого объекта. В зависимости от целей и интересов из одного и того же сообщения можно извлечь совершенно разную информацию.

Процессы преобразования информации связаны с информационными технологиями. Под технологией (techne – мастерство, искусство) понимают Процессы преобразования информации связаны с информационными технологиями. Под технологией (techne – мастерство, искусство) понимают обычно либо совокупность методов обработки, изготовления, изменения состояния, свойств, формы сырья, материала или полуфабриката в процессе производства (например, технология металлов, химическая технология, технология строительства и др. ), либо науку о способах воздействия на сырье, материалы или полуфабрикаты соответствующими орудиями производства.

Особенностью ИТ является то, что в ней и предметом и продуктом труда является информация, Особенностью ИТ является то, что в ней и предметом и продуктом труда является информация, а орудиями труда – средства вычислительной техники и связи. ИТ как наука о производстве информации возникала именно потому, что информация стала рассматриваться как реальный производственный ресурс наряду с другими материальными ресурсами. Производство информации и знаний оказывает решающее влияние на модификацию и создание новых промышленных технологий.

История Изобретение телефона, радио, телевидения, а затем ЭВМ, цифровых систем связи и вычислительных сетей История Изобретение телефона, радио, телевидения, а затем ЭВМ, цифровых систем связи и вычислительных сетей позволили новым информационным технологиям внедриться практически во все области человеческой деятельности. Основу автоматизированных ИТ составляют следующие достижения: • средства накопления больших объемов информации (магнитные и оптические диски); • средства связи, позволяющие воспринимать, использовать и передавать информацию практически в любой точке земного шара; • компьютер, позволяющий по определенным алгоритмом обрабатывать и отображать информацию, накапливать и генерировать знания. ИТ направлены на увеличение степени автоматизации всех информационных операций, следовательно, на ускорение технический прогресс общества.

Определения понятия информации • Определение. (Реймон Буаде, почетный профессор Национальной школы искусств и ремесел Определения понятия информации • Определение. (Реймон Буаде, почетный профессор Национальной школы искусств и ремесел Франции). Информация это все то, что уменьшает степень неопределенности нашего знания о данном предмете. • Определение. Информация любые сведения о каком либо событии, процессе, объекте, являющиеся предметом операции восприятия, передачи, преобразования, хранения или использования. • Определение. (Федеральный закон “Об информации, информатизации и защите информации”). Информация – сведения о лицах, предметах, фактах, событиях, явлениях и процессах независимо от формы их представления. (устарел закон)

Информацию можно разделить на два типа: • Первичная информация – это выражение некоторого факта, Информацию можно разделить на два типа: • Первичная информация – это выражение некоторого факта, поведения, то есть того, что характеризует определенное событие, ситуацию, состояние. • Обработанная информация – это результат переработки первичной или ранее обработанной информации.

Существует ошибочное мнение, что необработанная информация менее ценна, чем обработанная. Однако информация и процесс Существует ошибочное мнение, что необработанная информация менее ценна, чем обработанная. Однако информация и процесс переработки информации – это не процесс превращения алмазов в бриллианты. Наша задача заключается не в производстве новой информации, а в эффективном её использовании.

Можно выделить три критерия качества информации: 1. Актуальность 2. Полнота 3. Точность Можно выделить три критерия качества информации: 1. Актуальность 2. Полнота 3. Точность

Актуальность • • хуже всего реализуется на практике. зависит от быстроты регистрации информации и Актуальность • • хуже всего реализуется на практике. зависит от быстроты регистрации информации и от точности ее отнесения к определенным моментам времени или к другим событиям, от которых она зависит или на которые оказывает влияние (скорость регистрации и правильная классификация по времени или событию). выступая в роли некоторого симптома, информация позволяет предвидеть события. дает возможность в рамках стабилизированного процесса сделать краткосрочный прогноз его дальнейшего развития. критерий связан с понятием срока старения информации

Полнота • отражает желание обладать всей полезной для анализа ситуации информацией. • может быть Полнота • отражает желание обладать всей полезной для анализа ситуации информацией. • может быть истолкована тремя способами: во первых, предусматривать накопление всех элементарных единиц информации относительно одного и того же аспекта наблюдений; во вторых, означать получение всей элементарной информации, характеризующей явление в определенный момент времени, в третьих, представлять собой сочетаний первых двух случаев. критерий связан с понятием объема и количества информации

Точность • • дополняет первые два критерия гарантирует, что не произойдет никаких искажений, которые Точность • • дополняет первые два критерия гарантирует, что не произойдет никаких искажений, которые могли бы изменить один или несколько компонентов информации. Критерий точность следует рассматривать на двух уровнях: на техническом уровне, связанном со средствами и процедурами сбора и передачи, где выдвигается требование отсутствия искажений при сборе и передаче информации; на методическом уровне, где объединяются три критерия: актуальность, полнота и точность.

Уровни информации для управления стратегический тактический оперативный Уровни информации для управления стратегический тактический оперативный

Информация • В любой области экономической и социальной деятельности, • На любом предприятии, занимающемся Информация • В любой области экономической и социальной деятельности, • На любом предприятии, занимающемся производством и распределением продукции, создается и используется информация

Назад к 21 Назад к 21

Система информации • Всякая взаимосвязь и координация работ внутри отдельной производственной группы возможны только Система информации • Всякая взаимосвязь и координация работ внутри отдельной производственной группы возможны только благодаря СИСТЕМА ИНФОРМАЦИИ • • которая охватывает как всю группу, так и ее отдельные элементы, способные порождать, модифицировать и использовать информацию. генераторами и одновременно потребителями информации являются различные виды деятельности, а также сам человек и применяемые им устройства.

Система информации • существует в естественном виде, • она образует информационную среду, • информация Система информации • существует в естественном виде, • она образует информационную среду, • информация существовала и существует, непрерывно циркулирует при наличии систем автоматики, современной электронной вычислительной техники или даже без них, • охватывает данные не только об этом предприятии, но и данные, представляющие для него интерес. • связана со всей информационной средой предприятия.

Определение Совокупность информационных потоков и информационных обменов составляет систему информации. Определение Совокупность информационных потоков и информационных обменов составляет систему информации.

Пример • торговый агент, подтверждающий получение заказа, • станок, выдающий продукцию в определенном темпе, Пример • торговый агент, подтверждающий получение заказа, • станок, выдающий продукцию в определенном темпе, • товарные запасы на складе, претерпевающие определенные колебания, • Всё это является ограничительными факторами, порождаемые их поведением, и это отражается в соответствующей информации. • Последствия поведения каждого объекта порождает событие.

Определение Теория вероятностей под событием понимает возможный исход некоторого наблюдения (идеализированного опыта). Определение Теория вероятностей под событием понимает возможный исход некоторого наблюдения (идеализированного опыта).

Влияние событий на функционирование объекта: • остаются без внимания; • используются для локального управления; Влияние событий на функционирование объекта: • остаются без внимания; • используются для локального управления; • используются для управления основными ресурсами.

Управление или управляющее воздействие • Может означать и поставку сырья, и перестановку оборудования, и Управление или управляющее воздействие • Может означать и поставку сырья, и перестановку оборудования, и составление отчета. • Влияют на ход событий и сами в соответствующие моменты времени проявляются через другие события, так что цикл замыкается. • К событиям, вызываемыми путем управляющего воздействия добавляются те, которые вызываются внешними факторами (воздействия окружающей среды, механические поломки и т. д. )

Информационная среда Событие генерирует информацию, которая затем используется, использование вызывает управляющее воздействие. С этим Информационная среда Событие генерирует информацию, которая затем используется, использование вызывает управляющее воздействие. С этим процессом мы встречаемся во всех задачах управления. Система информации представляет собой информационную среду, которая позволяет определить: • где, когда и при каких обстоятельствах произошло событие; • каким образом его воспринять, уловить, зафиксировать; • где, когда и как следует применить управляющее воздействие.

Информационная система – это система, состоящая из следующих компонентов: • информационная база; • концептуальная Информационная система – это система, состоящая из следующих компонентов: • информационная база; • концептуальная схема; • информационный процессор. (ГОСТ 34. 320 -96 ИТ. Система стандартов по базам данных). Информационная система (Computer-aided information system) организационно техническая система, использующая автоматизированные информационные технологии для поддержки информационных технологий управления, предоставления управленческому персоналу методов и средств работы с информацией для реализации функций управления. Информационная система – совокупность взаимосвязанных данных, осуществляющая следующие управляющие воздействия: • сбор информации; • продвижение информации; • возможное преобразование; • передачу в пункт использования; • возможную обработку. (Ив Ложе. “Информационные системы. Методы и средства”) Информационная система – организационно упорядоченная совокупность документов и информационных технологий, в том числе с использованием средств вычислительной техники и связи, реализующих информационные процессы (определение устарело) (Федеральный закон “Об информации, информатизации и защите информации”).

В настоящее время история развития систем, предназначенных для хранения и обработки информации с использованием В настоящее время история развития систем, предназначенных для хранения и обработки информации с использованием ЭВМ, насчитывает уже более полувека. Еще относительно недавно в ходу были перфораторы в качестве устройств ввода данных, листинги в виде рулонов бумаги длиной порою до нескольких метров в качестве носителя результатов машинной обработки, недельные, либо месячные временные интервалы в качестве нормативных сроков обработки информации.

В последнее десятилетие ушедшего века ситуация претерпела качественные изменения. Если попытаться сформулировать В последнее десятилетие ушедшего века ситуация претерпела качественные изменения. Если попытаться сформулировать "портрет" современной информационной системы масштаба предприятия в виде десятка тезисов, то мы увидим, что она имеет: 1. в основе методологию управления, направленную на достижение стратегических целей высшего менеджмента предприятия, выраженную в информационной системе в виде системы управляющих воздействий, регламентирующей деятельность пользователей,

2. возможность доступа к данным для множества пользователей, объединенных в локальную сеть предприятия, а 2. возможность доступа к данным для множества пользователей, объединенных в локальную сеть предприятия, а зачастую и для пользователей, удаленных от центрального офиса на сотни и тысячи километров, например:

3. наличие средств коммуникации и элементов корпоративного решения задач коллективом пользователей; 4. развитый, дружественный 3. наличие средств коммуникации и элементов корпоративного решения задач коллективом пользователей; 4. развитый, дружественный графический интерфейс конечного пользователя, или 5. режимы обработки оперативной информации, близкие к режиму реального времени, 6. средства аутентификации и разграничения доступа, позволяющие дозировать информацию в соответствии с должностными обязанностями пользователя; высокий уровень защищенности от несанкционированного доступа, 7. один или более серверов баз данных, суммарный объем которых измеряется в гига или терабайтах; возможность обработки тысяч и миллионов записей при составлении отчетности, 8. инвариантность (в определенных пределах) к аппаратным и операционным средам функционирования серверных и клиентских приложений, 9. использование стандартизованных языков и протоколов для представления и манипулирования данными.

Основу информационной системы составляют Основу информационной системы составляют "три кита" база данных, как правило, реляционного типа, поддерживающая доступ на основе стандарта SQL, программные средства, обеспечивающие логику обработки данных, База данных Программные средства интерфейс пользователя. Интерфейс пользователя

Назад Назад

Информационной системой (ИС), либо автоматизированной ИС, АИС, будем называть программно аппаратную систему, предназначенную для Информационной системой (ИС), либо автоматизированной ИС, АИС, будем называть программно аппаратную систему, предназначенную для автоматизации целенаправленной деятельности конечных пользователей, обеспечивающую, в соответствии с заложенной в нее логикой обработки, возможность получения, модификации и хранения информации. Ключевым моментом в этом определении является понятие "целенаправленной деятельности". Речь идет о деятельности, направленной на решение конкретной задачи, стоящей перед пользователем (коллективом пользователей).

Регистрация только через секретаря Трудоемкость ручной обработки оперативных данных Абитуриент Очереди абитуриентов Секретарь приемной Регистрация только через секретаря Трудоемкость ручной обработки оперативных данных Абитуриент Очереди абитуриентов Секретарь приемной комиссии Экзаменатор Ручное Трудоемкость ручной обработки управленческих данных Директор института Ответственный секретарь

Информация для формирования ведомости Экзаменационная ведомость Экзамtнационный лист Экзаменационная Журнал регистрации ведомость документов Информация Информация для формирования ведомости Экзаменационная ведомость Экзамtнационный лист Экзаменационная Журнал регистрации ведомость документов Информация о оценках Экзаменационная ведомость Заявление Журнал Экзаменационный регистрации лист документов Информация о документах Экзаменационная ведомость Заполненная ведомость Приказ о зачислении Интерфейс

Некоторые исследователи определяют ИС несколько иным образом. ИС в широком смысле взаимосвязанная совокупность средств, Некоторые исследователи определяют ИС несколько иным образом. ИС в широком смысле взаимосвязанная совокупность средств, методов и персонала, используемых для хранения, обработки и выдачи информации в интересах достижения поставленной цели. Основные отличия такого подхода: 1) ввод пользователей системы "внутрь" ИС, 2) необязательность использования средств вычислительной техники. Такой подход также имеет право на жизнь. Так, например, в нем удобно прослеживать общую историю возникновения и развития систематических средств обработки информации в бизнесе, которая началась, очевидно, в докомпьютерную эпоху.

Рассмотрим примеры некоторых программных средств, являющихся, либо не являющихся ИС. • 1 С Бухгалтерия Рассмотрим примеры некоторых программных средств, являющихся, либо не являющихся ИС. • 1 С Бухгалтерия 8. 0. Используется в целях формирования бухгалтерской отчетности предприятия перед налоговыми органами. Является информационной системой. • MS Excel. Программное средство универсального характера, предназначенное для манипуляций с данными, представленными в табличной форме автоматизации расчетов, формирования разнообразных диаграмм для анализа данных. Не является информационной системой. • Книга MS Excel, содержащая сведения о штатном расписании, работниках предприятия и оснащенная макросами, позволяющими рассчитывать заработную плату и формировать платежные ведомости. Является информационной системой. • Система Axapta Retail комплексной автоматизации деятельности сети розничных магазинов. Является информационной системой. • Реляционная база данных DB 2 фирмы IBM. Не является информационной системой.

Структурно ИС включают в себя: • аппаратное (hardware), • программное (software), • коммуникационное (netware), Структурно ИС включают в себя: • аппаратное (hardware), • программное (software), • коммуникационное (netware), • промежуточного слоя (middleware), • лингвистическое и • организационно технологическое обеспечение.

 • Аппаратное обеспечение ИС включает в себя широкий набор средств вычислительной техники, средства • Аппаратное обеспечение ИС включает в себя широкий набор средств вычислительной техники, средства передачи данных, а также целый ряд специальных технических устройств (устройства графического отображения информации, аудио и видеоустройства, средства речевого ввода и т. д. ). Аппаратное обеспечение является основой любой ИС. • Коммуникационное (сетевое) обеспечение включает в себя комплекс аппаратных сетевых коммуникаций и программных средств поддержки коммуникаций в ИС. Оно имеет существенное значение при создании распределенных ИС и ИС на основе Интернета. • При создании распределенных ИС огромную роль также играет программное обеспечение промежуточного слоя, состоящее из набора программных средств (служб и сервисов), которые управляют взаимодействием распределенных объектов в системе.

Программное обеспечение ИС обеспечивает реализацию функций ввода данных, их размещения на машиночитаемых носителях, модификации Программное обеспечение ИС обеспечивает реализацию функций ввода данных, их размещения на машиночитаемых носителях, модификации данных, доступ к данным, поддержку функционирования оборудования. Программное обеспечение можно разделить на системное (которое венчает процесс выбора аппаратно программного решения, или платформы, как говорят в настоящее время) и пользовательское (которое применяется для решения задач удовлетворения потребностей пользователя в компьютерной среде, а именно, реализует бизнес логику).

Лингвистическое обеспечение ИС предназначено для решения задач формализации смыслового содержания полнотекстовой и специальной информации Лингвистическое обеспечение ИС предназначено для решения задач формализации смыслового содержания полнотекстовой и специальной информации для создания поискового образа данных (профиля). В классическом смысле обычно оно включает процедуры индексирования текстов, их классификацию и тематическую рубрикацию. Зачастую ИС, содержащие сложно структурированную информацию, включают в себя тезаурусы терминов и понятий (средства поддержки метаданных). Сюда можно отнести и создание процессоров специализированных формальных языков конечных пользователей, например языков для манипулирования бухгалтерской информацией и т. д. Чаще всего работам по разработке лингвистического обеспечения не придается должного значения. Подобные упущения чаще всего ведут к неприятию пользователями самой системы и, как следствие, к ее закономерной гибели. Это относится в первую очередь к узко специализированным ИС.

По мере возрастания сложности и масштабов ИС важную роль начинает играть организационно-технологическое обеспечение, которое По мере возрастания сложности и масштабов ИС важную роль начинает играть организационно-технологическое обеспечение, которое соединяет разнородные компоненты (аппаратуру, программы и персонал) в единую систему и обеспечивает процедуры ее управления и функционирования. Недооценка этой составляющей ИС чаще всего приводит к срыву сроков внедрения системы и вывода ее на производственные мощности.

На схеме представлены функции ИС через ее основные структурные компоненты: На схеме представлены функции ИС через ее основные структурные компоненты:

Классификация информационных систем • В зависимости от наших целей и склада мышления, мы можем Классификация информационных систем • В зависимости от наших целей и склада мышления, мы можем по разному классифицировать ИС, • некоторые системы и вовсе не поддаются классификации.

Классификация информационных систем 1. по своему функциональному назначению, 2. по отношению к использованию технических Классификация информационных систем 1. по своему функциональному назначению, 2. по отношению к использованию технических средств, 3. по масштабу и принципам доступа к данным, 4. по отношению к моделям данных.

По своему функциональному назначению: фактографические; документальные; интеллектуальные. По своему функциональному назначению: фактографические; документальные; интеллектуальные.

Фактографические информационные системы Фактографические информационные системы

Фактографические информационные системы Фактографические информационные системы

Фактографические системы • способны однозначно решать поставленные задачи и давать однозначные ответы на запросы Фактографические системы • способны однозначно решать поставленные задачи и давать однозначные ответы на запросы • условно делят на информационно справочные системы, информационно поисковые системы и системы оперативной обработки данных • справочная (или поисковая) система позволяет регистрировать, накапливать, классифицировать, систематизировать и извлекать старые знания (например, телефонные номера, адреса и реквизиты фирм, сведения о кадрах, материалах, заказах, коллекционных ценностях и проч. ). • системы оперативной обработки данных предназначены для решения множества практических задач — управления производством, бухгалтерского учета, управления коммерческой деятельностью фирмы и т. д.

Фактографические информационные системы • содержат формализованные данные об объектах фиксированной длины, • записи в Фактографические информационные системы • содержат формализованные данные об объектах фиксированной длины, • записи в этой информационной системе имеют фиксированный формат, • каждая запись в такой ИС имеет ключ (ключевое слово), которое однозначно идентифицирует каждую запись в файловой информационной системе. Центральное функциональное звено фактографических информационных систем – системы управления базами данных (СУБД). Они используются не только для реализации справочных функций, но и для решения задач обработки данных (ввод, хранение, сортировка, отбор, группировка записей и другие).

Фактографические ИС можно классифицировать по признаку: • универсальные • специализированные. Фактографические ИС можно классифицировать по признаку: • универсальные • специализированные.

Универсальные системы • могут работать с любой предметной областью, с любой “начинкой”, если данные Универсальные системы • могут работать с любой предметной областью, с любой “начинкой”, если данные организованы в соответствии с принципами и формализованы согласно дополнительным требованиям конкретной ИС.

Специализированные ИС • широко применяются в материальном производстве, • банковском деле, • криминалистике, • Специализированные ИС • широко применяются в материальном производстве, • банковском деле, • криминалистике, • научных исследованиях.

Документальные информационные системы Документальные информационные системы

Документальные информационные системы Документальные информационные системы

Слово “документ” происходит от латинского слова “documentum” свидетельство. Документ является основной единицей хранения и Слово “документ” происходит от латинского слова “documentum” свидетельство. Документ является основной единицей хранения и обработки документальных информационных систем. Исторически сложилось так, что за системами, ориентированными на работу с текстовыми документами, укоренился термин информационно-поисковые системы (ИПС)

Основной функцией любой документальной ИПС (ДИПС) является информационное обеспечение потребителей на основе выдачи ответов Основной функцией любой документальной ИПС (ДИПС) является информационное обеспечение потребителей на основе выдачи ответов на их запросы.

Запрос Информа ционный поиск Ответ на запрос (требуемые данные) Список документов или объектов, в Запрос Информа ционный поиск Ответ на запрос (требуемые данные) Список документов или объектов, в какой-то мере удовлетворяющих сформулированным в запросе условиям Документальная ИПС При проведении информационного поиска в системе рассматривается не фактическая информационная потребность пользователя, а только информационный запрос, в ответ на который выдаются те или иные документы системы.

Для выражения этих отношений в теории ДИПС введены два фундаментальных понятия: пертинентность и релевантность. Для выражения этих отношений в теории ДИПС введены два фундаментальных понятия: пертинентность и релевантность. Под пертинентностью понимается соответствие смыслового содержания документа информационной потребности потребителя. Документы, содержание которых удовлетворяет информационной потребности, называются пертинентными. Релевантность представляет собой соответствие содержания документа информационному запросу в том виде, в каком он сформулирован, а документы, содержание которых отвечает запросу потребителя, носят название релевантных.

В состав типичной ДИПС входят четыре подсистемы: • Подсистема ввода и регистрации. • Подсистема В состав типичной ДИПС входят четыре подсистемы: • Подсистема ввода и регистрации. • Подсистема обработки. • Подсистема хранения. • Подсистема поиска.

Запрос ПП Подсистема ввода и регистрации Подсистема обработки ПОД Словарь Индекс Подсистема поиска КСС Запрос ПП Подсистема ввода и регистрации Подсистема обработки ПОД Словарь Индекс Подсистема поиска КСС Идентификаторы релевантных документов подаются с выхода подсистемы поиска на вход подсистемы хранения, которая осуществляет выдачу пользователю самих релевантных документов РЕЛЕВАНТНЫЕ ДОКУМЕНТЫ Подсистема хранения ДИПС База документов Общая функциональная структура ДИПС

Документальные информационные системы • обслуживают принципиально иной класс задач, которые не предполагают однозначного ответа Документальные информационные системы • обслуживают принципиально иной класс задач, которые не предполагают однозначного ответа на поставленный вопрос. • Базу данных таких систем образует совокупность неструктурированных текстовых документов (статьи, книги, рефераты, тексты законов и т. п. ), снабженная тем или иным формализованным аппаратом поиска.

Документальные информационные системы • содержат неформализованные тексты документов, • служат для работы с документами Документальные информационные системы • содержат неформализованные тексты документов, • служат для работы с документами на естественном языке – монографиями, публикациями в периодике, сообщениями пресс агенств, текстами законодательных актов, • обеспечивают смысловой анализ при неполном, приближенном представлении смысла. Основной задачей этих информационных систем является хранение и поиск документов по их содержанию.

Документальные информационные системы • Цель системы выдать в ответ на запрос пользователя список документов, Документальные информационные системы • Цель системы выдать в ответ на запрос пользователя список документов, в какой то мере удовлетворяющих сформулированным в запросе условиям. Например, выдать список всех статей, в которых встречается слово “информационная система”. • Принципиальной особенностью документальной системы является ее способность, с одной стороны, выдавать ненужные пользователю документы (например, где “информационная система” употреблена в ином смысле, чем предполагалось), а с другой — не выдавать нужные (например, если автор употребил какой то синоним или ошибся в написании). • Документальная система должна уметь по контексту определять смысл того или иного термина.

Совместное использование Некоторые программные пакеты дают возможность пользователю спроектировать своеобразный гибрид фактографической и документальной Совместное использование Некоторые программные пакеты дают возможность пользователю спроектировать своеобразный гибрид фактографической и документальной системы; т. е. работать с неструктурированными блоками информации, снабженными структурированными описателями.

Любая информационная система (ИС) выполняет следующие функции: 1. воспринимает вводимые пользователем информационные запросы и Любая информационная система (ИС) выполняет следующие функции: 1. воспринимает вводимые пользователем информационные запросы и необходимые исходные данные, 2. обрабатывает введенные и хранимые в системе данные в соответствии с известным алгоритмом и формирует требуемую выходную информацию. С точки зрения реализации перечисленных функций ИС можно рассматривать как фабрику, производящую информацию, в которой: • заказом является информационный запрос, • сырьем - исходные данные, • продуктом - требуемая информация, • а инструментом (оборудованием) - знание, с помощью которого данные преобразуются в информацию. Программа = Алгоритм (Правила преобразования данных + Управляющая структура) + Структура данных

Интеллектуальные информационные системы • содержат формализованные сведения из различных областей знания, • базы знаний Интеллектуальные информационные системы • содержат формализованные сведения из различных областей знания, • базы знаний содержат факты и правила, • факты представляют собой изменяющуюся информацию, например, факты, характеризующие состояние объекта, • правила являются долговременной информацией о том, как порождать новые факты. • примерами могут быть обучающие системы, системы машинного перевода, экспертные системы в разных отраслях (в том числе экспертные системы экономического анализа деятельности предприятия, инвестиционного проектирования, систем управления бизнес процессами).

По отношению к использованию технических средств информационные системы делятся на: • локальные, • распределенные. По отношению к использованию технических средств информационные системы делятся на: • локальные, • распределенные. Локальные размещаются в памяти одной ЭВМ, Распределенные – на нескольких, независимо от того, находятся ли они рядом или удалены друг от друга территориально. вернуться

Концепция распределенных ИС Возникла в 70 -годах в связи с решением следующих проблем: • Концепция распределенных ИС Возникла в 70 -годах в связи с решением следующих проблем: • при создании информационных систем больших объемов приходится считаться с ограничениями со стороны ЭВМ относительно объемов внешней памяти и скорости обработки данных; • для описания некоторой предметной области необходимы данные; как правило, даже для описания одной предметной области данные территориально распределены, что создает большие трудности по сбору информации и централизованному сопровождению информационных систем; • часть информации, содержащаяся в информационной системе, не всегда активно используется всеми пользователями информационные системы, в результате чего возникает вопрос об эффективности использования информационные системы.

Локальные информационные системы • приближены к месту возникновения данных, либо к месту их наибольшего Локальные информационные системы • приближены к месту возникновения данных, либо к месту их наибольшего использования, • легкость сопровождения информационных систем. • обеспечение доступа к информации для всех ее пользователей и возможность ее получения для решения пользователями своих локальных задач. локальные ЭВМ пользователей стали объединяться в сети ЭВМ.

Определение Совокупность локальных информационных систем, функционирующих на ЭВМ, входящих в сеть ЭВМ, представляет собой Определение Совокупность локальных информационных систем, функционирующих на ЭВМ, входящих в сеть ЭВМ, представляет собой распределенную информационную систему.

Распределенная информационная система • каждая локальная информационная система имеет свою локальную систему управления, • Распределенная информационная система • каждая локальная информационная система имеет свою локальную систему управления, • функционирует под управлением распределенной системы управления, которая оснащается специальными каталогами, включающими сведения о структуре сети, о локальных системах управления и локальных информационных систем, а также специальным программным обеспечением.

По масштабу и принципам доступа к данным: 1. настольные (автономные) или “персональные” ИС; 2. По масштабу и принципам доступа к данным: 1. настольные (автономные) или “персональные” ИС; 2. простые сетевые ИС, построенные по технологии “файл сервер”; 3. мощные информационные системы в архитектуре “клиент сервер”. вернуться

По отношению к моделям данных информационные системы делятся на: • сетевые, • иерархические, • По отношению к моделям данных информационные системы делятся на: • сетевые, • иерархические, • реляционные. поддерживают систему управления на логическом уровне. вернуться

Сетевая модель • данные представлены в виде произвольного графа. Для этой модели характерны все Сетевая модель • данные представлены в виде произвольного графа. Для этой модели характерны все операции на множестве графов.

Сетевая модель Сетевая модель

Иерархическая модель • данные представлены в виде набора древовидных структур, • среди операций работы Иерархическая модель • данные представлены в виде набора древовидных структур, • среди операций работы с иерархическими структурами есть операции перемещения по иерархическим путям вниз и вверх по деревьям.

Иерархическая модель Иерархическая модель

Реляционная модель В реляционной модели данные представлены в виде таблиц (отношений). Реляционная модель В реляционной модели данные представлены в виде таблиц (отношений).

Объектно-ориентированная модель • В последнее время добавилась к трем традиционным моделям данных • Данные Объектно-ориентированная модель • В последнее время добавилась к трем традиционным моделям данных • Данные представлены в виде объектов и отношений между ними

Информационно поисковый язык Информационно поисковый язык

Автоматизация процесса информационного поиска потребовала создания информационно поисковых языков. Информационно-поисковый язык (ИПЯ) – это Автоматизация процесса информационного поиска потребовала создания информационно поисковых языков. Информационно-поисковый язык (ИПЯ) – это специально созданный искусственный язык, предназначенный для выражения содержания документов и запросов или описания фактов с целью их последующего поиска. ИПЯ создается на базе естественного языка, однако отличается от него компактностью, наличием четких грамматических правил и отсутствием семантической неоднозначности.

Основными требованиями, предъявляемыми к ИПЯ, являются следующие: 1. однозначность: каждая запись на ИПЯ должна Основными требованиями, предъявляемыми к ИПЯ, являются следующие: 1. однозначность: каждая запись на ИПЯ должна иметь только один смысл, одно толкование, а любое понятие, смысл должны получить единообразную запись средствами ИПЯ; 2. достаточная семантическая сила: способность отражать с необходимой полнотой и точностью смысловое содержание документов и запросов определенной предметной области; 3. открытость: обеспечение возможности корректировки языка.

Все ИПЯ принято условно делить на: • Классификационные. • Дескрипторные. Принципиальная разница между данными Все ИПЯ принято условно делить на: • Классификационные. • Дескрипторные. Принципиальная разница между данными типами языков заключена в процедуре построения предложений (фраз) языка.

В основе ИПЯ классификационного типа лежит систематическая классификация понятий, то есть классификация, отражающая смысловые В основе ИПЯ классификационного типа лежит систематическая классификация понятий, то есть классификация, отражающая смысловые отношения между понятиями. Классификацией называется распределение понятий (предметов или отношений) по классам на основании общего признака, присущего одним понятиям и отличающего их от других понятий.

В классификациях непосредственно подчиняющее понятие называют родом, непосредственно подчиненное – видом по отношению к В классификациях непосредственно подчиняющее понятие называют родом, непосредственно подчиненное – видом по отношению к роду (родовому понятию). Такие отношения называют родовидовыми или иерархическими. Иерархические классификации используются для систематизации литературы и для ее поиска по систематическим каталогам в библиотеках. Для каждого предмета или темы в библиотечных системах предусмотрен соответствующий раздел или рубрика. Рубрикатор является частным случаем классификационного ИПЯ.

Кроме иерархических классификаций используются так называемые фасетные классификации. В их основу положено два принципа: Кроме иерархических классификаций используются так называемые фасетные классификации. В их основу положено два принципа: разделение одного и того же множества предметов и явлений по разным основаниям, то есть выделение нескольких иерархических деревьев для одного и того же множества (категорий, фасетов). В отличие от иерархических, в фасетных классификациях кроме основного деления на ряд классов осуществляется второе разбиение всего множества предметов и явлений по категориям или фасетам.

Поисковый аппарат документальных информационнопоисковых систем Поисковый аппарат документальных информационнопоисковых систем

Модель поиска текстовой информации характеризуется четырьмя параметрами: 1. представлением документов и запросов; 2. критерием Модель поиска текстовой информации характеризуется четырьмя параметрами: 1. представлением документов и запросов; 2. критерием смыслового соответствия; 3. методами ранжирования результатов запроса; 4. механизмами обратной связи, обеспечивающими оценку релевантности пользователем.

Булева модель представляет документы с помощью набора терминов, присутствующих в индексе, каждый из которых Булева модель представляет документы с помощью набора терминов, присутствующих в индексе, каждый из которых рассматривается как булева переменная. При наличии термина в документе соответствующая переменная принимает значение True.

Булева модель Запросы формулируются как произвольные булевы выражения, связывающие термины с помощью логических операций. Булева модель Запросы формулируются как произвольные булевы выражения, связывающие термины с помощью логических операций. Сочетание терминов характеризует документ. Весовые коэффициенты не вводятся. Например, он может выглядеть следующим образом: ((информационная and система) or ИПС) not СУБД и означать найди все документы, которые содержат одновременно слова "информационная" и "система", либо слово "ИПС", но не содержат слова "СУБД".

Булева модель Мерой соответствия запроса документу служит значение статуса выборки (RSV, retrival status value). Булева модель Мерой соответствия запроса документу служит значение статуса выборки (RSV, retrival status value). В булевой модели RSV равно либо 1, если для данного документа вычисление выражения запроса дает True, либо 0 в противном случае. Все документы с RSV = 1 считаются релевантными запросу.

Булева модель Эта модель проста и часто используется во многих коммерческих системах. Она позволяет Булева модель Эта модель проста и часто используется во многих коммерческих системах. Она позволяет пользователю вводить довольно сложные запросы. Однако эффективность поиска в таких моделях невысока, так как терминам нельзя присвоить весовые коэффициенты и ранжировать результаты поиска невозможно. Для повышения эффективности в таких моделях применяют обратную связь с пользователем. Именно пользователь выбирает из предложенного системой списка релевантные документы.

Модель нечетких множеств основывается на теории нечетких множеств, допускающей частичную принадлежность элемента тому или Модель нечетких множеств основывается на теории нечетких множеств, допускающей частичную принадлежность элемента тому или иному множеству. Здесь логические операции переопределены таким образом, чтобы учесть возможность неполной принадлежности множеству, а обработка запросов пользователя выполняется аналогично булевой модели. Однако и эта модель также мало эффективна и требует вмешательства пользователя.

Наиболее распространенной является Пространственно-векторная модель основана на предположении, что совокупность документов можно представить набором Наиболее распространенной является Пространственно-векторная модель основана на предположении, что совокупность документов можно представить набором векторов в пространстве, определяемом базисом из n нормализованных векторов терминов.

Пространственно-векторная модель Значение первого компонента вектора, представляющего документ, отражает вес термина в нем. Запрос Пространственно-векторная модель Значение первого компонента вектора, представляющего документ, отражает вес термина в нем. Запрос пользователя также представляется n мерным вектором. Показатель RSV, определяющий соответствие документа запросу, задается скалярным произведением векторов запроса и документа. Чем больше RSV, тем выше релевантность документа запросу.

Пространственно-векторная модель Эта модель позволяет реализовать обратную связь пользователя и системы, однако она не Пространственно-векторная модель Эта модель позволяет реализовать обратную связь пользователя и системы, однако она не обладает простотой общения системы и пользователя, присущей булевой модели. Пользователю достаточно сложно сформулировать запрос.

Вероятностные модели Впервые идеи таких моделей были предложены в 1960 году. Пространственно векторная модель Вероятностные модели Впервые идеи таких моделей были предложены в 1960 году. Пространственно векторная модель не учитывает взаимосвязи между терминами. Вероятностная модель позволяет учесть все взаимосвязи и определить такие основные параметры, как веса терминов запросов и форма соответствия “запросдокумент”.

Вероятностные модели Данная модель базируется на двух главных параметрах: Pr(rel) и Pr(nonrel), то есть Вероятностные модели Данная модель базируется на двух главных параметрах: Pr(rel) и Pr(nonrel), то есть на вероятности релевантности и не релевантности документа запросу пользователя, которые вычисляются на основе вероятностных весовых коэффициентов терминов и фактического присутствия терминов в документе. Релевантность бинарное свойство, и поэтому Pr(rel) = 1 - Pr(nonrel). В этой модели применяются два стоимостных параметра: a 1 и a 2. Они характеризуют потери, связанные с включением в результат нерелевантного документа и пропуском релевантного документа.

Вероятностная модель Эта модель требует определения вероятности вхождения термина в релевантные и нерелевантные части Вероятностная модель Эта модель требует определения вероятности вхождения термина в релевантные и нерелевантные части совокупности документов, оценить которые сложно.

Булева модель поиска Булева модель является классической и широко используемой моделью представления информации, базирующейся Булева модель поиска Булева модель является классической и широко используемой моделью представления информации, базирующейся на теории множеств, и, следовательно, и моделью информационного поиска, базирующейся на математической логике. В булевой модели запрос пользователя представляет собой логическое выражение, в котором ключевые слова (термы запроса) связаываются операторами из теории множеств и соответствующими им логическими операторами AND, OR и NOT. В различных поисковых системах использующих булеву модель, в частности, в Интернет пользователи при формировании запросов могут просто перечислять ключевые слова, не указывая в явном виде логических операций. Чаще всего при этом предполагается по умолчанию считается, что все ключевые слова соединяются логической операцией AND в этих случаях в результаты поиска включаются только те документы, которые содержат одновременно все ключевые слова запроса.

Архитектура ИПС, основанных на булевой модели поиска При использовании булевой модели база данных включает Архитектура ИПС, основанных на булевой модели поиска При использовании булевой модели база данных включает индекс, организуемый в виде инвертированного массива, в котором для каждого терма из словаря базы данных содержится список документов, в которых этот терм встречается. В индексе могут храниться также частоты встречаемости данного терма в каждом документе, что позволяет сортировать список по убыванию частоты встречаемости. Классическая база данных, соответствующая булевой модели, организована таким образом, чтобы по каждому терму можно быстро получить доступ к соответствующему списку документов. Кроме того, структура инвертированного массива обеспечивает его быструю модификацию при включении в базу данных новых документов. В связи с этими требованиями, инвертированный массив часто реализуется в виде B дерева. Одной из удачных реализаций структуры базы данных ИПС, основанной на булевой модели, была признана система STAIRS (Storage and Information Retrieval System).

Структура базы данных STAIRS База данных информационно поисковых систем этой традиционной архитектуры состоит из Структура базы данных STAIRS База данных информационно поисковых систем этой традиционной архитектуры состоит из следующих основных таблиц: текстовой, содержащей текстовую часть всех документов; таблицы указателей текстов, включающей указатели местонахождения документов в текстовой таблице, а заодно и форматные поля всех документов; словарной, содержащей все уникальные слова, встречающиеся в полях документов, то есть те слова, по которым может осуществляться поиск. Слова могут быть связаны в синонимические цепочки; инверсной, содержащей списки номеров документов и координаты встречаемости отдельных слов в полях документов.

Поиск в БД, соответствующей булевой модели Поиск термина в базе данных: Происходит обращение к Поиск в БД, соответствующей булевой модели Поиск термина в базе данных: Происходит обращение к словарной таблице, по которой определяется, входит ли слово в состав словаря БД. Если входит, то определяется ссылка на цепочку появлений этого слова в документах. Происходит обращение к инверсной таблице: определяются координаты всех вхождений терма в текстовую часть БД. По номеру документа происходит обращение к записи таблицы указателей текстов. Каждая запись этого файла соответствует одному документу в базе данных. По номеру документа происходит прямое обращение к фрагменту текстовой таблицы документу и последующий его вывод. В случае, когда обрабатывается не один термин, а некоторая их комбинация, в результате отработки поиска по каждому термину запроса формируется массив записей, соответствующих вхождению этого термина в базу данных. После окончания формирования массивов результатов поиска происходит выявление релевантных документов путем выполнения теоретико множественных операций над записями этих массивов.

Поисковое предписание и поисковый образ документа отражают лишь основное смысловое содержание поступающих сообщений в Поисковое предписание и поисковый образ документа отражают лишь основное смысловое содержание поступающих сообщений в сокращенном виде. Поэтому метод информационного поиска, основанный на сопоставлении ПП с ПОД, не в состоянии полностью обеспечить отыскания всех документов отвечающих информационному запросу. Это приводит к тому, что часть документов, отвечающих запросу, то есть релевантных ему, остается не выданной потребителю. В то же время во множестве выданных ему документов присутствуют и такие, которые не отвечают запросу, то есть не являются релевантными. Таким образом, практически в любой ДИПС могут быть два типа ошибок:

Два типа ошибок: • ошибки 1 -го рода (или пропуски цели): невыдача потребителю фактически Два типа ошибок: • ошибки 1 -го рода (или пропуски цели): невыдача потребителю фактически релевантных его запросу документов; • ошибки 2 -го рода (или ложная тревога, иначе шум): выдача потребителю нерелевантных документов, которые не отвечают поставленному запросу. Наличие ошибок 1 го и 2 го рода в реальной системе обуславливает разбиение всего массива документов системы по отношению к запросу на 4 подмассива:

Разбиение пространства документов при исполнении каждого запроса Разбиение пространства документов при исполнении каждого запроса

Существуют следующие показатели эффективности ДИПС (см. материал самостоятельно в учебном пособии «ИС» ): Коэффициент Существуют следующие показатели эффективности ДИПС (см. материал самостоятельно в учебном пособии «ИС» ): Коэффициент полноты p, характеризующий долю выданных релевантных документов во всем массиве релевантных документов: p = a/(a+c). Коэффициент точности n, характеризующий долю выданных релевантных документов во всем массиве выданных документов: n = a/(a+b). Коэффициент шума e, характеризующий долю выданных нерелевантных документов во всем массиве выданных документов: e = b/(a+b) = 1 n. Коэффициент осадка q, характеризующий долю выданных нерелевантных документов во всем массиве нерелевантных документов: q = b/(b+d). Коэффициент специфичности k, характеризующих долю не выданных нерелевантных документов во всем массиве нерелевантных документов: k = d/(b+d).

Наряду с этими показателями, основанными на сопряжении релевантности и выдачи, используют также и другие: Наряду с этими показателями, основанными на сопряжении релевантности и выдачи, используют также и другие: 1. быстродействие ДИПС (интервал времени между моментом формулировки запроса и получением ответа на него); 2. пропускная способность (оценивается количеством вводимых документов и количеством ответов в единицу времени при заданных значениях коэффициента полноты и точности); 3. производительность (оценивается количеством пользователей системы и частотой обращения с их стороны); 4. надежность работы (оценивается вероятность того, что система будет выполнять свои функции при заданных условиях в течение требуемого времени); 5. тип запросов, обслуживаемых системой.

В качестве примеров ИПС рассмотрим наиболее популярные и типичные системы, использующиеся в Сети Alta. В качестве примеров ИПС рассмотрим наиболее популярные и типичные системы, использующиеся в Сети Alta. Vista – один из самых больших и самых быстрых поисковых серверов. Осуществляет поиск в WEB и USENET. С помощью этой поисковой системы можно найти что угодно и где угодно в Web и Usenet, но при создании запроса нужно быть достаточно точным, в противном случае в результате поиска вы получите слишком много информации. Достоинства: быстрота, большой индекс, позволяющий найти много страниц, огромные возможности расширенного поиска, имеется функция «похожие страницы» , хорошо работает функция устранения повторяющихся ссылок. Имеет русифицированный интерфейс (http: //comtec. ru/alta. html) с правильным индексирование русскоязычных ресурсов и наличием учета морфологии русского языка. Недостатки: слабое ранжирование результатов поиска, не поддерживает тематического поиска. При русскоязычном запросе поиск оказывается практически не возможным, т. к. пользователь отправляется на Web сайты электронной коммерции.

Yahoo! Это каталог Web с возможностью полнотекстового поиска на сервере Alta. Vista. Один из Yahoo! Это каталог Web с возможностью полнотекстового поиска на сервере Alta. Vista. Один из крупнейших серверов в мире и самый популярный сетевой портал в мире. « Yahoo » в переводе означает «деревенщина» . Сетевой портал под таким названием был создан в конце 1994 г. студентами Стэнфордского университета (США) Дэвидом Фило ( David Filo ) и Джерри Янгом ( Jerry Yang ). Проводит поиск в Web и Usenet; позволяет находить электронные адреса людей, содержит текущие новости, карты городов. Каталог полезен с той точки зрения, что дает представление о том, как много различной информации находится в Web. Достоинства: Yahoo! представляет ссылки на другие поисковые системы. , обладает полнотой списка категорий и простотой поиска, отлично работает функция устранения повторяющихся ссылок, хорошо структурирован. Yahoo! Имеет сервис My. Yahoo , обеспечивающий предоставление зарегистрированным пользователям отдельной Web страницы, на которой пользователь может размещать любую информацию, соответствующую его интересам. Недостаток – встречаются устаревшие ссылки.

Euro. Seek, SEARCH Euro. Seek каталог с возможностью поиска. Предоставляет списки по регионам, предметным Euro. Seek, SEARCH Euro. Seek каталог с возможностью поиска. Предоставляет списки по регионам, предметным областям, изданиям. Возможен поиск на русском языке. Имеет русскоязычный интерфейс. (http : // www. euroseek. com / page ? ilang = ru). SEARCH поиск в Web и Use. Net. Позволяет искать по другим поисковым системам: Alta. Vista, YAHOO, LYCOS, Hot. Bot или Info. Seek. Предоставляет алфавитный список других поисковых систем и имеет удобную утилиту, которая определяет, какая поисковая система сможет отыскать то, что необходимо.

Info. Seek Ultra простой в использовании поисковый сервер с каталогом Web с аннотацией узлов. Info. Seek Ultra простой в использовании поисковый сервер с каталогом Web с аннотацией узлов. Осуществляет поиск в Web, Use. Net, FAQ (Часто задаваемые вопросы), по текущим новостям, электронным адресам, картам и спискам компаний. Предназначена для тематического поиска ресурсов в Интернет, компаний, людей и электронных адресов. Достоинства: содержит поисковую и справочную системы и полезен, если необходимо искать не в Web или Use. Net; обеспечивает широкий охват тем, обладает большим числом полезных вспомогательных инструментов. Сервер Info. Seek обеспечивается доступ к настраиваемой странице новостей. Предоставляет возможность поиска по ключевым словам и фразам Ориентирован как на опытных пользователей, так и на новичков. Недостатки – менее полное представление результатов поиска, плохо организован интерфейс

Современное состояние В последние годы в связи с изменением общей структуры мирового информационного потока Современное состояние В последние годы в связи с изменением общей структуры мирового информационного потока наметился ряд тенденций в развитии классических информационно поисковых систем. К этим тенденциям можно отнести следующие: • быстрое развитие связей между отдельными информационными элементами, так и внутри самих элементов (межсетевые связи и т. п. ); • усложнение структуры информационных объектов (внедренная графика, мультимедиа); • резкое нарастание объемов обрабатываемой документальной информации и ее динамическое изменение; • слияние различных информационных систем в гетерогенные сети с унифицированным пользовательским интерфейсом при базировании на технологии “клиент сервер”.

Современная ИПС должна быть легко масштабируемой, переносимой, тесно интегрируемой с мировыми сетями и поддерживать Современная ИПС должна быть легко масштабируемой, переносимой, тесно интегрируемой с мировыми сетями и поддерживать ряд стандартов как в части форматов хранимых данных, так и в части доступа к этим данным. В России исторически сложились и развиваются два направления развития ИПС: • классические ИПС, ориентированные на обработку больших массивов текстовой и фактографической документальной информации • и прикладные ИПС, ориентированные на обработку экспериментальных данных в той или иной области знаний.

К первому типу относятся: проект “Разработка комплекса информационных услуг на основе банка данных отечественных К первому типу относятся: проект “Разработка комплекса информационных услуг на основе банка данных отечественных и зарубежных публикаций по науке и технике”, полнотекстовая документальная информационная система “ODB TEXT” и другие. Ко второму: гипермедийная ИС общего пользования с автоматическим накоплением данных, поступающих с метеорологических спутников, экспертная система поддержки экспериментов в области физико химической кинетики, компьютерная база геополей Урала, виртуальные энциклопедические и справочные издания и другие.

Спасибо за внимание!!! Спасибо за внимание!!!

Оперативная • информация нужна на нижнем уровне управления предприятием в повседневной работе. • представляет Оперативная • информация нужна на нижнем уровне управления предприятием в повседневной работе. • представляет собой часто обновляемую, первичную, рутинную информацию. Оперативная информация – основа в информационной иерархии ИС, поэтому ее обработка автоматизируется в первую очередь. назад

Тактическая • информация получается путем обобщения информации оперативного уровня и предназначена для руководителей среднего Тактическая • информация получается путем обобщения информации оперативного уровня и предназначена для руководителей среднего звена. • автоматизация информации оперативного уровня существенно ускоряет подготовку тактической информации, которая выдается в виде отчетов, различных вариантов решения на основании информационного запроса. назад

Стратегическая • информация, предназначенная для руководства, • получается в результате обработки оперативной и тактической Стратегическая • информация, предназначенная для руководства, • получается в результате обработки оперативной и тактической информации. • содержит краткие, но содержательные сводки, отчеты, прогнозы. • на ее основе осуществляются долгосрочное планирование и разработка бизнес плана предприятия в целом. назад

Экспертная система ЭС это комплекс программно аппаратных средств, основанных на алгоритмах искусственного интеллекта и Экспертная система ЭС это комплекс программно аппаратных средств, основанных на алгоритмах искусственного интеллекта и современных средствах вычислительной техники, который использует знания, опыт, и оправдавшие себя техники для решения специализированных проблем, требующих способностей людей экспертов. Главная особенность ЭС способность перерабатывать знания людей экспертов в своей области. Именно их профессиональные знания, навыки, технологические приемы, эвристические решения и опыт, формализуемые в процессе разработки системы. ЭС потенциально содержат возможности по предсказанию сценариев развития, самообучению и преобразованию информации в знания. назад

Система поддержки принятия решений Принятие решения - акт целенаправленного воздействия на объект управления, основанный Система поддержки принятия решений Принятие решения - акт целенаправленного воздействия на объект управления, основанный на анализе ситуации, определении цели, разработке программы достижения этой цели. Система поддержки принятия решений – это компьютерная система, позволяющая лицу, принимающему решение, сочетать собственные субъективные предпочтения с компьютерным анализом ситуации при выработке рекомендаций в процессе принятия решения. Главной особенностью информационной технологии поддержки принятия решений является качественно новый метод организации взаимодействия человека и компьютера. Выработка решения, что является основной целью этой техноло гии, происходит в результате итерационного процесса, в котором участвуют: • Система поддержки принятия решений в роли вычислительного звена и объекта управления; • человек как управляющее звено, задающее входные данные и оценивающее получен ный результат вычислений на компьютере. назад

Подсистемы ввода и регистрации документов решает следующие задачи: • создание электронных копий бумажных документов Подсистемы ввода и регистрации документов решает следующие задачи: • создание электронных копий бумажных документов (например, сканирование с последующим распознаванием текста или ввод с клавиатуры); • обеспечение подключения к каналам доставки электронных документов; • распознавание, а при необходимости и преобразование формата электронных документов; • присвоение электронным документам уникальных назад идентификаторов (регистрация);

Жесткий диск Поэтому для хранения документов применяют средства сжатия и быстрого поиска информации. В Жесткий диск Поэтому для хранения документов применяют средства сжатия и быстрого поиска информации. В этом случае подсистема хранения представляет собой совокупность стандартных или специализированных средств архивации, управления данными, обеспечивающих возможность доступа к данным по предъявляемому идентификатору. Недостатки: 1. неэффективность использования дискового пространства 2. низкая скоростью доступа при большом количестве файлов назад

Критерий смыслового соответствия (ККС) – это набор правил, по которым данная ДИПС определяет степень Критерий смыслового соответствия (ККС) – это набор правил, по которым данная ДИПС определяет степень смысловой близости между поисковым образом документа (ПОД) и поисковым предписанием (ПП). назад

Кладовщик_1 **** Назад Кладовщик_1 **** Назад

Интерфейс Назад Интерфейс Назад