
лекция6.ppt
- Количество слайдов: 28
Лекция 6 Базы знаний и геоинформационные системы Содержание лекции • История возникновения, основные понятия, структура систем БЗ. Виды и способы представления знаний. • Инструментальные средства БЗ: языки представления знаний, пустые системы, интегрированные гибридные среды, средства построения обучающих систем. • История возникновения и возможности ГИС. Структура ГИС. • Виды объектов: точечные, линейные, площадные, обобщенные по площади, непрерывные явления. • Компоненты ГИС. Развитие и классификация ГИС.
6. 1. История возникновения, основные понятия, структура систем БЗ Разработка систем баз знаний (СБЗ) и экспертных систем (ЭС) входит в круг задач искусственного интеллекта. Термин искусственный интеллект был предложен в 1956 г. Джоном Маккарти( штат Нью-Гемпшир США) на Дортмундской конференции. Существует несколько интеллекту: определений искусственному 1) Искусственная система, имитирующая решение человеком сложных задач в процессе его жизнедеятельности; 2) Направление научных исследований, сопровождающих и обуславливающих создание систем представления знаний и работы с ними.
Считают, что ЭС рационально использовать в трех режимах, в первом из которых пользователь выступает как клиент – он ставит проблему и получает ответы; во втором пользователь выступает как педагог, внося в систему новые знания; в третьем – как ученик, получая от системы знания, которые в ней находятся в момент общения. При этом для всех режимов желателен интерфейс, работающий на основе естественного языка. Развитие ЭС систем связано с появлением новой методологии – «инженерии знаний» . «Инженерия знаний» - это методы кодирования информации, относящейся к определенной области знаний, позволяющие внести закодированную информацию в программы, решающие задачи в этой области.
При принятии решения о целесообразности разработки ЭС необходимо учитывать 4 фактора: 1) Задача описывается с использованием специальных знаний, суждений и опыта, выраженных в форме четких правил; 2) Область задачи достаточно узкая, не требует обращения к смежным сферам знаний и четко определена; 3) В распоряжении разработчиков есть специалистыэксперты в данной области, которые хотят и могут поделиться своими знаниями, опытом и методами принятия решений; 4) Возможна высокая эффективность по результатам разработки.
6. 2. Структура СБЗ и ЭС состоят из трех основных элементов. Система, базирующаяся на знаниях (СБЗ) База знаний (БЗ) Механизм получения решений (МПР) Интерфейс (ИФ) Основой СБЗ и ЭС является база знаний (или источник знаний), содержащая факты и эвристические правила принятия решения. Классификация знаний В системе знаний выделяют: понятия (математические и нематические); факты; правила, зависимости, законы, связи; алгоритмы и процедуры.
Профессор С. С. Лавров (Новосибирский технический университет) предлагает различать алгоритмические и неалгоритмические знания. Алгоритмические (или процедурные) знания – это алгоритмы (программы, процедуры), вычисляющие функции, выполняющие преобразования, решающие точно определенные задачи. Базой алгоритмических знаний можно считать любое собрание (библиотеку) программ. Неалгоритмические знания состоят, прежде всего, из мысленных объектов, называемых понятиями. Понятие обычно имеет имя (возможно несколько именсинонимов), определение, структуру (части, элементы и т. п. ); оно связано с другими понятиями и входит в какую-то систему понятий.
Факты играют роль элементарных «единиц» знания (простых утверждений о характеристиках объекта. Правила служат для выражения связей между фактами и их комбинациями. Связи указывают на наличие каких-либо отношений между понятиями или утверждениями о свойствах понятий. Механизм получения решений (МР) МР дает возможность извлекать из БЗ ответы на вопросы, получать решения задач, формулируемых в терминах понятий, хранящихся в БЗ. Обычно это «частные» задачи и вопросы такого рода: «Дано то-то, найти то-то» ; найти объекты удовлетворяющие такому-то условию» ; Какие действия выполнить в такой-то ситуации? » .
Способы представления знаний Методы МР тесно связаны со способами представления знаний. Распространены следующие способы: правила, фреймы, семантические и нейронные сети. Представление знаний, основанных на правилах построено на использовании выражений вида ЕСЛИ (условие) – ТО (действие). Когда текущая ситуация (факты) в задаче удовлетворяют или согласуются с частью правила ЕСЛИ, то выполняется действие, определенное частью ТО. Семантические сети основаны на представлении знаний, связанных в сетевые структуры. Узлы в них соответствуют объектам, концепциям или событиям, а дуги – используются для представления иерархии связей и наследования свойств. При их применении для естественных языков, обычно используют дуги типа: является; представляет собой часть.
Фрейм, также как и семантические сети, является структурой знаний, представленной сетью узлов и связей между ними и предназначенной для описания стереотипных ситуаций. К каждому фрейму присоединяется несколько видов информации. Часть этой информации – о том, как использовать фрейм. Часть о том, что можно ожидать далее. Часть о том, что следует делать, если эти ожидания не подтвердятся. Верхний уровень фрейма фиксирован и содержит знания, всегда истинные для ситуаций, представленных им. На более низких уровнях находятся слоты – «дыры» , которые не обязательно заполнены. «Понимание» , описание конкретной ситуации происходит путем приспособления к ней некоторого фрейма с помощью заполнения слотов подходящими конкретными данными. фрейм представляется в виде: [имя фрейма (<имя слота><значение слота>), (<имя слота><значение слота>)].
Интерфейс (ИФ) Последняя, основная часть СБЗ – интерфейс (ИФ), обеспечивающий работу БЗ, МР и пользователя на языке достаточно высокого уровня, приближенном к профессиональному языку специалистов в той прикладной области, к которой относится СБЗ. Для реализации указанных функций ИФ включает в себя соответствующий языковой процессор. Кроме того, в функции ИФ также входит поддержка диалога пользователя с системой, что дает возможность пользователю получать объяснения действий системы, участвовать в поиске решения, пополнять и корректировать БЗ.
6. 3. Инструментальные средства построения СБЗ и ЭС Существует следующая классификация инструментальных средств: • языки программирования; • языки представления знаний; • пустые системы или оболочки ЭС; • интегрированные гибридные среды; • средства построения обучающих систем; • средства построения систем принятия решений. Языки программирования В качестве языков программирования для создания СБЗ и ЭС использовались языки общего назначения, такие как ФОРТРАН 77, КОБОЛ, Си, Паскаль, Бейсик, АПЛ и др.
Языки представления знаний К языкам представления знаний относятся: Пролог, KRL, OPS 5, Loglisp, Плэнер, LOOPS и др. Каждый из них имеет специальные средства представления знаний (логика, фреймы, продукционные правила) и встроенный механизм поиска вывода. OPS 5 используется, в основном в США. Для представления знаний применяет продукционные правила вида P → Q, где P является конъюнкцией «шаблонов» фактов (списков, имеющих структуру фактов, в которые вместо значений атрибутов могут также входить переменные и элементарные условия на значения атрибутов) и их отношений. Правая часть правила Q – это последовательность действий. использует непосредственно прямую стратегию (от фактов).
Язык Пролог как инструмент построения СБЗ более популярен в Европе и Японии, чем в США. Знания в нем представляются с помощью предложений (логических формул) специального вида: Q: – P 1, . . . , Pn, где Q, P 1, . . . , Pn – атомарные формулы. Содержательно такое предложение утверждает истинность заключения Q при условии истинности всех посылок P 1, . . . , Pn. . Механизм вывода в Прологе применяет обратную стратегию (от цели): для доказательства цели А ищется первое еще не использованное предложение, заключение которого унифицируется (сопоставляется) с А и его посылки объявляются новыми подцелями. Если найти подходящее предложение для текущей цели невозможно, то происходит возврат и поиск нового доказательства предыдущей цели.
Пустые системы или оболочки ЭС Пустые экспертные системы (или, как их еще называют, родовые, каркасные, наполняемые, оболочки) содержат, как правило, реализацию некоторого языка представления знаний (например, интерпретатор правил) и средства интерфейса, предназначенные для конструктора ЭС или инженера по знаниям (например, редактор и отладчик БЗ) и для конечного пользователя (подсистема объяснений). Интегрированные гибридные среды Включают в себя несколько разнородных средств представления данных и знаний, более богатый по сравнению с пустыми ЭС набор средств организации интерфейса.
Инструментальные (автоматизированные) обучающие системы (АОС) АОС обычно включает в себя один или несколько языков, на которых описываются действия и структуры, используемые для создания и функционирования обучающих систем. Языки ориентированы на разные функциональные роли лиц, работающих с АОС (автор учебного курса и ученик). Автор инструментальной АОС может: 1) задавать виды и структуру учебного материала (БЗ); 2) редактировать и хранить его в машинной организованной соответствующим образом (БЗ); памяти, 3) описывать процесс обучения с помощью соответствующего сценария (плана), в котором могут учитываться результаты обучения (МР).
Средства, предоставляемые ученику, относятся к МР и интерфейсу (ИФ). Они позволяют: 1) получать на экране дисплея порции учебного материала в соответствии со сценарием обучения, 2) выполнять упражнения и контролируемые действия (отвечать на вопросы системы), 3) получать советы и указания системы.
6. 4. Географические информационные системы ГИС – это автоматизированная система, имеющая большое количество графических и тематических баз данных, соединенная с моделирующими и расчетными функциями для манипулирования ими и преобразования в пространственную картографическую информацию для принятия на ее основе разнообразных решений и осуществления контроля. ГИС, которые служат информационным базисом для решения следующих задач: • принятие решений управленческого уровня; • научно-обоснованное перспективное и оперативное планирование развития города и его отдельных территорий;
• оптимальное проектирование объектов промышленного и гражданского назначения на территории города; • разработка генерального плана города и контроль его реализацией; • изучение состояния экологических, социальноэкономических, природно-ресурсных условий территории и их экономическая оценка; • совершенствование учета и рационального использования городских земель и недвижимости (зданий и сооружений); • получение достоверной информации о местоположении и эксплуатации сетей городского коммунального хозяйства; • проведение налогообложения, взимание платежей за использование природных ресурсов, недвижимости, за загрязнение окружающей среды;
Структура ГИС Любая ГИС работает с базами данных двух типов – графическими и атрибутивными или тематическими. Графические данные содержат картографическую информацию, сохраняемую в цифровой форме в картографической базе данных. БД состоит из индивидуальных записей, которые содержат атрибуты каждой картографической характеристики. Картографическая характеристика – это то, что имеет название (как, например, улица или люк) и может размещаться на карте также как на местности. На местности это называется картографической сущностью. По атрибутам, вызванным из БД, можно вычертить карту или вывести необходимые для ее создания данные.
Каждый объект может быть описан одним или несколькими геометрическими примитивами и атрибутами. К геометрическим примитивам относятся, прежде всего, точки, линии и площади. Точечные объекты на карте представляют единичное расположение на местности. Линии – одномерные объекты на карте, представляющие линейную характеристику с начальной и конечной точками. В зависимости от степени точности и масштаба линии подразделяются на более мелкие сегменты – дуги. Площади (многоугольники) – двумерные объекты на карте, представляющие очертания районов, имеющих площадь.
Физически геометрические примитивы записываются как последовательность пар координат. Точке соответствует одна пара координат – x, y. Окружности и кривые показываются ломаными линиями, т. е. списком пар координат. Отрезок прямой задается двумя парами координат, а площадь записывается как серия пар или серия идентификаторов ломаных и отрезков прямых, которая описывает замкнутый контур. Совокупность точек, линий и площадей образует цифровое представление карты. Точечные, линейные и площадные объекты являются дискретными объектами, т. е. для них всегда может быть определено их фактическое расположение на местности.
Непрерывные явления, в отличие от дискретных объектов, характеризуют не отдельные пространственные элементы, а территорию в целом. Непрерывность этих явлений заключается в том, что невозможно указать промежутки по площади распространения объектов данного типа, в которых бы они отсутствовали. Непрерывные данные часто представляют в виде регулярных или нерегулярных множеств точек. Объекты, обобщенные по площади, показывают обобщенную характеристику или концентрацию отдельных объектов в пределах заданной области. Негеографические атрибутивные данные являются описательной информацией, сохраняемой в базе данных об особенностях объектов, которые могут быть размещены (локализованы) на карте.
Структура ГИС Система ввода Система управления графическими БД Система управления атрибутивными БД Система визуализации Система обработки и анали за Система вывода Система ввода – это программный блок, отвечающий за получение данных, источниками которых могут являться разнообразные электронные устройства. Система вывода информации ГИС предназначена для представления результатов работы в виде, удобном потребителю. Система визуализации выводит на экран информацию в виде карт, таблиц, схем и т. п. имеющуюся Система анализа и обработки, осуществляет манипуляции с данными
Развитие ГИС AM CAD GIS Мелкомасштабный пространственный анализ СУБД FM CAD-система – это система для автоматизированного проектирования с использованием средств машинной графики. AM-системы – программные продукты, специально предназначенные для профессионального производства карт.
FM-системы – системы управления сетями – пространственно распределенными объектами, с каждым из которых связана существенная содержательная информация. Системы мелкомасштабного пространственного анализа связаны, прежде всего, с задачами природопользования, а также территориального планирования и управления.
Классификация ГИС по функциональным возможностям Можно выделить три группы ГИС. Первые – это мощные, ориентированные на рабочие станции или мощные ПК и сетевую эксплуатацию системы, обрабатывающие колоссальные объемы информации, имеющие разнообразные средства ввода (от дигитайзеров и сканеров до станций обработки космических снимков) и вывода, имеющие развитые средства документирования ( INTERGRAPH, GDS, ERSI). Вторые - настольные ГИС, обладают меньшими возможностями, предназначены для решения в первую очередь научных задач, но могут быть использованы и в задачах управления ( Mapinfo, Atlas. GIS, настольные версии INTERGRAPH, ARC/INFO ).
Третьи - системы для домашнего и информационносправочного использования. Это наиболее закрытые системы, которые либо не допускают вовсе внесения изменений в информацию или допускают незначительное ее изменение, например редактирование записей в БД или внесение новых записей. Представителями таких систем являются системы фирм Хорис (Санкт-Петербург) или MCity (Москва). ГИС можно также классифицировать исходя из принципов построения их архитектуры: «закрытые» и «открытые» . Закрытые системы построены по принципу «что Вы видите, то Вы получите» , . Основное их преимущество – очень низкая цена. Они не имеют возможностей расширения, у них отсутствуют встроенные языки, для них невозможно написание приложений.
Открытые системы обычно имеют от 70 до 90% встроенных функций и на 10 -30% могут быть достроены своими пользователями при помощи специального аппарата создания приложений. Термин «открытые» системы означает открытость ее для пользователя, легкость приспособления, расширения, изменения, адаптацию к новым формам, изменившимся данным, связь между существующими приложениями.
лекция6.ppt