10-Ненадежные знания.ppt
- Количество слайдов: 33
Тема 4. Представление и использование не четких и не надежных знаний
Некорректно поставленные задачи существует во всех предметных областях. Более того, можно сказать, что большинство реальных задач являются нечеткими. Корректно поставленные задачи решаются с использованием традиционных методов, которые, как правило, хорошо формализованы, для них существует описанные, математические методы и алгоритмы решений. Для решения некорректных задач используется специфические методы, позволяющие учитывать и оценивать некорректность в процессе логического вывода.
В инженерии знаний обычно выделяют следующие виды нечеткостей: 1. Недетерминированность выводов. 2. Многозначность. Проблема состоит в том, что на определенных шагах поиска решения возникает множество вариантов дальнейшего хода действий, но при этом отсутствует критерий выбора наиболее предпочтительного пути. 3. Ненадежность фактов и правил, которые используются при построении вывода. 4. Неполнота. Ситуация возникает в том случае, когда для решения задачи просто недостает исходных данных. 5. Работа с нечеткими множествами, т. е. с множествами, для которых нельзя определить четких границ.
§ 1. Недетерминированность управления выводом и эвристические знания
Эвристики – те знания которые являются приобретенными или врожденными, например личный опыт человека. Недетерминированное управление является наиболее характерным для систем ИИ. Такое управление необходимо, т. к. знания, в процессе вывода, накапливаются фрагментарно и заранее нельзя сказать в какой момент времени будут использованы те или иные знания. Рассмотрим пример решения задачи недетерминированного вывода на примере алгоритма Харта, Нильсена и Рафаэля
Рассмотрим пример этого алгоритма на основе поиска решений для игры в 8. 7 2 4 1 2 3 8 1 6 4 5 6 5 3 7 8 Оценочная функция будет состоять из двух компонент: f(n)=g(n)+h(n) g(n) – стоимость пути от 1 -ой вершины до N h(n) – стоимость пути от вершины N до окончательного решения.
Если проанализировать обе составляющие, то становиться очевидным, что первый параметр – это всегда точно известное значение, а второй параметр при недетерминированном выводе – это значение, которое можно оценивать только приблизительно. И поэтому имеет смысл перейти к следующей формуле ~f(n)=g(n)+ ~ h(n), где значения с символом «~» означают приближенное значение. Например, для рассматриваемой задачи, в качестве параметра g(n) можно использовать уровень дерева вывода, который соответствует текущему состоянию решаемой задачи. А в качестве параметра ~ h(n) – количество фишек стоящих не на своих местах.
2 1 7 2 1 h=5 f=7 4 8 7 3 5 6 2 h=7 f=8 4 1 8 3 5 6 7 4 3 2 1 5 7 8 6 h=5 f=8 2 7 4 3 1 5 8 6 h=6 f=9 h=2 f=7 1 3 4 2 5 7 8 6 h=4 f = 10 1 4 7 1 7 h=4 f=7 1 2 4 h=3 7 8 f=7 2 8 3 5 6 1 2 3 4 8 5 7 6 h=3 f=9 1 2 4 5 h=0 7 8 f=7 8 3 5 6 h=6 f=7 2 1 7 4 8 6 3 5 4 8 3 5 6 h=4 f=6 2 1 7 4 5 8 3 3 5 6 g=0 2 4 1 5 3 7 8 6 h=5 f=8 2 3 1 4 5 7 8 6 h=6 f=9 3 5 6 h=4 f=9 3 6 4 2 1 7 h=5 f=7 2 4 8 3 5 6 2 1 7 h=5 f=6 4 8 ! 1 7 2 4 8 1 2 3 4 5 7 8 6 h=1 f=7 h=2 f=9 3 5 6 6 2 4 3 1 5 6 7 8 h=3 f=6 2 4 3 1 5 6 7 8 h=4 f=8 g=1 g=2 g=3 g=4 g=5 g=6 1 4 7 2 5 8 3 6 g=7
§ 2. Ненадежные знания и выводы
Во многих практических задачах приходится работать с данными, достоверность которых нельзя считать полной, т. е. 100%. Такие знания могут быть достоверными с некоторой степенью доверия.
Для работы со знаниями такого вида существуют специальные методы, которые позволяют учитывать, то что факты и правила участвующие в выводах не полностью достоверны и учитывать накопление этой достоверности в процессе логического вывода. Чтобы в конце можно было сказать, на сколько достоверен результат.
Понятие Байесовской вероятности Пусть имеется черный ящик в котором лежат шары. Эти шары помечены следующим образом. Одни имеют метку А, другие Б, третьи имеют метку А и Б одновременно, часть шаров вообще не имеют меток. Проведем следующий эксперимент. Будем доставать из ящика по одному шару и будем подсчитывать общее число извлеченных шаров и число извлеченных шаров которые имели метку А не зависимо от Б. После подсчета шары возвращаем в ящик.
После проведения некоторого числа экспериментов, мы можем вычислить вероятность извлечения шара с меткой А, для этого достаточно поделить число извлеченных шаров с меткой А на общее число шаров: (Число шаров с меткой A) P(A) = ______________ (Общее число шаров)
Рассмотрим более сложную ситуацию. Попытаемся определить вероятность происхождения некоторого события при условии выполнения другого события. Для этого проведем следующий эксперимент. Также как и в предыдущем случае будем извлекать шары и вести подсчет. Но при этом будем учитывать общее число извлеченных шаров, число шаров которые имеют метку А, независимо от Б, число шаров имеющих метку Б, независимо от А, а также число шаров имеющих метку А и Б.
После проведения этих экспериментов можно вычислить вероятность извлечения шара имеющего метку АБ одновременно. Это может быть описано следующим образом: (Число шаров с меткой А и Б) P(A и Б)= ______________ (Общее число шаров) (1)
Чтобы вычислить вероятность извлечения шара имеющего метку А при условии что был извлечен шар имеющий метку Б необходимо произвести следующие вычисления: (Число шаров с меткой А и Б) P(A|Б)= ______________ (2) (Число шаров с меткой Б) В формуле (1) выразим числитель (Число шаров с меткой А и Б) = P(А и Б) * (Общее число шаров) и подставим в (2) получим Р(А и Б)* (Общее число шаров) Р(А и Б) P(А|Б)= _____________ = ____ ( Число шаров с меткой Б) Р(Б)
Аналогично предыдущему случаю можно вычислить вероятность появления шара с меткой Б при условии извлечения шара с меткой А. Р(А и Б) P(Б|А)= ____ Р(А) Если в обоих формулах выразить числитель и приравнять, то получится следующая зависимость: Р(А|Б)*Р(Б)=Р(Б|А)*Р(А)
Закон Байеса. Из четырех экспериментов, которые можно произвести над двумя объектами необходимыми являются только три, значение четвертого эксперимента всегда может быть выражено через три других. Замечание. Особенностью метода Байеса является то, что сам он в чистом виде не применяется, однако существует множество других методов построенных на принципах Байесовской вероятности, которые применяются для решения практических задач.
§ 3. Декомпозиция задач с ненадежными данными
Известно, что любая сложная задача может быть разбита на множество подзадач, т. е. может быть выполнена ее декомпозиция. При этом последовательность выполнения подзадач может быть описана такой структурой, как граф. Граф, используемый для описания задач с ненадежными знаниями по своей структуре похож на И/ИЛИ графы известные с продукционных систем, разница в том, что в этих графах помимо двух известных типов связи появляется новая связь, которая называется комбинированная - КОМБ
При решении задач логического вывода с ненадежными исходными данными используется подход, основанный на разбиении основной задачи на несколько подзадач. Каждая подзадача, в свою очередь, разбивается на простые подзадачи, поэтому задача в целом описывается иерархически. В конечном итоге можно выделить четыре основные ситуации, которые необходимо разрешить с точки зрения ненадежного вывода. В задачах с ненадежными исходными данными кроме «И» и «ИЛИ» важную роль играет комбинированная связь «КОМБ» . Такая связь независимо подкрепляет или опровергает цель на основании двух и более доказательств. Если выбрать метод выводов для связей, используемых в графе, то степени надежности можно распространить на иерархическую сеть выводов. В итоге можно получить степень надежности конечной цели, а также указать ее при окончательном ответе.
Метод MYCIN В системе MYCIN (экспертная система по идентификации микроорганизмов в крови) для представления ненадежности введен так называемый коэффициент уверенности CF, который принимает значение на интервале [1, 1] (1 – заведомо истинно, -1 – заведомо ложно, 0 – полностью не определено) и могут быть выражены через байесовскую вероятность.
Для листьев коэффициенты обычно задаются на основе знаний эксперта. Коэффициенты доверия для правил (CFправ) могут быть рассчитаны на Байесовской вероятности по правилу: основе СF(C, e) - коэффициент доверия C при условии, что имеет место факт e.
В том случае если вершине предшествует несколько вершин, связанных одним из известных типов связи, то в зависимости от типа связи определяется правило вычисления доверия события, делается это следующим образом. связь x cfx А cfпред y cfy
При таком виде коэффициент доверия события рассчитывается как произведение коэффициента доверия правила и коэффициента доверия предшествующего вывода, который определяется на основе коэффициентов доверия событий, входящих в вывод и на основе существующего типа связи. сf(A) = cfпр * cfпред
Коэффициент доверия предшествующего вывода в зависимости от типа связи Если используется связь И, тогда коэффициент доверия предшествующего вывода определяется как минимум из коэффициентов доверия событий Х и У. cfпред(A, X&Y) = min(cfx , cfy) Если используется связь ИЛИ, тогда коэффициент доверия предшествующего вывода определяется как максимум из коэффициентов доверия событий Х и У. cfпред(A, Xv. Y) = max(cfx , cfy)
Если используется связь КОМБ 1, если cf(А, Х)=1 или сf(А, У)=1 cf(А, Х)+ cf(А, У)- cf(А, Х)* cf(А, У), если cf(А, X)>0, cf(А, У)>0 cf пред (A, (X, Y)) = (1) cf(А, Х)+ cf(А, У), если cf(А, У)<>+-1, cf(А, Х)<>+-1 и (3) cf(А, Х)* cf(А, У)=<0 cf(А, Х)+ cf(А, У)+ cf(А, Х)* cf(А, У), если cf(А, Х)<0, cf(А, У)<0 -1, если cf(А, Х)= -1 или cf(А, У)= -1 (2)
Коэффициенты доверия предшествующего вывода принимают значение абсолютная истина или абсолютная лож в том случае, если одна из веток имеет такие значения. Если ни одна из веток не имеет абсолютного значения, то расчет коэффициентов выполняется на основе одной из трех формул. Однако область определения этих формул является взаимно пересекающейся, поэтому чтобы избежать ошибок формулы применяются в том порядке, в котором они пронумерованы. Чтобы избежать противоречивой ситуации формула (3) может быть заменена на следующую формулу. cf(А, Х)+ cf(А, У) сf пред = ______________ 1 -min(cf(А, Х), cf(А, У))
Замечание 1 Очевидно, что возможна ситуация, когда одному заключению соответствуют не две, а три или более посылок. А cfпр связь x y cfx cfy Z cf. Z
Замечание 1 (продолжение) Для связи И/ИЛИ выбор максимума или минимума не представляет труда. Для КОМБ применяется следующий подход: выбирается пара вершин и рассчитывается их совместный коэффициент рассмотренному правилу. доверия, по ранее Например, для Х и У рассчитывается коэффициент cfn. Затем строится новая пара в которую в качестве первого элемента входит сfn, а в качестве второго следующая вершина (например, Z). Такое разбиение возможно построить для любого числа посылок.
Замечание 2 Если проанализировать формулу вычисления коэффициентов доверия вывода, то становиться, очевидно, что если правило полностью достоверно, т. е. коэффициент имеет значение 1, то коэффициент доверия заключения зависит только от предшествующего вывода. Если же правило не полностью достоверно, то это послужит понижению достоверности вывода, т. к. будет уменьшать коэффициент доверия предшествующего вывода.


