
ИАОЭБ Интеллект и нейроннные сети.ppt
- Количество слайдов: 50
1
Интеллект Термин «интеллект» происходит от латинского слова intellectus – разум, рассудок. Под «искусственным интеллектом» обычно понимают способность информационных систем брать на себя некоторые функции человеческого разума. К примерам таких функций можно отнести принятие решений на основе накопленного опыта и с учетом анализа состояния объекта и внешней среды. Интеллектуальными следует считать лишь слабоформализованные задачи, такие, для которых алгоритм решения неизвестен, или его слишком сложно определить. 2
Искусственный интеллект Искусственным интеллектом также называют отрасль научных знаний, связанных с созданием интеллектуальных информационных систем (Ин. ИС) – класса информационных систем, нацеленных на решение интеллектуальных задач. Общим для них является: • способность к накоплению знаний в целях их последующего применения; • возможность функционирования в условиях неопределенности информации или знаний о закономерностях функционирования исследуемой предметной области; • поэтапное улучшение качества решения. 3
Знания можно определить как накопленный потенциал данных и специальных средств и технологий обработки этого потенциала для достижения определенных целей. По характеру знания можно разделить на декларативные и процедурные. Декларативные знания представляют собой описания фактов и явлений, а также основных связей и закономерностей, в которые эти факты и явления входят. Процедурные знания описывают действия или процедуры, которые возможно применить к фактам и явлениям для достижения определенных целей. 4
Знания По способу приобретения знания подразделяются на фактические и эвристические. Фактические знания представляют собой хорошо известные в данной предметной области факты и зависимости. Эвристические знания основаны на собственном опыте эксперта, работающего в конкретной предметной области, и, как правило, не имеют точных теоретических обоснований. 5
Базы знаний Для того, чтобы знания могли быть использованы в Ин. ИС, их необходимо формализовать и представить в виде определенной информационной структуры. Такой структурой выступает база знаний (БЗ). База знаний – это семантическая модель, описывающая предметную область и позволяющая отвечать на такие вопросы из этой предметной области, ответы на которые в явном виде не присутствуют в базе. 6
Базы знаний Это становится возможным благодаря системе правил, позволяющих выводить новые знания из уже существующих. Таким образом, база знаний состоит из двух основных компонентов: • базы данных, содержащей знания о предметной области в формализованном виде; • механизма (системы правил, процедур) получения новых знаний на основе существующих в базе. 7
Модели представления знаний К настоящему времени к наиболее распространенным относятся следующие универсальные модели представления знаний: • логическая; • продукционная; • фреймовая; • модель семантической сети. 8
Логическая модель основана на формальных логических правилах. Знания представляются в ней в виде предикатов первого порядка, над которыми можно выполнять логические операции. 9
Логическая модель (пример) P: Все импортные товары требуют таможенного оформления Q: Товар Х – импортный товар Над этими предикатами можно выполнить логическую операцию, приводящую к появлению нового верного утверждения: R: Товар Х требует таможенного оформления Используя для обозначения высказываний логические переменные Р, Q, R, можно составить формулу: То есть: «Если все импортные товары требуют таможенного оформления И товар Х является импортным, то товар Х требует таможенного оформления» . 10
Продукционная модель (или модель, основанная на правилах) Продукционная модель получила наибольшее распространение благодаря своей структурной простоте и универсальности. В этой модели знания представлены совокупностью так называемых продукционных правил вида «если – то» , которые могут быть дополнены логическими операторами. Пример продукционного правила: если (СПРОС НА ТОВАР неэластичен по цене) и (ЦЕНА понижается) то (ВЫРУЧКА падает) 11
Продукционная модель (или модель, основанная на правилах) Содержимое базы знаний изменяется в процессе решения задач по мере срабатывания правил, то есть при возникновении такой ситуации, когда предпосылки правила совпадают с имеющимися фактами, и, следовательно, это правило можно применить к решению данной задачи. При этом заключение сработавшего правила заносится в рабочую память. Тем самым реализуется принцип самообучения: база пополняется в процессе решения прикладных задач, и становится способной решать принципиально новые задачи. 12
Пример продукционной модели Имеется фрагмент базы знаний из двух правил: П 1: Если "отдых - летом" и "человек - активный", то "ехать в горы", П 2: Если "любит солнце", то "отдых летом", Предположим, в систему поступили данные - "человек активный" и "любит солнце" Прямой вывод - исходя из данных, получить ответ. 1 -й проход. Шаг 1. Пробуем П 1, не работает (не хватает данных "отдых - летом"). Шаг 2. Пробуем П 2, работает, в базу поступает факт "отдых - летом". 2 -й проход. Шаг 3. Пробуем П 1, работает, активируется цель "ехать в горы", которая и выступает как совет, который дает Экспертная Система. Обратный вывод - подтвердить выбранную цель при помощи имеющихся правил и данных. 1 -й проход. Шаг 1. Цель - "ехать в горы": пробуем П 1, данных "отдых - летом" нет, они становятся новой целью, и ищется правило, где они в правой части. Шаг 2. Цель "отдых - летом": правило П 2 подтверждает цель и активирует ее. 2 -й проход. Шаг 3. Пробуем П 1, подтверждается искомая цель. 13
Применение продукционной модели q Продукционная модель чаще всего применяется в промышленных экспертных системах. Она привлекает разработчиков своей наглядностью, высокой модульностью, легкостью внесения дополнений и изменений и простотой механизма логического вывода. q Имеется большое число программных средств, реализующих продукционный подход (язык OPS 5); инструментальные системы (ИЭС и СПЭИС и др. ), а также промышленные ЭС и др. 14
Фреймовая модель Основана на теории фреймов, разработанной американским исследователем М. Минским, и представляющей собой систематизированную модель памяти и сознания человека. Поскольку эта теория имеет несколько абстрактный характер, фреймовая модель представления знаний обычно применяется в комбинации с другими моделями. 15
Фреймовая модель Фреймом называется структура данных для представления некоторой стереотипной ситуации или объекта. Каждый фрейм имеет имя, идентифицирующее описываемое понятие, и содержит ряд полей – слотов, с помощью которых определяются основные элементы понятия. Слоты содержат определенные значения, которые могут представлять собой некоторый диапазон или перечень возможных значений, арифметическое выражение, фрагмент текста и т. д. 16
Фреймовая модель позволяет отобразить все многообразие знаний через различные типы фреймов: • фреймы-структуры для обозначения объектов и понятий (заказ, товар, ценная бумага); • фреймы-роли (поставщик, кассир, клиент); • фреймы-сценарии (продажа товара, прием заказа); • фреймы-ситуации (обнаружение дефекта товара) и др. Совокупность данных предметной области может быть представлена множеством взаимосвязанных фреймов, образующих единую фреймовую систему, в которой объединяются декларативные и процедурные знания. 17
Образное представление фрейма Под фреймом понимается абстрактный образ или ситуация Например, слово "комната" вызывает у слушающих образ комнаты: "жилое помещение с четырьмя стенами, полом, потолком, окнами и дверью, площадью 6 -20 м 2 ". Из этого описания ничего нельзя убрать (например, убрав окна мы получим уже чулан, а не комнату), но в нем есть "дырки", или "слоты", - это незаполненные значения некоторых атрибутов количество окон, цвет стен, высота потолка. покрытие пола и др. В теории фреймов такой образ называется фреймом. Фреймом называется также и формализованная модель для отображения образа. Структуру фрейма можно представить так; ИМЯ ФРЕЙМА : (имя 1 -го слота: значение 1 -го слота), (имя 2 -го слота: значение 2 -го слота), ---(имя N-го слота: значение N-гo слота). 18
Важнейшее свойство теории фреймов q Важнейшим свойством теории фреймов является заимствованное из теории семантических сетей наследование свойств. И во фреймах, и в семантических сетях наследование происходит по АКО-связям (A-Kind-Of = это). Слот АКО указывает на фрейм более высокого уровня иерархии, откуда неявно наследуются, т. е. переносятся, значения аналогичных слотов. q Например(см. след. слайд), в сети фреймов понятие "ученик" наследует свойства фреймов "ребенок" и "человек", которые находятся на более высоком уровне иерархии. Так, на вопрос: "Любят ли ученики сладкое? " Следует ответ: "Да", так как этим свойством обладают все дети, что указано во фрейме "ребенок". Наследование свойств может быть частичным, так, возраст для учеников не наследуется из фрейма "ребенок", поскольку указан явно в своем собственном фрейме. 19
Пример: сеть фреймов 20
Семантическая сеть Термин семантическая означает смысловая, а сама семантика - это наука, устанавливающая отношения между символами и объектами, которые они обозначают, т. е. наука, определяющая смысл знаков. 21
Семантическая сеть- это ориентированный граф, вершины которого - понятия, а дуги - отношения между ними. Понятиями обычно выступают абстрактные или конкретные объекты, а отношения - это связи типа: "это" ("is"), "имеет частью" ("has part"), "принадлежит", "любит". Проблема поиска решения в базе знаний типа семантической сети сводится к задаче поиска фрагмента сети, соответствующего некоторой подсети, соответствующей поставленному вопросу. 22
Семантическая сеть. В качестве вершин понятия: Человек, Иванов, Волга. Автомобиль, Вид транспорта, Двигатель, Цвет, Красный. Основное преимущество этой модели - в соответствии современным представлениям об организации долговременной памяти человека. Недостаток модели сложность поиска вывода на семантической сети. 23
Классификация Ин. ИС Классификационный признак: “Виды интеллектуальных информационных технологий”. Наиболее применяемыми в сфере экономики являются следующие интеллектуальные технологии: • технологии инженерии знаний; • технологии экспертных систем; • технологии эволюционного моделирования; • нейросетевые технологии. 24
Технологии инженерии знаний Инженерия знаний - научное направление, занимающееся вопросами формализации, представления и обработки знаний в информационных системах. Этот термин предложил в 1977 году американский ученый Э. Фейгенбаум. Инженерия знаний изучает вопросы: • извлечения знаний из экспертов и/или текстов; • формализации и обработки знаний; • проектирования и разработкой баз знаний. 25
Экспертные системы Технологии инженерии знаний составляют основу для разработки и функционирования экспертных систем. Экспертная система (ЭС) – вид Ин. ИС, аккумулирующих знания специалистов в определенной предметной области и способных предлагать и объяснять пользователю разумные решения. В составе экспертной системы выделяют три основные части: • база знаний; • механизм логического вывода; • подсистема объяснений. 26
Эволюционное моделирование Это направление в моделировании, использующее методы и принципы биологической эволюции для оптимизации систем. Идеи эволюционного моделирования возникали у ряда авторов, начиная с 1960 -х годов. Следует отметить вышедшую в 1975 году книгу американского ученого Дж. Холланда «Адаптация в естественных и искусственных системах» , в которой впервые был предложен генетический алгоритм. 27
Генетические алгоритмы это компьютерная модель эволюции популяции искусственных «особей» , ключевыми операторами которой являются селекция, скрещивание и мутация. Генетические алгоритмы предназначены для решения задач оптимизации. К подобным задачам можно отнести, например, бизнес-планирование. В процессе разработки бизнес-плана возникает большое число альтернатив: многочисленные условия получения кредита в различных банках, различные схемы закупок и реализации, варианты приобретения оборудования у различных поставщиков и т. д. 28
Типовой генетический алгоритм Формирование популяции Работа алгоритма начинается сродителей Скрещивание формирования начальной популяции – конечного набора допустимых вариантов К избранным родителям применяется оператор Мутация потомков решения задачи. На каждом шаге эволюции с помощью скрещивания: на основесебе свойства двух родителей. параметров каждого Потомок комбинирует в комбинацииэволюции Переход к новому этапу выбираются два вероятностного оператора селекции из родителей недостаточно длявариантэволюции. Шаги новый развития потомок. Однако этого создаетсяочередной шаг – популяции На этом заканчиваетсяродителями. решения, называемых Простейшим приобретение новых свойств. Поэтому будет необходимо видом и вновь до скрещивания является повторяются вновь оператора того момента, когда однородный оператор: он перебирает все параметры же вариант-потомок подвергается небольшим случайным достигнуто желаемое значение целевой функции или варианта и с вероятностью 0, 5 случайным образом модификациямуказанное количество шагов. когда пройдет при помощи оператора мутации. присваиваетвариант-потомок добавляется влибо от После чего, им значение либо от первого, популяцию, а второго родителя. вариант с наименьшим значением целевой функции удаляется из нее. 29
Нейросетевые технологии Нейросетевыми технологиями называют комплекс информационных технологий, основанных на применении искусственных нейронных сетей. Искусственные нейронные сети (ИНС) – это программно или аппаратно реализованные системы, построенные по принципу организации и функционирования их биологического аналога – нервной системы человека. 30
Нейросетевые технологии В основе нейросетевых технологий лежит идея о том, что функционирование биологического нейрона можно промоделировать относительно простыми математическими моделями, а вся глубина и гибкость человеческого мышления и другие важнейшие качества нервной системы определяются не сложностью нейронов, а их большим числом и наличием сложной системы связей между ними. 31
Биологический нейрон Нервная система и мозг человека состоят из особых нервных клеток - нейронов, соединенных между собой нервными волокнами, которые способны передавать электрические импульсы между нейронами. Все процессы мышления, управления действиями, а также процессы передачи раздражения от зрительного, слухового аппаратов и кожи реализованы в живом организме посредством передачи электрических сигналов между нейронами. 32
Биологический нейрон 33
Краткое описание биологического нейрона Нейрон – это биологическая клетка, способная обрабатывать информацию. Она состоит из тела клетки (или сомы) и отростков нервных волокон двух типов – нескольких дендритов, по которым принимаются импульсы и одного аксона, по которому нейрон может передавать импульс. Тело нейрона включает ядро, которое содержит информацию о наследственных свойствах и плазму, обладающую молекулярными средствами для производства необходимых нейрону материалов. Нейрон получает сигналы (импульсы) от аксонов других нейронов через дендриты и передает сигналы, сгенерированные телом клетки, вдоль своего аксона, который в конце разветвляется на волокна, н окончаниях которых располагаются синапсы – образования, влияющие на велич импульсов. (продолжение) 34
Краткое описание биологического нейрона (продолжение) Синапс является элементарной структурой и функциональным узлом между двумя нейронами. Когда импульс достигает синаптического окончания, выделяются химические вещества, называемые нейротрансмиттерами, которые, проходя через синаптическую цепь, возбуждают или затормаживают, в зависимости от типа синапса, способность принимающего нейрона генерировать электрические импульсы. Результативность передачи импульса синапсом может настраиваться проходящими через него сигналами так, что синапсы могут обучаться в зависимости от активности процессов, в которых они участвуют. Веса синапсов могут изменяться во времени, а значит, меняется и поведение соответствующих нейронов. 35
Структура и свойства искусственного нейрона 36
Пояснения к структуре и свойствам искусственного нейрона Искусственный нейрон явля-ется составной частью нейронной се-ти. Нейрон состоит из элементов трех типов – умножителей, которые сумматора и нелинейного преобразователя. играют роль синапсов, Синапсы осуществляют связь между нейронами, умножают входной сигнал на коэффициент, характеризующий силу связи (вес синапса). Сумматор складывает сигналы, поступающие по синаптическим связям от других нейронов, и внешних входных сигналов. Нелинейный преобразователь реализует нелинейную функцию выхода сумматора, которая называется функцией активации или передаточной функцией нейрона. 37
Математическая модель нейрона Y=f(s) Где wi – вес синапса, i=1, …, n, s – результат суммирования, xi – компонент входного вектора (входной сигнал), y – выходной сигнал нейрона, n – число входов нейрона, f – нелинейный преобразователь, реализующий функцию активации y=f(s). Таким образом, нейрон в целом реализует скалярную функцию векторного аргумента. 38
Виды синоптических связей Синаптические связи бывают двух видов: возбуждающими и тормозящими К первому виду относятся синаптические связи с положительными весами, а ко второму – с отрицательными. В НС используют функции активации различных видов. Одной из наиболее распространенных является так называемая логистическая функция или сигмоид, описываемая выражением: К числу преимуществ сигмоидальной функции активации относится простое выражение для производной, дифференцируемость на всей оси абсцисс, что делает ее удобной при решении ряда задач. 39
График логистической функции активации (сигмоид) 40
Все нейроны, в зависимости от расположения и функции, выполняемой ими в сети, делятся на три типа: а) входные нейроны – на них подается вектор входного воздействия, в большинстве сетей имеет только выходные связи; б) выходные нейроны – выходные значения которых являются выходами нейронной сети, обычно, имеет только входные связи; в) промежуточные нейроны – составляют основу нейронных сетей. 41
Функционирование нейронной сети В процессе функционирования нейронной сети, в ней осуществляется преобразование информации, в результате которого входной вектор преобразуется в выходной. Конкретный вид выполняемого сетью преобразования данных определяется: • характеристиками составляющих ее нейронов, • особенностями архитектуры – топологией межнейронных связей, • выбором подмножеств нейронов для ввода и вывода данных, • способами обучения сети, • наличием или отсутствием конкуренции между нейронами, • направлением и способами управления передачи данных. 42
Обучение нейронных сетей В процессе функционирования нейронная сеть формирует выходной сигнал Y в соответствии с входным сигналом X, реализуя некоторую функцию где F – множество всех возможных функций f. Если архитектура сети задана, то функция f определяется значениями синоптических весов и смещений сети. Кроме этого, вводится специальная функция ошибки, или, как ее еще называют, функционал качества (обозначим ее через E). (продолжение) 43
Обучение нейронных сетей (продолжение) Функционирование нейронной сети (НС) и операции, которые она способна выполнять, зависит от величин синоптических связей. Поэтому, задавшись определенной структурой сети, соответствующей некоторой задаче, необходимо установить оптимальные значения всех переменных весовых коэффициентов. Эта задача решается на этапе обучения НС, и от того, насколько успешно она будет решена, зависит способность сети решать те или иные поставленные перед ней проблемы. (продолжение) 44
Обучение нейронных сетей (продолжение) Пусть для решения некоторой задачи в сети реализуется функция t: Y=t(X). Тогда, функционал качества будет показывать для каждой функции f степень ее близости к t. Решить поставленную задачу при помощи НС заданной архитектуры это означает построить (синтезировать) функцию подобрав параметры нейронов (синаптические веса и смещения) таким образом, чтобы функционал качества становился оптимальным для всех пар X и Y. 45
Модель нейрона Х 1 y=f(s) Х 2 Х 3. . . Хn Х – сигнал, W – весовой коэффициент, У – активационная функция нейрона 46
Обучение нейрона Подобно биологическим системам, которые он моделирует, искусственный нейрон изменяет свои характеристики в результате попыток достичь лучшей модели поведения. Изменения состоят в корректировке величин коэффициентов wi входящих связей. Тем самым изменяется и величина исходящего сигнала, который будет генерироваться при тех же входных сигналах. Корректируя весовые коэффициенты, нейрон накапливает «опыт» , приспосабливая свой выходной сигнал к решению той или иной конкретной задачи. 47
Обучение нейрона В практике искусственных нейронных сетей сложились два основных метода обучения: • с учителем, • без учителя. При обучении с учителем предполагается, что помимо входных сигналов, известны также и ожидаемые выходные сигналы. Иными словами, нейрон каждый раз получает информацию о том, какой выходной сигнал от него ожидают. При обучении без учителя ожидаемые выходные сигналы неизвестны, подбор весовых коэффициентов осуществляется на основе конкуренции нейронов, либо корреляции обучающих и выходных сигналов. 48
Резюме Задача обучения НС сводится к поиску вида функции f, оптимальной по E. Обучение представляет собой итеративный процесс и требует длительных вычислений. При этом число итераций может составлять от 10 Е 3 до 10 Е 8 Результатом каждой итерации должно быть уменьшение функции ошибки. 2. В настоящее время разработано множество методов оптимизации обучения НС. При этом, предпочтение следует отдавать тем методам, которые позволяют обучать нейронную сеть за наименьшее число шагов. 3. Данное краткое введение в нейронные сети не преследует целью подробно ознакомить студента с принципами их построения и функционирования. Его задача заключается в том, чтобы студент овладел базовыми понятиями и терминологией на уровне, необходимом для эффективного решения задач анализа данных с помощью модуля Neural Analyzer 49 1.
Спасибо за внимание 50