Скачать презентацию Системы искусственного интеллекта Введение в теорию нейронных сетей Скачать презентацию Системы искусственного интеллекта Введение в теорию нейронных сетей

Системы искусственного интеллекта Лекция5.ppt

  • Количество слайдов: 23

Системы искусственного интеллекта Введение в теорию нейронных сетей 3 часть Черноморский государственный университет им. Системы искусственного интеллекта Введение в теорию нейронных сетей 3 часть Черноморский государственный университет им. П. Могилы, Факультет компьютерных наук к. т. н. , доц. Гожий А. П.

Алгоритм зворотнього поширення помилки Алгоритм зворотнього поширення помилки

Побудова нейроконтролера для комп ютерних ігор Нейроконтролерами (Neurocontroller) звичайно називаються НМ, які використовуються при Побудова нейроконтролера для комп ютерних ігор Нейроконтролерами (Neurocontroller) звичайно називаються НМ, які використовуються при керуванні об'єктами. Нейронні мережі як нейроконтролери використовують тому, що неможливо задати для персонажа гри поведінку, яка охоплювала б усі можливі у навколишньому середовищі ситуації. Тому, необхідно навчити НМ на обмеженій кількості прикладів (тобто зразків поведінки залежно від обставин), а потім дозволити їй самостійно генерувати поведінку у всіх інших ситуаціях. Здатність генерувати правильну реакцію на різні ситуації, які не входять до набору навчальних, є ключовим чинником при створенні нейроконтролера.

Особливості і переваги нейроконтролера n n Перевага нейроконтролера полягає у тому, що він не Особливості і переваги нейроконтролера n n Перевага нейроконтролера полягає у тому, що він не є строго заданою функцією, а це забезпечує взаємодію між навколишнім середовищем і реакцією на нього. Незначні зміни в навколишньому середовищі можуть викликати різну реакцію нейроконтролера, тому поведінка персонажа виглядає більш природньо. Фіксовані дерева поведінки, або скінченні автомати, викликають передбачувану реакцію, що досить погано відображається на грі. Навколишнє середовище надає певну інформацію персонажу, яка потім передається агентові. Процес "сприйняття" навколишнього середовища називається передчуттям. Нейроконтролер забезпечує можливість вибору дії, за допомогою якої персонаж взаємодіє з навколишнім середовищем. Навколишнє середовище при цьому змінюється, персонаж знову звертається до сприйняття, і цикл відновлюється.

Архітектура нейроконтролера У комп'ютерних іграх частіше використовується архітектура мережа, побудована за принципом Архітектура нейроконтролера У комп'ютерних іграх частіше використовується архітектура мережа, побудована за принципом "переможець отримує все": Такі архітектури корисні у випадку, якщо виходи повинні бути розподілені на кілька класів Вхід Конкуренція вихідних нейронів за право бути переможцем

u 8 Здоров‘я Атакувати u 9 Бігти u 10 Ухилятися u 11 Ховатися u u 8 Здоров‘я Атакувати u 9 Бігти u 10 Ухилятися u 11 Ховатися u 1 u 5 Має ніж u 2 u 6 Має пістолет u 3 u 7 Присутній ворог Вхідний шар u 4 Прихований шар Вихідний шар

n n У мережі, створеної за принципом n n У мережі, створеної за принципом "переможець отримує все", вихідна комірка з більшою сумою вагів є "переможцем" групи і допускається до дії. У даному прикладі кожна комірка представляє певну поведінку, доступну для персонажа у грі. Прикладами поведінки є такі дії: вистрілити зі зброї, утекти, ухилитися та ін. Спрацьовування комірки в групі за цим принципом приводить до того, що персонаж виконує певну дію. Коли персонажу знову дозволяється оцінити навколишнє середовище, процес повторюється. Представлена мережа, яка використовувалася для тестування архітектури та методу вибору дії. Чотири входи по значають наступне: "здоров'я персонажа" ("0" погане, "1" задо вільне, "2" гарне), "має ніж" ("1" так, персонаж має ніж; "0" ні), "має пістолет" ("1" так, "0" ні) і "присутній ворог" (цифра позначає кількість ворогів у полі зору).

Виходи визначають поведінку, яку вибирає персонаж. Дія Виходи визначають поведінку, яку вибирає персонаж. Дія "атакувати" приводить до того, що персонаж атакує ворогів у полі зору, дія "бігти" змушує персонажа тікати, "ухилятися" довільно рухатися, а "ховатися" шукати захист. Це високорівневі типи поведінки, і передбачається, що підсистема поведінки буде вибирати дію. Обрана тут архітектура (три приховані комірки) була визначена методом проб і помилок. Три приховані комірки можуть бути навчені для всіх наведених прикладів з точністю 100 %. Зменшення кількості комірок до двох або однієї призводить до створення мережі, що не може правильно класифікувати всі приклади.

Навчання нейроконтролера n Нейроконтролер в ігровому середовищі це постійний елемент персонажа. Навчання нейроконтролера в Навчання нейроконтролера n Нейроконтролер в ігровому середовищі це постійний елемент персонажа. Навчання нейроконтролера в режимі реального часу полягає в наведенні навчальних прикладів з невеликої групи бажаних дій. Потім необхідно виконати алгоритм зворотного поширення з урахуванням бажаного і дійсного результатів. Наприклад, якщо персонаж здоровий, має пістолет і бачить одного ворога, бажана дія атакувати. Однак якщо персонаж здоровий, має ніж, бачить двох ворогів, то правильна дія сховатися.

Данні для тестування Ці дані представляють кілька сценаріїв з набором дій. Оскільки потрібно, щоб Данні для тестування Ці дані представляють кілька сценаріїв з набором дій. Оскільки потрібно, щоб нейроконтролер поводився так само, як реальна людина, не треба вчити його для кожного випадку, мережа повинна розраховувати реакцію на входи і виконувати дію, подібну до навчальних сценаріїв. Дані, наведені в табл. 1, були передані мережі в довільному порядку під час навчання за допомогою алгоритму зворотного поширення. У більшості випадків мережа успішно проходить на вчання на всіх наведених прикладах. При деяких запусках один або два приклади призводять до неправильних дій. При збільшенні кількості прихованих комірок навчання проходить ідеально, однак у цьому випадку для роботи нейроконтролера потрібно набагато більше комп'ютерних ресурсів. Тому були обрані три приховані комірки з декількома циклами навчання. Для навчання нейроконтролера було виконано стільки запусків, скільки треба для одержання ідеального результату на підставі тестових даних

Радиально-базисні нейронні мережі Нейронні мережі, які використовують в якості активаційних функцій радиально базисні ( Радиально-базисні нейронні мережі Нейронні мережі, які використовують в якості активаційних функцій радиально базисні ( RBF мережі). Загальний вигляд радіально базисної функції: Радиально базисная мережа характеризуеться трьома особливостями: n 1. Один прихований слой n 2. Тільки нейрони прихованого слоя мають нелінійну активаційну функцію n 3. Синаптичні ваги зв язків вхідного і прихованого слоїв дорівнюють 1

Мережі Кохонена Самоорганізаційна карта Кохонена (Self-organizing map — SOM) — нейронна мережа з навчанням Мережі Кохонена Самоорганізаційна карта Кохонена (Self-organizing map — SOM) — нейронна мережа з навчанням зі змаганням без вчителя, що виконує завдання кластеризації.

Нейронна мережа Хопфілда Нейронна мережа Хопфілда

Нейронна мережа Хопфілда складається з N штучних нейронів. Кожен нейрон системи може приймати один Нейронна мережа Хопфілда складається з N штучних нейронів. Кожен нейрон системи може приймати один з двох станів (що аналогічно виходу нейрона з пороговою функцією активації): Вихід мережі обраховуеться: