Лекция 4 Равновесие Нэша и смешанные стратегии 1

Скачать презентацию Лекция 4 Равновесие Нэша и смешанные стратегии 1

Lektsia_5_TI_2_kurs.ppt

Количество слайдов: 25

Лекция 4 Равновесие Нэша и смешанные стратегии 1. Существование РН и смешанные стратегии

Существование равновесий Нэша и смешанные стратегии

Игра «Совпадение монет» • Два игрока одновременно и независимо друг от друга кладут на стол по монете каждый, прикрывая свою монету рукой. По команде судьи они поднимают руки. Игрок 1 выигрывает, если монеты лежат по – разному, а игрок 2 выигрывает, если они лежат одинаково. 2/9/2018 3

О О -1, 1 1, -1 Р 2/9/2018 Р 1, -1 -1, 1 4

О О -1, 1 1, -1 Р 2/9/2018 Р 1, -1 -1, 1 5

• Очевидно, что ни одна из клеток не может быть равновесием Нэша, поскольку ни в одной из клеток не подчеркнуты одновременно оба выигрыша. В подобной игре каждый игрок заинтересован в том, чтобы его партнер не смог угадать, какую именно стратегию он выбрал. Этого можно достичь, внеся в выбор стратегии элемент неопределенности. Те стратегии, которые мы рассматривали ранее, принято называть чистыми стратегиями. 2/9/2018 6

• Но в некоторых играх естественно ввести в рассмотрение также смешанные стратегии. Под смешанной стратегией понимают распределение вероятностей на чистых стратегиях. • В частном случае, когда множество чистых стратегий каждого игрока конечно, Xi = {x 1 i , . . . , xni i } (соответствующая игра называется конечной), смешанная стратегия представляется вектором вероятностей соответствующих чистых стратегий: μi = (μ 1 i, . . . , μni i ). 2/9/2018 7

• Обозначим множество смешанных стратегий iго игрока через Mi: • Стандартное предположение теории игр состоит в том, что если выигрыш—случайная величина, то игроки предпочитают действия, которые приносят им наибольший ожидаемый выигрыш. • Ожидаемый выигрыш i-го игрока, соответствующий набору смешанных стратегий всех игроков (μ 1, . . . , μm), вычисляется по формуле: 2/9/2018 8

• Ожидание рассчитывается в предположении, что игроки выбирают стратегии независимо (в статистическом смысле). Поскольку игрок максимизирует ожидаемый выигрыш, то он будет смешивать несколько разных стратегий, только если они дают ему одинаковый выигрыш (при данных стратегиях других игроков). Смешанные стратегии можно представить как результат рандомизации игроком своих действий, т. е. как результат их случайного выбора. 2/9/2018 9

• Набор смешанных стратегий μ = (μ 1 , . . . , μm) является равновесием Нэша в смешанных стратегиях, если стратегия μ*i каждого игрока i = 1, . . . , n является наилучшим для него откликом на стратегии других игроков μ*−i: 2/9/2018 10

Определение. Игра называется антагонистической, если в ней участвуют два игрока, т. е. N={1, 2}, интересы которых противоположны: u 1(s 1, s 2)+u 2(s 1, s 2) 0 - нижняя цена игры - верхняя цена игры 2/9/2018 11

Утверждение: Теорема. В антагонистической игре РН существует тогда и только тогда, когда v 0=v. В этом случае говорят, что игра имеет цену v. 2/9/2018 12

Определение. Смешанная стратегия игрока i – это вероятностная мера μi на множестве его чистых стратегий si. Если все множества стратегий конечны, μi(si) является вероятностью выбора игроком i стратегии si: 2/9/2018 13

Определение. Смешанным расширением игры в нормальной форме называется игра где множество смешанных стратегий игрока i; - вероятность выбора s при независимом выборе si; - ожидаемый выигрыш в исходной игре, 2/9/2018 14

Определение. РН в смешанных стратегиях μ* называют РН в смешанном расширении Gm: 2/9/2018 15

O O P 2/9/2018 P -1, 1 1, -1 q 1, -1 -1, 1 1 -q p 1 -p 16

Функция отклика (наилучшего ответа) первого игрока на действия второго: 2/9/2018 17

Функция отклика (наилучшего ответа) второго игрока на действия первого: игрок 1 игрок 2 q 1 1/2 p 2/9/2018 0 1/2 1 18

О Б 2, 1 0, 0 p О 0, 0 1, 2 1 -p q Игра «Семейный спор» : Б 1 -q максимум достигается при р=0 максимум достигается при р=1 выигрыш не зависит от р и равен 2/3 2/9/2018 19

максимум достигается при q=0 максимум достигается при q=1 выигрыш не зависит от q и равен 2/3 2/9/2018 20

Функция отклика (наилучшего ответа) первого игрока на действия второго: Функция отклика (наилучшего ответа) второго игрока на действия первого: 2/9/2018 21

игрок 2 q 1 игрок 1 1/3 p 0 2/9/2018 2/3 1 22

«Дилемма заключенного» : q 1 (М) игрок 1 игрок 2 p 0 (C) 2/9/2018 1 (М) 23

Теорема Нэша. Пусть в игре множества стратегий Si игроков конечны. Тогда в игре существует РН в смешанных стратегиях. 2/9/2018 24

Вычисление РН в смешанных стратегиях 2/9/2018 25