1 Лекция 5 Динамические игры с полной информацией

Скачать презентацию 1 Лекция 5 Динамические игры с полной информацией Скачать презентацию 1 Лекция 5 Динамические игры с полной информацией

13478-lektsia_6_ti_2urs.ppt

  • Количество слайдов: 35

>1 Лекция 5 Динамические игры с полной информацией Полная и совершенная информация ( ПиСИ). 1 Лекция 5 Динамические игры с полной информацией Полная и совершенная информация ( ПиСИ). Двухходовая игра. Подходы Штакельберга и Гермейера. Общая модель динамической игры с ПиСИ. Обратная индукция и рациональность игроков. Модели, основанные на динамических играх с ПиСИ.

>2 Полная и совершенная информация ( ПиСИ). В динамических играх различают полную и совершенную 2 Полная и совершенная информация ( ПиСИ). В динамических играх различают полную и совершенную информацию. Информацию считают полной, если все игроки имеют общую информацию о правилах игры и функциях выигрыша. Это понятие относится как к статическим так и динамическим играм. Понятие совершенной информации относится только к динамическим играм, в которых игроки делают ходы последовательно в разные моменты времени

>3 Полная и совершенная информация ( ПиСИ). Если все сделанные ходы сразу становятся известны 3 Полная и совершенная информация ( ПиСИ). Если все сделанные ходы сразу становятся известны всем игрокам, динамическая игра обладает совершенной информацией.

>Динамические игры с полной информацией Динамической будем называть такую игру, в которой каждый игрок Динамические игры с полной информацией Динамической будем называть такую игру, в которой каждый игрок может сделать несколько ходов и по крайней мере один из игроков, делая ход, знает, какой ход сделал другой игрок (возможно, он сам). В этой ситуации он стоит перед свершившимися фактами (уже сделанными ранее и известными ему ходами) и должен учитывать их при выборе своих действий. 4

>Динамические игры с полной информацией Описание динамической игры (с совершенной информацией) в развернутой форме Динамические игры с полной информацией Описание динамической игры (с совершенной информацией) в развернутой форме должно включать : множество вершин дерева игры, в том числе одну начальную вершину; для каждой вершины, кроме начальной,— единственную вершину, которая непосредственно ей предшествует; при этом цепь предшествующих вершин, построенная из любой вершины, должна заканчиваться в начальной вершине (что предполагает, в том числе, отсутствие циклов); множество игроков; для каждой вершины, кроме конечных,— единственного игрока, которому принадлежит ход в данной вершине; для каждой конечной вершины, т. е. такой, которая не предшествует ни одной другой вершине,— вектор выигрышей всех игроков. 5

>6 Двухходовая игра Пусть есть всего два игрока N={1,2}, и игра разворачивается во времени 6 Двухходовая игра Пусть есть всего два игрока N={1,2}, и игра разворачивается во времени следующим образом: Ход 1. Игрок 1 выбирает некоторые действия a1 A1 Ход 2. Игрок 2, зная совершенный игроком 1 выбор a1, выбирает некоторое действие a2 A2

>7 Двухходовая игра Предполагаем, что информация является полной, т.е. правила игры и функция выигрыша 7 Двухходовая игра Предполагаем, что информация является полной, т.е. правила игры и функция выигрыша известны обоим игрокам. Поэтому игрок 1 может спрогнозировать ответные действия игрока 2 с помощью множества наилучших ответов: В случае однозначности наилучших ответов прогноз поведения игрока2 в ответ на любые действия игрока 1 является точным.

>8 Двухходовая игра С учетом этого прогноза игроку 1 следует выбирать свое действие из 8 Двухходовая игра С учетом этого прогноза игроку 1 следует выбирать свое действие из условия максимизации выигрыша u1(a1,R2(a1)). Обозначим через a1* оптимальные действия игрока 1 с учетом прогноза ответных действий игрока 2 в случае однозначности наилучших ответов: max [ u1(a1,R2(a1)) ] = u1(a1* ,R2(a1* )) Обозначим через a2* = R2(a1*) оптимальный ответ игрока 2 на оптимальное действие игрока 1.

>9 Подход Штакельберга  Подход Штакельберга – доброжелательность партнера:     max 9 Подход Штакельберга Подход Штакельберга – доброжелательность партнера: max max [ u1(a1,a2) ] = max [u1(a1* , a2)] a1 € A1 a2 € R2(a1) a2 € R2(a1* ) В экономических приложениях чаще используется подход Штакельберга, т.к. в случае безразличия лучше пойти навстречу партнеру. ( бесплатная услуга, может потом мне это как-то зачтется)

>10 Подход Гермейера. Подход Гермейера  - гарантированный результат или осторожность:   10 Подход Гермейера. Подход Гермейера - гарантированный результат или осторожность: max min [ u1(a1,a2) ] = min [u1(a1* , a2)] a1 € A1 a2 € R2(a1) a2 € R2(a1* ) Гермейер исходил из общего принципа гарантированного результата. Если у нас есть информация о доброжелательности партнера в случае равного для него выигрыша, то можем пользоваться подходом Штакельберга. Но если такой информации нет, то только совет к максимальному гарантированному результату

>11 Двухходовая игра Стратегия в теории игр – это план действий на всю игру 11 Двухходовая игра Стратегия в теории игр – это план действий на всю игру с учетом всей поступающей информации. Игрок 1 выбирает действие, не имея никакой дополнительной информации. Поэтому его множество стратегий S1 =A1 совпадает с множеством действий.

>12 Двухходовая игра Игрок 2 перед выбором своего действия получает информацию о уже совершенном 12 Двухходовая игра Игрок 2 перед выбором своего действия получает информацию о уже совершенном действии игрока 1. Но стратегию он должен выбрать до игры, поэтому его стратегия это отображение S2 : A1→A2 , которая каждому действию a1 игрока 1 ставит в соответствие некоторое действие s2(a1) A2 Положим u1(s1, s2)= u (s, s2 (s1 )). Если у каждого игрока было по два возможных действия, то в двухходовой игре у игрока 1 будет две стратегии, а у игрока 2 станет четыре стратегии.

>13 Двухходовая игра Игру удобно представить в виде диаграммы, изображающей дерево игры . Решение 13 Двухходовая игра Игру удобно представить в виде диаграммы, изображающей дерево игры . Решение игры можно найти в предположении, что игроки рациональны и что рациональность и структура игры являются общеизвестными фактами. При этом естественно воспользоваться методом обратной индукции. В соответствии с этим методом игру разматывают с конца.

>14 Игра «Террорист» 14 Игра «Террорист»

>15 15

>В этой игре действия пилота несложно предсказать—он полетит в Нью-Йорк, поскольку предпочитает выигрыш 1 В этой игре действия пилота несложно предсказать—он полетит в Нью-Йорк, поскольку предпочитает выигрыш 1 выигрышу −1. Таким образом, исход игры однозначен: пилот посадит самолет в Нью-Йорке, а террорист не станет взрывать бомбу. Изобразим полученное решение на дереве. Те действия, которые были игроком в каждой из вершин, изобразим жирными пунктирными линиями. Исход игры определяется траекторией, состоящей из выбранных действий, и идущей из начальной вершины в одну из конечных вершин 16

>17 17

>Обратная индукция Рассмотрим предфинальную позицию m. Пусть право хода в этой позиции имеет игрок Обратная индукция Рассмотрим предфинальную позицию m. Пусть право хода в этой позиции имеет игрок i(m). В этой позиции все зависит от только от игрока i, и он может выбрать наилучшую для себя следующую вершину m: из всего множества. Сократим дерево игры, объявив позицию m финальной, приписав ей выигрыши u(m:) . Такой процесс сокращения дерева игры можно проводить до начальной позиции. В этом и заключается суть метода обратной индукции. 18

>19 19

>20 Игра «Рэкет» 20 Игра «Рэкет»

>21 21

>22 22

>23 23

>В этой игре обратная индукция дает два решения: (L1,R2) и (L2,R1). Если выигрыши всех В этой игре обратная индукция дает два решения: (L1,R2) и (L2,R1). Если выигрыши всех игроков во всех конечных вершинах различны, то неоднозначность при использовании обратной индукции не возникает, поэтому решение должно быть единственным. В конечной игре с совершенной информацией алгоритм обратной индукции дает хотя бы одно решение. 24

>25 Теорема. В конечной игре с совершенной информацией алгоритм обратной индукции даёт хотя бы 25 Теорема. В конечной игре с совершенной информацией алгоритм обратной индукции даёт хотя бы одно решение

>Концепция равновесия Нэша Мы рассмотрели, как находить решение динамической игры с совершенной информацией с Концепция равновесия Нэша Мы рассмотрели, как находить решение динамической игры с совершенной информацией с помощью обратной индукции. Другой подход состоит в том, чтобы применить к динамической игре концепцию равновесия Нэша, так же как мы применяли ее к статическим играм. 26

>Концепция равновесия Нэша Для того чтобы это сделать, следует записать динамическую игру в нормальной Концепция равновесия Нэша Для того чтобы это сделать, следует записать динамическую игру в нормальной форме. Как мы помним, описание игры в нормальной форме состоит из: задания множества игроков, множества стратегий каждого игрока, функции выигрыша каждого игрока на множестве исходов. 27

>Концепция равновесия Нэша В игре в развернутой форме (чистая) стратегия—это полный план действий игрока: Концепция равновесия Нэша В игре в развернутой форме (чистая) стратегия—это полный план действий игрока: что он будет делать в каждой из вершин, в которой ход принадлежит ему. Это должен быть действительно полный план, т. е. в нем должно быть определено, что игрок выберет в любой своей вершине, даже если из каких-либо соображений ясно, что процесс игры вряд ли может привести в эту вершину. 28

>Концепция равновесия Нэша Процесс игры для динамической игры в нормальной форме можно условно представить Концепция равновесия Нэша Процесс игры для динамической игры в нормальной форме можно условно представить следующим образом. Каждый игрок до начала игры сообщает выбранную им стратегию организатору игры. Организатор, руководствуясь этими стратегиями, осуществляет за игроков их ходы. Когда последовательность ходов приведет организатора в конечную вершину, он раздает всем игрокам выигрыши, соответствующие этой конечной вершине. При такой интерпретации мы, по сути, имеем статическую игру в которой выигрыши определяются с помощью только что описанного алгоритма. 29

>30 30

>31 31

>32 32

>33 33

>34 34

>35 Теорема. В игре с совершенной информацией и конечным числом ходов множество решений, получаемых 35 Теорема. В игре с совершенной информацией и конечным числом ходов множество решений, получаемых обратной индукцией, совпадает с множеством СПРН ( совершенное по подыграм равновесие Нэша).