Лекция 4 -5 Динамические игры с полной информацией
lekciya_4-5(zaochn.otd.).pptx
- Размер: 728.7 Кб
- Автор:
- Количество слайдов: 40
Описание презентации Лекция 4 -5 Динамические игры с полной информацией по слайдам
Лекция 4 -5 Динамические игры с полной информацией
• Динамическая игра более сложный объект, чем статическая игра. Для описания динамической игры нескольких субъектов, необходимо знать: 1. последовательность действий игроков при возможных сценариях развития событий в игре, а также выигрыши, получаемые игроками в зависимости от произошедших в игре событий. 2. что каждому игроку может быть известно
3 Полная и совершенная информация ( Пи. СИ ). • В динамических играх различают полную и совершенную информацию. • Информацию считают полной , если все игроки имеют общую информацию о правилах игры и функциях выигрыша. Это понятие относится как к статическим так и динамическим играм. • Понятие совершенной информации относится только к динамическим играм , в которых игроки делают ходы последовательно в разные моменты времени
4 Полная и совершенная информация ( Пи. СИ ). • Если все сделанные ходы сразу становятся известны всем игрокам , динамическая игра обладает совершенной информацией.
Динамические игры с полной информацией • Динамической будем называть такую игру, в которой каждый игрок может сделать несколько ходов и по крайней мере один из игроков, делая ход, знает, какой ход сделал другой игрок (возможно, он сам). В этой ситуации он стоит перед свершившимися фактами (уже сделанными ранее и известными ему ходами) и должен учитывать их при выборе своих действий.
Динамические игры с полной информацией • Описание динамической игры (с совершенной информацией) в развернутой форме должно включать : 1. множество вершин дерева игры , в том числе одну начальную вершину; 2. для каждой вершины, кроме начальной, — единственную вершину , которая непосредственно ей предшествует; при этом цепь предшествующих вершин, построенная из любой вершины, должна заканчиваться в начальной вершине (что предполагает, в том числе, отсутствие циклов); 3. множество игроков ; 4. для каждой вершины, кроме конечных, — единственного игрока , которому принадлежит ход в данной вершине; 5. для каждой конечной вершины, т. е. такой, которая не предшествует ни одной другой вершине, — вектор выигрышей всех игроков.
Динамические игры с полной информацией • Пример: Игра « Террорист » . В самолет сел террорист, который требует лететь из Майами в Гавану вместо Нью-Йорка. В предположении, что террорист не может определить маршрут полета, летчик выбирает, куда лететь. Если он летит в Гавану, игра заканчивается, а если в Нью-Йорк, то ход делает террорист, который решает, взрывать самолет или нет. На конечных вершинах дерева проставлены выигрыши игроков (первый игрок – пилот)
8 Двухходовая игра • Игру удобно представить в виде диаграммы, изображающей дерево игры . Решение игры можно найти в предположении, что игроки рациональны и что рациональность и структура игры являются общеизвестными фактами. • При этом естественно воспользоваться методом обратной индукции. В соответствии с этим методом игру разматывают с конца.
9 Игра «Террорист»
• В этой игре действия пилота несложно предсказать—он полетит в Нью-Йорк , поскольку предпочитает выигрыш 1 выигрышу − 1. Таким образом, исход игры однозначен: пилот посадит самолет в Нью-Йорке, а террорист не станет взрывать бомбу. • Изобразим полученное решение на дереве. Те действия , которые были игроком в каждой из вершин, изобразим жирными пунктирными линиями. Исход игры определяется траекторией, состоящей из выбранных действий, и идущей из начальной вершины в одну из конечных вершин
Обратная индукция • Рассмотрим предфинальную позицию m. Пусть право хода в этой позиции имеет игрок i(m). В этой позиции все зависит только от игрока i , и он может выбрать наилучшую для себя следующую вершину m : из всего множества. Сократим дерево игры, объявив позицию m финальной , приписав ей выигрыши u(m : ) . Такой процесс сокращения дерева игры можно проводить до начальной позиции. В этом и заключается суть метода обратной индукции.
• В случае, когда в динамической игре участвуют два игрока и игра происходит в два этапа , обратную индукцию удобно провести на основе функции отклика второго игрока на действия первого.
•
16 Игра «Рэкет» 1, 0 py 2 1 ypy
170211 2 ypypy y 01 y 2 1 p y 2 1 021 2 maxmax 2 2 1, 0 p p py
•
•
• В этой игре обратная индукция дает два решения : (L 1, R 2) и (L 2, R 1). • Если выигрыши всех игроков во всех конечных вершинах различны, то неоднозначность при использовании обратной индукции не возникает, поэтому решение должно быть единственным. • В конечной игре с совершенной информацией алгоритм обратной индукции дает хотя бы одно решение.
21 Теорема. В конечной игре с совершенной информацией алгоритм обратной индукции даёт хотя бы одно решение
Концепция равновесия Нэша • Мы рассмотрели, как находить решение динамической игры с совершенной информацией с помощью обратной индукции. • Другой подход состоит в том, чтобы применить к динамической игре концепцию равновесия Нэша , так же как мы применяли ее к статическим играм.
Концепция равновесия Нэша • Для того чтобы это сделать, следует записать динамическую игру в нормальной форме. Как мы помним, описание игры в нормальной форме состоит из: 1. задания множества игроков , 2. множества стратегий каждого игрока , 3. функции выигрыша каждого игрока на множестве исходов.
Концепция равновесия Нэша • В игре в развернутой форме (чистая) стратегия —это полный план действий игрока: что он будет делать в каждой из вершин, в которой ход принадлежит ему. Это должен быть действительно полный план , т. е. в нем должно быть определено, что игрок выберет в любой своей вершине, даже если из каких-либо соображений ясно , что процесс игры вряд ли может привести в эту вершину.
Концепция равновесия Нэша • Процесс игры для динамической игры в нормальной форме можно условно представить следующим образом. Каждый игрок до начала игры сообщает выбранную им стратегию организатору игры. • Организатор , руководствуясь этими стратегиями , осуществляет за игроков их ходы. Когда последовательность ходов приведет организатора в конечную вершину , он раздает всем игрокам выигрыши , соответствующие этой конечной вершине. При такой интерпретации мы, по сути, имеем статическую игру в которой выигрыши определяются с помощью только что описанного алгоритма.
26 Mac. IBMIBMIBM 3, 2, 3,
28 Mac. IBMIBM 3, 2: 2 1:
29 Mac. IBMIBM 3, 2: 2 1:
• В игре с совершенной информацией (и конечным числом ходов) любое решение, полученное методом обратной индукции , является равновесием по Нэшу. • При представлении динамической игры в нормальной форме теряется информация о последовательности ходов доступной игрокам на каждом ходе.
• Совершенным в подыграх равновесием называется набор стратегий, такой что он является равновесием Нэша в полной игре, а соответствующие части этого набора стратегий являются равновесиями по Нэш у во всех собственных подыграх этой игры.
32 Mac. Mac 3, 2, 1 IBMIBMIBM 3, 2, 1 Игрок 2 3 IBM 3 Mac Игрок 1 0 0 b+c c Mac. IBMIBM 3, 2,
33 Теорема. В игре с совершенной информацией и конечным числом ходов множество решений , получаемых обратной индукцией , совпадает с множеством СПРН ( совершенное по подыграм равновесие Нэша).
Экономические модели, основанные на динамических играх с полной и совершенной информацией
• Рассмотрим 3 типа моделей, в которых применяется метод обратной индукции. 1. Дуополия Штакельберга. – это модель несовершенной отраслевой конкуренции с лидирующей фирмой , которая первой определяет объем выпускаемой на рынок продукции. Зная планы лидера отрасли, другие фирмы определяют объемы собственных выпусков. Такой вид дуополии основан на том, что фирма – лидер имеет возможность прогнозировать ответную реакцию ведомой фирмы или фирм и планировать свой выпуск с учетом этого прогноза.
2, 1 N 21 qq. QДуополия Штакельберга ca. QP, jiijii qqcaqqqu,
• Имеем симметричную дуополию , кроме порядка ходов. Ход 1. Фирма 1 выбирает объем выпуска q 1. Ход 2. Фирма 2 , зная выбор фирмы 1 , выбирает объем своего выпуска q 2. Так как игра полная , то фирма 1 может прогнозировать ответную реакцию фирмы 2, стремящейся к максимизации своего выигрыша при известном q 1 :
2 1 12 qca q. R 212 022 max, maxqqcaqqqu qq 2 max, max 1 1 0 1 11 01211 0 1 11 qca qcaqq. Rqu q qq 21 ca q S 4 122 ca q. Rq SS 8 2 1 ca u 16 2 2 ca u 9 )( 2 са u дуоп. Курно Совпадает с Курно , но. .
• Каждой фирме выгодно захватить лидерство в отрасли – борьба за лидерство ( информационное лидерство- право первым принять решение и объявить его другому игроку). • Эта ситуация прямо противоположна антагонистической игре, в которой нет РН в чистых стратегиях (никто не хочет объявлять свою стратегию другому, а наоборот, стремится выведать чужую стратегию) – борьба за право быть ведомым.
Сравнение дуополий • Курно: • Штакельберг: • В дуополии Штакельберга выпуск продукции больше , а значит, цена ниже. Потребители только выигрывают от появления фирмы-лидера. Выпуск лидера совпадает с выпуском монополиста, но дополняется выпуском ведомой фирмы. ), ( 3 1* 2 * 1 caqq)( 3 2* ca. Q )( 43 ca. Q s