Лекция 4 -5 Динамические игры с полной информацией

• Динамическая игра более сложный объект, чем статическая игра. Для описания динамической игры

3 Полная и совершенная информация ( Пи. СИ ). • В динамических играх

4 Полная и совершенная информация ( Пи. СИ ). • Если все сделанные

Динамические игры с полной информацией • Динамической будем называть такую игру, в которой

Динамические игры с полной информацией • Описание динамической игры (с совершенной информацией) в развернутой

Динамические игры с полной информацией • Пример: Игра « Террорист » .

8 Двухходовая игра • Игру удобно представить в виде диаграммы, изображающей дерево игры

• В этой игре действия пилота несложно предсказать—он полетит в Нью-Йорк , поскольку

Обратная индукция • Рассмотрим предфинальную позицию m. Пусть право хода в этой позиции имеет

• В случае, когда в динамической игре участвуют два игрока и игра происходит

• В этой игре обратная индукция дает два решения : (L 1, R

21 Теорема. В конечной игре с совершенной информацией алгоритм обратной индукции даёт хотя

Концепция равновесия Нэша • Мы рассмотрели, как находить решение динамической игры с совершенной информацией

Концепция равновесия Нэша • Для того чтобы это сделать, следует записать динамическую игру в

Концепция равновесия Нэша • В игре в развернутой форме (чистая) стратегия —это полный план

Концепция равновесия Нэша • Процесс игры для динамической игры в нормальной форме можно условно

• В игре с совершенной информацией (и конечным числом ходов) любое решение,

• Совершенным в подыграх равновесием называется набор стратегий, такой что он является равновесием

32 Mac. Mac 3, 2, 1 IBMIBMIBM 3, 2, 1 Игрок 2 3 IBM

33 Теорема. В игре с совершенной информацией и конечным числом ходов множество

Экономические модели, основанные на динамических играх с полной и совершенной информацией

• Рассмотрим 3 типа моделей, в которых применяется метод обратной индукции. 1. Дуополия

2, 1 N 21 qq. QДуополия Штакельберга ca. QP, jiijii qqcaqqqu,

• Имеем симметричную дуополию , кроме порядка ходов. Ход 1. Фирма 1

2 1 12 qca q. R 212 022 max, maxqqcaqqqu qq

• Каждой фирме выгодно захватить лидерство в отрасли – борьба за лидерство

Сравнение дуополий • Курно: • Штакельберг: • В

Скачать презентацию Лекция 4 -5 Динамические игры с полной информацией

lekciya_4-5(zaochn.otd.).pptx

Размер: 728.7 Кб
Автор:
Количество слайдов: 40

Описание презентации Лекция 4 -5 Динамические игры с полной информацией по слайдам

Лекция 4 -5 Динамические игры с полной информацией

• Динамическая игра более сложный объект, чем статическая игра. Для описания динамической игры нескольких субъектов, необходимо знать: 1. последовательность действий игроков при возможных сценариях развития событий в игре, а также выигрыши, получаемые игроками в зависимости от произошедших в игре событий. 2. что каждому игроку может быть известно

3 Полная и совершенная информация ( Пи. СИ ). • В динамических играх различают полную и совершенную информацию. • Информацию считают полной , если все игроки имеют общую информацию о правилах игры и функциях выигрыша. Это понятие относится как к статическим так и динамическим играм. • Понятие совершенной информации относится только к динамическим играм , в которых игроки делают ходы последовательно в разные моменты времени

4 Полная и совершенная информация ( Пи. СИ ). • Если все сделанные ходы сразу становятся известны всем игрокам , динамическая игра обладает совершенной информацией.

Динамические игры с полной информацией • Динамической будем называть такую игру, в которой каждый игрок может сделать несколько ходов и по крайней мере один из игроков, делая ход, знает, какой ход сделал другой игрок (возможно, он сам). В этой ситуации он стоит перед свершившимися фактами (уже сделанными ранее и известными ему ходами) и должен учитывать их при выборе своих действий.

Динамические игры с полной информацией • Описание динамической игры (с совершенной информацией) в развернутой форме должно включать : 1. множество вершин дерева игры , в том числе одну начальную вершину; 2. для каждой вершины, кроме начальной, — единственную вершину , которая непосредственно ей предшествует; при этом цепь предшествующих вершин, построенная из любой вершины, должна заканчиваться в начальной вершине (что предполагает, в том числе, отсутствие циклов); 3. множество игроков ; 4. для каждой вершины, кроме конечных, — единственного игрока , которому принадлежит ход в данной вершине; 5. для каждой конечной вершины, т. е. такой, которая не предшествует ни одной другой вершине, — вектор выигрышей всех игроков.

Динамические игры с полной информацией • Пример: Игра « Террорист » . В самолет сел террорист, который требует лететь из Майами в Гавану вместо Нью-Йорка. В предположении, что террорист не может определить маршрут полета, летчик выбирает, куда лететь. Если он летит в Гавану, игра заканчивается, а если в Нью-Йорк, то ход делает террорист, который решает, взрывать самолет или нет. На конечных вершинах дерева проставлены выигрыши игроков (первый игрок – пилот)

8 Двухходовая игра • Игру удобно представить в виде диаграммы, изображающей дерево игры . Решение игры можно найти в предположении, что игроки рациональны и что рациональность и структура игры являются общеизвестными фактами. • При этом естественно воспользоваться методом обратной индукции. В соответствии с этим методом игру разматывают с конца.

9 Игра «Террорист»

• В этой игре действия пилота несложно предсказать—он полетит в Нью-Йорк , поскольку предпочитает выигрыш 1 выигрышу − 1. Таким образом, исход игры однозначен: пилот посадит самолет в Нью-Йорке, а террорист не станет взрывать бомбу. • Изобразим полученное решение на дереве. Те действия , которые были игроком в каждой из вершин, изобразим жирными пунктирными линиями. Исход игры определяется траекторией, состоящей из выбранных действий, и идущей из начальной вершины в одну из конечных вершин

Обратная индукция • Рассмотрим предфинальную позицию m. Пусть право хода в этой позиции имеет игрок i(m). В этой позиции все зависит только от игрока i , и он может выбрать наилучшую для себя следующую вершину m : из всего множества. Сократим дерево игры, объявив позицию m финальной , приписав ей выигрыши u(m : ) . Такой процесс сокращения дерева игры можно проводить до начальной позиции. В этом и заключается суть метода обратной индукции.

• В случае, когда в динамической игре участвуют два игрока и игра происходит в два этапа , обратную индукцию удобно провести на основе функции отклика второго игрока на действия первого.

• 15 •

16 Игра «Рэкет» 1, 0 py 2 1 ypy

170211 2 ypypy y 01 y 2 1 p y 170211 2 ypypy y 01 y 2 1 p y 2 1 021 2 maxmax 2 2 1, 0 p p py

• 18 •

• 19 •

• В этой игре обратная индукция дает два решения : (L 1, R 2) и (L 2, R 1). • Если выигрыши всех игроков во всех конечных вершинах различны, то неоднозначность при использовании обратной индукции не возникает, поэтому решение должно быть единственным. • В конечной игре с совершенной информацией алгоритм обратной индукции дает хотя бы одно решение.

21 Теорема. В конечной игре с совершенной информацией алгоритм обратной индукции даёт хотя 21 Теорема. В конечной игре с совершенной информацией алгоритм обратной индукции даёт хотя бы одно решение

Концепция равновесия Нэша • Мы рассмотрели, как находить решение динамической игры с совершенной информацией с помощью обратной индукции. • Другой подход состоит в том, чтобы применить к динамической игре концепцию равновесия Нэша , так же как мы применяли ее к статическим играм.

Концепция равновесия Нэша • Для того чтобы это сделать, следует записать динамическую игру в нормальной форме. Как мы помним, описание игры в нормальной форме состоит из: 1. задания множества игроков , 2. множества стратегий каждого игрока , 3. функции выигрыша каждого игрока на множестве исходов.

Концепция равновесия Нэша • В игре в развернутой форме (чистая) стратегия —это полный план действий игрока: что он будет делать в каждой из вершин, в которой ход принадлежит ему. Это должен быть действительно полный план , т. е. в нем должно быть определено, что игрок выберет в любой своей вершине, даже если из каких-либо соображений ясно , что процесс игры вряд ли может привести в эту вершину.

Концепция равновесия Нэша • Процесс игры для динамической игры в нормальной форме можно условно представить следующим образом. Каждый игрок до начала игры сообщает выбранную им стратегию организатору игры. • Организатор , руководствуясь этими стратегиями , осуществляет за игроков их ходы. Когда последовательность ходов приведет организатора в конечную вершину , он раздает всем игрокам выигрыши , соответствующие этой конечной вершине. При такой интерпретации мы, по сути, имеем статическую игру в которой выигрыши определяются с помощью только что описанного алгоритма.

26 Mac. IBMIBMIBM 3, 2, 3, 2 26 Mac. IBMIBMIBM 3, 2, 3,

28 Mac. IBMIBM 3, 2: 2 1: 1 28 Mac. IBMIBM 3, 2: 2 1:

29 Mac. IBMIBM 3, 2: 2 1: 1 29 Mac. IBMIBM 3, 2: 2 1:

• В игре с совершенной информацией (и конечным числом ходов) любое решение, полученное методом обратной индукции , является равновесием по Нэшу. • При представлении динамической игры в нормальной форме теряется информация о последовательности ходов доступной игрокам на каждом ходе.

• Совершенным в подыграх равновесием называется набор стратегий, такой что он является равновесием Нэша в полной игре, а соответствующие части этого набора стратегий являются равновесиями по Нэш у во всех собственных подыграх этой игры.

32 Mac. Mac 3, 2, 1 IBMIBMIBM 3, 2, 1 Игрок 2 3 IBM 3 Mac Игрок 1 0 0 b+c c Mac. IBMIBM 3, 2,

33 Теорема. В игре с совершенной информацией и конечным числом ходов множество 33 Теорема. В игре с совершенной информацией и конечным числом ходов множество решений , получаемых обратной индукцией , совпадает с множеством СПРН ( совершенное по подыграм равновесие Нэша).

Экономические модели, основанные на динамических играх с полной и совершенной информацией Экономические модели, основанные на динамических играх с полной и совершенной информацией

• Рассмотрим 3 типа моделей, в которых применяется метод обратной индукции. 1. Дуополия Штакельберга. – это модель несовершенной отраслевой конкуренции с лидирующей фирмой , которая первой определяет объем выпускаемой на рынок продукции. Зная планы лидера отрасли, другие фирмы определяют объемы собственных выпусков. Такой вид дуополии основан на том, что фирма – лидер имеет возможность прогнозировать ответную реакцию ведомой фирмы или фирм и планировать свой выпуск с учетом этого прогноза.

2, 1 N 21 qq. QДуополия Штакельберга ca. QP, jiijii qqcaqqqu,

• Имеем симметричную дуополию , кроме порядка ходов. Ход 1. Фирма 1 выбирает объем выпуска q 1. Ход 2. Фирма 2 , зная выбор фирмы 1 , выбирает объем своего выпуска q 2. Так как игра полная , то фирма 1 может прогнозировать ответную реакцию фирмы 2, стремящейся к максимизации своего выигрыша при известном q 1 :

2 1 12 qca q. R 212 022 max, maxqqcaqqqu qq 2 1 12 qca q. R 212 022 max, maxqqcaqqqu qq 2 max, max 1 1 0 1 11 01211 0 1 11 qca qcaqq. Rqu q qq 21 ca q S 4 122 ca q. Rq SS 8 2 1 ca u 16 2 2 ca u 9 )( 2 са u дуоп. Курно Совпадает с Курно , но. .

• Каждой фирме выгодно захватить лидерство в отрасли – борьба за лидерство ( информационное лидерство- право первым принять решение и объявить его другому игроку). • Эта ситуация прямо противоположна антагонистической игре, в которой нет РН в чистых стратегиях (никто не хочет объявлять свою стратегию другому, а наоборот, стремится выведать чужую стратегию) – борьба за право быть ведомым.

Сравнение дуополий • Курно: • Штакельберг: • В Сравнение дуополий • Курно: • Штакельберг: • В дуополии Штакельберга выпуск продукции больше , а значит, цена ниже. Потребители только выигрывают от появления фирмы-лидера. Выпуск лидера совпадает с выпуском монополиста, но дополняется выпуском ведомой фирмы. ), ( 3 1* 2 * 1 caqq)( 3 2* ca. Q )( 43 ca. Q s