Скачать презентацию Антагонистические матричные игры Простейший случай это конечная Скачать презентацию Антагонистические матричные игры Простейший случай это конечная

IGR.pptx

  • Количество слайдов: 9

Антагонистические матричные игры Простейший случай – это конечная парная игра с нулевой суммой. Рассмотрим Антагонистические матричные игры Простейший случай – это конечная парная игра с нулевой суммой. Рассмотрим такую игру G, в которой участвуют два игрока А и В, имеющие противоположные интересы: выигрыш одного равен проигрышу другого. Так как выигрыш игрока А равен выигрышу игрока В с противоположным знаком, можно сосредоточить внимание лишь на выигрыше а игрока А. А хочет максимизировать, а В – минимизировать выигрыш а. Пусть у А имеется m возможных стратегий А 1, А 2, . . , Аm, а у В (противника) – n возможных стратегий В 1, В 2, . . , Вn (это игра mxn). Обозначим аij выигрыш в случае, если А использует i-ую стратегию, а В – j-ую. Предположим, что выигрыш для каждой пары стратегий нам известен (средний выигрыш). Тогда можно составить таблицу (матрицу), в которой перечислены все стратегии игроков и соответствующие выигрыши. Аi Bj B 1 B 2 … Bn A 1 a 12 … a 1 n A 2 a 21 a 22 … a 2 n am 1 am 2 … amn … Am

Рассмотрим пример игры G (4 x 5) в матричной форме. Допустим у А есть Рассмотрим пример игры G (4 x 5) в матричной форме. Допустим у А есть 4 стратегии, а у его противника – 5. Какой стратегией следует воспользоваться игроку А, чтобы получить максимальный выигрыш? Очевидно, что А 3, так как при этой стратегии есть вариант получить максимальный выигрыш 10. Но необходимо учитывать, что противник тоже не «дурак» и если А выберет А 3, то назло ему В может выбрать стратегию В 3, при которой А получит лишь единицу. Возникает вопрос – как выбирать стратегию? Исходя из принципа осторожности (а это основной принцип теории игр), надо выбрать ту стратегию, которая принесет игроку максимальный минимальный выигрыш , то есть – принцип «минимакса» : стратегия должна быть такой, чтобы при наихудшем для игрока поведении противника получить максимальный выигрыш. Аi Bj B 1 B 2 B 3 B 4 B 5 A 1 3 4 5 2 3 A 2 1 8 4 3 4 A 3 10 3 1 7 6 A 4 4 5 3 4 8

Перепишем таблицу и в добавочном столбце запишем минимальное значение выигрыша в каждой строке (минимум Перепишем таблицу и в добавочном столбце запишем минимальное значение выигрыша в каждой строке (минимум строки), обозначим его αi. Аi Bj B 1 B 2 B 3 B 4 B 5 αi A 1 3 4 5 2 3 2 A 2 1 8 4 3 4 1 A 3 10 3 1 7 6 1 A 4 4 5 3 4 8 3 βj 10 8 5 7 8 Из всех значений αi выделено наибольшее (3). Ему соответствует 4 -я стратегия А 4. Выбирая эту стратегию игрок А будет уверен, что при любом поведении противника, его выигрыш будет не меньше 3 -х. Эта величина – гарантированный выигрыш. Ведя себя осторожно, меньше этой величины игрок А получить не сможет, а может и больше. Этот выигрыш называется нижней ценой игры (или максимином – максимальный из минимальных выигрышей). Обозначим его α=3. Теперь рассмотрим точку зрения противника В. Выбирая стратегию, он бы хотел отдать поменьше, но также должен рассчитывать на наихудшее поведение со стороны А. Впишем в таблицу добавочную строчку, в которой будут записаны максимумы столбцов βi. Очевидно, что осторожный соперник должен выбрать ту стратегию при которой эта величина будет минимальна, это то значение выигрыша, больше которого соперник В не отдаст А – верхняя цена игры или минимакс – минимальный из максимальных выигрышей. (в нашем случае он равен 5)

В показанном выше примере минимаксные стратегии неустойчивы по отношению к информации о поведении другой В показанном выше примере минимаксные стратегии неустойчивы по отношению к информации о поведении другой стороны (в случае, если А узнает, что В выбрал стратегию В 3, он изменит свою стратегию на А 1, чтобы получить больший выигрыш); эти стратегии не обладают свойством равновесия. Существуют также устойчивые стратегии, но для их появления необходимо выполнение равенства между нижней и верхней ценой игры, то есть α= β. В такой ситуации даже если противники знают стратегию друга, они не станут их менять, так как это ухудшило бы их положение. Пара стратегий, обеспечивающих равновесие называется уравновешенная пара стратегий, а выигрыш, достигаемый при этой паре стратегий, называется «седловой точкой матрицы» . Стратегии Аi, Bj, при которых достигается этот выигрыш, называются оптимальными чистыми стратегиями, а их совокупность – решением игры. Про саму игру в таком случае говорят, что она решается в чистых стратегиях. Наличие седловой точки в игре – это скорее исключение. Большинство игр ее не имеют. Но та разновидность игр, которые имеют седловую точку, то есть решается в чистых стратегиях, - это игры с полной информацией (шашки, шахматы, крестики-нолики и пр. ).

Игра в условиях отсутствия «седловой» точки (смешанные стратегии) Такая игра предполагает, что игроки не Игра в условиях отсутствия «седловой» точки (смешанные стратегии) Такая игра предполагает, что игроки не придерживаются принципа минимакса, а случайно выбирают свои стратегии, смешивают их. Смешанные стратегии представляют собой модель изменчивой, гибкой тактики, когда ни один из игроков не знает, как поведет себя соперник (карты). Обозначим смешанные стратегии игроков А и В соответственно SA=(p 1, p 2, . . , pm) и SB=(q 1, q 2, . . , qn), где p и q – вероятности применения игроками соответствующих стратегий (в сумме они для каждого игрока дают 1). Основная теорема теории игр: любая конечная игра двух лиц с нулевой суммой имеет по крайней мере одно решение – пару оптимальных стратегий (SA*, SB*). Пара оптимальных стратегий (SA*, SB*), образующих решение игры, обладает свойством: если один из игроков придерживается своей оптимальной стратегии, то другому не может быть выгодно отступать от своей стратегии. Эта пара образует в игре положение равновесие: один игрок заинтересован обратить выигрыш в минимум, а второй в максимум.

Методы решения конечных игр 1. Необходимо по возможности упростить игру • Стратегия Аi игрока Методы решения конечных игр 1. Необходимо по возможности упростить игру • Стратегия Аi игрока А называется доминирующей над стратегией Ak, если в строке Аi стоят выигрыши не меньше, чем в соответствующих клетках строки Аk, и из них по крайней мере один заведомо больше, чем в соответствующей клетке строки Аk. • Если все выигрыши в строке Ai равны соответствующим выигрышам строки Аk, то стратегия Аi называется дублирующей стратегию Ak. Пример: Аi Bj B 1 B 2 B 3 B 4 B 5 A 1 4 7 2 3 4 A 2 3 5 6 8 9 A 3 4 4 2 2 8 A 4 3 6 1 2 4 A 5 3 5 6 8 9 Очевидно, что стратегия А 5 дублирует стратегию А 2, любую их них можно отбросить. Выигрыши в строке А 1 больше или равны выигрышам строки А 4, то есть А 1 – доминирующая над А 4, отбрасываем А 4. Получим матрицу 3 х3

Аi Bj B 1 B 2 B 3 B 4 B 5 A 1 Аi Bj B 1 B 2 B 3 B 4 B 5 A 1 4 7 2 3 4 A 2 3 5 6 8 9 A 3 4 4 2 2 8 Рассмотрим стратегии игрока В. Видно, что В 3 доминирует над В 4 и В 5, а В 1 – над В 2. Удаляем лишние столбцы. Получаем игру 3 х2. В которой А 3 дублирует А 1, следовательно ее можно также отбросить. В результате: Аi Bj B 1 B 3 A 1 4 2 A 2 3 6 A 3 4 2 Такую игру уже нельзя упростить и необходимо решать. Первое, что необходимо сделать – это проверить не обладает ли игра седловой точкой – если она есть, то можно получить решение в чистых стратегиях. Тогда все просто, но чаще этой точки нет. Пусть имеется игра mxn без седловой точки с матрицей aij.

Пусть имеется игра mxn без седловой точки с матрицей aij. Аi Bj B 1 Пусть имеется игра mxn без седловой точки с матрицей aij. Аi Bj B 1 B 2 … Bn A 1 a 12 … a 1 n A 2 a 21 a 22 … a 2 n am 1 am 2 … amn … Am Необходимо найти решение игры – две оптимальные смешанные стратегии SA*=(p 1, p 2, . . , pm), SB*=(q 1, q 2, . . , qn) дающие каждой стороне максимально возможный для нее средний выигрыш (минимальный проигрыш). Сначала определим стратегию для А. Пусть А применяет всегда оптимальную для себя стратегию, в этом случае В не сможет улучшить свое положение, отступая от своей оптимальной стратегии. Заставим В отступать от своей оптимальной стратегии, пользуясь чистыми стратегиями В 1, В 2, . . Вn. В любом случае, придерживаясь своей оптимальной стратегии, А получит выигрыш больше (не меньше) некоторого значения u. а 11 p 1+a 21 p 2+…+am 1 pm≥u а 12 p 1+a 22 p 2+…+am 2 pm≥u …………… а 1 np 1+a 2 np 2+…+amnpm≥u Разделим неравенства на u и введем обозначения: x 1=p 1/u; x 2=p 2/u; …. . ; xm=pm/u; Тогда:

а 11 х1+a 21 х2+…+am 1 хm≥ 1 а 12 х1+a 22 х2+…+am 2 а 11 х1+a 21 х2+…+am 1 хm≥ 1 а 12 х1+a 22 х2+…+am 2 хm≥ 1 …………… а 1 nх1+a 2 nх2+…+amnхm≥ 1 Так как р1+р2+…+рm=1, то х1+х2+…+хm=1/u. Но u – это гарантированный выигрыш, который хотелось бы сделать максимальным, а следовательно величину 1/u – минимальной. Таким образом, задача решения игры свелась к математической задаче: найти неотрицательные значения переменных х, такие, чтобы они удовлетворяли линейным ограничениям-неравенствам и обращали в минимум линейную функцию этих переменных: L= х1+х2+…+хm⇒min Это типичная задача линейного программирования. Зная х можно найти вероятности р и, значит, оптимальную стратегию и цену игры u. Оптимальная стратегия игрока В находится аналогично с той лишь разницей, что В стремится минимизировать u. Одним из самых простых методов решения игр является метод итераций (метод Брауна. Робинсона). Смысл в том, что разыгрывается мысленный эксперимент, в котором А и В поочередно применяют друг против друга свои стратегии. На каждом шаге итерационного процесса игрок отвечает своей стратегией, которая является оптимальной для него относительно смешанной стратегии другого, в которую все примененные до сих пор стратегии входят пропорционально частотам их появления. Доказано, что при увеличении числа партий средний выигрыш будет сходиться к цене игры.