
ДМ Теория игр.ppt
- Количество слайдов: 45
Основы теории игр • Теория игр это математическая теория конфликтов. • Конфликт – ситуация, в которой сталкиваются интересы сторон, происходит борьба интересов. Война – конфликт. Говорят «военный конфликт» . 1
• Другие примеры конфликтов – игры – шашки, шахматы, спортивные игры. • Они отличаются тем, что ведутся по определённым правилам: перечень возможных ходов и к какому результату приводит некоторая совокупность ходов. 2
• Далеко не каждый конфликт протекает по правилам ( «бои без правил» , «русские воюют не по правилам» …). • Для математического анализа конфликта необходимо представить конфликт в игровой форме, то есть указать стратегии (возможные действия) и уточнить, к какому результату приведёт игра, если каждый игрок выберет определённую стратегию. 3
• Таким образом, игра – это конфликт с чётко сформулированными условиями. 4
• Часто результат игры даже при определённых стратегиях предсказать невозможно, так как всё зависит от случая. • Тогда говорят о среднем результате, то есть о результате, приходящемся в среднем на одну партию, если будет сыграно достаточно большое число партий. • То есть, даже если случайно «везёт» , в среднем выигрывает тот, кто ведёт себя разумно. 5
• Часто результат выражается числом, даже если это просто выигрыш (1), либо проигрыш (0). • Мы будем полагать, что выигрыш (проигрыш) каждого игрока выражается числом. 6
• Таким образом, основная задача теории игр формулируется так: как должен вести себя (какую стратегию применять) разумный игрок в конфликте с разумным противником (противниками), чтобы обеспечить себе в среднем наибольший возможный выигрыш? 7
Парные игры. • Если в конфликте участвуют две стороны, то игра называется парной, если несколько – множественной. • Мы ограничимся парными играми. 8
Игры с нулевой суммой. • Игра называется с нулевой суммой, если одна сторона выигрывает то, что проигрывает другая. • Иногда называют – антагонистическая игра. Это не всегда соблюдается. • Например, один выигрывает одну сумму, а другой в этой же ситуации проигрывает другую. • Однако, во многих случаях парные игры с нулевой суммой не слишком искажают суть явлений. 9
Конечные игры. • Конечные игры – каждый игрок располагает конечным числом стратегий. В этом, помимо всего прочего выражается своего рода дискретность игры. 10
Платёжная матрица или матрица (таблица) игры с нулевой суммой: С 1 С 2 С 3 С 4 К 1 k 12 k 13 k 14 К 2 k 21 k 22 k 23 k 24 К 3 k 31 k 32 k 33 k 34 11
• Здесь К «красный» игрок, С – «синий» . • У красного три стратегии, у синего – четыре. • kij – выигрыш (проигрыш) красного, то есть проигрыш(выигрыш) синего. • Если игра представлена в виде такой таблицы (матрицы), то говорят, что игра приведена к нормальной форме. • Реально – как записать шахматы в нормальной форме? ! 12
Игра «Три пальца» • Два игрока К и С одновременно и не сговариваясь показывают один, два или три пальца. • Если всего показанных пальцев ( у К и С) будет чётное число, то выигрывает К – он получает столько очков, сколько показанных пальцев. • Если всего показанных пальцев ( у К и С) будет нечётное число, то выигрывает С. • Запишем игру в нормальной форме. 13
Игра «Три пальца» С 1 С 2 С 3 К 1 2 -3 4 К 2 -3 4 -5 К 3 4 -5 6 14
Получить наибольшую выгоду в наихудших условиях! С 1 С 2 С 3 Миниму м строк К 1 2 -3 4 -3 К 2 -3 4 -5 -5 К 3 4 -5 6 -5 Максиму м столбцо в 4 4 6 15
• Нижняя цена игры – максимин α – максимальный элемент среди минимумов строк. • Верхняя цена игры – минимакс β – минимальный элемент среди максимумов столбцов. 16
• Это принцип минимакса и он является в теории игр основным. • То есть вести себя так, чтобы получить наибольшую выгоду в наихудших условиях. • Значит, К целесообразно показывать один палец, а С – либо один, либо два. • Найденные нами стратегии обладают нехорошим свойством – они неустойчивы. 17
• Пусть К показывает один палец (К 1), а С – тоже один(С 1). К всегда выигрывает 2 очка. • Тогда С переходит на С 2 и будет выигрывать 3 очка. • Тогда К, не будь дурак, переходит на К 2. А С в ответ – на С 3 и так далее… • Равновесии нарушается. 18
Седловая точка. Чистая цена игры. Рассмотрим другой пример. С С m 1 2 3 4 i n К 10 1 1 2 1 1 К 6 2 8 5 6 5 К 2 3 4 4 8 2 m 10 8 a x 5 8 19
• Здесь α =5 и β =5. Особый случай! • Пара стратегий К 2, С 3 устойчива и представляет собой решение игры. Никому не выгодно отступать от своих стратегий. • Это связано с тем, что в матрице есть элемент, являющийся одновременно и минимаксом и максимином. • Такой элемент называется седловой точкой. • Сама седловая точка - цена игры. 20
• Если матрица игры имеет седловую точку (седловые точки), то игра имеет решение в так называемых чистых стратегиях. • Это пара стратегий, пересекающихся в седловой точке. • А если α не равно β ? • Решение есть и в этом случае, только оно лежит в области смешанных стратегий, то есть путём чередования стратегий с какими - то вероятностями. 21
• Систематическое применение этих стратегий, называемых оптимальными, обеспечивает каждой стороне максимально возможный для неё выигрыш, определяемый ценой игры. 22
• Если же одна из сторон от своей оптимальной стратегии (в то время как другая продолжает придерживаться своей), то это ни в коем случае не может быть выгодно: выигрыш либо будет неизменным, либо уменьшится. • Таки образом, каждая конечная игра имеет решение (возможно в области смешанных стратегий). • Это утверждает основная теорема теории игр. 23
Игра осада и оборона города • «Красные» стремятся занять город, «синие» обороняют. • В город ведут две дороги 1 и 2. • У «красных» два отряда. • У «синих» - три отряда. Если встречаются равные силы «красных» и «синих» , то в 50% случаях красные побеждают и занимают город, а в 50% случаев отступают. • Если красные встречаются с превосходящими силами синих ( один отряд на два или два с тремя) они отступают. 24
• Как должны действовать красные? • Стратегии «красных» (дискретные): • К 1 – послать оба отряда по дороге 1; • К 2 – послать оба отряда по дороге 2; • К 3 – послать по одному отряду на каждую дорогу. 25
• Стратегии «синих» (дискретные): • С 1 -поставить все три отряда на дорогу 1; • С 2 -поставить все три отряда на дорогу 2; • С 3 -поставить два отряда на дорогу 1 и один на дорогу 2; • С 4 -поставить два отряда на дорогу 2 и один на дорогу 1. • Нет «одноотрядных» стратегий! 26
С 1 С 2 С 3 С 4 К 1 0% 100% 50% 100% К 2 100% 0% 100% 50% К 3 100% 50% 27
Выигрыш – процент случаев, когда красным удается занять город. С 1 С 2 С 3 С 4 min К 1 0% 100% 50% 100% 0% К 2 100% 0% 100% 50% 0% К 3 100% 50% 50% max 100% 28
• Таким образом, нижняя чистая цена игры α=50%, верхняя чистая цена игры β=100%. • Тогда цена игры при смешанных стратегиях: 29
Получим решение игры. Будем указывать не проценты, а числовое значение выигрыша – 1, либо 0, 5: С 1 С 2 С 3 С 4 min К 1 0, 5 1 0 К 2 1 0, 5 0 К 3 1 1 max 1 1 0, 5 1 1 30
• Составим систему уравнений для неизвестных значений оптимальной стратегии красных: 31
Разделим левые и правые части неравенств на значение правой части: 32
• Обозначим и введём переменную z для перехода к равенствам: • Тогда: 33
• Поскольку стремимся максимизировать выигрыш ν: 34
• Получили задачу линейного программирования. • При полезных стратегиях синих получаем zi =0. • Тогда из первого уравнения 35
• Из второго: 36
• Из третьего находим: 37
Отсюда 38
Тогда 39
А посему: 40
Таким образом, оптимальная смешанная стратегия красных имеет вид: 41
• То есть красные должны одинаково часто применять каждую из своих стратегий. • Составим теперь систему уравнений для неизвестных значений оптимальной стратегии синих: 42
43
Решение имеет вид: 44
• То есть синие в одной трети случаев посылают все три отряда на одну дорогу (любую), а в остальных – две на одну, а один – на другую. • Однако, все эти рассуждения ориентированы на многократное проведение «экспериментов» сражений. • Реальный бой реализуется один раз и кто выиграет определяется не теорией игр, а военным искусством… • На то оно и искусство! 45