Биматр. игры.ppt
- Количество слайдов: 13
Биматричные Игры
Рассмотрим конфликтную ситуацию, в которой каждый из двух участников имеет следующие возможности для выбора своей линии поведения: Игрок A – может выбрать любую из стратегий A 1, …, Am. Игрок B – любую из стратегий B 1, …, Bn. При этом, если агент A выбрал i-ю стратегию Ai, а агент B – k-ю стратегию Bk, то в итоге выигрыш агента A будет равен некоторому числу aik, а выигрыш агента B – некоторому другому числу bik. Всякий раз каждый из игроков получает свой выигрыш.
Таблицы выигрышей агентов A и B A 1 … Ai B 1 a 11 … ai 1 … … Bk a 1 k … aik … … Bn a 1 n … ain … Am … am 1 … … … amk … … … amn A 1 … Ai B 1 b 11 … bi 1 … … Bk b 1 k … bik … … Bn b 1 n … bin … Am … bm 1 … … … bmk … … … bmn
Обычно таблицы записывают в виде матриц: B= … … a 1 k … aik … … … a 1 n … ain … am 1 A= a 11 … ai 1 … … amk … amn b 11 … bi 1 … … … b 1 k … bik … … … b 1 n … bin … bm 1 … bmk … bmn
A – платежная матрица агента A, а B – платежная матрица агента B. Таким образом, в случае, когда интересы агентов различны (но необязательно противоположны), получаются две платежные матрицы: одна – матрица выплат агенту A, другая – матрица выплат игроку B. Такая игра и получила название биматричной. В общем случае биматричная игра – это игра с ненулевой суммой.
Примеры биматричных игр
Борьба за рынки Небольшая фирма (агент A) намерена сбыть партию товара на одном из двух рынков, контролируемых другой, более крупной фирмой (агент B). Для этого фирма A готова сделать на одном из рынков соответствующие приготовления (например, развернуть рекламную компанию). Господствующая на рынках фирма B может попытаться воспрепятствовать этому, приняв на одном из рынков предупредительные меры. Не встречая противодействия на рынке, фирма A захватывает его, при наличии препятствий – терпит поражение.
Таким образом у фирмы A две стратегии: A 1 – выбор первого рынка, A 2 – выбор второго рынка. Такие же стратегии и у фирмы B: B 1 – выбор первого рынка, B 2 – выбор второго рынка. Для сравнения платежных матриц агентов, нужны расчетные платежные показатели: A= -10 1 2 -1 B= 5 -1 -2 1
Дилемма узников Агентами являются два узника, находящиеся в предварительном заключении по подозрению в совершении преступления. При отсутствии прямых улик возможность их осуждения в большей степени зависит от того, заговорят они или будут молчать.
Эта конфликтная ситуация приводит к биматричной игре, в которой каждый из агентов имеет по две стратегии – молчать (1) или говорить (2). Выигрыши агентов A и B соответственно описываются так: (1) (2) (1) -1 0 (2) -9 -6 (1) (2) (1) -1 -9 (2) 0 -6
Студент -преподаватель Студент (агент A) готовится к зачету, который принимает преподаватель (агент B). Можно считать, что у студента две стратегии – подготовиться к сдаче зачета (+) и не подготовиться (-). У преподавателя также две стратегии – поставить зачет [+] и не поставить зачет [-].
В основу значений функций выигрыша игроков положим следующие соображения: Выигрыш студента: (+) (-) [+] Оценка заслужена [-] Очень обидно Удалось обмануть Оценка заслужена Выигрыш преподавателя: (+) (-) [+] Все нормально [-] Был неправ Дал себя обмануть Опять придет
Количественно это можно выразить, например, так: (+) (-) [+] 2 1 [-] -1 0 (+) (-) [+] 1 -2 [-] -3 -1
Биматр. игры.ppt