Скачать презентацию 1 Чернов Владимир Георгиевич Исследование операций  № Скачать презентацию 1 Чернов Владимир Георгиевич Исследование операций №

Презентация _исследование операций.ppt

  • Количество слайдов: 125

1 Чернов Владимир Георгиевич Исследование операций 1 Чернов Владимир Георгиевич Исследование операций

№ Раздел п/п дисциплины Се Нед мес е ля тр семе стра Виды учебной № Раздел п/п дисциплины Се Нед мес е ля тр семе стра Виды учебной работы, включая самостоятельную работу студентов и трудоемкость (в часах) 1 2 4 4 1 2 СРС 5 часов 4 3 СРС 2 часа 4 4 СРС 4 часа, 4 5 СРС 4 часа 4 6 СРС 4 часа 4 7, 9 Практические занятия 6 часов. СРС 6 часов 3 4 5 6 7 Введение. Основные понятия исследования операций. Операция, эффективность операции. Математическая модель операции Общая постановка задачи исследования операций. Детерминированн ый случай Оптимизация решения в условиях неопределенност и Методы принятия решений в условиях статистической неопределенност и. Стратегические игры. Формы текущего контроля успеваемости (по неделям семестра) Форма промежуточно й аттестации (по семестрам) 1 й рейтинг

2 ОСНОВНЫЕ ПОНЯТИЯ ИССЛЕДОВАНИЯ ОПЕРАЦИЙ 1. ОПЕРАЦИЯ. ЭФФЕКТИВНОСТЬ ОПЕРАЦИИ Под операцией мы будем понимать 2 ОСНОВНЫЕ ПОНЯТИЯ ИССЛЕДОВАНИЯ ОПЕРАЦИЙ 1. ОПЕРАЦИЯ. ЭФФЕКТИВНОСТЬ ОПЕРАЦИИ Под операцией мы будем понимать любое мероприятие (или систему действий), объединенное единым замыслом и направленное к достижению определенной цели. Основная задача исследования операций—предварительное количественн обоснование оптимальных решений. Под эффективностью операции подразумевается степень ее приспособленности к выполнению стоящей перед ней задачи. Чем лучше организована операция, тем она эффективнее. Рассмотрим отдельную операцию О. Показатель эффективности операции -W.

3 2. МАТЕМАТИЧЕСКАЯ МОДЕЛЬ ОПЕРАЦИИ Математические модели, применяемые в настоящее время в задачах исследования 3 2. МАТЕМАТИЧЕСКАЯ МОДЕЛЬ ОПЕРАЦИИ Математические модели, применяемые в настоящее время в задачах исследования операций, можно грубо подразделить на два класса: аналитические и статистические. ОБЩАЯ ПОСТАНОВКА ЗАДАЧИ ИССЛЕДОВАНИЯ ОПЕРАЦИИ. ДЕТЕРМИНИРОВАННЫЙ СЛУЧАЙ Пусть имеется некоторая операция 0 Эффективность операции характеризуется каким-то численным критерием или показателем W. Рассмотрим сначала наиболее простой случай: все факторы, от которых зависит успех операции, делятся на две группы: — заданные, заранее известные факторы (условия проведения операции) al, а 2. . . , на которые мы влиять не можем; — зависящие от нас факторы (элементы решения) xl, х2, . . . , которые мы, в известных пределах, можем выбирать по своему усмотрению. W=W(al, a 2, . . . xl, х2, . . . ). (3. 1) При заданных условиях al, a 2, . . . найти такие элементы решения xl, x 2, . . . , которые обращают показатель W в максимум.

4 4. ОБЩАЯ ПОСТАНОВКА ЗАДАЧИ ИССЛЕДОВАНИЯ ОПЕРАЦИИ. ОПТИМИЗАЦИЯ РЕШЕНИЯ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ Эффективность операции 4 4. ОБЩАЯ ПОСТАНОВКА ЗАДАЧИ ИССЛЕДОВАНИЯ ОПЕРАЦИИ. ОПТИМИЗАЦИЯ РЕШЕНИЯ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ Эффективность операции зависит уже не от двух, а от трех категорий факторов: условия выполнения операции al, а 2, . . . , которые известны заранее и изменены быть не могут; неизвестные условия или факторы Yl, Y 2, . . . ; элементы решения xl, х2, . . . , которые нам предстоит выбрать. Пусть эффективность операции характеризуется некоторым показателем W, зависящим от всех трех групп факторов. Запишем это в виде общей формулы: W=W(a 1, a 2, . . . ; Y 1, Y 2, . . . ; х1, х2, . . . ). При заданных условиях а 1, а 2, . . . , с учетом неизвестных факторов Y 1, Y 2, . . . найти такие элементы решения х1, х2, . . . , которые по возможности обращали бы в максимум показатель эффективности W Это — уже другая, не чисто математическая задача (недаром в ее формулировке сделана оговорка «по возможности» ). Наличие неизвестных факторов Yl, Y 2, . . . переводит нашу задачу в другую категорию, она превращается в задачу о выборе решения в условиях неопределенности.

5 «Исследование операций представляет собой искусство давать плохие ответы на те практические вопросы, на 5 «Исследование операций представляет собой искусство давать плохие ответы на те практические вопросы, на которые даются еще худшие ответы другими методами» . Т. Л. Саати «Математические методы исследования операций» В случае, когда неизвестные факторы, фигурирующие в операции — Y 1, Y 2, . . — являются обычными случайными величинами (или случайными функциями), распределение которых, хотя бы ориентировочно, известно, для оптимизации решения может быть применен один из двух приемов: — искусственное сведение к детерминированной схеме; — «оптимизация в среднем» . Первый прием применяется по преимуществу в грубых, ориентировочных расчетах, когда диапазон случайных изменений величин Yl, Y 2, . . сравнительно мал, т. е. они без большой натяжки могут рассматриваться как не случайные. Заметим, что тот же прием замены случайных величин их математическими ожиданиями может успешно применяться и в случаях, когда величины Yl, Y 2, . . обладают большим разбросом, но показатель эффективности W зависит от них линейно (или почти линейно).

6 Во втором случае нужно выбирать такое решение XI, Х 2, . . . 6 Во втором случае нужно выбирать такое решение XI, Х 2, . . . , при котором обращается в максимум математическое ожидание показателя эффективности: W=M[W}= W(a 1, а 2, . . . ; У 1, у2, . . . ; х1, х2. . . ) (У 1, у2, . . . ) dy 1 dy 2. . d(Yl), d Y 2), . . . ). плотность распределения случайных величин Yl, Y 2, . . . Наиболее трудным для исследования является тот случай неопределенности, когда неизвестные факторы Yl, Y 2, . . . не могут быть изучены и описаны с помощью статистических методов: их законы распределения или не могут быть получены (соответствующие статистические данные отсутствуют), или, что еще хуже, таких законов распределения вовсе не существует. Это бывает, когда явление, о котором идет речь, не обладает свойством статистической устойчивости

7 Эффективность операции W зависит, помимо заданных условий al, a 2, . . . 7 Эффективность операции W зависит, помимо заданных условий al, a 2, . . . и элементов решения xl, х2, . . . , еще и от ряда неизвестных факторов Yl, Y 2, . . . нестатистической природы, о которых определенных сведений нет, а можно делать только предположения. Попробуем все же решить задачу. Зафиксируем мысленно параметры Yl, Y 2, . . . , придадим им вполне определенные значения Yl=yl, Y 2=y 2, . . . , и переведем тем самым в категорию заданных условий al, a 2, . . Для этих условий мы в принципе можем решить задачу исследования операций и найти соответствующее оптимальное решение xl, х2, . . . Его элементы, кроме заданных условий al, a 2, . . . , очевидно, будут зависеть еще и от того, какие частные значения мы придали условиям Yl, Y 2, . . . : xl =xl (al, a 2, . . . ; yl, у2, . . . ); х2 =x 2(al, а 2, . . . ; yl, у2, . . . ). Такое решение, оптимальное для данной совокупности условий yl, у2, . . . (и только для нее), называется локально-оптимальным.

8 Вопросы. 1. В чем заключается смысл понятия « операция» ? 2. Приведите примеры 8 Вопросы. 1. В чем заключается смысл понятия « операция» ? 2. Приведите примеры , когда к событиям Вашей повседневной жизни может быть применено понятие «операция» . 3. Почему при исследовании операций можно ограничиться лишь задачей максимизации критерия эффективности? 4. Какие виды ситуаций рассматриваются в теории исследования операций? 5. Какие виды решения задач исследования операций могут использоваться в детерминированных ситуациях? 6. Почему в условиях неопределенности задачу исследования операций решают как задачу оптимизации в среднем?

9 ОСНОВЫ ТЕОРИИ СТРАТЕГИЧЕСКИХ ИГР Типичный конфликт характеризуется тремя основными составляющими: заинтересованными сторонами; интересами 9 ОСНОВЫ ТЕОРИИ СТРАТЕГИЧЕСКИХ ИГР Типичный конфликт характеризуется тремя основными составляющими: заинтересованными сторонами; интересами этих сторон; их возможными действиями. ТЕОРИЯ ИГР- это математическая теория конфликтов. Протекание конфликта состоит в выборе каждым игроком своей стратегии и в получении им в сложившейся ситуации выигрыша из некоторого источника. На этом пути создается теория игр с выигрышами. Однако оценка игроком ситуации путем предположения о своем выигрыше, вообще говоря, не всегда возможна практически и даже не всегда имеет смысл. В подобных случаях иногда удается вместо прямых численных оценок ситуаций указывать на их сравнительную предпочтительность для отдельных игроков. На этом пути создается теория игр с предпочтениями, включающая в себя теорию игр с выигрышами как частный случай. В дальнейшем мы ограничимся рассмотрением только игр с выигрышами.

10 Мы будем стремиться: • к выработке принципов оптимальности, т. е. того критерия, по 10 Мы будем стремиться: • к выработке принципов оптимальности, т. е. того критерия, по которому поведение игроков следует считать оптимальным (разумным, целесообразным); • выяснению реализуемости этих принципов, т. е. установлению существования оптимальных в выработанном смысле ситуаций и отысканию этих реализаций. Оптимальной называется стратегия, которая при многократном повторении игры обеспечивает данному игроку максимально возможный средний выигрыш. Количество стратегий у каждого игрока может быть конечным или бесконечным, в зависимости от этого игры подразделяются на конечные и бесконечные.

11 Матричные игры Предположим что игрок А имеет m стратегий, а игрок B имеет 11 Матричные игры Предположим что игрок А имеет m стратегий, а игрок B имеет n стратегий. Пусть игрок A выбрал стратегию i, а игрок B – стратегию k. Будем считать, что выбор игроками стратегий и однозначно определяет исход игры – выигрыш игрока A и выигрыш игрока B, причем эти выигрыши связаны равенством: (отрицательный выигрыш обычно называют проигрышем). Полученная матрица имеет размеры m x n и называется матрицей игры или платежной матрицей (отсюда и название игры – матричная).

12 Матричные игры относятся к разряду так называемых антагонистических игр, т. е. игр, в 12 Матричные игры относятся к разряду так называемых антагонистических игр, т. е. игр, в которых интересы игроков прямо противоположны. Рассматриваемая модель называется антагонистической игрой двух лиц с нулевой суммой (имеются два участника, и выигрыш одного равен проигрышу другого. Матричная игра двух игроков с нулевой суммой может рассматриваться как следующая абстрактная игра двух игроков. Первый игрок имеет m стратегий i = 1, 2, . . . , n, второй имеет n стратегий j = 1, 2, . . . , n. Каждой паре стратегий (i, j) поставлено в соответствие число аij, выражающее выигрыш игрока 1 за счёт игрока 2, если первый игрок примет свою i-ю стратегию, а 2 - свою j-ю стратегию. Каждый из игроков делает один ход: игрок 1 выбирает свою i-ю стратегию (i=1, 2… m), 2 -й свою j-ю стратегию (j=1, 2, …), после чего игрок 1 получает выигрыш аij за счёт игрока 2 (если аij <0, то это значит, что игрок 1 платит второму сумму |аij |). На этом игра заканчивается. Каждая стратегия игрока i(i=1, 2…m); j (j=1, 2, …n) часто называется чистой стратегией.

13 (1). Определение. Число α , определённое по формуле (1) называется нижней чистой ценой 13 (1). Определение. Число α , определённое по формуле (1) называется нижней чистой ценой игры и показывает, какой минимальный выигрыш может гарантировать себе игрок 1, применяя свои чистые стратегии при всевозможных действиях игрока 2. (2). Определение. Число β, определяемое по формуле (2 ), называется чистой верхней ценой игры и показывает, какой максимальный выигрыш за счёт своих стратегий может себе обеспечить игрок 1. Верхнею цену игры можно интерпретировать и как максимальный проигрыш, который может гарантировать себе второй игрок при любых чистых стратегиях первого игрока.

14 Определение. Если в игре с матрицей А α=β , то говорят, что эта 14 Определение. Если в игре с матрицей А α=β , то говорят, что эта игра имеет седловую точку в чистых стратегиях и чистую цену игры - гиперболическиq параболоид Пример. У 2 У 3 У 4 А(х) У 1 Х 1 7 2 5 1 1 Х 2 2 2 3 4 2 Х 3 5 3 4 4 3 Х 4 3 2 1 6 1 В(у) 7 3 5 6

Вопросы 1. В чем заключаются особенности конфликтной ситуации? 2. Каким видом игры можно формализовать Вопросы 1. В чем заключаются особенности конфликтной ситуации? 2. Каким видом игры можно формализовать конфликтную ситуацию? 3. Что отражает матрица игры? 4. Какой уровень выигрыша гарантирует себе игрок , если он выбирает 5. стратегию, соответствующую седловой точке? • 6. Как определяется седловая очка? • 7. Будет ли значение выигрыша в седловой точке зависеть от выбора стратегии другого игрока? • 8. Как называются стратегии игроков, соответствующие седловой точке? • • •

Смешанные стратегии в матричных играх • Исследование в матричных играх начинается с нахождения её Смешанные стратегии в матричных играх • Исследование в матричных играх начинается с нахождения её седловой точки в чистых стратегиях. Если матричная игра имеет седловую точку в чистых стратегиях, то нахождением этой седловой точки заканчивается исследование игры. Если же в игре нет седловой точки в чистых стратегиях, то можно найти нижнюю и верхнюю чистые цены этой игры, которые указывают, что игрок 1 не должен надеяться на выигрыш больший, чем верхняя цена игры, и может быть уверен в получении выигрыша не меньше нижней цены игры. Улучшение решений матричных игр следует искать в использовании секретности применения чистых стратегий и возможности многократного повторения игр в виде партии. Этот результат достигается путём применения чистых стратегий случайно, с некоторой вероятностью.

 • Пример. А 1 А’ В 1 3 6 3 В 2 5 • Пример. А 1 А’ В 1 3 6 3 В 2 5 4 4 B’ Р=0. 5 А 2 5 6 Средние потери второго игрока при стратегии Х 1 первого L=0. 5*3+0. 5*6=4. 5, при стратегии. Х 2 L=0. 5*5+0. 5*4=4. 5 Следовательно, второй игрок может ограничить свой средний проигрыш величиной 4. 5 независимо от стратегий, применяемых первым игроком.

 • Определение. Смешанной стратегией игрока называется полный набор • вероятностей применения его чистых • Определение. Смешанной стратегией игрока называется полный набор • вероятностей применения его чистых стратегий. Таким образом, если игрок 1 имеет m чистых стратегий 1, 2, . . . , m, то его смешанная стратегия x это набор чисел p = (p 1, . . . , pm) удовлетворяющих соотношениям pi 0 (i = 1, …, m), = 1. Аналогично для игрока 2, который имеет n чистых стратегий, смешанная стратегия q- это набор чисел q= (q 1, . . . , qn), qj 0 (j= 1, …, n), = 1. Так каждый раз применение игроком одной чистой стратегии исключает применение другой, то чистые стратегии являются несовместными событиями. Кроме того, они являются единственными возможными событиями. Чистая стратегия есть частный случай смешанной стратегии. Действительно, если в смешанной стратегии какая-либо i-я чистая стратегия применяется с вероятностью 1, то все остальные чистые стратегии не применяются. И эта i-я чистая стратегия является частным случаем смешанной стратегии. Для соблюдения секретности каждый игрок применяет свои стратегии независимо от выбора другого игрока.

 • Определение. Средний выигрыш игрока 1 в матричной игре с матрицей А выражается • Определение. Средний выигрыш игрока 1 в матричной игре с матрицей А выражается в виде математического ожидания его выигрышей L(A, p, q) = = p A q. T Первый игрок имеет целью за счёт изменения своих смешанных стратегий p максимально увеличить свой средний выигрыш L(А, p, q), а второй - за счёт своих смешанных стратегий стремится сделать L (А, p, q) минимальным, т. е. для решения игры необходимо найти такие p и q, при которых достигается верхняя цена игры L(А, p, q). Аналогичной должна быть ситуация и для игрока 2, т. е. нижняя цена игры должна быть L(А, p, q). Подобно играм, имеющим седловые точки в чистых стратегиях, вводится следующее определение: оптимальными смешанными стратегиями игроков 1 и 2 называются такие наборы pо, qо соответственно, которые удовлетворяют равенству L (А, p, q 0) L (А, pо, qо) L(А, pо, q)

 Решение игр • Решение игры –это процесс нахождения игроков своих оптимальных стратегий, который Решение игр • Решение игры –это процесс нахождения игроков своих оптимальных стратегий, который состоит из нескольких этапов. • Первый –это проверка на наличие седловой точки, т. к. в этом случае значительно упрощается процесс решения игры. Если седловая точка отсутствует, то игрокам целесообразно использовать смешанные стратегии, которые и должны быть найдены в результате решения игры. • Однако прежде, чем приступать к нахождению смешанных стратегий целесообразно провести проверку доминирования стратегий, которая позволит игрокам исключить из рассмотрения заведомо невыгодные для них стратегии, что позволит сократить размерность решаемой задачи. Таким образом, вторым этапом решения игры является проверка доминирования. • И, наконец, третий этап –это непосредственное решение игры. • Первый этап проверка на наличие седловой точки был рассмотрен в предыдущем разделе

Доминирующие и полезные стратегии • Смешанные стратегии игроков представляют собой смесь чистых стратегий, которые Доминирующие и полезные стратегии • Смешанные стратегии игроков представляют собой смесь чистых стратегий, которые выбираются в соответствии с выбранным законом распределения вероятностей. Однако во многих случаях очевидно, что применение некоторых из чистых стратегий явно нецелесообразно и при определении оптимальной смешанной стратегии их просто не следует учитывать. Будем называть те из чистых стратегий, которые входят в состав оптимальной смешанной стратегии, полезными стратегиями игрока. для облегчения выделения полезных стратегий введем понятия доминирующих стратегий. • Рассмотрим две стратегии l и p второго игрока. Пусть первый игрок применяет стратегию i. Потери второго игрока будут соответственно и . Может оказаться что т. е. в матрице игры потери в столбце l не превосходят соответствующих потерь в столбце p. (4)

 • • Это означает, что второму игроку ни при каких условиях невыгодно применять • • Это означает, что второму игроку ни при каких условиях невыгодно применять стратегию p, т. к. применяя ее, он заведомо несет большие потери, чем при стратегии l. Поэтому стратегия p должна быть отброшена, т. е. вычеркнута из матрицы игры. Стратегия l, удовлетворяющая условию (4) оказывается доминирующей по отношению к стратегии p. Доминирующие стратегии второго игрока имеют наглядную геометрическую иллюстрацию при переходе к эквивалентной S игре на плоскости. В этом случае m=2 и условие (4) запишется в виде На рис. 1 приведены два случая расположения точек и , соответствующих чистым стратегиям l и p второго игрока. Нетрудно видеть, (рис. 1. а) что стратегия l доминирует над стратегией p. В случае , представленном рис. 1. б, ни одна из стратегий не является доминирующей.

 • • Для того чтобы стратегия l доминировала над стратегией p, точка должна • • Для того чтобы стратегия l доминировала над стратегией p, точка должна лежать левее и ниже точки р. Аналогично определяются доминирующие стратегии первого игрока. Стратегия l доминирует над стратегией p, если выигрыш первого игрока при стратегии l больше выигрыша при стратегии p при любой стратегии второго игрока Удаление из матрицы игры тех стратегий , над которыми доминируют другие, значительно упрощает игру, а следовательно поиск оптимальной стратегии. Можно показать, что в игре с матрицей размером число полезных стратегий каждого из игроков не превышает наименьшего из чисел m и n. Теорема. Если один из игроков придерживается своей оптимальной смешанной стратегии , то выигрыш игрока остается неизменным и равным цене игры, независимо от того, какую смешанную стратегию (или чистую) стратегию применяет другой игрок, если только он не выходит за пределы своих полезных стратегий.

Методы решения игр • • Решение игры путем сведения ее к задаче линейного программирования Методы решения игр • • Решение игры путем сведения ее к задаче линейного программирования Предположим, что цена игры положительна ( > 0). Итак, пусть дана матричная игра с матрицей А порядка m х n. Оптимальные смешанные стратегии p = (p 1, . . . , pm), q = (q 1, . . . , qn) соответственно игроков 1 и 2 и цена игры должны удовлетворять соотношениям. Разделим все уравнения и неравенства в (1) и (2) на (это можно сделать, т. к. по предположению > 0) и введём обозначения :

 • Тогда (1) и (2) перепишется в виде : • Тогда (1) и (2) перепишется в виде :

Пример. Найти решение игры с матрицей, заданной таблицей В 1 В 2 В 3 Пример. Найти решение игры с матрицей, заданной таблицей В 1 В 2 В 3 А 1 2 -3 4 А 1 7 2 9 А 2 -3 4 -5 А 2 2 9 0 А 3 4 -5 6 А 3 9 0 11 Решим задачу для первого игрока и запишем уравнения для его среднего выигрыша

 • Разделим обе части этих уравнений на и обозначим (6) • Разделим обе части этих уравнений на и обозначим (6)

 • Запишем для смешанных стратегий второго игрока одно уравнение вида и два уравнения • Запишем для смешанных стратегий второго игрока одно уравнение вида и два уравнения для полезных стратегий Вспоминая, что ко всем элементам матрицы игры прибавлялось число 5, находим цену игры

Графоаналитический метод решения стратегических игр • • S-игра в играх 2 × 2, 2 Графоаналитический метод решения стратегических игр • • S-игра в играх 2 × 2, 2 × m и n × 2. Решению игры 2× 2 можно дать простую геометрическую интерпретацию. Пусть имеется игра 2× 2 с матрицей, приведенной в таб. 1. а 11 а 12 а 21 а 22

 • Возьмем участок оси абсцисс длиной 1 (рис. 1). а 11 а 21 • Возьмем участок оси абсцисс длиной 1 (рис. 1). а 11 а 21 Средний выигрыш первого игрока а 12 а 22

 • Несмотря на наличие пересечения стратегий, решение дает для обоих игроков чистые стратегии • Несмотря на наличие пересечения стратегий, решение дает для обоих игроков чистые стратегии ( и ), а цена игры .

В данном случае нижняя граница выигрыш совпадает со стратегией Стратегия для противника является заведомо В данном случае нижняя граница выигрыш совпадает со стратегией Стратегия для противника является заведомо невыгодной.

 • Геометрическая интерпретация дает возможность представить наглядно также нижнюю и верхнюю цены игры • Геометрическая интерпретация дает возможность представить наглядно также нижнюю и верхнюю цены игры (рис. 5). Рис. 5

 • Совершенно аналогично может быть решена любая игра 2×n, где у нас имеются • Совершенно аналогично может быть решена любая игра 2×n, где у нас имеются всего две стратегии, а у противника – произвольное число.

 • • В теории игр доказывается, что у любой конечной игры имеется решение, • • В теории игр доказывается, что у любой конечной игры имеется решение, в котором число «полезных» стратегий той и другой стороны не превосходит наименьшего из двух чисел m и n. В частности, из этого следует, что у игры 2 xn всегда имеется решение, в котором с той и другой стороны участвует не более двух «полезных» стратегий. Пользуясь геометрической интерпретацией, можно дать простой способ решения любой игры. Непосредственно по чертежу находим пару «полезных» стратегий противника и , пересекающиеся в точке (если в точке пересекается более двух стратегий, берем любые две из них). Мы знаем, что если игрок А придерживается своей оптимальной стратегии, то выигрыш не зависит от того, в какой пропорции применяет В свои «полезные» стратегии, следовательно: Из этих уравнений и условия и цену игры находим

 • Зная цену игры, можно сразу определить оптимальную стратегию игрока В. Для этого • Зная цену игры, можно сразу определить оптимальную стратегию игрока В. Для этого решается, например, уравнение: В случае, когда мы располагаем стратегиями, а противник – всего двумя, очевидно, задача решается совершенно аналогичным способом; достаточно заметить, что, изменяя знак выигрыша на обратный, можно превратить игрока А из «выигрывающего» в «проигрывающего» . Можно решить игру и без перемены знака выигрыша; тогда задача решается непосредственно для В, но строится не нижняя, а верхняя граница выигрыша (рис. 7).

 • S-игра при решении игр m × n • S-игра при решении игр m × n

ТЕОРИЯ СТАТИСТИЧЕСКИХ. РЕШЕНИИ (СТАТИСТИЧЕСКИЕ ИГРЫ) 9 1. СТРУКТУРА СТАТИСТИЧЕСКИХ ИГР а) Стратегические и статистические ТЕОРИЯ СТАТИСТИЧЕСКИХ. РЕШЕНИИ (СТАТИСТИЧЕСКИЕ ИГРЫ) 9 1. СТРУКТУРА СТАТИСТИЧЕСКИХ ИГР а) Стратегические и статистические игры • • • Специфическим видом игр, имеющих большое значение при анализе различных практических ситуаций, являются так называемые статистические игры. Они имеют ряд существенных отличий от того вида игр, которые рассматривались до сих пор и которые могут быть названы стратегическими играми. В основе теории стратегических игр лежит предположение, что интересы двух игроков являются противоположными. Каждый из игроков стремится так выбрать свою стратегию, чтобы получить для себя наибольшую выгоду и свести до минимума выгоду противника. В таких играх каждый игрок действует активно и стремится по возможности использовать свою оптимальную стратегию. Однако во многих практических ситуациях приходится сталкиваться со случаями, когда один из игроков оказывается нейтральным, т. е. таким, который не стремится извлечь для себя максимальной выгоды и, следовательно, не стремится обратить в свою пользу ошибки, совершаемые противником. К таким играм относятся игры, в которых в качестве одного из игроков выступает природа. Здесь под словом «природа» мы понимаем всю совокупность внешних обстоятельств, в условиях которых приходится принимать решение.

 • • Природу нельзя рассматривать как разумного противника, который мог бы использовать ошибки, • • Природу нельзя рассматривать как разумного противника, который мог бы использовать ошибки, совершаемые человеком. Другими словами, природа не имеет злого умысла по отношению к человеку. Она просто развивается и действует в соответствии со своими законами и во власти человека обратить эти законы себе на пользу. Если бы человек совершенно точно знал законы природы, он мог бы их использовать с максимальной для себя выгодой. Однако во многих случаях человек или не знает закона природы, или знает его недостаточно полно. Неизбежной платой за попытку получить решение в условиях неполной информации о законе природы является возможность принятия ошибочных решений. При этом практические ситуации бывают таковы, что отказаться вообще от принятия какого либо решения бывает невозможно. К тому же решение отказаться от принятия решения также есть решение, и оно может иметь столь же нежелательные последствия, как и другие решения. Единственным выходом из создавшейся ситуации являтся выработка человеком такой стратегии в отношении принятия решений, которая, хотя и не исключает возможность принятия неправильных решений, но сводит к минимуму связанные с этим нежелательные последствия.

 • • • Правда, у человека есть еще возможность изучать противника, т. е. • • • Правда, у человека есть еще возможность изучать противника, т. е. природу, посредством проведения эксперимента. Теоретически путем проведения неограниченного эксперимента мы можем сделать свои знания о природе сколь угодно полными и действовать уже в условиях полной определенности. Однако этому мешают два обстоятельства: на проведение эксперимента требуется время, тогда как решение во многих случаях нужно принять быстро; эксперимент требует затраты средств, т. е. может стоить дорого — дороже того выигрыша, который дают добавочные знания, полученные в результате эксперимента. Поэтому важной задачей человека в игре против «природы» является принятие решения о том, нужно ли проводить эксперимент, а если нужно, то какой, когда его закончить и какие действия предпринять после окончания эксперимента. Игры, в которых одним противником является природа, а другим — человек, получили название статистических игр, а теория таких игр называется теорией статистических решений. Человека, который участвует в игре против природы, будем в дальнейшем называть статистиком.

Пространство стратегий природы • Под стратегией природы будем понимать полную совокупность внешних условий, в Пространство стратегий природы • Под стратегией природы будем понимать полную совокупность внешних условий, в которых приходится принимать решение. Эту совокупность внешних условий назовем состоянием природы В общем случае существует некоторое множество возможных состояний природы Элементы этого пространства будем называть чистыми стратегиями природы. Если бы нам было известно заранее, какую из своих чистых стратегий применяет природа в каждом конкретном случае, то мы с уверенностью принимали бы решение на основании полного знания состояния природы. Однако обычно бывает известен только перечень чистых стратегий природы. Кроме того, из прошлого опыта бывает известно, как часто природа применяет ту или иную из своих чистых стратегий, т. е. бывает известно априорное распределение вероятностей на пространстве состояний природы Это априорное распределение вероятностей будем называть смешанной стратегией природы.

 • Пространство стратегий статистика и функция потерь • Задача статистика состоит в том, • Пространство стратегий статистика и функция потерь • Задача статистика состоит в том, чтобы принять какое либо решение или выполнить какое либо действие из совокупности решений или действий. Обозначим воз можные действия статистика через . Каждое из этих действий есть чистая стратегия статистика. Множество является пространством чистых стра тегий статистика. Статистик должен уметь оценить каждое из своих действий. Для этого он допускает, что, совершая , зависящий как от выполняемого действия а, так и от неизвестного ему состояния природы υ. Функция L(, υ а), называемая функцией потерь, должна быть заранее определена для всех возможных комбинаций и т. е. должна быть задана на прямом произведении множеств А. действие а, он может потерпеть убыток Ее можно задавать или аналитически, или по аналогии с матрицей потерь

 • • Знание функции потерь позволяет статистику предпринять действия, которые являются наилучшими в • • Знание функции потерь позволяет статистику предпринять действия, которые являются наилучшими в условиях имеющейся у него информации о состоянии природы. Статистику бывает обычно известна смешанная стратегия природы , т. е. априорное распределение вероятностей на пространстве состояний природы Знание априорного распределения вероятностей позволяет определить средние потери, которые несет статистик, выполняя то или иное действие: Наилучшим для статистика действием будет так на зываемое айесовское действие а*, б при котором потери будут минимальны и равны: Статистик не обязательно должен ограничиваться использованием только одной чистой стратегии. Он может использовать смесь чистых стратегий в соответствии с некоторым вероятностным законом распределения. В этом случае будем говорить о смешанной стратегии статистика. Для применения смешанной стратегии статистик должен задаться распределением вероятностей , определяющим вероятности, с которыми он будет использовать свои чистые стратегии

 • В общем случае статистик располагает некоторым набором смешанных стратегий называемым пространством смешанных • В общем случае статистик располагает некоторым набором смешанных стратегий называемым пространством смешанных стра тегий статистика. Если статистик применяет смешанную стратегию , а природа применяет смешанную стратегию, то средние потери статистика В этом случае задача статистика состоит в том, что бы выбрать такую стратегию при которой его средние потери будут минимальны, т. е. В рассмотренных случаях решалась сравнительно простая статистическая задача — определение наилучшей стратегии статистика только на основании имеющейся априорной информации о состояниях природы. Здесь статистик не делает попытки уточнить свои знания о действительном состоянии природы путем проведения эксперимента. Поэтому данный тип статистической игры может быть назван статистической игрой без эксперимента.

 • • • г) Примеры статистических игр Для лучшего понимания структуры статистических игр • • • г) Примеры статистических игр Для лучшего понимания структуры статистических игр и методов их решения приведем несколько примеров, на которых в дальнейшем будем иллюстрировать основные положения теории статистических решений. Пример 9 1. Задача о замене оборудования. Установленное на предприятии сложное и дорогое оборудование после k лет работы может оказаться в одном из трех состояний: υ1 — оборудование вполне работоспособно и требует лишь не большого текущего ремонта; υ2 — некоторые детали значительно износились и требуют серьезного ремонта или замены; υз — основные детали износились настолько, что дальнейшая эксплуатация оборудования невозможна. Прошлый опыт эксплуатации аналогичного оборудования пока зывает, что в 20% случаев оно может находиться в состоянии υ1, в 50% случаев — в состоянии υ2 и в 30% случаев — в состоянии υз. Для предприятия возможны три различных способа действия: а 1— оставить оборудование в работе еще на год, проведя незначительный ремонт своими силами; а 2 — провести капитальный ремонт оборудования с вызовом специальной бригады ремонтников; аз — заменить оборудование новым. Потери, которые несет предприятие при различных способах действия, приведены в табл. 9 1. В величину потерь входят стоимость ремонта или замены оборудования, а также убытки, связан ные с ухудшением качества продукции и с простоями, вызванными неисправным оборудованием. В этой же таблице приведены априор ные вероятности различных состояний природы, т. е. смешанная стратегия природы ξ(ν).

Априорные вероятности состояний природы и потери в задаче о замене оборудования Табл. 9 -1. Априорные вероятности состояний природы и потери в задаче о замене оборудования Табл. 9 -1. υ ξ(υ) А а 1 а 2 а 3 υ1 0. 2 1 3 5 υ2 0. 5 5 2 4 υ3 0. 3 7 6 3 Потери, которые несёт предприятие при различных способах действия, приведены в табл. 9 -1. В величину потерь входят стоимость ремонта или замены оборудования, а также убытки, связанные с ухудшением качества продукции и с простоями, вызванными неисправным оборудованием. В этой же таблице приведены априорные вероятности различных состояний природы, т. е. смешанная стратегия природы ξ(ν). Для заданной смешанной стратегии ξ(ν) средние потери при различных способах действия

Пример 9 2. Задача о технологической линии • На технологическую линию может поступать сырье Пример 9 2. Задача о технологической линии • На технологическую линию может поступать сырье с малым количеством примесей ν 1 и с большим количеством примесей ν 1. Известно, что в среднем поступает 60% сырья первого вида и 40% сырья второго вида. Для использования различных видов сырья предусмотрены три режима работы технологической линии: а 1, а 2 и а 3. Априорные вероятности состояний природы и потери, отражающие качество выпускаемой продукции и расходы сырья в зависимости от качества сырья и режима работы технологической линии, приведены в табл. υ ξ(υ) А а 1 а 2 а 3 υ1 0. 6 0 1 3 υ2 0. 4 5 3 2 L(ξ, а, ) =2, 0; L(ξ, а 2)=1, 8; L(ξ, а 3)=2, 6. Байесовским действием будет установление режима работы а 2

СТАТИСТИЧЕСКИЕ ИГРЫ БЕЗ ЭКСПЕРИМЕНТА а) Представление статистической игры без эксперимента в виде S-игры • СТАТИСТИЧЕСКИЕ ИГРЫ БЕЗ ЭКСПЕРИМЕНТА а) Представление статистической игры без эксперимента в виде S-игры • • Статистическая игра может быть представлена в виде эквивалентной S игры совершенно таким же образом, как это делалось в стратегических играх. Для этого с каждой из чистых стратегий aj(j=1, . . . , L) связываем точку Cj=(q 1 j, . . . , qmj) в m мерном пространстве, координатами которой будут потери статистика при различных состояниях природы i=1, …, m. Так, в задаче о технологической линии чистым стратегиям статистика а 1 а 2 и а 3 будут соответствовать точки плоскости C 1=(0, 5); С 2=(1, 3) и С 3= (3, 2), как показано на рис. 9 -1. Выпуклая оболочка S* множества точек {С 1 С 2, С 3} дает область всех возможных стратегий статистика как чистых, так и смешанных. Рис. 9 -1. Представление задачио технологической линии в виде S-игры.

 • • Мы в дальнейшем рассмотрим несколько принципов, которыми может руководствоваться статистик при • • Мы в дальнейшем рассмотрим несколько принципов, которыми может руководствоваться статистик при выборе своей стратегии. При этом следует отметить, что среди статистиков не существует единого мнения на то, какой из принципов является наилучшим в статистических играх. Другими словами, не существует универсального правила, позволяющего выбрать определенный образ действия независимо от сложившейся ситуации. Однако, хотя могут иметься разногласия относительно того, что нужно делать в данной ситуации, можно придти к полному согласию относительно того, что не нужно делать. Это можно сделать, введя понятие допустимых стратегий, аналогичное понятию доминирующих стратегий в стратегических играх. б) Допустимые стратегии в статистических играх Предположим, что мы рассматриваем смешанную стратегию статистика η(а). Могут встретиться два случая. Нельзя найти ни одной стратегии, лучшей чем η(а). Это означает, что не существует такой стратегии η'(а), для которой для всех , В этом случае стратегию η(а) можно назвать допустимой. Но она не обязательно является предпочтительной, так как могут быть и другие стратегии, которые также имеют право на внимание.

 • • 2) Существует стратегия η’(a), лучшая чем η(а). Это означает, что соотношение • • 2) Существует стратегия η’(a), лучшая чем η(а). Это означает, что соотношение • для стратегии η’(a), будет справедливо при всех νєӨ В этом случае стратегию η(а) нужно исключить из рассмотрения в пользу стратегии η’(a), т. е. считать ее недопустимой. Допустимые стратегии удобно рассматривать в терминах S-игры. Поскольку в S-игре стратегия статистика определяется точкой S выпуклой оболочки S*, а потери при различных υєӨ определяются координатами этой точки, то стратегия, определяемая точкой S, будет допустимой, если не существует другой точки S'єS*, у которой все координаты будут меньше соответствующих координат точки S. Рассмотрим стратегию, определяемую точкой S 1, являющейся внутренней точкой области S*. Эта стратегия не является допустимой, так как все точки, лежащие на отрезке OS 1 внутри определяют лучшие стратегии, чем S 1. Наилучшей из них является стратегия S, принадлежащая нижней левой границе области S*. Поэтому все внутренние точки можно исключить в пользу точек, принадлежащих нижней левой границе области S*, отмеченной на рис. жирной линией.

 • Однако смещение точки вдоль этой границы не дает каких либо преимуществ, так • Однако смещение точки вдоль этой границы не дает каких либо преимуществ, так как при этом уменьшаются потери, соответствующие одному состоянию природы, но увеличиваются потери, соответствующие другому состоянию природы. Поэтому точки, принадлежащие нижней левой границе области S*, и определяют допустимые стратегии статистика. Пример 9 -3. В задаче о технологической линии (см. рис. ) левая нижняя граница области S* состоит из отрезков С 1 C 2 и С 2 С 3, каждый из которых определяется смесью чистых стратегий а 1, а 2 и а 2, а 3. Пусть 0≤w>≤ 1. Тогда уравнение для отрезка. С 1, С 2, запишется в векторной форме следующим образом: S=w. C 1+(— w)C 2. Это уравнение определяет смешанную стратегиюη(а) = (w, 1—w, 0). Проектируя уравнение отрезка С 1 C 2 на оси координат 'получим: Аналогично, уравнение отрезка С 2 С 3, определяющее смешаннуюстратегию η(а) = (0, W, 1— w), приводится к виду L(υ1, η)) = 3— 2 w; L(υ2, η)=2+w.

 • Принципы выбора стратегий в статистических играх • Принципом выбора называется правило, позволяющее • Принципы выбора стратегий в статистических играх • Принципом выбора называется правило, позволяющее определить наилучшую смешанную стратегию статистика. В различных случаях статистик может пользоваться различными принципами выбора своей стратегии. Одним из возможных принципов выбора стратегии может быть принцип минимакса. Этот принцип успешно применяется в стратегических играх, когда игра ведется против разумного противника, желающего причинить нам наибольший ущерб. Однако в ряде случаев целесообразно использовать этот принцип и в статистических играх. Согласно принципу минимакса статистик выбирает такую смешанную стратегию η(а), при которой средние потери L(υ, η) будут минимальны при наихудшем для него состояния природы υ. Наихудшим случаем будет такое υєӨ , когда величина L(υ, η) принимает максимальное значение. Эту величину статистик и должен минимизировать, т. е. выбирать стратегию η*(а), которая обеспечивает условие • •

 • • Пример 9 -4. Найдем минимаксную стратегию статистика в задаче о технологической • • Пример 9 -4. Найдем минимаксную стратегию статистика в задаче о технологической линии. Так как решение должно лежать классе допустимых стратегий, то достаточно ограничиться рассмотрением стратегий, соответствующих отрезкам С 1 С 2 и С 2 С 3 выпуклой оболочки S*. В соответствии с этими соотношениями и отрезками L(υ1, η)) = 3— 2 w; L(υ2, η)=2+w. • • • на рис. построены график L(υ, η )в функции от w для υ=υ1 b υ= υ2. Значения max. L(υ, η) отмечены жирными линиями. Как видно из рисунков, минимум этой величины на отрезке C 1 C 2 достигается при w = 0 и равен 3, а на отрезке С 2 С 3 определяется условием пересечения двух прямых 3— 2 w=2+w, т. е. достигается при w = 1/3 и равен '/з<3. Таким образом, принцип минимакса дает точку на отрезке С 2 С 3, соответствующую w =1 /3, т. е. определяет оптимальную смешанную стратегию η*=(0, 1 /3, 2/3). при которой потери статистика будут не больше величины 1/3 при любой стратегии природы.

 • • Иногда бывает целесообразно выбирать стратегию, исходя не из полных потерь L(υ, • • Иногда бывает целесообразно выбирать стратегию, исходя не из полных потерь L(υ, υ), а из так называемых дополнительных потерь L' (υ, a), определяемых из соотношений L' (υ, a) = L (υ, a ) — min L(υ, а). (9 11) a Величина min L(υ, а) для каждого состояния природы определяет те минимальные потери, которые статистик несет обязательно, даже при своем наилучшем действии, т. е. это необходимые потери. Можно считать, что необходимые потери тем или иным образом компенсируются (например, путем установления соответствующих цен на выпускаемую продукцию) и, следовательно, могут не учитываться при выборе стратегии. В этом случае выбор стратегии может быть осуществлен по принципу минимакса дополнительных потерь.

 • Минимаксные принципы, исходящие из предположения, что природа действует наихудшим для статистика образом, • Минимаксные принципы, исходящие из предположения, что природа действует наихудшим для статистика образом, являются логически оправданными в стратегических играх, но в играх статистических они выражают, по существу, точку зрения очень осторожного человека, старающегося получить хотя бы доступное и не гонящегося за максимальным, чтобы не потерпеть случайно большого ущерба. Недостатком минимаксных принципов следует считать также то, что они не учитывают априорной информации о состояниях природы и тем самым ограничивают тот выигрыш, который эта информация может дать. • Поэтому минимаксные принципы можно рекомендовать в тех случаях, когда отсутствует априорная информация о состояниях природы или есть основания сомневаться в достоверности этой информации.

Другим принципом выбора стратегии, учитывающим априорное распределение вероятностей ξ(υ) , является байесовский принцип. Согласно Другим принципом выбора стратегии, учитывающим априорное распределение вероятностей ξ(υ) , является байесовский принцип. Согласно байесовскому принципу оценка смешанной стратегии статистика η(а) производится путем усреднения потерь L(υ, η) по всем возможным состояниям природы υєӨ с учетом априорного распределения вероятностей ξ(υ), т. е. по величине Наилучшей стратегией η(а) при этом будет такая стратегия, которая дает минимум величины L(ξ, η). Эта наилучшая стратегия называется байесовской стратегией. Байесовский принцип, естественно, можно применять как к полным, так и к дополнительным потерям. Однако в дальнейших примерах мы ограничимся применением байесовского принципа только к полным потерям. Пример 9 -6. В задаче о технологической линии при ξ(υ1))=0, 6 и ξ(υ2)=0, 4 для допустимых стратегий, определяемых отрезком C 1 C 2, имеем: L(ξ, η) = (1—w)0, 6+ (3+2 w)0, 4= 1, 8+0. 2 w, так что min. L(ξ, η)) = 1, 8 при w=0, что соответствует смешанной стратегии η=(0, 1, 0); для отрезка C 2 C 3 L(ξ, η) =2, 6— 0, 8 w, так что min. L(ξ, η) =1, 8 при w=1, что соответствует том же самой w смешанной стратегии η=(0, 1, 0) Таким образом, байесовской стратегией является чистая стратегия а 2. Следует отметить, что полученный результат не является случайным. Далее мы покажем, что байесовский принцип всегда дает в качестве наилучшей стратегии одну из чистых стратегий статистика. При этом байесовское действие а* будет определяться условием.

Геометрическая трактовка байесовских стратегий • • • Рассмотрим статистическую S игру для двух состояний Геометрическая трактовка байесовских стратегий • • • Рассмотрим статистическую S игру для двух состояний природы υ1 и υ2, определяемую выпуклой областью S* на плоскости (х, у), приведенную на рис. , где x=L(υ1, η); y = L(υ2, η). Как мы знаем, допустимые стратегии лежат на нижней левой границе области S*. Рассмотрим одну из допустимых стратегий So Построим вспомогательное множество R, содержащее все точки, лежащие ниже и левее точки S 0. Очевидно, что S* и R — выпуклые множества и ни одна точка из S* не принадлежит R, в том числе и точка S 0. Построим прямую, разделяющую множества S* и R. Эта прямая должна проходить через So, т. е. должна являться опорной прямой к множеству S* точке S 0. Но она должна быть опорной прямой и для множества R. Следовательно, эта прямая должна иметь или отрицательный наклон, или быть вертикальной, или быть горизонтальной и ее уравнение может быть записано в виде y=—kx+c, k≥O.

 • Разделив обе части этого уравнения на k+l, приведем его к виду: Замечая, • Разделив обе части этого уравнения на k+l, приведем его к виду: Замечая, что а≥ 0, b≥O, a + b = 1, можем положить a = w, b = 1—w и рассматривать w и 1—w как априорные вероятности состояний природы υ1 и υ2: w=ξ(υ1), 1 w=ξ(υ2). Уравнение опорной прямой в этом случае может быть записано в виде wx+(l—w)y = c’ или L(υ1, η)ξ(υ1)+L(υ2, η)ξ(υ2)=c’ Как видим, величина с' определяет средние потери L(ξ , η) при априорных вероятностях состояний природы ξ(υ1)=w и ξ(υ2)=1—w. Нетрудно заметить также, что величина с' для точки S 0 является минимальной из всех возможных значений L(ξ , η) , так как увеличение с' до с">с' означает, что прямая пройдет выше и будет проходить через точки множества S*, не являющиеся допустимыми, а уменьшение с' невозможно, так как прямая опустится вниз и не будет иметь с S* общих точек. Таким образом, величина с' определяет стратегию η. , дающую минимум средних потерь L(ξ, η) при данном распределении ξ(υ) = (w, 1—w), т. е. определяет для данного априорного распределения вероятностей байесовскую стратегию.

 • • Поскольку So является произвольной точкой на границе допустимых стратегий, то для • • Поскольку So является произвольной точкой на границе допустимых стратегий, то для любой точки этой границы можно найти такие w и 1—w, для которых эта точка будет определять байесову стратегию. Отсюда следует, что каждая допустимая стратегия, является байесовской стратегией для некоторых априорных вероятностей w и 1—w. Предположим теперь, что нам заданы априорные вероятности состояний природы w и 1—w и требуется на выпуклой оболочке S* найти точку, определяющую байе совскую стратегию для этого случая. Построим на плоскости (х, у) прямую При произвольном с эта прямая будет параллельна опорной прямой в точке, соответствующей байесовской стратегии. Для удобства построения положим с = = w(1—w) и запишем уравнение в виде представляющем собой уравнение прямой в отрезках.

 • Прямая, соответствующая полученному уравнению , построена на рис. Теперь уже легко построить • Прямая, соответствующая полученному уравнению , построена на рис. Теперь уже легко построить опорную прямую, соответствующую заданным значениям w и 1—w, которая определит на выпуклой оболочке S* точку, соответствующую байесовской стратегии статистика. Поскольку внешней границей выпуклой оболочки является многоугольник с вершинами, соответствующими чистым стратегиям статистика, опорная прямая обязательно проходит хотя бы через одну из вершин. Следовательно, для. заданных априорных вероятностей w и 1—w всегда существует хотя бы одна байесовская стратегия, являющаяся чистой стратегией Это обстоятельство чрезвычайно упрощает решение статистических игр, так как позволяет при поиске байесовского решения ограничиться рассмотрением только конечного числа чистых допустимых стратегий вместо рассмотрения бесконечного множества смешанных стратегий. Это устраивает также многих скептически настроенных статистиков, возражающих против использования смешанных стратегий на том основании, что при этом требуется использование механизма случайного выбора, который к существу задачи отношения не имеет. Разумеется все сделанные выводы остаются справедливыми и для случая, когда имеется больше двух состояний природы. Однако при этом рассмотрение на плоскости уже невозможно, что затрудняет геометрическую иллюстрацию этих случаев.

. СТАТИСТИЧЕСКИЕ ИГРЫ С ПРОВЕДЕНИЕМ ЕДИНИЧНОГО ЭКСПЕРИМЕНТА • • Постановка задачи Как уже отмечалось, . СТАТИСТИЧЕСКИЕ ИГРЫ С ПРОВЕДЕНИЕМ ЕДИНИЧНОГО ЭКСПЕРИМЕНТА • • Постановка задачи Как уже отмечалось, особенностью статистической игры является возможность для статистика углублять и уточнять свои знания относительно состояния при роды путем постановки эксперименте. В принципе, если бы была возможность неограниченного экспериментирования, статистик мог бы получить полную информацию о состоянии природы и действовать в условиях полной определенности. Однако постановка эксперимента всегда связана с затратой средств и времени, потери от которых могут оказаться значительнее того выигрыша, который могут дать результаты эксперимента. Возможность проведения эксперимента чрезвычайно расширяет класс стратегий статистика. Прежде всего статистик должен принять решение о том, проводить или не проводить эксперимент. Он должен далее решить, каков должен быть этот эксперимент, сколько следует провести отдельных испытаний, прежде чем считать эксперимент законченным, и какие предпринять действия при тех или иных исходах эксперимента. В дальнейшем сосредоточим свое внимание на статистических играх с единичным экспериментом.

 • Мы пока не будем включать в класс стратегий статистика принятие решения о • Мы пока не будем включать в класс стратегий статистика принятие решения о проведении эксперимента, считая, что уже принято решение о проведении единичного эксперимента. При этом под единичным экспериментом будем понимать такой эксперимент, объем и порядок проведения которого заранее определены. Так если нужно проверить, является ли данная монета симметричной, то можно провести единичный эксперимент, состоящий в n кратном бросании монеты. Исходом эксперимента при n=5 может быть последовательность ГРГГР. Всего существует • таких последовательностей, т. е. в данном случае пространство исходов эксперимента состоит из • элементов. Аналогично, при проверке оружия под единичным экспериментом понимают эксперимент, при котором делается п выстрелов. Для оценки влияния какого либо специального вида пищи на животное может быть произведен единичный эксперимент, состоящий в измерении в течение нескольких месяцев ежедневного прибавления в весе у n животных, и т. п. Хотя в этих примерах эксперимент состоит из ряда подыспытаний, но мы его называем единичным, так как число подыспытаний и характер каждого подыспытания заранее определены.

Пространство выборок • • • Z пространство исходов эксперимента. Элементы этого пространства, т. е. Пространство выборок • • • Z пространство исходов эксперимента. Элементы этого пространства, т. е. отдельные исходы эксперимента будут z 1, . . . , zn. Отдельные исходы эксперимента zєZ оказываются связанными с состояниями природы υєӨ. Эта связь состоит в том, что для каждого состояния природы υєӨ имеется определенная вероятность рυ(z) того, что исходом эксперимента будет данное zєZ. Величины pυ (z), иногда обозначаемые p(z/υ), представляют собой условное распределение вероятностей на пространстве Z при данном υ и удовлетворяют соотношениям рυ(z) ≥ 0, Σ рυ(z)=1. Совокупность трех элементов: пространства исходов эксперимента Z, пространства состояний природы Ө в и распределения вероятностей рυ(z) на пространстве Z при заданном υєӨ , называется пространством выборок и обозначается Ψ = (Z, Ө , p). Пространство выборок удобно задавать в виде табли цы, содержащей распределение рυ(z) на прямом произведении множеств Ө×Z

 • • • Пример. В задаче о замене оборудования Эксперимент может состоять в • • • Пример. В задаче о замене оборудования Эксперимент может состоять в проведении проверочных испытаний оборудования силами предприятия. При этом недостаточная квалификация персонала и отсутствие необходимой измерительной аппаратуры приводят к тому, что результаты испытаний лишь приближенно отражают состояние оборудования. Предположим, что эксперимент может иметь четыре исхода: z 1 — оборудование исправно; z 2 — требуется текущий ремонт; z 3 требуется замена изношенных деталей; z 4 — оборудование непригодно к дальнейшей эксплуатации. Вероятности каждого из этих исходов при. различных состояниях природы приведены в табл. , представляющей собой пространство выборок для данной задачи. υ Z z 1 Z 3 Z 2 1/2 υ2 0 1/2 υ3 0 0 1/2 0 1/3 υ1 z 4 2/3

 • Пример. В задаче о технологической линии эксперимент может состоять в грубом предварительном • Пример. В задаче о технологической линии эксперимент может состоять в грубом предварительном анализе содержания примесей (точный лабораторный анализ невозможен, так как требует затраты значительного времени, а значит, простоя оборудования). Результаты эксперимента: z 1 — примесей не обнаружено, z 2 — примеси в небольшом количестве, z 3—примесей много. Пространство выборок при этом может иметь вид табл. z υ z 1 z 2 z 3 υ1 0, 60 0, 25 0, 15 υ2 0, 20 0, 30 0, 50

Решающая функция • В задаче без эксперимента статистик должен был принять решение из пространства Решающая функция • В задаче без эксперимента статистик должен был принять решение из пространства решений А, основываясь на априорной информации ξ(υ) о состояниях природы. В задаче с экспериментом статистик принимает решение в зависимости от исхода эксперимента zєZ. Чтобы формализовать эту задачу, он может заранее проанализировать все возможные исходы эксперимента и составить правило d, определяющее, какое решение аєА следует принять при каждом из возможных исходов эксперимента zєZ. Это правило будет представлять собой отображение пространства исходов эксперимента Z на пространство решений А • d: Z—>A, • что может быть записано также в виде • d(z) =а.

 • Правило d(z), определяющее решение аєА, которое должен принять статистик при любом исходе • Правило d(z), определяющее решение аєА, которое должен принять статистик при любом исходе эксперимента zєZ, называется решающей функцией. • Поясним понятие решающей функции на следующем примере. Предположим, что пространство решений состоит из трех элементов A={a 1, а 2, аз}, а пространство исходов эксперимента — из пяти элементов Z = {z 1, z 2, Z 3, z 4, z 5}. }. Решающую функцию d(Zi) =ai, можно задать в виде множества пар индексов( i, j), определяющих решение а , при исходе эксперимента zi. Решающей функцией будет, например, множество {(1, 1), (2, 1), (3, 2), (4, 2), (5, 3)}, означающее, что при исходах Z 1 и z 2 принимается решение а 1 при исходах z 3 и z 4 принимается решение а 2, а при исходе z 5 принимается решение а 3. • Конечно, данная решающая функция не является единственно возможной. Можно было бы рассматривать также решающие функции вида {(1, 1), (2. 2), (3, 2), (4, 3), (5, 3)} или {(1, 3), (2, 1), (3, 2), (4, 3), (5, 2)} и т. п. • В связи с этим удобно вести пространство D, содержащее полный перечень возможных решающих функций, и назвать его пространством решающих функций. j

 • Рассмотренная выше решающая функция разбивает множество Z на непересекающиеся подмножества Sai, а • Рассмотренная выше решающая функция разбивает множество Z на непересекающиеся подмножества Sai, а именно • Sa 1={z 1, z 2}, Sа 2 = {z 3, z 4}, Sа 3 = {z 5}. • В терминах теории множеств можно сказать, что любую решающую функцию dєD можно рассматривать как разбиение пространства исходов эксперимента Z на непересекающиеся подмножества Sa, такие, что • Sа = {z : d(z) =а}, аєА. • В частности если пространство решений А состоит только из двух элементов a 1 и а 2 (двухальтернативная задача), то решающая функция d(z) разбивает пространство Z на пространство S, называемое критической областью, и его дополнение C(S)= , определяемые из условия d(z) = Понятие решающей функции позволяет более четко сформулировать задачу статистика. Эта задача состоит в том, чтобы из пространства решающих функций D выбрать такую решающую функцию d(z), которая позволит принимать наиболее выгодные решения. Однако для этого необходимо уметь оценивать различные решающие функции, что может быть сделано при помощи функции риска.

Функция риска • • Если статистик остановил свой выбор на некоторой решающей функции d{z), Функция риска • • Если статистик остановил свой выбор на некоторой решающей функции d{z), то тем самым он определил для каждого исхода эксперимента zєZ решение a=d(z), которому при данном υєӨ будут соответствовать потери L (υ, а) = L [υ, d (z)] = Lz (υ, d). Однако при заданном υ исход эксперимента z будет случайной величиной, определяемой распределением вероятностей pυ(z) на пространстве Z. Следовательно, с той же вероятностью рυ(z) будут иметь место и потери Lz(υ, d) при данном z, которые, таким образом, будут также случайной величиной. Поскольку для оценки решающей функции d(z) при данном состоянии природы υ необходимо учитывать все возможные исходы эксперимента, то необходимо вести речь о средних потерях, определяемых на всем пространстве исходов эксперимента Z. Эти средние потери называются функцией риска, обозначаются ρ(υ, d) и определяются из соотношения ρ (υ, d) == Мd [LZ (υ, d)] = Σ Lz (υ, d)ρυ (z). z Каждому состоянию природы υєӨ и каждой решающей функции dєD будет соответствовать свое значение средних потерь, т. е. функции риска ρ (υ, d), которая, таким образом, определяется на прямом произведении множеств Ө×D совершенно аналогично тому, как функция потерь L (υ, а) в игре без эксперимента определялась на прямом произведении множеств Ө×А. Из этого следует, что пространство решающих функций D и функция риска ρ (υ, d) в игре с единичным экспериментом играют ту же роль, что пространство решений А и функция потерь в игре без эксперимента. Отсюда вытекают и аналогичные методы решения этих двух задач.

 • • В играх с единичным экспериментом статистик может использовать и смешанные стратегии. • • В играх с единичным экспериментом статистик может использовать и смешанные стратегии. Для этого он должен иметь механизм случайного выбора, задающий распределение вероятностей η(d) на пространстве D. Функция риска применении смешанной стратегии η(d) , обозначаемая в этом случае ρ (υ, η) , получится путем усреднения ρ (υ, d) по всем чистым стратегиям, входящим в данную смешанную стратегию. Таким образом, ρ (υ, η) = Мd [ρ (υ, d) ] =Σ ρ (υ, d) η(d) d или с учетом ρ (υ, d) = Мd [LZ (υ, d)] = Σ Lz (υ, d)ρυ (z). • ρ (υ, η) =Σ Lz (υ, d)ρυ (z) η(d) Естественно, что при поиске наилучшей стратегии в игре с единичным экспериментом статистик должен исходить только из допустимых стратегий, которые определяются точно так же, как и в игре без эксперимента

 • • • . Пример. Определим функцию риска в задаче о технологической линии. • • • . Пример. Определим функцию риска в задаче о технологической линии. Для удобства расчетов потери статистика L(υ, а) и вероятности исходов эксперимента Pυ(z)сведем в одну таблицу. Поскольку пространство исходов эксперимента состоит из трех элементов, то решающая функция будет иметь вид d(z)=(ai, aj, ak)=dijk, где ai, аj, и ак означают решения, которые должен принять статистик при исходах эксперимента z 1, z 2 и z 3 соответственно. Так, решающая функция d 122 означает, что при исходах экспериментa z 1, z 2 и z 3 статистик принимает решения а 1 a 2, a 2. а Рυ (z) υ а 1 а 2 аз Z 1 zз z 2 υ1 0 1 3 0, 60 0, 25 0, 15 υ2 5 3 2 0, 20 0, 30 0, 50

 • • Значения функции риска, подсчитанные по формуле ρ (υ, d) == Мd • • Значения функции риска, подсчитанные по формуле ρ (υ, d) == Мd [LZ (υ, d)] = Σ Lz (υ, d)Pυ (z). z для каждой решающей функции, приведены в табл. и на рис. . υ d 111 d 112 d 113 d 121 d 122 d 123 d 131 d 132 d 133 υ1 υ2 0, 00 5, 00 0, 15 4. 0 0, 45 3. 5 0, 25 4. 40 0, 40 3, 40 0, 70 2, 90 0, 75 4, 1 0, 90 3, 10 1, 20 2, 60 υ d 211 d 212 d 213 d 221 d 222 d 223 d 231 d 232 d 233 υ1 υ2 0, 60 4, 60 0, 75 3, 60 1, 05 3, 10 0, 85 4, 00 1, 00 3, 00 1, 30 2, 50 1, 35 3, 70 1, 50 2, 70 1, 80 2, 20 υ d 311 d 312 d 313 d 331 d 322 d 323 d 331 d 332 d 333 υ1 υ2 1, 80 4, 40 1, 95 3, 40 2, 25 2, 90 2, 05 3, 80 2, 20 2, 50 2, 80 2, 30 2, 55 2, 70 3, 00 3, 50 2, 00 Рис. 9 -6. Функция риска в задаче о технологической линии. ρ(υ, d 122) = Lz 1 (υ, d 122)ρυ(z 1) + Lz 2 (υ, d 122) ρυ(z 2) + Lz 3(υ, d 122) ρυ (z 3)=L(υ, a 1) ρυ(z 1)+ +L(υ, 2) ρυ(z 2)+ +L(υ, a 2) ρυ(z 3). Полагая υ = υ1, и υ = υ2, получаем: ρ(υ1, d 122)=0, 4; р(υ2, d 122 ) = 3. 4.

Принципы выбора стратегии в играх с единичным экспериментом • Поскольку введение функции риска сводит Принципы выбора стратегии в играх с единичным экспериментом • Поскольку введение функции риска сводит игру с единичным экспериментом к форме, аналогичной игре без эксперимента, то все принципы выбора стратегии в игре без эксперимента остаются справедливыми и для данного случая с той разницей, что вместо минимизации средних потерь теперь статистик должен минимизировать средний риск. Принцип минимакса состоит в том, чтобы выбрать стратегию η(d) при которой средний риск ρ(υ, d) при наихудшем для статистика состояния природы был бы минимален, т. е. выбор минимаксной стратегии η* производится из условия ρ(υ, η*) = minmaxρ(υ, η). Для применения байесовского принципа введем понятие ожидаемого риска, под которым понимается средний риск с учетом всех возможных состояний природы υєӨ и априорного распределения вероятностей на пространстве Ө. Так как применении байесовского принципа статистик может ограничиться использованием только чистых стратегий, то ожидаемый риск ρ(ξ, d)= Σρ(υ, d 0 )ξ(υ). υ Байесовский принцип требует применения такой решающей функции d*, при которой ожидаемый риск, называемый в этом случае байесовским риском, будет минимальным: ρ(ξ)=ρ(ξ, d*)=minρ(ξ, d). d

 • Пример. Определим минимаксную и байесовскую стратегии в задаче о технологической линии с • Пример. Определим минимаксную и байесовскую стратегии в задаче о технологической линии с проведением единичного эксперимента. На рис. эта задача представлена в виде S-игры. Из проведенного геометрического построения легко установить, что минимаксная стратегия определяется точкой S 0 и соответствует применению чистых стратегий d 233 и d 333 с вероятностями 10/14 и 4/14. Байесовской стратегией будет стратегия d 333. Рис. 9 -6. Функция риска в задаче о технологической линии.

. ИСПОЛЬЗОВАНИЕ АПОСТЕРИОРНЫХ ВЕРОЯТНОСТЕЙ • • Определение числа стратегий в играх с проведением эксперимента . ИСПОЛЬЗОВАНИЕ АПОСТЕРИОРНЫХ ВЕРОЯТНОСТЕЙ • • Определение числа стратегий в играх с проведением эксперимента Из рассмотренных в предыдущих параграфах примеров видно, что проведение эксперимента в статистических играх приводит к значительному увеличению числа чистых стратегий статистика. Так, в задаче о технологической линии при учете результатов эксперимента число чистых стратегий возросло с 3 до 27. И если бы эту игру нам не удалось представить в виде S-игры па плоскости, то возникли бы серьезные трудности при ее анализе. Обозначим через N общее число чистых стратегий статистика в игре с единичным экспериментом. Это число нетрудно подсчитать. Предположим, что в игре без эксперимента у статистика имеется l возможных решений a 1, a 2, …al, а число возможных исходов эксперимента равно ν. При ν=1 получаем игру, с заранее известным исходом эксперимента, что равносильно игре без эксперимента, при которой N=1. При v = 2 стратегия статистика может быть записана и виде d = (ai 1, аi 2), где величинами аi 1, и аi 2, могут быть любые а єA. Следовательно, может быть l различных значений ail, каждому из которых может соответствовать l различных значений аi 2, так что .

 • При ν = 3 стратегия статистика d = (al 1, al 2, • При ν = 3 стратегия статистика d = (al 1, al 2, al 3). Совокупность решений аl 1 и al 2 может принимать значений каждому из которых может соответствовать l значений аl 3 , так что . Продолжая аналогичные рассуждения, приходим к выводу, что при произвольных l и ν общее число чистых стратегий статистика равно При больших l и v число чистых стратегий статистика может оказаться столь значительным, что возникнут серьезные затруднения, связанные с их анализом. В подобных случаях можно добиться значительного упрощения при нахождении байесовских стратегий, если вместо априорного распределения вероятностей использовать апостериорное распределение, вычисленное на основе результатов проведенного эксперимента. При этом число чистых стратегий статистика в задаче с экспериментом останется тем же самым, что и в задаче без эксперимента.

Апостериорное распределение вероятностей. Формула Байеса • • Априорное распределение вероятностей ξ(ν), получаемое на основе Апостериорное распределение вероятностей. Формула Байеса • • Априорное распределение вероятностей ξ(ν), получаемое на основе статистических данных и прошлого опыта, дает полезную информацию о том, насколько часто то или иное состояние природы встречается вообще, безотносительно к тем конкретным условиям, в которых статистику приходится принимать решение. Целью эксперимента, проводимого статистиком, является получение добавочной информации о действительном состоянии природы. Предположим, что пространством исходов эксперимента является множество Z = {z 1, . . . , zυ} При этом исход конкретного эксперимента будет случайным и потому также не дает возможности точно судить о действительном состоянии природы. Однако неопределенность относительно состояния природы значительно уменьшается, если эксперимент поставлен правильно.

 • • Это изменение неопределенности относительно состояния природы состоит в том, что в • • Это изменение неопределенности относительно состояния природы состоит в том, что в результате эксперимента вместо априорного распределения ξ(υ) получается новое распределение вероятностей ξz(υ), которое называется апостериорным распределением вероятностей на пространстве в при данном конкретном исходе эксперимента z€Z. Обратимся к методам вычисления апостериорного распределения вероятностей. Прежде всего заметим, что исход эксперимента, имеющего целью уточнить действительное состояние природы, будет зависеть от состояния природы υ Предварительное изучение условий, в которых проводится эксперимент, позволяет для каждого состояния природы υ указать распределение вероятностей на пространстве исходов эксперимента Z, которое будет, таким образом, представлять собой условное распределение вероятностей p(z|υ) =рυ (z). Для полного описания одного конкретного эксперимента необходимо знать исход эксперимента z€Z и состояние природы υ€Ө, при котором эксперимент был произведен. Следовательно, результат конкретного эксперимента можно представить в виде упорядоченной пары (z, υ), являющейся элементом прямого произведения множеств ZxӨ.

 • • Обозначим через q(z, υ) распределение вероятностей на множестве ZXӨ. В общем • • Обозначим через q(z, υ) распределение вероятностей на множестве ZXӨ. В общем случае это распределение вероятностей будет изменяться с изменением априорного распределения вероятностей ξ(υ) т. е будет функцией от ξ. Для конкретного априорного распределения ξ(υ) обозначим распределение вероятностей на множестве ZxӨ через qξ(z, υ). Нам необходимо увязать между собой распределения ξ(υ), рυ(z), qξ(z, υ), ξz(υ) С подобной задачей мы сталкивались при рассмотрении двумерных случайных величин, когда исходом эксперимента z являлась упорядоченная пара (х, у). • Отсюда находим (*) В этом выражении p(z) представляет собой безусловную вероятность данного исхода эксперимента z, т. е. вероятность того, что будет иметь место исход z при произвольном состоянии природы. Исходя из этого, вероятность р (г) можно представить в виде Применяя к этому выражению формулу полной вероятности , получаем: С учетом последнего соотношения выражение для ξz(υ) приобретает вид Эта формула в теории вероятностей получила название формулы Байеса.

Вычисление апостериорного распределения вероятностей в задаче о технологической линии υ ξ(υ) Pυ(z)ξ(υ) ξz(υ) Z Вычисление апостериорного распределения вероятностей в задаче о технологической линии υ ξ(υ) Pυ(z)ξ(υ) ξz(υ) Z 1 Z 2 Z 3 Z 1 0, 6 0, 09 0, 818 υ1 0, 4 0, 6 0, 25 0, 15 0, 36 0, 15 0, 20 0, 182 0, 30 0, 08 0, 12 υ2 0, 50 Z 2 Z 3 0, 555 0, 310 0, 445 0, 690 0, 44 0, 27 0, 29 υ z υ ξ(υ) А а 1 а 2 а 3 z 1 z 2 z 3 υ1 0, 60 0, 25 0, 15 υ2 0, 20 0, 30 0, 50 υ1 0. 6 0 1 3 υ2 0. 4 5 3 2

Принцип максимального правдоподобия • • • Знание апостериорных вероятностей позволяет производить оценку состояния природы, Принцип максимального правдоподобия • • • Знание апостериорных вероятностей позволяет производить оценку состояния природы, используя принцип максимального правдоподобия. Согласно этому принципу за оценку состояния природы принимается то состояние природы, которое представляется наиболее вероятным на основании опытных данных. Пример 9 -12. Дадим оценку состояния природы в задаче о технологическом процессе при исходе эксперимента z 1. Согласно табл. 9 -8 апостериорные вероятности состояний природы υ1 и υ2 при исходе эксперимента Z 1 равны: ξz 1(υ1) =0. 818, ξz (υ)= 0, 182. Поскольку max [ξz 1(υ1) , ξz (υ )] = ξz 1(υ1), то согласно принципу максимального правдоподобия =υ1. Принцип максимального правдоподобия часто применяется для выбора решения в двухальтернативной задаче 2 2

 • • Для принятия решения в двухальтернативной задаче часто используют отношение правдоподобия, определяемое • • Для принятия решения в двухальтернативной задаче часто используют отношение правдоподобия, определяемое соотношением Говорят, что имеет место проверка по отношению правдоподобия, если задано число k, такое, что решение принимается согласно следующему правилу: принимается решение ai, если Λ(z)>k; принимается решение а 2, если Λ(z)

Определение байесовского решения на основе использования апостериорных вероятностей • • Как мы видели в Определение байесовского решения на основе использования апостериорных вероятностей • • Как мы видели в начале настоящей главы, основная трудность решения задачи с проведением эксперимента состояла в резком увеличении числа стратегий при увеличении числа возможных исходов эксперимента. Однако в действительности вовсе нет необходимости рассматривать все возможные исходы эксперимента. Если в результате проведения эксперимента получен какой-то конкретный исход z€Z, то для этого исхода и следует решать задачу. Это можно сделать, подсчитав при данном исходе эксперимента z апостериорное распределение вероятностей ξz(υ) на пространстве состояний природы Ө. При этом будут известны пространство состояний природы в, пространство решений А и распределение вероятностей на пространстве состояний природы ξz(υ), в котором учтен результат эксперимента. Но эта задача отличается от задачи без эксперимента только тем, что здесь используется апостериорное распределение вероятностей ξz(υ) вместо априорного распределения ξ(υ). Следовательно, и методы решения этой задачи аналогичны тем, которые применялись в задаче без эксперимента.

При использовании апостериорных вероятностей ξz(υ) в качестве чистых стратегий статистика используются элементы пространства решений При использовании апостериорных вероятностей ξz(υ) в качестве чистых стратегий статистика используются элементы пространства решений A ={a 1, . . . , al}. При этом каждому действию а€A будут соответствовать потери или с учетом Байесовский принцип сводится к тому, чтобы выбрать такое действие а*€А, при котором величина потерь будет минимальна: R*(ξz) = R(ξz, а*)=min. L(ξz, a)

Двухальтернативная задача • • Проиллюстрируем изложенные принципы на примере решения двухальтернативной задачи с априорным Двухальтернативная задача • • Проиллюстрируем изложенные принципы на примере решения двухальтернативной задачи с априорным распределением вероятностей ξ(υ)=(γ, 1—γ) При правильных решениях потери считаем равными нулю. Ошибка первого рода (a 2|υ1) даст потери w, а ошибка второго рода (a 1|υ2) даст потери 1. Тогда матрица потерь имеет вид. Рассмотрим решающую функцию d(z), которая должна делить пространство исходов эксперимента Z υ a 1 a 2 на области S и С(S) такие, что при нимается решение а 1 если z€S, и при υ1 0 W нимается решение а 2, если z€C(S). υ2 1 0 Поскольку S и C(S) должны быть компактными, то решение задачи сводится к тому, чтобы найти границу, разбивающую множество Z на непересекающиеся подмножества S и C(S). Элементы z€Z, составляющие эту границу, обозначим z 0.

 • Для нахождения уравнения, определяющего границу Zo, напишем выражения для средних потерь при • Для нахождения уравнения, определяющего границу Zo, напишем выражения для средних потерь при данном z и решениях a 1 и а 2. Учитывая, что • и данные , получаем: Граница z 0 соответствует равенству средних потерь при решениях a 1 и а 2, что дает:

 • Как видим, каждому значению γ будет соответствовать своя граница z 0, а • Как видим, каждому значению γ будет соответствовать своя граница z 0, а следовательно, и соответствующие области. Sγ и С(Sγ). При этом величиной γ будут определяться и вероятности ошибочных решений α(γ) и β(γ), являющиеся вероятностями того, что при υ= υ1, точка z попадет в область С(Sγ) и будет принято решение a 2, и вероятность того, что при υ= υ2 точка z попадет в область Sγ и будет принято решение а 1. Эти вероятности определяются соотношениями Для определения характера зависимости вероятности ошибочных решений от γ определим значения α(γ) и β(γ) для крайних значений γ = 0 и γ=1. Элементы z€Z, входящие в множество S, определяются условием L(ξz, a 1)≤L(ξz, a 2) или

 • При γ=0 это условие дает: что возможно только в том случае, если • При γ=0 это условие дает: что возможно только в том случае, если Sγ=Ø, С(Sγ)=Z При этом из и находим α(0) = 1, β(0)=0 При γ=1 условие дает: что определяет область Sγ = Z, C(Sγ) = Ø, так что α(1)= 0, β(1)= 1. Таким образом, при изменении γ от 0 до 1 α(γ) меняется от 1 до 0, β(γ) меняется от 0 до 1.

 • • • Для того чтобы определить средние потери при всевозможных значениях γ, • • • Для того чтобы определить средние потери при всевозможных значениях γ, найдем байесовский риск ρ*(γ) для рассмотренной решающей функции d(z). Используя выражение для решающей функции р(υ, d) и усредняя эту функцию по всем состояниям природы, находим: ρ*(γ)=γwα(γ)+(1 -γ) β(γ). График зависимости y=ρ*(γ), построенный по этой формуле с учетом найденного характера изменения α(γ) и β(γ)приведен на рис. Из этого графика видно, что ρ*(γ) обращается в нуль при γ=0 и при γ=1 и достигает максимума при некотором γ=γ 0 Значение γ 0 определяет наихудшую для статистика стратегию природы, при которой он, применяя байесовский принцип, имеет потери ρ*(γ 0).

 • На практике весьма часто встречаются случаи, когда предварительных статистических данных недостаточно для • На практике весьма часто встречаются случаи, когда предварительных статистических данных недостаточно для того, чтобы точно определить априорную вероятность γ. Поэтому представляет интерес найти величину байесовского риска для случая, когда статистик исходит из некоторого значения априорной вероятности γ'и в соответствии с этим определяет величины Sγ′, , α(γ') и β(γ') тогда как действительное значение γ будет иным. В этом случае байесовский риск определяется выражением • ρ(γ, γ')=γwα. (γ') + (1 -γ)β(γ′), • • которое является линейным относительно γ и определяет касательную к кривой y=ρ*(γ) в точке γ=γ'. Из рис. видно, что потери, определяемые функцией ρ(γ, γ') будут больше, чем для функции ρ*(γ), если γ≠γ', так что неточное знание априорного распределения вероятностей приводит к увеличению потерь. Более того если γ значительно отличаются от γ', то потери, определяемые функцией ρ(γ, γ'), могут превысить величину ρ*(γо), соответствующую максимальной величине байесовских потерь. Однако если исходить из наиболее неблагоприятного распределения вероятностей, соответствующего значению γо, то функция у=ρ(γ, γо) будет постоянна и при любом γ определяет потери, равные ρ*(γo) Этот случай соответствует применению минимаксной стратегии. Таким образом, применение байесовского принципа целесообразно лишь в тех случаях, когда априорное распределение вероятностей ξ(υ) известно достаточно. Если же априорное распределение вероятностей ξ(υ) неизвестно или известно не точно, то более выгодным может оказаться применение минимаксного принципа.

 СТАТИСТИЧЕСКИЕ ИГРЫ С ПОСЛЕДОВАТЕЛЬНЫМИ ВЫБОРКАМИ Предварительные замечания • • При рассмотрении статистической игры СТАТИСТИЧЕСКИЕ ИГРЫ С ПОСЛЕДОВАТЕЛЬНЫМИ ВЫБОРКАМИ Предварительные замечания • • При рассмотрении статистической игры с единичным экспериментом отмечалось, что единичный эксперимент необязательно состоит из одного единственного испытания. Он может состоять и из последовательности испытаний, но объем и порядок этих испытаний должны быть определены заранее. Так если заранее установлено, что решение принимается после того, как проведено N последовательных испытаний, то вся эта последовательность испытаний рассматривается как единичный эксперимент, исходом которого будет многомерная величина z= (z 1, . . . , z. N), где Zi, i= 1, . . . , N является исходом i-го испытания. В связи с этим игру с единичным экспериментом часто называют игрой с заданным объемом выборки, понимая под объемом выборки число последовательно проведенных экспериментов. В играх с заданным объемом выборки статистик может использовать только те стратегии, которые определяют характер его действий после полного окончания всей последовательности испытаний. Однако для статистика открыт и другой путь. Так, вместо проведения всех N испытаний, он может после каждого последовательного испытания решать, прекратить ли испытание и выбрать какое-то решение из А на основании уже имеющейся информации или провести следующее испытание. Это расширяет класс возможных стратегий статистика, так к выбору решения из множества А добавляется еще выбор решения о том, прекратить или продолжить эксперимент. Подобные игры называются играми с последовательной выборкой.

 • • • При этом если задано предельное допустимое число испытаний, после проведения • • • При этом если задано предельное допустимое число испытаний, после проведения которых решение из А должно быть обязательно принято, то игра называется игрой с усеченной последовательной выборкой. Только такими играми мы и ограничим дальнейшее изложение. Отдельные последовательные результаты эксперимента будем называть наблюдениями. Если бы эксперимент ничего не стоил, то расширение класса стратегий путем введения последовательных выборок не имело бы смысла, так как статистик ничего бы не терял, а мог только выиграть, проведя все N наблюдений. Однако во многих случаях эксперимент дорог и требует затраты времени. При этом статистик может получить значительное сокращение своих затрат, если на каждой стадии эксперимента он сопоставляет стоимость продолжения эксперимента с ожидаемым выигрышем от получения добавочной информации. Рассмотрим способ описания игры с усеченными последовательными выборками. Обозначим через Zj множество исходов i-го испытания. Тогда полное пространство исходов эксперимента Z при проведении всех N испытаний можно представить в виде Z = Z 1 ×. . . ×ZN. В игре с последовательными выборками мы допускаем принятие решения на основе проведения не всех N наблюдений z 1, …, z. N, а только j первых из них Z 1, . . . , Zj. В связи с этим множество Z можно разбить на непересекающиеся подмножества So, Si, …, SN такие, что если z€Sj, то решение принимается на основании проведения первых j наблюдений.

 • • Множество S= (S 0, S 1, … SN) называется планом последовательной • • Множество S= (S 0, S 1, … SN) называется планом последовательной выборки. Множество Z можно разбить на непересекающиеся подмножества S, несколькими различными способами. Каждый из этих способов определит свой план последовательной выборки. Множество всевозможных планов последовательной выборки обозначим W и назовем полным классом последовательных выборок. Для возможности принятия решения должна быть задана решающая функция d(z), определяющая для каждой последовательности наблюдений решение из А. Решающую функцию d(z), как и в игре с единичным экспериментом, статистик выбирает из пространства решающих функций D, в которое входят все возможные решающие функции. Стратегия статистика в игре с последовательными выборками состоит, во-первых, в выборе плана последовательной выборки S€W указывающего, когда должен быть закончен эксперимент, и, во-вторых, в выборе решающей функции d€D, указывающей, какое решение должно быть принято по окончании эксперимента. Таким образом, пара (S, d) определяет стратегию статистика. Учитывая, что пара (S, d) является элементом прямого произведения W×D, приходим к выводу, что W×D является пространством чистых стратегий статистика.

 • Общее число стратегий в играх с последовательными выборками получается значительно большим, чем • Общее число стратегий в играх с последовательными выборками получается значительно большим, чем в играх с единичным экспериментом, что вызывает значительные трудности при составлении полного перечня стратегий статистика и выбора наилучшей из них. Эту работу можно значительно упростить, если на каждой стадии эксперимента вычислять апостериорное распределение вероятностей, используя для этого всю накопленную к данному моменту информацию. По мере проведения последовательных наблюдений неопределенность относительно действительного состояния природы будет при этом уменьшаться, так что открывается возможность выработать критерий для определения момента окончания эксперимента и принятия решения из множества А. • Использование апостериорного распределения вероятностей для определения последовательных байесовских правил • Будем рассматривать только такие статистические игры, в которых результаты отдельных подыспытаний Z 1, . . . , z. N являются независимыми случайными величинами. Обозначим через qυ(Zj) распределение вероятностей на пространстве Zj при данном состоянии природы υ. Стоимость отдельного подыспытания будем считать постоянной и равной с=1.

 • • В качестве основы для описания плана последовательных выборок примем распределение вероятностей • • В качестве основы для описания плана последовательных выборок примем распределение вероятностей ξ(υ) на пространстве состояний природы Ө, причем под распределением ξ(υ) будем понимать не только априорное распределение вероятностей до начала эксперимента, но и апостериорное распределение вероятностей после проведения нескольких подыспытаний. В дальнейем будем обозначать через ξ 0(υ) априорное распределение вероятностей, а через ξj(υ) апостериорное распределение вероятностей после проведения j подыспытаний. Распределение вероятностей ξj(υ) будет содержать в себе всю информацию о состоянии природы υ, которая имелась до проведения эксперимента, а также которая была получена в результате проведения первых j наблюдений. Поэтому распределение ξj(υ) может рассматриваться как априорное перед (j+1)-м наблюдением. Следовательно, распределение ξj+1(υ) выражается через ξj(υ) с помощью формулы для апостериорного распределения вероятностей. Будем рассматривать переход от априорного распределения вероятностей ξj(υ) к апостериорному ξj+1(υ) как некоторое преобразование Т распределения ξj(υ). Тогда апостериорное распределение вероятностей согласно может быть записано в виде

 • • Принцип получения плана последовательной выборки на основе использования апостериорного распределения вероятностей • • Принцип получения плана последовательной выборки на основе использования апостериорного распределения вероятностей рассмотрим на примере двухальтернативной задачи, в которой Ө = {υ1, υ2} и А={а 1, а 2). Обозначим через (ζ, 1—ζ) (Z, ζ-дзэта) апостериорное распределение вероятностей на пространстве Ө после проведения нескольких подыспытаний. Пространство Е смешанных стратегий природы в этой задаче определяется областью возможных значений ζ, т. е. интервалом [0, 1] вещественной оси. Может оказаться, что ζ=1. В этом случае можно принять только решение a 1. Если ζ = 0, то обязательно принимается решение а 2. Но если, например, окажется ζ=0, 5, то невозможно отдать предпочтение ни одному решению и следует продолжить эксперимент для того, чтобы уточнить действительное состояние природы. Здесь были рассмотрены крайние случаи распределения вероятностей ξ(υ). В общем же случае можно задаться величинами δ и γ (O≤δ≤l, O≤ γ ≤ 1, δ≥ γ ), такими, что: если ζ лежит в диапазоне [δ, 1], то принимается решение а 1; если ζ лежит в диапазоне [0, γ], то принимается решение а 2; если ζ лежит в диапазоне [γ, δ], то принимается решение о проведении следующего подыспытания Диапазоны Δ(a 1)=[δ, 1] и Δ(a 2)=[0, у] называются областями остановки. На рис. 9 -9 сформулированное правило принятия решения изображено графически.

В общем случае области остановки можно определить и для случая, когда число состояний природы В общем случае области остановки можно определить и для случая, когда число состояний природы больше двух. Правда, в этом случае пространство смешанных стратегий природы Е будет иметь более сложный вид. Так, в случае трех состояний природы оно имеет вид равностороннего треугольника с высотой, равной единице В общем случае областью остановки Δ(a)в пространстве Е называется подмножество пространства Е Δ(a)€Е такое, что если после некоторого подыспытания окажется ξ(υ)€ Δ(a) , то эксперимент прекращается и принимается решение а. Поскольку каждое подыспытание имеет стоимость, то будет небезразлично, попадает ли ξ(υ) в область Δ(a) до проведения эксперимента или после нескольких подиспытаний. Это означает, что с каждым новым подыспытанием будут изменяться как значения ξ(υ), так и области Δ(a).

 • При этом на каждой стадии эксперимента представляют интерес не те подыспытания, которые • При этом на каждой стадии эксперимента представляют интерес не те подыспытания, которые уже были проведены и результаты которых уже использованы, а те, которые еще осталось провести до полного окончания эксперимента. В соответствии с этим области остановки на той стадии эксперимента, когда проведено j подыспытаний из N, будем обозначать ΔN-1(a). Если пространство решений состоит из m элементов а 1, . . . , ат, то на каждой стадии эксперимента должно быть определено т областей Δ(a) , соответствующих каждому a€A. Эти области должны быть выпуклыми и непересекающимися. • Правило последовательных выборок • • • Предположим, что в пространстве Е выделено т областей Δ(a) на каждой стадии эксперимента. Тогда правило последовательных выборок будет состоять в следующем. Первоначально известно априорное распределение вероятностей ξo(υ). Если ξo(υ) € ΔN(ai) при каком-либо i, то принимается решение ai без проведения эксперимента. Если ни при каком i, то производится первое подыспытание и вычисляется апостериорное распределение вероятностей ξ 1(υ). Затем рассматриваются области ΔN-1(a). Если ξo(υ) € ΔN-1(ai) при каком-либо i, то эксперимент прекращается и принимается решение а, . Если ни при каком i, то производится следующее подыспытание и т. д.

Вообще если эксперимент не был прекращен при первых j— 1 наблюдениях, то производится дополнительное Вообще если эксперимент не был прекращен при первых j— 1 наблюдениях, то производится дополнительное наблюдение и вычисляется ξj(υ). Если при каком-либо j, то эксперимент заканчивается и принимается решение аi. Если выбор не был произведен после (N— 1)-го наблюдения, то делается N-oe наблюдение и производится окончательный выбор. Для выполнения этого условия области Δ 0(аi) должны выбираться так, чтобы Как видим, задача описания последовательных байесовских правил сводится к задаче определения областей ΔN-j(a) в пространстве Е для всех а€А и для всех j от 0 до N. Функция риска при оптимальном последовательном правиле Функция риска при последовательных выборках должна определять на каждой стадии эксперимента (например, после j подыспытаний) минимальные средние потери, которые будет нести статистик, принимая наилучшее решение из числа возможных решений, включая решение о том, что эксперимент должен быть продолжен. Поскольку принятие решения основывается на знании апостериорного распределения вероятностей ξj(υ), то от этого распределения вероятностей будет зависеть и функция риска. Функцию риска, получающуюся после проведения j подыспытаний, будем обозначать ρ*(ξj). Выражения, определяющие функцию риска, будем искать последовательно, начиная с последней стадии эксперимента.

 • Предположим, что проведены все N подиспытаний и найдено апостериорное распределение вероятностей ξN(υ). • Предположим, что проведены все N подиспытаний и найдено апостериорное распределение вероятностей ξN(υ). Средние потери, которые при этом несет статистик, принимая решение a€A, равны: Минимальное значение этих потерь, соответствующее байесовскому решению а*, определится выражением R* (ξN)=L(ξN, а*) = min L (ξN а). а Поскольку никакого лучшего решения, чем а*, принять невозможно, то величина R* (ξN) на этой стадии эксперимента будет совпадать с функцией риска ρ*(ξj)= R* (ξN) Рассмотрим теперь произвольную стадию эксперимента и найдем минимальные средние потери, которые статистик будет нести после того, как он провел j подиспытаний (j=0, 1, N-1). При этом статистик располагает распределением вероятностей ξj(υ). В данном случае статистик может поступить двоякимобразом. 1. Статистик может прекратить эксперимент и принять решение a€A. Минимальные средние потери, которые он при этом несет: 2. Статистик может принять решение проводить (j+1)-е подыспытание. При этом он будет нести, вопервых, потери, равные стоимости испытания, которые мы приняли за единицу, и, во-вторых, потери, которые он несет после принятия наилучшего решения по результатам (j+1)-го наблюдения, т. е. ρ*(ξj+1). Однако статистику неизвестно распределение вероятностей ξj+1(υ). . Он знает только распределение ξj(υ), а ξj+1(υ). . может определить лишь по формуле

При этом величина Tξj(υ) может быть найдена для конкретных значений Zi+1 €Zj+1 и υ€Ө, При этом величина Tξj(υ) может быть найдена для конкретных значений Zi+1 €Zj+1 и υ€Ө, (zi – результаты отдельных подыспытаний)которые статистик пока не знает. Поэтому он должен вести речь не о конкретном значении функции риска p*(ξj+1), а лишь о среднем значении М[ρ*(Tξj)], причем усреднение должно быть проведено по всем возможным значениям Zj+1€Zj+1 с распределением вероятностей qυ(zj+1) и по всем υ€Ө с распределением вероятностей ξj(υ): Таким образом, минимальные потери статистика при решении о продолжении эксперимента равны: 1+М(ρ*(Tξj)] Функция риска после проведения j подыспытаний определится минимумом средних потерь при рассмотрении обоих способов действия статистика: прекращения эксперимента и продолжения эксперимента. Следовательно Последнее выражение можно записать более компактно, не употребляя индекса j, обозначающего номер подиспытания.

 • Будем рассматривать стадию эксперимента, когда до полного окончания эксперимента осталось k подыспытаний. • Будем рассматривать стадию эксперимента, когда до полного окончания эксперимента осталось k подыспытаний. Обозначим через ξ(υ) апостериорное распределение вероятностей на этой стадии, а через ξ’=Tξ(υ) апостериорное распределение вероятностей после проведения еще одного подыспытания. Функцию риска на стадии, когда до конца эксперимента осталось к подыспытаний, обозначим через ρk*(ξ) Тогда • ρ*(ξ)=R*(ξ); • ρk*(ξ)=min{R*(ξ), 1+M[ρ*k-1(Tξ)]} • Обозначим через V пространство исходов следующего подыспытания, элементы которого будем обозначать v. При этих обозначениях получим: Формулы (9 -64) и (9 -65) могут быть использованы для определения областей остановки. Однако сравнительно простые результаты получаются лишь для двухальтернативной задачи, рассмотрением которой мы в дальнейшем и ограничимся.

 • КРИТЕРИИ ПРИНЯТИЯ РЕШЕНИЯ В УСЛОВИЯХ НЕОПРЕДЕЛЁННОСТИ • Минимаксный критерий О возможности появления • КРИТЕРИИ ПРИНЯТИЯ РЕШЕНИЯ В УСЛОВИЯХ НЕОПРЕДЕЛЁННОСТИ • Минимаксный критерий О возможности появления внешних состояний Fj ничего не известно; Приходится считаться с появлением различных внешних состояний Fj; Решение реализуется только один раз; Необходимо исключить какой бы то ни было риск.

Определение областей остановки для двухальтернативной задачи при усеченной последовательной выборке Рассмотрим случай двухальтернативной задачис Определение областей остановки для двухальтернативной задачи при усеченной последовательной выборке Рассмотрим случай двухальтернативной задачис функцией потерь, заданной матрицей и с распределением вероятностей на пространстве состояния природы ξ(υ)= (ξ, 1—ξ). Обозначим через Δk(a 1) и Δk(a 2) области остановки, соответствующие решениям а 1 и а 2, когда до окончания эксперимента осталось провести k наблюдений. Эти области определяются значениями ζ =δk и ζ=γk, такими, что Δk(a 1) =[ δk ≤ζ≤ 1], Δk(a 2)=[0≤ζ≤γk] Определение областей остановки сводится к определению значений yk и δk при k = 0, 1, …N. Это можно сделать, воспользовавшись полученными выражениями для функции риска. Начнем определение граничных точек областей остановки с k = 0. Выражая ξ(υ) через ζ из и ρk*(ξ)=min{R*(ξ), 1+M[ρ*k-1(Tξ)]} ρ*(ξ)=R*(ξ); получаем: ρ*0(ζ) =R*(ζ) =min[(l-ζ)q 21, ζ, q 12 ] По определению Δ 0(a 1) и Δ 0(а 2) должны бытьнепересекающимися вещественными множествами, объединение которых дает замкнутый отрезок 0, 1.

 • Следовательно, эти области должны отделяться друг от друга точкой ζ = γ • Следовательно, эти области должны отделяться друг от друга точкой ζ = γ 0=δо, которая определится из условия (l-ζ)q 21 = ζq 12. Это условие является условием равенства минимальных средних потерь принятии решений a 1 и a 2, из которого находим: При произвольном к≠О функция риска имеет вид: Условия получения граничных значений ζ для множеств Δk(a 1) и Δk(a 2) будут условиями равенства мини-мальпых средних потерь принятии решения а 1 или а 2 и принятии решения о продолжении эксперимента, что выражается соотношением

 • • Замечая, что в выражении ρ*0(ζ) =R*(ζ) =min[(l-ζ)q 21, ζ, q 12 • • Замечая, что в выражении ρ*0(ζ) =R*(ζ) =min[(l-ζ)q 21, ζ, q 12 ] для R*(ζ) величина ζ, q 21 является монотонно возрастающей функцией ζ, обращающейся в нуль при ζ=0, а (l—ζ)q 12 является монотонно убывающей функцией ζ, обращающейся к пуль при ζ=1, и заменяя в граничных точках ζ на γk для области Δk(a 1)и на δk для области Δk(a 2) , условие • можем записать в виде

 • Полученные соотношения показывают, что задача определения γk, и δk а также функции • Полученные соотношения показывают, что задача определения γk, и δk а также функции риска ρ*k(ζ) сводятся к вычислению величины M[ρ*k-1(Tζ)]. Формула дает общее выражение для этой величины при произвольном Ө. Для двухальтернативной задачи это выражение принимает вид:

При k=1 функция ρ*о(ζ), определяемая выражением ρ*0(ζ) =R*(ζ) =min[(l-ζ)q 21, ζ, q 12 ] При k=1 функция ρ*о(ζ), определяемая выражением ρ*0(ζ) =R*(ζ) =min[(l-ζ)q 21, ζ, q 12 ] , является очень простой функцией от ζ, так что величина M[p*0(Tζ)] может быть определена из (*) непосредственно. Зная М[р*0(Тζ)], можно вычислить из (**) ρ*1(ζ) и, следовательно, определить M[p*1(Tζ)] из, а отсюда ρ*2(ζ) из (**) и т. д. Хотя подобный процесс нахождения ρ*k(ζ) требует больших вычислений, однако при этом не приходится производить никаких более сложных операций, чем отыскание математических ожиданий.

Принятие решений в условиях неопределенности • • Реализационная структура задачи принятия решения включает в Принятие решений в условиях неопределенности • • Реализационная структура задачи принятия решения включает в себя множество допустимых альтернатив A, множество состояний среды X, множество исходов Y и функцию реализации F : A х X —> Y. Принятие решения в условиях неопределенности характеризуется тем, что при выборе альтернативы принимающему решение неизвестно наличное состояние среды и он не имеет никакой информации о вероятностях их появления. Отметим, что эта неопределенность не является абсолютной, так как принимающему решение известно множество возможных состояний среды (множество X) и известна функция реализации F. Оценочная структура ЗПР в условиях неопределенности может быть задана различными способами, в данной случае мы будем рассматривать случай, когда оценочная структура задается в виде оценочной функции. Композиция функции реализации и оценочной функции представляет собой целевую функцию f. При этом число f(a, x) указывает полезность (ценность, эффективность) того исхода, который получается в ситуации, когда принимающий решение выбирает альтернативу a € A, а среда принимает состояние x є X. Напомним, что если оценка исходов выражает затраты, убытки или другие негативные факторы, то в этом случае функция f называется функцией потерь.

Математическая модель ЗПР в условиях неопределенности может быть задана в виде следующей тройки объектов Математическая модель ЗПР в условиях неопределенности может быть задана в виде следующей тройки объектов (A, X, f), где A — множество допустимых альтернатив, X — множество возможных состояний среды, f: A * X —► R — целевая функция. Фактически построение такой математической модели принятия решения сводится к заданию целевой функции, определенной на множестве A *X и принимающей числовые значения. Основная сложность принятии решения в условиях неопределенности состоит в том, что, выбирая одну из допустимых альтернатив, принимающий решение не знает имеющегося состояния среды; в то же время получающийся исход зависит от того, в каком состоянии находится среда. Говоря формально, целевая функция f(a, x) является функцией двух аргументов a и x и принимающий решение должен выбирать значение аргумента a є A, не зная значения аргумента x єX. В этой лекции мы ограничимся случаем, когда множества A и X являются конечными; тогда целевая функция может быть задана табличным способом. Так как «природа» альтернатив и состояний среды в математической модели ЗПР никак не отражается, будем различать элементы этих множеств по номерам, полагая A = {1, . . . , i, . . . , n), X = {1, . . . , j, . . . , m). Далее, положим f(i, j) =sij и будем интерпретировать число sij как выигрыш принимающего решение в ситуации (i, j). Тогда целевая функция задается в виде в которой на пересечении i й строки и j ro столбца стоит число sij — выигрыш принимающего решение в ситуации, когда он выбирает альтернативу i, а среда принимает состояние j. Эта таблица называется также матрицей выигрышей или платежной матрицей.

Рассмотрим ЗПР в условиях неопределенности, целевая функция которой задана следующей таблицей. Выбор какой альтернативы Рассмотрим ЗПР в условиях неопределенности, целевая функция которой задана следующей таблицей. Выбор какой альтернативы здесь следует считать наилучшим? a/y 1 2 3 4 5 6 1 5 3 4 2 1 2 5 4 3 3 3 7 6 7 3 1 2 4 4 4 5 5 1 2 3 4 3 5 Чтобы ответить на этот вопрос, надо иметь некоторый способ сравнения двух альтернатив. Наиболее простой и естественный принцип, по которому можно сравнить две альтернативы — это принцип доминирования, состоящий в следующем: говорят, что альтернатива ai доминирует альтернативу ak (записывается ), если при любом состоянии среды выигрыш принимающего решение при выборе им альтернативы ai будет не меньше, чем его выигрыш при выборе альтернативы ak (то есть выполняется sij ≥skj при всех j = 1, . . . , m). Если sij > skj , то альтернатива ai называется доминирующей, а альтернатива ak — доминируемой. Ясно, что независимо от состояния среды доминирующая альтернатива является не менее предпочтительной для принимающего решение, чем доминируемая альтернатива, поэтому доминируемую альтернативу можно исключить из дальнейшего рассмотрения. Принцип доминирования состоит в отбрасывании доминируемых альтернатив.

В представленном примере имеем: а 4 >а 5 , а 3 >а 1, и В представленном примере имеем: а 4 >а 5 , а 3 >а 1, и других пар, находящихся в отношении доминирования, нет. Поэтому, исключая доминируемые альтернативы 1 и 5 (то есть вычеркивая из таблицы строки с номерами 1 и 5), получаем ЗПР, в которой все альтернативы несравнимы по отношению доминирования. Для того, чтобы выбрать из оставшихся альтернатив наилучшую, нужны какие то дополнительные соображения. • Основной метод, позволяющий найти наилучшую альтернативу в ЗПР в условиях неопределенности, состоит в следующем: • Формулируется некоторая гипотеза о поведении среды, позволяющая дать каждой альтернативе единую числовую оценку. • Задание числовой оценки для каждой альтернативы дает критерий для сравнения альтернатив по предпочтению: из двух альтернатив лучшей считается та, которая имеет большую числовую оценку (альтернативы, имеющие одинаковые оценки, считаются эквивалентными). Тогда наилучшей будет та альтернатива, которая является наиболее предпочтительной, то есть имеет наибольшую числовую оценку (для случая функции потерь — наименьшую числовую оценку). • 3. Рассмотрим здесь важнейшие типы критериев, используемые для задач принятия решений в условиях неопределенности. • Критерий недостаточного основания Лапласа Критерий Лапласа основан на гипотезе равновозможности (равновероятности) и содержательно может быть сформулирован в виде: "Поскольку мы ничего не знаем о состояниях среды, надо считать их равновероятными» . При принятии данной гипотезы в качестве оценки i й альтернативы выступает среднеарифметическое выигрышей, стоящих в i й строке матрицы выигрышей. •

Вероятности состояний природы принимаются одинаковыми и равными 1/m. При введении оценки Лапласа любые две Вероятности состояний природы принимаются одинаковыми и равными 1/m. При введении оценки Лапласа любые две альтернативы будут сравнимыми между собой по предпочтительности: лучшей будет считаться та альтернатива, которая имеет большую оценку по критерию Лапласа Критерий Лапласа следует применять если: ЛПР не имеет информации о вероятностях состояний природы, либо имеет неполную информацию; вероятности состояний природы близки по своим значениям; минимизация риска проигрыша представляется ЛПР менее существенным фактором принятия решения, чем максимизация среднего выигрыша или наоборот более существенным будет минимизация среднего проигрыша (риска). Основной недостаток критерия Лапласа связан с тем, что при нахождении среднего выигрыша может происходить "эффект компенсации"маленьких выигрышей большими, и полученное в результате среднее арифметическое будет тогда весьма слабой характеризацией допустимых альтернатив.

Например, сравнивая по критерию Лапласа альтернативы, указанные в следующей таблице, получаем, что альтернатива 1 Например, сравнивая по критерию Лапласа альтернативы, указанные в следующей таблице, получаем, что альтернатива 1 является более предпочтительной, чем альтернатива 2, поскольку L(1) > L(2). Однако величина выигрышей для альтернативы 1 распределена крайне неравномерно, поэтому при выборе альтернативы 1 принимающий решение рискует не получить ничего; в то же время при выборе альтернативы 2 он имеет гарантированный выигрыш в 9. 9. 1 1 2 2 …. 9 10 L(i) 1 0 …. . 0 10. 1 10 9. 9 10 … … Критерий Вальда основан на гипотезе антагонизма, которая может быть сформулирована в виде: "При выборе решения надо рассчитывать на самый худший возможный вариант". При принятии данной гипотезы оценкой альтернативы i служит число Сравнение любых двух альтернатив производится по величине критерия Wmin(i). Наилучшей в этом случае будет альтернатива, максимизирующая функцию Wmin(i), то есть та альтернатива ai*, для которой выполняется

 • • • со • Альтернатива i* называется максиминной, а число maxmina si • • • со • Альтернатива i* называется максиминной, а число maxmina si jназывается максимином. Принцип выбора наилучшего решения, по которому наилучшей альтернативой считается максиминная , называется принципом максимина. В чем содержательный смысл принципа максимина? Число Wmin(i) характеризует гарантированный уровень альтернативы i (так как при выборе альтернативы i выигрыш принимающего решение — независимо от состояния среды — не может быть меньше, чем. Wmin(i) Таким образом, принцип максимина основан на макисимизации минимального возможного (то есть гарантированного) выигрыша; поэтому иногда этот принцип называется также принципом максимального гарантированного результата. На практике использование принципа максимина связано с психологическими особенностями принимающего решение, точнее, с его отношением к неопределенности. Расчет на наихудший вариант свойственен крайне осторожным людям ("пессимистам"). Главный недостаток принципа максимина состоит в том, что при выборе решения учитывается только один — наихудший вариант. Например, при сравнении альтернатив, указанных в таблице 1 2 4 5 W(i) 1 2 3 1 5 4 1 2 0 6 8 7 9 0 согласно принципу максимина альтернатива 1 будет более предпочтительной, чем альтернатива 2, хотя, за исключением одного состояния среды, альтернатива 2 доминирует альтернативу 1. Расчет на наихудший случай может привести к созданию неоправданных резервов, что, в свою очередь, может привести к дополнительных потерям, например затратам на их хранение.

 • • Замечание. Если целевая функция является функцией потерь, то в соответствии с • • Замечание. Если целевая функция является функцией потерь, то в соответствии с гипотезой антагонизма, оценкой альтернативы i будет число Wmax(i)= max sij. Альтернатива, минимизирующая функцию Wmax(i) , то есть альтернатива i*, для которой выполняется называется минимаксной, а число minmax si j называется минимаксом. В этом случае принцип максимина трансформируется в принцип минимакса, по которому Наилучшей альтернативой будет минимаксная альтернатива. Содержательно принцип минимакса есть принцип минимизации максимальных возможных потерь. Критерий Байеса - Лапласа. рi- вероятность появления внешнего состояния Вj. Условия применения. Вероятности появления состояния Вj известны и не зависят от времени. Решение реализуется (теоретически) бесконечно много раз. Для малого числа реализаций решения допускается некоторый риск.

 • Критерий Байеса Лапласа. рi - вероятность появления внешнего состояния Вj. Вероятности появления • Критерий Байеса Лапласа. рi - вероятность появления внешнего состояния Вj. Вероятности появления состояния Вj известны и не зависят от времени. Решение реализуется (теоретически) бесконечно много раз. Для малого числа реализаций решения допускается некоторый риск. Критерий Сэвиджа основан на преобразовании первоначальной матрицы выигрышей в матрицу — матрицу рисков (по другому — матрицу сожалений). Содержательно r ij интерпретируется как "мера сожаления, возникающего от незнания истинного состояния среды. (Если бы принимающий решение знал истинное состояние среды j, он выбрал бы альтернативу, дающую максимальный возможный выигрыш в состоянии j и получил бы в результате выигрыш β=maxsij вместо полученного им выигрыша sij. ) Для критерия Сэвиджа наилучшей считается альтернатива, минимизирующая максимальный риск (то есть здесь используется минимаксный критерий для матрицы сожалений).

ПРОИЗВОДНЫЕ КРИТЕРИИ Критерий Гурвица связан с введением показателя 0 < а < 1, называемого ПРОИЗВОДНЫЕ КРИТЕРИИ Критерий Гурвица связан с введением показателя 0 < а < 1, называемого показателем пессимизма. Гипотеза о поведении среды состоит в этом случае в том, что при любом выборе альтернативы наихудший для принимающего решения вариант реализуется с вероятностью α, а наилучший — с вероятностью 1 — α. Тогда оценкой альтернативы i является взвешенная сумма = α ij + (1 - α) ij , При α=1 критерий Гурвица превращается в ММ-критерий. При α = 0 он превращается в критерий «азартного игрока» Ij. Основной недостаток критерия Гурвица состоит в том, что он учитывает только два исхода — наихудший и наилучший. Кроме того, имеется содержательная сложность при использовании к ритерия Гурвица — назначение показателя пессимизма α. Критерий Гурвица применяется в случае, когда : о вероятностях появления состояния Вj ничего не известно; с появлением состояния Вj необходимо считаться; реализуется только малое количество решений; допускается некоторый риск.

 • Замечание. В общем случае оптимальные решения, получаемые по указанным критериям, могут не • Замечание. В общем случае оптимальные решения, получаемые по указанным критериям, могут не совпадать (как говорят, критерии противоречат другу). Это неудивительно, ибо эти критерии основаны на разных гипотезах. Вводя ту или иную гипотезу о поведении среды, мы тем самым "снимаем неопределенность однако всякая гипотеза являтся только предположением, а не знанием. Было бы странным, если бы различные предположения приводили всегда к одному и тому же результату.

 • Критерий Ходжа Лемана. eir = + (1 - ) S ir , • Критерий Ходжа Лемана. eir = + (1 - ) S ir , 0 1. вероятности появления состояния Вj неизвестны, но некоторые предположения о распределении вероятностей возможны; принятое решение теоретически допускает бесконечно много реализаций; при малых числах реализации допускается некоторый риск. Критерий Гермейера. Критерий ориентирован на величину потерь, т. е. на отрицательные значения всех qij. r i = ij pj. Т. к. в хозяйственных задачах преимущественно имеют дело с ценами и затратами, условие sij 0 обычно выполняется. вероятности появления состояния Вj неизвестны; с появлением тех или иных состояний, отдельно или в комплексе, необходимо считаться; допускается некоторый риск; решение может реализоваться один или несколько раз.

 • BL (MM) критерий. Правило выбора для этого критерия формулируется следующим образом: матрица • BL (MM) критерий. Правило выбора для этого критерия формулируется следующим образом: матрица решений дополняется еще тремя столбцами. В первом из них записываются математические ожидания каждой из строк, во втором - разность между опорным значением и наименьшим значением . В третьем столбце помещаются разности между наибольшим значением каждой строки и наибольшим значением той строки, в которой находится

 • . Выбираются те варианты, строки которых (при соблюдении приводимых ниже соотношений между • . Выбираются те варианты, строки которых (при соблюдении приводимых ниже соотношений между элементами второго и третьего столбцов) дают наибольшее математическое ожидание. А именно, соответствующее значение из второго столбца должно быть или равно некоторому заранее заданному уровню риска Вероятности появления состояний Вj неизвестны, однако имеется некоторая априорная информация в пользу какого-либо определенного распределения; необходимо считаться с появлением различных состояний как по отдельности, так и в комплексе; допускается ограниченный риск; принятое решение реализуется один раз или многократно.

 • BL(MM) критерий хорошо приспособлен для построения практических решений прежде всего в области • BL(MM) критерий хорошо приспособлен для построения практических решений прежде всего в области техники и может считаться достаточно надежным. Однако заданные границы риска и, соответственно, оценок риска не учитывают ни число применения решения, ни иную подобную информацию. Влияние субъективного фактора хотя и ослаблено, но не исключено полностью. Условие существенно в тех случаях, когда решение реализуется только один или малое число раз. В этих условиях недостаточно ориентироваться на риск, связанный только с невыгодными внешними состояниями и средними значениями. Из-за этого, правда, можно понести некоторые потери в удачных внешних состояниях. При большом числе реализаций это условие перестает быть таким уж важным. Оно даже допускает разумные альтернативы. При этом не известны, однако, четкие количественные указания, в каких случаях это условие следовало бы опускать.

 • Критерий произведений. ir Sij = Применение этого критерия обусловлено следующими обстоятельствами: вероятности • Критерий произведений. ir Sij = Применение этого критерия обусловлено следующими обстоятельствами: вероятности появления состояния Вj неизвестны; с появлением каждого из состояний Вj по отдельности необходимо считаться; критерий применим и при малом числе реализаций решения; некоторый риск допускается. Критерий произведений приспособлен в первую очередь для случаев, когда все sij положительны. sij + а а= а > ij +1. Если же никакая константа не может быть признана имеющей смысл, то критерий произведений не применим.