Критерий байеса примеры. Принятие решений в условиях неопределенности

Экспертные оценки минимаксного метода и методов Байеса - Лапласа и Сэвиджа

Приведенные в подпараграфе 2.8.1 простейшие критерии и стратегии принятия решений (2.8.1) (2.8.5) имеют ясное и логическое объяснение мотивов, которыми руководствуются лица, принимающие решения. Далее можно перейти к рассмотрению обобщенных классических критериев принятия решений. К ним относятся минимаксный критерий, критерий Байеса - Лапласа, критерий Сэвиджа, а также другие обобщения.

Минимаксный критерий и метод

Минимаксный критерий использует оценочную функцию (2.8.1, а), соответствующую пессимистической позиции, формализуемой соотношением

Справедливо соотношение

причем Zn„„ в (2.8.8) - оценочная функция минимаксного критерия.

Правило выбора решения в соответствии с минимаксным критерием интерпретируется следующим образом. Матрица решений {ву} дополняется еще одним столбцом из наименьших результатов еГ каждой строки. При принятии решения следует выбрать такие варианты Ею, строки которых соответствуют наибольшим значениям ег этого столбца. Выбранные таким образом варианты полностью исключают риск, поскольку лицо, принимающее решение, ориентировано на пессимистическую позицию, что не позволяет получить худший результат. Вне зависимости от условий Fj результат выбора не может оказаться ниже 2.тт. Минимаксный критерий относится к числу фундаментальных, поскольку используется весьма часто. Применение минимаксного критерия оправдано в следующих ситуациях:

1) о возможности появления внешних состояний (условий) Б] ничего неизвестно (например, неизвестны вероятности появления состояний Р])щ,
2) приходится считаться с появлением различных внешних состояний Рр
3) решение реализуется только один раз;
4) необходимо исключить всякий риск (недопустимо получение результата ниже значения 2,„,„).

Критерий и метод Байеса - Лапласа

Для построения оценочной функции данного критерия используется априорная информация о вероятностях ц} появления внешних условий Ру Тем самым данная вероятностная модель учитывает каждое из возможных последствий. Пусть - вероятность появления внешнего состояния (условия) Ру Тогда критерий Байеса - Лапласа

соответствует множеству

Фактически в данном критерии в качестве оценочной функции выбирается математическое ожидание оценки, соответствующей у"-му варианту, причем усреднение происходит по множеству условий Г^.

Правило принятия решении (2.8.11)-(2.8.13) имеет вероятностную интерпретацию. При этом ситуация, в которой принимается решение, характеризуется следующими обстоятельствами:

- вероятности появления состояний (условий) известны и не зависят от времени;
- решение реализуется (теоретически) бесконечно много раз;
- для малого числа реализаций решения допускается некоторый риск.

Позиция лица, принимающего решения на основе критерия Байеса - Лапласа, является более оптимистичной, чем по минимаксному критерию.

Критерий и метод Сэвиджа

Этот критерий основывается на предварительном преобразовании матрицы системных оценок в соответствии с соотношениями

Оценочная функция имеет вид

Множество оптимальных вариантов решения определяется соотношением

Смысл критерия (2.8.16) становится ясным после анализа соотношений (2.8.14)-(2.8.17).

Величины а =(тахе, еЛ, вычисляемые в соответствии

(2.8.14), можно трактовать как максимальный дополнительный выигрыш, который достигается, если В состояний Fj вместо варианта £", выбрать другой, оптимальный для этого внешнего состояния. Величины ay =(тахву е^) можно также интерпретировать и как потери (штрафы), возникающие в состоянии Fj при замене оптимального для него варианта

Тогда величина eir определенная равенством (2.8.12), представляет собой - при интерпретации йу как потерь - максимально возможные (по всем внешним состояниям Fj) потери в случае выбора варианта Ej. Согласно соотношениям (2.8.15), (2.8.17) максимально возможные потери минимизируются за счет выбора £;.

С точки зрения матрицы {еф критерий Сэвиджа связан с риском, однако с позиции матрицы {ау) он от риска свободен, поскольку использует стратегию минимаксного критерия.

Обобщенный минимаксный критерий и метод

Этот критерий использует расширение доли вероятностно заданной неопределенности. Предположим, что для каждого из возможных внешних состояний Fj определена вероятность его появления

Введем вероятность Р, применения г"-го варианта решения и будем предполагать возможность реализации т вариантов решения. Тогда среднее значение

где Р= (/>„ ...,/>,„), д = (

В реальной ситуации вектор ц неизвестен. В этом случае, ориентируясь на наименее выгодное распределение ц состояний Fj, можно добиться максимального увеличения е(Р, д) за счет выбора наиболее удачного распределения Р вариантов решения £;. Подобная стратегия соответствует расширенному минимаксному критерию, причем в данной ситуации реализуется игровая стратегия: состояния Fj минимизируют критерий, а варианты Е, его максимизируют. Общая формулировка данного расширенного минимального критерия имеет вид

где векторы Рид определены в (2.8.18).

Таким образом, цель расширенного минимаксного критерия - нахождение наилучшего распределения вероятностей на множестве вариантов Е, когда в многократно использовавшейся ситуации ничего не известно о вероятностных состояниях ^, относительно которых предполагается "невыгодное" распределение.

Производные критерии, оценки и принятие решений

Данный класс критериев позволяет рассматривать задачи принятия решения с обобщенных позиций, причем обобщение предполагает более полный учет априорно известных факторов, а также введение новых функциональных элементов.

Следует иметь в виду, что для интерпретации критериев можно воспользоваться идеями подпараграфа 2.8.1. В соответствии с подпараграфом 2.8.1 целесообразно свести рассмотренные производные (обобщенные) критерии в табл. 2.8.

Критерий Гурвица

Оценочная функция критерия Гурвица находится между точками предельного оптимума (С = 0) и крайнего пессимизма (С = 1). Характерно, что при С = 1 критерий Гурвица превращается в минимаксный критерий (см. подпараграф 2.8.1).

Критерий Ходжа - Лемана

Критерий основан на минимаксном критерии и критерии Байеса - Лапласа, характеризуется тем, что с помощью параметра в выражает степень доверия к используемому распределению вероятностей. При V = 1 критерий переходит в критерий Байеса - Лапласа, а при V = 0 - в минимаксный критерий. Ситуация, в которой рекомендовано применение этого критерия, характеризуется следующими условиями: вероятности появления состояний Е] неизвестны, но некоторые предположения о распределениях вероятностей возможны; принятое решение теоретически допускает бесконечно много реализаций: при малых числах реализации допускается некоторый риск.

Критерий Ю. Б. Гермейера

Данный критерий ориентирован на оценочные функции, отражающие величину потерь, т.е. на отрицательные значения всех е-у матрицы оценок, применяется в хозяйственных задачах и ориентирован на цены и затраты. Смысл остальных параметров: <77 - вероятность условия Еу а ег - минимум математического ожидания затрат. В критерии Ю. Б. Гермейера допускается некоторый риск при принятии решения, а также должны быть известны вероятности Цр

Таблица 2.8.

Минимаксный критерий и метод Байеса - Лапласа

Метод позволяет лучше адаптироваться к ситуации за счет введения составных частей, логически унаследованных от других критериев (см. табл. 2.8). На первом этапе формирования критерия фиксируется опорное значение 2тт, задаваемое минимаксным критерием. Затем задается допустимый риск 5д0|| >0 и определяется множество согласия Величины £,-=£^0- ште^ё 1 характеризуют наиболее возможные потери в сравнении с е^. После этого формируется выигрышное множество /2. Множеству /] п ¡2 принадлежат варианты решений, для которых в определенных состояниях могут иметь потери по сравнению с состоянием, задаваемым минимаксным критерием, однако в других состояниях имеется, по меньшей мере, прирост выигрыша.

Таким образом, рассмотренные методы позволяют расширить классы методов, используемых для принятия решений в условиях неполной статистически заданной неопределенности на основе обработки таблиц экспертных оценок.

Предполагалось бы, что месторождения расположены равномерно по всей территории. Такой подход навряд ли можно считать правомерным, поскольку выводы, полученные с его помощью, не имеют под собой логической основы. Впрочем, критерий Байеса - Лапласа не произвольнее критерия Гурвица.

Оптимистичный подход, подходы на основе критерия Гурвица , критерия Байеса - Лапласа и критерия Сэвиджа имеют в данном случае следующий вид
Байеса (Лапласа) критерий 27, 224 Байесовский подход 27 Баланс 27 Балансирующая (или равновесная)
Среди этих критериев и правил особое место занимают правила и критерии, основанные на известной теореме Байеса. Подход, основанный на этой теореме, позволяет, во-первых, использовать некоторые методологические принципы естественных наук в управлении, а во-вторых, обеспечить корректировку суждений и принятия решений по мере накопления опыта. Последнее означает обучение управлению (в смысле принятия решений) в процессе самого управления 1.
Иногда в ходе операции неопределенность раскрывается постепенно, по мере поступления информации. В этом случае для обоснования решений удобно использовать такой объективный критерий, как апостериорная вероятность события. Саму эту вероятность проще всего вычислять с использованием формулы Байеса в терминах шансов. Рассмотрим суть этого подхода.
Критерий Байеса применяется в тех случаях, когда известно распределение вероятностей возможных состояний. Если это дискретное распределение вероятностей задано набором вероятностей , то по критерию Байеса стратегия Si предпочтительнее Sj (s > если
Частными случаями этого критерия являются критерий Байеса (при А = 1) и критерий Вальда (при А = 0).
Критерий Байеса-Лапласа в отличие от критерия Вальда учитывает каждое из возможных следствий всех вариантов решений
Критерий Байеса-Лапласа предъявляет к ситуации, в которой принимается решение , следующие требования
При z = 1 критерий преобразуется в критерий Байеса-Лапласа, а при z = О превращается в критерий Вальда . Таким образом, выбор параметра z подвержен влиянию субъективизма. Кроме того, без внимания остается и число реализаций. Поэтому этот критерий редко применяется при принятии технических решений.
Мы рассмотрели несколько основных подходов к принятию решения в случае неопределенных факторов в изучаемой модели. Можно привести примеры, когда все критерии принятия решения приводят к выбору одного и того же решения x e X, обычно же этого не происходит, каждый критерий приводит к своему решению (пример такого рода рассмотрен в следующей главе). Поэтому возникают дискуссии о том, какой критерий и когда предпочтительнее,. делаются попытки построить на основе нескольких критериев единственный. В частности, критерий Гурвица является таким объединением двух критериев. Предпринимались также попытки объединить критерий Гурвпца и критерий Байеса - Лапласа. Все получаемые критерии имеют высокую степень произвольности. По нашему мнению, единственным путем преодоления этих трудностей является многокритериальный подход, в котором ЛПР смогло бы рассмотреть варианты принимаемого решения, эффективные с точки зрения совокупности показателей, и выбрать среди них наиболее подходящий. Такой подход использован в примере, приведенном в следующей главе. Конечно, совокупность показателей при этом должна, быть не слишком велика.
Обычно опробуется несколько конфигураций с различным числом элементов и структурой соединений. Одними из наиболее важных показателей являются объем обучающего множества и обеспечение способности к обобщению при дальнейшей работе, и нужного результата можно достичь на различных схемах. Чаще всего используются процедуры последовательного спуска (с подтверждающим множеством) или N-кратного перекрестного подтверждения . Могут быть применены и более мощные информационные критерии (1) обобщенное перекрестное подтверждение (G V), итоговая ошибка предсказания Акаике (FPE), критерии Байеса (BI) и Акаике (AI) (см. ). Для того чтобы улучшить способности к обобщению и устранить опасность переобучения, применяются также уменьшение весов и их исключение (прореживание дерева). При этом изменяется архитектура сети удаляются некоторые связи и изучается, какое влияние они оказывали на эффективность. >,
БАЙЕСА (ЛАПЛАСА) КРИТЕРИЙ - в теории решений критерий принятия решений в условиях отсутствия какой-либо информации об относительных вероятностях стратегий "природы". (См. Неопределенные задачи .) По Б.(Л.)к. предлагается придать равные вероятности всем рассматриваемым стратегиям, после чего принять ту из них, при которой ожидаемый выигрыш окажется наибольшим. Имеет тот недостаток, что круг оцениваемых альтернатив в одной и той же задаче может быть различным и соответственно различной может быть также относительная вероятность каждой из них.
Критерий Ходжеса - Лемана. При реализации этого критерия используются два субъективных показателя во-первых, распределение вероятностей , используемое в критерии Байеса, во-вторых, "параметр оптимизма" из критерия Гурвица
Критерий Ходжа-Лемана базируется одновременно на критериях Вальда и Байеса-Лапласа

Критерий Лапласа
В ряде случаев представляется правдоподобным следующее рассуждение: поскольку неизвестны будущие состояния природы, постольку можно считать их равновероятными. Этот подход к решению используется в критерии “недостаточного основания” Лапласа.

Для решения задачи для каждого решения подсчитывается математическое ожидание выигрыша (вероятности состояний природы полагаются равными qj = 1/n, j = 1:n), и выбирается то решение, при котором величина этого выигрыша максимальна.

Гипотеза о равновероятности состояний природы является довольно искусственной, поэтому принципом Лапласа можно пользоваться лишь в ограниченных случаях. В более общем случае следует считать, что состояния природы не равновероятны и использовать для решения критерий Байеса-Лапласа.

Критерий Байеса-Лапласа

Этот критерий отступает от условий полной неопределенности - он предполагает, что возможным состояниям природы можно приписать определенную вероятность их наступления и, определив математическое ожидание выигрыша для каждого решения, выбрать то, которое обеспечивает наибольшее значение выигрыша:

Этот метод предполагает возможность использования какой-либо предварительной информации о состояниях природы. При этом предполагается как повторяемость состояний природы, так и повторяемость решений, и, прежде всего, наличие достаточно достоверных данных о прошлых состояниях природы. То есть, основываясь на предыдущих наблюдениях прогнозировать будущее состояние природы (статистический принцип).

Возвращаясь к нашей таблице 1 предположим, что q1=0.4, q2=0.2 и q3=0.4. Тогда согласно критерию Байеса-Лапласа таблицу 1 дополняем столбцом математических ожиданий и среди этих значений выбираем максимальное. Получим таблицу 13.

Таблица 13.

Оптимальным является решение X1.

Критерий Байеса-Лапласа предъявляет к ситуации, в которой принимается решение, следующие требования:

v вероятности появления состояний Вj известны и не зависят от времени;

v решение реализуется (теоретически) бесконечно много раз;

v для малого числа реализаций решения допускается некоторый риск.

При достаточно большом количестве реализаций среднее значение постепенно стабилизируется. Поэтому при полной (бесконечной) реализации какой-либо риск исключён.

Исходная позиция применяющего - критерий оптимистичнее, чем в случае критерия Вальда, однако она предполагает более высокий уровень информированности и достаточно длинные реализации.

Перечисленные критерии не исчерпывают всего многообразия критериев выбора решения в условиях неопределенности, в частности, критериев выбора наилучших смешанных стратегий, однако и этого достаточно, чтобы проблема выбора решения стала неоднозначной:

Таблица 14. Оптимальные варианты, полученные с помощью различных критериев

Из таблицы 14 видно, что от выбранного критерия (а, в конечном счете - от допущений) зависит и выбор оптимального решения.

Выбор критерия (как и выбор принципа оптимальности) является наиболее трудной и ответственной задачей в теории принятия решений. Однако конкретная ситуация никогда не бывает настолько неопределенной, чтобы нельзя было получить хотя бы частичной информации относительно вероятностного распределения состояний природы. В этом случае, оценив распределение вероятностей состояний природы, применяют метод Байеса-Лапласа, либо проводят эксперимент, позволяющий уточнить поведение природы.

Поскольку различные критерии связаны с различными условиями, в которых принимается решение, лучшее всего для сравнительной оценки рекомендации тех или иных критериев получить дополнительную информацию о самой ситуации. В частности, если принимаемое решение относится к сотням машин с одинаковыми параметрами, то рекомендуется применять критерий Байеса-Лапласа. Если же число машин не велико, лучше пользоваться критериями минимакса или Сэвиджа.

Примеры постановки решения задач

В данном параграфе на примере решения задач мы должны научиться определять вектор стратегий, вектор состояний и платёжную матрицу и применять различные критерии для получения оптимального решения.

Задача. В приморском городе решено открыть яхт-клуб. Сколько следует закупить яхт (из расчета: одна яхта на 5 человек), если предполагаемое число членов клуба колеблется от 10 до 25 человек. Годовой абонемент стоит 100 денежных единиц. Цена яхты - 170 денежных единиц. Аренда помещения и хранение яхт обходится в 730 денежных единиц в год.

Решение. Несомненно, что имеет смысл рассматривать количество приобретаемых яхт в диапазоне от двух до пяти (4 варианта) и количество потенциальных яхтсменов от 10 до 25. Для уменьшения объема перебора ограничимся вариантами 10, 15, 20, 25 (если полученные выводы для смежных вариантов будут существенно разниться, проведем дополнительный, уточняющий расчет). Итак: X= {Xi} = (2, 3, 4, 5) - количество яхт (i=1,2,3,4); B = {Bj} =(10, 15, 20, 25) - количество членов яхт-клуба (j=1,2,3,4).

Для того, чтобы начать поиск решения, построим матрицу решений, элементы которой показывают прибыль при принятии i -го решения при j -ом количестве членов яхт-клуба:

aij = 100min(5Xi ; Bj) - 170Xi - 730

т.е. решающее правило в нашей задаче формулируется как "доход - затраты".

Выполнив несложные расчеты, заполним матрицу решений {aij} (см. табл. 15):

теория игра матричный решение

Таблица 15. Платёжная матрица

Например, a11 = 100min(52, 10) - 1702-730 =-70

a12=100min(52, 15)-1702-730=-70

a13 = a14 = -70 (спрос на яхты останется неудовлетворенным). Отрицательные значения показывают, что при этих соотношениях спроса на яхты и их наличия яхт-клуб несет убытки.

Критерий Вальда (выбор осторожной, пессимистической стратегии) - для каждой альтернативы (количество яхт в клубе) выбирается самая худшая ситуация (наименьшее значение величины прибыли) и среди них отыскивается гарантированный максимальный эффект:

ZMM=max(-70; -240; -410; -580)=-70

Вывод: принимая решение по критерию Вальда, яхт-клубу следует закупить 2 яхты и максимум ожидаемого убытка не превысит 70 д.е.

Критерий Гурвица (компромиссное решение между самым худшим исходом и излишне оптимистическим). Рассмотрим изменение решения нашей задачи в зависимости от значений коэффициента оптимизма (в таблице 16 выделены значения, удовлетворяющие критерию Гурвица при различных):

Таблица 16. Решения по Гурвицу для различных

Вывод: при 0,5 следует закупить 5 яхт и ожидать прибыль порядка, не меньшую 170 д.е. (надеемся на широкую популярность нашего клуба и определенную финансовую состоятельность любителей), при = 0,2 не следует закупать более 2 яхт (мы более осторожны в своих прогнозах и, скорее всего, предпочтем отказаться от создания клуба).

Критерий Сэвиджа (нахождение минимального риска). При выборе решения по этому критерию сначала матрице полезности сопоставляется матрица сожалений D - для нашего примера, вычитанием (-70) из первого столбца матрицы полезности, 260 из второго столбца, 590 и 920 из третьего и четвертого столбцов соответственно, получим матрицу рисков (см. табл. 17):

Таблица 17. Матрица рисков

Наименьшее значение среди максимальных элементов строк (выделенные в таблице значения) равно:

ZS=min(990; 660; 340; 510)=340

Вывод: покупая 4 яхты для открываемого яхт-клуба, мы уверены, что в худшем случае убытки клуба не превысят 340 д.е.

Критерий принятия решения Байеса-Лапласа. Предположим, что есть статистические данные, позволяющие оценить вероятность того или иного спроса на членство в яхт-клубе: q=(0,1; 0,2; 0,4; 0,3). Тогда математическое ожидание величины прибыли для каждого из рассматриваемых вариантов решения (предложение яхт в яхт-клубе):

a1r = (-700,1)+(-700,2)+(-700,4)+(-700,3) =-70 ,

a2r= (-2400,1)+(2600,2)+(2600,4)+(2600,3) =210;

a3r = 390; a4r = 370.

Вывод: в условиях рассматриваемой ситуации наиболее целесообразно закупить 4 яхты (в этом случае максимальная ожидаемая прибыль яхт-клуба составит 390 денежных единиц).

Для применения критерия Лапласа находим:

a1r = ((-70)+(-70)+(-70)+(-70)) / 4 = -70 ;

a2r = ((-240)+(260)+(260)+(260)) / 4 =135;

a3r = 215; a4r = 170.

Вывод: в условиях равновероятности возникновения той или иной величины спроса на членство в яхт-клубе следует закупить 4 яхты и при этом можно рассчитывать на прибыль в размере 215 д.е.

Общий вывод. Рассмотренные критерии приводят к различным решениям и дают тем самым информацию к размышлению (принятое решение здесь будет существенно зависеть от психологии и интуиции субъекта решения). Это неудивительно, так как критерии основаны на различных гипотезах. вводя ту или иную гипотезу о поведении среды, мы тем самым "снимаем неопределённость", однако сама гипотеза является только предположением, а не знанием. Было бы странным, если различные предположения приводили всегда к одному и тому результату.

Принятие решений в условиях риска

Как было сказано выше, принятие решений в условиях риска характеризуется тем, что поведение природы (среды) имеет случайный характер. Это проявляется в том, что существует некоторая вероятностная мера, в соответствии с которой возникают (наступают) те или иные состояния природы. При этом лицо прин имающее решение имеет определённую информацию о вероятностях появления состояний среды, которая по своему характеру может быть весьма разнообразна. Например, имеется три состояния среды B1, B2 и B3, то дополнительная информация о появлении этих состояний может заключаться в том, что состояние B1 наименее вероятно, а состояние B3 более вероятно.

Следовательно, принятие решений в условиях риска предполагает, кроме задания функции реализации, задание некоторой дополнительной информации о вероятностях состояния среды. Если множество состояний природы B конечно (число состояний равно m), то вероятностная мера на нём может быть задана вероятностным вектором q=(q1, q2, …, qm), где qj?0 и.

Таким образом, матрица выигрышей в условиях риска может быть представлена в следующем виде (см. таблицу 1)

Состояния среды

Выбирая решение Xi, игрок знает, что получит один из выигрышей a11, …, a1m с вероятностями q1, …, qm соответственно. Следовательно, исходом для принимающего решение при выборе им решения Xi является случайная величина

Итак, сравнение двух решений X1 и X2 сводится к сравнению соответствующих им случайных величин..

Выбор оптимального решения обычно основывается на одном из следующих критериев:

1) критерий Байеса-Лапласа - ожидаемого значения (прибыли или расходов);

2) комбинации ожидаемого значения и дисперсии;

3) критерий произведения;

4) наиболее вероятного события в будущем и другие.

Рассмотрим подробнее критерий Байеса-Лапласа.

Критерий ожидаемого значения (критерий Байеса-Лапласа)

На прошлой лекции мы рассмотрели критерий Байеса-Лапласа. Использование данного критерия (в литературе встречается другое название - критерий "ожидаемого среднего значения") обусловлено стремлением максимизировать ожидаемую прибыль (или минимизировать ожидаемые затраты). Использование ожидаемых величин предполагает возможность многократного решения одной и той же задачи, пока не будут получены достаточно точные расчётные формулы. Математически это выглядит так: пусть о - случайная величина с математическим ожиданием Mо и дисперсией Dо. Если x1, x2,..., xn - значения случайной величины (с.в.) о, то среднее арифметическое их (выборочное среднее) значений

имеет дисперсию. Таким образом, когда n>

Другими словами при достаточно большом объёме выборки разница между средним арифметическим и математическим ожиданием стремится к нулю (так называемая предельная теорема теории вероятности). Следовательно, использование критерия "ожидаемое значение" справедливо только в случае, когда одно и то же решение приходится применять достаточно большое число раз. Верно и обратное: ориентация на ожидания будет приводить к неверным результатам, для решений, которые приходится принимать небольшое число раз.

Прежде чем перейти к модификации критерия Байеса-Лапласа рассмотрим данный критерий подробнее.

Известно, что естественной числовой характеристикой случайной величины о является её математическое ожидание Mо, к которому приближается среднее значение этой случайной величины при большом количестве испытаний.

Если у человека, выступающего против природы, есть статистические данные о закономерностях в конкретных проявлениях природы, то задача легко может быть решена вероятностными методами.

Таким образом, если вероятности состояний природы известны и не изменяются со временем (стационарны), то оптимальным следует считать решение, максимизирующее ожидаемый выигрыш (которое дает наибольшее математическое ожидание выигрыша против известной стратегии природы - состояния или условия).

Пример. Фирма купила станок за 100 денежных единиц. Для его ремонта можно купить специальное оборудование за 50 ед. или обойтись старым оборудованием. Если станок выходит из строя, его ремонт с помощью спецоборудования обходится в 10 ед., без спецоборудования - в 40 ед. Известно, что в течение срока эксплуатации станок выходит из строя не более трех раз: вероятность того, что станок не сломается - 0.3; сломается 1 раз - 0.4; сломается 2 раза - 0.2; сломается 3 раза - 0.1. Требуется определить целесообразность приобретения специализированного ремонтного оборудования.

Формализация. Первый игрок имеет две чистые стратегии: покупать (X1) и не покупать (X2) специализированное ремонтное оборудование. У природы - второго игрока - четыре состояния: станок не выйдет из строя, выйдет один раз, сломается два раза и три раза. Функция выигрыша - затраты фирмы на покупку и ремонт станка, задается платежной матрицей (см. таблицу 1):

Таблица 1.

Выход станка из строя

B1, ни разу

X1, не купить

X2, купить

Решение. Рассмотрим сначала эту задачу как антагонистическую игру. В матрице методом минимакса находим седловую точку: (X2, B4), таким образом, цена игры v= - 180 денежных единиц (см. таблицу 2).

Таблица 2.

Выход станка из строя

B1,ни разу

X1, не купить

X2, купить

Ответ: нужно купить специализированное оборудование.

Однако в играх с природой положение коренным образом меняется: уже в условии заложена устойчивая смешанная стратегия природы: q= (0,3; 0,4; 0,2; 0,1) и мы знаем, что именно этой стратегии придерживается природа.

Если же человек - первый игрок - будет продолжать играть оптимально, то его выигрыш составит M=-150Ч0.3-160Ч0.4-170Ч0.2-180Ч0.1=-161, а если применит первую, неоптимальную стратегию, то математическое ожидание его выигрыша составит M=-100Ч0.3 - 140Ч0.4 - 180Ч0.2 -220Ч0.1 =-144.

Таким образом, первому игроку выгодно играть не оптимально!

Таблица 3.

Выход станка из строя

B1, ни разу

X1, не купить

X2, купить

Ответ: не покупать специализированное оборудование.

Существенное различие между значениями v(x*) и v(x") объясняется тем, что смешанная стратегия природы неоптимальна и она, "отклоняясь" от своей оптимальной стратегии "недополучает" 36 денежных единиц выигрыша.

Итак, в игре с природой ориентация на математическое ожидание выигрыша есть фактически ориентация на средний выигрыш, который получится при многократном повторении этой игры (при предположении, что условия игры не меняются). Разумеется, если игра в действительности многократно повторяется, то критерий среднего выигрыша (например, в экономических задачах - средней прибыли) можно считать оправданным. Однако разумно ли ориентироваться на этот критерий при единичном испытании?

Рассмотрим следующий пример. Фирма I может выставить на продажу один из товаров TI1или TI2, а фирма II - один из товаров TII1, TII2, TII3. Товары TI1 и TII1 являются конкурирующими (например, пиво и лимонад), а товары TI1 и TII3 дополнительными (например, пиво и вобла); остальные товары нейтральны. Прибыль фирмы I зависит от сочетания товаров, выставляемых на продажу обеими фирмами, и определяется таблицей 4. Известно, что фирма II выставляет на продажу товар TII3 в три раза реже, чем TII1 и в четыре раза реже, чем TII2. Какой товар следует поставлять на продажу фирме I?

Таблица 4

Состояния среды

Здесь решение выставить на продажу фирмой I товар TI1, решение X2 выставить на продажу фирмой I товар TI2.

Вычислим математические ожидания для данной таблицы:

M=8Ч3/8+18Ч4/8+40Ч1/8=17, M=18Ч3/8+15Ч4/8+14Ч1/8=16.

Оптимальной стратегией будет решение X1, т.е. фирма I поставлять товар TI1. Безусловно, выигрыш в 17 денежных единиц лучше, чем в 16. Однако при выборе решения X1 мы получим не 17 денежных единиц, а один из выигрышей: 8, 18 или 40. При выборе решения X2 мы получим не 16 денежных единиц, а один из выигрышей 18, 15 или 14. Составим таблицу, где указаны отклонения возможных выигрышей от их ожидаемых значений и вероятности этих отклонений.

Таблица 5. Значения отклонений

Из данной таблицы видно, что при равных ожидаемых выигрышах, по-разному ведут отклонения от ожидаемых выигрышей: для X1 эти отклонения значительны, а для X2 - сравнительно невелики.

Из проведённого анализа можно сделать вывод: в условиях риска критерий Байеса-Лапласа (ожидаемого среднего выигрыша) не является адекватным и должен быть изменён с учётом возможных отклонений случайной величины от её среднего значения.

В теории вероятностей в качестве меры отклонения случайной величины от её среднего значения обычно используют дисперсию Dо или среднеквадратичное отклонение у=. В задачах принятия решений в условиях риска будем рассматривать в качестве показателя риска среднеквадратичное отклонение у, т.к. у.имеет такую же размерность, что и случайная величина о, математическое ожидание Mо.

Таким образом, для принятия решения в условиях риска выбор альтернативы Xi приводит к случайной величине оi, которая может быть охарактеризована парой показателей (Mо, уi). Теперь приступим к построению адекватного критерия сравнения альтернатив. Фактически здесь получается задача двухкритериальной оптимизации, где в качестве частных критериев выступают математическое ожидание Mо (значение данного критерия нужно максимизировать) и среднеквадратичное отклонение у (значение данного критерия нужно минимизировать).

Рассмотрим нахождение Парето-оптимальных решений для данной многокритериальной задачи. Предположим, что требуется выбрать одну оптимальное решение из множества допустимых решений, каждое из которых определяется парой показателей (Mоi, уi). Изобразив на координатной плоскости точки с координатами (Mоi, уi), получим картинку типа изображённой на рис. 1, т.е. мы получили пространство оценок. Левая часть рисунка (красные точки) значения математического ожидания мы взяли положительными, а у отрицательные значения, т.к. этот критерий (у) мы должны минимизировать. Парето-оптимальными оценками является правая верхняя граница и соответственно Парето оптимальными решениями X1, X2, X9 и X7.

В данном примере множество Парето-оптимальных решений есть X1, X2, X9, X7 и окончательный выбор оптимального решения проводится из этого множества. Как было сказано выше, здесь есть два подхода: первый подход заключается в том, что строится множество Парето-оптимальных решений и из этого множества ЛПР выбирает единственное решение на основе неформальных дополнительных соображений. Рассмотрим второй подход на основе сужения множества Парето-оптимальных альтернатив.

1. Выбор главного критерия и назначение нижних границ по остальным критериям. Назначим нижнюю границу по критерию M и минимизировать критерий у. В качестве нижней границы критерия M возьмём значение M4 (см. рис. 1), то оптимальным будет решение X2, так среди решений удовлетворяющих условию Mi? M4, она наименее рискованна.

2. Лексикографическая оптимизация предполагает упорядочение критериев по важности. Пусть, например, M - важнейший критерий. Так как максимальное значение по критерию M имеет единственное решение X7, то оно и является оптимальным. Здесь наглядно проявляется недостаток метода лексикографической оптимизации: учёт одного (важнейшего) критерия. Этот недостаток связан с необходимостью введения жесткого приоритета критериев и может быть снят за счёт ослабления "жесткости" приоритетов. В этом случае используют метод последовательных уступок (метод смены цели), который был рассмотрен выше.

Например, в нашем случае в качестве уступки по критерию M величину Д, указанную на рис. 1. Тогда результатом выбора на первом шаге будут альтернативы X7, X8, X9. Среди них наилучшей по второму критерию будет X9. Таким образом, несколько снизив требования по критерию M, мы значительно улучшили оценку по критерию у (т.е. некоторое уменьшение ожидаемого выигрыша привело к существенному снижению риска).

Рис. 1.

Рассмотрим применение обобщенного критерия для нашей задачи. Возьмём в качестве обобщённого критерия функцию вида:

f(M, у)= M-лЧу, (1)

где л - некоторая постоянная величина. Фактически критерий (1) представляет аддитивный критерий оптимальности частных критериев M, у с весовыми коэффициентами 1 и - л. При л>0 оценка случайной величины с помощью аддитивного критерия (1) меньше, чем её среднее значение, что характерно для осторожного человека, т.е. человека не склонного к риску. Напротив, при л<0 оценка (1) выше, чем среднее значение, что характеризует человека, склонного к риску. Наконец, при л=0 оценка случайной величины совпадает с её средним значением (т.е. возможные отклонения случайной величины от её среднего значения игнорируются) - это характеризует человека, безразличного к риску.

Содержательный смысл аддитивного критерия (1) при л>0 состоит в том, что увеличение критерия f(M, у) может происходить как за счёт увеличения M, так и за счёт уменьшения у. Таким образом, для человека, не склонного к риску, критерий (1) отражает стремление к увеличению ожидаемого выигрыша и уменьшению риска отклонения от него. При этом показатель л характеризует субъективное отношение принимающего решение к риску. Следовательно, л можно рассматривать как субъективный показатель меры несклонности к риску (субъективный показатель осторожности).

Выбор варианта производимого товара. Фирма может выпускать продукцию из следующих шести видов: зонтики (З), куртки (К), плащи (П), сумки (С), туфли (Т) и (Ш). Глава фирмы должен принять решение, какой из этих видов продукции выпускать в течение предстоящего летнего сезона. Прибыль фирмы зависит от того, каким будет лето - дождливым, жарким или умеренным, и определяется таблицей 6. Выбор какого варианта производства будет оптимальным?

При отсутствии дополнительной информации о состояниях среды в условиях неопределённости, и её решение возможно при принятии какой-либо гипотезы о поведении среды. Если принимающий решение имеет информацию о вероятностях наступления дождливого, жаркого и умеренного лета, то указанная задача становится задачей принятия в условиях риска. В рассматриваемой случае необходимая информация может быть взята из статистических данных (наблюдений за погодой в данной местности). Предположим, что вероятность дождливого, жаркого и умеренного лета равна соответственно 0.2, 0.5 и 0.3. Тогда получаем задачу принятия решения в условиях риска, заданную таблицей 7.

Таблица 6.

Найдём ожидаемые выигрыши, соответствующие решениям З, К, П, С, Т, Ш. Имеем:

МЗ=0.2Ч80+0.5Ч60+0.3Ч40=58,

Мк=0.2Ч70+0.5Ч40+0.3Ч80=58,

МП=0.2Ч70+0.5Ч50+0.3Ч60=57,

МС=0.2Ч50+0.5Ч50+0.3Ч70=56,

МТ=0.2Ч75+0.5Ч50+0.3Ч50=55,

DоЗ=196, DоК=336, DоП=61, DоС=84, DоТ=100, DоШ=231.5. Среднеквадратичные отклонения рассматриваемых случайных величин таковы:

уЗ=14.0, уК=18.3, уП=7.8, уС=9.2, уТ=10.0, уШ=15.2.

Составим таблицу значений критериев M и у для каждой альтернативы (таблица 8)

таблица 8

Критерии

Представим рассматриваемые решения точками на координатной плоскости переменных M и у, получим рис. 2, из которого Парето-оптимальные решения З, П, Ш. Окончательный выбор оптимальной альтернативы должен производиться из этого множества.

Сужение Парето-оптимального множества (в идеале - до одного элемента) может быть произведено только при наличии дополнительной информации о соотношении критериев M и у. Как было сказано выше, это можно сделать методом главного критерия, методом последовательных уступок или с использованием лексикографического критерия.

Обзор критериев принятия решения в условиях риска

Критерий произведений

Правило выбора в этом случае формулируется так:

Матрица решений дополняется новым столбцом, содержащим произведения всех результатов каждой строки. Выбираются те варианты, в строках которых находятся наибольшие значения этого столбца.

Применение этого критерия обусловлено следующими обстоятельствами:

· вероятности появления состояния Bj неизвестны;

· с появлением каждого из состояний Bj по отдельности необходимо считаться;

· критерий применим и при малом числе реализаций решения;

· некоторый риск допускается.

Критерий произведений приспособлен в первую очередь для случаев, когда все aij положительны. Если условие положительности нарушается, то следует выполнять некоторый сдвиг aij+а с некоторой константой а> . Результат при этом будет, естественно зависеть от а. На практике чаще всего

Если же никакая константа не может быть признана имеющей смысл, то критерий произведений не применим.

Предыдущая Главная Следующая

Принятие решения в условиях риска с возможностью проведения эксперимента

При принятии решения в условиях неопределённости (или в условиях риска) принципиальная сложность выбора решения возникает из-за незнания ЛПР истинного состояния среды. В предыдущих лекциях рассмотрено несколько критериев, каждый из которых по-своему "борется" с неопределённостью: с помощью выдвижения гипотезы о поведении среды (критерий Лапласа, Вальда, Гурвица и Сэвиджа); с помощью усреднения получаемых выигрышей (критерий Байеса-Лапласа или критерий ожидаемого выигрыша); с помощью учёта как ожидаемого выигрыша, так и меры отклонения от него. Однако, каждый из этих подходов даёт лишь способ рационального анализа неопределённости, не устраняя самой неопределённости. Устранение или хотя бы уменьшение неопределённости может быть произведено только на основе уточнения истинного состояния среды.

На практике такое уточнение осуществляется, как правило, с помощью сбора дополнительной информации, а также с помощью проведения экспериментов, по результатам которых судят об имеющемся состоянии среды. Например, прежде чем приступить к лечению больного при неясном диагнозе, врач проводит дополнительные анализы; прежде чем бурить дорогостоящую нефтяную скважину, геолог производит сейсморазведку; прежде чем наладить производство какого-либо товара, предприниматель изготавливает пробную партию этого товара и т.д. В рамках теории принятия решений все эти действия означают не что иное, как проведение эксперимента с целью уточнения состояния среды.

Эксперимент называется идеальным, если по его результатам ЛПР узнаёт истинное состояние среды. На практике наличие идеального эксперимента - явление довольно редкое. Чаще всего результат эксперимента даёт некоторую информацию, на основе которой может быть произведено уточнение среды.

Как использовать результаты эксперимента и имеющиеся статистические данные при принятии решений наиболее эффективно? Одна из методик, позволяющая решить эту проблему основана на формуле Байеса - формула переоценки вероятностей событий с учётом результата проведённого эксперимента.

Отметим, что не для всякой задачи принятия решения эксперимент является возможным. Если для некоторой задачи эксперимент возможен, то возникает задача оценки целесообразности его проведения. Дело в том, что проведение эксперимента всегда требует затрат (материальных, организационных, временных и пр.).

В книге [Розен] показано, что идеальный эксперимент является выгодным тогда и только тогда, когда его стоимость меньше минимального ожидаемого риска:

где rij - риски, C - стоимость эксперимента.

Для изложения байесовского подхода к переоценке вероятностей напомним некоторые понятия из теории вероятностей.

Условная вероятность события A при условии, что произошло событие B, обозначается P(A/B) и вычисляется по формуле

Рассмотрим следующую теоретико-вероятностную схему. Пусть B1, B2, …, Bm - полная группа событий и для каждого события Bj, j= известна её вероятность P(Bj). Пусть произведён опыт, в результате которого произошло событие A. Если известны условные вероятности P(A/Bj) для всех j=, тогда условная вероятность (послеопытная) вероятность события Bj (j=,) может быть найдена по формуле Байеса

Рассмотрим теперь в схематической форме задачу принятия решения в условиях риска, заданную с помощью матрицы выигрышей, которая имеет вид табл.

Таблица 1. Платёжная матрица с вероятностным вектором состояния среды

Состояния среды

Здесь B1, B2, …, Bm - состояния среды, aij - выигрыш игрока в ситуации, когда он выбирает стратегию Xi, а среда принимает состояние Bj. ЛПР известна вероятность P(Bj)= qj наступления состояния Bj, причём P(Bj)?0 и. Предполагается, что среда может находиться в одном и только в одном из состояний B1, B2, …, Bm. Другими словами, случайные события B1, B2, …, Bm образуют полную группу событий, поэтому их можно взять в качестве гипотез. Известные ЛПР вероятности состояний среды P(Bj) (j=) являются безусловными (доопытными, априорными) вероятностями.

Предположим, что проводится некоторый эксперимент, результат которого как-то зависит от имеющегося состояния среды. Если в результате эксперимента наблюдается событие A и, кроме того, известны условные вероятности P(A/Bj) для всех j=, то используя формулу Байеса, можно найти послеопытные (апостериорные) вероятности каждого состояния среды. Знание уточненных вероятностей состояний среды позволяет более точно указать стратегию ЛПР.

Описанный подход к принятию решений в условиях риска называется байесовским, так как он основан на формуле Байеса. Этот подход иллюстрируется примером, рассмотренным ниже.

Задача. Бурение нефтяной скважины.

Руководитель поисковой группы должен принять решение: бурить нефтяную скважину или нет. Скважина может оказаться "сухой" (С), т.е. без нефти, "маломощной" (М), т.е. с малым содержанием нефти, и "богатой" (Б), т.е. с большим содержанием нефти. Альтернативами руководителя группы являются: x1 - бурить и x2 - не бурить. Чистая прибыль при выборе одной из альтернатив в зависимости от возможного типа скважины приведена в таблице прибылей (см. табл. 1)

Таблица 1. Платёжная матрица

Тип скважины

Кроме того, руководителю поисковой группы известно, что в данной местности вероятности сухой, маломощной или богатой скважины таковы: P(C)=0.5, P(M)=0.3, P(Б)=0.2.

Руководитель поисковой группы может провести эксперимент с целью уточнения структуры грунта (состояния среды). Этот эксперимент представляет собой сейсморазведку, результатом которой будет ответ - какова структура грунта в данной местности (но не ответ на вопрос о типе скважины!). В принципе структура грунта может быть либо открытой (О), либо замкнутой (З). Руководитель группы имеет таблицу результатов экспериментов, приведённой в этой местности (см. табл. 2).

Таблица 2. Таблица экспериментальных данных

Эта таблица показывает, сколько раз на грунтах открытой и грунтах замкнутой структуры встречались скважины типа С, М, Б (т.е. даёт совместную статистику грунта и типа скважин для данной местности).

Проведём анализ экспериментальных данных полученной таблицы. Предположим, что произведено n экспериментов, результаты которых являются значениями дискретных случайных величин X (тип скважины) и Y (структура грунта), которые принимают соответственно значения С, М, Б и О, З. Обозначим через n11 число экспериментов, в которых X=С и Y=О, через n12 число экспериментов, в которых X=С и Y=З, через n21 число экспериментов, в которых X=М и Y=О и т.д. В нашем случае n=100, n11=45, n12=5, n21=11. Разделив значения таблицы 2 на 100 (на число проведённых экспериментов), мы получим закон распределения двумерной случайной величины (X, Y) заданной в табличной форме (см. табл. 3).

Таблица 3. Статистический ряд распределения двумерной с.в. (X, Y)

Из таблицы 3 следует, что Р(X=C)=P(C)=0.5, Р(X=M)=P(M)=0.3, Р(X=Б)=P(Б)=0.2; Р(Y=O)=P(O)=0.6, Р(Y=З)=P(З)=0.4,

Итак, руководитель группы должен принять решение:

· проводить ли эксперимент (его стоимость составляет 10 единиц);

· если проводить, то, как поступать в дальнейшем в зависимости от результатов эксперимента.

Таким образом, получена многошаговая задача принятия решений в условиях риска. Опишем методику нахождения оптимального решения.

Шаг 1. Построим дерево (рис. 1), на котором указаны все этапы процесса принятия решений - дерево решений. Ветви дерева соответствуют возможным альтернативам, а вершины - возникающим ситуациям. Альтернативами руководителя поисковой группы являются: б - отказ от эксперимента, в - проведение эксперимента, x1 - бурить, x2 - не бурить. Состояния природы: выбор типа скважины (С, М, Б), а также выбор структуры грунта (О, З).

Построенное дерево определяет игру руководителя группы с природой. Позициями данной игры служат вершины дерева, а ходами игроков - выбираемые ими решения. Позиции, в которых ход делает руководитель группы, изображены прямоугольником; позиции, в которых ход делает природа, - кружком.

Игра протекает следующим образом. В начальной позиции ход делает руководитель группы. Он должен принять решение - отказаться от эксперимента (выбрать решение б) или проводить эксперимент (выбрать решение в). Если он отказался от эксперимента, то игра переходит в следующую позицию, в которой руководитель группы должен принять решение: бурить (выбрать альтернативу x1) или не бурить (выбрать альтернативу x2). Если же он решает проводить эксперимент, то игра переходит в позицию, в которой ход делает природа, выбирая одно из состояний О или З, соответствующих возможным результатам эксперимента, и т. д. Игра заканчивается тогда, когда она переходит в окончательную позицию (т.е. вершину дерева, для которой нет исходящих из неё ветвей)

Шаг 2. Для каждого решения, которое является ходом природы (т.е. исходит из позиции, изображённой кружком), надо найти вероятность этого хода. Для этого поступаем следующим образом. Для каждой позиции дерева существует единственный путь, соединяющий эту позицию с начальной позицией. Если это для позиции природы, путь, соединяющий её с с начальной позицией, не проходит через позицию (Э), означающую проведение эксперимента, то вероятности состояний Р(С), Р(М) и Р(Б) являются безусловными (доопытными) и находятся из табл. 3:

Р(С)=50/100, Р(М)=30/100, Р(Б)=20/100.

Если же для позиции природы путь, соединяющий её с начальной позицией, проходит через позицию (Э), то вероятности состояний среды становятся условными вероятностями и находятся по формулам (1), используя данные табл. 3:

В позиции (Э) вероятности ходов, приводящих к позициям (О) и (З), находятся из таблицы 3: Р(О)=0.6, Р(З)=0.4.

Рис. 1.

Шаг 3. Произведём оценку всех позиций дерева игры, "спускаясь" от конечных позиций к начальной. Оценкой позиции служит ожидаемый выигрыш в этой позиции. Оценки конечных позиций находим из таблицы 2. Укажем теперь способ нахождения оценки произвольной позиции дерева игры в предположении, что уже найдены оценки всех следующих за ней позиций.

Для позиции природы её оценка представляет собой ожидаемый выигрыш (см. рис 2);

Для позиции игрока оценкой служит максимум всех за ней позиций. Мотив: в "своей" позиции игрок может сделать любой ход, поэтому он выберет тот, который приводит к наибольшему возможному выигрышу (см. рис 3). В каждой позиции игрок помечает черточкой ту ветвь дерева, которая приводит к позиции, имеющей максимальную оценку.

Обратимся к рис. 1. Получаем, что в начальной позиции ожидаемая прибыль без проведения эксперимента (альтернатива б) - 20 единиц; ожидаемая прибыль с проведением эксперимента (альтернатива в) - 28 единиц. Таким образом, целесообразным является решение - проводить эксперимент (сейсморазведку). Далее, если эксперимент покажет, что грунт открытый, то бурение производить не следует, а если замкнутый, то нужно бурить.

1 - ветвь: =20

2 - ветвь: 0

3 - ветвь:= -30

4 - ветвь: 0

5 - ветвь: =95

6 - ветвь: 0

Как следует из условия задачи, значение в 95 единиц мы можем получить с вероятностью 0.4. Следовательно, ожидаемый выигрыш будет равен 0.4*95=38 единицам. Вычитаем расходы на проведение эксперимента равное 10 единицам.

В итоге получим 28 единиц.

Деревья решений иерархически представляют собой логическую структуру принятия решений, и облегчает тем самым понимание задачи и процесс её решения. В отличие от матрицы решений здесь можно видеть временной ход процесса принятия решения. Дерево решений нельзя, однако, в общем случае представить простой матрицей решений; так могут быть представлены лишь отдельные этапы процесса. Разбиение на этапы производят так, чтобы выбор решения начинался с некоторого узла решений, от которого исходят одна или несколько ветвей, представляющих варианты решений. Далее следуют узлы событий и на конце - листья", представляющие конечные состояния с указанием значений соответствующих выходных параметров. Если же за узлами событий следует опять узел решений с соответствующими действиями, тогда это и всё последующие разветвления относятся к более поздней стадии выбора решения.. Таким образом, можно проследить весь путь с начала до конца дерева решений.

В дереве решений различают узлы событий и узлы решений. Можно себе представить, что в узлах событий выбор дальнейшего пути определяется внешними условиями (природой, в теории игр противником), а в узлах решений - лицом, принимающим решение.

Деревья решений легко поддаются модификации: при необходимости их можно дополнительно развить, а в случаях, когда какие-либо ветви практически лишены значения, - соответственно уменьшить. Узлы решений, если они связаны с одним действием и не разделены узлами событий могут быть объединены. То же справедливо и для узлов событий.

Краткая теория

Любую хозяйственную деятельность человека можно рассматривать как игру с природой. В широком смысле под природой будем понимать совокупность неопределенных факторов, влияющих на эффективность принимаемых решений.

Управление любым объектом осуществляется путем принятия последовательности управленческих решений. Для принятия решения необходима информация (совокупность сведений о состоянии объекта управления и условиях его работы). В тех случаях когда отсутствует достаточно полная информация, возникает неопределенность в принятии решения. Причины этого могут быть различны: требующаяся для полного обоснования решения информация принципиально не может быть получена (неустранимая неопределенность); информация не может быть получена своевременно, к моменту принятия решения; затраты, связанные с получением информации, слишком высоки. По мере совершенствования средств сбора, передачи и обработки информации неопределенность управленческих решении будет уменьшаться. К этому нужно стремиться. Существование неустранимой неопределенности связано со случайным характером многих явлений. Например, в торговле, случайный характер изменения спроса делает невозможным его точное прогнозирование, a, следовательно, и формирование идеально точного заказа на поставку товара. Принятие решения в этом случае связано с риском. Приемка партии товара на основании выборочного контроля также связана с риском принятия решения в условиях неопределенности. Неопределенность может быть снята путем полного контроля всей партии, однако это может оказаться слишком дорогостоящим мероприятием. В сельском хозяйстве, например, с целью получения урожая человек предпринимает ряд действии (пашет землю, вносит удобрения, борется с сорняками и т. п.). Окончательный результат (урожай) зависит от действий не только человека, но и природы (дождь, засуха, вечер и т. п.). Из приведенных примеров видно, что полностью исключить неопределенность в управлении экономической системой нельзя, хотя, повторим, к этому нужно стремиться. В каждом конкретном случае следует принимать во внимание степень риска при принятии управленческих решений, по возможности максимально учитывать имеющуюся информацию с целью уменьшения неблагоприятных последствий, которые могут возникнуть из-за ошибочных решений.

Две стороны, участвующие в игре, будем называть игрок I и игрок II. Каждый из игроков располагает конечным набором действий (чистых стратегий), которые он может применять в процессе игры. Игра имеет повторяющийся, циклический характер. о каждом цикле игроки выбирают одну из своих стратегии, что однозначно определяет платеж . Интересы игроков противоположны. Игрок I старается вести игру так, чтобы платежи были как можно большими. Для игрока II желательны как можно меньшие значения платежей (с учетом знака). Причем в каждом цикле выигрыш одного из игроков в точности совпадает с проигрышем другого. Игры такого типа называются играми с нулевой суммой.

Решить игру - значит определить оптимальное поведение игроков. Решение игр является предметом теории игр. Оптимальное поведение игрока инвариантно относительно изменения всех элементов платежной матрицы на некоторую величину.

В общем случае определение оптимального поведения игроков связано с решением двойственной пары задач линейного программирования. В отдельных случаях могут быть использованы более простые методы. Часто платежную матрицу удается упростить путем удаления из нее строк и столбцов, соответствующих доминируемым стратегиям игроков, доминируемой называется стратегия, все платежи которой не лучше соответствующих платежей некоторой другой стратегии и хотя бы один из платежей хуже соответствующего платежа этой другой стратегии, называемой доминирующей.

В обычной стратегической игре принимают участие «разумные и антагонистические» противники (противоборствующие стороны). В таких играх каждая из сторон предпринимает именно те действия, которые наиболее выгодны ей и менее выгодны противнику. Однако очень часто неопределенность, сопровождающая некоторую операцию, не связана с сознательным противодействием противника, а зависит от некой, не известной игроку I объективной действительности (природы). Такого рода ситуации принято называть играми с природой. Игрок II - природа - в теории статистических игр не является разумным игроком, так как рассматривается как некая незаинтересованная инстанция, которая не выбирает для себя оптимальных стратегий. Возможные состояния природы (ее стратегии) реализуются случайным образом. В исследовании операций оперирующую сторону (игрока I) часто называют статистиком, а сами операции - играми статистика с природой или статистическими играми.

Рассмотрим игровую постановку задачи принятия решения в условиях неопределенности. Пусть оперирующей стороне необходимо выполнить операцию в недостаточно известной обстановке относительно состояний которой можно сделать предположений. Эти предположения будем рассматривать как стратегии природы. Оперирующая сторона в своем распоряжении имеет возможных стратегий - . Выигрыши игрока I при каждой паре стратегий и - предполагаются известными и заданы платежной матрицей .

Задача заключается в определении такой стратегии (чистой или смешанной), которая лри ее применении обеспечила бы оперирующей стороне наибольший выигрыш.

Выше уже говорилось, что хозяйственная деятельность человека может рассматриваться как игра с природой. Основной особенностью природы как игрока является ее не заинтересованность в выигрыше.

Анализ матрицы выигрышей игры с природой начинается с выявления и отбрасывания дублирующих и заведомо невыгодных стратегий лица, играющего с природой. Что касается стратегий природы, то ни одну из них отбросить нельзя, так как каждое из состояний природы может наступить случайным образом, независимо от действий игрока I. Ввиду того что природа не противодействует игроку I, может показаться, что игра с природой проще стратегической игры. На самом деле это не так. Противоположность интересов игроков в стратегической игре в некотором смысле как бы снимает неопределенность, чего нельзя сказать о статистической игре. Оперирующей стороне в игре с природой легче в том отношении, что она скорее.всего выиграет больше, чем в игре против сознательного противника. Однако ей труднее принять обоснованное решение, так как в игре с природой неопределенность ситуации сказывается в гораздо более сильной степени.

После упрощения платежной матрицы игры с природой целесообразно не только оценить выигрыш при той или иной игровой ситуации, но и определить разность между максимально возможным выигрышем при данном состоянии природы и выигрышем, который будет получен при применении стратегии в тех же условиях. Эта разность в теории игр называется риском.

Природа меняет состояние стихийно, совершенно не заботясь о результате игры. В антагонистической игре мы предполагали, что игроки пользуются оптимальными (в определенном выше смысле) смешанными стратегиями. Можно предположить, что природа применяет наверняка не оптимальную стратегию. Тогда какую? Если бы существовал ответ на этот вопрос, то принятие решения лицом, принимающим решения (ЛПР) сводилось бы к детерминированной задаче.

Если вероятности состояний природы известны, то пользуются критерием Байеса, в соответствии с которым оптимальной считается чистая стратегия , при которой максимизируется средний выигрыш:

Критерий Байеса предполагает, что нам хотя и неизвестны условиях выполнения операций (состояния природы) , но известны их вероятности .

С помощью такого приема задача о выборе решения в условиях неопределенности превращается в задачу о выборе решения в условиях определенности, только принятое решение является оптимальным не в каждом отдельном случае, а в среднем.

Если игроку представляются в равной мере правдоподобными все состояния природы, то иногда полагают и, учитывая, «принцип недостаточного основания» Лапласа, оптимальной считают чистую стратегию , обеспечивающую:

Если же смешанная стратегия природы неизвестна, то в зависимости от гипотезы о поведении природы можно предложить ряд подходов для обоснования выбора решения ЛПР. Свою оценку характера поведения природы будем характеризовать числом , которое можно связывать со степенью активного «противодействия» природы как игрока Значение соответствует наиболее пессимистичному отношению ЛПР в смысле «содействия» природы в достижении им наилучших хозяйственных результатов. Значение соответствует наибольшему оптимизму ЛПР. Как известно, в хозяйственной деятельности указанные крайности опасны. Скорее всего, целесообразно исходить из некоторого промежуточного значения . В этом случае используется критерий Гурвица, согласно которому наилучшим решением ЛПР является чистая стратегия , соответствующая условию:

Критерий Гурвица (критерий «оптимизма-пессимизма») позволяет руководствоваться при выборе рискового решения в условиях неопределенности некоторым средним результатом эффективности, находящимся в поле между значениями по критериям «максимакса» и «максимина» (поле между этими значениями связано посредством выпуклой линейной функции).

В случае крайнего пессимизма ЛПР указанный критерий называется критерием Вальда. Согласно этому критерию, наилучшей считается максиминная стратегия. Это критерий крайнего пессимизма. По этому критерию ЛПР выбирает ту стратегию, которая гарантирует в наихудших условиях максимальный выигрыш:

Такой выбор соответствует наиболее робкому поведению ЛПР, когда он предполагает наиболее, неблагоприятное поведение природы, боится больших потерь. Можно предположить, что он не получит больших выигрышей. Согласно критерию Сэвиджа, следует выбирать чистую стратегию соответствующую условию:

где риск .

Критерий Сэвиджа (критерий потерь от «минимакса») предполагает, что из всех возможных вариантов «матрицы решений» выбирается та альтернатива, которая минимизирует размеры максимальных потерь по каждому из возможных решений. При использовании этого критерия «матрица решения» преобразуется в «матрицу риска», в которой вместо значений эффективности проставляются размеры потерь при различных вариантах развития событий.

Недостатком критериев Вальда, Сэвиджа и Гурвица является субъективная оценка поведения природы. Хотя указанные критерии и дают некоторую логическую схему принятия решений, резонно все же задать вопрос: «А почему сразу не выбрать субъективное решение, вместо того чтобы иметь дело с разными критериями?» Несомненно, определение решения по различным критериям помогает ЛПР оценить принимаемое решение с различных позиций и избежать грубых ошибок в хозяйственной деятельности.

Пример решения задачи

Условие задачи

После нескольких лет эксплуатации оборудование может оказаться в одном из трех состояний:

требуется профилактический ремонт;

требуется замена отдельных деталей и узлов;

требуется капитальный ремонт.

В зависимости от ситуации руководство предприятия может принять следующие решения:

Требуется найти оптимальное решение данной проблемы по критерию минимизации затрат с учетом следующих предположений:

a 4 6 9 b 5 3 7 c 20 15 6 q 0.4 0.45 0.15
Решение задачи

Если возникли сложности с решением задач, то сайт сайт оказывает онлайн помощь студентам по методам оптимальных решений с контрольными или экзаменами.

Игра парная, статистическая. В игре участвуют 2 игрока: руководство предприятия и природа.

Под природой в данном случае понимаем совокупность внешних факторов, которые определяют состояние оборудования.

Стратегия руководства:

Отремонтировать оборудование своими силами

Вызвать бригаду специалистов

Заменить оборудование новым

Стратегия природы - 3 возможных состояния оборудования.

Требуется профилактический ремонт;

Следует заменить отдельные детали и узлы;

Требуется капитальный ремонт.

Расчет платежной матрицы и матрицы рисков

Поскольку элементы матрицы - затраты, то будем считать их выигрышными но со знаком минус. Платежная матрица:

-4 -6 -9 -9 -5 -3 -7 -7 -20 -15 -6 -20 0.4 0.45 0.15
Составляем матрицу рисков:

-4-(-20)=16 -6-(-15)=9 -9-(-9)=0 16 -5-(-20)=15 -3-(-15)=12 -7-(-9)=2 15 -20-(-20)=0 -15-(-15)=0 -6-(-9)=3 3
Критерий Байеса

Определяем средние выигрыши:

По критерию Байеса оптимальной является стратегия - вызвать бригаду специалистов

Критерий Лапласа

Определим средние выигрыши:

По критерию Лапласа оптимальной является стратегия - вызвать бригаду специалистов

Критерий Вальда

По критерию Вальда оптимальной является стратегия - вызвать бригаду специалистов

Критерий Сэвиджа

По критерию Сэвиджа оптимальной является стратегия - заменить оборудование новым

Критерий Гурвица

По критерию Гурвица оптимальной является стратегия - вызвать бригаду специалистов

Ответ

По всем критериям, за исключением критерия Сэвиджа, оптимальной является стратегия «Вызвать бригаду специалистов». По критерию Сэвиджа, который минимизирует риски, оптимальной является стратегия «Заменить оборудование новым».

Содержит изложенные в краткой и доступной форме теоретические сведения о матричной игре без седловой точки и способе сведения такой задачи к задаче линейного программирования, для отыскания ее решения в смешанных стратегиях. Приведен пример решения задачи.
Многоканальная СМО с неограниченной очередью
Приведены необходимые теоретические сведения и образец решения задачи по теме "Многоканальная система массового обслуживания с неограниченной очередью", подробно рассмотрены показатели многоканальной системы массового обслуживания (СМО) с ожиданием обслуживания - среднее число каналов, занятых обслуживанием заявки, длина очереди, вероятность образования очереди, вероятность свободного состояния системы, среднее время ожидания в очереди.

Критический путь, критическое время и другие параметры сетевого графика работ
На примере решения задачи рассмотрены вопросы построения сетевого графика работ, нахождение критического пути и критического времени. Также показано вычисление параметров и резервов событий и работ - ранних и поздних сроков, общих (полных) и частных резервов.

В этом критерии для каждой стратегии (строки) определяется средний ожидаемый результат как сумма произведений вдоль строки результатов на их вероятности:
Лучшей по критерию Байеса считается та стратегия, для которой этот результат наибольший:
Место критерия Байеса. Как следует из сути и альтернативных названий этого критерия, он наилучшим образом соответствует ситуации многократной повторяемости, когда лучший средний результат приведет к лучшему общему итогу. Если рассматриваемая ситуация выбора решения будет часто повторяться при неизменных условиях, то выбор наилучшей стратегии по критерию Байеса представляется наилучшим. В остальных случаях этот критерий разумно использовать лишь как ориентировочный.
Отметим, что только в этом критерии используются значения вероятностей состояний. В остальных критериях используются только значения выигрышей.
Применим критерий Байеса к нашему примеру.
Таким образом, по критерию Байеса наилучшей является стратегия , то есть средний лучший результат приносит стратегия привлечения только финансовых консультантов.
Если фирма-исполнитель постоянно выполняет аналогичные проекты для схожих заказчиков, то общий результат деятельности будет наилучшим при выборе именно третьей стратегии. Если такой заказ имеет разовый характер, то критерий Байеса является менее предпочтительным.
Критерий Вальда (Wald) (пессимизма, наибольшего худшего результата, максимина)
В этом критерии для каждой стратегии (строки) определяется наименьший достижимый результат как минимальный элемент в строке:
Лучшей по критерию Вальда считается та стратегия, для которой этот результат наибольший:
Место критерия Вальда. Как следует из сути и альтернативных названий этого критерия, он наилучшим образом подходит для ситуации, в которой необходимо получить наименее «плачевный» результат в самом худшем случае, максимум минимального дохода или минимум максимальных потерь. Критерий соответствует пессимистично настроенному лицу, принимающему решения, когда для него страх проигрыша значительно важнее выигрыша. Выбирая стратегию по критерию Вальда мы можем твердо рассчитывать на полученный при ее определении результат даже при самом плохом стечении обстоятельств.
Применим критерий Вальда к нашему примеру.
Таким образом, по критерию Вальда наилучшей является стратегия , то есть при привлечении научных и финансовых консультантов мы в самом худшем случае получим наибольший выигрыш.
Критерий оптимизма (максимакса, крайнего оптимизма)
В этом критерии для каждой стратегии (строки) определяется наибольший достижимый результат как максимальный элемент в строке:
Лучшей по критерию оптимизмасчитается та стратегия, для которой этот результат наибольший:
Место критерия оптимизма. Как следует из сути и названий этого критерия, он наилучшим образом подходит для ситуации, в которой игрок настроен крайне оптимистично и рассчитывает на наибольший успех. Критерий хорошо работает в случае, когда потери для игрока в рассматриваемой ситуации мало значимы. Он так же соответствует случаю, когда все стратегии во всех вариантах приводят к заметным выигрышам и можно «рискнуть» понадеяться на самый крупный из них.
Результат применения этого критерия бывает обычно заранее понятным. Как правило, этот критерий для анализа игр с природой не используется, а используется более «взвешенный» критерий Гурвица.
Применим критерий оптимизма к нашему примеру.
Таким образом, по критерию оптимизма наилучшей является стратегия , то есть наибольший возможный выигрыш есть шанс получить только выполняя проект своими силами без привлечения консультантов.