Критерий сэвиджа пример решения. Дерево решений и его сворачивание

Порядок применения критерия Сэвиджа

1. Для каждого состояния природы j (столбца матрицы) определим максимальное значение выигрыша y j :

y j = max(x ij )

2. Для каждой клетки исходной матрицы X найдем разность между максимальным выигрышем r j для данного состояния природы и исходом в рассматриваемой ячейке x ij :

r ij = y j - x ij

Из полученных значений составим новую матрицу R - "матрицу сожалений" или, как ее еще можно назвать, матрицу недополученных выигрышей.

3. Для каждой альтернативы в новой матрице R найдем наибольший возможный недополученный выигрыш ("максимальное сожаление"). Это и будет являться оценкой данной альтернативы по критерию Сэвиджа S i :

S i = max(r ij ), j=1..M

4. Оптимальной может быть признана альтернатива с минимальным (!) наибольшим недополученным выигрышем:

Х* = Х k , S k = min(S i ), i=1..N

Пример применения критерия Сэвиджа

Применим изложенный выше алгоритм действий для принятия решения в условиях задачи из табл. 3.

1. Найдем наибольшую возможную величину прибыли для каждого сценария развития региона:

y 1 = max (x 11 , x 21) = max(45, 20) = 45

y 2 = max (x 12 , x 22) = max(25, 60) = 60

y 3 = max (x 13 , x 23) = max(50, 25) = 50

2. Рассчитаем значения "сожалений" для каждого проекта при каждом сценарии (т.е. найдем недополученную прибыль по сравнению с максимально возможной при данном сценарии развития). Составим из полученных значений "матрицу сожалений" (табл. 4).

для проекта Х 1 :

r 11 = y 1 - x 11 = 45 - 45 = 0

r 12 = y 2 - x 12 = 60 - 25 = 35

r 13 = y 3 - x 13 = 50 - 50 = 0

для проекта Х 2 :

r 21 = y 1 - x 21 = 45 - 20 = 25

r 22 = y 2 - x 22 = 60 - 60 = 0

r 23 = y 3 - x 23 = 50 - 25 = 25

Таблица 4

Матрица сожалений R (для примера).

4. В полученной матрице по каждой строке найдем наибольшую величину "сожаления" для каждого проекта (последний столбец в табл. 4). Это значение соответствует оценке данной альтернативы по критерию Сэвиджа.

S 1 = max(0, 35, 0) = 35

S 2 = max(25, 0, 25) = 25

5. Сравним полученные величины и найдем проект с минимальным (!) значением критерия . Он и будет оптимальным:

35 > 25 => S 1 > S 2 => X* = X 2

ЛПР, руководствующийся при принятии решений критерием Сэвиджа, выберет проект Х 2 .

Еще раз подчеркнем, что в отличие от остальных критериев, наилучшей альтернативой является та, для которой значение критерия Сэвиджа минимально , поскольку критерий отражает наибольший из возможных недополученных выигрышей для данной альтернативы. Разумеется, чем меньше можно недополучить, тем лучше.

Обычный (или простой) критерий Гурвица учитывает только крайние исходы x i max и x i min каждой альтернативы:

x i max = max(x ij ), x i min = min(x ij ), j = 1..M

Он позволяет учесть субъективное отношение применяющего данный критерий ЛПР за счет придания этим исходам разных "весов". Для этого в расчет критерия введен "коэффициент оптимизма" λ, 0 ≤ λ ≤ 1 . Формула для расчета критерия Гурвица для i -й альтернативы с коэффициентом оптимизма λ выглядит следующим образом:

H i (λ ) = λ x i max + (1 - λ ) x i min

Если исходы представляют возможные выигрыши, то оптимальной признается альтернатива с максимальным значением критерия Гурвица:

Х* = Х k , H k (λ ) = max(H i (λ )), i = 1..N

Как видно из формулы, правильный выбор коэффициента оптимизма λ оказывает существенное влияние на результат применения критерия. Остановимся подробнее на логике подбора λ .

Если ЛПР настроен пессимистически, то для него важнее меньше потерять при плохом развитии событий, пусть даже это означает не такой большой выигрыш при удачном состоянии. Значит, удельный вес наихудшего исхода x i min в оценке альтернативы должен быть выше, чем для x i mах . Это обеспечивается, когда λ находится в пределах от 0 до 0.5 , исключая последнее значение.

При λ=0 критерий Гурвица "вырождается" в критерий Вальда и подходит только для очень пессимистично настроенных ЛПР.

Оптимистичный ЛПР, напротив, ориентируется на лучшие исходы, так как для него важнее больше выиграть, а не меньше проиграть. Больший удельный вес в оценке наилучшего исхода достигается при λ больше 0.5 и до 1 включительно. При λ=1 критерий Гурвица становится критерием "максимакса", который учитывает исключительно наибольший исход каждой альтернативы.

Если у ЛПР нет ярко выраженного уклона ни в сторону пессимизма, ни оптимизма, коэффициент λ принимается равным 0.5 .

Пример применения критерия Гурвица

В условиях задачи из табл. 3 рассмотрим принятие решения по критерию Гурвица для ЛПР, настроенного оптимистически (λ = 0.8 ), и ЛПР-пессимиста (λ = 0.3 ). Порядок действий таков:

1. Найдем максимальные x i max и минимальные x i min исходы для каждого проекта:

x 1 max = max(45, 25, 50) = 50 x 1 min = min(45, 25, 50) = 25

x 2 max = max(20, 60, 25) = 60 x 2 min = min(20, 60, 25) = 20

2. Рассчитаем величину критерия Гурвица при заданных значениях коэффициента оптимизма:

ЛПР-оптимист (λ=0.8 ):

H 1 (0.8 ) = λ x 1 max + (1 - λ ) x 1 min = 0.8×50 + (1 - 0.8 )×25 = 45

H 2 (0.8 ) = λ x 2 max + (1 - λ ) x 2 min = 0.8×60 + (1 - 0.8 )×20 = 52

ЛПР-пессимист (λ=0.3 ):

H 1 (0.3 ) = λ x 1 max + (1- λ ) x 1 min = 0.3×50 + (1 - 0.3 )×25 = 32.5

H 2 (0.3 ) = λ x 2 max + (1- λ ) x 2 min = 0.3×60 + (1 - 0.3 )×20 = 32

3. Сравним полученные величины. Оптимальными для каждого ЛПР будут альтернативы с максимальным значением критерия Гурвица:

ЛПР-оптимист (λ = 0.8 ):

45 < 52 => H 1 (0.8) < H 2 (0.8) => X* = X 2

ЛПР-пессимист (λ = 0.3 ):

32.5 < 32 => H 1 (0.3) > H 2 (0.3) => X* = X 1

Как мы видим, выбор оптимальной альтернативы в одних и тех же условиях существенным образом зависит от отношения ЛПР к риску. Если для пессимиста оба проекта примерно равноценны, то оптимист, который надеется на лучшее, выберет второй проект. Его высокая наилучшая прибыль (60 ) при больших значениях коэффициента λ значительно повышает ценность данного проекта по критерию Гурвица.

Недостатком обычного критерия Гурвица является его "нечувствительность" к распределению исходов между крайними значениями. Это может приводить к неправильным решениям. Например, альтернатива А{100; 150; 200; 1000} по критерию Гурвица с "оптимистичным" коэффициентом λ = 0.7 лучше альтернативы В{100; 750; 850; 950} , так как:



H А (0.7) = 0.7×1000 + (1 - 0.7)×100 = 730

H В (0.7) = 0.7×950 + (1 - 0.7)× 100 = 695

Однако, если посмотреть внимательнее на возможности, которые предоставляет В , то становится заметно, что она выгоднее. Ее "внутренние" исходы (750 и 850 ) существенно лучше, чем у А (150 и 200) , а максимальный выигрыш лишь немногим хуже (950 против 1000 ). В реальной жизни логичнее было бы выбрать В .

Принцип построения обобщенного критерия Гурвица похож на предыдущий. Всем принимаемым в расчет исходам присваивается некоторый "удельный вес". Значение критерия для альтернативы рассчитывается как взвешенная сумма ее исходов. Однако чтобы избежать недостатков "предшественника", обобщенный критерий учитывает все исходы каждой альтернативы.

Тогда, формула для расчета обобщенного критерия для i -й альтернативы может быть записана следующим образом:

λ q - коэффициент для q -го значения i -й альтернативы,

0≤λ q ≤1, λ 1 + ... + λ q + ... + λ М = 1

Получается, что для использования обобщенного критерия Гурвица необходимо назначить М (!) коэффициентов λ q . Конечно, можно было бы это сделать произвольно. Но при большом количестве состояний М это становится весьма трудоемко, так как необходимо, чтобы коэффициенты удовлетворяли как минимум двум условиям:

1) сумма всех весовых коэффициентов должна быть равна единице:

2) величины коэффициентов должны отражать отношение ЛПР к неопределенности:

а) для оптимистичного ЛПР лучшие исходы должны иметь больший "вес", причем, чем лучше исход, тем больше "вес";

б) для пессимистичного ЛПР - все наоборот - больший "вес" у худших исходов, и чем хуже исход - тем больше "вес":

Чтобы не назначать коэффициенты произвольно по отдельности были предложены формализованные методы их расчета, один и которых мы и рассмотрим ниже.

Применим изложенный выше алгоритм действий для принятия решения в условиях задачи из п. 1 (табл. 2).

1. Найдем наибольшую возможную величину прибыли для каждого сценария развития региона:

y 1 = max (x 11 , x 21) = max(45, 20) = 45

y 2 = max (x 12 , x 22) = max(25, 60) = 60

y 3 = max (x 13 , x 23) = max(50, 25) = 50

2. Рассчитаем значения "сожалений" для каждого проекта при каждом сценарии (т.е. найдем недополученную прибыль по сравнению с максимально возможной при данном сценарии развития). Составим из полученных значений "матрицу сожалений" (см. табл.2.3).для проекта Х 1:

r 11 = y 1 - x 11 = 45 - 45 = 0

r 12 = y 2 - x 12 = 60 - 25 = 35

r 13 = y 3 - x 13 = 50 - 50 = 0

для проекта Х 2:

r 21 = y 1 - x 21 = 45 - 20 = 25

r 22 = y 2 - x 22 = 60 - 60 = 0

r 23 = y 3 - x 23 = 50 - 25 = 25

Табл.3. Матрица сожалений R (для примера).

4. В полученной матрице по каждой строке найдем наибольшую величину "сожаления" для каждого проекта (последний столбец в табл. 3). Это значение соответствует оценке данной альтернативы по критерию Сэвиджа.

S 1 = max(0, 35, 0) = 35

S 2 = max(25, 0, 25) = 25

5. Сравним полученные величины и найдем проект с минимальным (!) значением критерия. Он и будет оптимальным:

35 > 25 => S 1 > S 2 => X* = X 2

ЛПР, руководствующийся при принятии решений критерием Сэвиджа, выберет проект Х 2 .

Еще раз подчеркнем, что в отличие от остальных критериев, наилучшей альтернативой является та, для которой значение критерия Сэвиджа минимально, поскольку критерий отражает наибольший из возможных недополученных выигрышей для данной альтернативы. Разумеется, чем меньше можно недополучить, тем лучше.

Критерий Гурвица

Обычный (или простой) критерий Гурвица учитывает только крайние исходы x i max и x i min каждой альтернативы:

x i max = max(x ij), x i min = min(x ij), j = 1..M

Он позволяет учесть субъективное отношение применяющего данный критерий ЛПР за счет придания этим исходам разных "весов". Для этого в расчет критерия введен "коэффициент оптимизма" λ, 0 ≤ λ ≤ 1. Формула для расчета критерия Гурвица для i-й альтернативы с коэффициентом оптимизма λ выглядит следующим образом:

H i (λ) = λ x i max + (1 - λ) x i min

Если исходы представляют возможные выигрыши, то оптимальной признается альтернатива с максимальным значением критерия Гурвица:

Х* = Х k , H k (λ) = max(H i (λ)), i = 1..N


Как видно из формулы, правильный выбор коэффициента оптимизма λ оказывает существенное влияние на результат применения критерия. Остановимся подробнее на логике подбора λ.

Если ЛПР настроен пессимистически, то для него важнее меньше потерять при плохом развитии событий, пусть даже это означает не такой большой выигрыш при удачном состоянии. Значит, удельный вес наихудшего исхода x i min в оценке альтернативы должен быть выше, чем для x imах. Это обеспечивается, когда λ находится в пределах от 0 до 0.5, исключая последнее значение.

При λ=0 критерий Гурвица "вырождается" в критерий Вальда и подходит только для очень пессимистично настроенных ЛПР.

Оптимистичный ЛПР, напротив, ориентируется на лучшие исходы, так как для него важнее больше выиграть, а не меньше проиграть. Больший удельный вес в оценке наилучшего исхода достигается при λ больше 0.5 и до 1 включительно. При λ=1 критерий Гурвица становится критерием "максимакса", который учитывает исключительно наибольший исход каждой альтернативы.

Если у ЛПР нет ярко выраженного уклона ни в сторону пессимизма, ни оптимизма, коэффициент λ принимается равным 0.5.

Критерий минимума ожидаемых сожалений является обобшением критерия минимакса сожалений Сэвиджа, используемого для решения задачи принятия решений в условиях неопределенности. Согласно данному критерию, вычисляется матрица сожалений и затем для каждого действия вычисляется ожидаемое сожаление. Оптимальное действие соответствует минимальному значению ожидаемого сожаления. Обозначим вектор сожалений, соответствующих -ому действию,
. Ожидаемое сожаление для-ого действия есть математическое ожидание сожалений, соответствующих этому действию, т.е.

Критерий оптимальности можно записать следующим образом. Действие является оптимальным, если для любого
выполняется неравенство
или.

Используем данный критерий в задаче с вложением денег. Ожидаемые сожаления (см. матрицу сожалений в описании критерия минимакса сожалений Сэвиджа) имеют вид:

Минимальное значение ожидаемого сожаления -
. Следовательно, оптимальное действие - покупка облигаций ().

Определение функции полезности

Вернемся к критерию максимума ожидаемых полезностей, так как он имеет наибольшее распространение при решении задач принятия решений. Матрица (таблица) полезности содержит полезности (доходы), выраженные в терминах денег. Однако ожидаемые денежные значения не всегда являются наилучшим критерием в задачах принятия решений. Значение денег изменяется в различных ситуациях и для различных лиц, принимающих решение. В общем, значение денег не является линейной функцией от количества денег. В каждой ситуации аналитик должен определять полезности денег для лица, принимающего решение и выбирать альтернативный курс акций, который соответствует наибольшей ожидаемой полезности в большей степени, чем наибольшему ожидаемому денежному значению.

Люди осуществляют страховые выплаты для того, чтобы избежать возможности финансовых потерь в результате нежелательных событий. Однако полезности различных событий не могут быть пропорциональны их денежным последствиям. Если потери относительно большие, человек предпочитает осуществить соответствующую выплату. Если субъект считает, что потери незначительные, то маловероятно, что он будет осуществлять соответствующую выплату.

Субъекты различаются в их отношении к риску, и эти различия влияют на их выбор. Поэтому они должны принимать одинаковые решения относительно воспринимаемого риска в аналогичных ситуациях. Это не означает, что субъекты оценивают одинаковое количество риска в аналогичных ситуациях. Более того, из-за финансовой стабильности некоторого субъекта, два субъекта в одной и той же ситуации могут реагировать различно, но их поведение должно быть рационально.

Ожидаемое денежное вознаграждение, соответствующее различным решениям, может быть неприемлемым по следующим двум важным причинам:

1. Денежная единица, например, рубль, не всегда точно выражает персональное значение последствия. Это то, что движет некоторых людей играть в лотерею за 1 руб.

2. Ожидаемые денежные значения могут не совсем адекватно отражать нежелание рисковать. Например, предположим, что имеется выбор между получением 10 руб. за ничего не делание или за участие в игре. Результат игры зависит от подбрасывания симметричной монеты. Если выпадает орел, то игрок получает 1000 руб. Однако, если выпадает решка, игрок теряет 950 руб. Первая альтернатива имеет ожидаемое вознаграждение 10 руб., вторая - 0.5x1000 + 0.5x(- 950) = 25 руб. Очевидно, что второй выбор был бы более предпочтительным, если бы критерием был бы ожидаемое денежное вознаграждение. В то же время, субъект может предпочесть гарантированные 10 руб., чтобы избежать риска потери 950 руб.

Рассмотрим известный Санкт-Петербургский парадокс Бернулли. Парадокс состоит в следующем: симметричную монету, вероятности выпадания орла и решки которой равны 1/2, бросают до тех пор, пока не появится орел. Игрок получает
долларов, если первое выпадение орла произойдет на
-ом испытании. Вероятность этого события равна вероятности последовательного выпадения решек в первых n-1 испытаниях и появления орла на
-ом испытании, которая равна
. Таким образом, игрок может получить 2 доллара с вероятностью 1/2, 4 доллара с вероятностью 1/4, 8 доллара с вероятностью 1/8 и т.д. Следовательно среднее (ожидаемое) значение выигрыша равно

и эта сумма бесконечна. Отсюда следует, что за участие в игре можно заплатить какую угодно сумму. Однако никто не будет в этом случае руководствоваться средним денежныим выигрышем. Бернулли предложил считать не действительную денежную стоимость исходов, а внутреннюю стоимость их денежных значений. Разумно предположить, что для многих субъектов внутрення стоимость денег увеличивается с ростом суммы денег, но в уменьшающейся степени. Такой функцией, например, является логарифм. Так, если полезность долларов равна
, то среднее значение полезности равно, что является конечным числом.

Почему некоторые люди покупают страховку, а некоторые нет? Процесс принятия решений включает среди прочих психологические и экономические факторы. Концепция полезности - это попытка измерить полезность денег для лица, принимающего решение. Она позволяет объяснить, почему, например, некоторые люди покупают билет лотереи за 1 руб., чтобы выиграть 1 миллион рублей. Для таких людей 1000000x1 руб. меньше, чем 1000000 руб. Для этих людей шанс выиграть 1000000 руб. значит больше, чем 1 руб., чтобы играть. Поэтому для того, чтобы принять осознанное решение, учитывающее отношение лица, принимающего решение, к риску, нужно перевести денежную матрицу доходов в матрицу полезностей. Главный вопрос: как измерить функцию полезности для конкретного лица, принимающего решение?

Рассмотрим пример задачи принятия решений относительно инвестиций.

Прежде всего, что означает полезность 12?

a) Назначим 100 единиц полезности и ноль единиц полезности наибольшим и наименьшим доходам, выраженным в рублях, соответственно в таблице доходов. Для рассматриваемого числового примера, мы назначим 100 единиц значению 15, и 0 - значению 2.

b) Попросим ЛПР выбрать между следующими сценариями:

1) Получить 12 руб. за ничего не делание (называемые определенный эквивалент, разница между определенным эквивалентом лица, принимающего решение, и ожидаемого денежного значения называется плата за риск.).

2) Играть следующую игру: выиграть 15 руб. с вероятностью ИЛИ выиграть 2 руб. с вероятностью
, где- некоторое число от 0 до 1.

Изменяя значение и повторяя аналогичный вопрос, найдется значение, при котором ЛПР не может выбрать из двух сценариев один из-за их "одинаковости" с его точки зрения. Скажем
.

c) Теперь полезность за 12 руб. равна 0.58x100 + (1-0.58)x0 = 58.

d) Повторяя эту процедуру для всех элементов таблицы доходов, получим матрицу полезностей.

С точки зрения отношения лица, принимающего решение, можно выделить три типа поведения:

1. Если вознаграждение за риск положительное, то ЛПР готов идти на риск и называется ищущим риска . Очевидно, что некоторые люди в большей степени готовы идти на риск, чем другие: чем больше вознаграждение за риск, тем больше готовность идти на него.

2. Если вознаграждение за риск отрицательное, то ЛПР готов избежать риска и называется нерасположенным рисковать .

3. Если вознаграждение за риск нулевое, то ЛПР называется, нейтральным к риску .

Типичные графики зависимости полезности от вознаграждения или дохода для рассмотренных видов отношений к риску показаны на рисунке.

Дерево решений является одним из методов науки управления.

Дерево решений – схематичное представление проблемы принятия решений. Оно используется для выбора наилучшего направления действий из имеющихся вариантов.

Таблица 1 Дерево принятия решений

Используя дерево решений, руководитель может рассчитать результат каждой альтернативы и выбрать наилучшую последовательность действий. Результат альтернативы рассчитывается путем умножения ожидаемого результата на вероятность и последующим суммированием таких же произведений, находящихся правее на дереве решений.

Как и платежная матрица, дерево решений дает руководителю возможность учесть различные направления действий, соотнести с ними финансовые результаты, скорректировать их в соответствии с приписанной им вероятностью, а затем сравнить альтернативы. Концепция ожидаемого значения является неотъемлемой частью метода дерева решений.

Методом дерева решений можно пользоваться в ситуациях, подобных описанной выше, в связи с рассмотрением платежной матрицы. В этом случае предполагается что данные о результатах, вероятности и т.п. не влияют на все последующие решения, Однако дерево решений можно построить под более сложную ситуацию, когда результаты одного решения влияют на последующие решения.

Дерево решений можно строить под сложные ситуации, когда результаты одного решения влияют на последующие решения. Таким образом, дерево решений – это полезный инструмент для принятия последовательных решений.

Критерий Вальда (максимина, минимакса)

Критерий Вальда, более известный как критерий маскимина (для максимизируемого критерия) или минимакса (для минимизируемого), ориентирован на выбор наиболее трудной ситуации, на пессимистическое развитие событий. Оправдан в условиях конкуренции, наличия активного противодействия, когда возможность возникновения той или иной ситуации определяется не только или не столько природой, сколько действиями людей. В соответствии с ним оптимальным признается вариант, у которого значение полезности является наилучшим из наихудших возможных.



Примеры

1. Таблица решений

При использовании критерия Вальда (в данном случае - минимакса) определим гарантированные значения полезности для каждого варианта:

U 1 = min = 0.56

U 2 = min = 0.42

U 3 = min = 0.56

Подученные результаты показывают, что в смысле критерия Вальда лучшими являются варианты 1 и 3. Для их дальнейшего более тонкого сравнения необходимо привлечь дополнительную информацию или использовать другой критерий.

Таблица решений

Вариант УР S 1 S 2 S 3 e ij
a 1
а 2
а 3
а 4

а – действия

S – условия

е - эффект

Выбор делаем только на множестве Парето-оптимальных вариантов.

Вариант а 2 дает лучший гарантированный результат.

1) max min е ij максимизация минимальной прибыли

Если е ij – доходы

2) max min е ij минимизация максимальных потерь

Если е ij – потери

Критерий минимального сожаления Севиджа

Севидж ввел понятие «сожаления». Критерий Сэвиджа ориентирован на минимизацию сожаления, или потерь ЛПР от принятия решения. Сожаление для i–й альтернативы в j–й ситуации рассматривается как разница между лучшим значением показателя качества среди всех альтернатив в данной ситуации и значением этого показателя для i–й альтернативы в той же ситуации. Лучшей в смысле рассматриваемого критерия признается альтернатива с минимальным сожалением. Критерий Сэвиджа, как и критерий Вальда, ориентирован на выбор в качестве лучшей альтернативы так называемого пессимистического варианта.

Примеры

1. Таблица решений

Из таблицы видно, что предпочтительным является вариант 2.

2. Таблица сожалений

S 1 S 2 S 3
a 1
а 2
а 3

а – действия

S – условия

Выбираем min из max-ма сожалений (а 2).

Критерий Бернулли-Лапласа (недостаточной определенности)

Критерий Бернулли-Лапласа, или критерий недостаточного обоснования, исходит из предположения о равной вероятности ситуаций S j . В соответствии с этим критерием лучшим является вариант a i , для которого среднее значение полезности åU ij /m максимально на множестве рассматриваемых вариантов.

Метод недостаточного обоснования заключается в том, что нет достойного обоснования для оценки каждого сценария.

u(a i)=1/m*∑ e ij

m- минимум ущерба

Пример

Таблица решений

Применяя критерий Бернулли-Лапласа, вычислим значения полезностей исходов каждого варианта в предположении равной вероятности ситуаций. Для первого варианта получим значение 0,603, для второго – 0,687, для третьего – 0,66. Следовательно, лучшим следует признать вариант 2.

Критерий Сэвиджа использует матрицу рисков || r ij ||. Элементы данной матрицы можно определить по формулам (23), (24), ко­торые перепишем в следующем виде:

Это означает, что r ij есть разность между наилучшим значени­ем в столбце i и значениями V ji при том же i. Неза­висимо от того, является ли V ji доходом (выигрышем) или потеря­ми (затратами), r ji в обоих случаях определяет величину потерь ли­ца, принимающего решение. Следовательно, можно применять к r ji только минимаксный критерий. Критерий Сэвиджа рекоменду­ет в условиях неопределенности выбирать ту стратегию Rj, при ко­торой величина риска принимает наименьшее значение в самой неблагоприятной ситуации (когда риск максимален).

Пример 6. Рассмотрим пример 4. Заданная матрица опреде­ляет потери (затраты). По формуле (31) вычислим элементы мат­рицы рисков || r ij ||:

Полученные результаты вычислений с использованием крите­рия минимального риска Сэвиджа оформим в следующей таблице:

Введение величины риска r ji , привело к выбору первой страте­гии R 1 , обеспечивающей наименьшие потери (затраты) в самой не­благоприятной ситуации (когда риск максимален).

Применение критерия Сэвиджа позволяет любыми путями из­бежать большого риска при выборе стратегии, а значит, избежать большего проигрыша (потерь).

4.Критерий Гурвица.

Критерий Гурвицаоснован на следующих двух предположе­ниях: «природа» может находиться в самом невыгодном состоянии с вероятностью (1 - α) и в самом выгодном состоянии с вероятно­стью α, где α - коэффициент доверия. Если результат V j i - прибыль, полезность, доход и т. п., то критерий Гурвица записыва­ется так:

Когда V ji представляет затраты (потери), то выбирают действие, дающее

Если α = 0, получим пессимистический критерий Вальда.

Если α = 1, то приходим к решающему правилу вида max max V ji , или к так называемой стратегии «здорового оптими­ста», т. е. критерий слишком оптимистичный.

Критерий Гурвица устанавливает баланс между случаями край­него пессимизма и крайнего оптимизма путем взвешивания обоих способов поведения соответствующими весами (1 - α) и α, где 0≤α≤1. Значение α от 0 до 1 может определяться в зависимости от склонности лица, принимающего решение, к пессимизму или к оптимизму. При отсутствии ярко выраженной склонности α = 0,5 представляется наиболее разумной.

Пример 7. Критерий Гурвица используем в примере 4. Поло­жим α = 0,5. Результаты необходимых вычислений приведены ниже:

Оптимальное решение заключается в выборе W.

Таким образом, в примере предстоит сделать выбор, какое из возможных решений предпочтительнее:

по критерию Лапласа - выбор стратегии R 2 ,

по критерию Вальда - выбор стратегии R 3 ;

по критерию Сэвиджа - выбор стратегии R 1 ;

по критерию Гурвица при α = 0,5 - выбор стратегии R 1 , а ес­ли лицо, принимающее решение, - пессимист (α = 0), то выбор стратегии R 3 .

Это определяется выбором соответствующего критерия (Лапла­са, Вальда, Сэвиджа или Гурвица).

Выбор критерия принятия решений в условиях неопределенно­сти является наиболее сложным и ответственным этапом в иссле­довании операций. При этом не существует каких-либо общих со­ветов или рекомендаций. Выбор критерия должно производить ли­цо, принимающее решение (ЛПР), с учетом конкретной специфи­ки решаемой задачи и в соответствии со своими целями, а также опираясь на прошлый опыт и собственную интуицию.

В частности, если даже минимальный риск недопустим, то сле­дует применять критерий Вальда. Если, наоборот, определенный риск вполне приемлем и ЛПР намерено вложить в некоторое пред­приятие столько средств, чтобы потом оно не сожалело, что вложе­но слишком мало, то выбирают критерий Сэвиджа.

Задание для самостоятельного решения : написать программу на языке С++ для выбора наиболее эффективного проекта легкового автомобиля для производства, используя критерии Лапласа, Вальда, Сэвиджа и Гурвица.

Намечается крупномасштабное производство легковых автомобилей. Имеются четыре варианта проекта автомобиля

Определена экономическая эффективность V ji каждого проекта в зависимости от рентабельности производства. По истечению трех сроков рассматриваются как некоторые состояния среды (природы). Значения экономической эффективности для различных проектов и состояний природы приведены в следующей таблице (д.е.):

Состояния природы

Требуется выбрать лучший проект для производства, используя критерии Лапласа, Вальда, Сэвиджа и Гурвица при ɑ=0,1. Сравните решения и сделайте выводы.