Большая советская энциклопедия - критерий оптимальности. Критерии оптимальности

После получения точечной оценки желательно иметь данные о надежности такой оценки. Понятно, что величина является лишь приближенным значением параметра q. Вычисленная точечная оценка может быть близка к оцениваемому параметру, а может и очень сильно отличаться от него. Точечная оценка не несет информации о точности процедуры оценивания. Особенно важно иметь сведения о надежности оценок для небольших выборок. В таких случаях следует пользоваться интервальными оценками.

Задачу интервального оценивания в самом общем виде можно сформулировать следующим образом: по данным выборки построить числовой интервал, относительно которого с заранее выбранной вероятностью можно сказать, что внутри этого интервала находится оцениваемый параметр. Здесь существует несколько подходов. Наиболее распространенным методом интервального оценивания является метод доверительных интервалов .

Доверительным интервалом для параметра q называется интервал , содержащий неизвестное значение параметра генеральной совокупности с заданной вероятностью g, т.е.

.

Число g называется доверительной вероятностью , а число a=1–g – уровнем надежности . Доверительная вероятность задается априорно и определяется конкретными условиями. Обычно используется g=0,9; 0,95; 0,99 (соответственно, a=0,1; 0,05; 0,01).

Длина доверительного интервала, характеризующая точность интервальной оценки, зависит от объема выборки n и доверительной вероятности g. При увеличении величины n длина доверительного интервала уменьшается, а с приближением вероятности g к единице – увеличивается.

Часто доверительный интервал строят симметричным относительно точечной оценки, т.е. в виде

, (3.15)

Здесь число D называется предельной (или стандартной ) ошибкой выборки . Однако симметричные интервалы не всегда удается построить, более того, иногда приходится ограничиваться односторонними доверительными интервалами:

или .

Поскольку в эконометрических задачах часто приходится строить доверительные интервалы параметров случайных величин, имеющих нормальное распределение , приведем схемы их нахождения.



3.4.2. Доверительный интервал оценки генеральной
средней при известной генеральной дисперсии

Пусть количественный признак X генеральной совокупности имеет нормальное распределение с заданной дисперсией s 2 и неизвестным математическим ожиданием a . Для оценки параметра a извлечена выборка X 1 , X 2 , …, X n , состоящей из n независимых нормальной распределенных случайных величин с параметрами a и s, причем s известно, а величину a оценивают по выборке:

.

Оценим точность этого приближенного равенства. Для этого зададим вероятность g и попробуем найти такое число D, чтобы выполнялось соотношение

.

Далее воспользуемся свойствами нормального распределения. Известно, что сумма нормально распределенных величин также имеет нормальное распределение. Поэтому средняя величина имеет нормальное распределение, математическое ожидание и дисперсия которой равны

Следовательно,

.

Воспользуемся теперь формулой нахождения вероятностей отклонения нормально распределенной случайной величины от математического ожидания:

,

где F(x ) – функция Лапласа. Заменяя X на и s на , получим

,

где . Из последнее равенства находим, что предельная ошибка выборки будет равна

.

Приняв во внимание, что доверительная вероятность задана и равна g, получим окончательный результат.

Интервальная оценка генеральной средней (математического ожидания) имеет вид

, (3.17)

или более кратко

где число t g определяется из равенства .

Приведем значения t g для широко распространенных значений доверительной вероятности:

, , .

Обсудим, как влияет на точность оценивания параметра a объем выборки n , величина среднего квадратичного отклонения s, а также значение доверительной вероятности g.

а) При увеличении n точность оценки увеличивается. К сожалению, увеличение точности (т.е. уменьшение длины доверительного интервала) пропорционально , а не 1/n , т.е. происходит гораздо медленнее, чем рост числа наблюдений. Например, если мы хотим увеличить точность выводов в 10 раз чисто статистическими средствами, то мы должны увеличить объем выборки в 100 раз.

б) Чем больше s, тем ниже точность. Зависимость точности от этого параметра носит линейный характер.

в) Чем выше доверительная вероятность g, тем больше значение параметра t g , т.е. тем ниже точность. При этом между g и t g существует нелинейная связь. С увеличением g значение t g резко увеличивается ( при ). Поэтому с большой уверенностью (с высокой доверительной вероятностью) мы можем гарантировать лишь относительно невысокую точность. (Доверительный интервал окажется широким.) И наоборот: когда мы указываем для неизвестного параметра a относительно узкие пределы, мы рискуем совершить ошибку – с относительно высокой вероятностью.

Отметим, что величина

называется средней ошибкой выборки . Для бесповторной выборки эта формула примет вид

. (3.20)

Тогда предельная ошибка выборки D будет представлять собой t -кратную среднюю ошибку:

Пример 3.7. На основе продолжительных наблюдений за весом X пакетов орешков, заполняемых автоматически, установлено, что среднее квадратичное отклонение веса пакетов равно s=10 г . Взвешено 25 пакетов, при этом их средний вес составил . В каком интервале с надежностью 95% лежит истинное значение среднего веса пакетов?

.

Для определения 95%-го доверительного интервала вычислим предельную ошибку выборки

Следовательно 95%-й доверительный интервал для истинное значение среднего веса пакетов будет иметь вид

,

На первый взгляд может показаться, что полученный результат представляет только теоретический результат, поскольку среднее квадратичное отклонение s, как правило, тоже неизвестно и вычисляется по выборочным данным. Однако если выборка достаточно большая, то полученный результат вполне приемлем для практического использования, поскольку функция распределения будет мало отличаться от нормальной, а оценка дисперсии s 2 будет достаточно близка к истинному значению s 2 . Более того, полученный результат часто используют и в том случае, когда распределение генеральной совокупности отличается нормального. Это обусловлено тем, что сумма независимых случайных величин, в силу центральной предельной теоремы, при больших выборках имеет распределение, близкое к нормальному. â

Пример 3.8. Предположим, что в результате выборочного обследования жилищных условий жителей города на основе собственно-случайной повторной выборки, получен следующий вариационный ряд:

Таблица 3.5

Построить 95%-доверительный интервал для изучаемого признака.

Решение. Рассчитаем выборочную среднюю величину и дисперсию изучаемого признака.

Таблица 3.6

Общая площадь жилищ, приходящаяся на 1 чел., м 2 Число жителей, n i Середина интервала, x i
До 5,0 2,5 20,0 50,0
5,0–10,0 7,5 712,5 5343,8
10,0–15,0 12,5 2550,0 31875,0
15,0–20,0 17,5 4725,0 82687,5
20,0–25,0 22,5 4725,0 106312,5
25,0–30,0 27,5 3575,0 98312,5
30,0 и более 32,5 2697,5 87668,8
Итого 19005,0 412250,0

; ; .

Средняя ошибка выборки составит

.

Определим предельную ошибку выборки с вероятностью 0,95 ():

Установим границы генеральной средней

.

Таким образом, на основании проведенного выборочного обследования с вероятностью 0,95 можно заключить, что средний размер общей площади, приходящейся на 1 чел., в целом по городу лежит в пределах от 18,6 до 19,4 м 2 . â

3.4.3. Доверительный интервал оценки генеральной
средней при неизвестной генеральной дисперсии

Выше была решена задача построения интервальной оценки для математического ожидания нормального распределения, когда его дисперсия известна. Однако на практике дисперсия обычно тоже неизвестна и ее вычисляют по той же самой выборке, что и математическое ожидание. Это приводит к необходимости использования другой формулы при определении доверительного интервала для математического ожидания случайной величины, имеющей нормальное распределение. Такая постановка задачи особенно актуальна при малых объемах выборки.

Пусть количественный признак X генеральной совокупности имеет нормальное распределение N (a ,s), причем оба параметра a и s неизвестны. По данным выборки X 1 , X 2 , …, X n , вычислим среднее арифметическое и исправленную дисперсию:

, .

Для нахождения доверительного интервала в этом случае строится статистика

имеющая распределение Стьюдента с числом степеней свободы n=n–1 независимо от значений параметров a и s. Выбрав доверительную вероятность g и зная объем выборки n, можно найти такое число t, что будет выполняться равенство

,

.

Отсюда находим

интервальную оценку для генеральной средней (математического ожидания) при неизвестном s:

, (3.22)

или более кратко

Число t (коэффициент Стьюдента ) находится из таблиц для распределения Стьюдента. Отметим, что он является функцией двух аргументов: доверительной вероятности g и числа степеней свободы k =n –1, т.е. t=t (g,n).

Следует быть очень внимательным при использовании таблиц для распределения Стьюдента. Во-первых, обычно в таблицах вместо доверительной вероятности g используют уровень надежности a=1–g. Во-вторых, очень часто в таблицах приводятся значения т.н. одностороннего критерия Стьюдента

Или .

В этом случае в таблицах следует брать значения , если в таблице используется уровень надежности, или , если в таблице используется доверительная вероятность.

Несмотря на кажущееся сходство формул (3.17) и (3.22), между ними имеется существенное различие, заключающееся в том, что коэффициент Стьюдента t зависит не только от доверительной вероятности, но и от объема выборки. Особенно это различие заметно при малых выборках. (Напомним, что при больших выборках различие между распределением Стьюдента и нормальным распределением практически исчезает.) В этом случае использование нормального распределения приводит к неоправданному сужению доверительного интервала, т.е. к неоправданному повышению точности. Например, если n =5 и g=0,99, то, пользуясь распределением Стьюдента, получим t =4,6, а используя нормальное распределение, – t =2,58, т.е. доверительный интервал в последнем случае почти в два раза уже, чем интервал при использовании распределения Стьюдента.

Пример 3.9. Аналитик фондового рынка оценивает среднюю доходность определенных акций. Случайная выборка 15 дней показала, что средняя (годовая) доходность со средним квадратичным отклонением . Предполагая, что доходность акций подчиняется нормальному закону распределения, постройте 95%-доверительный интервал для средней доходности интересующего аналитика вида акций.

Решение. Поскольку объем выборки n =15, то необходимо применить распределение Стьюдента с степенями свободы. По таблицам для распределения Стьюдента находим

.

Используя это значение, строим 95%-доверительный интервал:

.

Следовательно, аналитик может быть на 95% уверен, что средняя годовая доходность по акциям находится между 8,44% и 12,3%. â

Пусть измерение проводят несколько раз, причем условия эксперимента поддерживают, насколько возможно, неизменными. Поскольку строго соблюдать неизменность условий невозможно, результаты отдельных измерений будут несколько различаться. Их можно рассматривать как значения случайной величины g, распределенной по некоторому закону, заранее нам неизвестному.

Очевидно, математическое ожидание равно точному значению измеряемой величины (строго говоря, точному значению плюс систематическая ошибка).

Обработка измерений основана на центральной предельной теореме теории вероятностей: если с есть случайная величина, распределенная по любому закону, то

есть также случайная величина, причем

а закон распределения величины стремится к нормальному (гауссову) при . Поэтому среднеарифметическое нескольких независимых измерений

является приближенным значением измеряемой величины, причем с тем большей надежностью, чем больше число измерений .

Однако равенство не является точным, и нельзя даже строго указать предел его ошибки; в принципе может сколь угодно сильно отличаться от хотя вероятность такого события ничтожно мала.

Ошибка приближенного равенства (2) носит вероятностный характер и описывается доверительным интервалом Р, т. е. границей, которую с доверительной вероятностью не превышает разность . Символически это записывают следующим образом:

Доверительный интервал зависит от закона распределения (а тем самым от постановки эксперимента), от числа измерений , а также от выбранной доверительной вероятности . Из (3) видно, что чем ближе к единице, тем шире оказывается доверительный интервал.

Доверительную вероятность выбирают, исходя из практических соображений, связанных с применениями полученных результатов. Например, если мы делаем игрушечный воздушный змей, то вероятность благополучного полета нас устроит, а если конструируем самолет, то даже вероятность недостаточна. Во многих физических измерениях считается достаточной.

Замечание 1. Пусть требуется найти величину z, но измерять удобнее величину связанную с ней известным соотношением например, нас интересует джоулево тепло, а измерять легче ток. При этом следует помнить, что

так, среднее значение переменного тока равно нулю, а средний джоулев нагрев отличен от нуля. Поэтому, если мы вычислим сначала а затем положим это будет грубая ошибка. Следует по каждому измерению вычислять и далее обрабатывать полученные значения .

Ширина доверительного интервала. Если известна плотность распределения величины то доверительный интервал можно определить из (3), разрешая уравнение

относительно . Выше отмечалось, что при распределение стремится к нормальному

здесь - дисперсия распределения, а величину называют стандартным отклонением или просто стандартом.

Подставляя (5) в (4) и полагая , т. е. измеряя доверительный интервал в долях стандарта, получим соотношение

(6)

Интеграл ошибок, стоящий в правой части (6), табулирован, так что из этого соотношения можно определить доверительный интервал . Зависимость дается в таблице 23 строкой, соответствующей

Из таблицы 23 видно, что доверительный интервал соответствует доверительной вероятности так что отклонение от более чем на маловероятно. Но отклонение более чем на довольно вероятно, поскольку ширине соответствует

Таким образом, если известна дисперсия то нетрудно определить стандарт и, тем самым, абсолютную ширину доверительного интервала . В этом случае даже при выполнении одного измерения можно оценить случайную ошибку , а увеличение числа измерений позволяет уменьшать доверительный интервал, поскольку

Критерий Стьюдента. Чаще всего дисперсия D? неизвестна, поэтому выполнить оценку ошибки указанным выше способом обычно не удается. При этом точность однократного измерения неизвестна. Однако, если измерение повторено несколько раз, можно приближенно найти дисперсию:

Точность этого выражения невелика по двум причинам: во-первых, число членов суммы обычно мало; во-вторых, использование замены вносит ошибку значительную при малых n. Более хорошее приближение дает так называемая несмещенная оценка дисперсии:

где величину s называют стандартом выборки.

Оценка (8) также является приближенной, поэтому нельзя пользоваться формулой (6), заменяя в ней на Надо вносить в нее поправку, тем большую, чем меньше . Если распределение считать нормальным при любых , то связь доверительного интервала со стандартом выборки устанавливается критерием Стьюдента:

где коэффициенты Стьюдента представлены в таблице 23.

Таблица 23

Коэффициенты Стьюдента

Очевидно, при больших с хорошей точностью выполняется . Поэтому при критерий Стьюдента переходит в формулу (6); выше отмечалось, что этой формуле соответствует строка таблицы 23. Однако при малых доверительный интервал (8) оказывается много шире, чем по критерию (6).

Пример 1. Выбрано и выполнено 3 измерения; по таблице 23 доверительный интервал равен

К сожалению, не все физики и инженеры знакомы с понятием доверительного интервала и критерием Стьюдента. Нередко встречаются экспериментальные работы, в которых при малом числе измерений пользуются критерием или даже считают, что значение является погрешностью величины , и вдобавок оценивают дисперсию по формуле (7).

Для приведенного выше йримера при первой ошибке был бы дан ответ при второй а при третьей что сильно отличается от правильного значения.

Замечание 2. Зачастую одна и та же величина измерена в разных лабораториях на разном оборудовании. Тогда следует найти среднее и стандарт по формулам (2) и (8), где суммирование проводится по всем измерениям во всех лабораториях, и определить доверительный интервал по критерию Стьюдента.

Нередко при этом суммарный стандарт s оказывается больше, чем стандарты определенные по данным отдельных лабораторий. Это естественно. Каждая лаборатория делает при измерениях систематические ошибки, и часть систематических ошибок в разных лабораториях совпадает, а часть различается. При совместной обработке различающиеся систематические ошибки переходят в разряд случайных, увеличивая стандарт.

Значит, при совместной обработке разнотипных измерений обычно систематическая ошибка значения будет меньше, а случайная больше. Но случайную ошибку можно сколь угодно уменьшить, увеличивая число измерений. Поэтому такой способ позволяет получить окончательный результат с большей точностью.

Замечание 3. Если в разных лабораториях используется оборудование разного класса точности, то при такой совместной обработке надо суммировать с весами

где относятся, как квадраты точности приборов.

Произвольное распределение. Чаще всего число измерений невелико и заранее неясно, можно ли считать распределение нормальным и пользоваться приведенными выше критериями.

Для произвольного распределения справедливо неравенство Чебышева

Отсюда можно оценить доверительный интервал:

Коэффициент в этой оценке приведен в дополнительной строке таблицы 23.

Из таблицы видно, что если в качестве доверительной вероятности принять то для произвольного закона распределения сизвестной дисперсией доверительный интервал не превышает . Для симметричного одновершинного распределения аналогичные оценки показывают, что доверительный интервал не превышает напомним, что для нормального распределения он равен (при выбранном ).

Разумеется, если вместо используют найденное по тем же измерениям значение то надо строить критерий, аналогичный критерию Стьюдента. Оценки при этом будут существенно хуже приведенных.

Проверка нормальности распределения. Из сравнения критериев (6) и (11) видно, что даже при невысокой доверительной вероятности оценки доверительного интервала при произвольном распределении вдвое хуже, чем при нормальном. Чем ближе к единице, тем хуже соотношение этих оценок. Поэтому целесообразно проверять, существенно ли отличается распределение от нормального.

Распространенный способ проверки - исследование так называемых центральных моментов распределения:

Два первых момента, по определению, равны Для нормального распределения два следующих момента равны Обычно ограничиваются этими моментами. Вычисляют их фактические значения по проведенным измерениям и проверяют, согласуются ли они со значениями, соответствующими нормальному распределению.

Удобно вычислять не сами моменты, а составленные из них безразмерные комбинации - асимметрию и эксцесс для нормального распределения они обращаются в нуль. Аналогично дисперсии, вычислим их по несмещенным оценкам:

где s определяется формулой (8). Собственные дисперсии этих величин известны и зависят только от числа измерений:

причем собственное распределение А является симметричным.

Поэтому, если выполняются соотношения

то по критерию Чебышева (11) отличие А и Е от нуля недостоверно, так что можно принять гипотезу о нормальности распределения

Формулы (13)-(15) непосредственно относятся к распределению единичного измерения. На самом деле надо проверить, нормально ли распределение среднеарифметического при выбранном . Для этого делают большое число измерений разбивают их на групп по измерений в каждой и среднее значение в каждой группе рассматривают как единичное измерение. Тогда проверка выполняется по формулам (13)-(15), где вместо надо подставить .

Разумеется, такую тщательную проверку проводят не в каждой измеряемой точке, а лишь во время отработки методики эксперимента.

Замечание 4. Аналогично проверяют любые естественнонаучные гипотезы. Производят большое число экспериментов и выясняют, нет ли среди них событий, маловероятных с точки зрения этой гипотезы. Если найдутся такие события, то гипотезу отвергают, если нет - условно принимают.

Выбор . За счет увеличения числа измерений можно неограниченно уменьшать доверительный интервал. Однако систематическая ошибка при этом не уменьшается, так что суммарная ошибка все равно будет больше Поэтому целесообразно выбрать я так, чтобы ширина доверительного интервала составляла Дальнейшее увеличение числа измерений бессмысленно.

Критерий оптимальности

Термин "критерий" широко используется как во всех областях знаний, так и в обыденной жизни в интуитивно понятном смысле. Ввиду особой важности этого термина для исследования операций дадим краткие пояснения. Греческое слово kriterion означает мерило, оценку, средство для суждения. Именно в этом смысле используется понятие критерия в ИСО. Поставленная в операции цель может быть достигнута по-разному и в разной степени в зависимости от принимаемых решений. Критерий есть тот показатель, который характеризует (оценивает) эффективность решений с точки зрения достижения цели, а следовательно, позволяет выбрать среди них наилучшее. В ИСО применяют равнозначные термины: критерий оптимальности, критерий эффективности, целевая функция. Последний термин подчеркивает неразрывную связь критерия с целью. Таким образом, решение может быть оптимальным только в смысле конкретного критерия в пределах адекватности используемой модели.

В исследовании операций к критерию предъявляются определенные требования. Наиболее важные из них следующие.

1. Критерий должен быть количественной и неслучайной величиной.

2. Критерий должен правильно и полно отражать поставленную цель. Его можно рассматривать как количественную модель качественной цели.

3. Критерий должен иметь простой и понятный ЛПР физический смысл.

4. Критерий должен быть чувствителен к управляемым (искомым) переменным.

При исследовании действующих систем к критерию могут предъявляться дополнительные требования, такие как измеримость, статистическая однозначность, статистическая эффективность и др.

Многочисленные примеры из практики показывают огромную важность правильного выбора критерия оптимальности. Из истории второй мировой войны известен случай неверного выбора критерия для оценки эффективности мероприятий по охране караванов судов, доставляющих грузы в северные советские порты (об одном из таких караванов написан роман В. Пикуля). С целью защиты караванов от воздушных налетов немцев на судах стали устанавливать зенитные системы. Через некоторое время решили оценить эффективность принятых мер, чтобы определить дальнейшие действия, и в качестве критерия взяли число самолетов противника, сбиваемых установленными зенитными системами. Этот показатель оказался очень низким, что объяснялось непрофессиона-льностью орудийных расчетов, а также отсутствием стабилизационных платформ на используемых судах. Исходя из такой оценки, предлагалось демонтировать зенитные орудия, передав их береговым батареям, и искать другие способы защиты караванов. Но вовремя спохватились, поняв, что принятый критерий не отражает поставленную цель, которая заключается в повышении живучести судов, а не в уничтожении самолетов противника (поражение самолетов - это только одно из средств). Достижение такой цели с помощью рассматриваемого мероприятия должно определяться по проценту судов, приходящих в порты назначения. Проведенный анализ показал, что для караванов с зенитными системами этот критерий значимо вырос и, следовательно, предложенный способ эффективен. А объясняется данный феномен тем, что при стрельбе из зенитных орудий немецкие летчики боялись приближаться к судам и бомбометание производили с больших высот и расстояний, что значительно снижало эффективность налетов.

В истории советского периода немало примеров, когда нарушение требований к выбору критерия приводило к печальным последствиям. Это прежде всего критерии развития экономики, например, пресловутый вал, который привел к тому, что мы выпускали самое тяжелое и энергоемкое оборудование, больше всех металла, угля, тракторов и, в то же время использовали их с самой низкой эффективностью и т.п. А сколько человеческих судеб искалечено из-за тех критериев, которые применяла КПСС к людям?!

Множество показателей, которые в ИСО используются в качестве критериев, можно условно разделить на ряд групп: социальные (среднедушевой доход, обеспеченность жильем и т.п.), экономические (прибыль, рентабельность, себестоимость и др.), технико-экономические (производительность, урожайность и др.), технико-технологические (прочность, чистота материала, другие физические или химические показатели), прочие. Они приведены в порядке убывания глобальности применения: первые применяются в системах более высокого уровня (страна, регион, предприятие), последние - в основном на уровне процесса, объекта.

Однако во многих случаях не удается полностью отразить поставленную цель одним критерием и тем более это невозможно, когда в операции преследуется более одной цели. Например, цели типа повышение уровня жизни, улучшение экологической обстановки и т.п. нельзя "покрыть" одним критерием. В таких ситуациях вводится несколько показателей, характеризующих достижение цели. Как правило, оптимальные решения, получаемые по разным показателям-критериям, не совпадают, что создает неопределенность в выборе окончательного решения. Задачи, в которых приходится определять наилучшее решение по нескольким критериям, называются многокритериальными или задачами векторной оптимизации. Они составляют особый и более сложный класс задач исследования операций, который рассмотрен в последней главе настоящего пособия.

    Виды математических моделей ИСО

Не останавливаясь на классификации моделей, в том числе и математических, рассмотрим их только в одном аспекте, который обусловливает принципиальные различия математических моделей и методов отыскания на них оптимальных решений.

Вид модели определяется типом связи между решениями (альтернативами, стратегиями) и результатами, который в свою очередь зависит от условий, в которых протекает операция и приходится принимать решения.

1. Решения принимаются в условиях определенности. Это значит, что каждому решению можно поставить в соответствие (пусть даже путем сложных расчетов) определенный результат, то есть имеет место детерми-нированный тип связи. Модели, описывающие такие ситуации, называются детерминированными . Этот тип модели на практике применяется наиболее широко, так как он "удобен в работе". По этой причине такие модели часто используют в качестве первого приближения и в условиях, отличающихся от ситуации определенности.

Приведем простой пример детерминированной модели. Пусть в пункте A , возле которого проходит прямая дорога, расположена пожарная часть, а на лугу в точке C - некоторое строение (рис.1.1). В случае возгорания строения пожарная машина должна быстро прибыть к месту пожара. Известны расстояния AB и BC и скорости движения машины по дороге и по лугу . Требуется определить кратчайший путь движения машины. Если правомерно допущение об отсутствии влияния на скорость машины каких-либо случайных факторов, то описанная ситуация характеризуется полной определенностью. Очевидно, что оптимальный маршрут машины надо искать в классе ломаных линий, включающих не более двух отрезков прямых (любой другой путь будет заведомо хуже). Такой путь полностью определяется точкой излома - расстоянием от пункта A до места съезда машины с дороги. Выбрав в качестве критерия оптимальности время движения машины, можем представить математическую модель операции в виде

Как видно из модели, каждой альтернативе в выборе маршрута (значению ) ставится в соответствие его показатель T . Детерминизм данной модели отражает определенность ситуации.

2. Решения принимаются в условиях риска. Между решениями и результатами имеет место стохастическая связь: определенному решению может соответствовать более одного результата, вероятности появления которых известны. Адекватным отображением таких условий являются вероятностные (стохастические) модели. Если под результатом имеется в виду значение критерия, то исходная постановка задачи (и модель!) некорректна: нельзя максимизировать или минимизировать случайную величину. В этом случае в качестве критерия следует выбирать не исходный показатель, а одну из его вероятностных характеристик, например, математическое ожидание или дисперсию. Неоднозначность обусловлена наличием случайных факторов. Но осреднение случайных аргументов и осреднение результатов, на которые первые влияют, далеко не всегда одно и то же. Это объясняется тем, что в общем случае не выполняется равенство

где - случайные величины; M - знак математического ожидания.

Рассмотрим пример такой ситуации. Пусть фирма "Апельсин" постоянно занимается продажей фруктов. Для простоты будем считать, что поставка и продажа фруктов осуществляется целыми контейнерами, а единицей времени является неделя. Спрос на фрукты C колеблется случайным образом, но вероятность спроса в случайно взятую неделю P (C ) известна. При заключении договора с поставщиком на очередной период фирма должна определить наиболее выгодное для нее количество контейнеров, которое будет поставляться еженедельно, если известны прибыль от реализации одного контейнера и убыток при его невостребовании. Так как спрос случаен, то и результат - доход за неделю D , для фиксированного числа заказываемых контейнеров n будет случайной величиной: в случае, когда спрос превысит предложение, то есть при C>n ,

D = dn , (1.2)

если же предложение окажется выше спроса (C £n ), доход

D = dC- (n-C )b . (1.3)

Таким образом, доход D является функцией управляемой величины n и случайного фактора C . Очевидно, что максимизация такого показателя бессмысленна. В качестве критерия оптимальности разумно взять математическое ожидание дохода за неделю, так как его максимизация обеспечит максимум дохода за весь период. Поскольку вероятность появления случаев (1.2) и (1.3) определяется P (C ), модель задачи будет иметь вид

где означает "целое". При составлении этой модели в явном виде учитывалась стохастичность ситуации и, следовательно, принимаемые по ней решения в такой же степени учитывают фактор случайности. Упрощенное представление операции может базироваться на аппрок-симации реальной ситуации детерминированной. В этом случае спрос рассматривается как неслучайная величина, равная его математическому ожиданию . При этом доход

также неслучаен. На такой моделиоптимальное решение, максимизирующее , определяется просто: n ° = .

Чтобы показать отличие результатов при использовании упрощенной модели и модели (1.4), произведем расчет для исходных данных =30, =5 и вероятности спроса:

Р (С )

Вычисляем средний спрос: . Тогда по упрощенной модели получим: n ° = 3, D =90. Такой доход имел бы место при детерминированном и неизменяемом уровне спроса. Но при случайном спросе величина D =90 будет достигаться только в те недели, когда спрос окажется не меньше 3, а в другие недели доход будет ниже и, следовательно, средний доход за весь период станет меньше 90. Чтобы показать это и одновременно определить оптимальное число контейнеров при случайном спросе, вычислим значения среднего дохода по модели (1.4) при всех возможных n :

По результатам вычислений видно, что решение n ° =3, полученное на детерминированной модели, не обеспечивает максимального среднего дохода. Кроме того, видно, что в условиях случайного спроса оптимальным является решение n * =4, при котором средний доход составляет 81.5 против 74.25 при n ° =3. Это пример операции, для которой не выполняется равенство (1.1), хотя случайный фактор имеет симметричное распределение. Судя по разнице результатов на двух моделях, в данной операции стохастичность оказывает значимое влияние и поэтому ее нельзя не учитывать.

Однако наличие случайных факторов не всегда влечет за собой неоднозначность результатов. Возможны случаи, когда элементарные составляющие процесса или системы ведут себя случайно, а результаты системы в целом не случайны. Характерным примером такой системы является идеальный газ, поведение которого подчиняется детерминированному закону БойляМариотта. Неслучайное поведение на макроуровне при наличии элементов случайности на микроуровне называют стохастическим детерминизмом.

3.Решения принимаются в условиях неопределенности. Это ситуация, противоположная первой рассмотренной. Природа неопределенности может быть различной, но в общем случае она проявляется в том, что определенному решению соответствует более одного результата, а вероятностные характеристики результатов неизвестны. Математические модели, описывающие неопределенный тип связи, разнообразны и не имеют единого названия. В частности, к этому классу относятся матричные модели, модели типа "игра", "аукционный торг", нечеткие модели.

Во многих случаях ситуацию неопределенности можно представить (или аппроксимировать) матрицей вида

Состояние среды

(где - результат (исход) выбора альтернативы при условии, что среда окажется в состоянии ; может иметь смысл прибыли, дохода, выигрыша или затрат, проигрыша, убытков и т.п.).

Прежде чем выбирать решение на этой модели, нужно определиться с принципом оптимальности, на основе которого будут сравниваться альтернативы, так как только одно желание ЛПР получить наилучший результат не дает такой основы. Принцип оптимальности зависит от точки зрения на ситуацию ЛПР, его отношения к риску, от предположений относительно поведения среды. Наиболее характерной гипотезой поведения среды является представление, что среда ведет себя наихудшим образом ("как назло"). Это самый пессимистический взгляд на ситуацию, свойственный ЛПР, не склонному к риску. В этом случае выбор решения основывается на принципе гарантированного результата (иногда его называют критерием Вальда). Он состоит в том, что эффективность каждой альтернативы оценивается наихудшим из исходов, возможных при выборе данной альтернативы. Такой результат гарантируется, то есть будет не хуже, при любом фактическом состоянии среды. Теперь очевидно, что наилучшим решением в смысле принятого принципа оптимальности будет выбор той альтернативы, которая имеет наилучший гарантированный результат. Так, если имеет смысл прибыли, то оценкой -м состоянии среды и выигрышем при выборе отражают разный уровень риска ЛПР. Возможны и другие подходы к выбору оптимальных решений в условиях неопределенности, но все они, как и последние два, не гарантируют достижение расчетных результатов.

Как следует из вышерассмотренного, выбор вида модели требует от исследователя интуиции и опыта наряду с глубокими знаниями моделируемой области. Следует особо отметить, что построение модели основывается на представлениях аналитика, которые могут не соответствовать реальным связям в большей или меньшей степени. При этом большое значение имеют оценка влияния случайных факторов, факторов неопределенности, уровень агрегирования, допустимая сложность модели. Так, нередко возникает дилемма: построить высокоточную, но очень сложную модель, на которой можно будет получить только приближенное к оптимальному решение, либо поступиться точностью моделирования и иметь возможность применять на модели точные методы оптимизации. Какое решение окажется ближе к истинному оптимальному, заранее сказать невозможно. К сожалению, не существует готовых рецептов построения математических моделей. Это один из этапов операционного исследования, который, следуя Саати, можно отнести к области искусства.

Лабораторных и самостоятельных занятий. Общая постановка задачи об оптимизации . Основные понятия и определения. Графики... энергосистемы О рациональном управлении энергосистемой. Постановка задачи оптимизации режима энергосистемы и основные этапы ее...

  • Оптимизация в системах управления

    Задача

    Адаптивными или экстремальными регуляторами. При постановке задачи оптимизации разработчику системы (устройства) необходимо... поэтому широко применяются при расчетах. Задача оптимизации - задача нелинейного программирования Мы познакомились с...

  • Оптимизация конструктивных параметров и алгоритмов управления радиального электромагнитного подвеса

    Автореферат диссертации

    Характеристики и динамические параметры РЭМП. - Постановка задачи оптимизации РЭМП и методика ее реализации, основанная... второй главе сформулирована постановка задачи оптимизации РЭМП, выбраны критерии (параметры) оптимизации и варьируемые факторы. ...

  • На разных этапах проектирования встает задача выбора наилучшего варианта из множества допустимых проектных решений, удовлетворяющих предъявленным требованиям.

    Процесс принятия решения при оптимальном проектировании характеризуют следующие основные черты: наличие цели (критериев оптимальности) и альтернативных вариантов проектируемого объекта, и учет существенных факторов при проектировании.

    Понятие «оптимальное решение» при проектировании имеет вполне определенное толкование - лучшее в том или ином смысле проектное решение, допускаемое обстоятельствами. В подавляющем большинстве случаев одна и та же техническая задача может быть решена несколькими способами, приводящими не только к различным выходным характеристикам, схемам и конструкциям, но даже и к физическим принципам, положенным в основу построения объекта. При этом одно из решений может превосходить другое по одним свойствам и уступать ему по другим. В этих условиях часто чрезвычайно трудно сказать, не только какая из систем оптимальна, но даже какая из них предпочтительнее.

    Если выделяют один параметр, который характеризует свойства, то этот параметр принимается за целевую функцию. При этом другие параметры подпадают под категорию ограничений. При решении однокритериальных задач применяется математический аппарат исследования операций. При создании вычислительной сети в большинстве случаев однокритериальные задачи не удовлетворяют полученному решению. Сложные ВС характеризуются многими параметрами (емкость памяти, время счета, пропускная способность каналов и т. п.), определяющими ее качество. Среди этих параметров есть такие, значения которых желательно всемерно увеличивать, но есть и такие, которые желательно минимизировать.

    Таким образом, ограничения и связи между отдельными параметрами ВС приводят к необходимости идти на компромисс и выбирать для каждой характеристики не максимально возможное в принципе значение, а мень­шее, но такое, при котором и другие важные характеристики тоже будут иметь приемлемые значения. Поэтому необходимо принимать во внимание всю совокупность характеристик ВС. Задачи проектирования, проводимые по нескольким критериям оптимизации, носят название многокритериальных, или задач векторной оптимизации.

    Известные методы векторной оптимизации прямо или косвенно сводят решаемые задачи к задачам скалярной оптимизации, т. е. частные критерии тем или иным способом объединяются в составной критерий, который затем максимизируется (или минимизируется). Если составной критерий отражает физическую суть ВС и вскрывает объективную связь между частными критериями и составным критерием, то оптимальное решение является объективным.

    На практике из-за сложности обычно составной критерий объединяет частные, что ведет к субъективности решения; такой критерий является обобщенным, или интегральным. В зависимости от того, каким образом частные критерии объединяются в обобщенный критерий, различают критерии аддитивные, мультипликативные и минимаксные (максиминные).

    Если оптимизация ведется без учета статистического разброса характеристик, то соответствующий критерий оптимальности называют детерминированным критерием; если разброс параметров учитывается, то имеем критерий статистический. Статистический критерий оптимальности наиболее полно отражает качество ВС, но его использование требует больших затрат машинного времени.

    Рассмотрим способы выбора критериев оптимальности.

    Частные критерии

    При проектировании по частным критериям в качестве целевой функции F(X) принимается наиболее важный выходной параметр проектируемой ВС, все остальные параметры в виде соответствующих условий работоспособности относятся к ограничениям. В этом случае задача оптимального проектирования является однокритериальной задачей математического программирования: максимизировать (или минимизировать) значение целевой функции при наличии ограничений на параметры ВС.

    Из постановки задачи вытекает, что параметры, для которых выполняются ограничения в виде строгих неравенств, имеют определенный запас по сравнению с заданными техническими требованиями. Ряд параметров, для которых условия работоспособности имеют вид неравенств, запасов вообще не имеет, и любые изменения технических требований для этих параметров приводят как к изменению характеристик и структуры проектируемого объекта, так и к изменению значения целевой функции.

    Частные критерии используются при проектировании ВС различного назначения.

    Аддитивные критерии

    В этих критериях целевая функция образуется путем сложения нормированных значений частных критериев. Частные критерии имеют различную физическую природу и в соответствии с этим - различную размерность. Поэтому при образовании обобщенного критерия следует оперировать не с «натуральными» критериями, а с их нормированными значениями. Нормированные критерии представляют собой отношение «натурального» частного критерия к некоторой нормирующей величине, измеренной в тех же единицах, что и сам критерий. При этом выбор нормирующего делителя должен быть логически обоснован. Возможны несколько подходов к выбору нормирующего делителя.

    Первый подход предлагает принимать в качестве нормирующего делителя директивные значения параметров, заданные заказчиком. Логически слабым моментом такого подхода является негласное предположение того, что в ТЗ на проектируемую ВС заданы оптимальные значения параметров объекта, и что совокупность заданных значений критериев рассматривается как образцовая.

    Второй подход предполагает выбор в качестве нормирующих делителей максимальных значений критериев, достигаемых в области существования проектных решений (в области компромисса). Возможен подход, при котором в качестве нормирующих делителей выбирают разность между максимальным и минимальным значениями критерия в области компромисса.

    Выбор подхода к формированию безразмерной формы частных критериев носит иногда субъективный характер и должен обосновываться в каждом конкретном случае. Пусть при проектировании ВС существует п частных критериев. Тогда целевая функция задачи оптимизации в случае применения аддитивного критерия определяется

    где - весовой коэффициент частного критерия;

    Нормирующий делитель;

    Нормированное значение частного критерия.

    Такая целевая функция позволяет осуществить компромисс, при котором улучшение значения одного нормированного частного критерия компенсирует ухудшение значений других.

    Введение весовых коэффициентов должно учитывать различную значимость частных критериев при формировании аддитивного критерия. Определение весовых коэффициентов сталкивается с серьезными трудностями и обычно сводится либо к использованию формальных процедур, либо к применению экспертных оценок. С появлением обобщенного критерия исчезают логические проблемы, связанные с установлением взаимосвязей между частными критериями различной размерности и выбором наилучшего варианта ВС, и остаются лишь вычислительные трудности. Но аддитивный критерий имеет ряд недостатков, главный из которых состоит в том, что он не вытекает из объективной роли частных критериев в функционировании ВС и выступает поэтому как формальный математический прием, придающий задаче удобный для решения вид.

    Другой недостаток заключается в том, что в аддитивном критерии может происходить взаимная компенсация частных критериев. Это значит, что значительное уменьшение одного из критериев вплоть до нулевого значения может быть покрыто возрастанием другого критерия. Для ослабления этого недостатка следует вводить ограничения на минимальные значения частных критериев и их весовых коэффициентов.

    Несмотря на слабые стороны, обобщенный аддитивный критерий позволяет в ряде случаев успешно решать многокритериальные задачи и получать полезные результаты.


    ©2015-2019 сайт
    Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
    Дата создания страницы: 2016-03-24

    Процедуры параметрического синтеза в САПР либо выполняются человеком в процессе многовариантного анализа (в интерактивном режиме), либо реализуются на базе формальных методов оптимизации (в автоматическом режиме). В последнем случае находят применение несколько постановок задач оптимизации.

    Наиболее распространенной является детерминированная постановка: заданы условия работоспособности на выходные параметры Y и нужно найти номинальные значения проектных параметров X , к которым относятся параметры всех или части элементов проектируемого объекта. Назовем эту задачу оптимизации базовой. В частном случае, когда требования к выходным параметрам заданы нечетко, к числу рассчитываемых величин могут быть отнесены также нормы выходных параметров, фигурирующие в их условиях работоспособности.

    Если проектируются изделия для дальнейшего серийного производства, то важное значение приобретает такой показатель, как процент выпуска годных изделий в процессе производства. Очевидно, что успешное выполнение условий работоспособности в номинальном режиме не гарантирует их выполнения при учете производственных погрешностей, задаваемых допусками параметров элементов. Поэтому целью оптимизации становится максимизация процента выхода годных, а к результатам решения задачи оптимизации относятся не только номинальные значения проектных параметров, но и их допуски.

    Базовая задача оптимизации ставится как задача математического программирования

    где F (X ) – целевая функция; X – вектор управляемых параметров; φ(X ) и ψ(X ) – функции-ограничения; D x – допустимая область в пространстве управляемых параметров. Указанная запись описывает задачу поиска экстремума путем варьирования управляемых параметров в пределах допустимой области.

    Таким образом, для выполнения расчета номинальных значений параметров необходимо, во-первых, сформулировать задачу, во-вторых, решить задачу поиска экстремума F(X).

    Сложность постановки оптимизационных проектных задач обусловлена наличием у проектируемых объектов нескольких выходных параметров, которые могут быть критериями оптимальности, но в задаче (2.1) целевая функция должна быть одна. Другими словами, проектные задачи являются многокритериальными, и воз­никает проблема сведения многокритериальной задачи к однокритериальной.

    Применяют несколько способов выбора критерия оптимальности.

    В частном критерии среди выходных параметров один выбирают в качестве целевой функции, а условия работоспособности остальных выходных параметров относят к ограничениям задачи. Эта постановка вполне приемлема, если действительно можно выделить один наиболее критичный выходной параметр. Но в большинстве случаев сказывается недостаток частного критерия (рис. 2.1).

    На рис. 2.1 представлено двумерное пространство выходных параметров y 1 и у 2 , для которых заданы условия работоспособности у 1 < Т 1 и у 2 < Т 2 . Кривая АВ является границей достижимых значений выходных параметров. Это ограничение объективное и связано с существующими физическими и технологическими условиями производства, называемыми условиями реализуемости. Область, в пределах которой выполняются все условия реализуемости и работоспособности, называют областью работоспособности.

    Множество точек пространства выходных параметров, из которых невозможно перемещение, приводящее к улучшению всех выходных параметров, называют областью компромиссов или областью Парето. Участок кривой АВ(см. рис. 2.1) относится к области Парето.

    Если в качестве целевой функции (рис. 2.1) выбрать параметр у 1 , то результатом оптимизации будут параметры X , соответствующие точке В . Но это граница области работоспособности, и, следовательно, при нестабильности внутренних и внешних параметров велика вероятность выхода за пределы области работоспособности. Конечно, результаты можно улучшить, если применять так называемый метод уступок, при котором в качестве ограничения принимают условие работоспособности со скорректированной нормой в виде

    У 2 < Т 2 + Δ,

    где Δ – уступка. Но возникает проблема выбора значений уступок, т. е. результаты оптимизации будут иметь субъективный характер. Очевидно, что ситуация не изменится, если целевой функцией будет выбран параметр у 2 , так как оптимизация приведет в точку А .

    Аддитивный критерий объединяет (свертывает) все выходные параметры (частные критерии) в одну целевую функцию, представляющую собой взвешенную сумму частных критериев

    , (2.2)

    где ω j – весовой коэффициент; т число выходных параметров. Функционал (2.2) подлежит минимизации.

    Недостатки аддитивного критерия – субъективный подход к выбору весовых коэффициентов и неучет требований ТЗ. Действительно, в (2.2) не входят нормы выходных параметров.

    Аналогичные недостатки присущи и мультипликативному критерию, целевая функция которого имеет вид

    , (2.3)

    Нетрудно видеть, что если прологарифмировать (2.3), то мультипликативный критерий превращается в аддитивный.

    Более предпочтительным является максиминный критерий, в качестве целевой функции которого принимают выходной параметр, наиболее неблагополучный с позиций выполнения условий работоспособности. Для оценки степени выполнения условия работоспособности этого выходного параметра вводят запас работоспособности этого параметра Sj и этот запас можно рассматривать как нормированный j-й выходной параметр. Здесь и далее для лаконичности изложения предполагается, что все выходные параметры приведены к виду, при котором условия работоспособности становятся неравенствами в форме у j < Т j :

    S j = (T j – y j)/T j ,

    S j = (T j – y ном j )/ d j ,

    где y ном . j – номинальное значение, δ j – некоторая характеристика рассеяния j-го выходного параметра, например, трехсигмовый допуск. Тогда целевая функция в максиминном критерии есть

    .

    Здесь запись означает множество целых чисел в диапазоне от 1 до т . Задача (2.2) при максиминном критерии конкретизируется следующим образом:

    , (2.4)

    где допустимая область D x определяется только прямыми ограничениями на управляемые параметры x i:

    x i min < x i < x i max .