§ 28. Задачи теории статистических решений

<< Предыдущий параграф

Следующий параграф >>

100

101

102

103

104

105

106

107

108

109

110

111

112

113

114

115

116

117

118

119

120

121

122

123

124

125

126

127

128

129

130

131

132

133

134

135

136

137

138

139

140

141

142

143

144

145

146

147

148

149

150

151

152

153

154

155

156

157

158

159

160

161

162

163

164

165

166

167

168

169

170

171

172

173

174

175

176

177

178

179

180

181

182

183

184

185

186

187

188

189

190

191

192

193

194

195

196

197

198

199

200

201

202

203

<< Предыдущий параграф

Следующий параграф >>

Макеты страниц

§ 28. Задачи теории статистических решений

Близкой по идеям и методам к теории игр является теория статистических решений. От теории игр она отличается тем, что неопределенная ситуация не имеет конфликтной окраски — никто никому не противодействует, но элемент неопределенности налицо. В задачах теории статистических решений неизвестные условия операции зависят не от сознательно действующего «противника» (или других участников конфликта), а от объективной действительности, которую в теории статистических решений принято называть «природой». Соответствующие ситуации часто называются «играми с природой». «Природа» мыслится как некая незаинтересованная инстанция («равнодушная природа», - по Пушкину), «поведение» которой неизвестно, но во всяком случае не злонамеренно.

Казалось бы, отсутствие сознательного противодействия упрощает задачу выбора решения. Оказывается, нет: не упрощает, а усложняет. Правда, принимающему решение в «игре с природой» в самом деле «легче» добиться успеха (ведь ему никто не мешает!), но ему «труднее» обосновать свой выбор. В игре против сознательного противника элемент неопределенности отчасти снимается тем, что мы «думаем» за противника, «принимаем» за него решение, самое неблагоприятное для нас самих. В игре же с природой такая концепция не подходит: кто ее знает, как она, матушка, себя поведет? Поэтому теория статистических решений — наиболее «шаткая» в смысле рекомендаций наука. Все же у нее есть право на существование и на внимание со стороны лиц, занимающихся исследованием операций.

Рассмотрим игру с природой: у нас (сторона А) имеется возможных стратегий ; что касается обстановки, то о ней можно сделать предположений: . Рассмотрим их как «стратегии природы». Наш выигрыш при каждой паре стратегий , задан матрицей (таблица 28.1).

Требуется выбрать такую стратегию игрока А (чистую или, может быть, смешанную, если это возможно), которая является более выгодной по сравнению с другими.

С первого взгляда кажется, что эта задача похожа на игру двух игроков А и П с противоположными интересами и должна решаться теми же методами. Но это не совсем так. Отсутствие противодействия со стороны природы делает ситуацию качественно другой.

Таблица 28.1

Давайте поразмышляем над задачей. Самый простой случай выбора решения в игре с природой — это случай когда (на наше счастье) какая-то из стратегий игрока А превосходит другие («доминирует» над ними), как, например, стратегия в таблице 28.2. Здесь выигрыш при стратегии при любом состоянии природы не меньше, чем при других стратегиях, а при некоторых — больше; значит, все ясно, и нужно выбирать именно эту стратегию.

Таблица 28.2

Если даже в матрице игры с природой нет одной доминирующей над всеми другими, все же полезно посмотреть, нет ли в ней дублирующих стратегий и уступающих другим при всех условиях (как мы это делали, упрощая матрицу игры). Но здесь есть одна тонкость: так мы можем уменьшить только число стратегий игрока А, но не игрока П ему ведь все равно, много или мало мы выиграем! Предположим, что «чистка» матрицы произведена, и ни дублирующих, ни заведомо невыгодных игроку А стратегий в ней нет.

Чем же все-таки руководствоваться при выборе решения? Вполне естественно, должна учитываться матрица выигрышей Однако в каком-то смысле картина ситуации, которую дает матрица неполна и не отражает должным образом достоинств и недостатков каждого решения.

Поясним эту (далеко не простую) мысль. Предположим, что выигрыш при нашей стратегии и состоянии природы больше, чем при нашей стратегии и состоянии природы . Но за счет чего больше? За счет того, что мы удачно выбрали стратегию А? Необязательно. Может быть, просто состояние природы П; выгоднее нам, чем П. Например, состояние природы «нормальные условия» для любой операции выгоднее, чем «наводнение», «землетрясение» и т. п. Желательно ввести такие показатели, которые не просто давали бы выигрыш при данной стратегии в каждой ситуации, но отражали бы «удачность» или «неудачность» выбора данной стратегии в данной ситуации.

С этой целью в теории решений вводится понятие «риска». Риском игрока А при пользовании стратегией в условиях П; называется разность между выигрышем, который мы получили бы, если бы знали условия Щ и выигрышем, который мы получим, не зная их и выбирая стратегию

Очевидно, если бы мы (игрок А) знали состояние природы мы выбрали бы ту стратегию, при которой наш выигрыш максимален. Этот выигрыш, максимальный в столбце мы уже раньше встречали и обозначили Чтобы получить риск нужно из вычесть фактический выигрыш

Для примера возьмем матрицу выигрышей (таблица 28.3) и построим для нее матрицу рисков (таблица 28.4).

При взгляде на матрицу рисков (таблица 28.4) нам становятся яснее некоторые черты данной «игры с природой». Так, в матрице выигрышей (таблица 28.3) во второй строке первый и последний элементы были равны друг другу:

Таблица 28.3

Таблица 28.4

Однако эти выигрыши совсем не равноценны в смысле удачного выбора стратегии: при состоянии природы П] мы могли выиграть самое большее 4, и наш выбор стратегии почти совершенно хорош; а вот при состоянии мы могли бы, выбрав стратегию А и получить на целых 6 единиц больше, т. е. выбор стратегии очень плох. Риск — это «плата за отсутствие информации»: в таблице (тогда как выигрыши в том и другом случае одинаковы). Естественно, нам хотелось бы минимизировать риск, сопровождающий выбор решения.

Итак, перед нами — две постановки задачи о выборе решения: при одной нам желательно получить максимальный выигрыш, при другой — минимальный риск.

Мы знаем, что самый простой случай неопределенности — это «доброкачественная» или стохастическая неопределенность, когда состояния природы имеют какие-то вероятности и эти вероятности нам известны. Тогда естественно (со всеми оговорками, сделанными по этому поводу в § 5) выбрать ту стратегию, для которой среднее значение выигрыша, взятое по строке, максимально:

Любопытно отметить, что та же стратегия, которая обращает в максимум средний выигрыш, обращает в минимум и средний риск:

(28.3)

так что в случае стохастической неопределенности оба подхода («от выигрыша» и «от риска») дают одно и то же оптимальное решение.

Давайте чуточку «испортим» нашу неопределенность и допустим, что вероятности в принципе существуют, но нам неизвестны. Иногда в этом случае предполагают все состояния природы равновероятными (так называемый «принцип недостаточного основания» Лапласа), но вообще-то это делать не рекомендуется. Все-таки обычно более или менее ясно, какие состояния более, а какие — менее вероятны. Для того чтобы найти ориентировочные значения вероятностей можно, например, воспользоваться методом экспертных оценок (см. § 5). Хоть какие-то ориентировочные значения вероятностей состояний природы все же лучше, чем полная неизвестность. Неточные значения вероятностей состояний природы в дальнейшем могут быть «скорректированы» с помощью специально поставленного эксперимента. Эксперимент может быть как «идеальным», полностью выясняющим состояние природы, так и неидеальным, где вероятности состояний уточняются по косвенным данным. Каждый эксперимент, разумеется, требует каких-то затрат, и возникает вопрос: окупаются ли эти затраты возрастанием эффективности? Оказывается, «идеальный» эксперимент имеет смысл проводить только в случае, когда его стоимость меньше, чем минимальный средний риск (см., например, [6]).

Однако не будем больше заниматься случаем стохастической неопределенности, а возьмем случай «дурной неопределенности», когда вероятности состояний природы либо вообще не существуют, либо не поддаются оценке даже приближенно. Ну что же? Обстановка неблагоприятна для принятия «хорошего» решения — попытаемся найти хотя бы не самое худшее.

Здесь все зависит от точки зрения на ситуацию, от позиции исследователя, от того, какими бедами грозит неудачный выбор решения.

Опишем несколько возможных подходов, точек зрения (или, как говорят, несколько «критериев» для выбора решения).

1. Максиминный критерий Вальда.

Согласно этому критерию игра с природой ведется как игра с разумным, причем агрессивным противником, делающим все для того, чтобы помешать нам достигнуть успеха. Оптимальной считается стратегия, при которой гарантируется выигрыш в любом случае не меньший, чем «нижняя цена игры с природой»;

Если руководствоваться этим критерием, олицетворяющим «позицию крайнего пессимизма», надо всегда ориентироваться на худшие условия, зная наверняка, что «хуже этого не будет». Очевидно, такой подход — «перестраховочный», естественный для того, кто очень боится проиграть, — не является единственно возможным, но как крайний случай он заслуживает рассмотрения.

2. Критерий минимаксного риска Сэвиджа.

Этот критерий — тоже крайне пессимистический, но при выборе оптимальной стратегии советует ориентироваться не на выигрыш, а на риск. Выбирается в качестве оптимальной та стратегия, при которой величина риска в наихудших условиях минимальна:

Сущность такого подхода в том, чтобы всячески избегать большого риска при принятии решения. В смысле «пессимизма» критерий Сэвиджа сходен с критерием Вальда, но самый «пессимизм» здесь понимается по-другому.

3. Критерий пессимизма-оптимизма Гурвица.

Этот критерий рекомендует при выборе решения не руководствоваться ни крайним пессимизмом («всегда рассчитывай на худшее!»), ни крайним, легкомысленным оптимизмом («авось кривая вывезет!»). Согласно этому критерию выбирается стратегия из условия

где х — «коэффициент пессимизма», выбираемый между нулем и единицей.

При критерий Гурвица превращается в критерий Вальда; при — в критерий «крайнего оптимизма», рекомендующий выбрать ту стратегию, при которой самый большой выигрыш в строке максимален. При получается нечто среднее между тем и другим. Коэффициент выбирается из субъективных соображений — чем опаснее ситуация, чем больше мы хотим в ней «подстраховаться», чем менее наша склонность к риску, тем ближе к единице выбирается х.

При желании можно построить критерий, аналогичный Н, исходя не из выигрыша, а из риска, но мы на этом не будем останавливаться.

«Что же, — спросит читатель, — выбор критерия — субъективен, выбор коэффициента х — тоже субъективен, значит и решение тоже принимается субъективно, т. е., грубо говоря, произвольно? Где же тут наука? При чем тут математика? Может быть, лучше было бы просто, без математических затей, выбрать решение по своему произволу?»

В какой-то мере читатель прав — выбор решения в условиях неопределенности всегда условен, субъективен. И все же в какой-то (ограниченной) мере математические методы полезны и тут. Прежде всего, они позволяют привести игру с природой к матричной форме, что далёко не всегда бывает просто, особенно когда стратегий много (в наших примерах их было очень мало). Кроме того, они позволяют заменить простое лицезрение матрицы выигрышей (или рисков), от которого, когда матрица велика, может просто «зарябить в глазах», последовательным численным анализом ситуации с разных точек зрения, выслушать рекомендации каждой из них и, наконец, остановиться на чем-то определенном. Это аналогично обсуждению вопроса с различных позиций, а в споре, как известно, рождается истина. Так что не ждите от теории решений окончательных, непререкаемых рекомендаций — единственное, чем она может помочь — это советом...

Если рекомендации, вытекающие из различных критериев, совпадают — тем лучше, значит, можно смело выбрать рекомендуемое решение: оно скорее всего «не подведет». Если же, как это часто бывает, рекомендации противоречат друг другу, не надо забывать, что у нас голова на плечах.

Задумаемся над этими рекомендациями, выясним, насколько к разным результатам они приводят, уточним свою точку зрения и произведем окончательный выбор. Не надо забывать, что в любых задачах обоснования решений некоторый произвол неизбежен — хотя бы при построении математической модели, выборе показателя эффективности. Вся математика, применяемая в исследовании операций, не отменяет этого произвола, а позволяет только «поставить его на свое место».

Таблица 28.5

Рассмотрим элементарный пример «игры с природой» 4х3, матрица выигрышей которой дана в таблице 28.5. Поглядим на матрицу и попробуем сразу, без расчетов, указать, какой стратегией пользоваться? Несмотря на малый размер матрицы, это не так-то легко.

Теперь попробуем помочь себе, пользуясь критериями Вальда, Сэвиджа и Гурвица, причем в последнем возьмем х = 0,6 (перевес чуть-чуть в сторону пессимизма). Что-то они нам скажут?

1. Слово имеет критерий Вальда. Подсчитаем минимумы по строкам (см. таблицу 28.6) и выберем ту стратегию, при которой минимум строки максимален (равен 25). Это — стратегия .

Таблица 28.6

2. Слово имеет критерий Сэвиджа. Перейдем от матрицы выигрышей (таблица 28.6) к матрице рисков (таблица 28.7), в правом дополнительном столбце запишем максимальное в строке значение риска .

Из чисел правого столбца минимальное (60) соответствует стратегиям ; значит, обе они оптимальны по Сэвиджу.

Таблица 28.7

3. Слово имеет критерий Гурвица (при ). Опять перепишем таблицу 28.5, но на этот раз в правых трех дополнительных столбцах поставим: минимум строки ее максимум со и величину , округленную до целых единиц (см. таблицу 28.8).

Максимальное значение соответствует стратегии

Итак, в данном случае все три критерия согласно говорят в пользу стратегии которую есть все основания выбрать.

Таблица 28.8

А теперь возьмем случай, когда между критериями возникает «спор». Матрица выигрышей (с заранее выписанными столбцами минимумов строк максимумами строк и значениями дана в таблице 28.9.

По критерию Вальда оптимальной является стратегия по критерию Гурвица с - стратегия

Таблица 28.9

Посмотрим, что скажет критерий Сэвиджа. Матрица рисков с дополнительным столбцом, содержащим максимумы строк дана в таблице 28.10.

Минимальным в последнем столбце является число 38, так что критерий Сэвиджа, так же как и критерий Гурвица, «голосует» за стратегию

Над этим стоит поразмыслить. Если мы очень боимся малого выигрыша «11», который нас может постигнуть при стратегии ну что же — выберем стратегию А и рекомендуемую крайне осторожным критерием Вальда, при котором мы, по крайней мере, можем себе гарантировать выигрыш «19», а может быть, и больше. Если же наш пессимизм не так уж мрачен, пожалуй, надо остановиться на стратегии рекомендуемой двумя из трех критериев.

Таблица 28.10

Читатель, конечно заметил, что тут мы говорим на каком-то нематематическом языке, а скорее на языке «рассуждений и здравого смысла».

Что поделаешь — в неопределенности ничего хорошего нет, и при отсутствии нужной информации никакая математика не поможет нам в однозначном выборе «оптимального» решения. Жизнь есть жизнь, будущее полно неопределенностей, и нам зачастую приходится принимать отнюдь не строго оптимальные, а «приемлемые» решения, при обсуждении которых разные «подходы» и «критерии» выступают в качестве как бы спорящих сторон.

В заключение отметим следующее: все три критерия (Вальда, Сэвиджа и Гурвица) были сформулированы нами для чистых стратегий, но каждый из них может быть распространен и на смешанные, подобно тому, как мы это делали в теории игр. Однако смешанные стратегии в игре с природой имеют лишь ограниченное (главным образом, теоретическое) значение. Если в игре против сознательного противника смешанные статегии иногда имеют смысл как «трюк», вводящий в заблуждение противника, то в игре против «равнодушной природы» этот резон отпадает. Кроме того, смешанные стратегии приобретают смысл только при многократном повторении игры. А если уж мы ее повторяем, то неизбежно начинают вырисовываться какие-то вероятностные черты ситуации, и мы ими можем воспользоваться для того, чтобы применить «стохастический подход» к задаче, а он, как мы знаем, смешанных стратегий не дает. Кроме того, в ситуациях с «дурной» неопределенностью, когда нам мучительно не хватает информации, главная задача — эту информацию получить, а не выдумывать хитроумные методы, позволяющие без нее обойтись. Одна из основных задач теории статистических решений — это как раз планирование эксперимента, цель которого — выяснение или уточнение каких-то данных. На вопросах планирования эксперимента мы здесь останавливаться не будем: это отдельный предмет, требующий серьезного внимания. По этому вопросу мы отошлем читателя к специальным руководствам [29, 30], а также к интересно написанной популярной книге [27]. Основной принцип теории планирования эксперимента состоит в том, что любое принятое заранее решение должно пересматриваться с учетом полеченной новой информации.

Таким образом, наш краткий обзор, посвященный задачам, принципам и методологии исследования операций, закончен. В нем автор стремился ознакомить читателя не только с возможностями, но и с ограничениями математических методов, применяемых для обоснования решений. Главное — ни один из этих методов не избавляет человека от необходимости думать. Но не просто думать, а пользоваться при этом математическими расчетами. Помня, что, по меткому выражению Хемминга, — «главная цель расчетов — не цифры, а понимание».

<< Предыдущий параграф

Следующий параграф >>

Оглавление

ПРЕДИСЛОВИЕ
ГЛАВА 1. ПРЕДМЕТ И ЗАДАЧИ ИССЛЕДОВАНИЯ ОПЕРАЦИЙ
§ 1. Что такое исследование операций и чем оно занимается
§ 2. Основные понятия и принципы исследования операций
§ 3. Математические модели операций
ГЛАВА 2. РАЗНОВИДНОСТИ ЗАДАЧ ИССЛЕДОВАНИЯ ОПЕРАЦИЙ И ПОДХОДОВ К ИХ РЕШЕНИЮ
§ 4. Прямые и обратные задачи исследования операций. Детерминированные задачи
§ 5. Проблема выбора решения в условиях неопределенности
§ 6. Многокритериальные задачи исследования операций. «Системный подход»
ГЛАВА 3. ЛИНЕЙНОЕ ПРОГРАММИРОВАНИЕ
§ 7. Задачи линейного программирования
§ 8. Основная задача линейного программирования
§ 9. Существование решения ОЗЛП и способы его нахождения
§ 10. Транспортная задача линейного программирования
§ 11. Задачи целочисленного программирования. Понятие о нелинейном программировании
ГЛАВА 4. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
§ 12. Метод динамического программирования
§ 13. Примеры решения задач динамического программирования
1. Прокладка наивыгоднейшего пути между двумя пунктами.
2. Задача о распределении ресурсов
3. Задача о загрузке машины.
§ 14. Задача динамического программирования в общем виде. Принцип оптимальности
ГЛАВА 5. МАРКОВСКИЕ СЛУЧАЙНЫЕ ПРОЦЕССЫ
§ 15. Понятие о марковском процессе
§ 16. Потоки событий
§ 17. Уравнения Колмогорова для вероятностей состояний. Финальные вероятности состояний
ГЛАВА 6. ТЕОРИЯ МАССОВОГО ОБСЛУЖИВАНИЯ
§ 18. Задачи теории массового обслуживания. Классификация систем массового обслуживания
§ 19. Схема гибели и размножения. Формула Литтла
§ 20. Простейшие системы массового обслуживания и их характеристики
2. Одноканальная СМО с неограниченной очередью.
3. n-канальная СМО с неограниченной очередью.
4. Одноканальная СМО с ограниченной очередью.
5. Замкнутая СМО с одним каналом и m источниками заявок.
§ 21. Более сложные задачи теории массового обслуживания
ГЛАВА 7. СТАТИСТИЧЕСКОЕ МОДЕЛИРОВАНИЕ СЛУЧАЙНЫХ ПРОЦЕССОВ (МЕТОД МОНТЕ-КАРЛО)
§ 22. Идея, назначение и область применимости метода
§ 23. Единичный жребий и формы его организации
§ 24. Определение характеристик стационарного случайного процесса по одной реализации
ГЛАВА 8. ИГРОВЫЕ МЕТОДЫ ОБОСНОВАНИЯ РЕШЕНИЙ
§ 25. Предмет и задачи теории игр
§ 26. Антагонистические матричные игры
§ 27. Методы решения конечных игр
§ 28. Задачи теории статистических решений
ЛИТЕРАТУРА