<< Предыдущий параграф

Следующий параграф >>

100

101

102

103

104

105

106

107

108

109

110

111

112

113

114

115

116

117

118

119

120

121

122

123

124

125

126

127

128

129

130

131

132

133

134

135

136

137

138

139

140

141

142

143

144

145

146

147

148

149

150

151

152

153

154

155

156

157

158

159

160

161

162

163

164

165

166

167

168

169

170

171

172

173

174

175

176

177

178

179

180

181

182

183

184

185

186

187

188

189

190

191

192

193

194

195

196

197

198

199

200

201

202

203

<< Предыдущий параграф

Следующий параграф >>

Научная библиотека

Математический справочник

ЕГЭ и ОГЭ

Forex4you

Живые анекдоты

Научная библиотека

избранных естественно-научных изданий

Научная библиотека служит для получения быстрого и удобного доступа к информации естественно-научных изданий, получивших широкое распространение в России и за рубежом. На сайте впервые широкой публике представлены некоторые авторские издания написанные ведущими учеными страны.

Во избежании нарушения авторского права, материал библиотеки доступен по паролю ограниченному кругу студентов и преподавателей вузов. Исключение составляют авторские издания, на которые имеются разрешения публикации в открытой печати.

Математика

Физика

Методы обработки сигналов

Схемотехника

Астрономия

Разное

Макеты страниц

2. Задача о распределении ресурсов

Метод динамического программирования позволяет с успехом решать многие экономические задачи (см., например, [6, 10]). Рассмотрим одну из простейших таких задач. В нашем распоряжении имеется какой-то запас средств (ресурсов) К, который должен быть распределен между предприятиями . Каждое из предприятий при вложении в него каких-то средств приносит доход, зависящий от , т. е. представляющий собой какую-то функцию Все функции заданы (разумеется, эти функции — неубывающие).

Спрашивается, как нужно распределить средства К между предприятиями, чтобы в сумме они дали максимальный доход?

Эта задача легко решается методом динамического программирования. Хотя в своей постановке она не содержит упоминания о времени, можно все же операцию распределения средств мысленно развернуть в какой-то последовательности, считая за первый шаг вложение средств в предприятие за второй — в и т. д.

Управляемая система S в данном случае — средства или ресурсы, которые распределяются. Состояние системы S перед каждым шагом характеризуется одним числом S — наличным запасом еще не вложенных средств. В этой задаче «шаговыми управлениями» являются средства выделяемые предприятиям. Требуется найти оптимальное управление, т. е. такую совокупность чисел при которой суммарный доход максимален:

Решим эту задачу сначала в общем, формульном виде, а потом — для конкретных числовых данных. Найдем для каждого шага условный оптимальный выигрыш (от этого шага и до конца), если мы подошли к данному шагу с запасом средств S. Обозначим условный оптимальный выигрыш , а соответствующее ему условное оптимальное управление — средства, вкладываемые в предприятие, -

Начнем оптимизацию с последнего, шага. Пусть мы подошли к этому шагу с остатком средств S. Что нам делать? Очевидно, вложить всю сумму S целиком в предприятие Поэтому условное оптимальное управление на -м шаге: отдать последнему предприятию все имеющиеся средства S, т. е.

а условный оптимальный выигрыш

Задаваясь целой гаммой значений S (располагая их достаточно тесно), мы для каждого значения S будем знать . Последний шаг оптимизирован.

Перейдем к предпоследнему, шагу. Пусть мы подошли к нему с запасом средств S. Обозначим условный оптимальный выигрыш на двух последних шагах: (который уже оптимизирован). Если мы выделим на шаге предприятию средства то на последний шаг останется Наш выигрыш на двух последних шагах будет равен

и нужно найти такое , при котором этот выигрыш максимален:

Знак означает, что берется максимальное значение по всем какие только возможны (вложить больше, чем S, мы не можем), от выражения, стоящего в фигурных скобках. Этот максимум и есть условный оптимальный выигрыш за два последних шага, а то значение при котором этот максимум достигается, — условное оптимальное управление на шаге.

Далее оптимизируем и т. д. шаги. Вообще, для любого шага будем находить условный оптимальный выигрыш за все шаги с этого и до конца по формуле

и соответствующее ему условное оптимальное управление — то значение при котором этот максимум достигается.

Продолжая таким образом, дойдем, наконец, до предприятия Здесь нам не нужно будет варьировать значения S; мы точно знаем, что запас средств перед первым шагом равен К:

Итак, максимальный выигрыш (доход) от всех предприятий найден. Теперь остается только «прочесть рекомендации». То значение при котором достигается максимум (13.4), и есть оптимальное управление на 1-м шаге.

После того как мы вложим эти средства в 1-е предприятие, у нас их останется . «Читая» рекомендацию для этого значения S, выделяем второму предприятию оптимальное количество средств: и т. д. до конца.

А теперь решим численный пример. Исходный запас средств (условных единиц), и требуется его оптимальным образом распределить между пятью предприятиями Для простоты предположим, что вкладываются только целые количества средств. Функции дохода заданы в таблице 13.1.

Таблица 13.1

В каждом столбце, начиная с какой-то суммы вложений, доходы перестают возрастать (реально это соответствует тому, что каждое предприятие способно «освоить» лишь ограниченное количество средств).

Произведем условную оптимизацию так, как это было описано выше, начиная с последнего, 5-го шага. Каждый раз, когда мы подходим к очередному шагу, имея запас средств ?, мы пробуем выделить на этот шаг то или другое количество средств, берем выигрыш на данном шаге по таблице 13.1, складываем с уже оптимизированным выигрышем на всех последующих шагах до конца (учитывая, что средств у нас осталось уже меньше, как раз на такое количество средств, которое мы выделили) и находим то вложение, на котором эта сумма достигает максимума. Это вложение и есть условное оптимальное управление на данном шаге, а сам максимум — условный оптимальный выигрыш.

В таблице 13.2 даны результаты условной оптимизации по всем шагам. Таблица построена так: в первом столбце даются значения запаса средств S, с которым мы подходим к данному шагу. Далее таблица разделена на пять пар столбцов, соответственно номеру шага.

Таблица 13.2

В первом столбце каждой пары приводится значение условного оптимального управления, во втором — условного оптимального выигрыша. Таблица заполняется слева направо, сверху вниз. Решение на пятом — последнем — шаге вынужденное: выделяются все средства; на всех остальных шагах решение приходится оптимизировать. В результате последовательной оптимизации 5-го, 4-го, 3-го, 2-го и 1-го шагов мы получим полный список всех рекомендаций по оптимальному управлению и безусловный оптимальный выигрыш W за всю операцию — в данном случае он равен 5,6. В последних двух столбцах таблицы 13.2 заполнена только одна строка, так как состояние системы перед началом первого шага нам в точности известно: . Оптимальные управления на всех шагах выделены рамкой. Таким образом, мы получили окончательный вывод: надо выделить первому предприятию две единицы из десяти, второму — пять единиц, третьему — две, четвертому — ни одной, пятому — одну единицу. При этом распределении доход будет максимален и равен 5,6.

Чтобы читателю было понятно, как заполняется таблица 13.2, продемонстрируем это на одном образце расчета. Пусть, например, нам нужно оптимизировать решение — как поступать на третьем шаге, если мы подошли к нему с запасом средств , и сколько максимум мы можем выиграть на всех оставшихся шагах, включая третий?

Таблица 13.3

Предположим, что все шаги после третьего (4-й и 5-й) уже оптимизированы, т. е. заполнены две первые пары столбцов таблицы 13.2. Найдем и (7). Для этого составим вспомогательную табличку (см. таблицу 13.3). В первом ее столбце перечислены все возможные вложения на третьем шаге, не превосходящие Во втором столбце — то, что останется после такого вложения от запаса средств . В третьем столбце — выигрыш на третьем шаге от вложения средств в третье предприятие (заполняется по столбцу таблицы 13.1). В четвертом столбце — оптимальный выигрыш на всех оставшихся шагах (четвертом и пятом) при условии, что мы подошли к четвертому шагу с оставшимися средствами (заполняется по столбцу таблицы 13.2). В пятом столбце — сумма двух выигрышей: шагового и оптимизированного дальнейшего при данном вложении в третий шаг.

Из всех выигрышей последнего столбца выбирается максимальный (в таблице 13.3 он равен а соответствующее управление

Возникает вопрос: а что если во вспомогательной таблице типа 13,3 максимум достигается не при одном а при двух или больше?

Отвечаем: совершенно все равно, какое из них выбрать; от этого выигрыш не зависит. Вообще, в задачах динамического программирования решение вовсе не должно быть единственным (мы об этом уже упоминали).

<< Предыдущий параграф

Следующий параграф >>

Оглавление

ПРЕДИСЛОВИЕ
ГЛАВА 1. ПРЕДМЕТ И ЗАДАЧИ ИССЛЕДОВАНИЯ ОПЕРАЦИЙ
§ 1. Что такое исследование операций и чем оно занимается
§ 2. Основные понятия и принципы исследования операций
§ 3. Математические модели операций
ГЛАВА 2. РАЗНОВИДНОСТИ ЗАДАЧ ИССЛЕДОВАНИЯ ОПЕРАЦИЙ И ПОДХОДОВ К ИХ РЕШЕНИЮ
§ 4. Прямые и обратные задачи исследования операций. Детерминированные задачи
§ 5. Проблема выбора решения в условиях неопределенности
§ 6. Многокритериальные задачи исследования операций. «Системный подход»
ГЛАВА 3. ЛИНЕЙНОЕ ПРОГРАММИРОВАНИЕ
§ 7. Задачи линейного программирования
§ 8. Основная задача линейного программирования
§ 9. Существование решения ОЗЛП и способы его нахождения
§ 10. Транспортная задача линейного программирования
§ 11. Задачи целочисленного программирования. Понятие о нелинейном программировании
ГЛАВА 4. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
§ 12. Метод динамического программирования
§ 13. Примеры решения задач динамического программирования
1. Прокладка наивыгоднейшего пути между двумя пунктами.
2. Задача о распределении ресурсов
3. Задача о загрузке машины.
§ 14. Задача динамического программирования в общем виде. Принцип оптимальности
ГЛАВА 5. МАРКОВСКИЕ СЛУЧАЙНЫЕ ПРОЦЕССЫ
§ 15. Понятие о марковском процессе
§ 16. Потоки событий
§ 17. Уравнения Колмогорова для вероятностей состояний. Финальные вероятности состояний
ГЛАВА 6. ТЕОРИЯ МАССОВОГО ОБСЛУЖИВАНИЯ
§ 18. Задачи теории массового обслуживания. Классификация систем массового обслуживания
§ 19. Схема гибели и размножения. Формула Литтла
§ 20. Простейшие системы массового обслуживания и их характеристики
2. Одноканальная СМО с неограниченной очередью.
3. n-канальная СМО с неограниченной очередью.
4. Одноканальная СМО с ограниченной очередью.
5. Замкнутая СМО с одним каналом и m источниками заявок.
§ 21. Более сложные задачи теории массового обслуживания
ГЛАВА 7. СТАТИСТИЧЕСКОЕ МОДЕЛИРОВАНИЕ СЛУЧАЙНЫХ ПРОЦЕССОВ (МЕТОД МОНТЕ-КАРЛО)
§ 22. Идея, назначение и область применимости метода
§ 23. Единичный жребий и формы его организации
§ 24. Определение характеристик стационарного случайного процесса по одной реализации
ГЛАВА 8. ИГРОВЫЕ МЕТОДЫ ОБОСНОВАНИЯ РЕШЕНИЙ
§ 25. Предмет и задачи теории игр
§ 26. Антагонистические матричные игры
§ 27. Методы решения конечных игр
§ 28. Задачи теории статистических решений
ЛИТЕРАТУРА