Исследование операций Введение в нелинейное и динамическое программирование

Скачать презентацию Исследование операций Введение в нелинейное и динамическое программирование

Исследование операций 4.ppt

Количество слайдов: 17

Исследование операций Введение в нелинейное и динамическое программирование.

План. • Введение в нелинейное программирование. Метод штрафных функций. Метод множителей Лагранжа. • Введение в динамическое программирование. Многошаговые процессы принятия решений. 2

Задачи нелинейного программирования • Если требуется найти неотрицательные значения переменных х1, х2, …, хn удовлетворяющие каким -то ограничениям произвольного вида φ1(х1, х2, …, хn )>=0 φ2(х1, х2, …, хn )>=0 … φm(х1, х2, …, хn )>=0 и обращающие в максимум произвольную нелинейную функцию этих переменных W=W(х1, х2, …, хn ) =>max, то речь идёт о задаче нелинейного программирования. 3

Особенности задач НП 1. Способ решения зависит от вида функции W и вида накладываемых на элементы решения ограничений. 2. Такие задачи часто встречаются в практике, например, когда затраты растут не пропорционально количеству произведённых товаров. 3. Иногда эти задачи могут быть заменены линейными (линеаризованы), например в области, близкой к оптимальному решению, либо к сравнительно благополучным нелинейным (квадратичное программирование). 4. Иногда применяется метод «штрафных функций» . 4

Метод «штрафных функций» . 1. Задача поиска экстремума при наличии ограничений сводится к аналогичной задаче при отсутствии ограничений, которая обычно решается проще. 2. Однако вместо жёсткого требования вида φ1(х1, х2, …, хn )>=0 накладывается большой «штраф» за нарушение этого условия и добавляется к целевой функции штраф вида αφ1(х1, х2, …, хn ), где α – коэффициент пропорциональности (α>0, если целевая функция минимизируется, α<0, если целевая функция максимизируется). 3. Увеличивая значение α смотрят как при этом меняется оптимальное решение (х*1, х*2, …, х*n). Когда оно практически перестаёт 5 меняться останавливаются на нём.

Метод множителей Лагранжа Задача. Максимизировать функцию Z = f(х1, х2, . . . , хn) при ограничениях gi(х1, х2, . . . , хn) = 0, i=1, 2. . , m. Решение. Составляют функцию Лагранжа Определяют частные производные и приравнивают их к нулю. Решают полученную систему. 6

Метод динамического программирования Динамическое программирование (планирование) –особый метод оптимизации решений, приспособленный к так называемым многошаговым (многоэтапным) операциям. Примеры. • Деятельность отрасли промышленности в течение ряда хозяйственных лет. • Преодоление группой самолётов нескольких полос противовоздушной обороны; • Выбор маршрута, состоящего из нескольких отдельных участков. 9

Постановка задачи ДП 1. Некоторые операции расчленяются на шаги естественно (вышеприведённые примеры), а некоторые - только искусственно (наведение ракеты на цель – можно разбить на этапы, каждый из которых занимает определённый промежуток времени). 10

Постановка задачи ДП 2. Эффективность всей операции W – «выигрыш» может складываться из выигрышей на отдельных шагах (свойство аддитивности)– такой процесс является управляемым. На каждом этапе мы выбираем какое-то решение хi «шаговое управление» , от которого зависит выигрыш за операцию в целом. Совокупность всех шаговых управлений – управление операцией в целом х = (х1, х2, …, хn ), где хi- могут быть как числами, так и векторами и функциями. Необходимо найти такое х*, чтобы выигрыш был максимальным W=>max, 11

Задача о распределении ресурсов Планируется деятельность 3 предприятий на ближайшие к лет. В начале периода на развитие выделены средства в определённом объёме. Часть средств расходуются, другая часть сохраняется и может быть перераспределена. Доход предприятий зависит от количества вложенных в них средств. Вопрос: какое количество денежных средств в начале каждого года следует выделить каждому предприятия, чтобы суммарный доход за к лет был максимальным. 12

Поиск решения. • Выигрыш - суммарный доход – сумма доходов на отдельных шагах – свойство аддитивности выполняется. • Шаговое управление – вектор (хк 1, хк 2, хк 3), где к - порядковый номер шага (года), 1, 2, 3 –номер предприятия, которому будет выделена данная сумма на данном шаге. Пример решения. Стр. 98 -104 учебника. 13

Задача о запуске космической ракеты Космическая ракета состоит из m ступеней, а процесс её запуска на орбиту из m этапов, в конце каждого из которых отбрасывается очередная ступень. Известен вес каждой ступени. Приращение скорости зависит отвеса ступени и оставшегося веса ракеты. Вопрос: как распределить вес между ступенями, чтобы скорость ракета при выводе на орбиту была максимальна. Решение. Выигрыш – скорость – обладает свойством аддитивности, так как равна сумме приращений скоростей на каждом шаге. 14 Управление – совокупность весов всех ступеней.

Задача об эксплуатации машины. Владелец машины на начало каждого следующего года эксплуатации машины может принимать одно из трёх решений 1. Продать машину и заменить её новой; 2. Ремонтировать её и продолжать эксплуатацию; 3. Продолжать эксплуатацию без ремонта. Шаговое управление - выбор одного из трёх решений. Показатель эффективности – расходы на эксплуатацию, которые в целом хотелось бы минимизировать. Решение – комбинация чисел, например 15 (3, 3, 2, 2, 2, 1, 3, …)

Особенности решения задач ДП 1. Каждый шаг оптимизируется не отдельно, а с учётом всех его последствий в будущем. 2. Управление на конкретном этапе (кроме последнего) выбирается так, чтобы сумма выигрышей на всех оставшихся до конца шагах с учётом данного была максимальна. 3. Логично начать с этапа, от которого не зависит судьба остальных шагов – последний этап. Планируя его нужно исходить из возможных гипотез о том, как мог закончиться предыдущий этап, строя так называемое «условное управление» . 16

Особенности решения задач ДП 4. Далее работаем с предпоследним этапом с учётом того, что последний этап оптимизирован, и выстраивая гипотезы о том как мог закончиться предшествующий этап. Далее поступаем аналогично до первого шага. 5. Исходя из разработанных условных управлений, двигаясь в прямом направлении (с первого шага в сторону последнего) теперь можем найти оптимальное управление. Данный этап значительно короче по времени. Замечание. Начало и конец можно поменять местами, то есть можно начинать решение с начала задачи и двигаться в конец. Пример. Стр. 93 -98 учебника. 17