Скачать презентацию Исследование операций Введение в нелинейное и динамическое программирование Скачать презентацию Исследование операций Введение в нелинейное и динамическое программирование

Исследование операций 4.ppt

  • Количество слайдов: 17

Исследование операций Введение в нелинейное и динамическое программирование. Исследование операций Введение в нелинейное и динамическое программирование.

План. • Введение в нелинейное программирование. Метод штрафных функций. Метод множителей Лагранжа. • Введение План. • Введение в нелинейное программирование. Метод штрафных функций. Метод множителей Лагранжа. • Введение в динамическое программирование. Многошаговые процессы принятия решений. 2

Задачи нелинейного программирования • Если требуется найти неотрицательные значения переменных х1, х2, …, хn Задачи нелинейного программирования • Если требуется найти неотрицательные значения переменных х1, х2, …, хn удовлетворяющие каким -то ограничениям произвольного вида φ1(х1, х2, …, хn )>=0 φ2(х1, х2, …, хn )>=0 … φm(х1, х2, …, хn )>=0 и обращающие в максимум произвольную нелинейную функцию этих переменных W=W(х1, х2, …, хn ) =>max, то речь идёт о задаче нелинейного программирования. 3

Особенности задач НП 1. Способ решения зависит от вида функции W и вида накладываемых Особенности задач НП 1. Способ решения зависит от вида функции W и вида накладываемых на элементы решения ограничений. 2. Такие задачи часто встречаются в практике, например, когда затраты растут не пропорционально количеству произведённых товаров. 3. Иногда эти задачи могут быть заменены линейными (линеаризованы), например в области, близкой к оптимальному решению, либо к сравнительно благополучным нелинейным (квадратичное программирование). 4. Иногда применяется метод «штрафных функций» . 4

Метод «штрафных функций» . 1. Задача поиска экстремума при наличии ограничений сводится к аналогичной Метод «штрафных функций» . 1. Задача поиска экстремума при наличии ограничений сводится к аналогичной задаче при отсутствии ограничений, которая обычно решается проще. 2. Однако вместо жёсткого требования вида φ1(х1, х2, …, хn )>=0 накладывается большой «штраф» за нарушение этого условия и добавляется к целевой функции штраф вида αφ1(х1, х2, …, хn ), где α – коэффициент пропорциональности (α>0, если целевая функция минимизируется, α<0, если целевая функция максимизируется). 3. Увеличивая значение α смотрят как при этом меняется оптимальное решение (х*1, х*2, …, х*n). Когда оно практически перестаёт 5 меняться останавливаются на нём.

Метод множителей Лагранжа Задача. Максимизировать функцию Z = f(х1, х2, . . . , Метод множителей Лагранжа Задача. Максимизировать функцию Z = f(х1, х2, . . . , хn) при ограничениях gi(х1, х2, . . . , хn) = 0, i=1, 2. . , m. Решение. Составляют функцию Лагранжа Определяют частные производные и приравнивают их к нулю. Решают полученную систему. 6

7 7

8 8

Метод динамического программирования Динамическое программирование (планирование) –особый метод оптимизации решений, приспособленный к так называемым Метод динамического программирования Динамическое программирование (планирование) –особый метод оптимизации решений, приспособленный к так называемым многошаговым (многоэтапным) операциям. Примеры. • Деятельность отрасли промышленности в течение ряда хозяйственных лет. • Преодоление группой самолётов нескольких полос противовоздушной обороны; • Выбор маршрута, состоящего из нескольких отдельных участков. 9

Постановка задачи ДП 1. Некоторые операции расчленяются на шаги естественно (вышеприведённые примеры), а некоторые Постановка задачи ДП 1. Некоторые операции расчленяются на шаги естественно (вышеприведённые примеры), а некоторые - только искусственно (наведение ракеты на цель – можно разбить на этапы, каждый из которых занимает определённый промежуток времени). 10

Постановка задачи ДП 2. Эффективность всей операции W – «выигрыш» может складываться из выигрышей Постановка задачи ДП 2. Эффективность всей операции W – «выигрыш» может складываться из выигрышей на отдельных шагах (свойство аддитивности)– такой процесс является управляемым. На каждом этапе мы выбираем какое-то решение хi «шаговое управление» , от которого зависит выигрыш за операцию в целом. Совокупность всех шаговых управлений – управление операцией в целом х = (х1, х2, …, хn ), где хi- могут быть как числами, так и векторами и функциями. Необходимо найти такое х*, чтобы выигрыш был максимальным W=>max, 11

Задача о распределении ресурсов Планируется деятельность 3 предприятий на ближайшие к лет. В начале Задача о распределении ресурсов Планируется деятельность 3 предприятий на ближайшие к лет. В начале периода на развитие выделены средства в определённом объёме. Часть средств расходуются, другая часть сохраняется и может быть перераспределена. Доход предприятий зависит от количества вложенных в них средств. Вопрос: какое количество денежных средств в начале каждого года следует выделить каждому предприятия, чтобы суммарный доход за к лет был максимальным. 12

Поиск решения. • Выигрыш - суммарный доход – сумма доходов на отдельных шагах – Поиск решения. • Выигрыш - суммарный доход – сумма доходов на отдельных шагах – свойство аддитивности выполняется. • Шаговое управление – вектор (хк 1, хк 2, хк 3), где к - порядковый номер шага (года), 1, 2, 3 –номер предприятия, которому будет выделена данная сумма на данном шаге. Пример решения. Стр. 98 -104 учебника. 13

Задача о запуске космической ракеты Космическая ракета состоит из m ступеней, а процесс её Задача о запуске космической ракеты Космическая ракета состоит из m ступеней, а процесс её запуска на орбиту из m этапов, в конце каждого из которых отбрасывается очередная ступень. Известен вес каждой ступени. Приращение скорости зависит отвеса ступени и оставшегося веса ракеты. Вопрос: как распределить вес между ступенями, чтобы скорость ракета при выводе на орбиту была максимальна. Решение. Выигрыш – скорость – обладает свойством аддитивности, так как равна сумме приращений скоростей на каждом шаге. 14 Управление – совокупность весов всех ступеней.

Задача об эксплуатации машины. Владелец машины на начало каждого следующего года эксплуатации машины может Задача об эксплуатации машины. Владелец машины на начало каждого следующего года эксплуатации машины может принимать одно из трёх решений 1. Продать машину и заменить её новой; 2. Ремонтировать её и продолжать эксплуатацию; 3. Продолжать эксплуатацию без ремонта. Шаговое управление - выбор одного из трёх решений. Показатель эффективности – расходы на эксплуатацию, которые в целом хотелось бы минимизировать. Решение – комбинация чисел, например 15 (3, 3, 2, 2, 2, 1, 3, …)

Особенности решения задач ДП 1. Каждый шаг оптимизируется не отдельно, а с учётом всех Особенности решения задач ДП 1. Каждый шаг оптимизируется не отдельно, а с учётом всех его последствий в будущем. 2. Управление на конкретном этапе (кроме последнего) выбирается так, чтобы сумма выигрышей на всех оставшихся до конца шагах с учётом данного была максимальна. 3. Логично начать с этапа, от которого не зависит судьба остальных шагов – последний этап. Планируя его нужно исходить из возможных гипотез о том, как мог закончиться предыдущий этап, строя так называемое «условное управление» . 16

Особенности решения задач ДП 4. Далее работаем с предпоследним этапом с учётом того, что Особенности решения задач ДП 4. Далее работаем с предпоследним этапом с учётом того, что последний этап оптимизирован, и выстраивая гипотезы о том как мог закончиться предшествующий этап. Далее поступаем аналогично до первого шага. 5. Исходя из разработанных условных управлений, двигаясь в прямом направлении (с первого шага в сторону последнего) теперь можем найти оптимальное управление. Данный этап значительно короче по времени. Замечание. Начало и конец можно поменять местами, то есть можно начинать решение с начала задачи и двигаться в конец. Пример. Стр. 93 -98 учебника. 17