Главная > Теория автоматического управления > Оптимальные и адаптивные системы
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

Принцип максимума.

Учтем теперь ограничения (2.2.2) на управление. Если в процессе оптимального управления функции не достигают границ множества (2.2.2) (что означает ) то для них выполняются соотношения (2.2.13), (2.2.14). Однако часто оптимальное управление принимает граничные значения либо — , более того, оптимальное управление может скачком переходить с одной границы на другую. Такие управления уже являются кусочно-непрерывными функциями времени.

При попадании оптимального управления на границу множества U соотношения (2.2.13), (2.2.14) нарушаются. Оптимальные управления удовлетворяют в этом случае принципу максимума Л. С. Понтрягина, установленного и доказанного в форме приведенной ниже - теоремы.

Переходя к этой теореме, сделаем некоторые пояснения. Возьмем произвольное допустимое управление и при начальных условиях найдем решение системы (2.2.1): .

Подставляя это решение и управление в (2.2.8), определим, пока при некоторых произвольных начальных условиях , решение (2.2.8): . При фиксированных (постоянных) значениях векторов функция Н становится функцией вектора . Максимум этой функции по и обозначим через :

Максимум (наибольшее значение) непрерывной функции может достигаться как в точках локального максимума этой функции, в которых

так и на границах множества .

Теорема 2.2.1 (принцип максимума Л. С. Понтрягина). Пусть , — такое допустимое управление, что соответствующие ему решения уравнения (2.2.11), исходящие в момент из состояния (2.2.3), (2.2.7), проходят в момент времени через точку .

Для оптимальности управления (при котором ) принимает наименьшее значение) необходимо существование таких ненулевых непрерывных функций удовлетворяющих уравнениям (2.2.12), что при любом функция переменного достигает при максимума

при этом в конечный момент времени выполняются соотношения

Если удовлетворяют (2.2.11), (2.2.12) и (2.2.17), то функции переменного t являются постоянными и поэтому проверку соотношений (2.2.18) можно проводить не обязательно в момент времени а в любой момент .

Доказательство теоремы является достаточно сложным, и поэтому в приложении 2 приведен лишь вывод основного соотношения (2.2.17) теоремы для случая свободного правого конца ( не задан) и фиксированного .

Соотношения (2.2.17) и (2.2.18) можно записать в более простой форме:

Таким образом, центральным в теореме 2.2.1 является условие максимума (2.2.19). Оно означает, что если — оптимальные управления, а -оптимальные траектории, то непременно найдутся такая постоянная и такие решения ), системы (2.2.12), что функция их, переменных при всех будет достигать максимума на U именно при оптимальных управлениях . Поэтому теорему 2.2.1, дающую необходимое условие оптимальности в задачах оптимального управления, принято называть принципом максимума. Отметим, что во внутренних точках множества U для оптимального управления выполняются условия (2.2.13), (2.2.14), которые являются необходимыми для (2.2.19).

Практическое применение принципа максимума.

Как же практически воспользоваться условием (2.2.19), ведь функции и постоянная , входящие в это условие, неизвестны?

Здесь поступают следующим образом: рассматривая функцию ) как функцию переменных и считая переменные параметрами, решают задачу максимизации функции и находят функцию

на которой достигается наибольшее значение функции .

В ряде случаев функция (2.2.20) может быть записана в явном виде. Например, если правые части (2.2.1) имеют структуру

а подынтегральное выражение функционала (2.2.5)

множество описывается U неравенствами (2.2.2), то

и эта функция достигает [2.8] наибольшего значения на U в точке с координатами

или

Формула (2.2.22) дает большой объем информации о структуре оптимального управления: координата оптимального управления является ступенчатой (кусочно-постоянной) функцией со значениями при этом моменты переключения определяются условием

Итак, допустим, что функция (2.2.20) известна. Рассмотрим систему дифференциальных уравнений

Функции и , входящие в правые части этих уравнений, известны. Общее решение системы (2.2.24), (2.2.25) зависит от произвольных постоянных, которые определяются из краевых условий (2.2.3), (2.2.4). Задача интегрирования уравнений (2.2.24), (2.2.25) при краевых условиях (2.2.3), (2.2.4) называется краевой задачей (двухточечной краевой задачей).

Таким образом, принцип максимума позволяет свести решение задачи об оптимальном программном управлении к решению краевой задачи.

Трудность ее решения состоит в том, что интегрирование уравнений (2.2.24), (2.2.25) в «прямом времени» не представляется возможным, так как неизвестны начальные условия Один из возможных подходов к решению краевой задачи заключается в следующем. Задаваясь произвольным вектором и интегрируя (2.2.24), (2.2.25) при известных начальных условиях , найдем функции и при проверим выполнение равенства (2.2.4). Если оно нарушается, задаемся другим вектором и, интегрируя (2.2.24), (2.2.25) при начальных условиях , получим при вектор .

Если он не совпадает с заданным, продолжаем процесс до тех пор, пока не найдется такой вектор что условия (2.2.4) будут выполняться с приемлемой точностью. При этом подходе используются градиентные методы, когда определяется из условия минимума «расстояния» от заданного вектора .

В вычислительной математике разработан ряд методов приближенного численного решения краевых задач: метод стрельбы, метод прогонки, ряд итерационных методов [2.10], [2.11]. Во многих случаях не представляется возможным найти из условия (2.2.19) явный вид (2.2.22) оптимального управления. Тогда уравнения (2.2.1), (2.2.6), сопряженная система (2.2.12) и условия максимума (2.2.19) образуют краевую задачу принципа максимума. Эта задача имеет ряд специфических особенностей, затрудняющих применение стандартных численных методов решения краевых задач. К числу таких особенностей относятся разрывы функций удовлетворяющих условию максимума (2.2.14), их неединственность, нелинейный характер зависимости (2.2.20) даже в линейных системах. Кроме того, особенностью краевых задач, связанных с принципом максимума даже в случаях, когда удается найти явный вид управлений (2.2.20), является их плохая сходимость, вызванная неустойчивостью системы (2.2.24), (2.2.25). Ряд приемов решения краевых задач принципа максимума изложен, например, в [2.12, 2.13].

Отметим в заключение, что, несмотря на различные методы численного решения краевой задачи принципа максимума, процесс решения каждой оптимизации на основе этого принципа является самостоятельной творческой задачей, решаемой в рамках той частной отрасли динамики, к которой относится объект управления, с учетом его специфических особенностей, используемых для улучшения сходимости численного решения краевой задачи.

Пример 2.2.1. Построение оптимального по расходу топлива управления [2.3].

Рассмотрим объект управления, описываемый уравнениями

Пусть на управление наложено ограничение

Функционал оптимизации, выражающий расход топлива, имеет вид

Заданы начальное состояние

и условие в момент времени

Требуется найти , при котором объект (2.2.26) переходит из состояния (2.2.29) в состояние (2.2.30), при этом выполняются ограничения (2.2.27), а функционал (2.2.28) принимает наименьшее значение.

Переходя к определению оптимального управления на основе принципа максимума, сформируем функцию

уравнения для вспомогательных переменных

Управление , доставляющее максимум функции (2.2.31), определяется как

Уравнения (2.2.26), (2.2.32), (2.2.33) составляют краевую задачу. Переходя к ее исследованию, запишем решение системы (2.2.32):

где — неизвестные числа, которые необходимо определить так, чтобы управление (2.2.33) привело объект (2.2.26) в состояние (2.2.30).

Найдем решение системы (2.2.26) при и . В первом случае решение этой системы имеет вид . Оно зависит от постоянных R и р, при этом . Фазовые траектории этой системы представляют собой окружности с центром в начале координат (рис. 2.2.1, а). Фазовые траектории системы (2.2.26) при и также являются окружностями, центры которых расположены в точках соответственно (рис. 2.2.1, б, в).

Рис. 2.2.1.

Рис. 2.2.2.

Рис. 2.2.3.

Пусть некоторым оптимальным управлениям объект (2.2.26) переводится из начального состояния в начало координат. Тогда на последнем участке оптимальной траектории управление равно либо —1. Для определенности будем полагать, что оптимальное управление имеет вид, изображенный на рис. 2.2.2. В этом случае последний участок фазовой траектории представляет собой дугу величиной с центром в точке (1, 0) (рис. 2.2.3). Управление при , и поэтому соответствующий участок фазовой траектории является дугой с центром в точке (0, 0) и центральным углом .

В точке А происходит переключение управления на , а в точке на . Задаваясь различными значениями чисел и , получим различные числа . Строя для каждого числа траекторию методом «попятного движения (каким была построена траектория на рис. 2 2.3), определяем, «попал» ли левый конец этой траектории в точку . Пусть для некоторого траектория ОАВ прошла через точку . Для такого числа нетрудно определить числа и , а через них начальные условия , которые и разрешают краевую задачу.

Условия трансверсальности.

Пусть в задаче об оптимальном программном управлении начальное (2.2.3) и конечное (2.2.4) состояния не фиксированы ( заданы) и могут перемещаться по поверхностям: левый конец траектории по поверхности , а правый — по поверхности .

Теорема 2.2.2 (принцип максимума) в этом случае в основном сохраняется (так как управление, оптимальное при подвижных концах траектории , является оптимальным и в частном случае, когда концы закреплены), однако граничных условий для системы (2.2.24), (2.2.25), решения которой содержат произвольных постоянных, определяются из условий трансверсальности:

Если один из концов траектории , например правый, закреплен, то граничные условия имеют вид

<< Предыдущий параграф Следующий параграф >>
Оглавление