Главная > Теория автоматического управления > Автоматическое управление
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

2. Доказательство теоремы о необходимом условии оптимальности для неавтономной системы с линейно входящим управлением.

Для частного случая, когда управление входит линейно, можно дать [27, 72] непосредственное доказательство теоремы о необходимом условии оптимальности для неавтономной системы.

Рассмотрим систему, описываемую скалярными дифференциальными уравнениями

(18.21)

которым эквивалентно векторное дифференциальное уравнение

(18.22)

где

(18.23)

Требуется перевести систему из точки в заданную точку . Момент времени , в который изображающая точка попадет в точку , заранее не фиксируется.

Управления должны удовлетворять ограничениям

(18.24)

и их надо выбрать чтобы приведение системы в точку было выполнено при минимально возможном значении функционала

(18.25)

Через обозначим функцию, определяемую дифференциальным уравнением

(18.26)

я начальным условием

(18.27)

Тогда функционал Q примет вид

(18.28)

Вспомогательные переменные будут удовлетворять следующей системе дифференциальных уравнений:

(18.29)

Функция Н в рассматриваемой задаче имеет вид

или

(18.30)

Обозначим через оптимальное управление, а через и соответствующие ему векторы фазовых координат и вспомогательных переменных.

Покажем, что оптимальное управление будет иметь следующий вид, соответствующий теореме о принципе максимума:

(18.31)

или

(18.32)

где

(18.33)

(18.34)

Дадим оптимальному управлению приращение , удовлетворяющее условию

(18.35)

Функцию назовем допустимой вариацией оптимального управления.

Управлению будет соответствовать решение дифференциальных уравнений (21) и (26), где -решение этих уравнений при .

Так как начальное состояние системы фиксировано, то

(18.36)

Таким образом, в соответствии с (21) и (26) будем иметь следующую систему дифференциальных уравнений:

Так как

(18.38)

то уравнения (37) принимают вид

(18.39)

Первое слагаемое в левой части уравнений (39) взаимно сокращается с первыми двумя слагаемыми в правой части этих уравнений, как это следует из уравнений (21) и (26). При малых допустимых вариациях управления , будут малыми и вариации . Тогда, отбрасывая в уравнениях (39) совокупность членов второго и высших порядков относительно получим следующую систему линейных дифференциальных уравнений:

(18.40)

Уравнения (40) представляют собой систему уравнений в вариациях для рассматриваемой задачи. Так как определяют собой оптимальную траекторию, то функции являются некоторыми функциями времени.

Обозначим через матрицу типа , элементами которой являются функции :

(18.41)

Через обозначим -мерный вектор

(18.42)

где

(18.43)

Систему уравнений в вариациях (40) можно представить в виде векторного дифференциального уравнения

(18.44)

где матрица имеет вид (34).

Матрица , образуемая транспонированием матриц (41), имеет следующий вид:

(18.45)

Согласно (29) вспомогательные переменные , соответствующие оптимальному управлению удовлетворяют следующей системе дифференциальных уравнений:

(18.46)

Систему скалярных дифференциальных уравнений (46) можно заменить векторным дифференциальным уравнением

(18.47)

Через обозначим фундаментальную матрицу решений векторного дифференциального уравнения (47), удовлетворяющую условию , где Е — единичная матрица.

Через обозначим фундаментальную матрицу решений векторного дифференциального уравнения

(18.48)

удовлетворяющую условию .

Так как согласно (47) и (48)

(18.49)

то

(18.50)

откуда следует, что

(18.51)

Подставляя вместо и решения уравнений (47) и (48)

приведем соотношение (51) к виду

или

(18.52)

Из соотношения (52) следует, что

(18.53)

Транспонируя матрицы в левой и правой части соотношения (53), получим

(18.54)

Аналогично (49) из уравнений (44) и (47) найдем, что

(18.55)

откуда, интегрируя, получим

(18.56)

Так как согласно (44) , то соотношение (56) принимает вид

(18.57)

Покажем теперь, что при выполнении условия (31) имеет место соотношение

(18.58)

где — любой вектор, принадлежащий множеству векторов, соответствующему множеству допустимых вариаций .

Действительно, в соответствии с (31) при

согласно (31) имеем , и допустимая вариация будет удовлетворять условию

При

имеем согласно (31) , и допустимая вариация будет удовлетворять условию

При этом

откуда согласно (57) вытекает соотношение (58).

Нетрудно также видеть, что если условие (31) не выполнено, то существуют такие допустимые вариации, для которых

Действительно, пусть вне отрезка времени вариация управления . На отрезке времени

Пусть

то есть условие (31) не выполнено.

Выберем в качестве допустимой вариации управления

где удовлетворяет условию

При этом выражение (57) принимает вид

Таким образом, соотношение (58) имеет место только при выполнении условия (31).

Допустимые вариации оптимального управления должны удовлетворять соотношению (35), из которого следует, что векторы ограничены по норме. Так как мы здесь исходим из линейной системы уравнений в вариациях (44), то ограничимся лишь достаточно малыми вариациями , удовлетворяющими как условию (35), так и условию

(18.59)

где — достаточно малая величина.

Каждой допустимой вариации соответствует некоторое решение векторного дифференциального уравнения (44). Это решение в момент времени принимает значение . В -мерном пространстве из точки отложим вектор . Множество концов векторов соответствующих допустимым вариациям назовем множеством достижимости и обозначим через . Так как согласно (59) допустимые вариации ограничены, то и векторы также ограничены, и, следовательно, множество будет ограниченным.

Можно показать, что является выпуклым множеством. Для этого требуется, чтобы все точки

отрезка прямой, соединяющего две точки и множества , принадлежали множеству . Вариации управления и , которым соответствуют и , удовлетворяют условиям (35) и (59). Определим соотношением

Вариация управления удовлетворяет условиям (35) и (59), то есть точка . Решение соответствующее вариации и начальному условию в соответствии с (44) будет

Отсюда следует, что

и, таким образом, является ограниченным, выпуклым множеством.

Покажем еще, что точка , соответствующая вариации бы , лежит на границе множества . Действительно, точка в пространстве расположена на прямой L, проходящей через точку параллельно оси . Если бы точка была внутренней точкой ограниченного выпуклого множества , то существовал бы отрезок прямой L с граничной точкой , все точки которого принадлежали бы множеству и имели бы координату меньшую чем координата граничной точки оптимальной траектории. Тогда сфера достаточно малого радиуса с центром в точке все точки которой принадлежат множеству , пересекла бы отрезок в точке , где , что противоречило бы оптимальности траектории .

Отсюда следует, что точка расположена на границе ограниченного выпуклого множества .

Как известно [15], через любую граничную точку выпуклого множества можно провести хотя бы одну гиперплоскость такую, что все точки этого множества будут расположены по одну сторону от этой гиперплоскости. Указанная гиперплоскость называется опорной. Через угловую граничную точку можно провести более одной опорной гиперплоскости. Обозначим через М опорную для множества гиперплоскость, проходящую через граничную точку Единичную нормаль к гиперплоскости М в точке направленную в полупространство, не содержащее множества , обозначим через N. Из изложенного следует, что для любого вектора будет иметь место соотношение

(18.60)

Чтобы завершить доказательство теоремы, надо показать существование вектор-функции удовлетворяющей условию (17). Положим

(18.61)

Тогда, как показано выше (соотношение (58)), для выполнения условия (60) требуется, чтобы управление определялось формулой (31), где — решение системы дифференциальных уравнений (46), удовлетворяющее граничному условию (61).

В качестве примера заметим, что для задачи с закрепленным временем Т и свободным концом траектории опорная плоскость М для множества достижимости будет перпендикулярна к оси . Поэтому нормаль N к плоскости М, направленная в полупространство, не содержащее множества , и, следовательно, согласно (61) в этой задаче , как это указано в формуле (17.55).

Приведенные здесь, при помощи линейных уравнений в вариациях (44), рассуждения справедливы, если вариации достаточно малы, то есть если рассматриваются лишь траектории, достаточно близкие к оптимальной траектории.

Итак доказано, что условие (31) является необходимым условием оптимальности.

Вопрос о достаточных условиях оптимальности в форме принципа максимума требует отдельного рассмотрения.

<< Предыдущий параграф Следующий параграф >>
Оглавление