Главная > Теория автоматического управления > Автоматическое управление
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

§ 24. Оптимальные линейные системы с квадратичным критерием качества

1. Задача о регуляторе состояния [34].

Рассмотрим нестационарную линейную систему

где -мерный вектор фазовых координат системы, -мерный вектор управления - матрица, -матрица. Предполагаем, что на управления ограничения не наложены. Управление должно быть выбрано так, чтобы минимизировать функционал

Здесь Т — некоторый фиксированный момент времени. Целью управления является удержание фазовых координат системы вблизи нуля, то есть речь идет о регулировании состояния системы. Через F и обозначены неотрицательно-определенные -матрицы, то есть симметрические матрицы, удовлетворяющие условию для любого -мерного вектора. Матрица представляет собой положительно-определенную -матрицу, то есть симметрическую матрицу, удовлетворяющую условию для любого -мерного вектора .

Необходимые условия оптимальности управления можно получить из принципа максимума Л. С. Понтрягина.

Согласно (18.15) функция для рассматриваемой здесь задачи имеет вид

где - -мерный вектор, элементами которого являются вспомогательные переменные . Оптимальное управление должно доставлять функции максимум.Согласно принципу максимума для неравтономных систем в задаче с закрепленным временем и свободным концом траектории . Поэтому, обозначая

получим, что оптимальное управление доставляет минимум функции

Так как

то элементы вектора удовлетворяют следующей системе дифференциальных уравнений:

Частные производные по от функции , где - симметрическая матрица, имеют вид

а вектор будет следующим:

Аналогично для функции имеем

а вектор имеет следующий вид:

где через обозначена матрица, образуемая транспонированием матрицы .

Таким образом, в соответствии с (6) и (5) вектор-функция удовлетворяет дифференциальному уравнению

(24.7)

Найдем теперь управление , доставляющее экстремум функции . Так как

(24.8)

то необходимые условия экстремума

принимают вид

(24.9)

Система скалярных уравнений (9) эквивалентна векторному уравнению

(21.10)

Из уравнения (10) следует, что управление , доставляющее экстремум функции , будет следующим:

(24.11)

Поскольку - определенная матрица, то и обратная матрица существует.

Согласно (8)

и, следовательно, матрица

(24.12)

является положительно-определенной матрицей. Отсюда следует, что управление которое определено выражением (11), доставляет функции минимум.

Подставляя выражение (11) для в уравнение (1), приведем это уравнение к виду

(24.13)

где - симметрическая матрица типа :

(24.14)

Уравнения (13) и (7) образуют систему векторных дифференциальных уравнений, которую можно записать так:

(24.15)

Векторное дифференциальное уравнение (15) определяет собой искомую оптимальную систему.

Начальное состояние системы (1) предполагается известным. Поэтому решение системы дифференциальных уравнений (15), ранг которой равен , должно удовлетворять начальным условиям, определяемым векторным соотношением

(24.16)

Для вспомогательных переменных вытекающие из условий трансверсальности n граничных условий определяются соотношением

(24.17)

Условия (16) и (17) определяют единственное решение системы уравнений (15).

Покажем, как получить граничное условие (17). Предварительно преобразуем функционал (2) к виду, не содержащему аддитивного члена, зависящего от . Так как

то имеем

(24.18)

Учитывая тождество (18), можно преобразовать функционал (2) к следующему виду:

(24.19)

Соответственно функция , определяемая выражением (5), может быть заменена следующей функцией:

Так как согласно (1)

то функция 26 принимает вид

(24.20)

Поскольку функционалы (2) и (19) получены друг из друга при помощи тождественного преобразования, то и функции и должны совпадать. Для этого, как следует из выражений (5) и (20), должно выполняться условие

(24.21)

В задаче с закрепленным временем и свободным концом траектории, в случае, когда функционал, который требуется минимизировать, имеет вид (19), условия трансверсальности приводят согласно (17.55) к соотношению

(24.22)

При этом в соответствии с (21) для исходной задачи с функционалом (2) будет иметь место соотношение (17)

Найдем еще дифференциальное уравнение, которому удовлетворяет вектор-функция в задаче с функционалом (19). Аналогично (6)

(24.23)

Так как

то, учитывая, что F — симметрическая матрица, то есть , будем иметь

Система дифференциальных уравнений (23), таким образом, может быть представлена в виде следующего векторного дифференциального уравнения:

(24.24)

или

Так как согласно (1)

то уравнение (24) приводится к виду

откуда в соответствии с (21) получим уравнение (7)

для исходной задачи с функционалом (2), что мы и хотели показать.

Обратимся теперь к дифференциальным уравнениям (7) и (13)

Будем искать в виде

(24.25)

где - -матрица, подлежащая определению. При этом уравнение (13) принимает следующий вид:

(24.26)

Из соотношения (25) следует, что

(24.27)

Сравнивая выражение (27) и (17), найдем, что

(24.28)

Из уравнений (7) и (13) можно найти дифференциальное уравнение, которому должна удовлетворять матрица К(t). Подставляя в уравнения (7) и (13) выражение (25), получим

(24.29)

Учитывая, что согласно (14)

можно привести уравнение (29) к виду

(24.30)

Соотношение (30) должно выполняться при любом значении , откуда следует, что матрица должна удовлетворять дифференциальному уравнению

(24.31)

Уравнение (31) представляет собой нелинейное матричное дифференциальное уравнение Риккати. Вместе с граничным условием (28) уравнение (31) определяет единственным образом матрицу .

Покажем еще, что матрица симметрическая. Транспонируя матрицы в левой и правой части уравнения (31) и учитывая, что и - симметрические матрицы и что

получим следующее уравнение:

(24.32)

Граничное условие (28) в силу симметричности матрицы F принимает вид

(24.33)

Таким образом, дифференциальные уравнения и граничные условия, которым удовлетворяют и совпадают, и в силу теоремы единственности

(24.34)

то есть является симметрической матрицей.

Дифференциальное уравнение, определяющее закон движения оптимальной системы, в соответствие с (26) и (14) будет следующим:

(24.35)

Покажем теперь, как связана матрица с фундаментальной матрицей решений векторного дифференциального уравнения (15). Обозначим через следующую -матрицу:

(24.36)

Решение уравнения (15) будет следующим:

(24.37)

Аналогично (37) при будем иметь

(24.38)

Представляя матрицу в виде блочной матрицы, элементы которой являются -матрицами:

(24.39)

получим из (38) и (17) следующие соотношения:

(24.40)

Из соотношений (40) следует, что

(24.41)

Так как , где — единичная матрица типа , то

где — единичная матрица типа , и из (41) следует

что совпадает с выражением (17).

Сравнивая выражения (41) и (25), найдем, что

(24.42)

Определение матрицы может быть выполнено интегрированием векторного дифференциального уравнения, сопряженного для векторного дифференциального уравнения (15) [68].

В случае, когда А, В, Q и R — постоянные матрицы, построение фундаментальной матрицы не вызывает затруднений и матрица может быть определена в замкнутой форме. Оптимальная система, описываемая векторным дифференциальным уравнением (35), будет линейной системой, однако даже в случае, когда А, В, Q и R — постоянные матрицы, она будет системой нестационарной.

Перейдем теперь к определению минимального значения функционала

(24.43)

Докажем, что

(24.44)

где - решение уравнения Риккати (31) при граничном условии (28). При этом, учитывая (28), будем иметь

(24.45)

Для доказательства справедливости выражения (44) составим уравнение Беллмана для рассматриваемой здесь задачи. Согласно (14.21) это уравнение будет следующим:

(24.46)

Выражение в фигурных скобках в уравнении (46) совпадает с выражением (5), которым определена функция , если в нем заменить вектор вектором . В соответствии с (11) этому выражению доставляет минимум управление

(24.47)

Так как согласно (44)

то формула (47) принимает вид

(24.48)

Уравнение (46) можно теперь переписать так:

(24.49)

Для преобразования уравнения (49) потребуются тождества

(24.50)

Здесь учтено, что согласно (34) . Аналогично

Из последних двух тождеств следует, что

(24.51)

При помощи (50) и (51) можно преобразовать уравнение (49) к виду

(24.52)

Таким образом, в соответствии с (44) уравнение Беллмана (46) принимает следующий вид:

(24.53)

Так как есть решение уравнения Риккати (31), то выражение в квадратных скобках в уравнении (53) тождественно равно нулю, и, следовательно, определяемая выражением (44) функция есть решение уравнения Беллмана для рассматриваемой задачи.

Из изложенного видно, что функция удовлетворяет уравнению Беллмана (53) при любых значениях ее аргументов: (где X — -мерное фазовое пространство системы) и . Можно показать [14] (аналогично теореме § 15), что из этого следует, что управление (48) удовлетворяет необходимым и достаточным условиям оптимальности и что это управление является единственным.

Покажем еще, что матрица при ) является положительно-определенной матрицей. В силу того, что F и — неотрицательно-определенные матрицы, a - положительно-определенная матрица, функционал при любом управлении будет согласно (43) иметь положительное значение при любом . Следовательно, минимальное значение функционала определяемое выражением (44):

для любого вектора . Отсюда следует положительная определенность матрицы при .

Определение граничного значения в общем случае задачи с закрепленным временем и свободным концом траектории. В общем случае уравнения движения системы имеют следующий вид:

(24.54)

где и x — -мерные векторы, u — -мерный вектор.

Пусть функционал, который требуется минимизировать, имеет вид

(24.55)

Аналогично (5) функция которой оптимальное управление должно доставить минимум, имеет вид

(24.56)

Так как

то имеем

(24.57)

Функционал (55) преобразуется к следующему виду:

(24.58)

Функция 26 теперь должна быть заменена следующей функцией:

(24.59)

Найдем дифференциальное уравнение, которому должна удовлетворять вектор-функция . Так как

то будем иметь

или

(24.60)

Покажем теперь, что вектор , который входит в выражение (56), будет иметь следующий вид:

(24.61)

то есть, что

(24.62)

Из (62) и (60) следует, что

(24.63)

Так как

(24.64)

то уравнение (63) принимает вид

(24.65)

то есть

(24.66)

где функция определена выражением (56). Полученный результат подтверждает справедливость соотношения (61).

В задаче с закрепленным временем и свободным концом траектории, в случае, когда функционал, который требуется минимизировать, имеет вид (58), условия трансверсальности приводят согласно (17.55) к соотношению

(24.67)

При этом в соответствии с (61) для исходной задачи с функционалом (55) будет иметь место соотношение

(24.68)

<< Предыдущий параграф Следующий параграф >>
Оглавление