Главная > Теория автоматического управления > Автоматическое управление
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

§ 20. Понятие регулярного синтеза в теории оптимальных систем

Понятие регулярного синтеза, введенное В. Г. Болтянским [14], для системы, описываемой дифференциальными уравнениями (17.1)

или эквивалентным векторным уравнением

где , для которых теперь предполагается непрерывность производных

состоит в следующем.

Предположим, что заданы кусочно-гладкое (см. § 15, стр. 240) множество N размерности , кусочно-гладкие множества

и функция , определенная в D и принимающая значения в .

Множества (2) и функция осуществляют регулярный синтез для уравнения (1) в области D, если выполнены следующие условия, сформулированные В. Г. Болтянским.

А. Множество содержит точку а и не имеет предельных точек в открытом множестве D. Каждая компонента множества представляет собой -мерное гладкое многообразие в эти компоненты называются -мерными клетками. Точки множества называются нульмерными клетками. Функция непрерывна и непрерывно дифференцируема на каждой клетке и может быть продолжена в непрерывно дифференцируемую функцию на окрестности клетки.

Б. Все клетки распределены на клетки первого и второго рода. Все -мерные клетки являются клетками первого рода, все нульмерные — клетками второго рода.

В. Если — некоторая -мерная клетка первого рода, то через каждую точку этой клетки проходит единственная траектория уравнения

(проходящая по клетке ). Существует такая -мерная клетка , что каждая траектория системы (3), идущая в клетне , через конечное время покидает клетку , упираясь под нулевым углом в клетку и подходя к ней с ненулевой фазовой скоростью.

Если — одномерная клетка первого рода, то она представляет собой кусок фазовой траектории системы (3), подходящей с ненулевой фазовой скоростью к некоторой нульмерной клетке .

Если — некоторая -мерная клетка второго рода, отличная от точки , то существует такая -мерная клетка , являющаяся клеткой первого рода, что из любой точки клетки исходит единственная траектория системы (3), идущая по клетке , причем функция непрерывна и непрерывно дифференцируема на .

Г. Перечисленные выше условия обеспечивают возможность продолжения траекторий системы (3) от клетки к клетке: из клетки в клетку , если клетка первого рода, и из клетки в клетку , если клетка второго рода. Требуется, чтобы каждая такая траектория шла лишь по конечному числу клеток (то есть чтобы «протыкание» клеток второго рода происходило для каждой траектории конечное число раз). При этом любая траектория кончается в точке .

Указанные траектории называются отмеченными.

Таким образом, из каждой точки множества исходит единственная отмеченная траектория, ведущая в точку . Требуется также, чтобы из каждой точки множества N исходила (возможно, не единственная) траектория системы (3), ведущая в точку и также называемая отмеченной.

Д. Все отмеченные траектории удовлетворяют принципу максимума.

Е. Значение функционала Q (см. (17.3)), вычисленное вдоль отмеченных траекторий (кончающихся в точке ), является непрерывной функцией начальной точки .

В частности, если из точки исходят несколько отмеченных траекторий, то значение функционала Q для них одинаково.

Пример регулярного синтеза. Задача о быстродействии в линейной системе. Все известные примеры синтеза оптимального по быстродействию управления в линейных системах являются частными случаями регулярного синтеза.

Покажем это на сравнительно простом примере линейной системы, рассмотренной в § 15, стр. 236.

Уравнения движения системы имеют следующий вид:

На управление и наложено следующее ограничение:

Требуется перевести систему из заданного начального состояния в состояние в наименьшее возможное время.

Промежуток времени, в течение которого удастся привести систему в состояние , существенно зависит от наложенных на управляющую силу и ограничений: .

В соответствии с (1) и (4) в рассматриваемом примере

Функция согласно (17.21) здесь принимает вид

где и в соответствии с (17.23) удовлетворяют следующим дифференциальным уравнениям:

Из (7) следует, что для любого момента времени при ограничении (5) наибольшее возможное значение функции переменного и, где доставит управление

Таким образом, оптимальное управление будет согласно (9) следующим:

Согласно (8) функции и будут иметь следующий вид:

(20.10)

где через и обозначены начальные значения функций и соответственно.

Если бы начальные значения и были известны, то в соответствии с (9) и (10) задача синтеза оптимального управления была бы завершена. Отыскание начального значения вектор-функции является основной трудностью в общей задаче синтеза оптимального управления по принципу максимума.

В рассматриваемом здесь простом примере задачу удается решить благодаря возможности явного определения на фазовой плоскости кривой , на которой управление и (модуль которого согласно (9) остается постоянным должно изменять знак. Кривая называется линией переключения управления.

Так как согласно (9)

и (20.11)

а функция изменяет свой знак лишь один раз в момент времени , то оптимальное управление изменяет свой знак не более одного раза на отрезке времени , где — момент попадания изображающей точки в начало координат.

Таким образом, оптимальное управление и является кусочно-постоянной функцией (модуль этой функции которая имеет не более двух интервалов постоянства.

Указанное свойство оптимального управления в рассматриваемом примере позволяет построить семейство оптимальных траекторий на фазовой плоскости .

На отрезке времени, на котором управление и , уравнения (4) принимают вид

откуда следует, что

Интегрируя это уравнение, получим семейство парабол

(20.13)

зависящее от параметра . При получим параболу

(20.14)

проходяшую через начало координат. Дуга АО параболы (14) показана на рис. 20.1. Линии являются дугами парабол (13), которые соответствуют различным значениям параметра .

Рис. 20.1.

Аналогично при и уравнения (4) принимают вид

(20.15)

откуда следует, что

Интегрируя это уравнение, найдем семейство парабол

(20.16)

зависящее от параметра . При получим параболу

(20.17)

проходящую через начало координат. Дуга ВО параболы (17) показана на рис. 20.1. Линии являются дугами парабол (16), которые соответствуют различным значениям параметра .

Обозначим теперь через Г линию, состоящую из дуг AO и ОВ. Линия Г делит фазовую плоскость на две области и , расположенные над линией Г и под ней соответственно.

Если в начальный момент времени изображающая точка находится области например в точке , то надо принять и . Тогда изображающая точка будет двигаться по дуге параболы (16), проходящей через точку . В момент времени, когда изображающая точка попадет в точку , надо изменить управление на и . Изображающая точка будет тогда продолжать движение по дуге , по которой и придет в начало координат. Кривая , состоящая из и является оптимальной траекторией, соответствующей начальному состоянию В соответствии с теоремой о единственности оптимальной траектории в задаче о быстродействии в линейных системах [72] время движения по траектории будет наименьшим по сравнению с временем движения по любой другой траектории, ведущей из точки в начало координат.

Аналогично, если в начальный момент времени изображающая точка находится в области , например в точке , то надо принять и . Изображающая точка будет двигаться по дуге параболы (13). В точке надо переключить управление на и . Дальнейшее движение будет происходить по дуге , по которой изображающая точка придет в начало координат. Таким образом, для начального состояния оптимальной будет траектория .

Как указано выше, для задачи о быстродействии в линейных системах доказана теорема о единственности оптимальной траектории [72] выделяемой принципом максимума.

В рассматриваемом примере единственность найденной выше оптимальной траектории можно доказать непосредственно [15]. Обозначим через момент попадания изображающей точки в начало координат. Тогда время движения по траектории будет . Через обозначим момент переключения управления.

Предположим, что существует другое управление , где которое приводит систему в начало координат за время — где Траекторию, соответствующую управлению (9), обозначим по-прежнему через , а управлению — через . Таким образом, будем иметь следующие соотношения:

Траектории и определяются уравнениями движения

и соответственно

Обозначим теперь

Так как

то

Из приведенных выше соотношений следует, что

Производные по t от и будут

Так как на траектории управление удовлетворяет условиям

то

Нетрудно видеть, что для любого другого управления , где будет иметь место неравенство

Из полученных соотношений следует, что

откуда найдем, что

Таким образом,

а так как , а кроме того, , то будем иметь

С другой стороны, поскольку мы предполагали, что , то, учитывая, что , можно получить такое соотношение:

откуда следует, что

Мы получили противоречие. Следовательно, невозможно, чтобы было меньше, чем . Таким образом, доказана единственность (при ограничении оптимального управления (9) и единственность соответствующей этому управлению оптимальной траектории для заданного начального состояния системы.

Найдем теперь функцию Беллмана для рассматриваемой задачи

(20.18)

Здесь

(20.19)

есть время движения изображающей точки по оптимальной траектории из начального положения в начало координат .

Пусть в начальным момент времени изображающая точка находится в точке плоскости , то есть и являются координатами точки . Уравнение параболы, дугой которой является линия будет в соответствии с (16) иметь вид

(20.20)

Точка , в которой переключается управление, является точкой пересечения парабол (20) и (14). Ордината точки удовлетворяет соотношению

Так как дуга АО расположена ниже оси абсцисс, то надо принять

При движении изображающей точки по дуге имеют место уравнения (15). Второе из этих уравнений имеет вид

откуда, учитывая, что здесь координаты точки обозначены через , найдем

(20.22)

где — момент времени, в который переключается управление.

Из (22) следует, что

При движении изображающей точки по дуге имеет место согласно (12) уравнение

откуда следует, что

(20.24)

где — момент времени, в который изображающая точка попадает в начале координат. Из (24) найдем, что

Из (23) и (25) следует, что

В соответствии с (21) выражение (26) принимает вид

(20.27)

Выражение (27) имеет место, когда точка лежит в области то есть в любой точке фазовой плоскости над линией АОВ.

Однако нетрудно видеть, что выражение (27) сохраняется, если точка лежит на линии АО. Действительно, в этом случае и выражение (26) принимает для точек линии АО следующий вид:

что совпадает с выражением (25) для времени движения изображающей точки по дуге .

Аналогичным путем можно найти для случая, когда точка лежит в области и на линии ВО.

В случае, когда точка лежит в области , то есть в любой точке фазовой плоскости под линией АОВ, будем иметь

(20.28)

Если изображающая точка в начальный момент времени находится на линии ВО в точке то время приведения системы в начало координат будет следующим:

Из формул (28) и (27) следует, что для симметричных начальных точек и время приведения в начало координат одинаково, как это, естественно, и должно быть.

Нетрудно видеть, что в точках линии АО функции (27) и (28) принимают одинаковое значение. Действительно, так как АО является дугой параболы (14)

то в точках линии АО функция (27) принимает значение, которое, учитывая, что линия АО расположена ниже оси абсцисс, можно записать так

(20.30)

Функция (28) в точках линии АО принимает значение

(20.31)

Значения (30) и (31) совпадают. Аналогично можно показать, что значения функций (27) и (28) будут совпадать и в точках линии принимаемэе ими значение будет равно .

Таким образом, функция , которая определена в областях и соответственно выражениями (27) и (28), сохраняет непрерывность на всей фазовой плоскости .

Частные производные от функции (27) по ее аргументам будут

(20.32)

Аналогично частные производные от функции (28) будут

(20.33)

Найдем значения, которые принимают функции (32) и (33) в точке , то есть положим, что

Так как согласно (21)

то значения функций (32) в точке будут

(20.34)

Значения функций (33) в точке в которой, как на всей линии

(20.35)

Из (34) и (35) видно, что значения функций (32) и (33) на линии АО (то есть на кривой ) будут различными. На линии BO (то есть на кривой ) значения функций (32) и (33) также будут различными.

Таким образом, в точках линии АОВ функция , а, следовательно, и функция не имеют частных производных своим аргументам и .

Нетрудно убедиться в том, что оптимальные траектории, построенные в рассматриваемом здесь примере (рис. 20.1), удовлетворяют сформулированным выше (стр. 280) условиям регулярного синтеза.

Заметим при этом, что в рассматриваемом примере множество , то есть множество содержит лишь точку .

Множество , где через Г обозначена линия, состоящая из АО и ОB (то есть линия переключения управления).

Множество где D — вся фазовая плоскость .

Множество N в рассматриваемом примере является пустым. Таким образом, здесь , то есть объединение множеств и N представляет собой линию АОВ (линию переключения управления Г).

Линии АО и ОВ представляют собой две одномерные клетки первого рода. Области и , на которые линия Г разбивает фазовую плоскость, представляют собой две двумерные клетки первого рода.

Отметим еще некоторые свойства оптимальных траекторий, достаточно очевидные в рассматриваемом примере.

Рис. 20.2.

На рис. 20.2 через обозначена точка, в которой находилась момент времени , и изображена оптимальная траектория, которая ведет из точки в начало координат. Положение точки которой переключается управление) на кривой АО зависит от начального состояния системы. Так как точки кривой АО удовлетворяют соотношению (14)

то, обозначая

можно представить координаты точки на плоскости так:

Таким образом, положение точки (принадлежащей линии АО, то есть одномерной клетке первого рода) определяется лишь одним параметром , который является функцией от начального состояния системы

(20.37)

Согласно (21) и (36)

(20.38)

Равным образом и промежуток времени

(20.39)

за который система проходит из точки в точку , есть функция от начального состояния системы :

(20.40)

Согласно (23)

В соответствии с (21) это выражение принимает вид

(20.41)

Как видно из (38) и (41), функции и являются непрерывными и непрерывно дифференцируемыми функциями своих аргументов и (то есть координат вектора ).

Так как в качестве начальной точки может служить любая точка дуги оптимальной траектории в области то выражения (38) и (41) можно переписать так

(20.42)

(20.43)

Рассмотрим теперь попятное движение изображающей точки от точки к точке . Это движение мы получим, обратив время t. В соответствии с (15) попятное движение будет описываться дифференциальными уравнениями

(20.44)

Решение уравнений (44) будет следующим:

(20.45)

Так как в попятном движении начальная точка лежит на линии АО, то согласно (14)

(20.46)

Поэтому решение (45) можно привести к виду

где через обозначено

(20.48)

Так как

(20.49)

то уравнения (47) можно разрешить относительно и .

Заметим еще, что если является начальным состоянием в исходном движении (от точки к точке ), то, подставляя в (47) вместо и величины

получим

то есть если попятное движение началось (как следует из (36)) из точки , то по истечении промежутка времени изображающая точка придет в точку , как это, естественно, и должно быть.

<< Предыдущий параграф Следующий параграф >>
Оглавление