Главная > Теория автоматического управления > Системы управления морскими подвижными объектами
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

5.2. Эквивалентная детерминированная задача и ее решение

Задача синтеза СУД МПО, сформулированная в (5.1), является стохастической, так как при случайных внешних возмущениях переменные и управления представляют собой также случайные функции времени, а оценка качества работы системы проводится по дисперсионному критерию. Однако при стационарном случайном процессе в системе, линейной модели ее неизменяемой части и линейном операторе обратных связей может быть сформулирована эквивалентная детерминированная задача. Смысл ее заключается в том, что оптимизация линейной системы, подверженной детерминированным возмущениям, при среднеквадратичном критерии качества приводит к тем же результатам, что и решение стохастической задачи. Необходимо только согласовать вид детерминированного возмущения со случайным и обеспечить равенство матриц весовых множителей дисперсионного и среднеквадратичного критериев.

При объяснении эквивалентной детерминированной задачи исходим из известного положения (3.5), что скалярный сигнал, описываемый случайной стационарной эргодической центрированной функцией , можно рассматривать как результат преобразования сигнала вида единичный белый шум линейным фильтром, амплитудно-фазовая характеристика (АФХ) которого определяется по спектральной плотности из условия .

Рис. 5.1. К эквивалентной детерминированной задаче.

Дальнейшее преобразование этого сигнала определяется математической моделью системы. Если АФХ системы для фазовой координаты по воздействию (рис. 5.1) обозначить , то АФХ всего пути от источника белого шума до будет . Поэтому при ционарном процессе в системе спектральная плотность фазовой координаты имеет вид , а автокорреляционную функцию определяют соотношением [8]:

где - импульсная характеристика пути белый шум координата связанная с обратным преобразованием Фурье,

Дисперсия фазовой координаты равняется начальному значению автокорреляционной функции

Используя аналогичные выражения для дисперсий сигналов управления, получаем возможность представить дисперсионный критерий в виде

Из (5.9) следует совпадение результатов расчета критерия качества по дисперсиям переменных состояния и сигналов управления, когда в линейной системе имеет место случайный стационарный эргодический центрированный процесс, и по их квадратичным отклонениям, проинтегрированным на бесконечном временном интервале при детерминированном процессе в той же системе. Эта эквивалентность стохастической и детерминированной задач для одной и той же линейной системы наблюдается, если случайный процесс возбуждается единичным белым шумом на входе формирующего фильтра, а соответствующий ему детерминированный процесс единичной импульсной функцией Дирака. Сама же линейная система в первом случае подвергается случайному воздействию со спектральной плотностью, определяемой амплитудно-фазовой характеристикой фильтра. Во втором случае на линейную систему действует детерминированное воздействие, которое определяется импульсной характеристикой фильтра, рассчитываемое по той же амплитудно-фазовой характеристике с помощью обратного преобразования Фурье:

Изложенное можно сформулировать в виде такого утверждения. Результаты оптимизации линейной системы, подверженной случайному стационарному эргодическому воздействию и оцениваемой по дисперсионному критерию, совпадают с результатами оптимизации той же системы при детерминированном воздействии и среднеквадратичном критерии качества, если случайное и детерминированное воздействия согласны по виду передаточной функции формирующего фильтра, а также если в критериях равны между собой весовые матрицы.

Это утверждение на основе принципа наложения можно распространить на случай векторного воздействия если его составляющие некоррелированы между собой.

Итак, чтобы синтезировать линейную систему, т. е. определить оператор и в классе линейных функций, нет необходимости минимизировать дисперсионный критерий

, который оценивает движение линейного объекта

при случайных возмущениях . Достаточно решить эквивалентную детерминированную задачу, которая заключается в минимизации среднеквадратичного критерия

при движении системы

под влиянием эквивалентного детерминированного возмущения определенного на основании (5.10).

Пример 5.1. На МПО действует возмущение, определяемое поперечной составляющей приведенного угла волнового склона , которая является случайной

Соответствующее эквивалентное детерминированное возмущение .

При формулировке эквивалентной детерминированной задачи особое значение имеет аппроксимация спектральных характеристик случайных внешних возмущений. Удобно выделить два случая.

В первом случае принимаем, что спектр возмущений значительно шире полосы пропускания объекта. Тогда можно предположить, что это воздействие имеет характеристики единичного белого шума , а эквивалентное детерминированное возмущение равно импульсной функции Дирака . Поведение объекта при этом определяется решением уравнения (5.12) при и ненулевых начальных условиях .

Во втором случае рассматриваем возмущение со спектрами, которые целиком расположены в полосе пропускания МПО и могут быть аппроксимированы дробно-рациональными функциями. Соответствующие передаточные функции формирующих фильтров являются положительными вещественными функциями вида

а эквивалентное детерминированное возмущение согласно обратному преобразованию Лапласа

где - однократные полюса, которые либо вещественны, либо попарно сопряжены. Оптимизация системы в этом случае определяется полным решением неоднородных уравнений (5.12) при возмущениях (5.13) и нулевых начальных условиях.

Эквивалентную детерминированную задачу решают методами теории оптимальных процессов. Для этой цели удобно использовать принцип максимума Л. С. Понтрягина, отличающийся общностью и математической простотой.

Принцип максимума позволяет решать задачи оптимизации движения динамического объекта с математической моделью

при перемещении его из состояния в путем выбора управления принадлежащего ограниченной области которое обеспечивает минимизацию функционала

где и - векторы состояния и управления размерности соответственно, нелинейная векторная функция; - произвольная скалярная функция.

Суть принципа максимума заключается в следующем:

1. Управление оказывается оптимальным, если оно обеспечивает максимальное значение скалярного произведения двух векторов, первый из которых формируется скоростями изменения состояния объекта и минимизируемого функционала, а второй представляет собой вспомогательный или сопряженный вектор . Это скалярное произведение

называют функцией Гамильтона.

Обратим внимание на то обстоятельство, что приближение к максимуму функции Гамильтона соответствует векторов и так как их скалярное произведение при , т. е. когда угол между этими векторами стремится к нулю. Это дает основание трактовать вспомогательный (сопряженный) вектор как вектор скорости оптимального движения системы, учитывая, что вектор является вектором скорости ее реального движения.

2. Вспомогательный вектор определяется сопряженной системой дифференциальных уравнений, формируемой по условию

или в векторной форме

Кроме компонент вектора в (5.15) и (5.16) присутствует переменная которая является сопряженной по отношению к критерию качества. Если (5.14) представить в дифференциальной форме

то критерий можно рассматривать как дополнительную компоненту вектора состояния . В связи с тем, что в явной форме не содержит из условия (5.16) следует или . В частности, можно принять . При этом функция Гамильтона

Необходимое условие экстремума оптимального управления согласно принципу максимума

.

Чтобы экстремум был максимумом по отношению к и, матрица размером должна быть отрицательно определенной.

<< Предыдущий параграф Следующий параграф >>
Оглавление