Главная > Теория автоматического управления > Автоматическое управление
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

§ 27. Многомерные случайные процессы. Оптимальные фильтры Кальмана — Бьюси

1. Системы с конечным временем наблюдения.

Рассмотрим нестационарную линейную систему

(27.1)

Здесь x — -мерный вектор состояния системы, - -мерный вектор, представляющий собой сигнал на входе системы, -мерный вектор, определяющий собой выход системы, - -матрица, -матрица, . Предполагается, что система (1) вполне наблюдаема.

Входной сигнал есть векторный случайный гауссов процесс типа белого шума с нулевым средним значением

и корреляционной матрицей

где — дельта-функция Дирака, —симметрическая, неотрицательно-определенная -матрица.

Пусть начальный момент времени , а вектор начальное состояние системы. Предполагается, что гауссова векторная случайная величина, не зависящая от с известным средним значением

и известной корреляционной матрицей

В сделанных выше предположениях и являются гауссовыми случайными процессами.

Предположим, что наблюдение вектора происходит при наличии помех типа гауссова белого шума, и поэтому наблюдаемый сигнал имеет вид

где — гауссов белый шум с нулевым средним значением

и корреляционной матрицей

где — симметрическая, положительно-определенная -матрица. Кроме того, предполагается, что и некоррелированы.

Пусть теперь требуется получить оценку состояния системы (1) по доступной измерению на отрезке времени вектор-функции . (Вектор-функции и непосредственно недоступны измерению.) Систему, которая будет определять вектор , назовем фильтром. Здесь мы ограничимся фильтрами, представляющими собой нестационарные линейные системы вида

(27.9)

где - -мерный вектор, - -матрица, -матрица. Вектор функция принимается в качестве оценки состояния исходной системы (1)

(27.10)

В соответствии с (10) ошибка оценки будет иметь следующий вид:

(27.11)

Вектор-функция может быть названа ошибкой фильтра.

К фильтру (9) предъявим следующие требования: вектор-функция должна представлять собой несмещенную оценку и при этом должна минимизировать дисперсию ошибки (точнее, минимизировать некоторый функционал, зависящий от корреляционной матрицы векторного случайного процесса ). Из этих требований и надлежит выбрать матрицы и и начальное состояние фильтра .

Найдем сначала дифференциальное уравнение, которому удовлетворяет вектор-функция . Согласно (11), (1), (9) и (6) будем иметь

(27.12)

Для того чтобы вектор-функция была несмещенной оценкой , должно выполняться условие

(27.13)

откуда согласно (11) будем иметь

(27.14)

(27.15)

Учитывая, что согласно (2) и (7) , и заменяя левую и правую части дифференциального уравнения (12) их математическими ожиданиями, получим в соответствии с (14) и (15) следующее соотношение:

(27.16)

Так как , то условие (16) несмещенности оценки принимает вид

(27.17)

Таким образом, входящие в уравнение фильтра (9) матрицы и должны удовлетворять соотношению

(27.18)

Начальное состояние фильтра в соответствии с (13) и (4), должно быть следующим:

(27.19)

При выполнении условий (18) и (19) вектор-функция будет несмещенной оценкой состояния исходной системы (1) для всех .

Таким образом, фильтр, обеспечивающий несмещенность оценки будет описываться дифференциальным уравнением

(27.20)

Фильтры, описываемые уравнением (20), содержат в качестве параметра матрицу . Выбор матрицы должен быть сделан из указанного выше условия минимизации дисперсии ошибки .

Укажем теперь критерий качества фильтра. Предварительно заметим, что так как согласно (14) , то корреляционная матрица ошибки будет иметь вид

(27.21)

Матрица является симметрической матрицей. Начальное значение матрицы будет следующим:

или согласно (5)

(27.22)

Матрица , как указано выше, предполагается известной. Рассмотрим функционал

(27.23)

где T — некоторый фиксированный момент времени, — симметрическая, положительно-определенная -матрица. Так как скалярное произведение двух -мерных векторов а и b равно следу -матрицы то есть сумме элементов, расположенных на ее главной диагонали

то выражение (23) можно записать так:

или в соответствии с (21)

(27.24)

Мерой качества фильтра (20) примем функционал (24). Матрица в дифференциальном уравнении (20) должна быть выбрана так, чтобы доставить минимум функционалу (24). Фильтр, удовлетворяющий этому условию, будем называть оптимальным фильтром.

Найдем теперь дифференциальное уравнение, которому удовлетворяет корреляционная матрица .

Дифференциальное уравнение (12), которому удовлетворяет вектор-функция в соответствии с (17) и (18), принимает вид

(27.25)

Так как согласно (21)

то

или в соответствии с (25)

(27.26)

Учитывая (21), можно уравнение (26) переписать так:

(27.27)

Заметим теперь, что согласно (2), (7), (14)

Согласно (11) и (19)

(27.28)

Так как предполагается, что и независимы (некоррелирован , то отсюда следует

(27.29)

Обозначим теперь через следующую -матрицу

(27.30)

где - фундаментальная матрица решений однородного дифференциального уравнения

(27.31)

Решение дифференциального уравнения (25) будет иметь следующий вид:

(27.32)

В соответствии с (32), (29), (3) и (8) будем иметь

(27.33)

(27.34)

Аналогично

(27.35)

(27.36)

В соответствии с (27), (33) — (36) и (22) матрица будет определяться следующим дифференциальным уравнением и начальным условием:

(27.37)

Так как матрицы и заданы, то параметром, от которого завидит решение задачи Коши (37), будет являться матрица . Таким образом, и значение функционала (24)

будет вависеть от матрицы , как от параметра.

Матрица , доставляющая минимум функционалу (24), будет оптимальной, а фильтр (20), у которого будет оптимальным фильтром.

В исходной работе Калмана — Бьюси [37] для построения оптимального фильтра были применены методы функционального анализа. Ниже излагается другой метод решения задачи [5].

Если считать совокупность элементов

матрицы состоянием системы (37), а элементы матрицы G — приложенными к системе (37) управлениями, то мы придем, как это показал М. Атанс [5], к одной из детерминированных задач оптимального управления, в которой требуется выбрать управления так, чтобы они доставляли минимум функционалу (24), причем в этой задаче время Т закреплено, а конец траектории свободен. Указанная задача можег быть решена при помощи принципа максимума Л. С. Понтрягина.

Аналогично (24.5) оптимальное управление должно доставлять минимум функции

(27.38)

где через обозначена -матрица, элементы которой являются аналогично (24.4) вспомогательными переменными в задаче с закрепленным временем и свободным концом траектории.

В соответствии с (37) выражение (38) можно преобразовать к виду

(27.39)

Обратимся теперь к выводу некоторых вспомогательных соотношений, которые потребуются ниже.

1) Рассмотрим матрицу , где a — -матрица, b — -матрица, x — -матрица. Найдем след этой матрицы , а также частные производные от по , где — элементы матрицы x.

Обозначим

Элементы матриц будут

Отсюда

или

След матрицы будет иметь следующий вид:

(27.40)

Из выражения (40) найдем

(27.41)

Прямоугольную -матрицу, элементами которой являются обозначим через .

Обозначим теперь через q следующую -матрицу:

(27.42)

где

(27.43)

Элементы -матриц и будут

Элементы -матриц и будут

или

(27.44)

В соответствии с (42) и (44)

(27.45)

Как следует из выражений (41) и (45),

(27.46)

Таким образом, имеет место соотношение

(27.47)

2) Рассмотрим теперь -матрицу

где -матрица, - -матрица. Так как

то

Таким образом,

(27.48)

3) Пусть теперь -матрица, - -матрица. Рассмотрим -матрицу

Так как

то

и следовательно,

(27.49)

4) Рассмотрим еще некоторые тождества. Пусть -матрица, а - -матрица. Обозначим через и следующие матрицы:

Так как

(27.50)

то имеет место тождество

5) Аналогично пусть и -матрицы. Обозначим через и матрицы:

Так как

то имеет место тождество

При помощи формул (47)-(51) нетрудно найти -матрицу и -матрицу . В соответствии с (38) будем иметь

(27.52)

(27.53)

Условия, необходимые для того, чтобы управления доставляли функции минимум, имеют вид

(27.54)

Система скалярных соотношений (54) эквивалентна матричному соотношению

(27.55)

В соответствии с (52) условие (55) принимает вид

(27.56)

Аналогично (24.6) вспомогательные переменные согласно принципу максимума Л. С. Понтрягина удовлетворяют следующей системе дифференциальных уравнений:

эквивалентной матричному дифференциальному уравнению

(27.58)

В соответствии с (53) уравнение (58) принимает вид

(27.59)

В соответствии с (24) граничные значения вспомогательных переменных в рассматриваемой здесь задаче аналогично (24.68) будут

(27.60)

что в матричном записи можно представить так:

(27.61)

Согласно (48)

(27.62)

Так как — симметрическая, положительно-определенная матрица, то , и, следовательно,

(27.63)

Таким образом, -матрица является симметрической, положительно-определенной матрицей.

Транспонируя левую и правую части уравнения (59), получим следующее уравнение:

(27.64)

Так как — симметрическая матрица, то согласно (63) граничное условие будет следующим:

(27.65)

Из сравнения уравнения (59) и граничного условия (63) с уравнением (64) и граничным условием (65) видно, что дифференциальные уравнения и граничные условия, которым удовлетворяют и , совпадают и, следовательно, в силу теоремы единственности

(27.66)

то есть является симметрической матрицей. Покажем еще, что — положительно-определенная матрица. Обозначая через и -матрицы

(27.67)

можно преобразовать матричное уравнение (59) к следующему виду:

(27.68)

Пусть - -матрица, удовлетворяющая матричному дифференциальному уравнению

(27.69)

Пусть элементы матрицы , а следовательчо» и матрицы -ограниченные, кусочно-непрерывные функции на отрезке . Тогда, как известно, решение уравнения (69) может быть представлено в виде матрицанта [17], то есть абсолютно и равномерно сходящегося ряда

где

Матрицант обладает свойством [17]

и, следовательно, является неособой матрицей.

Через обозначим -матрицу, удовлетворяющую матричному дифференциальному уравнению

(27.71)

Аналогично (70)

(27.72)

то есть матрица является неособой.

Решение дифференциального уравнения (68) будет иметь вид

(27.73)

в справедливости чего можно убедиться непосредственной подстановкой. Из (73) следует, что

(27.74)

Так как согласно (63) , то есть является , положительно-определенной матрицей, то

и в силу (70) и (72) из соотношения (74) следует, что

Из соотношения (73) тогда вытекает, что

(27.75)

Так как согласно (67) , то в силу уравнений (69) и (71) , и выражение (73) принимает вид

(27.76)

Из (76), (75) и (66) следует, что матрица , удовлетворяющая дифференциальному уравнению (59) и граничному условию (63), , симметрической положительно-определенной матрицей.

Учитывая, что и являются симметрическими матрицами, можно представить необходимое условие (56) минимума функции в следующем виде:

(27.77)

Так как согласно (75) является неособой матрицей, то соотношение (77) может иметь место лишь при выполнении условия

(27.78)

Матричное уравнение (78), в котором неизвестной является матрица , имеет единственное решение

(27.79)

Матрица , определяемая выражением (79), и представляет собой оптимальное управление, доставляющее минимум функционалу (24).

Подставляя в дифференциальное уравнение (37) значение согласно (79), приведем это уравнение к виду

(27.80)

(27.81)

В работах Калмана [34, 35] показано, что в случае, когда — неотрицательно-определенная матрица, уравнение (80) имеет единственное решение, которое существует для всех .

Согласно (20) и (79) дифференциальное уравнение оптимального фильтра будет иметь следующий вид:

(27.82)

где — решение дифференциального уравнения Риккати (80), удовлетворяющее начальному условию (81).

Решение дифференциального уравнения (82) представляет собой несмещенную оптимальную оценку состояния системы (1).

Сделаем еще следующие замечания. Уравнение (82) можно представить в виде

(27.83)

где согласно (6) и (11)

(27.84)

Таким образом, оптимальный фильтр представляет собой систему с обратной связью, сигнал на входе которой состоит из зависящей от рассогласования функции и аддитивной помехи в виде белого шума .

Из дифференциального уравнения (80) и выражения (79) видно, что матрицы и не зависят от входящего в функционал (23) значения Т конца отрезка времени , на котором ведется наблюдение. От значения Т зависит лишь матрица определяемая дифференциальным уравнением (59) и граничным условием (63). Однако при определении матрицы из условия (56) потребовалось лишь свойство симметричности и невырожденности матрицы . Это позволяет заключить, что оптимальный фильтр (82) доставляет равномерно по t несмещенную оптимальную оценку состояния системы (1).

Как следует из (79), (80) и (81), оптимальный фильтр не зависит от конкретного вида матрицы . Однако предположение о том, что — симметрическая положительно-определенная матрица, весьма существенно, так как только при этом, как видно из (63), (74) и (76), будет положительно-определенной матрица . Выражение (79) для матрицы G получено из условия и определяет собой единственное экстремальное значение функции Симметрическая матрица типа , элементами которой являются частные производные , может быть представлена в виде симметрической блочной матрицы S типа , элементы которой имеют вид , где — элементы матрицы R. Можно показать, что матрица будет положительно-определенной матрицей лишь в случае, когда является положительно-определенной матрицей.

Следующее доказательство этого утверждения принадлежит А. М. Формальскому. Пусть - -матрица, удовлетворяющая условию , где — единичная матрица типа . Тогда

Обозначим через N -матрицу, удовлетворяющую условию , где Е — единичная матрица типа , будем иметь

что и доказывает сделанное выше утверждение.

Из изложенного видно, что только при условии, что — положительно-определенная матрица, функция имеет минимум при значении (79) матрицы G.

Таким образом, матрица G, определяемая выражением (79), доставляет функции минимум и, следовательно, удовлетворяет необходимым условиям оптимальности для функционалов вида (23) лишь при условии, что -определенная матрица.

Отметим, что управление (79) удовлетворяет не только необходимым, но и достаточным условиям оптимальности, что можно доказать, как и в § 24, рассмотрением для данной задачи уравнения Беллмана, аналогичного уравнению (24.46).

Аналогично (24.42) покажем теперь, как матрица , являющаяся решением дифференциального уравнения Риккати (80) при начальном условии (81), может быть выражена при помощи фундаментальной матрицы решений следующей системы линейных векторных дифференциальных уравнений:

(27.85)

где и -мерные векторы.

Нетрудно проверить, что из (85) вытекает соотношение

(27.86)

где -решение уравнения Риккати (80). Действительно, в соответствии с (86) второе уравнение (85) принимает вид

(27.87)

Подставляя в уравнение (87) вместо празую часть первого уравнения (85) и учитывая (86), получим следующее соотношение:

(27.88)

Соотношение (88) удовлетворяется тождественно в силу дифференциального уравнения Риккати (80), которым определена матрица . Это и доказывает справедливость соотношения (86).

Фундаментальную матрицу решений системы векторных дифференциальных уравнений (85) обозначим через . Через обозначим -матрицу

(27.89)

Решение системы векторных уравнений (85) будет следующим:

(27.90)

Представляя -матрицу в виде блочной матрицы, элементы которой являются -матрицами

(27.91)

получим из (90) следующие соотношения:

Так как согласно (86) и (81)

(27.93)

то в соответствии с (86) и (92) будем иметь

(27.94)

откуда следует, что

(27.95)

<< Предыдущий параграф Следующий параграф >>
Оглавление