Главная > Теория автоматического управления > Автоматическое управление
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

2. Задача с закрепленным концом траектории и свободным временем.

Управляемую систему, описываемую дифференциальными уравнениями

(14.22)

которым эквивалентно векторное уравнение

(14.23)

где и — векторы следующего вида:

требуется перевести из точки фазового пространства X в заданную точку . Момент времени , в который изображающая точка попадет в точку , заранее не фиксируется. Управление должно удовлетворять ограничениям

(14.24)

и его надо выбрать так, чтобы функционал

(14.25)

принимал наименьшее возможное значение.

Удовлетворяющее этим условиям управление, соответствующую ему траекторию и промежуток времени будем считать оптимальными.

Полученное при указанных выше условиях наименьшее возможное значение функционала Q будет функцией от начального состояния системы

В предположении, что функция Ф непрерывна и всюду имеет непрерывные частные производные по всем своим аргументам, можно получить уравнение в частных производных (уравнение Беллмана), которому эта функция удовлетворяет.

По определению

(14.27)

Интеграл в правой части (27) можно представить в виде

(14.28)

Для малых значений выражение (28) можно переписать так:

(14.29)

где предполагается, что функция непрерывна на полуинтервале . Выражение (27) принимает вид

(14.30)

Необходимость знака перед всей квадратной скобкой в (30) обосновывается теми же рассуждениями, которые были изложены при выводе соотношения (12).

Второе слагаемое в квадратных скобках в выражении (30) есть , и выражение (30) можно переписать так:

(14.31)

Поскольку согласно (23)

(14.32)

то, при сделанном выше предположении относительно гладкости функции , будем иметь

(14.33)

Подставим теперь выражение (33) в (31). Учитывая, что функция , полученная в результате минимизации функционала (25), уже не содержит а, можно вынести за знак в выражении (31). Тогда получим

(14.34)

В качестве начального состояния можно принять любое текущее состояние и переписать соответственно соотношение (34)

(14.35)

Поскольку , то, переходя в (35) к пределу при , получим

(14.36)

Уравнение (36) и является уравнением Беллмана в рассматриваемой здесь задаче с закрепленным концом траектории и свободным временем.

<< Предыдущий параграф Следующий параграф >>
Оглавление