Тема «Математическая теория оптимального управления»
Постановка задачи теории оптимального управления.
Условия оптимальности (по Понтрягину).
1.Постановка задачи теории оптимального управления
Предметом математической теории оптимального управления является методы решения задач, в которых учитываются изменения изучаемых объектов и систем во времени и пространстве при поиске оптимального управления.
Рассмотрим динамический объект, состояние которого в каждый момент времени t описывается несколькими величинами , которые называются фазовыми координатами, т.е. имеем вектор . Пример, положение самолета как твердого тела в пространстве полностью определяет шестимерная вектор-функция времени. Три координаты определяют положение центра масс, а три – определяют вращение вокруг центра масс.
Объектом можно управлять изменяя управляемые параметры ). Состояние объекта изменяется во времени по закону, который связывает функции и :
, (*)
где t- время;
- вектор состояния;
- вектор управления;
- некоторая заданная функция, непрерывная вместе со своими частными производными.
Это система обыкновенных дифференциальных уравнений в векторной форме. Она описывает скорость изменения каждой фазовой координаты.
Управление объектом происходит за интервал времени , поэтому параметр .
На управление обычно накладываются условия
,
где - множество допустимых управлений;
- функции кусочно-непрерывные, т.е. имеют конечное число разрывов первого рода.
Начальное состояние объекта задается функцией .
Критерий качества управления объектом имеет вид (задача Больца):
,
где и - заданные непрерывно – дифференцируемые функции.
Интегральная часть критерия качества (первое слагаемое) характеризует качество функционирования объекта за весь период управления . Терминальный член (второе слагаемое) характеризует только конечный результат воздействия управления.
Если в задаче моменты времени и известны, то она называется задачей с фиксированным временем. Иначе, это задача с нефиксированным моментом начала и окончания управления.
В задаче необходимо найти такое решение , что ,
где - оптимальный момент окончания процесса;
- оптимальная траектория;
- оптимальное управление.
Или
Задача Лагранже (интегральный критерий).
Рассмотрим ситуацию, когда функционал качества имеет вид
.
Пусть - новая переменная, тогда (**).
Тогда задача нахождения минимума критерия качества становится задачей определения минимума фазовой координаты в момент времени расширенного векторного пространства по отношению к управлению u.
На конечное положение объекта могут накладываться ограничения вида:
, (***),
где - дифференцируемые функции.
Воспользуемся методом множителей Лагранжа и составим функцию:
,
где - неопределенные множители Лагранжа .
Итак, необходимо найти , при котором функционал будет оптимален.
2.Условия оптимальности (по Понтрягину)
Понтрягин и его ученики открыли принцип максимума, который связал оптимизируемый функционал с динамикой процесса, и решили задачу Лагранжа (интегральный критерий).
Была построена функция Гамильтона (или функция Понтрягина) вида:
,
где - правые части уравнений (*) и (**).
Вспомогательные функции удовлетворяют уравнению: для условий (***)
=
=, ;
.
Принцип максимума: для оптимального управления и соответствующих координат , обеспечивающих минимальное значение , функция Гамильтона имеет максимум по отношению к управлению на всем интервале . (это необходимое условие для нелинейных объектов; а также необходимое и достаточное условие оптимальности для линейных объектов).
Таким образом, задача определения оптимального управления становится задачей нахождения максимума функции относительно для любого момента времени .