"Принцип Максимума" Понтрягина — страница 2

  • Просмотров 14876
  • Скачиваний 1522
  • Размер файла 84
    Кб

фазовые координаты Ограничения на концах траектории целесообразно рассматривать отдельно: здесь R, причем inf o<.T. Таким образом, начальный и конечный моменты времени не обязательно фиксированы. Случаю фиксированных to, Т соответствуют множества закрепленным временем. Если So (to) = {закрепленным. Если же So (to) == R" при всех свободным. Во всех остальных случаях левый конец называют подвижным. В аналогичных ситуациях говорят о

закрепленном, свободном или подвижном правом конце траектории. Цель управления в задаче оптимального управления состоит в минимизации некоторого функционала на множестве допустимых наборов. Если каждой функции y=f(x) определенного класса ставится в соответствии по некоторому закону определенное числовое значение переменной I, то эту переменную называют функционалом от одной функциональной переменной I=I[y]=I[y(x)]=I[f(x)]. Наиболее

часто под задачами управления понимаются задачи, в которых роль функционала выполняет интегральный функционал Мы будем рассматривать задачу с целевым функционалом представляющим собой сумму интегрального функционала  и терминального функционала Ф(х(Т), Т). Эта задача называется задачей Больца. Ее частными случаями являются задача с интегральным функционалом, называемая задачей Лагранжа, и задача с терминальным

функционалом, называемая задачей Майера. Задача с интегральным функционалом при оптимального быстродействия. Набор (to, Т, хрешением задачи оптимального управления, управление и - оптимальным управлением, а траектория х - оптимальной траекторией. Часто решением задачи оптимального управления называют пару (ц, х). Принцип максимума Понтрягина. Эффективным средством исследования задач оптимального управления является

принцип максимума Понтрягина, представляющий собой необходимое условие оптимальности в таких задачах. Формулировка принципа максимума. Рассмотрим задачу оптимального управления, являющуюся частным случаем задачи, сформулированной выше , где (2.2) При этом предполагается, что моменты to, Т фиксированы, т. е. рассматривается задача с закрепленным временем; множество U не зависит от времени, фазовые ограничения отсутствуют.

Положим где  Функция Н называется функцией Гамильтона. Система линейных дифференциальных уравнений сопряженной системой, соответствующей управлению и и траектории х. Здесь  >В более подробной покоординатной записи сопряженная система принимает вид Система (2.3) имеет при любых начальных условиях единственное решение Следующая теорема выражает необходимые условия оптимальности в задаче (2.1). Теорема (принцип