Math-Net.Ru
Общероссийский математический портал
А. С. Булдаев, Новый подход к оптимизации управляемых систем на основе краевых задач, Автомат. и телемех. , 2011, выпуск 6, 87–94
Использование Общероссийского математического портала Math-Net.Ru подразумевает, что вы прочитали и согласны с пользовательским соглашением
http://www.mathnet.ru/rus/agreement Параметры загрузки:
IP: 139.59.245.186
6 ноября 2022 г., 02:00:08
Автоматика и телемеханика,№ 6, 2011
⃝c 2011 г. А.С. БУЛДАЕВ, д-р физ.-мат. наук (Бурятский государственный университет, Улан-Удэ)
НОВЫЙ ПОДХОД К ОПТИМИЗАЦИИ УПРАВЛЯЕМЫХ СИСТЕМ НА ОСНОВЕ КРАЕВЫХ ЗАДАЧ1
Для нелокального улучшения управления в линейных по управлению си- стемах конструируется специальная дифференциально-алгебраическая краевая задача. На основе краевой задачи улучшения формулируется новое необходимое условие оптимальности, усиливающее принцип максимума. Приводятся приме- ры строгого улучшения управлений, удовлетворяющих принципу максимума, с помощью решения предложенной краевой задачи.
1. Введение
В [1, 2] в классах линейных и полиномиальных по состоянию задач оптималь- ного управления были построены методы нелокального улучшения, основанные на нестандартных формулах приращения функционала без остаточных членов разло- жений. Отсутствие операции слабого или игольчатого варьирования управлений на каждой итерации и возможность улучшения управлений, удовлетворяющих принци- пу максимума, обуславливают повышенную эффективность построенных методов.
В [3] разработана процедура нелокального улучшения управлений в линейно управляемых полиномиальных по состоянию системах, основанная на свойствах опе- рации проектирования. Платой за нелокальность улучшения является решение диф- ференциальных краевых задач, которые значительно проще краевой задачи принци- па максимума по свойствам гладкости. В [4] предложен новый подход к нелокально- му улучшению управлений в нелинейных по состоянию системах общего вида на ос- нове дифференциально-краевых задач. В данной работе разработанный в [3] подход для улучшения линейно управляемых систем модифицируется с учетом построения дифференциально-алгебраических краевых задач по аналогии с [4].
2. Краевая задача улучшения Рассматривается задача оптимального управления
Φ(𝑢) =𝜑(𝑥(𝑡1)) +
∫
𝑇
(⟨𝑎(𝑥(𝑡), 𝑡), 𝑢(𝑡)⟩+𝑑(𝑥(𝑡), 𝑡))𝑑𝑡→min
𝑢∈𝑉, (1)
˙
𝑥(𝑡) =𝐴(𝑥(𝑡), 𝑡)𝑢(𝑡) +𝑏(𝑥(𝑡), 𝑡), 𝑥(𝑡0) =𝑥0, 𝑢(𝑡)∈𝑈, (2)
где 𝑥(𝑡) = (𝑥1(𝑡), . . . , 𝑥𝑛(𝑡)), 𝑢(𝑡) = (𝑢1(𝑡), . . . , 𝑢𝑚(𝑡))– векторы состояния и управ- ления соответственно,𝑡∈𝑇 = [𝑡0, 𝑡1]. В качестве допустимых управлений рассмат- ривается класс𝑉 кусочно-непрерывных на 𝑇 функций со значениями в выпуклом множестве𝑈 ⊆𝑅𝑚. Начальное состояние𝑥0 и отрезок𝑇 заданы.
1 Работа выполнена при финансовой поддержке Российского фонда фундаментальных иссле- дований (проекты №№ 08-01-00945-а, 09-01-90203-Монг_а) и Российского гуманитарного научного фонда (проект № 09-02-00493-а).
Предполагаются выполненными стандартные условия:
1) функция 𝜑(𝑥) непрерывно дифференцируема в 𝑅𝑛, функции 𝐴(𝑥, 𝑡), 𝑏(𝑥, 𝑡), 𝑎(𝑥, 𝑡),𝑑(𝑥, 𝑡)и их производные по𝑥непрерывны по совокупности аргументов(𝑥, 𝑡) на𝑅𝑛×𝑇;
2) функции 𝐴(𝑥, 𝑡), 𝑏(𝑥, 𝑡) удовлетворяют условию Липшица по 𝑥 на 𝑅𝑛×𝑇 с константой𝐿 >0.
Поставим задачу улучшения заданного управления 𝑢0 ∈ 𝑉: найти управление 𝑣∈𝑉 с условиемΦ(𝑣)⩽Φ(𝑢0).
Функция Понтрягина с сопряженной переменной𝑝∈𝑅𝑛 в задаче (1), (2) имеет вид
𝐻(𝑝, 𝑥, 𝑢, 𝑡) =𝐻0(𝑝, 𝑥, 𝑡) +⟨𝐻1(𝑝, 𝑥, 𝑡), 𝑢⟩, где введены обозначения:
𝐻0(𝑝, 𝑥, 𝑡) =⟨𝑝, 𝑏(𝑥, 𝑡)⟩ −𝑑(𝑥, 𝑡), 𝐻1(𝑝, 𝑥, 𝑡) =𝐴T(𝑥, 𝑡)𝑝−𝑎(𝑥, 𝑡), 𝐴T– транспонированная к𝐴 матричная функция.
Для заданного параметра 𝛼 > 0 и допустимого управления 𝑢∈ 𝑉 рассмотрим проекционное отображение
𝑢𝛼(𝑝, 𝑥, 𝑡) =𝑃𝑈(𝑢(𝑡) +𝛼𝐻1(𝑝, 𝑥, 𝑡)), 𝑝∈𝑅𝑛, 𝑥∈𝑅𝑛, 𝑡∈𝑇, где𝑃𝑈 – оператор проектирования на множество𝑈 в евклидовой норме.
Согласно известному свойству проекции имеем
⟨𝐻1(𝑝, 𝑥, 𝑡), 𝑢𝛼(𝑝, 𝑥, 𝑡)−𝑢(𝑡)⟩⩾ 1
𝛼∥𝑢𝛼(𝑝, 𝑥, 𝑡)−𝑢(𝑡)∥2. (3)
С помощью отображения𝑢𝛼принцип максимума в задаче (1), (2) для управления 𝑢∈𝑉 представляется в форме условия
𝑢(𝑡) =𝑢𝛼(𝜓(𝑡, 𝑢), 𝑥(𝑡, 𝑢), 𝑡), 𝑡∈𝑇, 𝛼 >0, (4)
где 𝑥(𝑡, 𝑢), 𝑡 ∈ 𝑇, – решение системы (2) для допустимого управления𝑢(𝑡), 𝑡 ∈ 𝑇; 𝜓(𝑡, 𝑢),𝑡∈𝑇, – решение стандартной сопряженной системы:
𝜓(𝑡) =˙ −𝐻𝑥(𝜓(𝑡), 𝑥(𝑡), 𝑣(𝑡), 𝑡), 𝜓(𝑡1) =−𝜑𝑥(𝑥(𝑡1)) при𝑥(𝑡) =𝑥(𝑡, 𝑢), 𝑣(𝑡) =𝑢(𝑡), 𝑡∈𝑇.
Для допустимых управлений𝑢0,𝑣 обозначим приращение Δ𝑥(𝑡) =𝑥(𝑡, 𝑣)−𝑥(𝑡, 𝑢0), 𝑡∈𝑇.
Пусть дифференцируемая функция𝑝(𝑡),𝑡∈𝑇, удовлетворяет дифференциально- алгебраической сопряженной системе:
˙
𝑝(𝑡) =−𝐻𝑥(𝑝(𝑡), 𝑥(𝑡, 𝑢0), 𝑢0(𝑡), 𝑡)−𝑟(𝑡),
𝐻(𝑝(𝑡), 𝑥(𝑡, 𝑣), 𝑢0(𝑡), 𝑡)−𝐻(𝑝(𝑡), 𝑥(𝑡, 𝑢0), 𝑢0(𝑡), 𝑡) =
= ⟨𝐻𝑥(𝑝(𝑡), 𝑥(𝑡, 𝑢0), 𝑢0(𝑡), 𝑡),Δ𝑥(𝑡)⟩+⟨𝑟(𝑡),Δ𝑥(𝑡)⟩, с краевыми условиями:
𝑝(𝑡1) =−𝜑𝑥(𝑥(𝑡1, 𝑢0))−𝑞,
𝜑(𝑥(𝑡1, 𝑣))−𝜑(𝑥(𝑡1, 𝑢0)) =⟨𝜑𝑥(𝑥(𝑡1, 𝑢0)),Δ𝑥(𝑡1)⟩+⟨𝑞,Δ𝑥(𝑡1)⟩,
где величины𝑟(𝑡), 𝑞определяются указанными алгебраическими соотношениями.
Тогда в соответствии с [4] приращение функционала в задаче (1), (2) для допу- стимых управлений𝑢0,𝑣 принимает вид
Φ(𝑣)−Φ(𝑢0) =−
∫
𝑇
⟨𝐻1(𝑝(𝑡), 𝑥(𝑡, 𝑣), 𝑡), 𝑣(𝑡)−𝑢0(𝑡)⟩𝑑𝑡.
(5)
Формула (5) не содержит остаточных членов каких-либо разложений.
Рассмотрим дифференциально-алгебраическую краевую задачу:
˙
𝑥(𝑡) =𝐴(𝑥(𝑡), 𝑡)𝑢𝛼(𝑝(𝑡), 𝑥(𝑡), 𝑡) +𝑏(𝑥(𝑡), 𝑡), 𝑥(𝑡0) =𝑥0, (6)
˙
𝑝(𝑡) =−𝐻𝑥(𝑝(𝑡), 𝑥(𝑡, 𝑢0), 𝑢0(𝑡), 𝑡)−𝑟(𝑡), 𝑝(𝑡1) =−𝜑𝑥(𝑥(𝑡1, 𝑢0))−𝑞, (7)
𝐻(𝑝(𝑡), 𝑥(𝑡), 𝑢0(𝑡), 𝑡)−𝐻(𝑝(𝑡), 𝑥(𝑡, 𝑢0), 𝑢0(𝑡), 𝑡) =
= ⟨𝐻𝑥(𝑝(𝑡), 𝑥(𝑡, 𝑢0), 𝑢0(𝑡), 𝑡), Δ𝑥(𝑡)⟩+⟨𝑟(𝑡), Δ𝑥(𝑡)⟩, (8)
𝜑(𝑥(𝑡1))−𝜑(𝑥(𝑡1, 𝑢0)) =⟨𝜑𝑥(𝑥(𝑡1, 𝑢0)),Δ𝑥(𝑡1)⟩+⟨𝑞,Δ𝑥(𝑡1)⟩. (9)
Предположим, что краевая задача (6)–(9) допускает решение (𝑥(𝑡), 𝑝(𝑡)), 𝑡∈𝑇. Сформируем выходное управление по правилу
𝑣(𝑡) =𝑢𝛼(𝑝(𝑡), 𝑥(𝑡), 𝑡) =𝑃𝑈(𝑢0(𝑡) +𝛼𝐻1(𝑝(𝑡), 𝑥(𝑡), 𝑡)), 𝑡∈𝑇.
(10)
В целях уменьшения громоздкости обозначений зависимость решения и выходного управления от параметра𝛼явно не указывается.
Покажем выполнение свойства улучшения. Имеет место очевидное соотношение 𝑥(𝑡) = 𝑥(𝑡, 𝑣), 𝑡 ∈ 𝑇. Отсюда, используя (5) с учетом неравенства (3), получаем оценку приращения функционала
Φ(𝑣)−Φ(𝑢0) =−
∫
𝑇
⟨𝐻1(𝑝(𝑡), 𝑥(𝑡), 𝑡), 𝑣(𝑡)−𝑢0(𝑡)⟩𝑑𝑡⩽
⩽ −1 𝛼
∫
𝑇
∥𝑣(𝑡)−𝑢0(𝑡)∥2𝑑𝑡⩽0.
(11)
Система (6)–(9) аналогично [4] всегда может быть сведена к вспомогательной дифференциальной сопряженной системе следующим (возможно, не единственным) образом.
Уравнение (8) можно явно разрешить относительно𝑟(𝑡)через𝑥(𝑡), 𝑝(𝑡). Действи- тельно, в случае линейных по 𝑥 функций 𝐴(𝑥, 𝑡), 𝑏(𝑥, 𝑡), 𝑎(𝑥, 𝑡), 𝑑(𝑥, 𝑡) получаем
⟨𝑟(𝑡), 𝑥(𝑡)−𝑥(𝑡, 𝑢0)⟩= 0, 𝑡∈𝑇. В этом случае положим𝑟(𝑡) = 0, 𝑡∈𝑇.
В нелинейном случае переменную величину𝑟(𝑡)можно построить по следующе- му правилу. Если для некоторого𝑘 выполняется 𝑥𝑘(𝑡)∕=𝑥𝑘(𝑡, 𝑢0), то можно взять 𝑟𝑖(𝑡) = 0,𝑖∕=𝑘,𝑟𝑘(𝑡) = Δ𝑥𝐻− ⟨𝐻𝑥,Δ𝑥⟩
Δ𝑥𝑘 . Если для всех𝑖 имеем𝑥𝑖(𝑡) =𝑥𝑖(𝑡, 𝑢0), то полагаем𝑟(𝑡) = 0.
Аналогично указанному правилу уравнение (9) можно явно разрешить относи- тельно𝑞. При линейной зависимости функции 𝜑 определяем 𝑞= 0. В нелинейном случае если∀𝑖 𝑥𝑖(𝑡1) =𝑥𝑖(𝑡1, 𝑢0), то𝑞= 0; иначе если∃𝑘 𝑥𝑘(𝑡1)∕=𝑥𝑘(𝑡1, 𝑢0), то𝑞𝑖= 0, 𝑖∕=𝑘,𝑞𝑘= Δ𝑥𝜑− ⟨𝜑𝑥,Δ𝑥⟩
Δ𝑥𝑘
.
Таким образом, от дифференциально-алгебраической системы (6)–(9) можно пе- рейти к вспомогательной двухточечной краевой задаче для обыкновенных диффе-
ренциальных уравнений:
˙
𝑥(𝑡) =𝐴(𝑥(𝑡), 𝑡)𝑢𝛼(𝑝(𝑡), 𝑥(𝑡), 𝑡) +𝑏(𝑥(𝑡), 𝑡), 𝑥(𝑡0) =𝑥0,
˙
𝑝(𝑡) =−𝐻𝑥(𝑝(𝑡), 𝑥(𝑡, 𝑢0), 𝑢0(𝑡), 𝑡)−𝑅(𝑝(𝑡), 𝑥(𝑡), 𝑡), 𝑝(𝑡1) =−𝜑𝑥(𝑥(𝑡1, 𝑢0))−𝑄(𝑥(𝑡1), 𝑡1).
При этом функции𝑅(𝑝, 𝑥, 𝑡), 𝑄(𝑥, 𝑡)в общем случае определяются не единственным образом.
Краевая задача (6)–(9) по свойствам гладкости существенно проще краевой за- дачи принципа максимума и дифференциально-алгебраических краевых задач в [3], которые основаны на известной операции на максимум функции Понтрягина.
В случае линейной по состоянию задачи (1), (2) (функции𝐴(𝑥, 𝑡), 𝑏(𝑥, 𝑡),𝑎(𝑥, 𝑡), 𝑑(𝑥, 𝑡),𝜑(𝑥)линейны по𝑥) краевая задача (6)–(9) сводится к двум последовательным непрерывным задачам Коши для сопряженной и фазовой систем. При этом предла- гаемая процедура улучшения становится эквивалентной известному проекционному методу нелокального улучшения [1].
Формализуем рассматриваемый подход к улучшению управления следующим об- разом. Введем дифференциально-алгебраическую сопряженную систему:
˙
𝑝(𝑡) =−𝐻𝑥(𝑝(𝑡), 𝑥(𝑡), 𝑤(𝑡), 𝑡)−𝑟(𝑡), (12)
⟨𝐻𝑥(𝑝(𝑡), 𝑥(𝑡), 𝑤(𝑡), 𝑡), 𝑦(𝑡)−𝑥(𝑡)⟩+⟨𝑟(𝑡), 𝑦(𝑡)−𝑥(𝑡)⟩=
= 𝐻(𝑝(𝑡), 𝑦(𝑡), 𝑤(𝑡), 𝑡)−𝐻(𝑝(𝑡), 𝑥(𝑡), 𝑤(𝑡), 𝑡) (13)
с краевыми условиями:
𝑝(𝑡1) =−𝜑𝑥(𝑥(𝑡1))−𝑞, (14)
⟨𝜑𝑥(𝑥(𝑡1)), 𝑦(𝑡1)−𝑥(𝑡1)⟩+⟨𝑞, 𝑦(𝑡1)−𝑥(𝑡1)⟩=𝜑(𝑦(𝑡1))−𝜑(𝑥(𝑡1)).
(15)
По определению положим𝑟(𝑡)≡0, если𝐴(𝑥, 𝑡), 𝑏(𝑥, 𝑡), 𝑎(𝑥, 𝑡), 𝑑(𝑥, 𝑡)– линейны по 𝑥. Также определим 𝑞 = 0, если 𝜑 – линейна. В нелинейных случаях если в некоторый момент времени𝑡 ∈𝑇 𝑦(𝑡) =𝑥(𝑡), то полагаем 𝑟(𝑡) = 0. При этом если 𝑡=𝑡1, то𝑞= 0.
В остальных случаях можно явно разрешить 𝑟(𝑡), 𝑞 из алгебраических уравне- ний аналогично тому, как было сделано выше. Таким образом, система (12)–(15) может быть сведена к вспомогательной дифференциальной сопряженной системе (возможно, не единственным образом).
Для допустимых управлений 𝑢, 𝑣 обозначим через 𝑝(𝑡, 𝑢, 𝑣), 𝑡 ∈ 𝑇, – решение системы (12)–(15) при 𝑥(𝑡) =𝑥(𝑡, 𝑢), 𝑤(𝑡) = 𝑢(𝑡), 𝑦(𝑡) = 𝑥(𝑡, 𝑣) (в предположении существования).
Понятно, что𝑝(𝑡, 𝑢, 𝑢) =𝜓(𝑡, 𝑢), 𝑡∈𝑇.
Формула приращения функционала (5) в новых обозначениях принимает вид Φ(𝑣)−Φ(𝑢0) =−
∫
𝑇
⟨𝐻1(𝑝(𝑡, 𝑢0, 𝑣), 𝑥(𝑡, 𝑣), 𝑡), 𝑣(𝑡)−𝑢0(𝑡)⟩𝑑𝑡.
Выходное управление, формируемое по правилу (10), записывается в виде соот- ношения
𝑣(𝑡) =𝑢𝛼(𝑝(𝑡, 𝑢0, 𝑣), 𝑥(𝑡, 𝑣), 𝑡), 𝑡∈𝑇.
(16)
Обозначим множество допустимых выходных управлений дифференциально- алгебраической краевой задачи (6)–(9):
𝑉𝛼(𝑢0) ={𝑣∈𝑉 : 𝑣(𝑡) =𝑢𝛼(𝑝(𝑡, 𝑢0, 𝑣), 𝑥(𝑡, 𝑣), 𝑡), 𝑡∈𝑇}.
Имеем: если𝑢0∈𝑉𝛼(𝑢0)хотя бы для одного𝛼 >0, то
𝑢0(𝑡) =𝑢𝛼(𝑝(𝑡, 𝑢0, 𝑢0), 𝑥(𝑡, 𝑢0), 𝑡) =𝑢𝛼(𝜓(𝑡, 𝑢0), 𝑥(𝑡, 𝑢0), 𝑡), 𝑡∈𝑇, т.е. управление𝑢0 удовлетворяет условию принципа максимума (4).
Обратно, если𝑢0 удовлетворяет условию (4), то оно удовлетворяет условию (16) при𝑣=𝑢0 для всех𝛼 >0. Следовательно,𝑢0∈𝑉𝛼(𝑢0), 𝛼 >0.
Это значит, что краевая задача (6)–(9) для управления 𝑢0, удовлетворяющего принципу максимума, при любом𝛼 > 0 всегда допускает решение 𝑥(𝑡) = 𝑥(𝑡, 𝑢0), 𝑝(𝑡) = 𝜓(𝑡, 𝑢0). Следовательно, если краевая задача (6)–(9) не имеет решения хотя бы при одном𝛼 >0, то𝑢0не удовлетворяет принципу максимума.
Таким образом, справедливо следующее утверждение.
Л е м м а . Управление 𝑢0 ∈ 𝑉 удовлетворяет принципу максимума тогда и только тогда, когда𝑢0∈𝑉𝛼(𝑢0) хотя бы для одного𝛼 >0.
С л е д с т в и е (принцип максимума). Для оптимальности управления 𝑢0 ∈ 𝑉 необходимо, чтобы𝑢0∈𝑉𝛼(𝑢0)хотя бы для одного𝛼 >0.
Оценка (11) гарантирует строгое улучшение управления 𝑢0 ∈ 𝑉 (в том числе удовлетворяющего принципу максимума) при 𝑣 ∈ 𝑉𝛼(𝑢0), 𝑣 ∕=𝑢0. Таким образом, случай неединственности решения краевой задачи улучшения обеспечивает строгое улучшение управления, удовлетворяющего принципу максимума.
Оценка (11) позволяет сформулировать новое необходимое условие оптимально- сти на основе предлагаемого подхода улучшения.
Т е о р е м а (условие 𝐴). Для оптимальности управления 𝑢0 ∈𝑉 в задаче (1), (2) необходимо, чтобы оно было единственным управлением на выходе процедуры улучшения
𝑉𝛼(𝑢0) ={𝑢0} для всех 𝛼 >0.
Очевидно, что принцип максимума является следствием условия𝐴.
В терминах решения краевой задачи (6)–(9) условия оптимальности в задаче (1), (2) принимают следующую форму.
Принцип максимума. Для оптимальности управления𝑢0∈𝑉 необходимо, что- бы пара(𝑥(𝑡, 𝑢0), 𝜓(𝑡, 𝑢0))была решением краевой задачи(6)–(9)хотя бы для одного 𝛼 >0.
Условие 𝐴. Для оптимальности управления 𝑢0 ∈ 𝑉 необходимо, чтобы па- ра (𝑥(𝑡, 𝑢0), 𝜓(𝑡, 𝑢0))была единственным решением краевой задачи (6)–(9)для всех 𝛼 >0.
В линейной по состоянию задаче (1), (2) краевая задача улучшения сводится к двум гладким задачам Коши для сопряженной и фазовой подсистем, которые един- ственным образом определяют выходное управление𝑣для заданного𝛼 >0. Потеря свойства неединственности решения краевой задачи означает, что в данном линей- ном случае управление, удовлетворяющее принципу максимума, невозможно строго улучшить с помощью рассматриваемой процедуры. При этом принцип максимума и условие𝐴становятся эквивалентными.
Отметим в этом линейном случае, что свойство существования решения крае- вой задачи и оценка (11) гарантируют строгое улучшение любого управления, не удовлетворяющего принципу максимума.
В нелинейной по состоянию задаче (1), (2) возможен случай отсутствия решения краевой задачи улучшения при некотором𝛼 >0. Это означает, что управление 𝑢0 не удовлетворяет принципу максимума. В таком случае нужно изменить значение 𝛼 >0 или перейти к другим процедурам улучшения.
3. Примеры
П р и м е р 1 (улучшение особого управления). Рассматривается задача [3]:
Φ(𝑢) =−1 2
∫
𝑇
𝑥2(𝑡)𝑑𝑡→min,
˙
𝑥(𝑡) =𝑢(𝑡), 𝑥(0) = 0, 𝑢(𝑡)∈𝑈 = [−1,1], 𝑡∈𝑇 = [0, 𝑡1].
Функция Понтрягина𝐻 =𝑝𝑢+1
2𝑥2, отображение 𝑢𝛼(𝑝, 𝑥, 𝑡) =𝑃𝑈(𝛼𝑝) =
⎧
⎨
⎩
𝛼𝑝, ∣𝛼𝑝∣⩽1,
−1, 𝛼𝑝 <−1, 1, 𝛼𝑝 >1.
Рассмотрим управление𝑢0(𝑡)≡0, которое является особым. Имеем𝑥(𝑡, 𝑢0) = 0, 𝑡∈𝑇,Φ(𝑢0) = 0. При этомΔ𝑥𝐻(𝑝, 𝑥(𝑡, 𝑢0), 𝑢0(𝑡), 𝑡) = 1
2𝑥2, Δ𝑥(𝑡) =𝑥(𝑡).
Дифференциально-алгебраическая краевая задача улучшения для𝑢0имеет вид:
˙
𝑥(𝑡) =𝑃𝑈(𝛼𝑝(𝑡)), 𝑥(0) = 0,
˙
𝑝(𝑡) =−𝑟(𝑡), 𝑝(𝑡1) = 0, 𝑟(𝑡)𝑥(𝑡) = 1
2𝑥2(𝑡).
Очевидно, для любого 𝛼 >0 задача имеет нулевое решение, что подтверждает свойства краевой задачи улучшения для управления, удовлетворяющего принципу максимума.
Из алгебраического уравнения получаем, что если 𝑥(𝑡) ∕= 0, то 𝑟(𝑡) = 1 2𝑥(𝑡).
В противном случае (𝑥(𝑡) = 0) по определению полагаем𝑟(𝑡) = 0.
В итоге получаем явную функцию 𝑅(𝑝, 𝑥, 𝑡) = 1
2𝑥и краевая задача сводится к вспомогательной дифференциальной задаче:
˙
𝑥(𝑡) =𝑃𝑈(𝛼𝑝(𝑡)), 𝑥(0) = 0,
˙
𝑝(𝑡) =−1
2𝑥(𝑡), 𝑝(1) = 0.
Как показано в [3], данная краевая задача для любого 𝛼 > 0 при 𝑡1 = 𝜋
√2𝛼+ +𝜋
√2
𝛼𝑘,𝑘= 0,1,2, . . ., допускает ненулевое решение при𝑝(0)∕= 0, ∣𝑝(0)∣⩽ 1 𝛼. При этом соответствующее выходное управление
𝑣(𝑡) =𝛼𝑝(0) cos
√𝛼
2𝑡, 𝑡∈𝑇,
строго улучшает особое управление𝑢0(𝑡),𝑡∈𝑇.
Отметим, что в данном примере дифференциально-алгебраическая краевая за- дача улучшения, применимая к общим нелинейным по состоянию системам управле- ния, позволяет добиться строгого улучшения особого управления без дополнитель- ного усложнения краевой задачи. В [3] для достижения эффекта строгого улучшения
потребовалась фазовая регуляризация исходной дифференциальной краевой задачи улучшения, ориентированной на полиномиальные по состоянию задачи оптималь- ного управления.
П р и м е р 2 (не полиномиальная по состоянию задача). Рассматривается извест- ная задача [5, с. 214], для которой подход [3] принципиально невозможен:
Φ(𝑢) = sin𝜋𝑥(1)
2 →min,
˙
𝑥(𝑡) =𝑢(𝑡), 𝑥(0) = 2, ∣𝑢(𝑡)∣⩽1, 𝑢0(𝑡) =−1, 𝑡∈𝑇 = [0,1].
Имеем𝑥(𝑡, 𝑢0) = 2−𝑡. ЗначениеΦ(𝑢0) = 1.
Функция Понтрягина𝐻(𝑝, 𝑥, 𝑢, 𝑡) =𝜓𝑢. Стандартная сопряженная система:
𝜓(𝑡) = 0,˙ 𝜓(1) =−𝜋
2 cos𝜋𝑥(1) 2 имеет решение𝜓(𝑡, 𝑢0)≡0.
Поскольку 𝐻(𝜓(𝑡, 𝑢0), 𝑥(𝑡, 𝑢0), 𝑢0(𝑡), 𝑡)≡0, 𝐻𝑢(𝜓(𝑡, 𝑢0), 𝑥(𝑡, 𝑢0), 𝑢0(𝑡), 𝑡)≡0 и Δ𝑢𝐻(𝜓(𝑡, 𝑢0), 𝑥(𝑡, 𝑢0), 𝑢0(𝑡), 𝑡)≡0, то управление𝑢0(𝑡)≡0– особое на 𝑇.
Отображение𝑢𝛼(𝑝, 𝑥, 𝑡) =𝑃𝑈(−1 +𝛼𝑝). Дифференциально-алгебраическая крае- вая задача улучшения имеет вид:
˙
𝑥(𝑡) =𝑃𝑈(−1 +𝛼𝑝(𝑡)), 𝑥(0) = 2,
˙
𝑝(𝑡) = 0, 𝑝(1) =−𝑞, 𝑞(𝑥(1)−1) = sin𝜋
2𝑥(1)−1.
Если𝑥(1) = 1, то полагаем𝑞= 0. Если𝑥(1)∕= 1, то полагаем
𝑞= sin𝜋
2𝑥(1)−1 𝑥(1)−1 .
Таким образом, функция𝑄имеет вид:
𝑄(𝑥) =
⎧
⎨
⎩ sin𝜋
2𝑥(1)−1
𝑥−1 , 𝑥∕= 1,
0, 𝑥= 1.
Получаем вспомогательную дифференциальную краевую задачу:
˙
𝑥(𝑡) =𝑃𝑈(−1 +𝛼𝑝(𝑡)), 𝑥(0) = 2,
˙
𝑝(𝑡) = 0, 𝑝(1) =−𝑄(𝑥(1)).
Имеем𝑝(𝑡) =−𝑄(𝑥(1)), 𝑡∈𝑇. Следовательно, краевая задача сводится к специ- альной задаче Коши
˙
𝑥(𝑡) =𝑃𝑈(−1−𝛼𝑄(𝑥(1))), 𝑥(0) = 2.
Отметим, что для любых𝛼 > 0 задача допускает решение𝑥(𝑡) =−𝑡+ 2,𝑡 ∈𝑇, соответствующее начальному управлению 𝑢0(𝑡) = −1, 𝑡 ∈ 𝑇, удовлетворяющему принципу максимума. Этот случай реализуется в предположении, что𝑄(𝑥(1)) = 0.
Предположим, что𝑄(𝑥(1))>0. Тогда используя условие𝛼 >0, получаем началь- ную задачу𝑥(𝑡) =˙ −1, 𝑥(0) = 2с решением𝑥(𝑡) =−𝑡+ 2, 𝑡∈𝑇. При этом получаем 𝑄(𝑥(1)) = 0, что противоречит сделанному предположению. Следовательно, такой случай невозможен.
Предположим, что𝑄(𝑥(1))<0. Тогда при достаточно больших𝛼 >0получаем начальную задачу𝑥(𝑡) = 1, 𝑥(0) = 2, имеющую решение˙ 𝑥(𝑡) = 𝑡+ 2, 𝑡 ∈ 𝑇. При этом 𝑄(𝑥(1)) = −1 < 0. Таким образом, при достаточно больших 𝛼 > 0 краевая задача улучшения допускает решение𝑥(𝑡) = 𝑡+ 2, 𝑡∈𝑇, с выходным управлением 𝑣= 1, которое строго улучшает исходное управление:Φ(𝑣) =−1<Φ(𝑢0) = 1.
4. Заключение
Предложен новый подход к нелокальному улучшению линейно управляемых про- цессов с помощью решения специальной дифференциально-алгебраической задачи.
Выделим основные свойства предлагаемого подхода в рассматриваемом классе нели- нейных по состоянию задач оптимального управления.
1. Трудоемкость улучшения определяется трудоемкостью решения специальной краевой задачи, которая по свойствам гладкости существенно проще краевой задачи принципа максимума.
2. В линейной по состоянию задаче оптимального управления со свободным пра- вым концом краевая задача улучшения сводится к двум задачам Коши для фазовой и сопряженной систем.
3. Нелокальность улучшения управления и отсутствие процедуры слабого или игольчатого варьирования управления, характерной для стандартных локальных методов улучшения.
4. Возможность улучшения управлений, удовлетворяющих принципу максиму- ма (в том числе и особых управлений). Такая возможность появляется в случае неединственности решения краевой задачи улучшения.
5. На основе краевой задачи получены новые необходимые условия оптимально- сти, усиливающие принцип максимума в рассматриваемом классе задач оптималь- ного управления.
СПИСОК ЛИТЕРАТУРЫ
1. Срочко В.А.Итерационные методы решения задач оптимального управления. М.: Физ- матлит, 2000.
2. Булдаев А.С.Методы возмущений в задачах улучшения и оптимизации управляемых систем. Улан-Удэ: Изд-во Бурят. гос. ун-та, 2008.
3. Булдаев А.С.Проекционные процедуры нелокального улучшения линейно управляемых процессов // Изв. вузов. Математика. 2004. № 1. С. 18–24.
4. Булдаев А.С., Моржин О.В.Улучшение управлений в нелинейных системах на основе краевых задач // Изв. Иркут. гос. ун-та. Математика. 2009. Т. 2. № 1. С. 94–107.
5. Габасов Р., Кириллова Ф.М.Качественная теория оптимальных процессов. М.: Наука, 1973.
Статья представлена к публикации членом редколлегии В.И. Гурманом.
Поступила в редакцию 16.12.2010