Math-Net.Ru
Общероссийский математический портал
В. А. Якубович, Линейно-квадратичная задача оп- тимизации и частотная теорема для периодиче- ских систем. I, Сиб. матем. журн., 1986, том 27, номер 4, 181–200
Использование Общероссийского математического портала Math- Net.Ru подразумевает, что вы прочитали и согласны с пользователь- ским соглашением
http://www.mathnet.ru/rus/agreement Параметры загрузки:
IP: 139.59.245.186
6 ноября 2022 г., 06:11:29
Т. X X V H , № 4 И Ю Л Ь — А В Г У С Т 1986
УДК 519.9.62.50 В. А. ЙКУБОВИЧ
ЛИНЕЙНО-КВАДРАТИЧНАЯ З А Д А Ч А ОПТИМИЗАЦИИ И ЧАСТОТНАЯ ТЕОРЕМА ДЛЯ ПЕРИОДИЧЕСКИХ СИСТЕМ. I
Введение
Пусть даны векторное уравнение
dx (t) /dt = A (t)x (t)+b(t)u{t) (0.1) и квадратичная форма
&{t, х, u)^(x*G(t)x + 2x*g(t)u + ii*T(t)u)/2. (0.2) Здесь Ц Е Г , матрицы A(t), b(t), G(t)=*G(t)*, g(t), Г ( 0 =
— T'(t)* > e0/m > 0 имеют соответствующие порядки й их элементы — ве
щественные измеримые, ограниченные, периодические функции с перио
дом Г. (Равенства и неравенства выполняются почти всюду. Звездочка означает транспонирование, а в случае комплексных векторов.и\матриц — эрмитово сопряжение, т. е. транспонирование и комплексное сопряже
ние) . Ниже рассматриваются следующие две задачи.
1. Оптимизационная задача 00
х ( 0 ) = а , & =*§9fax{t)xu(t))dt-+min (0.3)
о
(а—заданный вектор), причем допустимыми считаются такие х(), и(-), что выполнены (0.1) и условие устойчивости
И - ) | € = £ а ( 0 , оо), | и ( . ) | е £ р ( 0 , оо).
2. Задача нахождения формы V(t, х)=± x*R0(t)x (функции Ляпуно
ва) такой, что R0(t)= R0(t + Г ) = R0(t)*, RQ(t)— абсолютно непрерывная матричная функция и для производной в силу уравнения (0.1) справед
ливо неравенство
Я в > 0 : V = x*(dtio/dt)x + 2x*Ro(t)(A(t)x + b(i)u)>
>-2S(t, х, и)+8(\х\2+\а\2) Ух, и. (0.4) Первая задача хорошо изучена для постоянных коэффициентов урав
нения (0.1) и формы (0.2), а также для переменных коэффициентов и Для конечного интервала функционирования системы. В этих случаях оптимизационные задачи (называемые также задачами аналитического конструирования регуляторов) впервые исследованы Калманом [ 1 ] и А. М. Летовым [2]. (Одно из первых подробных изложений решения см. в [ 3 ] ) . Задача о существовании функции Ляпунова вначале рассмат
ривалась совершенно независимо и лишь для постоянных коэффициентов;
первые результаты получены в (4—7], эффективные алгоритмы в общем случае приведены в [ 8 ] . По-видимому, впервые Н. Н. Красовский указал [Щ на связь этих двух задач. В [10, 11 и др.] эта связь использована для решения второй задачи в ситуации, когда пространства состояний {х) и управлений Ли) гильбертовы.
В случае постоянных коэффициентов в (0.1) и (0.2) матрица RQ(t) =
6 = 5 До постоянна; обе указанные задачи приводят к «разрешающим» урав-
нениям Лурье [12]. К решению этих уравнений в 50—60-е годы сво
дились задачи абсолютной устойчивости в многочисленных работах по нелинейной теории регулирования (см., например, [13]). В связи с ука
занной задачей оптимизации в 70-е годы вновь пришли к уравнениям Лурье (записанным в иной, но эквивалентной форме), они получили в зарубежной литературе новое название — «алгебраические уравнения Риккати»; их обстоятельному исследованию посвящено большое коли
чество работ [14, 15, 16 и др.]. Частотная теорема [4—8] (см. также [17, § 1.2]) дает условия существования решения уравнений Лурье (ус
ловия существования функции Y ( # ) = x*RQx & требуемым свойством) й формулирует алгоритмы определения матрицы Д0 = /?о* Она использу
ется кроме задачи аналитического конструирования регуляторов в тео
рии абсолютной устойчивости [7, 17, 18 и др.], адаптивного управления [19, 20 и др.],' стохастической оптимизации [21 и др.]. Замена предпо
ложения постоянства коэффициентов рассматриваемых систем уравнений предположением ^-периодичности коэффициентов представляет интерес во всех этих случаях. При этом приходим к описанным выше задачам.
Имеется много работ, посвященных различным аспектам линейно- квадратичной оптимизационной задачи для систем с переменными коэф
фициентами общего вида; для бесконечного временного интервала один из первых результатов в этой области принадлежит В. И. Зубову [22].
Относительно недавно стала изучаться специфика периодического случая [23—26]; в последних работах, однако, решаются другие проблемы.
В задачах оптимизации обычно W(t, х, и)^0 (Ух, и, t). В задачах абсолютной устойчивости форма *3 (t, х, и) обязательно знакопеременна, это сильно осложняет исследование и требует применения других мето
дов. Далее будет рассматриваться сразу общий случай. Заметим, что мно
гие рассуждения сильно сократились бы и "упростились, если 9(t, х, и)>
> 0 (см. § 4 ) . Как в задачах оптимизации, так и в задачах абсолютной устойчивости & (t, 0,*гг)= u*T(t)u> 0. Это условие необходимо для суще
ствования оптимального управления в указанной оптимизационной зада
че. Ниже делается более сильное предположение: T(t)> ^1т>0. Извест
но (см., например, [27]), что при нарушении этого последнего условия оптимального управления может не существовать при некоторых х(0)=а:
В отличие от ряда других работ, посвященных линейно-квадратич
ным задачам оптимизации, в этой статье используются рассуждения, ана
логичные применявшимся при выводе необходимого условия Якоби в ва
риационном исчислении. По-видимому, впервые условия типа Якоби в задачах оптимального управления (для конечного временного интервала, но для более сложных задач, включающих ограничения) получены А. В. Дмитруком [28 и др.} на основе использования общих результа
тов [29].
В нашем случае условие типа Якобй приводит к необходимому усло
вию неколебательности, аналога которого нет в случае постоянных коэф
фициентов. (Оно автоматически выполнено, если коэффициенты постоян
н ы ) . Вместе с некоторым «частотным условием», аналогичным частотно
му условию [4—8 и др.], условие неколгебательности дает необходимое и достаточное условие разрешимости оптимизационной задачи и одновре
менно существования функции V(t, х) = x*R(t)x со свойством (0.4). По
путно получается эффективная процедура построения указанной функ
ции Ляпунова со свойством (0.4) и оптимального управления в задаче ( 0 . 1 ) - ( 0 . 3 ) .
§ 1. Формулировки основных результатов
В нижеследующих определениях А(-), & ( • ) , с ( • ) — локально'сумми
руемые, ограниченные матричные функции, не обязательно Т-периоди
ческие. ' 4 .. * \ • .
О п р е д е л е н и я . 1. Матричная функция А(•) называется гурвице- вой, если существуют такие числа С>0, е > 0 , что для любого решения х = x(t) уравнения dx/dt = A (t)x выполнено
\x(t)\^Ce-R{t-s)\x{s)\ при t>s.
2. Уравнение (0.1) называется экспоненциально стабилизируемым (пара (А(), Ь(-)} называется экспоненциально стабилизируемой), если существует такая п X ттг-матричная функция с(), что А(-) +Ь(-)с(-)* ~ гурвицева матричная функция, т. е. если экспоненциально устойчиво три
виальное решение уравнения (OA), в котором u(t) = c(t)*x(t). Это урав
нение u(t)~ c(t)*x(t) описывает экспоненциально стабилизирующий ре
гулятор. Если c(t+ Т)= c(t), то говорят о Т-периодической экспоненци
альной стабилизируемости.
3. Уравнение (0.1) называется Ь2-стабилизируемым (пара iA(-), b(.-)} называется Ь2-стабилизируемой), если для любого вектора а е Дп существует такая функция и(-), \и(•) | е L2(0, ° ° ) , что для решения урав
нений dx(t)/dt = A(t)x(t)+ b(t)u(t), я ( 0 ) = а имеем \х(-)\^Ь2(0, <»).
4. Уравнение Д0.1) называется управляемым на [tu t2] (пара (А(-),
&(•)) называется управляемой на t2]), если для любых tfi е Rn, я2 ^ e RK найдется такая функция и(-), \u(-)\^L(tu t2), что для решения уравнения (0.1) с условием x(tt) — at выполнено x(t2)^=a2.
Заметим, что гурвицевость матричной функции А() и гурвицевость матрицы A(t) при фиксированном t — разные понятия. Как известно, су
ществуют негурвицевы матричные функции А(-) такие, что Л ( ^ — гур
вицева матрица при любом t.
Пусть X0(t) — эволюционная матрица уравнения dx/dt = A(t)x, т. е.
dXJdt^ A(t)X0 и Х0( 0 ) = /п. Известно, что для управляемости уравне
ния (0.1) на [tv, t2] необходимо и достаточно выполнения одного из двух
эквивалентных условий: * (а) К - J Х0 (t)-1 Ъ (t) Ъ (t)* [Х0 (t)*]"1 dt > 0,
(б) d^/dt = -$*А, f * b = 0 ф в 0 (на [t0l it])'.
Поэтому из управляемости на [tu t2] следует управляемость на большем интервале [t[, t2] ~э [tx, t2]. .
Условие /^-стабилизируемости, очевидно, необходимо для существо
вания оптимального управления в указанной задаче оптимизации с лю
бым вектором х (0) = а. Поэтому ниже предполагается, что это условие выполнено.
Управляемость на [0, t0] (с каким-либо U > 0) влечет ^-стабилизи
руемость. (Можно взять x(t0) = 0 и положить u(t)^0, x(t)^0 при I^
^ 0 ) . Очевидно, что и из экспоненциальной стабилизируемости следует
^-стабилизируемость. 0
Изложенное ниже утверждение будет получено как следствие реше
ния указанной задачи оптимизации со строго положительно определенной формой % (см. § 4); удобно, однако, привести его сейчас.
Т е о р е м а ! . Для Т-периодических матричных функций А(•), Ь(-) экспоненциальная стабилизируемость, Ь2-стабилизируемость и Т-периоди-
ческая стабилизируемость — равносильные свойства.
Далее всюду предполагается, что А(), Ь(-) и коэффициенты формы
&(t, х, и)— периодические функции с периодом Т.
Можно показать, что в этом случае £2-стабилизируемость (0.1) рав
носильна стабилизируемости дискретного уравнения = XQ(T)xj + + KVJ, где К~~ матрица в (а) для U 0, t2 = Т.
Введем в рассмотрение функцию Гамильтона оптимизационной за
дачи (0.1) —(0.3) .
m(t, х, и, ^)^^(A(t)x + b(t)u)-&(t, х, и) (1.1)
и систему, называемую в дальнейшем присоединенной системой,
dx/dt«{дЗК/Щ; d^ldt = -(дЗЧ/дх)*, дЗв/ди = 0. (1.2) (Здесь и ниже дЖ/дх — производная Фреше; предполагается, что векто
ры записываются в виде столбца, тогда дЖ/дх, дЖ/д^ — вектор-строки).
Поясним происхождение этой системы. Первое уравнение (1.2) сов
падает с ( 0 . 1 ) . Второе и третье уравнения (1.2) получаются обычным образом из принципа максимума Понтрягина [30] (обоснованного для рассматриваемой задачи оптимизации в § 2 ) . Согласно этому принципу существовайие оптимального процесса x(t), u(t) влечет существование такого решения tf>(£) второго уравнения (1.2) со свойством li|?(-)|e=
ё L2( 0 , оо), что i
M(t, x(t), u(t), ф ( 0 ) = т а х Ж ( г , . x ( t ) , v, y(t))
по всем y ^ Rm. Отсюда вытекают третье уравнение (1.2) и неравенство T(t)>0, которое поэтому является необходимым для существования ре
шения задачи оптимизации, что отмечено во введении.
При условии T(t)^ 7 o / m > 0 из последнего уравнения (1.2) имеем и (t) — Г "1 (ty*b — g*x), а два первых уравнения (1.2) записываются в ви
де канонической системы
dx/dt ~=(дЖ/д^)*, d$/dt=*-{d36/dx)*, (1.3) где Ж(1, х, ty)=*M(t, х, п, ф) при дЖ/ди = 0. Действительно,
= дЖ/dty + (дЖ/ди) (du/dty) = дЖ/dty и аналогично дЖ/дх = дЖ/дх при дЖ/ди * 0.
Систему (1.3) можно записать в виде одного векторного канониче
ского уравнения
^ - t f W i 4 i « B i - . [ j ] f
*.-[°
In (1.4)H(t)~\ / t . (1.5)
Ниже будут использованы некоторые общие сведения [31, гл. 3] о ка
нонических уравнениях. Рассмотрим произвольное уравнение (1.4) с ве
щественной матрицей (гамильтонианом) Я {t) = Я (t) * = Я (t + Т); оно получается из системы ( 1 . 3 ) , причем Я ( £ ) — матрица квадратичной фор
мы Ж{1, х, 1|?). Пусть Z(t) — эволюционная матрица и Z(T) — матрица монодромии уравнения ( 1 . 4 ) , т. е. Z(t) — матрица фундаментальной си
стемы решений уравнения ( 1 . 4 ) , 2 ( 0 ) = /п. В дальнейшем важную роль будет играть следующее «частотное условие»:
det[Z(f)r ei(*I2n] ФО (Vco s [0, 2 л ) ) , (1.6) равносильное [31] полной неустойчивости уравнения ( 1 . 4 ) , т. е. отсут
ствию у уравнения (1.4) решений, ограниченных на (—°°, + < » ) . При вы
полнении условия (1.6) уравнение (1.4) (система ( 1 . 3 ) ) имеет п линей
но независимых вещественных решений [#Д£), %(£)]> экспоненциально убывающих при £~*оо. (Векторы ( # Д 0 ) , ф»(0)] — вещественный базис в сумме корневых подпространств матрицы Z(T), отвечающих собственным
значениям р^, |р^| < 1 ) . Введем п X w-вещественные матрицы
со столбцами $y(t) иг|зД£).
Приведенная ниже теЬрема дает достаточно полную информацию о двух сформулированных выше задачах.
Теорема 2 (частотная теорема). Пусть пара А(-), Ь(-)— Ь2-стабили- зируема и Г(£) = Г ( £ ) * > Чо1т > 0 (V£e=[0, Т]). Следующие утвержде
ния равносильны:
(A) Для любого начального состояния х(0)=* а задача (0.1) — (0.3) разрешима: существует оптимальное управление.
(B) Разрешима задача о функции Ляпунова: существует квадратич
ная форма V = x*R0(t)x с абсолютно непрерывной матричной функцией Д0(t) = R0(t) * — RQ (t + T), удовлетворяющая соотношению ( 0 . 4 ) .
(C) Выполнено частотное условие (1.6) и условие
ШХЩФЪ ( У * е [ 0 , Г ] ) . ^ (1.8) (D) Существует абсолютно непрерывная матричная функция #(£) =
= R(t) * = R (t + Т), удовлетворяющая матричному дифференциальному уравнению Риккати
£L + RA + A*R + G = (Rb + ?) Г "1 (ЛЬ + g)\ (1.9) такая, что В(-)^= А(-)+ b(-)r(-)* — гурвицева матричная функция, где
r(t)=-[R(t)b(t)+g(t)]T(t)-\ (1.10):
(E) Существует такая форма V(t, ж) = x*R(t)x с абсолютно непре
рывной матричной функцией R(t) = R(t + Г ) = R (t) *, чго
" f = ( ц - г ( 0 * а ? ) * Г ( 0 ( и - г ( 0 * « ) - 2 » ( ^ ж, » ) , (1.11) где V — производная в силу уравнения (0.1), г(t) — некоторая пХт-мат-
рица и В(-) = А()+b(-)r(-)* — гурвицева матричная функция. (Из (1.11) следует, что r(t) имеет вид ( 1 . 1 0 ) ) .
(F) Функционал Sf в (О.Ъ) положительнЬ определен на подпрострап*
стве ЗИ0 процессов х(-), и(-), Ix(-) I е= L2( 0 , ° ° ) , \и(-) I <= £2( 0 , оо), г/<Эов- летворяющих уравнению (0.1) и условию # ( 0 ) = 0:
Э б > 0 : | " У Л > б | ( | ж 1 * + M2) d * о о
( V * . ( 0 *и (•)• dxi dt » л( 0 * + ь ( 0м> * ( ° ) в о ) .
(1.12)
(G) Существует такое число б > 0 , чго для любых комплексных век
торных функций x(t), u(t), \х(-) I + Iи(•) I *= L2( 0 , Г ) и для любого со, 0 ^ о) < 2я, связанных соотношениями
• ^ « 4 ( * ) а ? + Ь ( * К я ( Г ) ^ Л ( 0 ) , справедливо неравенство
т т Sf т - J у ( * , . м ) > б j ( | х |2 + | a I2) dt.
о о
Пусть выполнено любое из условий ( А ) — ( G ) . Тогда матрица R(t)
^ (D) и ( Е ) определяется однозначно и для нее справедлива формула
R(t) = ~^(t)X(t)-\ (1.13) где W(t), X(t) — матрицы ( 1 . 7 ) . Оптимальный процесс (при любом
#(0) = а) доставляется регулятором *
u(t)^r(t)*x(t), (1.14) где г(t) — матрица (1.10). При этом X(t)-r матрица фундаментальной
системы решений оптимальной системы (0.1), (1.14).
Формула (1.14) для оптимального управления сразу следует из рав
носильности утверждений ( А ) и ( Е ) . Действительно, подставляя в (1.11)
Сибирский математический журнал № 4. 1986 г.
оптимальный процесс х ~ x(t), u=*u(t) и интегрируя от £ = 0 до £ = оо? получим
оо
2Sf = a*i? (0)а + { | Г ( * )1 / 2 И * ) - г (*)* а? ( * ) ] |2 dt. (1.15) о
Так как J 3 ( ) —гурвицева матричная функция, то управление (1.14) до
пустимо. Из (1.15) вытекает, что оно оптимально, а также что 1 п ! ^ = - а * Л ( 0 ) а / 2 .
В случае постоянных коэффициентов уравнения (0.1) и формьь
*3 (t, х,и) = с3 (х, и) из единственности матрицы R(t) и условия R(t-\-T)^~
= R(t) выводим, что R(t) = R = const, а значит, и r(£) = r = const. При этом (1.9) переходит в уравнение Лурье RA + A*R + G = (Rb + g) Г*"1 X X (Rb + g) *, которое лишь формой записи отличается от «разрешающих уравнений», введенных А. И. Лурье (см. подробнее [17, с . 5 9 ] ) . Частот
ное условие (1.6) теперь эквивалентно условию ' d e t i f ^ ^ — mhn] Ф 0 ( У ш ^ ( ~ о о , + о о ) )7 которое, как легко проверить, равносильно частотно
му условию [17, с. 51, формула ( 2 . 2 3 ) ] . Согласно [8] в случае постоянных коэффициентов условие (1.8), эквивалентное условию
detZ(0)
=9
6:0,
должно вытекать из частотного условия (1.6). Этот факт, может быть доказан и непосредственно. В следующей статье будет показано, что в случае пе
риодических коэффициентов (1.6) й (1.8) — независимые условия.
Из теоремы 2 могут быть выведены разные утверждения, относящие
ся к оптимизационной задаче (0.1) — (0.3). Сформулируем одно такое предложение.
Теорема 3 (о стабилизации). Пусть уравнение (0.1) управляемо (или Ьг-стабилизируемо) и 9 — произвольная формй, удовлетворяющая усло
вию ( F ) , например 3 6 > 0 : 9(t, х, и)> 6 ( Ы2+ . Ы2) (V£, х, и). Суще
ствует Т-периодическая nXm-матричная функция г ( £ ) . такая, что (1.14) — экспоненциально стабилизирующий регулятор для уравнения (0.1) (система (0.1), (1.14) асимптотически устойчива) и он доставляет оптимальный процесс #(•)> и(') в задаче (0.1) — (0.3)^ с любым вектором
%(0) = а. Матричный коэффициент r(t) определяется формулами (1.10), (1.13), где X(t), (t) — матрицы (1.7), Любой Т-периодический экспо
ненциально стабилизирующий регулятор (1.14) оптимален в указанном смысле для некоторой формы 8-(t, xf u ) .
Поскольку управляемая на каком-либо интервале [£0, ti] пара (А(-), &(•)) является /^-стабилизируемой, то первая часть теоремы 3 — прямое следствие теоремы 2. Вторая часть теоремы тоже следует из тео
ремы 2, а именно из утверждения (D) и заключения. Действительно, по условию В(-)^А(-)+ b(-)r(-)* гурвицева матричная функция. Возь
мем произвольную дифференциальную функцию R(t), R(t+ Т) = R(t)=^
= / ? ( £ ) * , произвольную функцию Г(£) = T(i)f > 60/m, определим G(t) из (1.9) и g(t) из (1.10). Тогда выполнены все условия в ( D ) , поэтому
(1.14)—оптимальный регулятор. /
Соотношение (1.8) тесно связано с осцилляторными свойствами ре
шений уравнения (1.4) — см. [32]. Приведем одно из возможных опреде
лений колебательного и неколебательного уравнений (1*4) и опишем со
держательный смысл этих понятий. Просто проверить (см., например, [31, гл. 3 ] ) , что для любого t эволюционная матрица Z(t) уравнения
(1.4) —симплектичеекая .матрица, т. е. удовлетворяет уравнению Z*2fZ^
'***3\ Известно, что группа S p2 n симплектических матриц гомеоморфна топологическому произведению связного и односвязного топологического пространства на окружность Т. Для Z в S p2 r t положим по определению
A r g Z = A r g det (Xt + iXz)t где Z *=
Xt1 X2 -
(1.16) Xii 4^ — матрицы размера я Х в , (Определение корректно, ибо можно по-
казать, что d e t ( Z4 + 1Х2)Ф 0 при 2 е 8р2 п.)»Однои з непрерывных отобра
жений S p2 n Т такое, что индуцированное отображение фундаменталь
ных групп — изоморфизм, дается формулой Z ei(p, где ф — Arg Z.
Уравнение (1.4) называется неколебательным, если приращение ар
гумента * • •'
A A r g Z ( . ) | S - A r g Z ( 0 - A r g Z ( 0 ) (1.17)
— ограниченная функция при t ~+ о°, и колебательным в противном слу
чае. Можно показать, что для уравнения с гамильтонианом (1.5) неогра
ниченность функции (1.17) равносильна тому, что она стремится к + ° ° при / ~у 0 0. Итак, колебательность уравнения (1.4) означает, что точка Z(t) неограниченно «закручивается» в «торе» S p2 n.
Уравнение (1,4) называется сильно, неколебателъным, если оно неко
лебательно и это свойство сохраняется при любой малой (в L-норме) де
формации гамильтониана H(t).
Оказывается, что при наличии условия (1.6) условие (1.8) равно
сильно неколебательности уравнения (1.4) (с гамильтонианом ( 1 . 5 ) ) , а оба эти условия равносильны сильной неколебательности уравнения
(1.4). Итак, любое из утверждений ( A ) — (G) теоремы 2 равносильно лю
бому из приведенных ниже утверждений.
(Н) Уравнение (1.4) вполне неустойчиво (выполнено (1.6)) и не
колебательно (| Д Arg Z (•) |о | ^ c o n s t ) .
(J) Уравнение (1.4) сильноfнёколебателъно.
Доказательство этих фактов будет приведено в следующей статье.
Там же будет показано, что в функциональном пространстве гамильто
нианов { # ( • ) } (с L-нормой) множество гамильтонианов, отвечающих вполне неустойчивым уравнениям, распадается на счетное число откры
тых связных и односвязных областей и лишь для одной из них соответ
ствующие уравнения неколебательны. Именно в эту область попадают гамильтонианы (1,5) при условии разрешимости указацной оптимизаци
онной задачи. Отсюда следует, в частности, что условия полной неустой- чиво®ти (1.6) и неколебательности (1.8) независимы.
Перейдем к исследованию оптимизационной задачи (0.1) — (0.3).
§ 2. Необходимые условия в оптимизационной задаче
Пусть А(), Ь ( - ) ~ - периодически стабилизируемая пара, но. предпо
ложения Г(t)> T f0/ m > 0 пока не делаем.
В этом параграфе будет показано, что из ( А ) вытекает неравенство Г ( 0 > 8 , а при Г ( 0 > б /т> 0 > Х А ) " * ' ( С ) . Пусть выполнено ( А ) .
Необходимые условия оптимальности можно получать разными спо
собами. Мы воспользуемся абстрактной теорией оптимизации [33]. s Согласно [33] должны быть выбраны пространства X , Y , Ua сг U , Уравнения (0.1) и # ( 0 ) = а должны быть записаны в виде абстрактного Уравнения F (х, и) = Оу, где х е X , и е Ua. В качестве пространств X , U, Ua, Y берем пространства *} Х « W j[ ( 0 , o o ) - * Rn] , U9 = U =
^ 21 ( 0 , o o ) - > Rm] , Y = Y4X Y2, Y4« Z* [ ( 0 , « ) - R « ] , Y2- R * . Схема [33] требует однозначной разрешимости уравнения F (х, и) « Оу относи
тельно х е Х при фиксированном й ^ и , Для уравнений (0.1) и х(0)=*а это имеет место, если А (•) — гурвицева матричная функция. В общем слу-
*) Здесь WgKO, oo)-^Rn]—пространство Соболева п^векторнозначных абсолютно непрерывных функций х(>): (0, o o ) ~ * R * с нормой \\x{-)f = j ( | х (t) |а+ | х (t) ?)dt.
Аналогичный смысл имеют другаш подобные СИМВОЛЫ.
13*
чае, вспоминая, что iA(-), Ь()} — периодически стабилизируемая пара, делаем замену
Ui(t)^tt(t)+:c(t)^x(t)- (2.1) такую, что А±(-) = А(-)+ Ь()с(-)* — гурвицева матричная функция.
В качестве абстрактных управления и состояния берем щ(-)&U, #(-)е=
е Х и считаем, что отображение у = F[x(), и()] определено формулами yi(t) = dx{t)/dt - AiWxit)- b(t)ui(t), г /2^ = х ( 0 ) - а , где у = [ i / i ( ) , yz] e
«= Y, t /t( - ) e Y , , i/2€= Y2. При этом уравнение JF[ # ( ) , И ( • ) ] = Оу равно
сильно исходным уравнениям (0.1) и # ( 0 ) = а.
Согласно (0,3) подлежит минимизации функционал
оо
Ф [ ж ( - )) « i ( - ) ] = J s ^ M ( ' W ' ) ] ^ . (2.2) где
(£, а?,Mj) = . ? ( £ , хл ut — с ( £ ) * х) =
- у С ^ ^ ж + г ^ ^ О ^ + ^ Г ^ л ) . (2.3) Так как (?i(£), gt( £ ) , Г(£)-— ограниченные матричные функции, то инте
грал в (2.2) сходится для #(•)«= X , 1 г4( ) е и , т. е. Ф: X X U R1. Итак, рассматриваемая задача сведена к абстрактной схеме [33].
Пусть х(-), Ui(•) — оптимальный процесс. Применим теорему 1.1 [33].
Очевидно, что выполнено условие ( А ) [33]. Уравнение у — 8x{.)F(x(-)1
Ui(-)\ h(>)) относительно h(-)^X совпадает с системой yiity^dhW/dt-AtWhit), yz = h(0).
При # == fj/i*(), yzl^Y эта система, очевидно, однозначно разрешима от
носительно fe(-)eX, т. е. выполнено условие ( В ) [33].
Лагранжиан L = l*F + Ф задачи (/* е Y * ) имеет вид
оо оо * ,
L = j 9xdt + J t|> (t)* (dx/dt — Axx + Ъиг) dt + it [x (0) — а], щ (2.4)
о 0
где я|?(-)'^ Yl f !2 eY2 однозначно находятся из абстрактного сопряженно
го уравнения = 0. Ищем if>() в более узком классе \ f > ( - ) e X . Тогда
\x(t) I + \ty(t) I ~>- 0 при ^ оо и L преобразуется к виду ОО 00
Ь = — J <ЖХ^— J + ( /2 — ^ (0))* д: (0) — г*а, (2.5) о о
где 3%?i =5^1 (f,-.ip(0, # ( 0 > М О ) » причем
Ж ( « , ^ , я, B i ) « i | ) * ( i 4 ( 0 * +b( ? ) ' » i ) - ^ i ( ' » М - (2-6) . Уравнение (т. е. 63 C {.)L ( x ( ) , w ( ) l f e ( ) ) = 0 У Л ( ) е = Х ) удов
летворяется, если h ф(0) и
<й|)уШ == — ( = — + Схж + g ^ ) . (2.7) Так как А{(-) — гурвицева матричная функция, то из (2.7) однозначно
определяется г|)(-)е=Х. В силу единственности найденный функци
онал / * ~ [ i | ) ( - ) * , является искомым. ,
В качестве липшицева пучка кривых и (г 1ц) [33, теорема 1.1] возь
мем стандартный пучок иф, e l i ? ( ) ) = М 0 +8 У( 0 » где v(-)&U. По тео
реме 1.1 [33] выполнено (1.22) [33], т. е.
1 00
S «l (. ) L (dL/дщ(.•))v(.) - - J (DMx/dux)v(t)dt^Q о
для всех Следовательйо, (дЖх/дщ)^0. Это уравнение и урав-
нение (2.6) совпадают с двумя последними уравнениями (1.2), причем в (1.1) Ж(1, tf, х, u) = a%>i(t, г|}, х, щ). Итак, доказана
Лемма 1. Из условия ( А ) следует:
( А ' ) для любого a e Rn система (1.2) имеет решение я ( - ) е Х , ф(*)<=
е Х , u(')^U такое, что .г (0) = а.
В качестве х(-), и(-) может быть взят оптимальный процесс в за
даче ( 0 . 1 ) - ( 0 . 3 ) .
Возьмем в качестве пучка и(г\\х) в теореме 1.1 [33] пучок простых игольчатых вариаций [33, раздел 2.1°]. Лагранжиан (2.5) имеет вид (0.11) [33]. Согласно утверждению в конце раздела 2.^° [33, с. 699] усло
вие 6U l( . ) L ^ 0 приобретает вид принципа максимума (0.12) [33], где Ж[Ь, и) = Ж(1, t| ) ( 0 , x(t), v) + const, т. е.*>
Жх(1, f (*), x(t), ь)<Ж{{1, г| ) ( 0 , x(t), » t ( 0 ) . (2.8)
Здесь по-прежнему x(t), u(t) — оптимальный процесс, а t — точка непре
рывности (или точка Лебега) функции Ut(-) и v & Rm —- произвольный вектор. Из (2.8) с учетом (2.6) и (2.3) следует упомянутое во введении утверждение.
Лемма 2. Условие ( А ) влечет T(t)>0 почти всюду.
Предположим теперь, как и в теореме 1, что T(t) ^ у0/ т > 0, и пре
образуем необходимое условие, даваемое леммой 1, к более удобному
«формульному» виду. Так существует Т(1)"~~1^уо~11т, то законен переход к системе (1.3) и уравнению (1.4). Пусть L( + ), L( 0 ), — сум
мы корневых подпространств матрицы монодромии Z(T). уравнения (1.4), отвечающих собственным значениям pj соответственно с Ipjl < 1, с | р;| =
= 1 и с Ipjl > 1. Так как Z(T) — вещественная матрица, то спектр Z(T) расположен симметрично относительно вещественной оси (с учетом жор- дановой структуры матрицы Z(T)), а это значит, что каждое из подпро
странств L( + ), L( 0 ), Z /( _ ) вещественно. Вещественность подпространства означает его инвариантность относительно операции комплексного со
пряжения или, что то же [31, гл. 1], возможность выбора в нем вещест
венного базиса. Так как Z(Т) — симплектическая матрица (т. е. Z = Z ( r ) удовлетворяет уравнению Z*/Z = / ) , то спектр матрицы Z(T) с учетом ее жордановой структуры (т. е. числа и порядка элементарных делите
лей) расположен симметрично относительно единичной окружности [31, гл. 3]. Отсюда следует, что размерности = d i m L( ± ) совпадают: ki+) —
Так как C2 n - £,<+> 4- L(0) + L(~\ то In - 2kw + &<°\ где &( 0 ) =
— d i m L( 0 ). Решение z(t)=*[x(t), $(t)] уравнения (1.4) обладает свой
ством I ( - ) E X , t|)(-)e=X (свойством I z ( - ) I e L2( 0 , 0 0) ) тогда и только тогда, когда z ( 0 ) e = L( + ).
Лемма 3, Условие ( А ' ) равносильно условию:
( А " ) удовлетворяется частотное условие (1.6) (и, следовательно, корректно определены матрицы ( 1 . 7 ) ) , а также d e t X ( 0 ) ^ 0.
При выполнении условия ( А ' ) решение х(-), t|)(-), и(-) в ( А ' ) опре
деляется однозначно.'
Д о к а з а т е л ь с т в о. Пусть выполнено ( А ' ) . Так как для любого
a == # ( 0 ) < = Rn существует ре1нение %(t) уравнения (1.4) со свойством Iz(-) | е= L2( 0 , 00), то имеется по крайней мере п линейно независимых решений с этим свойством. Поэтому / с( + ) > п. Так как 2п =* 2k{+) + fci0), то к{+) = п, кт = 0. Последнее равенство означает, что нет собственных значений р, с Ipjl = 1, т. е. выполнено частотное условие (1.6). Итак, корректно определены матрицы (1.7). 4
Решения Zj(£) = [xj(t), tyj(t)], j = 1, . . . , п,— полпый набор линейно независимых решений уравнения (1.4) со свойством ж ( ) ^ X, г|)()<= X .
** В [ 3 3 ] для простоты рассмотрен случай кусочно-непрерывных 'управлений
г / (•). Легко видеть, что доказательство проходит £ естественными изменениями для
(лучая локально суммируемых управлений и(-).
Произвольное вещественное решение с ьтц свойством есть
'z(t)-X(t)cf i j ) ( * J - V ( f t c ( с е Г ) , (2.9) Покажем, что йе%Х(0)Ф0. Пусть d e t X ' ( 0 ) = Q, r * X ( 0 ) = 0, r e R « ,
г ^ О . Из (2.9) следует, что при # ( 0 ) = а, г*аФ0 уравнения (2.9) не
разрешимы относительно с, что противоречит ( А ' ) . Итак, d e t Х ( 0 ) ^ 0 , т. е. ( А ' ) = * { А " ) .
Пусть выполнено ( А '7) . Из (2.9) для t =*= 0 имеем а = Х ( 0 ) с , откуда однозначно определяется вектор с, а значит, и # ( • ) , ф ( ) с указанным в ( А ' ) свойством. Из третьего уравнения (1.2) однозначно находится u(t^V(ty%b(t)^(t) — g(t)Hit)l Лемма 3 доказана.
Изложенное показывает, что (необходимое условие, даваемое ^прин
ципом максимума, эквивалентно условию ( А ' ) , а значцт, и ( А " ) . Пе
рейдем теперь к установлению дополнительного необходимого условия detX(t)^ 0 (Vt>0), которое, как покажет специальный анализ, явля- , ется независимым от принципа максимума, т. е. может не выполняться,
хотя условие ( А ' ) выполнено.
Лемма 4. Пусть выполнено условие ( А ) , а значит, и ( А ' ) . Тогда пара #(•), и(-) в условии (А') — оптимальный процесс в задаче
( 0 . t ) - ( 0 . 3 ) .
Действительно, пусть х ° ( - ) , и°()~~ существующий согласно усло
вию ( А ) оптимальный процесс в этой задаче. По лемме 1 найдется функ
ция -ф0(*)€=Х такая, что # ° ( ) , i | ?0( ) , и°()— решение системы (1.2). По лемме 3 тройка # ( • ) , « ф ( ) , и() с указанными свойствами определяется однозначно, т. е, х(-)=* х0(), и uQ()—оптимадьный процесс.
Лемма 5. Пусть любое решение уравнения dx/dt = Ai(t)x, где
\Ai(t) I < const, обладает свойством \х(-) \ ^ Ь2(0, «>). Пусть d^Jdt =
— — А * е £ ,2( 0 , оо). foa^a 0.
Д о к а з а т е л ь с т в о . Имеем d(t|?*a:)./di — 0, ty(t)*x(t)^const. Из hr(-) I, '|<£г(*)Л2*1 €= £2( 0 „ оо) следует \x(t) I 0 при £ о о . Поэтому и
* 1ф(£) I 0 при t оо, §(t)*x(t)^0. Так как вектор #(£0) может быть любым, то IJ)(^)SB 0.
Лемма 6.' Пурть х*** х(t), ф = ф(£), и == u{t)— решение системы (1.2) со свойством \х('У\ + \щ) I е Z/2(0, оо), Тогда*
оо •
J ^ ( f , a : , u ) d ^ ^ i - i | ) ( 0 f a : ( 0 ) . (2.10) Д о к а з а т е л ь с т в о . Из третьего уравнения (1.2) имеем и'($) =
— Т~Х{$*Ъ — g * # ) , \и(*)\ е ' Ь2( 0 , оо), поэтому интеграл в (2.10) сходит
ся. Согласно (1.1) 9 = — Ж Интегрируя по частям* с использова
нием условия . !ф(01 -* 0, \x(t) I 0 при £ оо (которое следует из ( 1 . 2 ) ) , получаем
; 2 ] 9dt - J + j (<ф*ж — 25$) eft « f *ж + | ( - ^ * * + i*^—2M)dt^
о 0 9 0
~ . - * ( 0 ) * * ( Q ) 4 - * + ^ + M u - 2 ^ ] d f . (2.11) Мы воспользовались здесь уравнениями (1.2). Так как Ж *~ квадратич
ная форма переменных ж, щ то по теореме Эйлера выражение в квад
ратной скобке равно тождественно нулю, и мы имеем (2.10).
Лемма 7. ПуЬтъ x^x(t), ••ifmif(t)y и«u(t)рщшешие системы
(1.2), причем x(t0)*** 0. ГогйЬ ,
| f ( ^ , ^ (2.12)
Д о к а з а т е л ь с т в о получается из предыдущей выкладки (2.11 ) \ если заменить в (2.11) o ol Ha i0.
Лемма 8 (аналог необходимого условия Якоби). Пусть x(t), u(t)-~
оптимальный процесс в'задаче (0.1) — ( 0 . 3 ) и х(0)^аФ 0. Тогда х(1)Ф0 при t > 0.
Д о к а з а т е л ь с т в о. Предположим противное: х (t0) = 0, t0 > 0. По лемме 1 существует такая функция ф(£)', что x(t)b u(t), ty(t)— решение системы (1.2) с о свойством \х(-)\ + e t2( 0 , оо). По лемме 5 вы
полнено ( 2 . 1 0 ) . Построим процесс [#i(*}, полагая . Ui(t)]^
= [#(£), u(t)] при 0<t<tQ и [xi(t)y Ui(t)] = 0 при t>t0. Этот процесс допустим, так как #i(O) = 0, почти всюду верно (0.1) и в силу условия х(и)~0 функция xt(t) непрерывна при t = а значит, и на [0, оо}.
Имеем
во *0
3ft — J <$ (tyXi, ut)dt a* J У (t, а;, и) = — i- ф (0)*a.
о 0
Последнее равенство выполнено согласно лемме 6. Сравнивая, с (2.10)\
получаем, что # i ( ) , Ui() — тоже оптимальный процесс. Следовательно, существует такая функция ф4( • ) , что . z , ( - )v U j ( - ) , ф4"(•) — решение си
стемы (1.2) со свойством U ( - ) I + ] ф ( ) I ^ L2( 0 , оо). По лемме 3 x(t)^
-#*(£), u(t)=~Ui(t), ty(t) = i\(t), т. e. x(t)^0, u(t)^0 при t > t«.
Из (1.2) (или из ( 1 . 3 ) ) имеем dty/dt= —A(t)*ty, $*b(t)**0 при t>t0 и, следовательно, dty(t)/dt = — Ai(i)+ilp(t), где А4( ) = А ( - ) + Ъ(•)с
гурвицева матричная функция. По лемме 5 г|)(£) — 0 при t > t0.
Итак, решение z(t) = [x(t), ty(t)] уравнения (1.4) обладает свой
ством z(t)^z 0 при t>t0. Поскольку z(t) = Z(t)z(0), то z ( 0 ) = 0, т. е.
#(0) = a = 0. Противоречие показывает, что х(Ь)Ф 0 при £ > 0 .
З а м е ч а н и е . Из приведенного выше доказательства следует так
же, что если x(t), u(t)— оптимальный процесс в задаче (0.1) —(0.3)?
и # ( 0 ) = 0 , то x(t)^0, к ( 0s5 0.
Лемма 9. Пусть выполнено условие ( А ) . Тогда ,detX(t)¥= 0 пр&
£ > 0 . «Бош u(t), ty(t)—произвольное решение системы (1.2) м !«(••) I + 1ф(-)1е ^ ( 0 , оо)., я ( 0 ) = ^ 0 , г о # ( £ ) ^ 0 при t>0.
Д о к а з а т е л ь с т в о . По леммам 1, 4 #(•)> и( •) —- ойтимальный процесс в задаче (0.1)-— ( 0 . 3 ) . В силу леммы 7 лх^)Ф 0 при £ > 0 . Пусть d e t X ( *0) = 0 , £0> 0 , и Х(£0)Со = 0, с0^ 0 . По лемме 3 d e t X ( 0 ) ¥ = 0 , т. е, U> 0. Функций (2.9) с с с0 удовлетворяют системе (1.2) и \х(-) I + + 1ф(-)1 е £2( 0 , оо). При этом а = = ж ( 0 ) = Х ( 0 ) св^ 0 , ибо d e t X ( 0 ) f - 0 . По доказанному x(t0) = X(t0)cQ¥= 0. Противоречие означает, что йвЬХ(и)Ф 0, что и требовалось доказать.
Выше было показано (леммы 1, 3 ) , что. из условия ( А ) следует час^
тотное условие ( 1 . 6 ) . Мы доказали теперь, что из условия ( А ) вытекает неравенство d e l Х Ц ) Ф 0 (vt>0): Итак, (А) ( С ) .
§ 3. Доказательство теоремы 2
В этом параграфе будет доказана теорема 2 в предположении, что T(t)> Ыт > 0 и Ы ( ) , &(•)) — периодически стабилизируемая пара. Из теоремы 1, доказанной независимо в § 4, следует, что теорема 2 справед
лива и в предоодожении //^-стабилизируемости пары L 4 ( ) , b(-)}.
Равносильность утверждений ( A ) — (F) докажем, установив две по
следовательности импликаций: * / ? х
( A ) ^ ( C ) ^ ( D ) ^ ( E ) ^ ( A ) , ( 3 1 ) ( C ) ^ ( B ) ^ ( F ) ^ ( A ) . / ( 3 . 2 }
Импликация ( А ) / ^ (С) доказана выше. Bee дрочив ймшшказри ус-
тановим лишь в предположении Г (t)> ^Jm > О, и это обстоятельство будет использовано далее.
( C ) = ^ ( D ) . Пусть выполнено частотное условие (1.6) и d e t X ( £ ) ^ 0 при 0 < t < Т. Покажем, что матрицы Х ( £ ) , W (t) в (1.7) имеют вид
X ( ( ) - . P1( * j eW e' , V(t)-P2(t)eNo\ (3.3) где Pj(t + T) — P}(t) и iVo — гурвицева п X гг-матрица; Pj(t) и iVo — вооб
ще говоря, комплексные матрицы. Пусть по-прежнему Z(t) — эволюцион
ная матрица уравнения (1.4). По теореме Флоке — Ляпунова [31].
Z(t)=*P(t)eNt, где P(t+T) = P(t), iV==const, причем 2п X 2гс-матрицы P(t) ж N могут быть и комплексными (хотя Z(t) —- вещественная матри
ца). Пусть Vj — собственные значения матрицы N. Тоща = exp(vjf) — мультипликаторы уравнения (1.4). Частотное условие (1.6) означает, что Ipjl Ф 1, т. е. что R e v j ^ 0. Поэтому
1 \ Ni о
* - * " ' [ о - - л
0 • 0 е~"*\ 5,
где Ni и iV2 — гурвицевы матрицы, S — неосрбая 2п X 2/г-матрица. Ё си
лу симметрии спектра Z(T) относительно единичной окружности матри
цы Ni и Nz имеют размер пХп. Обозначая Р(t) S"1 —Q (t) и разбивая Q(t) на четыре п X тг-подматрицы Q(t)= WQjh(t)W, получим
е 0 1 IQuWe Q2i(t)e 1 О е 2 J LCi9(t)e ' . ^ ( О * 1 Первые столбцов матрицы (3.4) образуют полный набор линейно не
зависимых решений Zj(t) = [xj(t), % ( 0 ] уравнения (1.4) со свойством Uj(-) I е £г(0, оо). Произвольный набор линейно независимых решений уравнения (1.4) с указанным свойством совпадает со столбцами матрицы
при подходяще выбранной гг X га неособой комплексной матрице С.
Здесь NQ — C^NIC и Pj(£) = Qji(t)C. Набор решений (1.7) обладает до
полнительно свойством вещественности. Согласно изложенному он имеет вид (3.5) с некоторой, вообще говоря, комплексной матрицей С. Так как Q(t + T)=~Q(t), то Pi{t + T) = Pi{t). Итак, введенные в § 1 матрицы X(t) и W(t) имеют вид (3.3).
Из (3.3) следует, что detX(t) = АеЬРА(Ь) ехр (SpiV,0- Так как detX(t)¥*0 при 0<t<T и P,(£ + Г) = />,(£), то d e t P i ( 0 ^ = 0 при 0<t^T и d e t X ( 0 ^ 0 при всех t > 0. Положим '
R(t)^^w(t)X(t)-K , (з:в) Так как Чг (t) и Х ( £ ) ~ - вещественные матрицы, то R(t) — вещественная1
матрица. Из (3.3) вытекает, что R{t + Г ) = R(t).
По свойству ^-ортогональности корневых подпространств матрицы Z(T) с собственными значениями ри р2, р4р2 ^ 1 [31, с. 156] имеем
' 4(t)*X{t)~X(t)4'(t)~0. (3.7) Тождество (3.7) легко доказать и непосредственно. Для двух реше-
.ний Zi Zi(t) и z2 = z2( 0 уравнения (1.4) выполнено d f ( z * ^ z2) / d f ssO.
2 * 5 % £ 2 c o n s t . Так как для решений = [#j, tyj] из (1.7) z}(t) ~+ О при ^ оо, то для h h x z *Jz /i s 0 , что совпадает с (3.7). Из (3.7) сле-
Д у е т . Д Ш * = = Д М , : -