• Nenhum resultado encontrado

А. С. Булдаев, Новый подход к оптимизации управляемых систем на основе краевых задач, Автомат. и телемех. , 2011, выпуск 6, 87–94

N/A
N/A
Protected

Academic year: 2023

Share "А. С. Булдаев, Новый подход к оптимизации управляемых систем на основе краевых задач, Автомат. и телемех. , 2011, выпуск 6, 87–94"

Copied!
9
0
0

Texto

(1)

Math-Net.Ru

Общероссийский математический портал

А. С. Булдаев, Новый подход к оптимизации управляемых систем на основе краевых задач, Автомат. и телемех. , 2011, выпуск 6, 87–94

Использование Общероссийского математического портала Math-Net.Ru подразумевает, что вы прочитали и согласны с пользовательским соглашением

http://www.mathnet.ru/rus/agreement Параметры загрузки:

IP: 139.59.245.186

6 ноября 2022 г., 02:00:08

(2)

Автоматика и телемеханика,№ 6, 2011

⃝c 2011 г. А.С. БУЛДАЕВ, д-р физ.-мат. наук (Бурятский государственный университет, Улан-Удэ)

НОВЫЙ ПОДХОД К ОПТИМИЗАЦИИ УПРАВЛЯЕМЫХ СИСТЕМ НА ОСНОВЕ КРАЕВЫХ ЗАДАЧ1

Для нелокального улучшения управления в линейных по управлению си- стемах конструируется специальная дифференциально-алгебраическая краевая задача. На основе краевой задачи улучшения формулируется новое необходимое условие оптимальности, усиливающее принцип максимума. Приводятся приме- ры строгого улучшения управлений, удовлетворяющих принципу максимума, с помощью решения предложенной краевой задачи.

1. Введение

В [1, 2] в классах линейных и полиномиальных по состоянию задач оптималь- ного управления были построены методы нелокального улучшения, основанные на нестандартных формулах приращения функционала без остаточных членов разло- жений. Отсутствие операции слабого или игольчатого варьирования управлений на каждой итерации и возможность улучшения управлений, удовлетворяющих принци- пу максимума, обуславливают повышенную эффективность построенных методов.

В [3] разработана процедура нелокального улучшения управлений в линейно управляемых полиномиальных по состоянию системах, основанная на свойствах опе- рации проектирования. Платой за нелокальность улучшения является решение диф- ференциальных краевых задач, которые значительно проще краевой задачи принци- па максимума по свойствам гладкости. В [4] предложен новый подход к нелокально- му улучшению управлений в нелинейных по состоянию системах общего вида на ос- нове дифференциально-краевых задач. В данной работе разработанный в [3] подход для улучшения линейно управляемых систем модифицируется с учетом построения дифференциально-алгебраических краевых задач по аналогии с [4].

2. Краевая задача улучшения Рассматривается задача оптимального управления

Φ(𝑢) =𝜑(𝑥(𝑡1)) +

𝑇

(⟨𝑎(𝑥(𝑡), 𝑡), 𝑢(𝑡)⟩+𝑑(𝑥(𝑡), 𝑡))𝑑𝑡→min

𝑢∈𝑉, (1)

˙

𝑥(𝑡) =𝐴(𝑥(𝑡), 𝑡)𝑢(𝑡) +𝑏(𝑥(𝑡), 𝑡), 𝑥(𝑡0) =𝑥0, 𝑢(𝑡)∈𝑈, (2)

где 𝑥(𝑡) = (𝑥1(𝑡), . . . , 𝑥𝑛(𝑡)), 𝑢(𝑡) = (𝑢1(𝑡), . . . , 𝑢𝑚(𝑡))– векторы состояния и управ- ления соответственно,𝑡∈𝑇 = [𝑡0, 𝑡1]. В качестве допустимых управлений рассмат- ривается класс𝑉 кусочно-непрерывных на 𝑇 функций со значениями в выпуклом множестве𝑈 ⊆𝑅𝑚. Начальное состояние𝑥0 и отрезок𝑇 заданы.

1 Работа выполнена при финансовой поддержке Российского фонда фундаментальных иссле- дований (проекты №№ 08-01-00945-а, 09-01-90203-Монг_а) и Российского гуманитарного научного фонда (проект № 09-02-00493-а).

(3)

Предполагаются выполненными стандартные условия:

1) функция 𝜑(𝑥) непрерывно дифференцируема в 𝑅𝑛, функции 𝐴(𝑥, 𝑡), 𝑏(𝑥, 𝑡), 𝑎(𝑥, 𝑡),𝑑(𝑥, 𝑡)и их производные по𝑥непрерывны по совокупности аргументов(𝑥, 𝑡) на𝑅𝑛×𝑇;

2) функции 𝐴(𝑥, 𝑡), 𝑏(𝑥, 𝑡) удовлетворяют условию Липшица по 𝑥 на 𝑅𝑛×𝑇 с константой𝐿 >0.

Поставим задачу улучшения заданного управления 𝑢0 ∈ 𝑉: найти управление 𝑣∈𝑉 с условиемΦ(𝑣)⩽Φ(𝑢0).

Функция Понтрягина с сопряженной переменной𝑝∈𝑅𝑛 в задаче (1), (2) имеет вид

𝐻(𝑝, 𝑥, 𝑢, 𝑡) =𝐻0(𝑝, 𝑥, 𝑡) +⟨𝐻1(𝑝, 𝑥, 𝑡), 𝑢⟩, где введены обозначения:

𝐻0(𝑝, 𝑥, 𝑡) =⟨𝑝, 𝑏(𝑥, 𝑡)⟩ −𝑑(𝑥, 𝑡), 𝐻1(𝑝, 𝑥, 𝑡) =𝐴T(𝑥, 𝑡)𝑝−𝑎(𝑥, 𝑡), 𝐴T– транспонированная к𝐴 матричная функция.

Для заданного параметра 𝛼 > 0 и допустимого управления 𝑢∈ 𝑉 рассмотрим проекционное отображение

𝑢𝛼(𝑝, 𝑥, 𝑡) =𝑃𝑈(𝑢(𝑡) +𝛼𝐻1(𝑝, 𝑥, 𝑡)), 𝑝∈𝑅𝑛, 𝑥∈𝑅𝑛, 𝑡∈𝑇, где𝑃𝑈 – оператор проектирования на множество𝑈 в евклидовой норме.

Согласно известному свойству проекции имеем

⟨𝐻1(𝑝, 𝑥, 𝑡), 𝑢𝛼(𝑝, 𝑥, 𝑡)−𝑢(𝑡)⟩⩾ 1

𝛼∥𝑢𝛼(𝑝, 𝑥, 𝑡)−𝑢(𝑡)∥2. (3)

С помощью отображения𝑢𝛼принцип максимума в задаче (1), (2) для управления 𝑢∈𝑉 представляется в форме условия

𝑢(𝑡) =𝑢𝛼(𝜓(𝑡, 𝑢), 𝑥(𝑡, 𝑢), 𝑡), 𝑡∈𝑇, 𝛼 >0, (4)

где 𝑥(𝑡, 𝑢), 𝑡 ∈ 𝑇, – решение системы (2) для допустимого управления𝑢(𝑡), 𝑡 ∈ 𝑇; 𝜓(𝑡, 𝑢),𝑡∈𝑇, – решение стандартной сопряженной системы:

𝜓(𝑡) =˙ −𝐻𝑥(𝜓(𝑡), 𝑥(𝑡), 𝑣(𝑡), 𝑡), 𝜓(𝑡1) =−𝜑𝑥(𝑥(𝑡1)) при𝑥(𝑡) =𝑥(𝑡, 𝑢), 𝑣(𝑡) =𝑢(𝑡), 𝑡∈𝑇.

Для допустимых управлений𝑢0,𝑣 обозначим приращение Δ𝑥(𝑡) =𝑥(𝑡, 𝑣)−𝑥(𝑡, 𝑢0), 𝑡∈𝑇.

Пусть дифференцируемая функция𝑝(𝑡),𝑡∈𝑇, удовлетворяет дифференциально- алгебраической сопряженной системе:

˙

𝑝(𝑡) =−𝐻𝑥(𝑝(𝑡), 𝑥(𝑡, 𝑢0), 𝑢0(𝑡), 𝑡)−𝑟(𝑡),

𝐻(𝑝(𝑡), 𝑥(𝑡, 𝑣), 𝑢0(𝑡), 𝑡)−𝐻(𝑝(𝑡), 𝑥(𝑡, 𝑢0), 𝑢0(𝑡), 𝑡) =

= ⟨𝐻𝑥(𝑝(𝑡), 𝑥(𝑡, 𝑢0), 𝑢0(𝑡), 𝑡),Δ𝑥(𝑡)⟩+⟨𝑟(𝑡),Δ𝑥(𝑡)⟩, с краевыми условиями:

𝑝(𝑡1) =−𝜑𝑥(𝑥(𝑡1, 𝑢0))−𝑞,

𝜑(𝑥(𝑡1, 𝑣))−𝜑(𝑥(𝑡1, 𝑢0)) =⟨𝜑𝑥(𝑥(𝑡1, 𝑢0)),Δ𝑥(𝑡1)⟩+⟨𝑞,Δ𝑥(𝑡1)⟩,

где величины𝑟(𝑡), 𝑞определяются указанными алгебраическими соотношениями.

(4)

Тогда в соответствии с [4] приращение функционала в задаче (1), (2) для допу- стимых управлений𝑢0,𝑣 принимает вид

Φ(𝑣)−Φ(𝑢0) =−

𝑇

⟨𝐻1(𝑝(𝑡), 𝑥(𝑡, 𝑣), 𝑡), 𝑣(𝑡)−𝑢0(𝑡)⟩𝑑𝑡.

(5)

Формула (5) не содержит остаточных членов каких-либо разложений.

Рассмотрим дифференциально-алгебраическую краевую задачу:

˙

𝑥(𝑡) =𝐴(𝑥(𝑡), 𝑡)𝑢𝛼(𝑝(𝑡), 𝑥(𝑡), 𝑡) +𝑏(𝑥(𝑡), 𝑡), 𝑥(𝑡0) =𝑥0, (6)

˙

𝑝(𝑡) =−𝐻𝑥(𝑝(𝑡), 𝑥(𝑡, 𝑢0), 𝑢0(𝑡), 𝑡)−𝑟(𝑡), 𝑝(𝑡1) =−𝜑𝑥(𝑥(𝑡1, 𝑢0))−𝑞, (7)

𝐻(𝑝(𝑡), 𝑥(𝑡), 𝑢0(𝑡), 𝑡)−𝐻(𝑝(𝑡), 𝑥(𝑡, 𝑢0), 𝑢0(𝑡), 𝑡) =

= ⟨𝐻𝑥(𝑝(𝑡), 𝑥(𝑡, 𝑢0), 𝑢0(𝑡), 𝑡), Δ𝑥(𝑡)⟩+⟨𝑟(𝑡), Δ𝑥(𝑡)⟩, (8)

𝜑(𝑥(𝑡1))−𝜑(𝑥(𝑡1, 𝑢0)) =⟨𝜑𝑥(𝑥(𝑡1, 𝑢0)),Δ𝑥(𝑡1)⟩+⟨𝑞,Δ𝑥(𝑡1)⟩. (9)

Предположим, что краевая задача (6)–(9) допускает решение (𝑥(𝑡), 𝑝(𝑡)), 𝑡∈𝑇. Сформируем выходное управление по правилу

𝑣(𝑡) =𝑢𝛼(𝑝(𝑡), 𝑥(𝑡), 𝑡) =𝑃𝑈(𝑢0(𝑡) +𝛼𝐻1(𝑝(𝑡), 𝑥(𝑡), 𝑡)), 𝑡∈𝑇.

(10)

В целях уменьшения громоздкости обозначений зависимость решения и выходного управления от параметра𝛼явно не указывается.

Покажем выполнение свойства улучшения. Имеет место очевидное соотношение 𝑥(𝑡) = 𝑥(𝑡, 𝑣), 𝑡 ∈ 𝑇. Отсюда, используя (5) с учетом неравенства (3), получаем оценку приращения функционала

Φ(𝑣)−Φ(𝑢0) =−

𝑇

⟨𝐻1(𝑝(𝑡), 𝑥(𝑡), 𝑡), 𝑣(𝑡)−𝑢0(𝑡)⟩𝑑𝑡⩽

⩽ −1 𝛼

𝑇

∥𝑣(𝑡)−𝑢0(𝑡)∥2𝑑𝑡⩽0.

(11)

Система (6)–(9) аналогично [4] всегда может быть сведена к вспомогательной дифференциальной сопряженной системе следующим (возможно, не единственным) образом.

Уравнение (8) можно явно разрешить относительно𝑟(𝑡)через𝑥(𝑡), 𝑝(𝑡). Действи- тельно, в случае линейных по 𝑥 функций 𝐴(𝑥, 𝑡), 𝑏(𝑥, 𝑡), 𝑎(𝑥, 𝑡), 𝑑(𝑥, 𝑡) получаем

⟨𝑟(𝑡), 𝑥(𝑡)−𝑥(𝑡, 𝑢0)⟩= 0, 𝑡∈𝑇. В этом случае положим𝑟(𝑡) = 0, 𝑡∈𝑇.

В нелинейном случае переменную величину𝑟(𝑡)можно построить по следующе- му правилу. Если для некоторого𝑘 выполняется 𝑥𝑘(𝑡)∕=𝑥𝑘(𝑡, 𝑢0), то можно взять 𝑟𝑖(𝑡) = 0,𝑖∕=𝑘,𝑟𝑘(𝑡) = Δ𝑥𝐻− ⟨𝐻𝑥,Δ𝑥⟩

Δ𝑥𝑘 . Если для всех𝑖 имеем𝑥𝑖(𝑡) =𝑥𝑖(𝑡, 𝑢0), то полагаем𝑟(𝑡) = 0.

Аналогично указанному правилу уравнение (9) можно явно разрешить относи- тельно𝑞. При линейной зависимости функции 𝜑 определяем 𝑞= 0. В нелинейном случае если∀𝑖 𝑥𝑖(𝑡1) =𝑥𝑖(𝑡1, 𝑢0), то𝑞= 0; иначе если∃𝑘 𝑥𝑘(𝑡1)∕=𝑥𝑘(𝑡1, 𝑢0), то𝑞𝑖= 0, 𝑖∕=𝑘,𝑞𝑘= Δ𝑥𝜑− ⟨𝜑𝑥,Δ𝑥⟩

Δ𝑥𝑘

.

Таким образом, от дифференциально-алгебраической системы (6)–(9) можно пе- рейти к вспомогательной двухточечной краевой задаче для обыкновенных диффе-

(5)

ренциальных уравнений:

˙

𝑥(𝑡) =𝐴(𝑥(𝑡), 𝑡)𝑢𝛼(𝑝(𝑡), 𝑥(𝑡), 𝑡) +𝑏(𝑥(𝑡), 𝑡), 𝑥(𝑡0) =𝑥0,

˙

𝑝(𝑡) =−𝐻𝑥(𝑝(𝑡), 𝑥(𝑡, 𝑢0), 𝑢0(𝑡), 𝑡)−𝑅(𝑝(𝑡), 𝑥(𝑡), 𝑡), 𝑝(𝑡1) =−𝜑𝑥(𝑥(𝑡1, 𝑢0))−𝑄(𝑥(𝑡1), 𝑡1).

При этом функции𝑅(𝑝, 𝑥, 𝑡), 𝑄(𝑥, 𝑡)в общем случае определяются не единственным образом.

Краевая задача (6)–(9) по свойствам гладкости существенно проще краевой за- дачи принципа максимума и дифференциально-алгебраических краевых задач в [3], которые основаны на известной операции на максимум функции Понтрягина.

В случае линейной по состоянию задачи (1), (2) (функции𝐴(𝑥, 𝑡), 𝑏(𝑥, 𝑡),𝑎(𝑥, 𝑡), 𝑑(𝑥, 𝑡),𝜑(𝑥)линейны по𝑥) краевая задача (6)–(9) сводится к двум последовательным непрерывным задачам Коши для сопряженной и фазовой систем. При этом предла- гаемая процедура улучшения становится эквивалентной известному проекционному методу нелокального улучшения [1].

Формализуем рассматриваемый подход к улучшению управления следующим об- разом. Введем дифференциально-алгебраическую сопряженную систему:

˙

𝑝(𝑡) =−𝐻𝑥(𝑝(𝑡), 𝑥(𝑡), 𝑤(𝑡), 𝑡)−𝑟(𝑡), (12)

⟨𝐻𝑥(𝑝(𝑡), 𝑥(𝑡), 𝑤(𝑡), 𝑡), 𝑦(𝑡)−𝑥(𝑡)⟩+⟨𝑟(𝑡), 𝑦(𝑡)−𝑥(𝑡)⟩=

= 𝐻(𝑝(𝑡), 𝑦(𝑡), 𝑤(𝑡), 𝑡)−𝐻(𝑝(𝑡), 𝑥(𝑡), 𝑤(𝑡), 𝑡) (13)

с краевыми условиями:

𝑝(𝑡1) =−𝜑𝑥(𝑥(𝑡1))−𝑞, (14)

⟨𝜑𝑥(𝑥(𝑡1)), 𝑦(𝑡1)−𝑥(𝑡1)⟩+⟨𝑞, 𝑦(𝑡1)−𝑥(𝑡1)⟩=𝜑(𝑦(𝑡1))−𝜑(𝑥(𝑡1)).

(15)

По определению положим𝑟(𝑡)≡0, если𝐴(𝑥, 𝑡), 𝑏(𝑥, 𝑡), 𝑎(𝑥, 𝑡), 𝑑(𝑥, 𝑡)– линейны по 𝑥. Также определим 𝑞 = 0, если 𝜑 – линейна. В нелинейных случаях если в некоторый момент времени𝑡 ∈𝑇 𝑦(𝑡) =𝑥(𝑡), то полагаем 𝑟(𝑡) = 0. При этом если 𝑡=𝑡1, то𝑞= 0.

В остальных случаях можно явно разрешить 𝑟(𝑡), 𝑞 из алгебраических уравне- ний аналогично тому, как было сделано выше. Таким образом, система (12)–(15) может быть сведена к вспомогательной дифференциальной сопряженной системе (возможно, не единственным образом).

Для допустимых управлений 𝑢, 𝑣 обозначим через 𝑝(𝑡, 𝑢, 𝑣), 𝑡 ∈ 𝑇, – решение системы (12)–(15) при 𝑥(𝑡) =𝑥(𝑡, 𝑢), 𝑤(𝑡) = 𝑢(𝑡), 𝑦(𝑡) = 𝑥(𝑡, 𝑣) (в предположении существования).

Понятно, что𝑝(𝑡, 𝑢, 𝑢) =𝜓(𝑡, 𝑢), 𝑡∈𝑇.

Формула приращения функционала (5) в новых обозначениях принимает вид Φ(𝑣)−Φ(𝑢0) =−

𝑇

⟨𝐻1(𝑝(𝑡, 𝑢0, 𝑣), 𝑥(𝑡, 𝑣), 𝑡), 𝑣(𝑡)−𝑢0(𝑡)⟩𝑑𝑡.

Выходное управление, формируемое по правилу (10), записывается в виде соот- ношения

𝑣(𝑡) =𝑢𝛼(𝑝(𝑡, 𝑢0, 𝑣), 𝑥(𝑡, 𝑣), 𝑡), 𝑡∈𝑇.

(16)

Обозначим множество допустимых выходных управлений дифференциально- алгебраической краевой задачи (6)–(9):

𝑉𝛼(𝑢0) ={𝑣∈𝑉 : 𝑣(𝑡) =𝑢𝛼(𝑝(𝑡, 𝑢0, 𝑣), 𝑥(𝑡, 𝑣), 𝑡), 𝑡∈𝑇}.

(6)

Имеем: если𝑢0∈𝑉𝛼(𝑢0)хотя бы для одного𝛼 >0, то

𝑢0(𝑡) =𝑢𝛼(𝑝(𝑡, 𝑢0, 𝑢0), 𝑥(𝑡, 𝑢0), 𝑡) =𝑢𝛼(𝜓(𝑡, 𝑢0), 𝑥(𝑡, 𝑢0), 𝑡), 𝑡∈𝑇, т.е. управление𝑢0 удовлетворяет условию принципа максимума (4).

Обратно, если𝑢0 удовлетворяет условию (4), то оно удовлетворяет условию (16) при𝑣=𝑢0 для всех𝛼 >0. Следовательно,𝑢0∈𝑉𝛼(𝑢0), 𝛼 >0.

Это значит, что краевая задача (6)–(9) для управления 𝑢0, удовлетворяющего принципу максимума, при любом𝛼 > 0 всегда допускает решение 𝑥(𝑡) = 𝑥(𝑡, 𝑢0), 𝑝(𝑡) = 𝜓(𝑡, 𝑢0). Следовательно, если краевая задача (6)–(9) не имеет решения хотя бы при одном𝛼 >0, то𝑢0не удовлетворяет принципу максимума.

Таким образом, справедливо следующее утверждение.

Л е м м а . Управление 𝑢0 ∈ 𝑉 удовлетворяет принципу максимума тогда и только тогда, когда𝑢0∈𝑉𝛼(𝑢0) хотя бы для одного𝛼 >0.

С л е д с т в и е (принцип максимума). Для оптимальности управления 𝑢0 ∈ 𝑉 необходимо, чтобы𝑢0∈𝑉𝛼(𝑢0)хотя бы для одного𝛼 >0.

Оценка (11) гарантирует строгое улучшение управления 𝑢0 ∈ 𝑉 (в том числе удовлетворяющего принципу максимума) при 𝑣 ∈ 𝑉𝛼(𝑢0), 𝑣 ∕=𝑢0. Таким образом, случай неединственности решения краевой задачи улучшения обеспечивает строгое улучшение управления, удовлетворяющего принципу максимума.

Оценка (11) позволяет сформулировать новое необходимое условие оптимально- сти на основе предлагаемого подхода улучшения.

Т е о р е м а (условие 𝐴). Для оптимальности управления 𝑢0 ∈𝑉 в задаче (1), (2) необходимо, чтобы оно было единственным управлением на выходе процедуры улучшения

𝑉𝛼(𝑢0) ={𝑢0} для всех 𝛼 >0.

Очевидно, что принцип максимума является следствием условия𝐴.

В терминах решения краевой задачи (6)–(9) условия оптимальности в задаче (1), (2) принимают следующую форму.

Принцип максимума. Для оптимальности управления𝑢0∈𝑉 необходимо, что- бы пара(𝑥(𝑡, 𝑢0), 𝜓(𝑡, 𝑢0))была решением краевой задачи(6)–(9)хотя бы для одного 𝛼 >0.

Условие 𝐴. Для оптимальности управления 𝑢0 ∈ 𝑉 необходимо, чтобы па- ра (𝑥(𝑡, 𝑢0), 𝜓(𝑡, 𝑢0))была единственным решением краевой задачи (6)–(9)для всех 𝛼 >0.

В линейной по состоянию задаче (1), (2) краевая задача улучшения сводится к двум гладким задачам Коши для сопряженной и фазовой подсистем, которые един- ственным образом определяют выходное управление𝑣для заданного𝛼 >0. Потеря свойства неединственности решения краевой задачи означает, что в данном линей- ном случае управление, удовлетворяющее принципу максимума, невозможно строго улучшить с помощью рассматриваемой процедуры. При этом принцип максимума и условие𝐴становятся эквивалентными.

Отметим в этом линейном случае, что свойство существования решения крае- вой задачи и оценка (11) гарантируют строгое улучшение любого управления, не удовлетворяющего принципу максимума.

В нелинейной по состоянию задаче (1), (2) возможен случай отсутствия решения краевой задачи улучшения при некотором𝛼 >0. Это означает, что управление 𝑢0 не удовлетворяет принципу максимума. В таком случае нужно изменить значение 𝛼 >0 или перейти к другим процедурам улучшения.

(7)

3. Примеры

П р и м е р 1 (улучшение особого управления). Рассматривается задача [3]:

Φ(𝑢) =−1 2

𝑇

𝑥2(𝑡)𝑑𝑡→min,

˙

𝑥(𝑡) =𝑢(𝑡), 𝑥(0) = 0, 𝑢(𝑡)∈𝑈 = [−1,1], 𝑡∈𝑇 = [0, 𝑡1].

Функция Понтрягина𝐻 =𝑝𝑢+1

2𝑥2, отображение 𝑢𝛼(𝑝, 𝑥, 𝑡) =𝑃𝑈(𝛼𝑝) =

𝛼𝑝, ∣𝛼𝑝∣⩽1,

−1, 𝛼𝑝 <−1, 1, 𝛼𝑝 >1.

Рассмотрим управление𝑢0(𝑡)≡0, которое является особым. Имеем𝑥(𝑡, 𝑢0) = 0, 𝑡∈𝑇,Φ(𝑢0) = 0. При этомΔ𝑥𝐻(𝑝, 𝑥(𝑡, 𝑢0), 𝑢0(𝑡), 𝑡) = 1

2𝑥2, Δ𝑥(𝑡) =𝑥(𝑡).

Дифференциально-алгебраическая краевая задача улучшения для𝑢0имеет вид:

˙

𝑥(𝑡) =𝑃𝑈(𝛼𝑝(𝑡)), 𝑥(0) = 0,

˙

𝑝(𝑡) =−𝑟(𝑡), 𝑝(𝑡1) = 0, 𝑟(𝑡)𝑥(𝑡) = 1

2𝑥2(𝑡).

Очевидно, для любого 𝛼 >0 задача имеет нулевое решение, что подтверждает свойства краевой задачи улучшения для управления, удовлетворяющего принципу максимума.

Из алгебраического уравнения получаем, что если 𝑥(𝑡) ∕= 0, то 𝑟(𝑡) = 1 2𝑥(𝑡).

В противном случае (𝑥(𝑡) = 0) по определению полагаем𝑟(𝑡) = 0.

В итоге получаем явную функцию 𝑅(𝑝, 𝑥, 𝑡) = 1

2𝑥и краевая задача сводится к вспомогательной дифференциальной задаче:

˙

𝑥(𝑡) =𝑃𝑈(𝛼𝑝(𝑡)), 𝑥(0) = 0,

˙

𝑝(𝑡) =−1

2𝑥(𝑡), 𝑝(1) = 0.

Как показано в [3], данная краевая задача для любого 𝛼 > 0 при 𝑡1 = 𝜋

√2𝛼+ +𝜋

√2

𝛼𝑘,𝑘= 0,1,2, . . ., допускает ненулевое решение при𝑝(0)∕= 0, ∣𝑝(0)∣⩽ 1 𝛼. При этом соответствующее выходное управление

𝑣(𝑡) =𝛼𝑝(0) cos

√𝛼

2𝑡, 𝑡∈𝑇,

строго улучшает особое управление𝑢0(𝑡),𝑡∈𝑇.

Отметим, что в данном примере дифференциально-алгебраическая краевая за- дача улучшения, применимая к общим нелинейным по состоянию системам управле- ния, позволяет добиться строгого улучшения особого управления без дополнитель- ного усложнения краевой задачи. В [3] для достижения эффекта строгого улучшения

(8)

потребовалась фазовая регуляризация исходной дифференциальной краевой задачи улучшения, ориентированной на полиномиальные по состоянию задачи оптималь- ного управления.

П р и м е р 2 (не полиномиальная по состоянию задача). Рассматривается извест- ная задача [5, с. 214], для которой подход [3] принципиально невозможен:

Φ(𝑢) = sin𝜋𝑥(1)

2 →min,

˙

𝑥(𝑡) =𝑢(𝑡), 𝑥(0) = 2, ∣𝑢(𝑡)∣⩽1, 𝑢0(𝑡) =−1, 𝑡∈𝑇 = [0,1].

Имеем𝑥(𝑡, 𝑢0) = 2−𝑡. ЗначениеΦ(𝑢0) = 1.

Функция Понтрягина𝐻(𝑝, 𝑥, 𝑢, 𝑡) =𝜓𝑢. Стандартная сопряженная система:

𝜓(𝑡) = 0,˙ 𝜓(1) =−𝜋

2 cos𝜋𝑥(1) 2 имеет решение𝜓(𝑡, 𝑢0)≡0.

Поскольку 𝐻(𝜓(𝑡, 𝑢0), 𝑥(𝑡, 𝑢0), 𝑢0(𝑡), 𝑡)≡0, 𝐻𝑢(𝜓(𝑡, 𝑢0), 𝑥(𝑡, 𝑢0), 𝑢0(𝑡), 𝑡)≡0 и Δ𝑢𝐻(𝜓(𝑡, 𝑢0), 𝑥(𝑡, 𝑢0), 𝑢0(𝑡), 𝑡)≡0, то управление𝑢0(𝑡)≡0– особое на 𝑇.

Отображение𝑢𝛼(𝑝, 𝑥, 𝑡) =𝑃𝑈(−1 +𝛼𝑝). Дифференциально-алгебраическая крае- вая задача улучшения имеет вид:

˙

𝑥(𝑡) =𝑃𝑈(−1 +𝛼𝑝(𝑡)), 𝑥(0) = 2,

˙

𝑝(𝑡) = 0, 𝑝(1) =−𝑞, 𝑞(𝑥(1)−1) = sin𝜋

2𝑥(1)−1.

Если𝑥(1) = 1, то полагаем𝑞= 0. Если𝑥(1)∕= 1, то полагаем

𝑞= sin𝜋

2𝑥(1)−1 𝑥(1)−1 .

Таким образом, функция𝑄имеет вид:

𝑄(𝑥) =

⎨

⎩ sin𝜋

2𝑥(1)−1

𝑥−1 , 𝑥∕= 1,

0, 𝑥= 1.

Получаем вспомогательную дифференциальную краевую задачу:

˙

𝑥(𝑡) =𝑃𝑈(−1 +𝛼𝑝(𝑡)), 𝑥(0) = 2,

˙

𝑝(𝑡) = 0, 𝑝(1) =−𝑄(𝑥(1)).

Имеем𝑝(𝑡) =−𝑄(𝑥(1)), 𝑡∈𝑇. Следовательно, краевая задача сводится к специ- альной задаче Коши

˙

𝑥(𝑡) =𝑃𝑈(−1−𝛼𝑄(𝑥(1))), 𝑥(0) = 2.

Отметим, что для любых𝛼 > 0 задача допускает решение𝑥(𝑡) =−𝑡+ 2,𝑡 ∈𝑇, соответствующее начальному управлению 𝑢0(𝑡) = −1, 𝑡 ∈ 𝑇, удовлетворяющему принципу максимума. Этот случай реализуется в предположении, что𝑄(𝑥(1)) = 0.

(9)

Предположим, что𝑄(𝑥(1))>0. Тогда используя условие𝛼 >0, получаем началь- ную задачу𝑥(𝑡) =˙ −1, 𝑥(0) = 2с решением𝑥(𝑡) =−𝑡+ 2, 𝑡∈𝑇. При этом получаем 𝑄(𝑥(1)) = 0, что противоречит сделанному предположению. Следовательно, такой случай невозможен.

Предположим, что𝑄(𝑥(1))<0. Тогда при достаточно больших𝛼 >0получаем начальную задачу𝑥(𝑡) = 1, 𝑥(0) = 2, имеющую решение˙ 𝑥(𝑡) = 𝑡+ 2, 𝑡 ∈ 𝑇. При этом 𝑄(𝑥(1)) = −1 < 0. Таким образом, при достаточно больших 𝛼 > 0 краевая задача улучшения допускает решение𝑥(𝑡) = 𝑡+ 2, 𝑡∈𝑇, с выходным управлением 𝑣= 1, которое строго улучшает исходное управление:Φ(𝑣) =−1<Φ(𝑢0) = 1.

4. Заключение

Предложен новый подход к нелокальному улучшению линейно управляемых про- цессов с помощью решения специальной дифференциально-алгебраической задачи.

Выделим основные свойства предлагаемого подхода в рассматриваемом классе нели- нейных по состоянию задач оптимального управления.

1. Трудоемкость улучшения определяется трудоемкостью решения специальной краевой задачи, которая по свойствам гладкости существенно проще краевой задачи принципа максимума.

2. В линейной по состоянию задаче оптимального управления со свободным пра- вым концом краевая задача улучшения сводится к двум задачам Коши для фазовой и сопряженной систем.

3. Нелокальность улучшения управления и отсутствие процедуры слабого или игольчатого варьирования управления, характерной для стандартных локальных методов улучшения.

4. Возможность улучшения управлений, удовлетворяющих принципу максиму- ма (в том числе и особых управлений). Такая возможность появляется в случае неединственности решения краевой задачи улучшения.

5. На основе краевой задачи получены новые необходимые условия оптимально- сти, усиливающие принцип максимума в рассматриваемом классе задач оптималь- ного управления.

СПИСОК ЛИТЕРАТУРЫ

1. Срочко В.А.Итерационные методы решения задач оптимального управления. М.: Физ- матлит, 2000.

2. Булдаев А.С.Методы возмущений в задачах улучшения и оптимизации управляемых систем. Улан-Удэ: Изд-во Бурят. гос. ун-та, 2008.

3. Булдаев А.С.Проекционные процедуры нелокального улучшения линейно управляемых процессов // Изв. вузов. Математика. 2004. № 1. С. 18–24.

4. Булдаев А.С., Моржин О.В.Улучшение управлений в нелинейных системах на основе краевых задач // Изв. Иркут. гос. ун-та. Математика. 2009. Т. 2. № 1. С. 94–107.

5. Габасов Р., Кириллова Ф.М.Качественная теория оптимальных процессов. М.: Наука, 1973.

Статья представлена к публикации членом редколлегии В.И. Гурманом.

Поступила в редакцию 16.12.2010

Referências

Documentos relacionados

При сравнении клинико-лабораторных параметров детей сопоставляемых групп было выявлено, что у больных с наличием в ротоглотке стрептококка дебют болезни сопровождается более высокой