• Nenhum resultado encontrado

ОПТИМАЛЬНОЕ И БЛИЗКОЕ К ОПТИМАЛЬНОМУ РЕШЕНИЯ В ЗАДАЧЕ

0 0 0 0 0

0 0

2

0 0 0 0

0

0 0

2

0 0 0 0

= , = = , = , = ,

( ) = 1 , = , = .

, '

u u u u u

x x t t t T T

v v v v

v

v u u

v t v t u J J

v u u v

 

   

 

     

 

Далее будем использовать безразмерные переменные, опуская штрихи. В безразмерных единицах параметры

u

0 и

v

0 равны единице.

Задача 1. Для системы (1) при начальных условиях (2) для возмущений вида (3) найти кусочно- непрерывное управление

u (t )

вида (4) и время упреждения

t

0

 0

, которые минимизируют максимальную величину смещения объекта относительно основания:

* 0

0 *

0 0

[ 0, ) ,

1 0

( ), [ 0, )

( , ) sup max | ( ; , , ) | min, т.е. требуется найти min sup max | ( ; , , ) | .

t u t V V

u t t V V t

J u t x t u V t

J x t u V t

 

Здесь выражение VV* под знаком

sup

означает, что супремум берется по функциям V t( )V*.

Задача 2. При заданном управлении

u (t )

для системы (1) при начальных условиях (2) для возмущений вида (3) найти время упреждения

t

0

 0

, которое минимизируют максимальную величину смещения объекта относительно основания:

* 0

0 *

0 0

, [ 0, )

2 0

[ 0, )

т е требуется н айт ( , ) sup max | ( ; , , ) | min, . .

( )

и min sup max | ( ; , , ) |

u t V V t

t V V t

J u t x t u V t

J u x t u V t

 

 

 

Задача 3. Для системы (1) при начальных условиях (2) для для заданного возмущения вида (3) найти кусочно-непрерывное управление

u (t )

, удовлетворяющее ограничению | ( ) |u tu0, t [0, ), и время упреждения

t

0

 0

, которые минимизируют максимальную величину смещения объекта относительно основания:

0

0

0 0

[0, ) ,

3 0

( ), [0, )

( , , ) = | ( ; , , ) | ,

= | ( ; , , ) | .

т.е. требуется н айти

max min

( ) min max

t u t

u t t t

J u V t x t u V t

J V x t u V t

 

 

Результаты

Мгновенный удар. Мгновенный удар моделируется дельта-функцией Дирака и в размерных переменных описывается соотношениемV( ) = v0 ( ), а в безразмерных переменных задается формулой

( ) = ( ).

V    Для этого возмущения задача 3 была решена в [4]. Оптимальное управление, оптимальное время упреждения и значение критерия качества для этого случая в безразмерных переменных определяются соотношениями

1

1 2 0

2

1, 0 = 1/4,

( ) = 1, < = 3/2, = 1, = 1/16.

0, > = 3/2, t t

u t t t t t J

t t

  

 



(5) Решение задачи 2 для дельта-управления. Получено решение задачи 2, в которой в качестве управляющего закона было использовано управление

u

из (5). Момент упреждения задается формулой

0

1/4 2 2 1 / 2 , 7/8,

= 17 / 16 /2, 7 / 8 < 17/8,

0, > 17/8,

T T T

t T T

T

     

  



а значение функционала для задачи 2 имеет следующий вид

2

25/16 1/4 2 2 , 7/8,

= /2, 7/8 < 17/8,

17/16, > 17/8.

T T T

J T T

T T

     

 

 

Решение задачи 1. Для класса управлений

U = { u

}

получено также решение задачи 1. Оптимальное управление определяется формулой (4) с значением параметра

/2 1/4 < 1/2,

= 1 / 2 1/2 < 7/2,

(1 )/2 1 > 7/2.

при при при

T T

T

T T

 

 

  

Значение функционала и момент упреждения определяются формулами

 

2

1

/2 1/4 1/2,

= /2 1/2 < .

при при

T T

J

T T

  



0

1 < 1/2,

= 7/4 /2 1/2 < 7/2,

0 > 7/2.

п ри п ри п ри

T T

t T T

T

 

  



Заметим, что приведенное решение задачи 1 при

T > 1/2

неединственно. Значение функционала

/2

= T

J

для этого случая обеспечивается моментом переключения

и моментом упреждения

t

0, удовлетворяющим соотношениям

2 0

{ (1 )/2 1, 0} /2,

= 1/2 2 /2.

max T T

t T

 

   

  

Зависимости величин

J

1 и

J

2 от

1/ T

изображены на рис. 1.

Рис. 1.Зависимости величин

J

1 и

J

2 от

1/ T

Литература

1. Гурецкий В.В. Об одной задаче оптимального управления // Изв. АН СССР. Механика. 1965. № 1. С. 159-162.

2. Гурецкий В.В. О задаче минимизации максимального смещения // Труды ЛПИ. Механика и процессы управления.

1969. 307. С. 11-21.

3. Sevin E. and Pilkey W. Optimum Shock and Vibration Isolation. Washington DC: Shock and Vibration Information Analysis Center, 1971, 162 с.

4. D.V. Balandin, N.N. Bolotnik, and W.D. Pilkey, Optimal Protection from Impact, Shock, and Vibration.Gordon and Breach Science Publishers, Amsterdam, 2001, 436 p.

5. Болотник Н.Н., Корнеев В.А. Гарантирующее упреждающее управление в задаче противоударной изоляции // Доклады РАН. 2018. Т. 481. № 4. С. 381-385.

УПРАВЛЕНИЕ ТРЕХЗВЕННОЙ МОДЕЛЬЮ СНОУБОРДИСТА А.В. Борисов

1

, И.Е. Каспирович

2

, Р.Г. Мухарлямов

2

1

Филиал ФГБОУ ВО НИУ Московский энергетический институт, Смоленск

2

Российский университет дружбы народов, Москва kaspirovich.ivan@mail.ru

Аннотация. В данной работе трехзвенный стержневой механизм моделирует движение сноубордиста. Для управления вертикальными звеньями вводятся голономные связи, обеспечивающие физиологическую возможность и удобство положения и ориентации звеньев относительно друг друга. В уравнениях движения слагаемые силы реакции определяются с помощью произвольных множителей Лагранжа. Для обеспечения устойчивости численного решения применяется метод стабилизации связей. Таким образом управляющие силы представляют собой обобщенные силы реакции связей, зависящие от параметров стабилизации.

Работа выполнена при поддержке гранта РФФИ № 19-08-00261 А.

Введение

Движение сноубордиста моделируется трехзвенным механизмом, динамика которых исследована в работе Борисова А.В. [1]. Режим движения модели задается набором механических связей, обеспечивающих физиологически возможное положение тела в каждый момент времени. Численное интегрирование уравнений движения со связями приводит к неустойчивости численного решения. Для обеспечения устойчивости применяется метод стабилизации связей Баумгарте [2], согласно которому при определении множителей Лагранжа вторые производные по связям приравниваются к линейной комбинации по самим связям и по их первым производным. Коэффициенты линейной формы носят название параметров возмущения. Задача определения диапазона их значений решается в работе Мухарлямова Р.Г. [3].

Основной текст

Трехзвенная модель сноубордиста представляет собой систему трех тонких металлических стержней, закрепленных шарнирно друг к другу. Положение и ориентация каждого стержня задается пятью координатами: H, )HH, ÍH, ÎH, U = 0,1,2. Звенья пронумерованы следующим образом: нулевое – доска (сноуборд), первое – ноги, второе – туловище (рис. 1а). Координаты H, )H, €H определяют положение центра тяжести -го звена, ÎH – кратчайший угол между звеном и наклонной плоскостью, ÍH – угол между проекцией звена на плоскость и выбранной осью. Модель осуществляет движение по наклонной плоскости, поэтому нулевое звено непременно должно лежать на ней во время спуска. Также шарнирное закрепление связывает координаты центра масс и углов следующими выражениями:

= 0, Î= 0,

= + Ï V cos Î cos Í , = + Ï cos Î cos Í + Ï V cos Î cos Í , ) = + Ï V cos Î sin Í , = + Ï cos Î sin Í + Ï V cos Î sin Í ,

€ = Ï V sin Î , € = Ï sin Î + Ï V sin Î ,

(1) где ÏH – длина -го звена, VH – параметр, отсчитывающий снизу положение центра масс, при равномерном распределении массы VH= 1/2.

Пусть длина траектории спуска много больше суммарной длины всех стержней, тогда с учетом выражений (1) функция Лагранжа запишется в виде:

ƒ =6Š( P+ )P) +ЊÍP+ ∑Hh , eZH( P + )P + €P ) + ÒÓÔÕÓÒÓf + } (Z+ Z + Z ), (2) где ZH, †H, U = 0,1,2 массы и моменты инерции звеньев, ÒÓÔ= (− cos ÎHÍPH, ÍOP , sinÎHÍPH), U = 1,2 – вектор угловой скорости, ÕÓ= #U }(†H, †H, 0).

Нулевое крыло представляет собой идеальное лезвие, таким образом его движение по поверхности плоскости моделируется при помощи неголономной связи

W = )P− tan Í P= 0. (3)

Околовертикальное положение первого и второго звена обеспечивается голономной связью вида:

W = ÖÎ −>× + ÖÎ −>× − = 0. (4)

Пусть сноубордист спускается по траектории вида слалом, в простейшем случае которая аппроксимируется тригонометрической функцией. Тогда движение нулевого звена связано соотношением

WA= tan Í− a cos a = 0, (5)

где – амплитуда траектории, a – волновое число.

Пусть также углы между проекциями звеньев на плоскость и осью - равны между собой:

W{= Í − Í= 0, WØ= Í − Í= 0. (6) Таким образом, набор связей может задавать режим движения модели сноубордиста. Решение

множителей. Однако, численное интегрирование уравнений движений со связями не всегда может обеспечить желаемым результатом. Накопление ошибок при реализации разностной схемы суммирования приводит к неустойчивости решения относительно уравнений связей. Для ограничения подобного рода накопления применяется метод стабилизации связей Баумгарта. При этом на шаге определения произвольных множителей производные от уравнений связей по времени приравниваются к линейной форме по самим связям и по их производным меньшего порядка

WP = HWH, W`¤= ̤ÙWÙ+ Ú¤ÛWPÛ, U, Ï = 1, … ,6, a, Ü = 2, … ,6.

(7) Коэффициенты линейной формы d, Ý, Þ называются параметрами возмущения. Результаты численного интегрирования уравнений Лагранжа для функции (2) с учетом стабилизации связей (7) представлены на рисунке (рис 1б).

a) б)

Рис. 1. a) Трехзвенная модель на наклонной плоскости, б) график зависимости угловой координаты от времени

Заключение

Управление движением трехзвенной модели сноубордиста обеспечивается введением набора механических связей. Управляющие силы и моменты в данной задаче по сути являются силами реакции связей, которые с учетом метода являются функциями параметров возмущения. Таким образом, определяя оптимальный диапазон значений параметров возмущения, можно обеспечить устойчивость численного решения.

Литература

1. Борисов А. В., Розенблат Г. М. Моделирование динамики экзоскелета с управляемыми моментами в суставах и переменной длиной звеньев с использованием рекуррентного метода составления дифференциальных уравнений движения // Известия РАН. Теория и системы управления. – 2018. № 2. – С. 148-174.

2. J. Baumgarte Stabilization of constraints and integrals of motion in dynamical systems // Computer Methods in Applied Mechanics and Engineering, Vol 1, Issue 1, 1-16 pp.

3. Н.В. Абрамов, Р.Г. Мухарлямов Моделирование процессов управления, устойчивость и стабилизация систем с программными связями. // Вестн. СамГУ. Естественнонаучн – 2(83) - С. 130-140.

О НЕКОТОРЫХ СВОЙСТВАХ ГРАНИЦ ОБЛАСТЕЙ ДОСТИЖИМОСТИ Д.И. Бугров, А.М.Формальский

Московский государственный университет имени М.В. Ломоносова d.bugrov@mech.math.msu.su

Аннотация. Рассматриваются линейные стационарные системы с одним управляющим (возмущающим) воздействием. Предполагается, что система является вполне управляемой в смысле Калмана, а воздействие принадлежит тому или иному множеству функций, называемых допустимыми управлениями. Целью работы является исследование свойств границ областей достижимости таких систем при изменении времени, в частности, в окрестности конических угловых точек, а также оценка влияния ограничений по управлению на границы области достижимости. Аналитические результаты подтверждаются численным моделированием.

Работа выполнена при поддержке гранта РФФИ № 18-00-01590.

Введение

В докладе рассматриваются линейные стационарные системы с одним управляющим (возмущающим) воздействием. Предполагается, что система является вполне управляемой в смысле Калмана, а воздействие принадлежит тому или другому множеству функций, называемых допустимыми управлениями. Авторы поставили своей целью исследование изменения границ области достижимости таких систем при изменении времени, в частности, в окрестности конических угловых точек. Под областью достижимости ß(„) в момент времени T будем понимать множество точек, в которые может быть переведена рассматриваемая система из начала координат при помощи допустимого управления. Конической угловой точкой будем называть такую точку, принадлежащую границе области достижимости, в которой пересекаются опорные гиперплоскости к этой области, образуя коническую поверхность.

Решение многих задач оптимального управления движением связано с необходимостью исследования областей достижимости управляемых (возмущаемых) систем при наличии тех или иных ограничений на управляющие (возмущающие) воздействия. Опубликован ряд работ, посвященных различным вопросам построения и использования областей достижимости [1, 2, 3], оценки этих областей с помощью эллипсоидов [4], гладкости их границ [5, 6].

Известно [5], что у линейной стационарной системы произвольного порядка (с ограниченным по абсолютной величине управляющим воздействием), имеющей хотя бы одно действительное собственное значение, на границе области достижимости в любой момент времени есть ровно две конические угловые точки. Если же стационарная система (произвольного порядка) имеет только комплексные собственные значения, то при достаточно больших временах множество достижимости ß(„) не имеет конических угловых точек.

Изменение границ областей достижимости с течением времени

В первой части доклада рассматривается линейная стационарная система третьего порядка с одним управляющим (возмущающим) воздействием, ограниченным по абсолютной величине и являющимся кусочно- непрерывной функцией времени. Исследуется случай, когда система имеет одно действительное и два комплексно-сопряженных собственных значения. Граница области достижимости ß(„) такой системы в любой конечный момент времени имеет ровно две конические угловые точки. Изучается поведение границы области ß(„) с ростом времени „. Угол раствора конической поверхности, охватывающей область достижимости и имеющей вершину в конической угловой точке, представляет собой телесный угол. Область достижимости симметрична относительно начала координат, поэтому угловые точки симметричны одна другой, и соответствующие телесные углы равны. В докладе доказано, что изменение во времени телесного угла зависит от соотношения между действительным собственным значением системы и действительной частью комплексно-сопряженных собственных значений.

Если действительное собственное значение меньше действительной части комплексно-сопряженных, то углы раствора конусов, охватывающих угловые точки, с ростом времени растут (см. рис. 1). При стремлении времени „ к бесконечности конус, охватывающий угловую точку, стремится к плоскости и угловые точки

«разглаживаются». На рис. 1а показана область достижимости ß(„) при „ = 2@, а на рис. 1б – при „ = 25@. При „ = 2@ угловая точка отчетливо видна на рис. 1а. Что касается времени „ = 25@, то оно на порядок больше времени „ = 2@, т.е. относительно велико, и угловая точка на рис. 1б практически не видна.

В случае, когда действительное собственное значение системы равно действительной части комплексно-сопряженных собственных значений, угол раствора конусов, охватывающих угловые точки, с ростом времени остается без изменения. Этот телесный угол удается найти аналитически. В случае, когда действительное собственное значение системы превосходит действительную часть комплексно-сопряженных

собственных значений, телесный угол конусов, охватывающих угловые точки, с ростом времени, начиная с некоторого момента, остается без изменения [7] и угловые точки не «пропадают».

а б

Рис.1. Изменение границы области ß(„) с ростом времени в случае, когда действительное собственное значение меньше действительной части комплексно-сопряженных; (а) – область ß(„) при „ = 2@, (б) – область ß(„) при„ = 25@.

Во второй части доклада рассматривается случай, когда управляющее воздействие принадлежит классу кусочно-непрерывных функций, дополненному множеством обобщенных дельта-функций Дирака. Считается, что импульс управляющего воздействия ограничен величиной N. Показано, что граница области достижимости может иметь плоские участки, участки линейчатых поверхностей, ребра, конические угловые точки. При наличии на границе плоских участков и/или прямолинейных ребер область достижимости ß(„) не является строго выпуклой. При таких ограничениях по импульсу на управление также изучается изменение границ областей достижимости с ростом времени „. Исследуются границы множества достижимости для системы с трехкратным нулевым собственным значением (тройной интегратор). Результаты аналитического исследования подтверждаются численным моделированием. На рис. 2 показана область, построенная для тройного интегратора при „ = 1 и l = 1. Доказано, что граница области достижимости такой системы состоит из четырех плоских участков, четырех линейчатых поверхностей и четырех прямолинейных ребер. Она имеет также четыре конические угловые точки [8].

а б

Рис. 2. (а) – область ß(„) для «тройного интегратора» при „ = 1, l = 1, (б) – «каркас» области ß(„) при тех же значениях T и N.

В третьей части доклада исследуется влияние на изменение границ области достижимости такого способа решения задач управления, как редукция. В качестве исходной рассматривается система с трехкратным нулевым собственным значением и управлением из множества кусочно-непрерывных функций, дополненного обобщенными дельта-функциями Дирака. Предполагается, что импульс управляющего воздействия ограничен известным значением N. Тогда, очевидно, третья координата системы при любом допустимом управлении является ограниченной величиной, не превосходящей величины N, причем изменяться она может скачкообразно. Следовательно, можно рассматривать третью координату как новое управление v(t) (являющееся кусочно-непрерывной ограниченной функцией) и осуществить редукцию до системы второго порядка. Область достижимости редуцированной системы будет совпадать с проекцией области достижимости исходной системы на плоскость первых двух координат при выполнении дополнительных ограничений на новое управление à |#N/# |#b ≤ l, N(0) = 0 . Если же этим ограничением пренебречь, то область достижимости увеличится, хотя конические угловые точки при этом останутся «на месте».

Заключение

В докладе представлены результаты аналитического исследования и численного моделирования поведения границ областей достижимости линейных стационарных систем с ростом времени. Управляющее воздействие при этом считается ограниченным по абсолютной величине. Показано, что изменение во времени угла раствора конической поверхности, охватывающей коническую угловую точку, зависит от соотношения между действительным собственным значением системы и действительной частью комплексно-сопряженных собственных значений.

Проведено исследование структуры границы области достижимости в случае, когда управляющее воздействие принадлежит классу кусочно-непрерывных функций, дополненному множеством обобщенных дельта-функций Дирака. Импульс управляющего воздействия при этом считается ограниченным. Построена граница области достижимости системы с трехкратным нулевым собственным значением – тройного интегратора.

Изучено влияние редукции задачи управления на изменение границ области достижимости. Для системы с двукратным нулевым собственным значением проведено сравнение границ области достижимости при различных ограничениях на управление.

Литература

1. А.М.Формальский. Управляемость и устойчивость систем с ограниченными ресурсами. М.: Наука, 1974. 368 с.

2. А.Б.Куржанский. Управление и наблюдение в условиях неопределенности. М.: Наука, 1977. 392 с.

3. В.С.Пацко, С.Г.Пятко, А.А.Федотов // Известия РАН. Теория и системы управления. 2003. № 3. С. 8–16.

4. Ф.Л.Черноусько. Оценивание фазового состояния динамических систем. М.: Наука, 1988. 320 с.

5. А.М.Формальский // ПММ. 1983. Т. 47. Вып. 4. С. 566–574.

6. Ю.В.Болотин, С.Н.Моргунова // Фундам. прикл. мат. 2005. Т. 11. № 8. С. 119–130.

7. Д.И.Бугров, А.М.Формальский // ПММ. 2017. Т. 81. Вып. 2. С. 154–164.

8. Д.И.Бугров, А.М.Формальский // ПММ. 2018. Т. 82. Вып. 5. С. 631–643.

МАТЕМАТИЧЕСКАЯ МОДЕЛЬ И СИНТЕЗ СИСТЕМЫ АВТОМАТИЧЕСКОГО