ИНФОРМАЦИОННАЯ МОДЕЛЬ
ОПТИМАЛЬНОГО УПРАВЛЕНИЯ ФИЗИЧЕСКОЙ
ПОДГОТОВКОЙ УЧАЩИХСЯ
УДК 519
ШУПИК Игорь Евгеньевич
доцент, заведующий кафедрой физического воспитания Херсонского национального технического университета.
Научные интересы: информационные технологии.
e-mail: IgorShupik@kntu.net.ua
ВВЕДЕНИЕ
Задача управления физической подготовкой уча-щейся молодежи относится к задачам создания опти-мальных информационно-управляющих систем, при-чем объектом управления является организационная система. Движение в данной системе происходит как результат операции принятия решения [1]. То есть каждый из элементов системы имеет собственную функцию цели и действует таким образом, что бы дос-тичь ее оптимума. Таким образом, моделируя проце-дурой оптимизации «разумность» каждого из элемен-тов системы, получаем возможность формировать модель группы студентов, как объекта управления. При такой постановке открывается возможность оце-нить динамику изменения состояния отдельного члена группы, но и описать изменение состояния всего кол-лектива как движение динамической системы в про-странстве состояний [2].
ОБЗОР СОСТОЯНИЯ ВОПРОСА
Вопросы управления организационными систе-мами занимают важное место в исследованиях соци-альных [3], экономических [4] и автоматизированных систем [5]. Сложная задача построения математиче-ской модели таких систем основывается на использо-вании методов теории искусственного интеллекта [6]. Задача построения математической модели динамики организационной системы является достаточно слож-ной проблемой [7]. В данслож-ной работе использована
абстрактная модель поведения агента в организацион-ной структуре, построенная на последовательности процедур принятия оптимального решения в процессах взаимодействия с внешними источниками информа-ции. При этом рассматривается достаточно узкий круг проблем связанных с функционированием группы, как организационной системы, в процессе занятий по фи-зическому воспитанию в период обучения в универси-тете и используется оценка скорости сходимости гради-ентной процедуры на выпуклой функции цели [8], как оценка динамики объекта.
ПОСТАНОВКА ЗАДАЧИ
В работе поставлена цель, основываясь на пред-ставлении о «разумности» элементов системы, как элементов объекта управления, движение которых определяется результатом решения задачи оптимиза-ции, найти оптимальное управление группой студен-тов, как организационной системой. Причем учитывая, что управление в данной системе осуществляется по-средством передачи информации, задача рассматрива-ется в информационном пространстве.
ОСНОВНЫЕ РЕЗУЛЬТАТЫ
приня-тия решения реализуется процедура поиска оптималь-ного решения, а следовательно, в системе имеется накопление информации как в контуре распознавания, так и в контуре принятия решения о поведении.
Однако необходимо учитывать, что передача управления в данной системе носит ярко выраженный информационный характер.
Для получения более простого описания поведе-ния объекта возможно использование информацион-ного пространства [9]. Исходя из специфики поведения объекта, заключающейся в том, что всегда выполняют-ся действия, которые наиболее выгодны с точки зрения агента рассмотрим информацию I как причину получе-ния выигрыша по отношению принятой агентом функ-ции цели f:
). (I f
f (1)
В таком случае достаточно предположить непре-рывность и ограниченность функции цели или её ана-литичность, чтобы записать связь функции цели и ин-формации в окрестности:
0
0 0
I 2
2 2
I
1 df (I) f (I) f (I ) I
1! dI 1 d f (I)
I ... R. 2! dI
= + D +
+ D + +
(2)
Так как желательно получить линейную связь ме-жду информацией и значением целевой функции, ис-пользуем первое приближение:
)). ( , ( ) (
I f I dI
I
df
. (3)
Вопрос о правой части уравнения (3)решается или на основе исследований или на основе гипотезы.
В данном случае целесообразно предположить, что чем выгоднее событие, тем больше оно несет ин-формации, тогда
, ) (
dI I df
(4) где β константа.
Тогда можно записать связь между информацией и выигрышем
, 1
df dI
(5)
или при нулевых начальных условиях получаем простую связь
. 1
f I
(6)
Естественно, единица измерения информации, в этом случае, совпадает с единицей измерения полезно-сти. В этом случае константа β может трактоваться, как емкость носителя и тогда получим привычное измере-ние - единиц на бит.
Рассмотрим свойства информации. Поскольку функция цели всегда неотрицательна f≥0 и неотрица-тельна константа β, можно утверждать, что информа-ция всегда неотрицательна I≥0.
Множество F, над которым определено информа-ционное поле - это множество интересов агентов, или множество значений целевых функций
.
F
fi (7)
В таком случае норма в информационном поле, для данного случая определится как
. 1
i
f I
(8)
При этом выполняются:
1. Требование неотрицательности:
. 0 1 0
fi
I
(9)
2. Равенство нулю (выполняется так как β<∞):
. 0 0
fi
I (10)
3. Аксиома однородности:
. 0 ,
0
I I
I
(11)
4. Аксиома треугольника (выполняется в след-ствии неотрицательности информации):
j i j
i I I I
I . (12)
Таким образом, использование значения функции цели для оценки информации позволяет определить норму информационного пространства.
Для определения метрики учтем, что в информа-ционном поле важен порядок, сообщение имеет при-емник, и обратная передача информации отсутствует, так как источник, в общем случае, не обладает априор-ной информацией приемника.
1. Аксиома тождества для метрики d(Ii, Ij)=(Ii-Ij)
выполняется
. 0
) ,
(Ii Ij Ii Ij
d (13)
2. Аксиома симметрии не выполняется в виду не реализуемости обратной передачи информации
). , ( ) ,
(Ii Ij d Ij Ii
3. Аксиома неотрицательности выполняется, так как в случае отрицательности меняется направле-ние передачи информации
. 0 ) , ( 1
1
; 0 ) , ( 1
1
i j j i
j i j i
I I d f f if
I I d f f if
(15) 4. Аксиома треугольника выполняется, выро-ждаясь в равенство:
). , ( ) , ( ) ,
(Ii Ij d Ii Ik d Ik Ij
d (16)
Так как
i j i j
i k i k
k j k j
i k k j i j
1 1 d(I , I ) f f ;
1 1 d(I , I ) f f ;
1 1 d(I , I ) f f ;
1 1 1 1 1 1 f f f f f f .
=
-b b
=
-b b
=
-b b
- + - =
-b b b b b b
(17)
Существенным достоинством представления мо-дели объекта в информационном пространстве
являет-ся простота. Так для описания всего процесса принятия решения достаточно рассмотреть две оптимизацион-ные процедуры
, max
; min
); , (
* * 1
z y
y x
I I
I
А
I I d I
(18) где Ix– входная информация, Iy – информация,
содержащаяся в принимаемой гипотезе о входном сообщении, Iε – информация об отклонении гипотезы от
входной информации, A-1 – оператор восстановления
входной информации, Iz – информация, поступающая
во внешнюю среду о действии объекта. Структурно получаем последовательность оптимизационных про-цедур, рис. 1.
Следовательно, при построении математической модели принятия решения объектом, достаточно рас-смотреть последовательность двух оптимизационных задач в пространстве состояния – задачи распознава-ния внешнего сообщераспознава-ния и задачи выбора оптималь-ного выходоптималь-ного сообщения.
Рисунок 1 – Структурная схема обработки информации
Однако, при этом получаем последовательность шагов оптимизации, что вызывает необходимость учета динамики процесса.
Рассматривая динамику принятия решения объ-ектом, считаем, что имеем линейную скорость сходи-мости оптимизационных процедур. В этом случае предполагается квадратичный вид функции цели. Дей-ствительно, для градиентной процедуры получаем:
. 2 ) (
; )
( 2
x dx
x df
x x f
(19) Тогда считая, что шаг по оси x занимает время пропорциональное величине шага
,
dt
dx (20)
можем записать
. 2
) (
cx x dt
x df
(21)
И в этом случае градиентная процедура принима-ет вид:
.
1 i i
i x x
x (22)
В таком случае динамика оптимизационной про-цедуры может быть описана как движение инерцион-ного звена первого порядка с передаточной функцией:
. 1 ) (
Tp k p
W (23)
Естественно, постоянная времени индивидуальна для каждого объекта, но эта величина вполне иденти-фицируема. Таким образом, движение системы в точку оптимума x* принятия решения описывается
диффе-ренциальным уравнением:
. )
( *
x x dt
x df
(24)
Переходя к описанию системы в информацион-ном пространстве, можем записать:
. y x
x I I
dt
dI
(25) A-1*→mind(I
x, Iy) Iy
*→maxI z
При этом константа α определяет скорость вос-приятия информации.
Так как в математической модели определены две последовательные оптимизационные процедуры – распознавание внешней информации и принятия ре-шения о действии, в динамической модели целесооб-разно рассматривать последовательность звеньев:
, 1 1 )
(
2 2 1
1
p T
k p T
k p
W (26)
где: k1 – коэффициент восприятия информации,
k2 – коэффициент выполнения решения,
T1 – постоянная времени распознавания,
T2 – постоянная времени принятия решения.
Структурная схема модели динамики объекта приведена на рис. 2.
Рисунок 2 – Модель динамики объекта
Переходя к общей передаточной функции, полу-чаем:
. 1 ) ( ) ( ) (
2 1 2 2 1
2 1
p T T p T T
k k p
W . (27)
И соответствующее дифференциальное уравнение в информационном пространстве:
. )
( )
( 2 1 2 1 2
2 2
1 x z
x
x I kk I
dt dI T T dt
I d T
T (28)
Характеристическое уравнение имеет вид:
. 0 1 ) ( )
( 1 2
2 2
1T T T
T (29)
Характер движения в данном случае это монотон-ный апериодический процесс с корнями характеристи-ческого уравнения λ1 =-1/T1, λ2=-1/T2. При этом
посто-янная времени в процессе распознавания меньше, чем в процессе принятия решения. Действительно, для того что бы понять указание преподавателя требуется не-много времени, а вот для того что бы выполнить тре-буемые действия в первый раз, необходимо гораздо больше времени. В общем случае воздействия на объ-ект нескольких источников в информационном про-странстве получаем модель динамики в пропро-странстве состояний:
. ;
x z
x x
C B A dt d
I I
U I I
(30) При этом матрица объекта А – определяет скоро-сти реакции системы на внешние сообщения, матрица управления; В – приоритеты объекта; вектор управле-ния u – цели и ограничеуправле-ния, являющиеся в организа-ционной системе управлениями; матрица С – степень выполнения решений. Таким образом, динамика объ-екта по отношению к выполнению требований носит не
сложный характер, однако для достижения поставлен-ной цели требуется учитывать не только краткосрочную реакцию объекта, но и длительный процесс изменения состояния объекта. Исходя из существенной разницы в постоянных времени процессов восприятия и решения по отношению к процессу изменения параметров объ-екта, разделим систему на две подсистемы. Первую подсистему формируем из процессов распознавания и принятия решения:
yi i yi i xi
zi i yi
i
i0 i1
i i
i21 i22
I A I B I
;
I C I
0 1
A ;
a a
0 0 0
B ; C
b b 1
üï
= + ïý
ï
= ïþ
æ ö÷
ç ÷
=ççç- - ÷÷
è ø
æ ö÷ é ù
ç ÷ ê ú
=çççè ÷÷ =ê ú
ø ë û
. (31)
При этом вектор управления содержит две ком-поненты:
Iix1 – информация о функции цели, предлагаемая
по каналу управления;
Iix2 – информация об ограничениях.
При этом для собственной функции цели fi и
ди-рективной функции цели f информация о функции цели, предлагаемая по каналу управления:
.
1 i
ix f f
I (32)
А компонент Iix2 информация об ограничениях
оп-ределяется влиянием на функцию цели и по сути дела является множителем Лагранжа:
.
2
f
Iix (33)
W1(p)=k1/(T1p+1)
Распознавание
W2(p)=k2/(T2p+1)
Решение x
При агрегировании объектов в группу из n объек-тов, порядок вектора состояния системы равен N=2n, и для трех объектов в системе, матрица объекта прини-мает вид: . 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 1 3 30 32 31 23 21 20 21 13 12 11 10 a a d d d a a d d d a a
A (34)
Тогда дополнив матрицу объекта подсистемы матрицей связи Dij где индекс j указывает какая
подсис-тема влияет на i- тую подсистему
. 0 0 0 ji ji d D (35)
Тогда матрица объекта всей системы принимает вид блочной матрицы:
10 11 21 31
12 20 21 32
13 23 30 31
1 12 13
21 2 23
31 32 3
0 1 0 0 0 0
a a 0 d 0 d
0 0 0 1 0 0
A
0 d a a 0 d
0 0 0 0 0 1
0 d 0 d a a
A D D
D A D
D D A
æ ö÷
ç ÷
ç ÷
ç- - ÷
ç ÷ ç ÷ ç ÷ ç ÷÷ ç ÷ ç
=ç ÷÷=
- -ç ÷ ç ÷ ç ÷ ç ÷÷ ç ÷ ç ÷ ç ÷
ç -
-è ø
æ ö÷
ç ÷
ç ÷
ç ÷
= çç ÷÷
ç ÷÷
çè ø
.
(36)
При этом матрица B системы принимает вид диа-гональной блочной матрицы:
121 122 221 222 321 322 1 2 3
0 0 0 0 0 0 b b 0 0 0 0 0 0 0 0 0 0 B
0 0 b b 0 0 0 0 0 0 0 0 0 0 0 0 b b B 0 0
0 B 0 , 0 0 B
æ ö÷ ç ÷ ç ÷ ç ÷ ç ÷ ç ÷ ç ÷ ç ÷÷ ç ÷ ç
=ç ÷÷=
ç ÷ ç ÷ ç ÷ ç ÷÷ ç ÷ ç ÷ ç ÷ çè ø æ ö÷ ç ÷ ç ÷ ç ÷
=çç ÷÷
ç ÷÷
çè ø
(37)
и вектор управления имеет вид:
. 3 2 1 32 31 22 21 12 11 x x x x x x x x x x I I I I I I I I I
I (38)
Аналогично формируется матрица выхода:
. 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 3 2 1 c c c C (39)
При этом вектор выхода имеет размерность N. Та-ким образом, математическая модель динамики всей подсистемы, определяется выражением аналогичным (40): . y z x y
y A B
I C I I I I (40) Вторая подсистема описывается более просто, так как не содержи подсистем и является просто много-мерной системой порядка N:
.
z s s s
s AI BI
I (41)
Тогда, с учетом разделения задачи на подзадачу управления восприятием и принятием решения и под-систему изменения параметров объекта, структура системы принимает вид, приведенный на рис. 3.
Подсистема принятия решения связана с решени-ем задачи оптимального управления для каждого объ-екта. Рассмотрим отдельно от группы одного агента, в этом случае порядок системы равен двум и можем использовать модель со скалярным функционалом цели и матрицей выхода, принимающей вид:
. 1 0 C (42)
При выборе функции цели необходимо учитывать специфику задачи. Во-первых, за время принятия ре-шения t1-t0 проходит переходный процесс, связанный с
восприятием информации принятием решения о дей-ствии, естественно, что желательно сократить время переходного процесса, но более существенно сократить потери информации за рассматриваемый период. Учи-тывая, что выходная информация ограничена всегда положительной оценкой действия Im и выполняется
условие Im-CIyi>0, иначе задача теряет смысл, в
Рисунок 3 – Структура системы управления
. ) (
1
0
dt I
J t
t
yi i m
i
CI (43)Тогда получаем задачу оптимального управления:
. ) (
0 ) (
; min ,
; ) (
* 1 0 * *
1
0
yi
I t t I
B A
J dt I
J
yi yi
yi i zi
xi i yi i yi
i xi
yi t
t
yi i m i
CI CI
I C
I I I
I I
I C
(44)
Функция Гамильтона в данном случае имеет вид [10, 11]:
;. ) (
, ) (
0 m i yi i i yi i xi
i I A B
H CI λ I I (45)
Так как интегрант функционала цели линеен и матрица управления не нулевая, то условие стационар-ности по управлению не выполняется:
) (
, )) (
( 0
I I I λ I
I C
I
xi xi i yi i i
xi yi i m
xi
i I A B
H
(46) При этом каноническая система уравнений Ла-гранжа – Эйлера принимает вид:
, ;
dt d H
dt d H
yi i
i i yi
i
I
λ λ
I
или
. ;
0 i i T i i
xi i yi i yi
A dt d
B A dt d
C
λ λ
I I I
Так как матрица объекта по условиям задачи гур-вицева, то для сходимости процесса по множителям Лагранжа с учетом требования неотрицательности множителя Лагранжа в задаче поиска минимума, мо-жем записать:
. 2 , 1 , 0
; 0
j
λ
dt d
j i λ
(47) Следовательно, в процессе принятия решения, влияние ограничений должно монотонно уменьшаться.
а
б
Рисунок 4 – Формирование управления (а), и результаты моделирования (б)
Учитывая, что функция Гамильтона линейна по отношению к входной информации и учитывая ограни-ченность входной информации
Подсистема принятия решения
Подсистема развития
Прогноз развития Коррекция
управления
Ix Iy Iz
Izt
,
0IxiIxm (48)
можем записать оптимальное управление в виде трех знакопостоянных управлений:
. ,
; ,
0
; 0 ,
1 2 * *
2 1 *
1 *
t I
I
t I
t I
I
x xi xi
xm xi
(49) Это дает интервал повышенного потока информа-ции, как побуждение к действию, интервал ожидания и интервал коррекции управления (рис. 4,а), (рис. 4,б).
Как видно из результатов моделирования, опти-мальное управление позволяет получить переходный процесс со значительно меньшими затратами инфор-мации.
ВЫВОДЫ
1. Использование информационного простран-ства позволяет учитывать особенности функциониро-вания организационных систем.
2. Модель динамики организационной систе-мы базируется на свойствах процедур оптимизации частных функций цели.
3. Линеаризованная модель элемента органи-зационной системы имеет третий порядок.
4. Гипотеза постоянства чувствительности ча-стной функции цели к входной информации позволяют иметь линейную метрику в информационном про-странстве.
5. Оптимальное управление организационной системой основывается на использовании принципа максимума Понтрягина.
6. В задаче оптимального управления студен-ческой группой на занятиях физистуден-ческой подготовкой эффективно использование квазиоптимального управ-ления.
ЛИТЕРАТУРА:
1. Makarov I.M. Intellektual'nye sistemy avtomaticheskogo upravlenija /Pod red. I.M. Makarova, V.M. Lohina. – M.: Fizmatlit, 2001. – 576 s. 2. Novikov D.A. Kurs teorii aktivnih sistem /D.A. Novikov, S.N. Petrakov. – M.: CYNTU. 1999. – 104 s.
3. Novikov D.A. Mehanizmy upravlenija dinamicheskimi aktivnimi sistemami /D.A. Novikov, I.M. Smirnov, T.E. Shohina. – M.: IPU RAN, 2002. – 124 s.
4. Coj E.B. Modelirovanie i upravlenie v ekonomike (chast' I). Kurs lekcіj /Coj E.B., Samochernov I.V. – Novosibirsk: Izd-vo NGTU, 2003. – 104 s. 5. Ahangel'skij V.I. Integrirovannye ASU v promyshlennosti /V.I. Arhangel'skij, I.N. Bogasenko, N.A. Rjumshin. – K.: NPK «Kievskij institut
avtomatiki», 1995. – 316 s.
6. Bondarev V.N. Iskusstvennyj intellekt: Uch. posobie dlja vuzov /V.N. Bondarev, F.G. Ade. – Sevastopol': izd-vo SevNTU, 2002. – 615 s. 7. Komashinskij V.I. Nejronnye seti i ih primenenie v sistemah upravlenija i svjazi /V.I. Komashinsskij. – M.: Gorjachaja linija-Telekom, 2003. –
94 s.
8. Chernoruckij I.G. Metody optimizacii v teorii upravlenija: Uch. posobie dlja vuzov /I.G. Chernoruckij. – SPb.: Piter, 2004. – 256 s.
9. Brazhnik D.A. Informacionnaja model' invariantnoj sistemy raspoznavanija /D.A. Brazhnik, F.B. Rogal'skij, V.A. Tkach //Problemi іnformacіjnih tehnologіj. – 2009. – №1 (005). – S.31-37.
10. Alekseev V.M. Optimal'noe upravlenie /V.M. Alekseev, V.M. Tihomirov, S.V. Fomin. – M.: Nauka, 1979. – 428 s. 11. Rektoris K. Variacionnye metody v matematicheskoj fizike i tehnike /K. Rektoris. – M.: Mir, 1985. – 590 s.