ИНФОРМАЦИОННАЯ МОДЕЛЬ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ ФИЗИЧЕСКОЙ ПОДГОТОВКОЙ УЧАЩИХСЯ

(1)

ИНФОРМАЦИОННАЯ МОДЕЛЬ

ОПТИМАЛЬНОГО УПРАВЛЕНИЯ ФИЗИЧЕСКОЙ

ПОДГОТОВКОЙ УЧАЩИХСЯ

УДК 519

ШУПИК Игорь Евгеньевич

доцент, заведующий кафедрой физического воспитания Херсонского национального технического университета.

Научные интересы: информационные технологии.

e-mail: IgorShupik@kntu.net.ua

ВВЕДЕНИЕ

Задача управления физической подготовкой уча-щейся молодежи относится к задачам создания опти-мальных информационно-управляющих систем, при-чем объектом управления является организационная система. Движение в данной системе происходит как результат операции принятия решения [1]. То есть каждый из элементов системы имеет собственную функцию цели и действует таким образом, что бы дос-тичь ее оптимума. Таким образом, моделируя проце-дурой оптимизации «разумность» каждого из элемен-тов системы, получаем возможность формировать модель группы студентов, как объекта управления. При такой постановке открывается возможность оце-нить динамику изменения состояния отдельного члена группы, но и описать изменение состояния всего кол-лектива как движение динамической системы в про-странстве состояний [2].

ОБЗОР СОСТОЯНИЯ ВОПРОСА

Вопросы управления организационными систе-мами занимают важное место в исследованиях соци-альных [3], экономических [4] и автоматизированных систем [5]. Сложная задача построения математиче-ской модели таких систем основывается на использо-вании методов теории искусственного интеллекта [6]. Задача построения математической модели динамики организационной системы является достаточно слож-ной проблемой [7]. В данслож-ной работе использована

абстрактная модель поведения агента в организацион-ной структуре, построенная на последовательности процедур принятия оптимального решения в процессах взаимодействия с внешними источниками информа-ции. При этом рассматривается достаточно узкий круг проблем связанных с функционированием группы, как организационной системы, в процессе занятий по фи-зическому воспитанию в период обучения в универси-тете и используется оценка скорости сходимости гради-ентной процедуры на выпуклой функции цели [8], как оценка динамики объекта.

ПОСТАНОВКА ЗАДАЧИ

В работе поставлена цель, основываясь на пред-ставлении о «разумности» элементов системы, как элементов объекта управления, движение которых определяется результатом решения задачи оптимиза-ции, найти оптимальное управление группой студен-тов, как организационной системой. Причем учитывая, что управление в данной системе осуществляется по-средством передачи информации, задача рассматрива-ется в информационном пространстве.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ

(2)

приня-тия решения реализуется процедура поиска оптималь-ного решения, а следовательно, в системе имеется накопление информации как в контуре распознавания, так и в контуре принятия решения о поведении.

Однако необходимо учитывать, что передача управления в данной системе носит ярко выраженный информационный характер.

Для получения более простого описания поведе-ния объекта возможно использование информацион-ного пространства [9]. Исходя из специфики поведения объекта, заключающейся в том, что всегда выполняют-ся действия, которые наиболее выгодны с точки зрения агента рассмотрим информацию I как причину получе-ния выигрыша по отношению принятой агентом функ-ции цели f:

). (I f

f  ₍₁₎

В таком случае достаточно предположить непре-рывность и ограниченность функции цели или её ана-литичность, чтобы записать связь функции цели и ин-формации в окрестности:

0

0 0

I 2

2 2

I

1 df (I) f (I) f (I ) I

1! dI 1 d f (I)

I ... R. 2! dI

= + D +

+ D + +

(2)

Так как желательно получить линейную связь ме-жду информацией и значением целевой функции, ис-пользуем первое приближение:

)). ( , ( ) (

I f I dI

I

df __

. (3)

Вопрос о правой части уравнения (3)решается или на основе исследований или на основе гипотезы.

В данном случае целесообразно предположить, что чем выгоднее событие, тем больше оно несет ин-формации, тогда

, ) ( __

dI I df

(4) где β константа.

Тогда можно записать связь между информацией и выигрышем

, 1

df dI



 ₍₅₎

или при нулевых начальных условиях получаем простую связь

. 1

f I



 ₍₆₎

Естественно, единица измерения информации, в этом случае, совпадает с единицей измерения полезно-сти. В этом случае константа β может трактоваться, как емкость носителя и тогда получим привычное измере-ние - единиц на бит.

Рассмотрим свойства информации. Поскольку функция цели всегда неотрицательна f≥0 и неотрица-тельна константа β, можно утверждать, что информа-ция всегда неотрицательна I≥0.

Множество F, над которым определено информа-ционное поле - это множество интересов агентов, или множество значений целевых функций

.

F

fi (7)

В таком случае норма в информационном поле, для данного случая определится как

. 1

i

f I



 ₍₈₎

При этом выполняются:

1. Требование неотрицательности:

. 0 1 0 

 fi

I

 (9)

2. Равенство нулю (выполняется так как β<∞):

. 0 0 

 fi

I (10)

3. Аксиома однородности:

. 0 ,

0 

 

 I I

I  

 (11)

4. Аксиома треугольника (выполняется в след-ствии неотрицательности информации):

j i j

i I I I

I    _. (12)

Таким образом, использование значения функции цели для оценки информации позволяет определить норму информационного пространства.

Для определения метрики учтем, что в информа-ционном поле важен порядок, сообщение имеет при-емник, и обратная передача информации отсутствует, так как источник, в общем случае, не обладает априор-ной информацией приемника.

1. Аксиома тождества для метрики d(Ii, Ij)=(Ii-Ij)

выполняется

. 0

) ,

(Ii Ij Ii Ij

d    ₍₁₃₎

2. Аксиома симметрии не выполняется в виду не реализуемости обратной передачи информации

). , ( ) ,

(Ii Ij d Ij Ii

(3)

3. Аксиома неотрицательности выполняется, так как в случае отрицательности меняется направле-ние передачи информации

. 0 ) , ( 1

1

; 0 ) , ( 1

1

 



 



i j j i

j i j i

I I d f f if

 

(15) 4. Аксиома треугольника выполняется, выро-ждаясь в равенство:

). , ( ) , ( ) ,

(I_i I_j d I_i I_k d I_k I_j

d   ₍₁₆₎

Так как

i j i j

i k i k

k j k j

i k k j i j

1 1 d(I , I ) f f ;

1 1 1 1 1 1 f f f f f f .

=

-b b

=

-b b

=

-b b

- + - =

-b b b b b b

(17)

Существенным достоинством представления мо-дели объекта в информационном пространстве

являет-ся простота. Так для описания всего процесса принятия решения достаточно рассмотреть две оптимизацион-ные процедуры

, max

; min

); , (

* * 1

z y

y x

I I

I

А

I I d I

  



 

(18) где Ix– входная информация, Iy – информация,

содержащаяся в принимаемой гипотезе о входном сообщении, Iε – информация об отклонении гипотезы от

входной информации, A-1_{– оператор восстановления}

входной информации, Iz – информация, поступающая

во внешнюю среду о действии объекта. Структурно получаем последовательность оптимизационных про-цедур, рис. 1.

Следовательно, при построении математической модели принятия решения объектом, достаточно рас-смотреть последовательность двух оптимизационных задач в пространстве состояния – задачи распознава-ния внешнего сообщераспознава-ния и задачи выбора оптималь-ного выходоптималь-ного сообщения.

Рисунок 1 – Структурная схема обработки информации

Однако, при этом получаем последовательность шагов оптимизации, что вызывает необходимость учета динамики процесса.

Рассматривая динамику принятия решения объ-ектом, считаем, что имеем линейную скорость сходи-мости оптимизационных процедур. В этом случае предполагается квадратичный вид функции цели. Дей-ствительно, для градиентной процедуры получаем:

. 2 ) (

; )

( 2

x dx

x df

x x f

 

 

(19) Тогда считая, что шаг по оси x занимает время пропорциональное величине шага

,

 

dt

dx ₍₂₀₎

можем записать

. 2

) (

cx x dt

x df



  (21)

И в этом случае градиентная процедура принима-ет вид:

.

1 i i

i x x

x_   (22)

В таком случае динамика оптимизационной про-цедуры может быть описана как движение инерцион-ного звена первого порядка с передаточной функцией:

. 1 ) (

 

Tp k p

W ₍₂₃₎

Естественно, постоянная времени индивидуальна для каждого объекта, но эта величина вполне иденти-фицируема. Таким образом, движение системы в точку оптимума x*_{принятия решения описывается}

диффе-ренциальным уравнением:

. )

( *

x x dt

x df



 (24)

Переходя к описанию системы в информацион-ном пространстве, можем записать:

. y x

x _I _I

dt

dI __ _

(25) A-1*_→_min_d₍_I

x, Iy) Iy

*→_max_I z

(4)

При этом константа α определяет скорость вос-приятия информации.

Так как в математической модели определены две последовательные оптимизационные процедуры – распознавание внешней информации и принятия ре-шения о действии, в динамической модели целесооб-разно рассматривать последовательность звеньев:

, 1 1 )

(

2 2 1

1

  

p T

k p T

k p

W ₍₂₆₎

где: k1 – коэффициент восприятия информации,

k2 – коэффициент выполнения решения,

T1 – постоянная времени распознавания,

T2 – постоянная времени принятия решения.

Структурная схема модели динамики объекта приведена на рис. 2.

Рисунок 2 – Модель динамики объекта

Переходя к общей передаточной функции, полу-чаем:

. 1 ) ( ) ( ) (

2 1 2 2 1

2 1

   

p T T p T T

k k p

W _. ₍₂₇₎

И соответствующее дифференциальное уравнение в информационном пространстве:

. )

( )

( ₂ ₁ ₂ ₁ ₂

2 2

1 x z

x

x _I _k_k _I

dt dI T T dt

I d T

T     (28)

Характеристическое уравнение имеет вид:

. 0 1 ) ( )

( 1 2

2 2

1T   T T  

T (29)

Характер движения в данном случае это монотон-ный апериодический процесс с корнями характеристи-ческого уравнения λ1 =-1/T1, λ2=-1/T2. При этом

посто-янная времени в процессе распознавания меньше, чем в процессе принятия решения. Действительно, для того что бы понять указание преподавателя требуется не-много времени, а вот для того что бы выполнить тре-буемые действия в первый раз, необходимо гораздо больше времени. В общем случае воздействия на объ-ект нескольких источников в информационном про-странстве получаем модель динамики в пропро-странстве состояний:

. ;

x z

x x

C B A dt d

I I

U I I

  

(30) При этом матрица объекта А – определяет скоро-сти реакции системы на внешние сообщения, матрица управления; В – приоритеты объекта; вектор управле-ния u – цели и ограничеуправле-ния, являющиеся в организа-ционной системе управлениями; матрица С – степень выполнения решений. Таким образом, динамика объ-екта по отношению к выполнению требований носит не

сложный характер, однако для достижения поставлен-ной цели требуется учитывать не только краткосрочную реакцию объекта, но и длительный процесс изменения состояния объекта. Исходя из существенной разницы в постоянных времени процессов восприятия и решения по отношению к процессу изменения параметров объ-екта, разделим систему на две подсистемы. Первую подсистему формируем из процессов распознавания и принятия решения:

yi i yi i xi

zi i yi

i

i0 i1

i i

i21 i22

I A I B I

;

I C I

0 1

A ;

a a

0 0 0

B ; C

b b 1

üï

= + _ïý

ï

= _ïþ

æ _ö÷

ç _÷

=ç_ç_ç- _- _÷_÷

è ø

æ ö_÷ é ù

ç _÷ _{ê ú}

=ç_ç_çè _÷_÷ =_{ê ú}

ø _{ë û}



. (31)

При этом вектор управления содержит две ком-поненты:

Iix1 – информация о функции цели, предлагаемая

по каналу управления;

Iix2 – информация об ограничениях.

При этом для собственной функции цели fi и

ди-рективной функции цели f информация о функции цели, предлагаемая по каналу управления:

.

1 i

ix f f

I   ₍₃₂₎

А компонент Iix2 информация об ограничениях

оп-ределяется влиянием на функцию цели и по сути дела является множителем Лагранжа:

.

2 __ 

 f

I_ix (33)

W1(p)=k1/(T1p+1)

Распознавание

W2(p)=k2/(T2p+1)

Решение x

(5)

При агрегировании объектов в группу из n объек-тов, порядок вектора состояния системы равен N=2n, и для трех объектов в системе, матрица объекта прини-мает вид: . 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 1 3 30 32 31 23 21 20 21 13 12 11 10                            a a d d d a a d d d a a

A (34)

Тогда дополнив матрицу объекта подсистемы матрицей связи Dij где индекс j указывает какая

подсис-тема влияет на i- тую подсистему

. 0 0 0        ji ji _d D (35)

Тогда матрица объекта всей системы принимает вид блочной матрицы:

10 11 21 31

12 20 21 32

13 23 30 31

1 12 13

21 2 23

31 32 3

0 1 0 0 0 0

a a 0 d 0 d

0 0 0 1 0 0

A

0 d a a 0 d

0 0 0 0 0 1

0 d 0 d a a

A D D

D A D

D D A

æ _ö÷

ç _÷

ç_- _- _÷

ç ÷ ç ÷ ç ÷ ç _÷÷ ç _÷ ç

=_ç _÷_÷=

- -ç _÷ ç ÷ ç ÷ ç _÷÷ ç _÷ ç _÷ ç _÷

ç -

-è ø

æ _ö÷

ç _÷

= ç_ç ÷_÷

ç _÷÷

çè ø

.

(36)

При этом матрица B системы принимает вид диа-гональной блочной матрицы:

121 122 221 222 321 322 1 2 3

0 0 0 0 0 0 b b 0 0 0 0 0 0 0 0 0 0 B

0 0 b b 0 0 0 0 0 0 0 0 0 0 0 0 b b B 0 0

0 B 0 , 0 0 B

æ _ö÷ ç _÷ ç _÷ ç _÷ ç _÷ ç ÷ ç ÷ ç _÷÷ ç _÷ ç

=_ç _÷_÷=

ç _÷ ç ÷ ç ÷ ç _÷÷ ç _÷ ç _÷ ç _÷ çè ø æ _ö÷ ç _÷ ç _÷ ç _÷

=ç_ç _÷_÷

ç _÷÷

çè ø

(37)

и вектор управления имеет вид:

. 3 2 1 32 31 22 21 12 11                                 x x x x x x x x x x I I I I I I I I I

I ₍₃₈₎

Аналогично формируется матрица выхода:

. 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 3 2 1            c c c C ₍₃₉₎

При этом вектор выхода имеет размерность N. Та-ким образом, математическая модель динамики всей подсистемы, определяется выражением аналогичным (40): .        y z x y

y A B

I C I I I I  (40) Вторая подсистема описывается более просто, так как не содержи подсистем и является просто много-мерной системой порядка N:

.

z s s s

s AI BI

I   ₍₄₁₎

Тогда, с учетом разделения задачи на подзадачу управления восприятием и принятием решения и под-систему изменения параметров объекта, структура системы принимает вид, приведенный на рис. 3.

Подсистема принятия решения связана с решени-ем задачи оптимального управления для каждого объ-екта. Рассмотрим отдельно от группы одного агента, в этом случае порядок системы равен двум и можем использовать модель со скалярным функционалом цели и матрицей выхода, принимающей вид:

. 1 0        C (42)

При выборе функции цели необходимо учитывать специфику задачи. Во-первых, за время принятия ре-шения t1-t0 проходит переходный процесс, связанный с

восприятием информации принятием решения о дей-ствии, естественно, что желательно сократить время переходного процесса, но более существенно сократить потери информации за рассматриваемый период. Учи-тывая, что выходная информация ограничена всегда положительной оценкой действия Im и выполняется

условие Im-CIyi>0, иначе задача теряет смысл, в

(6)

Рисунок 3 – Структура системы управления

. ) (

1

0

dt I

J t

t

yi i m

i



CI (43)

Тогда получаем задачу оптимального управления:

. ) (

0 ) (

; min ,

; ) (

* 1 0 * *

1

0

    

     

 

  



yi

I t t I

B A

J dt I

J

yi yi

yi i zi

xi i yi i yi

i xi

yi t

t

yi i m i

CI CI

I C

I I I

I I

I C

 ₍₄₄₎

Функция Гамильтона в данном случае имеет вид [10, 11]:

;. ) (

, ) (

0 m i yi i i yi i xi

i I A B

H  CI  λ I  I (45)

Так как интегрант функционала цели линеен и матрица управления не нулевая, то условие стационар-ности по управлению не выполняется:

) (

, )) (

( ₀

I I I λ I

I C

I  

 

    

xi xi i yi i i

xi yi i m

xi

i I A B

H 

(46) При этом каноническая система уравнений Ла-гранжа – Эйлера принимает вид:

, ;

dt d H

yi i

i i yi

i

I

λ λ

I

  

   

или

. ;

0 i i T i i

xi i yi i yi

A dt d

B A dt d

C

λ λ

I I I

   

 

Так как матрица объекта по условиям задачи гур-вицева, то для сходимости процесса по множителям Лагранжа с учетом требования неотрицательности множителя Лагранжа в задаче поиска минимума, мо-жем записать:

. 2 , 1 , 0

; 0

 



j

λ

dt d

j i λ

(47) Следовательно, в процессе принятия решения, влияние ограничений должно монотонно уменьшаться.

а

б

Рисунок 4 – Формирование управления (а), и результаты моделирования (б)

Учитывая, что функция Гамильтона линейна по отношению к входной информации и учитывая ограни-ченность входной информации

Подсистема принятия решения

Подсистема развития

Прогноз развития Коррекция

управления

Ix Iy Iz

Izt

(7)

,

0IxiIxm (48)

можем записать оптимальное управление в виде трех знакопостоянных управлений:

. ,

; ,

0

; 0 ,

1 2 * *

2 1 *

1 *

t I

I

t I

I

x xi xi

xm xi

 

  

  

  



(49) Это дает интервал повышенного потока информа-ции, как побуждение к действию, интервал ожидания и интервал коррекции управления (рис. 4,а), (рис. 4,б).

Как видно из результатов моделирования, опти-мальное управление позволяет получить переходный процесс со значительно меньшими затратами инфор-мации.

ВЫВОДЫ

1. Использование информационного простран-ства позволяет учитывать особенности функциониро-вания организационных систем.

2. Модель динамики организационной систе-мы базируется на свойствах процедур оптимизации частных функций цели.

3. Линеаризованная модель элемента органи-зационной системы имеет третий порядок.

4. Гипотеза постоянства чувствительности ча-стной функции цели к входной информации позволяют иметь линейную метрику в информационном про-странстве.

5. Оптимальное управление организационной системой основывается на использовании принципа максимума Понтрягина.

6. В задаче оптимального управления студен-ческой группой на занятиях физистуден-ческой подготовкой эффективно использование квазиоптимального управ-ления.

ЛИТЕРАТУРА:

1. Makarov I.M. Intellektual'nye sistemy avtomaticheskogo upravlenija /Pod red. I.M. Makarova, V.M. Lohina. – M.: Fizmatlit, 2001. – 576 s. 2. Novikov D.A. Kurs teorii aktivnih sistem /D.A. Novikov, S.N. Petrakov. – M.: CYNTU. 1999. – 104 s.

3. Novikov D.A. Mehanizmy upravlenija dinamicheskimi aktivnimi sistemami /D.A. Novikov, I.M. Smirnov, T.E. Shohina. – M.: IPU RAN, 2002. – 124 s.

4. Coj E.B. Modelirovanie i upravlenie v ekonomike (chast' I). Kurs lekcіj /Coj E.B., Samochernov I.V. – Novosibirsk: Izd-vo NGTU, 2003. – 104 s. 5. Ahangel'skij V.I. Integrirovannye ASU v promyshlennosti /V.I. Arhangel'skij, I.N. Bogasenko, N.A. Rjumshin. – K.: NPK «Kievskij institut

avtomatiki», 1995. – 316 s.

6. Bondarev V.N. Iskusstvennyj intellekt: Uch. posobie dlja vuzov /V.N. Bondarev, F.G. Ade. – Sevastopol': izd-vo SevNTU, 2002. – 615 s. 7. Komashinskij V.I. Nejronnye seti i ih primenenie v sistemah upravlenija i svjazi /V.I. Komashinsskij. – M.: Gorjachaja linija-Telekom, 2003. –

94 s.

8. Chernoruckij I.G. Metody optimizacii v teorii upravlenija: Uch. posobie dlja vuzov /I.G. Chernoruckij. – SPb.: Piter, 2004. – 256 s.

9. Brazhnik D.A. Informacionnaja model' invariantnoj sistemy raspoznavanija /D.A. Brazhnik, F.B. Rogal'skij, V.A. Tkach //Problemi іnformacіjnih tehnologіj. – 2009. – №1 (005). – S.31-37.

10. Alekseev V.M. Optimal'noe upravlenie /V.M. Alekseev, V.M. Tihomirov, S.V. Fomin. – M.: Nauka, 1979. – 428 s. 11. Rektoris K. Variacionnye metody v matematicheskoj fizike i tehnike /K. Rektoris. – M.: Mir, 1985. – 590 s.