• Nenhum resultado encontrado

Schwarz, Hans Rudolf Publication date:

N/A
N/A
Protected

Academic year: 2023

Share "Schwarz, Hans Rudolf Publication date:"

Copied!
33
0
0

Texto

(1)

ETH Library

Ein Verfahren zur Stabilitätsfrage bei Matrizen-Eigenwertproblemen

Doctoral Thesis Author(s):

Schwarz, Hans Rudolf Publication date:

1956

Permanent link:

https://doi.org/10.3929/ethz-a-000091928 Rights / license:

In Copyright - Non-Commercial Use Permitted

This page was generated automatically upon download from the ETH Zurich Research Collection.

For more information, please consult the Terms of use.

(2)

Prom Nr. 2603

Ein Verfahren

zur

Stabilitätsfrage

bei Matrizen-Eigenwertproblemen

VON DER

EIDGENÖSSISCHEN

TECHNISCHEN HOCHSCHULE

IN ZURICH

ZUR ERIANGUNG

DER WURDE EINES DOKTORS DER MATHEMATIK

GENEHMIGTE

PROMOTIONSARBEIT

VORGELEGT VON

HANS-RUDOLF SCHWARZ dipl Mathematiker ETH

von ZURICH

Referent Herr Prof Dr E Stiefel

Korreferent HerrProf Dr H Hopf

BASEL

Buchdruckerei Birkhauser AG 1956

(3)

Meinen lieben Eltern in Dankbarkeit

gewidmet

(4)

3

Ein Verfahren

zur

Stabilitätsfrage bei Matrizen-Eigenwertproblemen

VonHans-Rudolf Schwarz,

Zürich1)

1.

Einleitung

und

Problemstellung

Zahlreiche technische

Fragen

führen auf das mathematische

Problem,

für das

Matrizen-Eigenwertproblem (A

X

E)

x =0 die Anzahl der

Eigenwerte

mit

positivem

Realteilzu

bestimmen,

wobei die

Eigenwerte

selbst meistens gar nicht interessieren. Diese

Problemstellung

nenntmankurzdie

Stabilitätsfrage.

Um diese zu

beantworten,

sind verschiedene klassische Kriterien

bekannt,

welche aber allevomcharakteristischen

Polynom P(X) ausgehen,

also

bedingen,

dassdasselbe

explizit

ermittelt wird. So erwähne ich die KriterienvonRouth

[1]2)

und Hurwitz

[2],

welche in ihrer

ursprünglichen Formulierung

auf

Polynome

mitreellen Koeffizienten

Anwendung finden,

im

übrigen

aber

gleichbedeutend

sind. Das Ortskurvenkriterium von

Nyquist [3]

bestimmt auf

graphischem Weg

die Anzahl der Nullstellen der charakteristischen

Gleichung P(X)

= 0mit

negativem

Realteil. Eine unmittelbare

Folge

davon ist das

Lagen-

oder Lük-

kenkriterium

[4],

welches

aussagt,

dass dann und nur dann sämtliche Null¬

stellenvon

P(X)

=0

negative

Realteile

aufweisen,

wenndie WurzelnvonReal- und

Imaginärteil

von

P(i y)

=

Re(y)

+ i

Im(y)

reell sind und sich

gleichzeitig gegenseitig

trennen. Dasbekannteste numerische Verfahrenzur

Beantwortung

der

Stabilitätsfrage

dürfte wohl die Methode der Sturmschen Kette

[5] sein,

wonach aus dem Real- und

Imaginärteil

von PU

y)

=

Re(y)

+ i

Im(y)

durch

fortgesetzte

Divisionmit Rest eine

Folge

von

Polynomen absteigenden

Grades

gebildet

wird. Die Anzahl der

Eigenwerte

in der linken

komplexen

Halbebene

Rez < 0 lässt sich dannausdem Unterschied der Zeichenwechsel in der

Poly¬

nomfolge

für y= oo und y = +oo

angeben.

Damit

äquivalent

ist das Stabilitätskriterium von Wall

[6],

welches die

Aussage

in die Form eines Kettenbruches kleidet. Daneben finden sich in der Literatur einerseits noch verschiedene numerische

Verfahren,

welche vermittels eines

Reduktionspro¬

zesses aus dem charakteristischen

Polynom

eine

Folge

von

Polynomen

bestim¬

men, aus denen die

Frage

beantwortet werden

kann,

und anderseits auch

einige graphische

Methoden.

x) Institut furangewandteMathematik derETH.

2) Die Ziffern ineckigenKlammern verweisen auf dasLiteraturverzeichnis,Seite30.

(5)

4

Auf derandern Seite führt

jedes gangbare

numerische Verfahrenzur

expli¬

ziten

Entwicklung

des charakteristischen

Polynoms

von

(A

À

E)

x= 0 auf

eine

Folge

von

Polynomen,

deren Grad sich bei

jedem

Schritt um 1 erhöht

und die mit dem charakteristischen

Polynom endigt.

Ichverweise auf das Ver¬

fahrenvonWeber-Voetter

[7],

auf die MethodevonHessenberg

[8]

und den

Biorthogonalisierungsprozess

vonLanczos

[9],

welche alle über eine Reihevon

Polynomen aufsteigenden

Grades zum charakteristischen

Polynom

führen.

Um danndie alleininteressierende

Stabilitätsfrage

beantwortenzukönnen,

musseine

Polynomfolge absteigenden

Grades ermittelt werden. Um den

Weg

über eine

aufsteigende

und dannüber eine

absteigende

Kettevon

Polynomen

zu

vermeiden,

in welcher das charakteristische

Polynom

als solches vonhöch¬

stem Gradmeist gar nicht

interessiert, gab

mir HerrProfessor Dr. E. Stiefel

(ETH)

die

Anregung, folgende Frage

zuuntersuchen:

Problem:Man berechne das charakteristische

Polynom P(X)

ausderMatrix A

über eine solche

aufsteigende

Kette von

Polynomen,

aus welcher schon selbst die

Stabilitätsfrage

beantwortet werden kann.

Dieser Wunsch führte zu einem

Verfahren,

unter

Umgehung

des charak¬

teristischen

Polynoms

die

gegebene

Matrix A mit Hilfevonelementaren Trans¬

formationen auf eine Normalformzu

bringen,

deren Elemente allein schon das

Stabilitätsproblem

lösen. Die beschriebene Methode weist den Vorteil

auf,

dass die anzuwendenden

Rechenoperationen

von grosser Einheitlichkeit

sind,

was das

Programmieren

auf Rechenautomaten erleichtert. Bei der klassischen Methode der SturmschenKette stützt sich die ganze

Entscheidung

der Stabili¬

tät auf eine

längere Rechnung,

welche vom charakteristischen

Polynom

aus¬

geht.

Die Koeffizienten dieses

Polynoms

enthalten sicher

weniger

Information als die

ursprünglich gegebenen

Matrixelemente. Es ist zu hoffen, dass unsere

Methode,

diedie Matrixelemente in mehr direkter Weiseverwendet,in manchen Fällen numerisch stabiler verläuft. Ob diese

Hoffnung berechtigt ist,

können

allerdings

erst

umfangreichere

Versuche entscheiden.

An dieser Stelle möchte ich den Herren Professoren Dr. E. Stiefel und Dr. H.

Rutishauser,

die mit ihren wertvollen Hinweisenzum

Gelingen

dieser

Arbeit

beigetragen haben,

meinen besten Dank

aussprechen.

I. Das Stabilitätskriterium

2. Das Kettenbruchkriterium vonWall

[6]

Es sei

P(z)

=zn+

cn_xz"'1

+

c„_2zn~2

+ V cxz+ c0 ein

Polynom

w-ten

Grades mit

komplexen

Koeffizienten ck=

ftk

+ i qk. Aus diesem bilde man

Q(z)

=

[P(z)

(— 1)" P{— z)}j2,

worin

P(z)

das

Polynom

mit den

konjugiert

(6)

ßW

1 1 ' 1 P{z) rxz+ sx -r 1 ' r2ir+ s2 ' rsz + s3

komplexen

Koeffizientenck=

pk

i qk bedeutet. Dann ist

<?(*)

=

Pn-l

Zn~X + i ?„-* *""* +

Pn-S

*-8- »?«_4 -Z""4 + '" .

und der

Quotient Q{z)jP(z)

hat im

allgemeinen

eine

Kettenbruchentwicklung

von

folgender

Form mit inzlinearen Teilnennern:

+

-+„ /+— (2-1)

Satz 1

(Kriterium

von

Wall)

: Existiert die

Kettenbruchentwicklung (2.1)

von

Q{z)jP{z),

so sind darin die Grössen rk

(k

= 1,2,... ,

n)

reell und von Null

verschieden,

diesk

(k

= 1, 2, ... ,

n)

rein

imaginär

odernull. Sind dann unter den rkm

positiv

und

(n

m) negativ,

sohabenmder Wurzelnvon

P(z)

=0

negative

und

(n

m) positive

Realteile.

Die Teilnenner in

(2.1) ergeben

sich durch

fortgesetzte

Division mit Rest nach dem euklidischen

Algorithmus

für

P(z)

und

Q(z).

So ist

speziell

fürden

erstenTeilnenner

P(z)

=

(r1z

+

s1+l)Q(z)

+

R1(z) (2.2)

und nachSubtraktionvon

Q(z)

auf beiden Seiten

P(z)

-

Q(z) H'i

*+

*i) ÇW

+

*i(*)

.

(2.3)

Da der Rest

R^z)

in

(2.2)

und

(2.3) gleich ist,

lautet die Kettenbruchentwick¬

lung

von

Q(z)l[P(z)

-

Q(z)]

--

ÖW

__ =

l

__ + 1 +

A_

+ ... +

_i_ (2 4)

p(z) - 0W rtz -{ Sl r2z + s2 i-jHSa V^tS,

mit denselben rÄ, sfc

(k

= 1, 2, ... ,

n)

wiein

(2.1).

Demnach

gilt

derzu Satz 1

äquivalente

Satz 2: Existiert die

Kettenbruchentwicklung (2.4) für

den

Quotienten Q(z)/[P(z)

Q{z)],

so sind darin die Grössen rk

(k

= 1, 2, ... ,

n)

reell und von

Nullverschieden, diesk

(k

= 1,2, ... ,

n)

rein

imaginär

oder null. Die Anzahl der

positiven

rk ist dann

gleich

der Anzahl der Wurzelnvon

P(z)

= 0 mit

negativem

Realteil.

Die Teilnenner

(rkz+ sk)

in

(2.4)

berechnen sich nach dem euklidischen

Algorithmus

für

f0(z)

=

P(z)

Q(z)

und

f-^z)

=

Q(z).

Es ist

f0(z)

=

P(z)

-

Q(z)

=zn+ i qn^ z«-1 +

pn_2

z*-2+ i qn_a zn~3+

pn_4

zn^

/l W

=

<?(*)

=

Pn-l

Z"-1 +tqn-2 Zn~2+

Pn-Z

S""3+*?«-4 Z""4+ '''

(2.5)

(7)

undes sei

allgemein

/*(*)

=

«*.**B-*+«*,*+i*"~*~1

n-k

'- + ak,n-\z+ ak,n

2j

Œk'k+>2"

J-0

=0,1,

...,»).

(k=

1, 2, ... ,n-

1)

.

(2.6)

Dann bildet man

/o(*)

=

('i'

+

«i) /i(*)

+

/î(*)

-

/n-lW

=

K

2 +

Sn) fn{z)

Die Grössen rfc, sk, akik+1

(k=

1, 2,...,n;

j

=

0,1,...

,n

k)

lassen sich rekur¬

siv

gemäss

den nachstehenden Formeln berechnen:

ak-l,Jc-l 'ak,k" rki \ak-l,l 'kuk,k+l) <*k,k= sk

{k=l,2,...,n)

= ak ak-l,k+l+j sIeak,k+l+i rkak,k+2+j ~ uk+l,k+l+i

(k

= 1,2, ... ,n1; 1 0,1, ... ,n k 1; mit aki„+1=

0)

.

Die

Anfangsbedingungen

dazu lauten nach

(2.5):

a00 1 a0l= *9n-l > a02 = Pn-2' a0Z =*In—Z> a04= Pn-i» >

all=

Pn-X

> aX2 =lin~2> ali =

Pn-3

< aXi= lQn-i,

(2.7)

(2.8)

3.

Herleitung

des Kriteriums vonWall ausdem Verfahren der Sturmschen Kette

Betrachten wir die Methode der Sturmschen Kette

[5]

zur

Beantwortung

der

Stabilitätsfrage

: Danachsetztman in

P(z)

z i y

ein,

trennt in Real- und

Imaginärteil P(i y)

=

Re(y)

+ i

Im(y)

und

beginnt

für

gerades

n mit

F0(y)

=

Re(y), F^y)

=

-Im(y)

,

bzw. für

ungerades

n mit

F0(y)

=

Im(y), Fx{y)

=

Re(y).

Dann lässt sich im

allgemeinen

eine

Folge

von

Polynomen Fk(y)

vom wirklichen Grad n k und

(8)

mit reellen Koeffizienten

Aki

k+j mit

Aki

k + 0wie

folgt

bilden:

Fk(y)=Akiky- I*,

k+iy

Ak,n-1

y +

Ak>n

n-k

=

ZA,*+1yn-k-j (A

=

0,1,...,»),

J-0

F0(y)

=

(Äi

y +

SJ J^(y)

-

F2(y)

,

F1(y)

=

(R2y+S2)F2(y)-F3(y), \ (3.1)

F^{y)

=

(Rky

+

sk) Fk(y)

-

Fk+1(y) (k

= 1,2,...,n-

i),

iV-i(y)

=

(ÄB

y +

5») Fn(y)

.

Für das

folgende

treffen wir die

Voraussetzung:

Die Sturmsche Kette

für

das

Polynom P(z)

existiert in der Form

(3.1),

wobei die

Quotienten (Rky

+

Sk)

bei der

fortgesetzten

Division mit

Rest linear seien.

Dann

gilt

bekanntlich

Satz 3: Existiert die Kette

(3.1),

so ist die Anzahl N der Nullstellen von

P(z)

= 0 mit

negativem

Realteil N=

(n

+ l

w)/2,

wobei

(l

m)

der Unter¬

schied in der Zahl der Zeichenwechsel in der Sturmschen Kette

F0(y), F^y),

... ,

Fn-\{y)> Fn(y) für

y= ooundy= +00ist.

Darin ist l die Gesamtzahl der Verluste undmdie Gesamtzahl der Gewinne

anZeichenwechseln in der Kette

(3.1)

beim Durchlaufen der

imaginären

Achse

von i00 nach + i00. Diese Werte lassen sich aus den Koeffizienten

Aki

k

bzw.aus den

Quotienten Rk

=

Ak_xk_x\Aktk

ohne weiteres

angeben.

Betrachtet

man

Fk_x{y)

und

Fk(y),

so hatman

bezüglich

dieser beiden Glieder in der Kette hinsichtlich Zeichenwechsel

folgende

Situation:

sgn

Rk

=

00 1Zeichenwechsel I

00 0Zeichenwechsel

[

00 0 Zeichenwechsel

|

00 1Zeichenwechsel

|

1 Verlust

1 Gewinn

Somit ist dieGesamtzahlder Verluste /anZeichenwechseln

gleich

der Anzahl

der

positiven Rk

und die Zahl der Gewinnem

gleich

der Anzahl der

negativen

(9)

Rk.

Wenn

F0(y)

und

F^y)

teilerfremd

sind,

die

fortgesetzte

Division mit Rest wirklich mit

Fn(y)

const #= 0

endigt,

so istn= 1 +mund demnach

_

{l_-t-

m + l m) _,

also

folgt

aus Satz 3:

Satz 4: Die Anzahl N der Nullstellenvon

P(z)

= 0 mit

negativem

Realteil ist

gleich

derAnzahl der

positiven Rk

in derKette

(3.1).

Für die

Polynome F0(y)

und

F^y) ergeben

sich:

/. Fall: n=4k oder n= 4k + 1

(k ganz) F„(y)

=yn+ ?n-i

y""1

-

A.-* y*-2

- ?«-sy

Fi(y) Pn-iyn-1

+qn-lyn-l-'Pn-ay*~3-?«-4

y"~4

+

(3.2)

2.Fall:n= 4 k + 2oder«=4 Ä +3

(k ganz)

^0*(y)

=-y*-?«-i

y"-1

+

^m-2 y"~2

+ ?„-s

y"'3

-

£»-4 y"~4

-

F*(y)

:

-/>»-!

r

?„-ïr-s+/»«-8yn_8+?„-4r

-F0(y), -Fi(y)

Da

F*{y)

=

—i^,(y)

und

/^(y)

=

—F^y) ist,

so unterscheiden sich die Ketten

Fk*(y)

und

Fk(y)

nur durch das

Vorzeichen;

es ist

Fj*(y)

—Fk(y),

aber

R%

=

Rk (k

= 1, 2,... ,

«).

Deshalb kann die

Zerlegung

von

P(z)

in

F0(y)

und

i\(y) unabhängig

von «indererstenForm

(3.2) geschehen.

Fürdie Koef¬

fizienten

Rk, Sk, Akik+j (k

= 1,2, ... ,n;

j

= 0, 1, ... ,n

k)

bestehen die fol¬

genden

Rekursionsformeln:

Ak-i,

jt-i:

Ak>

Rlr

(4c-l,

R-k.

Ak> k+1)

:

Akik

Sk

(k^\,2,

...

,n)

,

~~-Ak_lik+1+j

+ok

Ak:k+1+j

-f

Rk Ak}k+2+j

Ak+lik+1^j (k

= 1, 2, ...,«- 1;

/

- 0, 1, ... ,n

-k-l;

mit

AkiU+1

=

0)

(3.3)

Die

Anfangsbedingungen

dazu lauten nach

(3.2):

An 1>

An.

grn_1,

Aq2

pn A3 ?«-

Pn-

•"11

/V-l> At2

"- <7«-2> -"13_"

~ftn-3> A4

(3.4)

Nach diesen

Vorbereitungen

kann nun

gezeigt werden,

dass Satz 2 und damit Satz 1 eine

Folge

von Satz 4 ist.

Voraussetzung:

Die SturmscheKette in der Form

(3.1)

für

P(z)

existiert.

(10)

9

Behauptung

Die

Kettenbruchentwicklung (2 4)

von

Q(z)j[P(z)

Q(z)]

exi¬

stiert, undes

gilt

«i *+,= i3

-Ak.k+i

=0,1, ,«,7 = 0,1,

,n~k),

I

(3 5)

rk=

Rk,

sk=4

Sj. (ä

= 1,

2,

,

«) J

Induktionsannahme Die

Behauptung (3 5)

sei

richtig

furJgwjl Indukhonsschluss Gemäss Rekursionsformel

(2 7)

ist fur k= m

"-m+1 m+1+3 = ^m—1,m+l+3 ^m ^-m,m+l+3 ^m^m,m+2+3 ^U ^ 7 ^ « W l) Nach

Induktionsvoraussetzung

ist dies einerseits

1'^ + 2 A 1 9 ^+1 ,4 _ P ?3+2 /)

-^m—1,m+l+3 v '-'m^ -^m m+l+3 ±vml -^-m m+2+3 >

^ \ **-m—1 m+l+3 "T~ ^m-^*-m m+l+j~T J^m^*-m,m+2+3/ >

und anderseits

infolge (3 3)

am+l,m+l+3

~ l -"-m+1 m+l+3 1) ="i li ,11 m 1) .

Weiter schhesstman

analog

unter

Verwendung

des letzten Resultates

für?

=0,1

^mm <%m+l,m+1 -^-mm -^-m+lm+1 -^m+1>

=

(«»

= \l**m m+1 -"-m+1^^-m+1 m+2) ^-m+1 m+1 ^ ^m+1

Induktionsverankerung

Fur &= 0 und k= 1 liest man die

Beziehungen

«„j =i3

A0],

a11+1 = î3

A11+1

direkt aus den

Anfangsbedingungen (2 8)

und

(3 4) ab,

undes

folgt daraus,

dass fur k= 1

ri= aoo an ~ ^00 "11

~ -"-l»

si "

(aoi

~ fi ai2) an= \l

-^oi

Rll A12) Alx

-!

Si

ist Nach

Voraussetzung

über die Existenz der Sturmschen Kette

(3 1)

sind

die

Rk

4= 0

(k

=

1,

2, ,

w),

unddeshalb sind auch dierk 4= 0

(k

=

1,

2, . ,

«),

das

heisst,

die

Kettenbruchentwicklungen (2 4)

und

(2 1)

existierenund die rk

sind reell und vonNull verschieden Da die

Sk (k

= 1,

2,

. ,

n)

reell sindaber

eventuell verschwinden

können,

sind die sk= i

Sk (k

= 1, 2,. ,

«)

rem ima¬

ginär oder auch null

Infolge

der Gleichheit rk=

Rk

decken sich die

Aussagen

(11)

10

über die Anzahl der Wurzeln von

P(z)

= 0 mit

negativem

Realteil in den Sätzen 1 und

4,

sodass damit der Beweisvon Satz 1 mit Hilfe des Satzes über die Sturmsche Kette erbracht ist.

4.

Folgerung

aus dem Kettenbruchkriterium

Voraussetzung:

Die

Entwicklung

von

Q(z)/P(z)

in einen Kettenbruch

(2.1)

existiert.

Folgerungen:

Nach Satz 1 sind die Grössen rk

(k

=

1,2,

...

,n)

von Null

verschieden. Deshalb lässt sich auf den Kettenbruch

(2.1)

eine

Äquivalenz¬

transformation

ausführen,

indem der Ä-te Teilbruch mit

l\rk

erweitert wird:

0W

-1/»-!

1

_, 1l^iU i ,

V^a's

P(z)

—z *

*2

S3

^ -

»'s

Setztmsmdann

+

iK-1

»-«

i

(4.1)

-l

«j.

(&

= 2, 3,

6* (Ä

= l,2,

n)

P(z) I

«i+ b1- z

H I

>b*-z

(4.2)

sosind dieak

(k

=

1,2,..., n)

reell undvonNull

verschieden,

die

bk(k=l,2,...,n)

rein

imaginär

oder eventuell null undmanerhält für

(4.1)

(4.3)

Gemäss dem Determinantensatz über die

Näherungszähler

und

Näherungs¬

nennereines Kettenbruchesist

P(z)

alsrc-ter

Näherungsnenner

von

(4.3) gleich folgender

Determinante:

P(z)

=

a1+

bx-

-z «2 0 0 0 . 0 0

-1

b2-z

a3 0 0 . 0 0

0 -1

h~

* <*i 0 . 0 0

0 0 -1

64-2

«5 0 0

0 0 0 0 0 .

K-

-1-2 «n

0 0 0 0 0 . -1

K-*

(4.4)

Aus

(4.4)

ist

ersichtlich,

dass

P(z)

das charakteristische

Polynom

des

Eigen¬

wertproblems (N—zE)

x= 0

ist,

wobei die Matrix N

folgende spezielle Jaco-

(12)

11

bische Form aufweist:

N--

«i +

bx

«2 0 0 . . 0 0

-1

K

«3 0 . .. 0 0

0 -l

h

«4 ... 0 0

0 0 -1

h

.. 0 0

0 0 0 0 .••

K-i

an

0 0 0 0 ... -1

bv

(4.5)

Inder Matrix .ZV sind die Grössen ak

(k

= 1,2, ... ,

n)

reell undvon Null ver¬

schieden,

die

bk (k

=

1,2,

...

,n)

rein

imaginär

oder null.

Übertragung

des KriteriumsvonWall

auf

die Matrix N: Die

Stabilitätsfrage

kann nach

(4.2)

allein ausdem Realteil ax des ersten Elementes in der

Haupt¬

diagonalen

und den reellen Elementen ak

(k

= 2, 3,... ,

n)

in der oberen

beglei¬

tenden

Diagonalen

beantwortet werden. Nach

(4.2) gelten:

»"l«2

«2 a, a,

it

«1 «3«5ak-

rk=

2 4. ft*

2 4 ß

"*

ak

esist som

«ia3«s••«fc

(k gerade) (k ungerade)

(k

= 2, 3, ... ,

n)

sgnrk -sgn(axa2 a3

(k

= 1, 2,

(4.6)

Demnach

folgt

aus Satz 1:

Satz 5: Die Zahl der

positiven

Glieder in der

Folge

von Produkten av ax a2, a1a2a3, ... ,a1a2--- a„_1 an

ergibt

die Anzahl der

Eigenwerte

von

(N

z

E)

x=0

mit

-positiven

Realteilen.

Schlussfolgerung:

Das

gestellte Problem,

das charakteristische

Polynom

einer

gegebenen

Matrix A mit

komplexen

Elementen vermittels einer Kettevon

solchen

Polynomen

zu

ermitteln,

welche die

Stabilitätsfrage

beantworten

kann,

ist damit auf die

Aufgabe zurückgeführt,

die Matrix A mit Hilfeeiner

Ähnlich¬

keitstransformation in die Normalform iV überzuführen.

Im zweiten Teil wird

gezeigt werden,

dass diese Transformation im

allge¬

meinen durchführbar ist. Dabei erweist es sich als

zweckmässig,

die Normal¬

form N an der

Nebendiagonalen

zu

spiegeln

und die

Bezeichnung

leicht zu

(13)

12

ändern. Es seien

B =

i

b'n i12

0 0

-1

ib'2i b23

0 .

0 -1

ib'33 bSi

.

0 0

0 0

0 0

0 0 0 0.

0 0 0 0.

% "n-ln-l °n-ln 1 0„ -+-% Onn

(4.7)

bzw. im reellen Fall

B

0 »12 0 0 . . 0 0

-1 0

hs

0 . . 0 0

0 -1 0

hi

. 0 0

0 0 0 0 . . 0 ®n—in

0 0 0 0 . . -1

(4.8)

die Normalformen der transformierten, zu A

äquivalenten Matrix,

worin die

h,

lc+i

(k

=

2,...,n

1)

und

bnn

reell und von Null verschieden

sind,

wàih- renddem die

b'kh (k

1,

2, ... ,

n)

in

(4.7)

reell aber nichtvonNull verschieden sein müssen. An Stellevon Satz 5 lässt sich dann

folgender

Satz formulieren:

Satz 6

{Stabilitätskriterium für Matrizen):

Wenn es

gelingt,

eine

gegebene

Matrix A =

(ajlc)

mit

komplexen

Elementen ajlc vermittels einer

Ähnlichkeits¬

transformation

indie Form

(4.7),

bzw.

(4.8)

bei reeller Matrix

A, überzuführen,

dann ist dieZahl der

positiven

Glieder in der

Folge

vonProdukten

bnn, bnnbn_ln, Kn K-m K-in-i. ,hn bn-m

hs bi2 gleich

der Anzahl der

Eigenwerte

von

A mit

positiven

Realteilen. Sind

speziell

alle Elemente o12,

623,

... ,

bn_ln, —bnn positiv,

so haben alle

Eigenwerte negative

Realteile.

II. Methode der Transformation

5. Elemente der Transformation

Die Grundidee der Transformation besteht

darin,

durch

geeignete

Wahl und

Reihenfolge

von

möglichst

einfachen

Ähnlichkeitstransformationen

in endlich vielen Schritten sukzessive die

gewünschte

Normalform zu

gewinnen,

indem in

jedem

einzelnen Schritt ein Element der Matrix behandelt wird.

Einerseits bewirkt

ja Multiplikation

miteiner

Diagonalmatrix

Tvonlinks

TA in A eine

Multiplikation

der Zeilen mit den

entsprechenden Diagonalele-

(14)

13

mentenvon

T,

und

Multiplikation

vonrechtsA T eine

entsprechende Multipli¬

kation der einzelnen Kolonnen von A. Anderseits bewirkt

ja Multiplikation

mit einer nicht

Diagonalgestalt

aufweisenden Matrix Tvonlinks TA in A eine lineareZeilenkombination und

Multiplikation

vonrechts A T eine lineare Kom¬

bination der Kolonnen. Als einfachste Gestalt wird T für einen Schritt einer

Ähnlichkeitstransformation

TAT-1 entweder als

Diagonalmatrix

so

gewählt werden,

dassnur

je

eine Zeile und eine Kolonne in A verändert

wird,

oder als

Nichtdiagonalmatrix

so, dass nur zwei bestimmte Zeilen und Kolonnen mit¬

einander kombiniert werden.

Typus

A: T ist

Diagonalmatrix

Es sei

r-

1 0 0 0 . . 0

0 ] 0 0 . . 0

0 0

1/a

0 . . 0

0 0 0 1 . . 0

0 0 0 0

T-i

1 0 0 0 . . 0 0 1 0 0 . . 0 0 0 a 0 . . 0 0 0 0 1 . . 0

0 0 0 0 . . 1

(5.1)

wo

1/a

in

T,

bzw. ain der Inversen

T_1,

inder

j-ten

Zeile und

/-ten

Kolonne

anStellevon1 steht. Eine

Ähnlichkeitstransformation

TA T"1 mit einer solchen Matrix werde im

folgenden

mit

[T,

bezeichnet und hat auf A

folgende Wirkung

:

Division der

j-ten

Zeile durcha und

Multiplikation

der

j-ten

Kolonne mita.

Typus

B: T ist

Nichtdiagonalmatrix

Es sei

T

1 0 0 0 ... 0

0 1 0 a .. 0

0 0 1 0 . .. 0

0 0 0 0 . .. 1

|1

0 0 0 . . 0

!

o 1 0

a . 0

-l__ 0 0 1 0 . . 0

,0 0 0 0 . . 1

(5.2)

wo a in

T,

bzw. —a in

T_1,

in der

j-ten

Zeile und Ä-ten Kolonne steht. Die Matrix

T,

vonlinks

multipliziert TA,

addiertm A zur

j-ten

Zeile das a-fache derß-ten Zeile und die Matrix

T^1,

vonrechts

multipliziert

A

T~1,

subtrahiert inA vonder &-ten Kolonne das a-fache der

j-ten

Kolonne. Demnach bedeutet eine

Ähnlichkeitstransformation

TA T"1 mit einer Matrix Tvondiesem

Typus

:

(15)

14

Man addiere zunächst zur

j-ten

Zeile vonA das

a-fache

der k-ten Zeile und subtrahiere dannvon der k-ten

Spalte

das

«.-fache

der

j-ten Spalte,

oder auch in

umgekehrter Reihenfolge.

Eine solche

Umformung

kann als «zweidimensionale» Transformation be¬

zeichnet werden und sei im

folgenden

durch

{Tjk; a)

dargestellt,

indem die Indizes die Positionvon ain der

dazugehörigen

Matrix T

und damit diezu ändernde Zeile

(/)

und Kolonne

(k)

sowie ihre Kombination kennzeichnen.

Versuchtmannun,die Transformation auf die Normalform mit Hilfe dieser beiden

Typen

von

Umformungen durchzuführen,

soerkenntman

bald,

dass sie im wesentlichen in zwei

Hauptabschnitte

zerfällt: Im ersten Teil werden die Elemente unterhalb der

Diagonalen behandelt,

während im zweiten Teil die Elemente oberhalb und in der

Diagonalen

auf die

gewünschte

Formtransfor¬

miert werden.

6.

Umformung

der Matrix unterhalb der

Hauptdiagonalen

In diesem Abschnitt sei die

Aufgabe gestellt,

die

gegebene

Matrix A =

(àik)

vermittels einer

Ähnlichkeitstransformation

auf die nachstehende Form zu

bringen

:

(6.1) Pu Pl2 Pis Pu

Pin

-1

P22 P23 P2i

Pin

0 -1

P33 Pst Psn

0 0 -1

Pu Pin

0 0 0 0 . Vnn

Dieses Problem ist

allerdings

bereits

gelöst

durch das Verfahren von Hes¬

senberg

[8].

Doch beschreibe ich hierzur

Vereinheitlichung

der ganzen Trans¬

formation einen andern

Weg.

Bezeichnungsweise:

Zur

Vereinfachung

werden die Elemente der umge¬

formten Matrix immer wieder mit ajlc

bezeichnet,

das

heisst,

essei ajlc derWert des Elementes in der

/-ten

Zeile und ß-ten

Kolonne,

wie er sich nach der beendeten letzten

Umformung ergeben

hat.

Die Transformation der Matrix unterhalb der

Diagonalen

kann

gemäss

nachstehender Vorschrift

geschehen

:

(16)

15

Regel

1:

Beginnend

mit der ersten Kolonne und von Kolonne zu Kolonne biszurzweitletzten

fortfahrend, führe

man

fur

die k te

Spalte (k 1,2,

,«

1) folgende Umformungen

aus

a)

Uminder

(k

+

l)-ten

Zeileeine1 zu

erhalten,

wendeman die

Transfor¬

mation

{Tk+1,

—ak+1

k)

an

b)

die Elemente a,k

(j

k + 2 k +3,

,n)

werden dann mit

Hilfe

derzwei

dimenstonalen

Transformationen [T3

k+1,

allc)

zum Verschwinden

gebracht

Dass die

Regel

1 den

gewünschten Erfolg hat,

zeige ich

folgendermassen Voraussetzung

Die

Elemente,

durch welche dividiert werden muss, seien von Null verschieden

Behauptung

Die Matrix A=

(a, k)

mit

komplexen

Elementen a}klasst sich unter

Anwendung

der

Regel

1 auf die Form

(6 1)

transformieren

Beweis

Induktionsannahme Die erstenm—1 Kolonnenweisenbereitsdie

gewünschte

Form

auf,

undes seienalso

ak+\ j;= ~l> aik ~~0 fur £ 1, 2, , m 1

f-k

+ 2,k + 3 , n

Induktionsschluss

Anwendung

der

Regel

1 fur k =m

a)

Nach

Voraussetzung

seiam+1 m =#

0,

die Transformation

(7"«,+!,—

am+1

m)

kann

ausgeführt

werden Danach wirdzuerstdie

(m

+

l)-te

Zeiledurch —am+1 m

dividiert,

wodurchindenersten

(m

1)

Kolonnen nichts

geändert wird,

da ]a am+i s=0 lstfur k= 1, 2, , m 1,inder m-ten Kolonnewird am+1mzu1 und inden

folgenden

Kolonnen werden die Elemente am+1 k mit k=m+1,

m+2, .,nverändert Dann wird noch die

(m

+

l)-te Spalte

mit —am+1 mmul¬

tipliziert,

das heisst die Elemente der

nächstfolgenden Spalte

Die dermten

vorangehenden

Kolonnen werden durch diese Transformation nicht

geändert

b)

Die Elemente alm

(j

m+ 2, m + 3, ,

n)

werden vermittels der Transformation

(T,

m+1,a,

m)

zuNull

gemacht

Danach wird zuerst das a,

m-fache

der

(m

+

l)-ten

Zeilezur

j-ten

Zeile addiert In den

(m

1)

ersten Kolonnen

wird dadurch wiederum nichts

geändert,

da nach Induktionsannahme alk= 0

(k

= 1,

2,

,m

1)

ist sowohl fur j =m+ 1 als auch fur j =m+ 2, m+ 3,

,n, weil in

]edem

Fall 7 2ï

(m

1)

+ 2 ist In der wten Kolonne ist

]etzt

am+i m=

—1>

weshalb aJm in Null

übergeht

und in den

folgenden

Kolonnen

werden die Elemente allc

(k

= m+

1,

m+

2, ,n) geändert

Dann wird noch

von der

(m

+

l)-ten Spalte

das

a3m-fache

der

7-ten Spalte (7

èm+

2)

subtra¬

hiert,

das

heisst,

eswirdnurdie

nächstfolgende

Kolonne verändert

Damit ist

gezeigt,

dass sich das Verfahren gemäss

Regel

1 auf die m-te

Kolonne fortsetzen

lasst,

ohnedabei diem 1 ersten Kolonnen zuandern

Induktionsverankerung

Sämtliche

Überlegungen

des Induktionsschlusses

gelten

sinngemäss auch fur m=\

(17)

16

7. Diskussion

Die Transformation stösst dann auf

Schwierigkeiten,

falls nach

beendigter Umformung

der

(k

1)

ersten Kolonnen das Element ak+lik Null oder auch

nursehrklein

geworden ist,

durch welches im nächsten Schritt die

(k

+

l)-te

Zeileder Matrix dividiert werden soll.

I.Fall: Die

Transformation

kann

auf

die k-te Kolonne

ausgedehnt

werden

Es sei ak+lik= 0,bzw. sehr

klein,

aber mindestens ein Element in der k-ten

Spalte

aJk mit k + 2 <

/

g n von Null

verschieden,

bzw. nicht sehr klein.

Durch

gleichzeitige Vertauschung

der

/-ten

mit der

(k

+

l)-ten

Zeile und der

entsprechenden

Kolonnen kann erreicht

werden,

dass nunin der Ä-ten

Spalte

und

(k

+

l)-ten

Zeile ein von Null verschiedenes Element

steht,

ohne dass dadurch das in den

vorangehenden

Kolonnen schon Erreichte zerstörtworden wäre.An Stelle dieser

Vertauschung

kann auch die im Endeffekt

gleichwertige

zweidimensionale Transformation

{Tk+lt3;l) eingeschalten werden,

indem die

/-te

Zeilezur

(k

+

l)-ten

Zeile addiert und dann die

(k

+

l)-te Spalte

vonder

/-ten Spalte

subtrahiert wird.

Jedenfalls

wird in diesem Fall die

Regel

1 auf

die k-te Kolonne anwendbar.

2. Fall: Die Matrix

zerfällt

Neben dem Element ak+lik verschwinden sämtliche Elemente a,k in der Ä-tenKolonne mit k + 2 g

/

< n, bzw. werden sehr klein. Dann zeichnet sich eine

Unterteilung

der Matrix in Untermatrizen ab:

nfc+i

A.

- 1 #22 a2k-1 a1k a2k+\ a2n

0 -1 . aik-1 aSk ß3*+l adn

0 0 --1 akk akk+l akn

0 0 0 0 ak+lk+l ak+ln

0 0 0 0 ak+2k+l ak±2n

0 0 ... 0 0 ank+1

Dann lässt sich das Verfahren auf die

quadratische

Untermatrix rechts unten weiteranwenden, undmanerhältso schliesslich einezuA

äquivalente

Matrix, welche nicht die Normalform

(6.1) aufweist,

sondern aus Kästchen der Form

(6.1) aufgebaut ist,

welche sich

längs

der

Hauptdiagonalen

aufreihen. Ein

(18)

17

solches Kastchen kann

gegebenenfalls

auch nur aus einem einzigen Element

bestehen,

welches dann

gleich

einem

Eigenwert

vonA ist. Oberhalb der Kast¬

chen wird die Matrix im

allgemeinen

mit von Null

verschiedenen, jedoch

be¬

deutungslosen

Elementen

ausgefüllt

sein. Die Untermatrizen von der Gestalt

(6.1),

die sichso

längs

der

Diagonalen ergeben,

brauchen aber nichts gemeinsam

zu haben. Es kann sein, dass sie je voneinander verschiedene

Eigenwerte

be¬

sitzen, teilweise untereinander

gleiche Eigenwerte

aufweisen, oder dass alle

Eigenwerte

einer Untermatrix auch

Eigenwerte

einer andern sind Zu

jedem

Fall lassen sich ohne weiteres

Beispiele

konstruieren. In gewissen Fallen ist diese

Aufspaltung

rem

zufalliger

Natur und kann durch

geeignete

Zeilen- und

Kolonnenvertauschungen

inder

Ausgangsmatrix

vermieden werden. Inandern Fallenistsie durch das

Koordinatensystem bedingt

und kann durch

Übergang

zu einemanderen

System

umgangen werden Ganz

allgemein

istdiese Erschei¬

nung immerdann vorhanden und nicht zum Verschwinden zu

bringen,

wenn

die Matrix A mehrfache

Eigenwerte

besitzt, und fur einensolchen der

Rang¬

abfall grosser als 1 ist, mit anderen

Worten,

wenn das

Mimmalpolynom

von

A nichtmit demcharakteristischen

Polynom

übereinstimmt. Soist esunmög¬

lich,

eine Hermitesche Matrix mit mehrfachen

Eigenwerten

vermittels einer

Ahnlichkeitstransformation auf die Form

(6 1)

zu

bringen

Das

Versagen

des

Verfahrens ist demnach in diesem Fall durch die Struktur der

gegebenen

Matrix

bedingt,

worauf aber hier nichtweitereingegangen werden soll

8.

Beendigung

der Transformation fur reelle Matrizen

Voraussetzung

Die Matrix A seiauf die Gestalt

(6 1) transformiert,

und die

Kettenbruchentwicklung (2.1)

fur das charakteristische

Polynom

existiert.

Dann lasst sich die Matrix noch mit endlich vielen

Umformungen

vom

Typus

B auf die Normalform

(4 8) bringen

Geht man an die

Losung

dieses Problems, so ist man versucht, die ge¬

wünschte Form einfach dadurch zu erreichen, dass mandie

notwendigen

Ele¬

mente durch

geeignete

Transformationen Schritt fur Schritt zu Null macht, indem man von Kolonne zu Kolonne fortschreitet Fur drei- und

vierreihige

Matrizen

gelangt

man auf diese Art auch wirklich ohne grosse

Schwierigkeiten

zumZiel. Bei

hoherreihigen

Matrizen scheint diesvorerstauchzufunktionieren, und man

gelangt

einmal zu einer

äquivalenten

Matrix, welche zwar in den (n

1)

ersten Kolonnendie

gewünschte

Gestalt

aufweist, jedoch

inder letzten

Spalte

im

allgemeinen

nur von Null verschiedene Elemente enthalt. Willman

diese noch zum Verschwinden

bringen,

so wird das schon Erreichte teilweise wieder zerstört. Aus diesem Grundist die

Reihenfolge

der

Umformungen

ge¬

schickter zu

wählen,

und so hat sich fur reelle Matrizen eine Transformation

herausgebildet,

welche sich m drei Teile

gliedert

und die sich in die

folgenden

Regeln

zusammenfassen lasst

(19)

18

Regel

2:

Beginnend

in der erstenKolonne und

fortschreitend

vonKolonnezu

Kolonne bis zur

zweitletzten,

werden alle Elemente aôk mit

gerader

Indexsumme

j

+ k und

l^]'g^gM-l

zu Null

gemacht,

indem im

allgemeinen

Schritt

die zweidimensionale

Transformation {Tiilc+1; ai]c) ausgeführt

wird.

Regel

3: Die Elemente ain in der letzten

Spalte

mit

gerader

Indexsumme

j

+n und

]'

g«- 2 werden zum Verschwinden

gebracht,

indem die

Transfor¬

mationen

{Tj:n; —ainlann) angewendet

werden.

Hatmansämtliche

Umformungen gemäss

den

Regeln

2 und 3

durchgeführt,

so

liegt

nuneine Matrix vor,in welcher in und oberhalb der

Hauptdiagonalen

mit Ausnahme vonanalle Elemente mit

gerader

Indexsumme Null sind:

0 a12 0 «14 0 a16

-1 0 «23 0 «25 0

0 -1 0 a3i 0 «36

0 0 -1 0 «45 0

0 0 0 -1 0 «56

0 0 0 0 0 0

Die restlichen Elemente werden noch wie

folgt

behandelt:

Regel

4:

Beginnend

in der letzten Kolonne und dann nachvorn

fortfahrend

biszurvierten

Kolonne,

werdensämtliche Elemente askmit

ungerader

Indexsumme

j

+ k und

4^j

+ 3-èk<ninNull

übergeführt,

indem im

allgemeinen

Schritt

die

Transformation [Tjile_x; —ajklak_li]c) ausgeübt

wird.

Anmerkung:

Die in den

Regeln

2 bis 4

angegebene Reihenfolge

ist nicht die

einzig mögliche,

sondern sie kann inbestimmten Grenzen noch variiert werden.

So ist im

Prinzip jede Folge zulässig,

die so beschaffen

ist,

dass in ihr

jeder

Schritt das bereits Erreichte unverändert lässt. Im Hinblick auf die Verifi¬

zierung

desVerfahrens wie auch auf die

Programmierung

für Rechenautomaten erschien mirdie

gewählte Reihenfolge

als

zweckmässig.

9. Beweis des Verfahrens

Voraussetzungen

I. Die

gegebene

Matrix A lässt sich vermittels einer

Ähnlichkeitstransfor¬

mation auf die Gestalt

(6.1) bringen.

II. Die

Kettenbruchentwicklung

des

Quotienten Q[z)jP{z) (2.1)

für das

charakteristische

Polynom P(z)

=

|

zE A

|

existiert.

(20)

19

Behauptung:

Dann lässtsich A durch eine

Ähnlichkeitstransformation

in die Normalform

(4.8)

überführen.

Beweis: Nach

Voraussetzung

I kann angenommen

werden,

dass A schon die Form

(6.1) aufweise,

und es bleibt zu

zeigen,

dass die

Anwendung

der

Regeln

2,3 und 4 zum Ziel führt.

1.

Regel

2

Induktionsannahme: Dieersten

(m

1)

Kolonnen seien bereits nach

Regel

2

behandelt worden und manhabe oberhalb der

Diagonalen:

a,-fc= 0 für

j+k gerade (l<Lj-g,k-g,m-\-g,n-2). (9.1)

Induktionsschluss: Um das Element aim mit

j

+ m

gerade

und

j

m zum

Verschwindenzu

bringen,

werde nach

Regel

2 zuerstdas

a3m-fache

der

(m

+

1)-

ten Zeile zur

/-ten

Zeile addiert. Da in der

(m

+

l)-ten

Zeile die Elemente am+i,h= 0 smd für

lg^m-1,

so wird dadurch in den

(m

1)

ersten

Kolonnen nichts

geändert;

da am+lim= 1

ist,

wird aim in Null

übergeführt,

undeswerden in der

/-ten

Zeilenurdie Elemente a,kmit m + 1 sï k SIn ver¬

ändert. Dann muss noch von der

(m

+

l)-ten Spalte

das

ajm-ia.che

der

/-ten Spalte

subtrahiert werden. Da

infolge

der Form

(6.1)

in der

/-ten

Kolonne nur

die Elemente aij+ 0 sind mit t g j + 1 ä«+ 1, werden dadurch nur die Elemente aitm+1in der

nächstfolgenden (m

+

l)-ten Spalte

in und oberhalb der

Hauptdiagonalen

betroffen.

Insgesamt

werden also nurElemente in und ober¬

halb der

Diagonalen verändert,

die in einem

späteren

Schritt behandelt

werden,

somit ist die Transformationsmethode auf diem-te Kolonne fortsetzbar.

Zugleich

ist auch ersichtlich, dass mit Ausnahmevonaim alle andern Ele¬

mentein derw-tenKolonne

ungeändert bleiben,

weshalb die Transformationen für die m-te

Spalte unabhängig

voneinander in

beliebiger Reihenfolge

durch¬

geführt

werden können. Ferner sind die

Umformungen

nach

Regel

2 immer

ausführbar,

da dazu nur

Multiplikationen

und Additionen

notwendig

sind.

Induktionsverankerung:

Sämtliche

Überlegungen

des Induktionsschlusses

gelten sinngemäss

auch für

j

m 1.

2.

Regel

3

Voraussetzung:

Nach

Anwendung

von

Regel

2 hat man

ajk = 0 für

j

+ k

gerade (1

<

j

^ k < n-

1)

.

(9.2)

Hier ist Division durch ann erforderlich. Dies ist

jetzt gleich

der

Spur

der

gegebenen

Matrix Aund stimmt somit mit

bn

in

(4.8)

überein. Dieses ist aber

Referências

Documentos relacionados

This traffic sign can be called a symbol by opposition to an arbitrary sign where there is no connection between the sign and its meaning.. This distinction and the