Schwarz, Hans Rudolf Publication date:

(1)

ETH Library

Ein Verfahren zur Stabilitätsfrage bei Matrizen-Eigenwertproblemen

Doctoral Thesis Author(s):

Schwarz, Hans Rudolf Publication date:

1956

Permanent link:

https://doi.org/10.3929/ethz-a-000091928 Rights / license:

In Copyright - Non-Commercial Use Permitted

This page was generated automatically upon download from the ETH Zurich Research Collection.

For more information, please consult the Terms of use.

(2)

Prom Nr. 2603

Ein Verfahren

zur

Stabilitätsfrage

bei Matrizen-Eigenwertproblemen

VON DER

EIDGENÖSSISCHEN

TECHNISCHEN HOCHSCHULE

IN ZURICH

ZUR ERIANGUNG

DER WURDE EINES DOKTORS DER MATHEMATIK

GENEHMIGTE

PROMOTIONSARBEIT

VORGELEGT VON

HANS-RUDOLF SCHWARZ dipl Mathematiker ETH

von ZURICH

Referent Herr Prof Dr E Stiefel

Korreferent HerrProf Dr H Hopf

BASEL

Buchdruckerei Birkhauser AG 1956

(3)

Meinen lieben Eltern in Dankbarkeit

gewidmet

(4)

3

Ein Verfahren

zur

Stabilitätsfrage ^bei Matrizen-Eigenwertproblemen

VonHans-Rudolf Schwarz,

Zürich1)

1.

Einleitung

^und

Problemstellung

Zahlreiche technische

Fragen

führen auf das mathematische

Problem,

^für das

Matrizen-Eigenwertproblem (A

^—^X

E)

^x ⁼0 die Anzahl der

Eigenwerte

mit

positivem

^Realteil^zu

bestimmen,

wobei die

Eigenwerte

selbst meistens gar nicht interessieren. Diese

Problemstellung

^nennt^man^kurz^die

Stabilitätsfrage.

Um diese zu

beantworten,

sind verschiedene klassische Kriterien

bekannt,

welche aber allevomcharakteristischen

Polynom P(X) ausgehen,

^also

bedingen,

dassdasselbe

explizit

ermittelt wird. So erwähne ich die KriterienvonRouth

[1]2)

und Hurwitz

[2],

welche in ihrer

ursprünglichen Formulierung

^auf

Polynome

mitreellen Koeffizienten

Anwendung finden,

^im

übrigen

^aber

gleichbedeutend

sind. Das Ortskurvenkriterium von

Nyquist [3]

^bestimmt ^auf

graphischem Weg

die Anzahl der Nullstellen der charakteristischen

Gleichung P(X)

⁼ ⁰^mit

negativem

Realteil. Eine unmittelbare

Folge

davon ist das

Lagen-

^{oder Lük-}

kenkriterium

[4],

^welches

aussagt,

dass dann und nur dann sämtliche Null¬

stellenvon

P(X)

⁼⁰

negative

^Realteile

aufweisen,

^wenndie WurzelnvonReal- und

Imaginärteil

^von

P(i y)

⁼

Re(y)

+ i

Im(y)

reell sind und sich

gleichzeitig gegenseitig

trennen. Dasbekannteste numerische Verfahrenzur

Beantwortung

der

Stabilitätsfrage

dürfte wohl die Methode der Sturmschen Kette

[5] sein,

wonach aus dem Real- und

Imaginärteil

^von ^PU

y)

⁼

Re(y)

^{+ i}

Im(y)

^durch

fortgesetzte

^Divisionmit Rest eine

Folge

^von

Polynomen absteigenden

^Grades

gebildet

wird. Die Anzahl der

Eigenwerte

in der linken

komplexen

^Halbebene

Rez < 0 lässt sich dannausdem Unterschied der Zeichenwechsel in der

Poly¬

nomfolge

für y⁼ ^—^oo und y ⁼ +oo

angeben.

^Damit

äquivalent

^{ist das} Stabilitätskriterium von Wall

[6],

welches die

Aussage

in die Form eines Kettenbruches kleidet. Daneben finden sich in der Literatur einerseits noch verschiedene numerische

Verfahren,

welche vermittels eines

Reduktionspro¬

zesses aus dem charakteristischen

Polynom

^eine

Folge

^von

Polynomen

^bestim¬

men, aus denen die

Frage

beantwortet werden

kann,

und anderseits auch

einige graphische

^Methoden.

x) Institut furangewandteMathematik derETH.

2) Die Ziffern ineckigenKlammern verweisen auf dasLiteraturverzeichnis,^Seite30.

(5)

4

Auf derandern Seite führt

jedes gangbare

^numerische ^Verfahren^zur

expli¬

ziten

Entwicklung

des charakteristischen

Polynoms

^von

(A

^—^À

E)

^x⁼ ⁰ ^auf

eine

Folge

^von

Polynomen,

deren Grad sich bei

jedem

^Schritt ^um ^{1 erhöht}

und die mit dem charakteristischen

Polynom endigt.

^Ichverweise auf das Ver¬

fahrenvonWeber-Voetter

[7],

auf die MethodevonHessenberg

[8]

^{und den}

Biorthogonalisierungsprozess

^von^Lanczos

[9],

^welche alle über eine Reihevon

Polynomen aufsteigenden

^Grades ^zum charakteristischen

Polynom

^führen.

Um danndie alleininteressierende

Stabilitätsfrage

beantwortenzukönnen,

musseine

Polynomfolge absteigenden

Grades ermittelt werden. Um den

Weg

über eine

aufsteigende

^{und dann}^{über eine}

absteigende

^Kette^von

Polynomen

zu

vermeiden,

in welcher das charakteristische

Polynom

als solches vonhöch¬

stem Gradmeist gar nicht

interessiert, gab

^{mir Herr}Professor Dr. E. Stiefel

(ETH)

^die

Anregung, folgende Frage

^zuuntersuchen:

Problem:Man berechne das charakteristische

Polynom P(X)

^aus^der^{Matrix A}

über eine solche

aufsteigende

^Kette ^von

Polynomen,

^aus welcher schon selbst die

Stabilitätsfrage

beantwortet werden kann.

Dieser Wunsch führte zu einem

Verfahren,

unter

Umgehung

des charak¬

teristischen

Polynoms

^die

gegebene

Matrix A mit Hilfevonelementaren Trans¬

formationen auf eine Normalformzu

bringen,

deren Elemente allein schon das

Stabilitätsproblem

lösen. Die beschriebene Methode weist den Vorteil

auf,

^dass die anzuwendenden

Rechenoperationen

^von grosser Einheitlichkeit

sind,

^was das

Programmieren

auf Rechenautomaten erleichtert. Bei der klassischen Methode der SturmschenKette stützt sich die ganze

Entscheidung

der Stabili¬

tät auf eine

längere Rechnung,

^welche ^vom charakteristischen

Polynom

^aus¬

geht.

^Die Koeffizienten dieses

Polynoms

enthalten sicher

weniger

Information als die

ursprünglich gegebenen

Matrixelemente. Es ist zu hoffen, dass unsere

Methode,

^diedie Matrixelemente in mehr direkter Weiseverwendet,^{in manchen} Fällen numerisch stabiler verläuft. Ob diese

Hoffnung berechtigt ^ist,

^können

allerdings

^erst

umfangreichere

Versuche entscheiden.

An dieser Stelle möchte ich den Herren Professoren Dr. E. Stiefel und Dr. H.

Rutishauser,

die mit ihren wertvollen Hinweisenzum

Gelingen

^dieser

Arbeit

beigetragen haben,

meinen besten Dank

aussprechen.

I. Das Stabilitätskriterium

2. Das Kettenbruchkriterium vonWall

[6]

Es sei

P(z)

⁼^zn⁺

cn_xz"'1

⁺

c„_2zn~2

⁺ ^V cxz+ c0 ein

Polynom

^w-ten

Grades mit

komplexen

Koeffizienten _ck⁼

ftk

+ i qk. Aus diesem bilde man

Q(z)

⁼

[P(z)

^—

(— 1)" P{— z)}j2,

^worin

P(z)

^das

Polynom

^{mit den}

konjugiert

(6)

ßW

¹ ¹ ^' ¹ P{z) rx^z+ sx ^-r 1 ^' r2^ir+ s2 ^' rsz + s3

komplexen

Koeffizienten_ck=

pk

^—i qk bedeutet. Dann ist

<?(*)

⁼

Pn-l

Zn~X + i ?„-* *""* +

Pn-S

^*-8^- ^»?«_4 -Z""4 + ^'^•^" ^.

und der

Quotient Q{z)jP(z)

^{hat im}

allgemeinen

^eine

Kettenbruchentwicklung

von

folgender

Form mit inzlinearen Teilnennern:

+

-+„ /+— ^(2-1)

Satz 1

(Kriterium

^von

Wall)

^: Existiert die

Kettenbruchentwicklung (2.1)

von

Q{z)jP{z),

^so sind darin die Grössen rk

(k

⁼ 1,2,... ,

n)

^{reell und} ^von ^Null

verschieden,

^diesk

(k

⁼ 1, 2, ^... ,

n)

^rein

imaginär

^odernull. Sind dann unter den rk^m

positiv

^und

(n

^—

m) negativ,

^so^haben^m^der ^Wurzeln^von

P(z)

⁼⁰

negative

und

(n

^—

m) positive

^Realteile.

Die Teilnenner in

(2.1) ergeben

^{sich durch}

fortgesetzte

Division mit Rest nach dem euklidischen

Algorithmus

^für

P(z)

^und

Q(z).

^{So ist}

speziell

Q(z)l[P(z)

^-

Q(z)]

--

ÖW

__ =

l

__ + ¹ +

A_

₊ ... +

_i_ _{(2 4)}

p(z) ^- 0W rtz -{ Sl r2z + s2 i-jHSa V^tS,

mit denselben _{rÄ, sfc}

(k

⁼ 1, 2, ^... ,

n)

^wieⁱⁿ

(2.1).

^Demnach

gilt

^der^zu ^Satz ¹

äquivalente

Satz 2: Existiert die

Kettenbruchentwicklung (2.4) für

^den

Quotienten Q(z)/[P(z)

^—

Q{z)],

^so ^sind darin die Grössen _rk

(k

⁼ 1, 2, ^... ,

n)

^{reell und} ^von

Nullverschieden, ^diesk

(k

⁼ 1,2, ^... ,

n)

^rein

imaginär

^{oder null.} Die Anzahl der

positiven

rk ist dann

gleich

der Anzahl der Wurzelnvon

P(z)

⁼ ⁰ ^mit

negativem

Pn-l

^{Z"-1 +}^tqn-2 Zn~2⁺

Pn-Z

S""3₊*?«-4 Z""4⁺ ^'^'^'

(2.5)

(7)

undes sei

allgemein

/()

⁼

«*.**B-+«,*+i"~~1

n-k

'- + ak,n-\z+ ak,n^—

2j

Œk'k+>2"

J-0

(Ä

⁼0,1,

...,»).

(k=

1, 2, ^... ,n-

1)

^.

(2.6)

Dann bildet man

/o(*)

⁼

('i'

⁺

«i) /i(*)

⁺

/î(*)

^-

/n-lW

⁼

K

² ⁺

Sn) fn{z)

Die Grössen rfc, sk, akik+1

(k=

1, 2,...,n;

j

⁼

^0,1,...

,n^—

k)

lassen sich rekur¬

siv

gemäss

den nachstehenden Formeln berechnen:

ak-l,Jc-l ^'ak,k^" rki \ak-l,l ^'kuk,k+l) <*k,k⁼ sk

{k=l,2,...,n)

= ak ak-l,k+l+j sIeak,k+l+i rkak,k+2+j ^~ uk+l,k+l+i

(k

⁼ 1,2, ^... ,n^—1; 1 ^— 0,1, ^... ,n ^— k ^— 1; _{mit aki„+1}⁼

0)

^.

Die

Anfangsbedingungen

dazu lauten nach

(2.5):

a00 ^— ¹ ^• a0l⁼ ^*9n-l ^> a02 ⁼ Pn-2^' a0Z ⁼^*In—Z^> a04⁼ Pn-i^» ^>

all⁼

Pn-X

^> aX2 ⁼^lin~2^> ali ⁼

Pn-3

^< aXi⁼ ^lQn-i^,

(2.7)

(2.8)

3.

Herleitung

des Kriteriums vonWall ausdem Verfahren der Sturmschen Kette

Betrachten wir die Methode der Sturmschen Kette

[5]

^zur

Beantwortung

der

Stabilitätsfrage

^: ^Danach^setzt^{man in}

P(z)

^z^— i y

ein,

^trennt in Real- und

Imaginärteil P(i y)

⁼

Re(y)

^{+ i}

Im(y)

^und

beginnt

^für

gerades

ⁿ ^mit

F0(y)

⁼

Re(y), F^y)

⁼

-Im(y)

,

bzw. für

ungerades

ⁿ ^mit

F0(y)

⁼

Im(y), Fx{y)

⁼

Re(y).

Dann lässt sich im

allgemeinen

^eine

Folge

^von

Polynomen Fk(y)

^vom wirklichen Grad n^— k und

(8)

mit reellen Koeffizienten

Aki

k+j mit

Aki

k + 0wie

folgt

^bilden^:

Fk(y)=Akiky- ^I*,

^k+i^y

Ak,n-1

^{y +}

Ak>n

n-k

=

ZA,*+1yn-k-j ^(A

⁼

0,1,...,»),

J-0

F0(y)

⁼

(Äi

y +

SJ J^(y)

^-

F2(y)

,

F1(y)

⁼

(R2y+S2)F2(y)-F3(y), \ ^(3.1)

F^{y)

⁼

(Rky

⁺

sk) Fk(y)

^-

Fk+1(y) (k

⁼ ^1,2,...,ⁿ^-

i),

iV-i(y)

⁼

(ÄB

y +

5») Fn(y)

^.

Für das

folgende

treffen wir die

Voraussetzung:

Die Sturmsche Kette

für

^das

Polynom P(z)

existiert in der Form

(3.1),

^{wobei die}

Quotienten (Rky

⁺

Sk)

^{bei der}

fortgesetzten

Division mit

Rest linear seien.

Dann

gilt

bekanntlich

Satz 3: Existiert die Kette

(3.1),

^so ist die Anzahl N der Nullstellen von

P(z)

⁼ ^{0 mit}

negativem

^{Realteil N}⁼

(n

^{+ l}^—

w)/2,

^wobei

(l

^—

m)

^{der Unter¬}

schied in der Zahl der Zeichenwechsel in der Sturmschen Kette

F0(y), F^y),

^... ^,

Fn-\{y)> Fn(y) für

y⁼ ^—^oound_y⁼ +00ist.

Darin ist l die Gesamtzahl der Verluste undmdie Gesamtzahl der Gewinne

anZeichenwechseln in der Kette

(3.1)

beim Durchlaufen der

imaginären

^Achse

von ^—i00 nach + i^00. Diese Werte lassen sich aus den Koeffizienten

Aki

k

bzw.aus den

Quotienten Rk

⁼

Ak_xk_x\Aktk

ohne weiteres

angeben.

^Betrachtet

man

Fk_x{y)

^und

Fk(y),

^so ^hat^man

bezüglich

dieser beiden Glieder in der Kette hinsichtlich Zeichenwechsel

folgende

^Situation^:

sgn

Rk

⁼

00 1Zeichenwechsel I

00 0Zeichenwechsel

[

00 0 Zeichenwechsel

|

00 1Zeichenwechsel

|

1 Verlust

1 Gewinn

Somit ist dieGesamtzahlder Verluste /anZeichenwechseln

gleich

^{der Anzahl}

der

positiven Rk

und die Zahl der Gewinnem

gleich

der Anzahl der

negativen

(9)

Rk.

^Wenn

F0(y)

^und

F^y)

teilerfremd

sind,

^die

fortgesetzte

Division mit Rest wirklich mit

Fn(y)

^—^const ^#= ⁰

endigt,

^so ^istⁿ⁼ ^{1 +}^mund demnach

„

_

{l_-t-

^m ^{+ l}^— ^m) ^_^,

also

folgt

^aus ^{Satz 3:}

Satz 4: Die Anzahl N der Nullstellenvon

P(z)

-/>»-!

r

ⁱⁿ

F0(y)

und

i\(y) unabhängig

^{von «}ⁱⁿ^der^ersten^Form

(3.2) geschehen.

^Für^die ^Koef¬

fizienten

Rk, Sk, Akik+j (k

⁼ ^1,2, ^... ^,n;

j

⁼ 0, 1, ^... ,n^—

k)

bestehen die fol¬

genden

Rekursionsformeln:

Ak-i,

jt-i:

Ak>

^Rlr

(4c-l,

R-k.

Ak> k+1)

^:

Akik

^— ^Sk

(k^\,2,

^...

,n)

,

~~-Ak_lik+1+j

+ok

Ak:k+1+j

^-f

Rk Ak}k+2+j

^—

Ak+lik+1^j (k

⁼ ^{1, 2,} ^...,«- ¹^;

/

^- 0, 1, ^... ,n

-k-l;

^mit

AkiU+1

⁼

0)

(3.3)

Die

Anfangsbedingungen

dazu lauten nach

(3.2):

An 1>

An.

^—grn_1,

Aq2

^— pn A3^— ?«-

Pn-

•"11^—

/V-l> At2

^"- <7«-2> -"13^_"

~ftn-3> A4

(3.4)

Nach diesen

Vorbereitungen

^kann ^nun

gezeigt werden,

dass Satz 2 und damit Satz 1 eine

Folge

^von Satz 4 ist.

Voraussetzung:

Die SturmscheKette in der Form

(3.1)

^für

P(z)

^existiert.

(10)

9

Behauptung

^Die

Kettenbruchentwicklung (2 4)

^von

Q(z)j[P(z)

^—

Q(z)]

^exi¬

stiert, ^und^es

gilt

«i *+,= i3

-Ak.k+i ^(£

⁼^0,1, ^,«,7 ⁼ ^0,1,

^,n~k),

^I

(3 5)

rk=

Rk,

sk⁼⁴

Sj. (ä

⁼ 1,

2,

,

«) J

Induktionsannahme Die

Behauptung (3 5)

^sei

richtig

^furJgwjl Indukhonsschluss Gemäss Rekursionsformel

(2 7)

^ist ^{fur k}⁼ ^m

"-m+1 m+1+3 ⁼ ^m—1,m+l+3 ^m ^-m,m+l+3 ^m^m,m+2+3 ^U ^ 7 ^ ^« ^W l) Nach

Induktionsvoraussetzung

^ist ^dies ^einerseits

—1'_^ + 2 A — 1 9 ^+1 ,4 _ P ?3+² ^/)

-^m—1,m+l+3 ^v '-'m^{^} -^m m+l+3 ±vm^l -^-m m+2+3 >

^ _\ **-m—1 m+l+3 ^"T~ ^m-^*-m m+l+j^~T J^m^*-m,m+2+3/ ^>

und anderseits

infolge ^{(3 3)}

am+l,m+l+3

~ l -"-m+1 m+l+3 1) ⁼"i li ,11^— m 1) ^.

Weiter schhesstman

analog

^unter

Verwendung

des letzten Resultates

für?

⁼0,1

^mm <%m+l,m+1 -^-mm -^-m+lm+1 -^m+1^>

=

(«»

= \l^**m m+1 -"-m+1^{^}^-m+1 m+2) ^-m+1 m+1 ^ ^m+1

Induktionsverankerung

^{Fur &}⁼ ⁰ ^und ^k⁼ ^{1 liest} ^man ^die

Beziehungen

«„j ⁼ⁱ³

A0],

a11+1 ⁼ ^î3

A11+1

^direkt ^aus ^den

Anfangsbedingungen (2 8)

^und

(3 4) ^ab,

^und^es

folgt ^daraus,

^{dass fur k}⁼ ¹

ri⁼ aoo an ^~ ^00 "11

~ -"-l^»

si ^"

(aoi

^~ fi ai2) an⁼ \l

-^oi

^—

Rll A12) Alx

^-!

Si

ist Nach

Voraussetzung

über die Existenz der Sturmschen Kette

(3 1)

^sind

die

Rk

4= 0

(k

⁼

^1,

2, ,

w),

^unddeshalb sind auch die_rk 4= 0

(k

⁼

1,

2, ^. ,

«),

das

heisst,

die

Kettenbruchentwicklungen (2 4)

^und

(2 1)

^existieren^{und die rk}

sind reell und vonNull verschieden Da die

Sk (k

⁼ 1,

2,

^. ^,

n)

^{reell sind}^aber

eventuell verschwinden

können,

sind die _sk⁼ i

Sk (k

⁼ ^{1, 2,.} ^,

«)

^{rem ima¬}

ginär oder auch null

Infolge

der Gleichheit rk⁼

Rk

decken sich die

Aussagen

(11)

10

über die Anzahl der Wurzeln von

P(z)

⁼ ^{0 mit}

negativem

Realteil in den Sätzen 1 und

4,

^sodass damit der Beweisvon Satz 1 mit Hilfe des Satzes über die Sturmsche Kette erbracht ist.

4.

Folgerung

^aus dem Kettenbruchkriterium

Voraussetzung:

^Die

Entwicklung

^von

Q(z)/P(z)

in einen Kettenbruch

(2.1)

existiert.

Folgerungen:

Nach Satz 1 sind die Grössen rk

(k

⁼

^1,2,

^...

,n)

^von ^Null

verschieden. Deshalb lässt sich auf den Kettenbruch

(2.1)

^eine

Äquivalenz¬

transformation

ausführen,

indem der Ä-te Teilbruch mit ^—

l\rk

erweitert wird:

0W

-1/»-!

1

_{_,} 1l^iU i ,

V^a's

P(z)

—z^— ^*

*2

S3

—^ ^— ^-

»'s

Setztmsmdann

+

iK-1

»-«

i

(4.1)

-l

«j.

(&

⁼ 2, 3,

6* (Ä

⁼ l,2,

n)

P(z) I

«i+ b1^- ^z

H I

>b*-z

(4.2)

sosind die_ak

(k

⁼

1,2,..., n)

^{reell und}^von^Null

verschieden,

^die

bk(k=l,2,...,n)

rein

imaginär

oder eventuell null undmanerhält für

(4.1)

(4.3)

Gemäss dem Determinantensatz über die

Näherungszähler

^und

Näherungs¬

nennereines Kettenbruchesist

P(z)

^als^rc-ter

Näherungsnenner

^von

(4.3) gleich folgender

Determinante:

P(z)

⁼

a1+

bx-

^-^z «2 0 0 0 . 0 0

-1

b2-z

a3 0 0 . 0 0

0 -1

h~

^* <*i 0 . 0 0

0 0 -1

64-2

«5 ^• 0 0

0 0 0 0 0 .••

K-

-1-2 «n

0 0 0 0 0 . -1

K-*

(4.4)

Aus

(4.4)

^ist

ersichtlich,

^dass

P(z)

^das charakteristische

Polynom

^des

Eigen¬

wertproblems (N—zE)

^x⁼ ⁰

^ist,

wobei die Matrix N

folgende spezielle Jaco-

(12)

11

bische Form aufweist:

N--

«i +

bx

«2 0 0 . . 0 0

-1

K

«3 ⁰ ^. ^.. ⁰ ⁰

0 -l

h

«4 ^.^.. 0 0

0 0 -1

h

^.. ⁰ ⁰

0 0 0 0 .••

K-i

an

0 0 0 0 ... -1

bv

(4.5)

Inder Matrix .ZV sind die Grössen ak

(k

⁼ 1,2, ^... ,

n)

^{reell und}^von ^Null ^ver¬

schieden,

^die

bk (k

⁼

1,2,

^...

,n)

^rein

imaginär

^{oder null.}

Übertragung

des KriteriumsvonWall

auf

die Matrix N: Die

Stabilitätsfrage

kann nach

(4.2)

^allein ^ausdem Realteil ax des ersten Elementes in der

Haupt¬

diagonalen

und den reellen Elementen ak

(k

⁼ 2, 3,^... ,

n)

in der oberen

beglei¬

tenden

Diagonalen

beantwortet werden. Nach

(4.2) gelten:

»"l«2

«2 a, a,

it

«1 «3«5^•^•^•ak-

rk⁼

2 4. ft^*

2 4 ß

"*

ak

esist som

«ia3«s^•••«fc

(k gerade) (k ungerade)

(k

⁼ ^{2, 3,} ^... ^,

n)

sgnrk ^-sgn(axa2 a3

(k

⁼ 1, 2,

(4.6)

Demnach

folgt

^aus ^{Satz 1}^:

Satz 5: Die Zahl der

positiven

Glieder in der

Folge

^von Produkten av ax a2, a1a2a3, ^... ^,a1a2--- a„_1 an

ergibt

die Anzahl der

Eigenwerte

^von

(N

^—^z

E)

^x⁼⁰

mit

-positiven

Realteilen.

Schlussfolgerung:

^Das

gestellte ^Problem,

das charakteristische

Polynom

einer

gegebenen

Matrix A mit

komplexen

Elementen vermittels einer Kettevon

solchen

Polynomen

^zu

ermitteln,

^{welche die}

Stabilitätsfrage

beantworten

kann,

ist damit auf die

Aufgabe zurückgeführt,

die Matrix A mit Hilfeeiner

Ähnlich¬

keitstransformation in die Normalform iV überzuführen.

Im zweiten Teil wird

gezeigt werden,

dass diese Transformation im

allge¬

meinen durchführbar ist. Dabei erweist es sich als

zweckmässig,

die Normal¬

form N an der

Nebendiagonalen

^zu

spiegeln

^{und die}

Bezeichnung

^leicht ^zu

(13)

12

ändern. Es seien

B ⁼

i

b'n i12

⁰ ⁰

-1

ib'2i b23

⁰ ^.

0 -1

ib'33 bSi

^.

0 0

0 0 0 0.

• % "n-ln-l °n-ln 1 0„„ -+-% Onn

(4.7)

bzw. im reellen Fall

B

0 »12 0 0 . . 0 0

-1 0

hs

⁰ ^. ^. ⁰ ⁰

0 -1 0

hi

^. ⁰ ⁰

0 0 0 0 . . 0 ®n—in

0 0 0 0 . . -1

(4.8)

die Normalformen der transformierten, ^zu ^A

äquivalenten Matrix,

^{worin die}

h,

lc+i

(k

⁼

^1»

2,...,n^—

1)

^und

bnn

^reell ^und ^von Null verschieden

sind,

^wàih- renddem die

b'kh (k

^—

1,

2, ^... ,

n)

ⁱⁿ

(4.7)

reell aber nichtvonNull verschieden sein müssen. An Stellevon Satz 5 lässt sich dann

folgender

^Satz formulieren:

Satz 6

{Stabilitätskriterium für Matrizen):

^Wenn ^es

gelingt,

^eine

gegebene

Matrix A ⁼

(ajlc)

^mit

komplexen

Elementen ajlc vermittels einer

Ähnlichkeits¬

transformation

ⁱⁿ^{die Form}

(4.7),

^bzw.

(4.8)

bei reeller Matrix

A, überzuführen,

dann ist dieZahl der

positiven

Glieder in der

Folge

^von^Produkten

bnn, bnnbn_ln, Kn K-m K-in-i. ,hn bn-m

^•^•

hs bi2 gleich

der Anzahl der

Eigenwerte

^von

A mit

positiven

Realteilen. Sind

speziell

alle Elemente o12,

623,

^... ^,

bn_ln, —bnn positiv,

^so ^{haben alle}

Eigenwerte negative

^Realteile.

II. Methode der Transformation

5. Elemente der Transformation

Die Grundidee der Transformation besteht

darin,

^durch

geeignete

^{Wahl und}

Reihenfolge

^von

möglichst

^einfachen

Ähnlichkeitstransformationen

in endlich vielen Schritten sukzessive die

gewünschte

^Normalform ^zu

gewinnen,

^{indem in}

jedem

einzelnen Schritt ein Element der Matrix behandelt wird.

Einerseits bewirkt

ja Multiplikation

^mit^einer

Diagonalmatrix

^T^von^links

TA in A eine

Multiplikation

^der Zeilen mit den

entsprechenden Diagonalele-

(14)

13

mentenvon

T,

und

Multiplikation

^von^rechts^{A T eine}

entsprechende Multipli¬

kation der einzelnen Kolonnen von A. Anderseits bewirkt

ja Multiplikation

mit einer nicht

Diagonalgestalt

aufweisenden Matrix Tvonlinks TA in A eine lineareZeilenkombination und

Multiplikation

^vonrechts A T eine lineare Kom¬

bination der Kolonnen. Als einfachste Gestalt wird T für einen Schritt einer

Ähnlichkeitstransformation

TAT-1 entweder als

Diagonalmatrix

^so

gewählt werden,

dassnur

je

eine Zeile und eine Kolonne in A verändert

wird,

oder als

Nichtdiagonalmatrix

so, dass nur zwei bestimmte Zeilen und Kolonnen mit¬

einander kombiniert werden.

Typus

^A^: ^{T ist}

Diagonalmatrix

Es sei

r-

1 0 0 0 . . 0

0 ] 0 0 . . 0

0 0

1/a

⁰ ^. ^. ⁰

0 0 0 1 . . 0

0 0 0 0

T-i

1 0 0 0 . . 0 0 1 0 0 . . 0 0 0 a 0 . . 0 0 0 0 1 . . 0

0 0 0 0 . . 1

(5.1)

wo

^{B: T ist}

Nichtdiagonalmatrix

Es sei

T

1 0 0 0 ... 0

0 1 0 a .. 0

0 0 1 0 . .. 0

0 0 0 0 . .. 1

|1

⁰ ⁰ ⁰ ^. ^. ⁰

!

_o ₁ ₀ —

Kolonne. Demnach bedeutet eine

Ähnlichkeitstransformation

TA T"1 mit einer Matrix Tvondiesem

Typus

^:

(15)

14

Man addiere zunächst zur

j-ten

^Zeile ^von^{A das}

a-fache

der k-ten Zeile und subtrahiere dannvon der k-ten

Spalte

^das

«.-fache

^der

j-ten Spalte,

oder auch in

umgekehrter Reihenfolge.

Eine solche

Umformung

^kann ^als ^«zweidimensionale» Transformation be¬

zeichnet werden und sei im

folgenden

^durch

{Tjk; a)

dargestellt,

indem die Indizes die Positionvon ain der

dazugehörigen

^{Matrix T}

und damit diezu ändernde Zeile

(/)

und Kolonne

(k)

sowie ihre Kombination kennzeichnen.

Versuchtmannun,die Transformation auf die Normalform mit Hilfe dieser beiden

Typen

^von

Umformungen durchzuführen,

^so^erkennt^man

bald,

dass sie im wesentlichen in zwei

Hauptabschnitte

zerfällt: Im ersten Teil werden die Elemente unterhalb der

Diagonalen behandelt,

während im zweiten Teil die Elemente oberhalb und in der

Diagonalen

^{auf die}

gewünschte

^Form^transfor¬

miert werden.

6.

Umformung

der Matrix unterhalb der

Hauptdiagonalen

In diesem Abschnitt sei die

Aufgabe gestellt,

^die

gegebene

^{Matrix A} ⁼

(àik)

vermittels einer

Ähnlichkeitstransformation

auf die nachstehende Form zu

bringen

^:

(6.1) Pu Pl2 Pis Pu

^•

Pin

-1

P22 P23 P2i

^•

Pin

0 -1

P33 Pst Psn

0 0 -1

Pu Pin

0 0 0 0 . Vnn

Dieses Problem ist

allerdings

^bereits

gelöst

durch das Verfahren von Hes¬

senberg

[8].

Doch beschreibe ich hierzur

Vereinheitlichung

der ganzen Trans¬

formation einen andern

Weg.

Bezeichnungsweise:

^Zur

Vereinfachung

werden die Elemente der umge¬

formten Matrix immer wieder mit ajlc

bezeichnet,

^das

heisst,

^essei ajlc derWert des Elementes in der

/-ten

Zeile und ß-ten

Kolonne,

^wie ^er sich nach der beendeten letzten

Umformung ergeben

^hat.

Die Transformation der Matrix unterhalb der

Diagonalen

^kann

gemäss

nachstehender Vorschrift

geschehen

^:

(16)

15

Regel

^1:

Beginnend

^mit der ersten Kolonne und von Kolonne zu Kolonne biszurzweitletzten

fortfahrend, führe

^man

fur

^{die k} ^te

Spalte (k 1,2,

,«^—

1) folgende Umformungen

^aus

a)

^Umⁱⁿ^der

(k

⁺

l)-ten

^Zeile^eine^—¹ ^zu

erhalten,

^wende^man die

Transfor¬

mation

{Tk+1,

—ak+1

k)

^an

b)

die Elemente a,^k

(j

^— ^{k + 2 k +}3,

,n)

werden dann mit

Hilfe

^der^zwei

dimenstonalen

Transformationen [T3

^k+1,

allc)

^zum Verschwinden

gebracht

Dass die

Regel

¹ ^den

gewünschten Erfolg hat,

zeige ich

folgendermassen Voraussetzung

^Die

Elemente,

^durch welche dividiert werden _muss, seien von Null verschieden

Behauptung

Die Matrix A⁼

(a, k)

^mit

komplexen

Elementen a}klasst sich unter

Anwendung

^der

Regel

¹ auf die Form

(6 1)

transformieren

Beweis

Induktionsannahme Die erstenm—1 Kolonnenweisenbereitsdie

gewünschte

Form

auf,

^und^{es seien}^also

ak+\ j;⁼ ~l> _aik ^~~0 fur £ — 1, 2, , m ^— 1

f-k

+ 2,k + 3 , n

Induktionsschluss

Anwendung

^der

Regel

^{1 fur k} ⁼^m

a)

^Nach

Voraussetzung

^seiam+1 ^m ^=#

0,

die Transformation

(7"«,+!,—

am+1

m)

kann

ausgeführt

werden Danach wirdzuerstdie

der

am+i ^m⁼

—1>

weshalb aJm ⁱⁿ Null

übergeht

^und ⁱⁿ ^den

folgenden

^Kolonnen

werden die Elemente allc

(k

⁼ ^m⁺

1,

^m+

2, ,n) geändert

Dann wird noch

von der

(m

⁺

l)-ten Spalte

^das

a3m-fache

^der

7-ten Spalte (7

^è^m⁺

2)

^subtra¬

hiert,

^das

heisst,

^es^wird^nurdie

nächstfolgende

^Kolonne ^verändert

Damit ist

gezeigt,

dass sich das Verfahren gemäss

Regel

¹ ^{auf die} ^m-te

Kolonne fortsetzen

lasst,

ohnedabei diem ^— 1 _ersten Kolonnen zuandern

Induktionsverankerung

^Sämtliche

Überlegungen

des Induktionsschlusses

gelten

sinngemäss auch fur m=\

(17)

16

7. Diskussion

Die Transformation stösst dann auf

Schwierigkeiten,

^{falls nach}

beendigter Umformung

^der

(k

^—

1)

^ersten Kolonnen das Element ak+lik Null oder auch

nursehrklein

geworden ^ist,

durch welches im nächsten Schritt die

(k

⁺

l)-te

Zeileder Matrix dividiert werden soll.

I.Fall: Die

Transformation

^kann

auf

die k-te Kolonne

ausgedehnt

^werden

Es sei ak+li^k⁼ 0,^{bzw. sehr}

klein,

aber mindestens ein Element in der k-ten

Spalte

aJk mit k + 2 ^<

/

^g ⁿ ^von ^Null

verschieden,

< n, bzw. werden sehr klein. Dann zeichnet sich eine

Unterteilung

der Matrix in Untermatrizen ab:

nfc+i

A.

- 1 #22 a2k-1 a1k a2k+\ a2n

0 -1 . aik-1 aSk ß3*+l adn

0 0 --1 akk akk+l akn

0 0 0 0 ak+lk+l ak+ln

0 0 0 0 ak+2k+l ak±2n

0 0 ... 0 0 ank+1

Dann lässt sich das Verfahren auf die

quadratische

Untermatrix rechts unten weiteranwenden, ^und^manerhältso schliesslich einezuA

äquivalente

Matrix, welche nicht die Normalform

(6.1) ^aufweist,

^sondern ^aus Kästchen der Form

(6.1) aufgebaut ist,

welche sich

längs

^der

Hauptdiagonalen

aufreihen. Ein

(18)

17

solches Kastchen kann

gegebenenfalls

^auch ^nur ^{aus einem} einzigen Element

bestehen,

welches dann

gleich

^einem

Eigenwert

^von^A ^ist. Oberhalb der Kast¬

chen wird die Matrix im

allgemeinen

^mit ^von ^Null

verschiedenen, jedoch

^be¬

deutungslosen

^Elementen

ausgefüllt

^sein. Die Untermatrizen von der Gestalt

(6.1),

^{die sich}^so

längs

^der

Diagonalen ergeben,

brauchen aber nichts gemeinsam

zu haben. Es kann _sein, dass sie je voneinander verschiedene

Eigenwerte

^be¬

sitzen, teilweise untereinander

gleiche Eigenwerte

^aufweisen, ^{oder dass} ^alle

Eigenwerte

^einer Untermatrix auch

Eigenwerte

^einer ^andern ^sind ^Zu

jedem

Fall lassen sich ohne weiteres

Beispiele

konstruieren. In gewissen Fallen ^ist diese

Aufspaltung

^rem

zufalliger

Natur und kann durch

geeignete

Zeilen- und

Kolonnenvertauschungen

ⁱⁿ^der

Ausgangsmatrix

vermieden werden. Inandern Fallenistsie durch das

Koordinatensystem bedingt

und kann durch

Übergang

zu einemanderen

System

umgangen werden Ganz

allgemein

^istdiese Erschei¬

nung ^immerdann vorhanden und nicht zum Verschwinden zu

bringen,

^wenn

die Matrix A mehrfache

Eigenwerte

^besitzt, ^{und fur} ^einensolchen der

Rang¬

abfall grosser als ¹ ist, ^mit anderen

Worten,

wenn das

Mimmalpolynom

^von

A nichtmit demcharakteristischen

Polynom

übereinstimmt. Soist esunmög¬

lich,

eine Hermitesche Matrix mit mehrfachen

Eigenwerten

^vermittels ^einer

Ahnlichkeitstransformation auf die Form

(6 1)

^zu

bringen

^Das

Versagen

^des

Verfahrens ist demnach in diesem Fall durch die Struktur der

gegebenen

Matrix

bedingt,

worauf aber hier nichtweitereingegangen werden soll

8.

Beendigung

^der Transformation fur reelle Matrizen

Voraussetzung

Die Matrix A seiauf die Gestalt

(6 1) transformiert,

^{und die}

Kettenbruchentwicklung (2.1)

fur das charakteristische

Polynom

^existiert.

Dann lasst sich die Matrix noch mit endlich vielen

Umformungen

^vom

Typus

^B auf die Normalform

(4 8) bringen

Geht man an die

Losung

^dieses ^Problems, ^so ^ist ^man ^versucht, die ge¬

wünschte Form einfach dadurch zu erreichen, ^dass ^man^die

notwendigen

^Ele¬

mente durch

geeignete

Transformationen Schritt fur Schritt zu Null macht, indem man von Kolonne zu Kolonne fortschreitet Fur drei- und

vierreihige

Matrizen

gelangt

^man auf diese Art auch wirklich ohne grosse

Schwierigkeiten

zumZiel. Bei

hoherreihigen

Matrizen scheint diesvorerstauchzufunktionieren, und man

gelangt

^einmal ^zu ^einer

äquivalenten

Matrix, welche zwar in den (n^—

1)

^ersten ^Kolonnen^die

gewünschte

^Gestalt

^aufweist, jedoch

ⁱⁿder letzten

Spalte

^im

allgemeinen

^{nur von} Null verschiedene Elemente enthalt. Willman

diese noch zum Verschwinden

bringen,

^so wird das schon Erreichte teilweise wieder zerstört. Aus diesem Grundist die

Reihenfolge

^der

Umformungen

ge¬

schickter zu

wählen,

^und ^so ^hat sich fur reelle Matrizen eine Transformation

herausgebildet,

welche sich m drei Teile

gliedert

und die sich in die

folgenden

Regeln

zusammenfassen lasst

(19)

18

Regel

²^:

Beginnend

^{in der} ^erstenKolonne und

fortschreitend

^von^Kolonne^zu

Kolonne bis zur

zweitletzten,

werden alle Elemente aôk mit

gerader

^Indexsumme

j

^{+ k und}

l^]'g^gM-l

^zu ^Null

gemacht,

^{indem im}

allgemeinen

^Schritt

die zweidimensionale

Transformation {Tiilc+1; ai]c) ausgeführt

^wird.

Regel

^{3: Die} Elemente ain in der letzten

Spalte

^mit

gerader

^Indexsumme

j

⁺ⁿ ^und

]'

^g^«^- ^{2 werden} ^zum Verschwinden

gebracht,

^{indem die}

Transfor¬

mationen

{Tj:n; —ainlann) angewendet

^werden.

Hatmansämtliche

Umformungen gemäss

^den

Regeln

^{2 und 3}

durchgeführt,

so

liegt

^nun^eine ^Matrix vor,in welcher in und oberhalb der

Hauptdiagonalen

mit Ausnahme vonan^„alle Elemente mit

gerader

Indexsumme Null sind:

0 a12 0 «14 ⁰ a16

-1 0 «23 0 «25 0

0 -1 0 a3i ⁰ «36

0 0 -1 0 «45 0

0 0 0 -1 0 «56

0 0 0 0 0 0

Die restlichen Elemente werden noch wie

folgt

^behandelt^:

Regel

⁴^:

Beginnend

ⁱⁿ der letzten Kolonne und dann nachvorn

fortfahrend

biszurvierten

Kolonne,

werdensämtliche Elemente askmit

ungerader

^Indexsumme

j

+ k und

4^j

+ 3-èk<ninNull

übergeführt,

^{indem im}

allgemeinen

^Schritt

die

Transformation [Tjile_x; —ajklak_li]c) ausgeübt

^wird.

Anmerkung:

^{Die in den}

Regeln

² ^{bis 4}

angegebene Reihenfolge

ist nicht die

einzig mögliche,

sondern sie kann inbestimmten Grenzen noch variiert werden.

So ist im

Prinzip jede Folge zulässig,

^die ^so ^beschaffen

^ist,

dass in ihr

jeder

Schritt das bereits Erreichte unverändert lässt. Im Hinblick auf die Verifi¬

zierung

^desVerfahrens wie auch auf die

Programmierung

für Rechenautomaten erschien mirdie

gewählte Reihenfolge

^als

zweckmässig.

9. Beweis des Verfahrens

Voraussetzungen

I. Die

gegebene

Matrix A lässt sich vermittels einer

Ähnlichkeitstransfor¬

mation auf die Gestalt

(6.1) bringen.

II. Die

Kettenbruchentwicklung

^des

Quotienten Q[z)jP{z) (2.1)

^{für das}

charakteristische

Polynom P(z)

⁼

|

^z^E^— ^A

|

^existiert.

(20)

19

Behauptung:

^{Dann lässt}sich A durch eine

Ähnlichkeitstransformation

in die Normalform

(4.8)

überführen.

Beweis: Nach

Voraussetzung

I kann angenommen

werden,

dass A schon die Form

(6.1) ^aufweise,

^und ^es ^bleibt ^zu

zeigen,

^{dass die}

Anwendung

^der

Regeln

^2,³ ^{und 4} ^zum Ziel führt.

1.

Regel

²

Induktionsannahme: Dieersten

(m

^—

1)

Kolonnen seien bereits nach

Regel

²

behandelt worden und manhabe oberhalb der

Diagonalen:

a,-fc⁼ 0 für

j+k gerade (l<Lj-g,k-g,m-\-g,n-2). (9.1)

Induktionsschluss: Um das Element aim mit

j

⁺ ^m

gerade

^und

j

Kolonnen nichts

geändert;

da am+lim⁼ ^—1

ist,

wird aim in Null

übergeführt,

undeswerden in der

/-ten

^Zeile^nurdie Elemente a,kmit m + 1 sï k SIn ver¬

ändert. Dann muss noch von der

(m

⁺

l)-ten Spalte

^das

ajm-ia.che

^der

/-ten Spalte

subtrahiert werden. Da

infolge

^{der Form}

(6.1)

^{in der}

/-ten

^Kolonne ^nur

die Elemente aij⁺ 0 sind mit t g j + 1 ä^«+ 1, werden dadurch nur die Elemente aitm+1in der

nächstfolgenden (m

+

l)-ten Spalte

in und oberhalb der

Hauptdiagonalen

^betroffen.

Insgesamt

werden also nurElemente in und ober¬

halb der

Diagonalen verändert,

die in einem

späteren

Schritt behandelt

werden,

somit ist die Transformationsmethode auf diem-te Kolonne fortsetzbar.

Zugleich

^{ist auch} ersichtlich, dass mit Ausnahmevonaim alle andern Ele¬

mentein derw-tenKolonne

ungeändert bleiben,

weshalb die Transformationen für die m-te

Spalte unabhängig

voneinander in

beliebiger Reihenfolge

^durch¬

geführt

werden können. Ferner sind die

Umformungen

^nach

Regel

² ^immer

ausführbar,

^{da dazu} ^nur

Multiplikationen

und Additionen

^.

(9.2)

Hier ist Division durch ann erforderlich. Dies ist

jetzt gleich

^der

Spur

^der

gegebenen

^{Matrix A}und stimmt somit mit

bn

„in

(4.8)

überein. Dieses ist aber