ETH Library
Ein Verfahren zur Stabilitätsfrage bei Matrizen-Eigenwertproblemen
Doctoral Thesis Author(s):
Schwarz, Hans Rudolf Publication date:
1956
Permanent link:
https://doi.org/10.3929/ethz-a-000091928 Rights / license:
In Copyright - Non-Commercial Use Permitted
This page was generated automatically upon download from the ETH Zurich Research Collection.
For more information, please consult the Terms of use.
Prom Nr. 2603
Ein Verfahren
zurStabilitätsfrage
bei Matrizen-Eigenwertproblemen
VON DER
EIDGENÖSSISCHEN
TECHNISCHEN HOCHSCHULEIN ZURICH
ZUR ERIANGUNG
DER WURDE EINES DOKTORS DER MATHEMATIK
GENEHMIGTE
PROMOTIONSARBEIT
VORGELEGT VON
HANS-RUDOLF SCHWARZ dipl Mathematiker ETH
von ZURICH
Referent Herr Prof Dr E Stiefel
Korreferent HerrProf Dr H Hopf
BASEL
Buchdruckerei Birkhauser AG 1956
Meinen lieben Eltern in Dankbarkeit
gewidmet
3
Ein Verfahren
zur
Stabilitätsfrage bei Matrizen-Eigenwertproblemen
VonHans-Rudolf Schwarz,
Zürich1)
1.
Einleitung
undProblemstellung
Zahlreiche technische
Fragen
führen auf das mathematischeProblem,
für dasMatrizen-Eigenwertproblem (A
—XE)
x =0 die Anzahl derEigenwerte
mit
positivem
Realteilzubestimmen,
wobei dieEigenwerte
selbst meistens gar nicht interessieren. DieseProblemstellung
nenntmankurzdieStabilitätsfrage.
Um diese zu
beantworten,
sind verschiedene klassische Kriterienbekannt,
welche aber allevomcharakteristischenPolynom P(X) ausgehen,
alsobedingen,
dassdasselbe
explizit
ermittelt wird. So erwähne ich die KriterienvonRouth[1]2)
und Hurwitz
[2],
welche in ihrerursprünglichen Formulierung
aufPolynome
mitreellen Koeffizienten
Anwendung finden,
imübrigen
abergleichbedeutend
sind. Das Ortskurvenkriterium von
Nyquist [3]
bestimmt aufgraphischem Weg
die Anzahl der Nullstellen der charakteristischenGleichung P(X)
= 0mitnegativem
Realteil. Eine unmittelbareFolge
davon ist dasLagen-
oder Lük-kenkriterium
[4],
welchesaussagt,
dass dann und nur dann sämtliche Null¬stellenvon
P(X)
=0negative
Realteileaufweisen,
wenndie WurzelnvonReal- undImaginärteil
vonP(i y)
=Re(y)
+ iIm(y)
reell sind und sichgleichzeitig gegenseitig
trennen. Dasbekannteste numerische VerfahrenzurBeantwortung
der
Stabilitätsfrage
dürfte wohl die Methode der Sturmschen Kette[5] sein,
wonach aus dem Real- undImaginärteil
von PUy)
=Re(y)
+ iIm(y)
durchfortgesetzte
Divisionmit Rest eineFolge
vonPolynomen absteigenden
Gradesgebildet
wird. Die Anzahl derEigenwerte
in der linkenkomplexen
HalbebeneRez < 0 lässt sich dannausdem Unterschied der Zeichenwechsel in der
Poly¬
nomfolge
für y= —oo und y = +ooangeben.
Damitäquivalent
ist das Stabilitätskriterium von Wall[6],
welches dieAussage
in die Form eines Kettenbruches kleidet. Daneben finden sich in der Literatur einerseits noch verschiedene numerischeVerfahren,
welche vermittels einesReduktionspro¬
zesses aus dem charakteristischen
Polynom
eineFolge
vonPolynomen
bestim¬men, aus denen die
Frage
beantwortet werdenkann,
und anderseits aucheinige graphische
Methoden.x) Institut furangewandteMathematik derETH.
2) Die Ziffern ineckigenKlammern verweisen auf dasLiteraturverzeichnis,Seite30.
4
Auf derandern Seite führt
jedes gangbare
numerische Verfahrenzurexpli¬
ziten
Entwicklung
des charakteristischenPolynoms
von(A
—ÀE)
x= 0 aufeine
Folge
vonPolynomen,
deren Grad sich beijedem
Schritt um 1 erhöhtund die mit dem charakteristischen
Polynom endigt.
Ichverweise auf das Ver¬fahrenvonWeber-Voetter
[7],
auf die MethodevonHessenberg[8]
und denBiorthogonalisierungsprozess
vonLanczos[9],
welche alle über eine ReihevonPolynomen aufsteigenden
Grades zum charakteristischenPolynom
führen.Um danndie alleininteressierende
Stabilitätsfrage
beantwortenzukönnen,musseine
Polynomfolge absteigenden
Grades ermittelt werden. Um denWeg
über eine
aufsteigende
und dannüber eineabsteigende
KettevonPolynomen
zu
vermeiden,
in welcher das charakteristischePolynom
als solches vonhöch¬stem Gradmeist gar nicht
interessiert, gab
mir HerrProfessor Dr. E. Stiefel(ETH)
dieAnregung, folgende Frage
zuuntersuchen:Problem:Man berechne das charakteristische
Polynom P(X)
ausderMatrix Aüber eine solche
aufsteigende
Kette vonPolynomen,
aus welcher schon selbst dieStabilitätsfrage
beantwortet werden kann.Dieser Wunsch führte zu einem
Verfahren,
unterUmgehung
des charak¬teristischen
Polynoms
diegegebene
Matrix A mit Hilfevonelementaren Trans¬formationen auf eine Normalformzu
bringen,
deren Elemente allein schon dasStabilitätsproblem
lösen. Die beschriebene Methode weist den Vorteilauf,
dass die anzuwendendenRechenoperationen
von grosser Einheitlichkeitsind,
was dasProgrammieren
auf Rechenautomaten erleichtert. Bei der klassischen Methode der SturmschenKette stützt sich die ganzeEntscheidung
der Stabili¬tät auf eine
längere Rechnung,
welche vom charakteristischenPolynom
aus¬geht.
Die Koeffizienten diesesPolynoms
enthalten sicherweniger
Information als dieursprünglich gegebenen
Matrixelemente. Es ist zu hoffen, dass unsereMethode,
diedie Matrixelemente in mehr direkter Weiseverwendet,in manchen Fällen numerisch stabiler verläuft. Ob dieseHoffnung berechtigt ist,
könnenallerdings
erstumfangreichere
Versuche entscheiden.An dieser Stelle möchte ich den Herren Professoren Dr. E. Stiefel und Dr. H.
Rutishauser,
die mit ihren wertvollen HinweisenzumGelingen
dieserArbeit
beigetragen haben,
meinen besten Dankaussprechen.
I. Das Stabilitätskriterium
2. Das Kettenbruchkriterium vonWall
[6]
Es sei
P(z)
=zn+cn_xz"'1
+c„_2zn~2
+ V cxz+ c0 einPolynom
w-tenGrades mit
komplexen
Koeffizienten ck=ftk
+ i qk. Aus diesem bilde manQ(z)
=[P(z)
—(— 1)" P{— z)}j2,
worinP(z)
dasPolynom
mit denkonjugiert
ßW
1 1 ' 1 P{z) rxz+ sx -r 1 ' r2ir+ s2 ' rsz + s3komplexen
Koeffizientenck=pk
—i qk bedeutet. Dann ist<?(*)
=Pn-l
Zn~X + i ?„-* *""* +Pn-S
*-8- »?«_4 -Z""4 + '•" .und der
Quotient Q{z)jP(z)
hat imallgemeinen
eineKettenbruchentwicklung
von
folgender
Form mit inzlinearen Teilnennern:+
-+„ /+— (2-1)
Satz 1
(Kriterium
vonWall)
: Existiert dieKettenbruchentwicklung (2.1)
von
Q{z)jP{z),
so sind darin die Grössen rk(k
= 1,2,... ,n)
reell und von Nullverschieden,
diesk(k
= 1, 2, ... ,n)
reinimaginär
odernull. Sind dann unter den rkmpositiv
und(n
—m) negativ,
sohabenmder WurzelnvonP(z)
=0negative
und
(n
—m) positive
Realteile.Die Teilnenner in
(2.1) ergeben
sich durchfortgesetzte
Division mit Rest nach dem euklidischenAlgorithmus
fürP(z)
undQ(z).
So istspeziell
fürdenerstenTeilnenner
P(z)
=(r1z
+s1+l)Q(z)
+R1(z) (2.2)
und nachSubtraktionvon
Q(z)
auf beiden SeitenP(z)
-Q(z) H'i
*+*i) ÇW
+*i(*)
.(2.3)
Da der Rest
R^z)
in(2.2)
und(2.3) gleich ist,
lautet die Kettenbruchentwick¬lung
vonQ(z)l[P(z)
-Q(z)]
--
ÖW
__ =
l
__ + 1 +
A_
+ ... +_i_ (2 4)
p(z) - 0W rtz -{ Sl r2z + s2 i-jHSa V^tS,
mit denselben rÄ, sfc
(k
= 1, 2, ... ,n)
wiein(2.1).
Demnachgilt
derzu Satz 1äquivalente
Satz 2: Existiert die
Kettenbruchentwicklung (2.4) für
denQuotienten Q(z)/[P(z)
—Q{z)],
so sind darin die Grössen rk(k
= 1, 2, ... ,n)
reell und vonNullverschieden, diesk
(k
= 1,2, ... ,n)
reinimaginär
oder null. Die Anzahl derpositiven
rk ist danngleich
der Anzahl der WurzelnvonP(z)
= 0 mitnegativem
Realteil.
Die Teilnenner
(rkz+ sk)
in(2.4)
berechnen sich nach dem euklidischenAlgorithmus
fürf0(z)
=P(z)
—Q(z)
undf-^z)
=Q(z).
Es istf0(z)
=P(z)
-Q(z)
=zn+ i qn^ z«-1 +
pn_2
z*-2+ i qn_a zn~3+pn_4
zn^/l W
=<?(*)
=Pn-l
Z"-1 +tqn-2 Zn~2+Pn-Z
S""3+*?«-4 Z""4+ '''(2.5)
undes sei
allgemein
/*(*)
=«*.**B-*+«*,*+i*"~*~1
n-k
'- + ak,n-\z+ ak,n—
2j
Œk'k+>2"J-0
(Ä
=0,1,...,»).
(k=
1, 2, ... ,n-1)
.(2.6)
Dann bildet man
/o(*)
=('i'
+«i) /i(*)
+/î(*)
-/n-lW
=K
2 +Sn) fn{z)
Die Grössen rfc, sk, akik+1
(k=
1, 2,...,n;j
=0,1,...
,n—k)
lassen sich rekur¬siv
gemäss
den nachstehenden Formeln berechnen:ak-l,Jc-l 'ak,k" rki \ak-l,l 'kuk,k+l) <*k,k= sk
{k=l,2,...,n)
= ak ak-l,k+l+j sIeak,k+l+i rkak,k+2+j ~ uk+l,k+l+i
(k
= 1,2, ... ,n—1; 1 — 0,1, ... ,n — k — 1; mit aki„+1=0)
.Die
Anfangsbedingungen
dazu lauten nach(2.5):
a00 — 1 • a0l= *9n-l > a02 = Pn-2' a0Z =*In—Z> a04= Pn-i» >
all=
Pn-X
> aX2 =lin~2> ali =Pn-3
< aXi= lQn-i,(2.7)
(2.8)
3.
Herleitung
des Kriteriums vonWall ausdem Verfahren der Sturmschen KetteBetrachten wir die Methode der Sturmschen Kette
[5]
zurBeantwortung
der
Stabilitätsfrage
: Danachsetztman inP(z)
z— i yein,
trennt in Real- undImaginärteil P(i y)
=Re(y)
+ iIm(y)
undbeginnt
fürgerades
n mitF0(y)
=Re(y), F^y)
=-Im(y)
,bzw. für
ungerades
n mitF0(y)
=Im(y), Fx{y)
=Re(y).
Dann lässt sich imallgemeinen
eineFolge
vonPolynomen Fk(y)
vom wirklichen Grad n— k undmit reellen Koeffizienten
Aki
k+j mitAki
k + 0wiefolgt
bilden:Fk(y)=Akiky- I*,
k+iyAk,n-1
y +Ak>n
n-k
=
ZA,*+1yn-k-j (A
=0,1,...,»),
J-0
F0(y)
=(Äi
y +SJ J^(y)
-F2(y)
,F1(y)
=(R2y+S2)F2(y)-F3(y), \ (3.1)
F^{y)
=(Rky
+sk) Fk(y)
-Fk+1(y) (k
= 1,2,...,n-i),
iV-i(y)
=(ÄB
y +5») Fn(y)
.Für das
folgende
treffen wir dieVoraussetzung:
Die Sturmsche Kettefür
dasPolynom P(z)
existiert in der Form(3.1),
wobei dieQuotienten (Rky
+Sk)
bei derfortgesetzten
Division mitRest linear seien.
Dann
gilt
bekanntlichSatz 3: Existiert die Kette
(3.1),
so ist die Anzahl N der Nullstellen vonP(z)
= 0 mitnegativem
Realteil N=(n
+ l—w)/2,
wobei(l
—m)
der Unter¬schied in der Zahl der Zeichenwechsel in der Sturmschen Kette
F0(y), F^y),
... ,Fn-\{y)> Fn(y) für
y= —ooundy= +00ist.Darin ist l die Gesamtzahl der Verluste undmdie Gesamtzahl der Gewinne
anZeichenwechseln in der Kette
(3.1)
beim Durchlaufen derimaginären
Achsevon —i00 nach + i00. Diese Werte lassen sich aus den Koeffizienten
Aki
kbzw.aus den
Quotienten Rk
=Ak_xk_x\Aktk
ohne weiteresangeben.
Betrachtetman
Fk_x{y)
undFk(y),
so hatmanbezüglich
dieser beiden Glieder in der Kette hinsichtlich Zeichenwechselfolgende
Situation:sgn
Rk
=00 1Zeichenwechsel I
00 0Zeichenwechsel
[
00 0 Zeichenwechsel
|
00 1Zeichenwechsel
|
1 Verlust
1 Gewinn
Somit ist dieGesamtzahlder Verluste /anZeichenwechseln
gleich
der Anzahlder
positiven Rk
und die Zahl der Gewinnemgleich
der Anzahl dernegativen
Rk.
WennF0(y)
undF^y)
teilerfremdsind,
diefortgesetzte
Division mit Rest wirklich mitFn(y)
—const #= 0endigt,
so istn= 1 +mund demnach„
_
{l_-t-
m + l— m) _,also
folgt
aus Satz 3:Satz 4: Die Anzahl N der Nullstellenvon
P(z)
= 0 mitnegativem
Realteil istgleich
derAnzahl derpositiven Rk
in derKette(3.1).
Für die
Polynome F0(y)
undF^y) ergeben
sich:/. Fall: n=4k oder n= 4k + 1
(k ganz) F„(y)
=yn+ ?n-iy""1
-A.-* y*-2
- ?«-syFi(y) Pn-iyn-1
+qn-lyn-l-'Pn-ay*~3-?«-4y"~4
+(3.2)
2.Fall:n= 4 k + 2oder«=4 Ä +3
(k ganz)
^0*(y)
=-y*-?«-iy"-1
+^m-2 y"~2
+ ?„-sy"'3
-£»-4 y"~4
-F*(y)
:-/>»-!
r?„-ïr-s+/»«-8yn_8+?„-4r
-F0(y), -Fi(y)
Da
F*{y)
=—i^,(y)
und/^(y)
=—F^y) ist,
so unterscheiden sich die KettenFk*(y)
undFk(y)
nur durch dasVorzeichen;
es istFj*(y)
——Fk(y),
aber
R%
=Rk (k
= 1, 2,... ,«).
Deshalb kann dieZerlegung
vonP(z)
inF0(y)
und
i\(y) unabhängig
von «indererstenForm(3.2) geschehen.
Fürdie Koef¬fizienten
Rk, Sk, Akik+j (k
= 1,2, ... ,n;j
= 0, 1, ... ,n—k)
bestehen die fol¬genden
Rekursionsformeln:Ak-i,
jt-i:Ak>
Rlr(4c-l,
R-k.Ak> k+1)
:Akik
— Sk(k^\,2,
...,n)
,~~-Ak_lik+1+j
+okAk:k+1+j
-fRk Ak}k+2+j
—Ak+lik+1^j (k
= 1, 2, ...,«- 1;/
- 0, 1, ... ,n-k-l;
mitAkiU+1
=0)
(3.3)
Die
Anfangsbedingungen
dazu lauten nach(3.2):
An 1>
An.
—grn_1,Aq2
— pn A3— ?«-Pn-
•"11—
/V-l> At2
"- <7«-2> -"13_"~ftn-3> A4
(3.4)
Nach diesen
Vorbereitungen
kann nungezeigt werden,
dass Satz 2 und damit Satz 1 eineFolge
von Satz 4 ist.Voraussetzung:
Die SturmscheKette in der Form(3.1)
fürP(z)
existiert.9
Behauptung
DieKettenbruchentwicklung (2 4)
vonQ(z)j[P(z)
—Q(z)]
exi¬stiert, undes
gilt
«i *+,= i3
-Ak.k+i (£
=0,1, ,«,7 = 0,1,,n~k),
I(3 5)
rk=
Rk,
sk=4Sj. (ä
= 1,2,
,«) J
Induktionsannahme Die
Behauptung (3 5)
seirichtig
furJgwjl Indukhonsschluss Gemäss Rekursionsformel(2 7)
ist fur k= m"-m+1 m+1+3 = ^m—1,m+l+3 ^m ^-m,m+l+3 ^m^m,m+2+3 ^U ^ 7 ^ « W l) Nach
Induktionsvoraussetzung
ist dies einerseits—1'^ + 2 A — 1 9 ^+1 ,4 _ P ?3+2 /)
-^m—1,m+l+3 v '-'m^ -^m m+l+3 ±vml -^-m m+2+3 >
^ \ **-m—1 m+l+3 "T~ ^m-^*-m m+l+j~T J^m^*-m,m+2+3/ >
und anderseits
infolge (3 3)
am+l,m+l+3
~ l -"-m+1 m+l+3 1) ="i li ,11— m 1) .
Weiter schhesstman
analog
unterVerwendung
des letzten Resultatesfür?
=0,1^mm <%m+l,m+1 -^-mm -^-m+lm+1 -^m+1>
=
(«»
= \l**m m+1 -"-m+1^^-m+1 m+2) ^-m+1 m+1 ^ ^m+1
Induktionsverankerung
Fur &= 0 und k= 1 liest man dieBeziehungen
«„j =i3
A0],
a11+1 = î3A11+1
direkt aus denAnfangsbedingungen (2 8)
und(3 4) ab,
undesfolgt daraus,
dass fur k= 1ri= aoo an ~ ^00 "11
~ -"-l»
si "
(aoi
~ fi ai2) an= \l-^oi
—Rll A12) Alx
-!Si
ist Nach
Voraussetzung
über die Existenz der Sturmschen Kette(3 1)
sinddie
Rk
4= 0(k
=1,
2, ,w),
unddeshalb sind auch dierk 4= 0(k
=1,
2, . ,«),
das
heisst,
dieKettenbruchentwicklungen (2 4)
und(2 1)
existierenund die rksind reell und vonNull verschieden Da die
Sk (k
= 1,2,
. ,n)
reell sindabereventuell verschwinden
können,
sind die sk= iSk (k
= 1, 2,. ,«)
rem ima¬ginär oder auch null
Infolge
der Gleichheit rk=Rk
decken sich dieAussagen
10
über die Anzahl der Wurzeln von
P(z)
= 0 mitnegativem
Realteil in den Sätzen 1 und4,
sodass damit der Beweisvon Satz 1 mit Hilfe des Satzes über die Sturmsche Kette erbracht ist.4.
Folgerung
aus dem KettenbruchkriteriumVoraussetzung:
DieEntwicklung
vonQ(z)/P(z)
in einen Kettenbruch(2.1)
existiert.
Folgerungen:
Nach Satz 1 sind die Grössen rk(k
=1,2,
...,n)
von Nullverschieden. Deshalb lässt sich auf den Kettenbruch
(2.1)
eineÄquivalenz¬
transformation
ausführen,
indem der Ä-te Teilbruch mit —l\rk
erweitert wird:0W
-1/»-!1
_, 1l^iU i ,V^a's
P(z)
—z— **2
S3
—^ — -
»'s
Setztmsmdann
+
iK-1
»-«i
(4.1)
-l
«j.
(&
= 2, 3,6* (Ä
= l,2,n)
P(z) I
«i+ b1- zH I
>b*-z
(4.2)
sosind dieak
(k
=1,2,..., n)
reell undvonNullverschieden,
diebk(k=l,2,...,n)
rein
imaginär
oder eventuell null undmanerhält für(4.1)
(4.3)
Gemäss dem Determinantensatz über die
Näherungszähler
undNäherungs¬
nennereines Kettenbruchesist
P(z)
alsrc-terNäherungsnenner
von(4.3) gleich folgender
Determinante:P(z)
=a1+
bx-
-z «2 0 0 0 . 0 0-1
b2-z
a3 0 0 . 0 00 -1
h~
* <*i 0 . 0 00 0 -1
64-2
«5 • 0 00 0 0 0 0 .••
K-
-1-2 «n0 0 0 0 0 . -1
K-*
(4.4)
Aus
(4.4)
istersichtlich,
dassP(z)
das charakteristischePolynom
desEigen¬
wertproblems (N—zE)
x= 0ist,
wobei die Matrix Nfolgende spezielle Jaco-
11
bische Form aufweist:
N--
«i +
bx
«2 0 0 . . 0 0-1
K
«3 0 . .. 0 00 -l
h
«4 ... 0 00 0 -1
h
.. 0 00 0 0 0 .••
K-i
an0 0 0 0 ... -1
bv
(4.5)
Inder Matrix .ZV sind die Grössen ak
(k
= 1,2, ... ,n)
reell undvon Null ver¬schieden,
diebk (k
=1,2,
...,n)
reinimaginär
oder null.Übertragung
des KriteriumsvonWallauf
die Matrix N: DieStabilitätsfrage
kann nach
(4.2)
allein ausdem Realteil ax des ersten Elementes in derHaupt¬
diagonalen
und den reellen Elementen ak(k
= 2, 3,... ,n)
in der oberenbeglei¬
tenden
Diagonalen
beantwortet werden. Nach(4.2) gelten:
»"l«2
«2 a, a,
it
«1 «3«5•••ak-
rk=
2 4. ft*
2 4 ß
"*
ak
esist som
«ia3«s•••«fc
(k gerade) (k ungerade)
(k
= 2, 3, ... ,n)
sgnrk -sgn(axa2 a3
(k
= 1, 2,(4.6)
Demnach
folgt
aus Satz 1:Satz 5: Die Zahl der
positiven
Glieder in derFolge
von Produkten av ax a2, a1a2a3, ... ,a1a2--- a„_1 anergibt
die Anzahl derEigenwerte
von(N
—zE)
x=0mit
-positiven
Realteilen.Schlussfolgerung:
Dasgestellte Problem,
das charakteristischePolynom
einer
gegebenen
Matrix A mitkomplexen
Elementen vermittels einer Kettevonsolchen
Polynomen
zuermitteln,
welche dieStabilitätsfrage
beantwortenkann,
ist damit auf dieAufgabe zurückgeführt,
die Matrix A mit HilfeeinerÄhnlich¬
keitstransformation in die Normalform iV überzuführen.
Im zweiten Teil wird
gezeigt werden,
dass diese Transformation imallge¬
meinen durchführbar ist. Dabei erweist es sich als
zweckmässig,
die Normal¬form N an der
Nebendiagonalen
zuspiegeln
und dieBezeichnung
leicht zu12
ändern. Es seien
B =
i
b'n i12
0 0-1
ib'2i b23
0 .0 -1
ib'33 bSi
.0 0
0 0
0 0
0 0 0 0.
0 0 0 0.
• % "n-ln-l °n-ln 1 0„„ -+-% Onn
(4.7)
bzw. im reellen Fall
B
0 »12 0 0 . . 0 0
-1 0
hs
0 . . 0 00 -1 0
hi
. 0 00 0 0 0 . . 0 ®n—in
0 0 0 0 . . -1
(4.8)
die Normalformen der transformierten, zu A
äquivalenten Matrix,
worin dieh,
lc+i(k
=1»
2,...,n—1)
undbnn
reell und von Null verschiedensind,
wàih- renddem dieb'kh (k
—1,
2, ... ,n)
in(4.7)
reell aber nichtvonNull verschieden sein müssen. An Stellevon Satz 5 lässt sich dannfolgender
Satz formulieren:Satz 6
{Stabilitätskriterium für Matrizen):
Wenn esgelingt,
einegegebene
Matrix A =
(ajlc)
mitkomplexen
Elementen ajlc vermittels einerÄhnlichkeits¬
transformation
indie Form(4.7),
bzw.(4.8)
bei reeller MatrixA, überzuführen,
dann ist dieZahl der
positiven
Glieder in derFolge
vonProduktenbnn, bnnbn_ln, Kn K-m K-in-i. ,hn bn-m
••hs bi2 gleich
der Anzahl derEigenwerte
vonA mit
positiven
Realteilen. Sindspeziell
alle Elemente o12,623,
... ,bn_ln, —bnn positiv,
so haben alleEigenwerte negative
Realteile.II. Methode der Transformation
5. Elemente der Transformation
Die Grundidee der Transformation besteht
darin,
durchgeeignete
Wahl undReihenfolge
vonmöglichst
einfachenÄhnlichkeitstransformationen
in endlich vielen Schritten sukzessive diegewünschte
Normalform zugewinnen,
indem injedem
einzelnen Schritt ein Element der Matrix behandelt wird.Einerseits bewirkt
ja Multiplikation
miteinerDiagonalmatrix
TvonlinksTA in A eine
Multiplikation
der Zeilen mit denentsprechenden Diagonalele-
13
mentenvon
T,
undMultiplikation
vonrechtsA T eineentsprechende Multipli¬
kation der einzelnen Kolonnen von A. Anderseits bewirkt
ja Multiplikation
mit einer nicht
Diagonalgestalt
aufweisenden Matrix Tvonlinks TA in A eine lineareZeilenkombination undMultiplikation
vonrechts A T eine lineare Kom¬bination der Kolonnen. Als einfachste Gestalt wird T für einen Schritt einer
Ähnlichkeitstransformation
TAT-1 entweder alsDiagonalmatrix
sogewählt werden,
dassnurje
eine Zeile und eine Kolonne in A verändertwird,
oder alsNichtdiagonalmatrix
so, dass nur zwei bestimmte Zeilen und Kolonnen mit¬einander kombiniert werden.
Typus
A: T istDiagonalmatrix
Es sei
r-
1 0 0 0 . . 0
0 ] 0 0 . . 0
0 0
1/a
0 . . 00 0 0 1 . . 0
0 0 0 0
T-i
1 0 0 0 . . 0 0 1 0 0 . . 0 0 0 a 0 . . 0 0 0 0 1 . . 0
0 0 0 0 . . 1
(5.1)
wo
1/a
inT,
bzw. ain der InversenT_1,
inderj-ten
Zeile und/-ten
KolonneanStellevon1 steht. Eine
Ähnlichkeitstransformation
TA T"1 mit einer solchen Matrix werde imfolgenden
mit[T,
bezeichnet und hat auf A
folgende Wirkung
:Division der
j-ten
Zeile durcha undMultiplikation
derj-ten
Kolonne mita.Typus
B: T istNichtdiagonalmatrix
Es sei
T
1 0 0 0 ... 0
0 1 0 a .. 0
0 0 1 0 . .. 0
0 0 0 0 . .. 1
|1
0 0 0 . . 0!
o 1 0 —a . 0
-l__ 0 0 1 0 . . 0
,0 0 0 0 . . 1
(5.2)
wo a in
T,
bzw. —a inT_1,
in derj-ten
Zeile und Ä-ten Kolonne steht. Die MatrixT,
vonlinksmultipliziert TA,
addiertm A zurj-ten
Zeile das a-fache derß-ten Zeile und die MatrixT^1,
vonrechtsmultipliziert
AT~1,
subtrahiert inA vonder &-ten Kolonne das a-fache derj-ten
Kolonne. Demnach bedeutet eineÄhnlichkeitstransformation
TA T"1 mit einer Matrix TvondiesemTypus
:14
Man addiere zunächst zur
j-ten
Zeile vonA dasa-fache
der k-ten Zeile und subtrahiere dannvon der k-tenSpalte
das«.-fache
derj-ten Spalte,
oder auch inumgekehrter Reihenfolge.
Eine solche
Umformung
kann als «zweidimensionale» Transformation be¬zeichnet werden und sei im
folgenden
durch{Tjk; a)
dargestellt,
indem die Indizes die Positionvon ain derdazugehörigen
Matrix Tund damit diezu ändernde Zeile
(/)
und Kolonne(k)
sowie ihre Kombination kennzeichnen.Versuchtmannun,die Transformation auf die Normalform mit Hilfe dieser beiden
Typen
vonUmformungen durchzuführen,
soerkenntmanbald,
dass sie im wesentlichen in zweiHauptabschnitte
zerfällt: Im ersten Teil werden die Elemente unterhalb derDiagonalen behandelt,
während im zweiten Teil die Elemente oberhalb und in derDiagonalen
auf diegewünschte
Formtransfor¬miert werden.
6.
Umformung
der Matrix unterhalb derHauptdiagonalen
In diesem Abschnitt sei die
Aufgabe gestellt,
diegegebene
Matrix A =(àik)
vermittels einer
Ähnlichkeitstransformation
auf die nachstehende Form zubringen
:(6.1) Pu Pl2 Pis Pu
•Pin
-1
P22 P23 P2i
•Pin
0 -1
P33 Pst Psn
0 0 -1
Pu Pin
0 0 0 0 . Vnn
Dieses Problem ist
allerdings
bereitsgelöst
durch das Verfahren von Hes¬senberg
[8].
Doch beschreibe ich hierzurVereinheitlichung
der ganzen Trans¬formation einen andern
Weg.
Bezeichnungsweise:
ZurVereinfachung
werden die Elemente der umge¬formten Matrix immer wieder mit ajlc
bezeichnet,
dasheisst,
essei ajlc derWert des Elementes in der/-ten
Zeile und ß-tenKolonne,
wie er sich nach der beendeten letztenUmformung ergeben
hat.Die Transformation der Matrix unterhalb der
Diagonalen
kanngemäss
nachstehender Vorschriftgeschehen
:15
Regel
1:Beginnend
mit der ersten Kolonne und von Kolonne zu Kolonne biszurzweitletztenfortfahrend, führe
manfur
die k teSpalte (k 1,2,
,«—1) folgende Umformungen
ausa)
Uminder(k
+l)-ten
Zeileeine—1 zuerhalten,
wendeman dieTransfor¬
mation
{Tk+1,
—ak+1k)
anb)
die Elemente a,k(j
— k + 2 k +3,,n)
werden dann mitHilfe
derzweidimenstonalen
Transformationen [T3
k+1,allc)
zum Verschwindengebracht
Dass die
Regel
1 dengewünschten Erfolg hat,
zeige ichfolgendermassen Voraussetzung
DieElemente,
durch welche dividiert werden muss, seien von Null verschiedenBehauptung
Die Matrix A=(a, k)
mitkomplexen
Elementen a}klasst sich unterAnwendung
derRegel
1 auf die Form(6 1)
transformierenBeweis
Induktionsannahme Die erstenm—1 Kolonnenweisenbereitsdie
gewünschte
Form
auf,
undes seienalsoak+\ j;= ~l> aik ~~0 fur £ — 1, 2, , m — 1
f-k
+ 2,k + 3 , nInduktionsschluss
Anwendung
derRegel
1 fur k =ma)
NachVoraussetzung
seiam+1 m =#0,
die Transformation(7"«,+!,—
am+1m)
kann
ausgeführt
werden Danach wirdzuerstdie(m
+l)-te
Zeiledurch —am+1 mdividiert,
wodurchindenersten(m
—1)
Kolonnen nichtsgeändert wird,
da ]a am+i s=0 lstfur k= 1, 2, , m— 1,inder m-ten Kolonnewird am+1mzu—1 und indenfolgenden
Kolonnen werden die Elemente am+1 k mit k=m+1,m+2, .,nverändert Dann wird noch die
(m
+l)-te Spalte
mit —am+1 mmul¬tipliziert,
das heisst die Elemente dernächstfolgenden Spalte
Die dermtenvorangehenden
Kolonnen werden durch diese Transformation nichtgeändert
b)
Die Elemente alm(j
— m+ 2, m + 3, ,n)
werden vermittels der Transformation(T,
m+1,a,m)
zuNullgemacht
Danach wird zuerst das a,m-fache
der
(m
+l)-ten
Zeilezurj-ten
Zeile addiert In den(m
—1)
ersten Kolonnenwird dadurch wiederum nichts
geändert,
da nach Induktionsannahme alk= 0(k
= 1,2,
,m—1)
ist sowohl fur j =m+ 1 als auch fur j =m+ 2, m+ 3,,n, weil in
]edem
Fall 7 2ï(m
—1)
+ 2 ist In der wten Kolonne ist]etzt
am+i m=—1>
weshalb aJm in Nullübergeht
und in denfolgenden
Kolonnenwerden die Elemente allc
(k
= m+1,
m+2, ,n) geändert
Dann wird nochvon der
(m
+l)-ten Spalte
dasa3m-fache
der7-ten Spalte (7
èm+2)
subtra¬hiert,
dasheisst,
eswirdnurdienächstfolgende
Kolonne verändertDamit ist
gezeigt,
dass sich das Verfahren gemässRegel
1 auf die m-teKolonne fortsetzen
lasst,
ohnedabei diem — 1 ersten Kolonnen zuandernInduktionsverankerung
SämtlicheÜberlegungen
des Induktionsschlussesgelten
sinngemäss auch fur m=\16
7. Diskussion
Die Transformation stösst dann auf
Schwierigkeiten,
falls nachbeendigter Umformung
der(k
—1)
ersten Kolonnen das Element ak+lik Null oder auchnursehrklein
geworden ist,
durch welches im nächsten Schritt die(k
+l)-te
Zeileder Matrix dividiert werden soll.
I.Fall: Die
Transformation
kannauf
die k-te Kolonneausgedehnt
werdenEs sei ak+lik= 0,bzw. sehr
klein,
aber mindestens ein Element in der k-tenSpalte
aJk mit k + 2 </
g n von Nullverschieden,
bzw. nicht sehr klein.Durch
gleichzeitige Vertauschung
der/-ten
mit der(k
+l)-ten
Zeile und derentsprechenden
Kolonnen kann erreichtwerden,
dass nunin der Ä-tenSpalte
und
(k
+l)-ten
Zeile ein von Null verschiedenes Elementsteht,
ohne dass dadurch das in denvorangehenden
Kolonnen schon Erreichte zerstörtworden wäre.An Stelle dieserVertauschung
kann auch die im Endeffektgleichwertige
zweidimensionale Transformation
{Tk+lt3;l) eingeschalten werden,
indem die/-te
Zeilezur(k
+l)-ten
Zeile addiert und dann die(k
+l)-te Spalte
vonder/-ten Spalte
subtrahiert wird.Jedenfalls
wird in diesem Fall dieRegel
1 aufdie k-te Kolonne anwendbar.
2. Fall: Die Matrix
zerfällt
Neben dem Element ak+lik verschwinden sämtliche Elemente a,k in der Ä-tenKolonne mit k + 2 g
/
< n, bzw. werden sehr klein. Dann zeichnet sich eineUnterteilung
der Matrix in Untermatrizen ab:nfc+i
A.
- 1 #22 a2k-1 a1k a2k+\ a2n
0 -1 . aik-1 aSk ß3*+l adn
0 0 --1 akk akk+l akn
0 0 0 0 ak+lk+l ak+ln
0 0 0 0 ak+2k+l ak±2n
0 0 ... 0 0 ank+1
Dann lässt sich das Verfahren auf die
quadratische
Untermatrix rechts unten weiteranwenden, undmanerhältso schliesslich einezuAäquivalente
Matrix, welche nicht die Normalform(6.1) aufweist,
sondern aus Kästchen der Form(6.1) aufgebaut ist,
welche sichlängs
derHauptdiagonalen
aufreihen. Ein17
solches Kastchen kann
gegebenenfalls
auch nur aus einem einzigen Elementbestehen,
welches danngleich
einemEigenwert
vonA ist. Oberhalb der Kast¬chen wird die Matrix im
allgemeinen
mit von Nullverschiedenen, jedoch
be¬deutungslosen
Elementenausgefüllt
sein. Die Untermatrizen von der Gestalt(6.1),
die sichsolängs
derDiagonalen ergeben,
brauchen aber nichts gemeinsamzu haben. Es kann sein, dass sie je voneinander verschiedene
Eigenwerte
be¬sitzen, teilweise untereinander
gleiche Eigenwerte
aufweisen, oder dass alleEigenwerte
einer Untermatrix auchEigenwerte
einer andern sind Zujedem
Fall lassen sich ohne weiteres
Beispiele
konstruieren. In gewissen Fallen ist dieseAufspaltung
remzufalliger
Natur und kann durchgeeignete
Zeilen- undKolonnenvertauschungen
inderAusgangsmatrix
vermieden werden. Inandern Fallenistsie durch dasKoordinatensystem bedingt
und kann durchÜbergang
zu einemanderen
System
umgangen werden Ganzallgemein
istdiese Erschei¬nung immerdann vorhanden und nicht zum Verschwinden zu
bringen,
wenndie Matrix A mehrfache
Eigenwerte
besitzt, und fur einensolchen derRang¬
abfall grosser als 1 ist, mit anderen
Worten,
wenn dasMimmalpolynom
vonA nichtmit demcharakteristischen
Polynom
übereinstimmt. Soist esunmög¬lich,
eine Hermitesche Matrix mit mehrfachenEigenwerten
vermittels einerAhnlichkeitstransformation auf die Form
(6 1)
zubringen
DasVersagen
desVerfahrens ist demnach in diesem Fall durch die Struktur der
gegebenen
Matrix
bedingt,
worauf aber hier nichtweitereingegangen werden soll8.
Beendigung
der Transformation fur reelle MatrizenVoraussetzung
Die Matrix A seiauf die Gestalt(6 1) transformiert,
und dieKettenbruchentwicklung (2.1)
fur das charakteristischePolynom
existiert.Dann lasst sich die Matrix noch mit endlich vielen
Umformungen
vomTypus
B auf die Normalform(4 8) bringen
Geht man an die
Losung
dieses Problems, so ist man versucht, die ge¬wünschte Form einfach dadurch zu erreichen, dass mandie
notwendigen
Ele¬mente durch
geeignete
Transformationen Schritt fur Schritt zu Null macht, indem man von Kolonne zu Kolonne fortschreitet Fur drei- undvierreihige
Matrizen
gelangt
man auf diese Art auch wirklich ohne grosseSchwierigkeiten
zumZiel. Bei
hoherreihigen
Matrizen scheint diesvorerstauchzufunktionieren, und mangelangt
einmal zu eineräquivalenten
Matrix, welche zwar in den (n—1)
ersten Kolonnendiegewünschte
Gestaltaufweist, jedoch
inder letztenSpalte
imallgemeinen
nur von Null verschiedene Elemente enthalt. Willmandiese noch zum Verschwinden
bringen,
so wird das schon Erreichte teilweise wieder zerstört. Aus diesem Grundist dieReihenfolge
derUmformungen
ge¬schickter zu
wählen,
und so hat sich fur reelle Matrizen eine Transformationherausgebildet,
welche sich m drei Teilegliedert
und die sich in diefolgenden
Regeln
zusammenfassen lasst18
Regel
2:Beginnend
in der erstenKolonne undfortschreitend
vonKolonnezuKolonne bis zur
zweitletzten,
werden alle Elemente aôk mitgerader
Indexsummej
+ k undl^]'g^gM-l
zu Nullgemacht,
indem imallgemeinen
Schrittdie zweidimensionale
Transformation {Tiilc+1; ai]c) ausgeführt
wird.Regel
3: Die Elemente ain in der letztenSpalte
mitgerader
Indexsummej
+n und]'
g«- 2 werden zum Verschwindengebracht,
indem dieTransfor¬
mationen
{Tj:n; —ainlann) angewendet
werden.Hatmansämtliche
Umformungen gemäss
denRegeln
2 und 3durchgeführt,
so
liegt
nuneine Matrix vor,in welcher in und oberhalb derHauptdiagonalen
mit Ausnahme vonan„alle Elemente mit
gerader
Indexsumme Null sind:0 a12 0 «14 0 a16
-1 0 «23 0 «25 0
0 -1 0 a3i 0 «36
0 0 -1 0 «45 0
0 0 0 -1 0 «56
0 0 0 0 0 0
Die restlichen Elemente werden noch wie
folgt
behandelt:Regel
4:Beginnend
in der letzten Kolonne und dann nachvornfortfahrend
biszurvierten
Kolonne,
werdensämtliche Elemente askmitungerader
Indexsummej
+ k und4^j
+ 3-èk<ninNullübergeführt,
indem imallgemeinen
Schrittdie
Transformation [Tjile_x; —ajklak_li]c) ausgeübt
wird.Anmerkung:
Die in denRegeln
2 bis 4angegebene Reihenfolge
ist nicht dieeinzig mögliche,
sondern sie kann inbestimmten Grenzen noch variiert werden.So ist im
Prinzip jede Folge zulässig,
die so beschaffenist,
dass in ihrjeder
Schritt das bereits Erreichte unverändert lässt. Im Hinblick auf die Verifi¬
zierung
desVerfahrens wie auch auf dieProgrammierung
für Rechenautomaten erschien mirdiegewählte Reihenfolge
alszweckmässig.
9. Beweis des Verfahrens
Voraussetzungen
I. Die
gegebene
Matrix A lässt sich vermittels einerÄhnlichkeitstransfor¬
mation auf die Gestalt
(6.1) bringen.
II. Die
Kettenbruchentwicklung
desQuotienten Q[z)jP{z) (2.1)
für dascharakteristische
Polynom P(z)
=|
zE— A|
existiert.19
Behauptung:
Dann lässtsich A durch eineÄhnlichkeitstransformation
in die Normalform(4.8)
überführen.Beweis: Nach
Voraussetzung
I kann angenommenwerden,
dass A schon die Form(6.1) aufweise,
und es bleibt zuzeigen,
dass dieAnwendung
derRegeln
2,3 und 4 zum Ziel führt.1.
Regel
2Induktionsannahme: Dieersten
(m
—1)
Kolonnen seien bereits nachRegel
2behandelt worden und manhabe oberhalb der
Diagonalen:
a,-fc= 0 für
j+k gerade (l<Lj-g,k-g,m-\-g,n-2). (9.1)
Induktionsschluss: Um das Element aim mit
j
+ mgerade
undj
—m zumVerschwindenzu
bringen,
werde nachRegel
2 zuerstdasa3m-fache
der(m
+1)-
ten Zeile zur
/-ten
Zeile addiert. Da in der(m
+l)-ten
Zeile die Elemente am+i,h= 0 smd fürlg^m-1,
so wird dadurch in den(m
—1)
erstenKolonnen nichts
geändert;
da am+lim= —1ist,
wird aim in Nullübergeführt,
undeswerden in der
/-ten
Zeilenurdie Elemente a,kmit m + 1 sï k SIn ver¬ändert. Dann muss noch von der
(m
+l)-ten Spalte
dasajm-ia.che
der/-ten Spalte
subtrahiert werden. Dainfolge
der Form(6.1)
in der/-ten
Kolonne nurdie Elemente aij+ 0 sind mit t g j + 1 ä«+ 1, werden dadurch nur die Elemente aitm+1in der
nächstfolgenden (m
+l)-ten Spalte
in und oberhalb derHauptdiagonalen
betroffen.Insgesamt
werden also nurElemente in und ober¬halb der
Diagonalen verändert,
die in einemspäteren
Schritt behandeltwerden,
somit ist die Transformationsmethode auf diem-te Kolonne fortsetzbar.
Zugleich
ist auch ersichtlich, dass mit Ausnahmevonaim alle andern Ele¬mentein derw-tenKolonne
ungeändert bleiben,
weshalb die Transformationen für die m-teSpalte unabhängig
voneinander inbeliebiger Reihenfolge
durch¬geführt
werden können. Ferner sind dieUmformungen
nachRegel
2 immerausführbar,
da dazu nurMultiplikationen
und Additionennotwendig
sind.Induktionsverankerung:
SämtlicheÜberlegungen
des Induktionsschlussesgelten sinngemäss
auch fürj
—m— 1.2.
Regel
3Voraussetzung:
NachAnwendung
vonRegel
2 hat manajk = 0 für
j
+ kgerade (1
<j
^ k < n-1)
.(9.2)
Hier ist Division durch ann erforderlich. Dies ist