Momentit generoiva funktio

(1)

TAMPEREEN YLIOPISTO Pro gradu -tutkielma

Jessica Glassar

Momentit generoiva funktio

Informaatiotieteiden yksikkö Matematiikka

Joulukuu 2012

(2)

Tampereen yliopisto

Informaatiotieteiden yksikkö

GLASSAR, JESSICA: Momentit generoiva funktio Pro gradu -tutkielma, 30 s.

Matematiikka Joulukuu 2012

Tiivistelmä

Tutkielman pääaihe on momentit generoiva funktio. Se on funktio, jonka avulla voidaan nimensä mukaisesti generoida jakauman momentteja. Lisäksi se on työväline, jonka avulla voidaan luonnehtia jakaumaa muodossa, jota on tietyissä tilanteissa helpompi käsitellä.

Tutkielman alussa pohjustetaan aihetta käyden läpi tarvittavia perus- määritelmiä satunnaismuuttujasta, odotusarvosta ja momenteista. Toinen esitietoja käsittelevä luku taas sisältää asiaa yleisesti generoivista funktioista sekä tarkemmin karakteristisesta funktiosta.

Itse momentit generoivaan funktioon päästään luvussa 4, jossa käsitel- lään määritelmän ja perusominaisuuksien lisäksi jakauman määrittämistä momenteista, momenttiepäyhtälöitä sekä riippumattomien muuttujien summaa.

Lukijan oletetaan tuntevan matemaattisen tilastotieteen perusteet sekä todennäköisyyslaskentaa. Tutkielman päälähteenä on käytetty Vijay K. Ro- hatgin ja A.K. Md. Ehsanes Salehin kirjan An Introduction to Probability and Statistics toista painosta.

(3)

Sisältö

1 Johdanto 4

2 Satunnaismuuttuja ja siihen liittyviä käsitteitä 4

2.1 Satunnaismuuttuja . . . 4

2.2 Riippumattomuus . . . 5

2.3 Odotusarvo . . . 6

2.4 Momentit . . . 8

3 Tarvittavia ennakkokäsitteitä 10 3.1 Generoivat funktiot . . . 10

3.2 Karakteristinen funktio . . . 12

4 Momentit generoiva funktio 13 4.1 Momentit generoivan funktion määritelmä ja perusominaisuuksia . . . 13

4.2 Jakauman määrittäminen momenteista . . . 19

4.3 Momenttiepäyhtälöitä . . . 22

4.4 Riippumattomien muuttujien summa . . . 26

Viitteet 29

(4)

1 Johdanto

Tämän tutkielman pääaiheena on momentit generoiva funktio. Aluksi on kuitenkin hyvä pohjustaa aihetta hiukan, joten luvussa 2 kerrataan matemaatti- sessa tilastotieteessä käytettäviä käsitteitä siinä suhteessa, miten tarpeellisia ne ovat tutkielman aiheen kannalta. Ensin kerrotaan satunnaismuuttujasta (alaluvut 2.1 ja 2.2), joka on ehkä koko tutkielman eniten toistettu käsi- te. Sen jälkeen käydään läpi vielä odotusarvo (2.3) ja momentit (2.4), jotta lukijalla olisi tuoreessa muistissa nämä aiheen kannalta tärkeät asiat.

Luku 3 pitää sisällään kaksi osaa, joista ensimmäinen (3.1) kertoo generoivista funktioista yleensä. Se pyrkii hiukan valottamaan sitä, mitä generoivat funktiot oikein tekevät. Toinen osa (3.2) kertoo karakteristisesta funktiosta, joka on oikein hyödyllinen funktio, mutta joka käydään tässä tutkielmassa läpi oikeastaan vain siksi, että sitä tarvitaan erään lauseen todistuksessa.

Karakteristinen funktio on myös generoiva funktio.

Viimein luvussa 4 päästään itse asiaan. Ensin määritellään momentit generoiva funktio ja käydään läpi sen perusominaisuuksia (alaluku 4.1). Sit- ten mietitään, voisiko tietyn jakauman määrittäminen momenteista onnis- tua (alaluku 4.2). Alaluku 4.3 käsittelee momenttiepäyhtälöitä ja viimeinen alaluku 4.4 tilanteita, joissa satunnaismuuttujia onkin enemmän kuin yksi.

Lukijalta odotetaan, että hän tuntee matemaattisen tilastotieteen perusteet sekä hieman erilaisia jakaumia, kuten normaalijakauma ja Poisson- jakauma. Myös matemaattisen analyysin perusteet oletetaan tunnetuiksi.

Tutkielman päälähteenä on käytetty Vijay K. Rohatgin ja A.K. Md. Eh- sanes Salehin kirjaa An Introduction to Probability and Statistics, Second edition.

2 Satunnaismuuttuja ja siihen liittyviä käsit- teitä

Pohjustetaan aihetta hieman tarvittavilla ennakkotiedoilla. Tässä kappaleessa käydään läpi pääpiirteittäin satunnaismuuttuja, sen ominaisuuksia sekä odotusarvo. Niiden jälkeen tarkastellaan vielä momentteja, jotka nimensäkin perusteella liittyvät kiinteästi momentit generoivaan funktioon.

2.1 Satunnaismuuttuja

Tutkimustuloksia on usein helpompi käsitellä jonkinlaisen tiivistetyn muuttujan avulla. Esimerkiksi vaikka kyselytutkimus, jossa vastaukset on jaoteltu myönteisiin, ”1”, ja kielteisiin, ”0”, ja vastauksia on saatu 50 henkilöltä. Nyt otosavaruudessa on 2⁵⁰ elementtiä, joista jokainen on 1:n ja 0:n muodosta- ma 50 alkion merkkijono. Tällainen tietomäärä on saatava pakattua tiiviim- mäksi, jotta sitä voidaan käsitellä helpommin. Voidaan määrittää muuttuja

(5)

X = ”1”:n määrä 50 vastauksen joukossa. Tällöin otosavaruus on pienenty- nyt kokonaislukujen joukoksi{0,1,2, . . . ,50}, mitä on paljon helpompi käsi- tellä. [2, s. 27]

Kun määritetään X tällä tavoin, on luotu kuvaus alkuperäiseltä otosava- ruudelta uudelle sellaiselle, useimmiten joukolle reaalilukuja. Yleisesti käyte- tään seuraavanlaista määritelmää:

Määritelmä 2.1. Satunnaismuuttuja X on funktio otosavaruudestaS reaa- liluvuille, toisin sanoen X :S →R. [2, s. 27]

Esimerkki 2.1. Taulukossa 1 on muutamia esimerkkejä erilaisista satun- naiskokeista ja niissä käytetyistä satunnaismuuttujista.

Koe Satunnaismuuttuja

Heitetään kahta noppaa X = saatujen lukujen summa

Heitetään kolikkoa 25 kertaa X = kruunujen määrä 25:ssä heitossa Viljellään eri maissilajikkeita X = tuotto/aari

Taulukko 1: Esimerkkejä erilaisista satunnaismuuttujista

Tässä tutkielmassa tarkastelun kohteena olevat käsitteet on suurelta osin jaoteltu kahteen tapaukseen sen mukaan, onko satunnaismuuttuja jatkuva vai diskreetti, joten määritellään vielä sekin ominaisuus.

Määritelmä 2.2. Satunnaismuuttuja X onjatkuva, jos sen kertymäfunktio F(x) on jatkuva. Satunnaismuuttuja X on taas diskreetti silloin, kun sen kertymäfunktio F(x) on porrasfunktio. [2, s. 33]

2.2 Riippumattomuus

Erityisesti tutkielman loppupuolella käsitellään toisistaan riippumattomia satunnaismuuttujia. Tässä kappaleessa selvennetään hiukan, mitä riippumattomuus satunnaismuuttujien kohdalla tarkoittaa.

Satunnaismuuttujien riippumattomuus pohjaa ehdollisen todennäköisyy- den käsitteestä. Kerrataan se lyhyesti:

Kun A ja B ovat jonkin otosavaruuden tapahtumia, niin tapahtuman B ehdollinen todennäköisyys ehdolla A on

P(B | A) = P(B ∩A)

P(A) , kun P(A)>0.

Kun tapahtumat ovat riippumattomia, on ehdollinen todennäköisyysP(B|A) sama kuin ehdollistamaton todennäköisyys P(B). Siis

P(B) = P(B |A) = P(B ∩A) P(A) . Tästä seuraa riippumattomuuden määritelmä:

(6)

Määritelmä 2.3. TapahtumatA ja B ovat riippumattomat, jos P(B∩A) = P(A)P(B)

[10, s. 54]

Satunnaismuuttujien riippumattomuus määritellään vastaavalla tavalla.

Määritelmä 2.4. OlkootX jaY satunnaismuuttujia. Ne ovatriippumatto- mat, jos

P({X ∈A} ∩ {Y ∈B}) =P({X ∈A})P({Y ∈B}), kaikilla A⊂Rja B ⊂R. [9, s. 39]

Määritelmästä seuraa suoraan muun muassa se, että jos ja vain jos X ja Y ovat riippumattomia,

F(x, y) =F₁(x)F₂(y),

kaikilla (x, y)∈ R². Tässä F₁(x), F₂(y) ovat satunnaismuuttujien X, Y ker- tymäfunktioita ja F(x, y) niiden yhdistetty kertymäfunktio. [13, s. 119]

2.3 Odotusarvo

Odotusarvo on yksi tärkeä jakaumien tunnusluku. Tässä kappaleessa kerrataan siihen liittyviä perusasioita. Odotusarvon kohdalla aloitetaan myös erikseen diskreetin ja jatkuvan tapauksen esittäminen (ks. Määritelmä 2.2).

Olkoon X diskreetin jakauman satunnaismuuttuja, jonka tiheysfunktio onp_k =P{X =x_k}, k = 1,2, . . .. Jos

(2.1)

∞

X

k=1

|x_k|p_k <∞,

niin X:n odotusarvo, E(X), on olemassa ja

(2.2) µ=E(X) =

∞

X

k=1

x_kp_k.

On siis huomattava, että on mahdollista, että jälkimmäinen sarja (2.2) suppenee, mutta ensimmäinen (2.1) ei. Tällöin määritellään, että E(X) ei ole olemassa.

Esimerkki 2.2. Olkoon X:n tiheysfunktio määritelty seuraavanlaisesti:

p_j =P

(

X = (−1)^j+13^j j

)

= 2

3^j, j = 1,2, . . . .

(7)

Tällöin _∞

X

j=1

|x_j|p_j =

∞

X

j=1

2 j =∞ ja E(X) ei ole olemassa, vaikka sarja

∞

X

j=1

xjpj =

∞

X

j=1

(−1)^j+12 j onkin suppeneva.

Jos X taas on jatkuva satunnaismuuttuja ja sillä on tiheysfunktio f, saadaan sen odotusarvo integraalin avulla yhtälöstä

E(X) =

Z

xf(x) dx.

Tällöin on vastaavasti oltava

Z

|x|f(x) dx <∞.

Tässä vaiheessa on hyvä palauttaa mieleen, että integraali^R_−∞^∞ ϕ(x)dxon olemassa vain silloin, kun raja-arvo lim^a→∞_b→∞ ^R_−b^a ϕ(x) dx on olemassa. Raja- arvon lima→∞Ra

−aϕ(x)dx on hyvinkin mahdollista olla olemassa ilman, että integraali ^R_−∞^∞ ϕ(x) dx on.

Esimerkki 2.3. Tarkastellaan esimerkkinä Cauchyn jakauman tiheysfunk- tiota:

f(x) = 1 π

1

1 +x², −∞< x < ∞.

Selvästikin

a→∞lim

a

Z

−a

x π

1

1 +x² dx= 0.

Nyt E(X) ei kuitenkaan ole olemassa, sillä integraali 1

π

∞

Z

−∞

|x|

1 +x² dx hajaantuu.

Huomautus 1. Sanotaan, että satunnaismuuttujaX onsymmetrinen pisteen α suhteen, jos

P{X≥α+x}=P{X ≤α−x} kaikillax:n arvoilla.

(8)

Kertymäfunktiolle F tämä tarkoittaa seuraavaa:

Jos kaikille x∈R pätee

F(α−x) = 1−F(α+x) +P{X =α+x},

niin sanotaan F:n olevan symmetrinen ja α:n olevan sen symmetriakeskus.

Jos α= 0, pätee jokaisella x

F(−x) = 1−F(x) +P{X =x}.

Erityisesti jos X on jatkuva satunnaismuuttuja, se on symmetrinen α:n ollessa sen symmetriakeskus, jos ja vain jos sen tiheysfunktio f toteuttaa seuraavan yhtälön kaikilla x:n arvoilla:

f(α−x) =f(α+x).

Siinä tapauksessa, ettäα = 0 puhutaan yksinkertaisesti, ettäX on symmetrinen.

Tästä seuraa suoraan se, että kun X on symmetrinen, α symmetriakes- kuksena ja E(X) < ∞, niin E(X) = α. Selkeä esimerkki symmetrisestä jakaumasta on Cauchyn tiheysfunktio, joka esiteltiin tämän kappaleen esi- merkissä 2.3. [13, s. 69-71]

2.4 Momentit

Ennen momentit generoivaa funktiota on hyvä selventää hieman sitä, mitä momentit ovat. Ne ovat myös tärkeitä jakauman tunnuslukuja. Momenttien avulla voidaan luonnehtia satunnaismuuttujan jakaumaa ja ne määritellään odotusarvon avulla.

Määritelmä 2.5. Kunn ∈Z⁺ ja odotusarvoE(X) on olemassa, satunnaismuuttujan X n:s momentti on

mn=E(Xⁿ).

Satunnaismuuttujan X n:s keskusmomentti taas saadaan seuraavan kaavan avulla:

m⁰_n=E[(X−m)ⁿ], missä m=m₁ =E(X)

[2, s. 59]

Huomautus 2. Kunα on positiivinen kokonaisluku jaE(|X|)^α <∞, saadaan β_α =E(|X|)^α, jota kutsutaan satunnaismuuttujanX α:ksiitseisarvomomen- tiksi. Tämä esiintyy myöhemmin kappaleessa 4.3 sekä Tsebysevin epäyhtälön että Ljapunovin epäyhtälön yhteydessä. [13, s. 72]

(9)

Määritelmästä 2.5 nähdään, että satunnaismuuttujan ensimmäinen momentti on jakauman odotusarvo. Toinen tärkeä ja usein tarpeellinen momentti on satunnaismuuttujan toinen keskusmomentti, joka tunnetaan paremmin varianssina. [2, s. 59]

Määritelmä 2.6. JosE(X²) on olemassa, onE[(X−m)²] satunnaisfunktion X varianssi ja voidaan merkitä σ² =var(X) =E[(X−m)²]. [13, s. 79]

Esimerkki 2.4. Olkoon X tasaisesta jakaumasta luonnollisten lukujen jou- kosta. Olkoon siis

P{X =k}= 1

N, k = 1,2, . . . , N.

Selvästi kaikkien kertalukujen momentit ovat olemassa:

E(X) =

N

X

k=1

k· 1

N = N + 1 2 , E(X²) =

N

X

k=1

k²· 1

N = (N + 1)(2N + 1)

6 jne.

[13, s. 73]

Esimerkki 2.5. OlkoonXeksponenttijakauman satunnaismuuttuja. Tällöin sen tiheysfunktio on

f(x) = 1

λe^−x/λ, 0≤x <0 jaλ >0.

Määritetään ensin X:n odotusarvo:

E(X) =

∞

Z

0

1

λxe^−x/λ dx

=

∞

0

−xe^−x/λ+

∞

Z

0

e^−x/λ dx k osittaisintegrointi

=

∞

Z

0

e^−x/λ dx=λ.

[2, s. 56]

Määritetään sitten X:n varianssi:

var(X) =E[(X−λ)²] =

∞

Z

0

(x−λ)²1

λe^−x/λ dx

=

∞

Z

0

(x²−2xλ+λ²)1

λe^−x/λ dx=λ². [3, s. 8-9]

(10)

3 Tarvittavia ennakkokäsitteitä

Jatketaan pohjustusta vielä tarpeellisilla esitiedoilla karakteristisesta funktiosta ja generoivista funktioista yleensä. Generoivia funktioita on siis muita- kin, kuin tässä tutkielmassa käsittelyyn otettu momentit generoiva funktio.

Käydään tässä kappaleessa läpi yleisellä tasolla generoivien funktioiden tar- koitusta sekä määritellään karakteristinen funktio, jota hyödynnetään myö- hemmin muun muassa Lauseen 4.1 todistuksessa.

3.1 Generoivat funktiot

Oletetaan, että halutaan tutkia lukujonoa (a₀, a₁, a₂, . . .). Tällainen jono saattaa olla määritelty tietyn suhdeluvun avulla tai se saattaa käsittää jonkin joukkoperheen. Erilaisia lukujonojen luokkia, joilla kaikilla on hyvin erilai- set ominaisuudet, on monia. Mitä ovat ne yleiset keinot, joilla lukujonoja voidaan tutkia? Yksi tällainen työväline on generoiva funktio:

A(x) =a₀+a₁x+a₂x²+· · ·=

∞

X

k=0

a_kx^k.

[12, s. 1]

Generoiva funktio on siis keino esittää lukujonoja tiiviimmässä muodossa.

Esimerkiksi geometrinen lukujono voidaan muotoilla seuraavasti:

a+arx+ar²x²+· · ·=

∞

X

k=0

ar^kx^k= a 1−rx. [12, s. 1]

Generoivien funktioiden summa on yksinkertaisesti A(x) +B(x) =

∞

X

k=0

(a_k+bk)x^k. [7, s. 32]

Generoivien fuktioiden tulo taas on hieman mielenkiintoisempi. Kirjoite- taan siitä määritelmä.

Määritelmä 3.1. OlkoonA(x) =^P^∞_k=0a_kx^kjaB(x) = ^P^∞_k=0b_kx^kgeneroivia funktioita. Niiden tulo AB on generoiva funktio C(x) = ^P^∞_k=0c_kx^k, missä

c_k =

k

X

i=0

a_ibk−i.

[12, s. 5] Tätä tuloa kutsutaan myös Cauchyn tuloksi. [7, s. 32]

(11)

Kun generoivia funktioita lähestytään algebrallisesti, symbolillex ei vält- tämättä anneta lukuarvoja, jolloin sen potenssi vain ilmaisee kertoimensa paikan lukujonossa. Tällaisen lähestymistavan etuna on, että sarjan suppe- nemista ei tarvitse tutkia ollenkaan. Generoivia funktioita voi kuitenkin lä- hestyä myös analyyttisesti, kuten tässä tutkielmassa myöhemmin tehdään.

Tällöin sarjan A(x) suppenemisellekin asetetaan tiettyjä ehtoja. [7, s. 32-33]

Toinen generoiva funktio, joka on hyvä tuntea, on eksponentiaalinen ge- neroiva funktio:

∞

X

k=0

a_kx^k k!.

Tietyissä tilanteissa tämä on soveltuvampi työväline.

Esimerkiksi

∞

X

k=0

x^k k! =e^x,

joka on jonon (1,1,1, . . .) eksponentiaalinen generoiva funktio. [1, s. 60]

Yksinkertaisin generoiva funktio, jota käytetään todennäköisyysteoriassa on diskreetin satunnaismuuttujan X todennäköisyydet generoiva funktio.

Määritelmä 3.2. Olkoon X:n tiheysfunktio p_k =P{X =k}, k = 0,1,2, . . . ja

∞

X

k=0

p_k= 1.

Tällöin satunnaismuuttujan X todennäköisyydet generoiva funktio on G(s) =

∞

X

k=0

pks^k,

mikä suppenee, kun |s| ≤1.

Esimerkki 3.1. Tarkastellaan Poisson-jakautunutta satunnaismuuttujaaX, jonka tiheysfunktio on

P{X =k}=e^−λλ^k

k!, k = 0,1,2, . . . . Tällöin saadaan, että

G(s) =

∞

X

k=0

(sλ)^ke^−λ

k! =e^−λe^sλ =e^−λ(1−s) kaikilla s:n arvoilla.

[13, s. 85-86]

(12)

3.2 Karakteristinen funktio

Karakteristinen funktio on kuvaus, jota kutsutaan analyysin puolella myös Fourier-Stieltjes-muunnokseksi. Tässä tutkielmassa sitä tarvitaan Lauseen 4.1 todistuksessa. Karakteristinen funktio on olemassa kaikille jakaumille toisin kuin esimerkiksi momentit generoiva funktio.

Määritelmä 3.3. OlkoonXsatunnaismuuttuja. Kompleksiarvoinen funktio φ on määritelty joukossa R seuraavasti

(3.1) φ(t) = E(e^itX), t∈R

ja i = √

−1 on imaginääriyksikkö. Tätä funktiota φ kutsutaan satunnaismuuttujan X karakteristiseksi funktioksi. [13, s. 89]

Kun kyseessä on diskreetti jakauma, φ(t) = ^X

k

e^itx^kP{X =x_k} ja kun jakauma on jatkuva,

φ(t) =

∞

Z

−∞

e^itxf(x) dx.

Esimerkki 3.2. Olkoon X Poisson-jakautunut parametrilla λ. Tällöin φ(t) =e^−λ

∞

X

k=0

e^itkλ^k k!

=e^−λ

∞

X

k=0

(λe^it)^k k!

=e^−λe^λe^it

=e^λ(e^it⁻¹⁾. [15, s. 67]

Esimerkki 3.3. OlkoonXnormaalisti jakautunut satunnaismuuttuja, jonka tiheysfunktio on

f(x) = 1

√2πe^−x²^/2, x∈R.

Muutetaan ensin Eulerin kaavaa, e^ix = cosx +isinx, käyttäen kaava (3.1) muotoon

φ(t) = E(e^itX) =E(cos(tX)) +iE(sin(tX)).

Nyt

(13)

φ(t) = 1

√2π

∞

Z

−∞

cos(tx)e^−x²^/2 dx+ i

√2π

∞

Z

−∞

sin(tx)e^−x²^/2 dx.

Huomataan, että sin(tx) on pariton funktio samoin kuin sin(tx)e^−x²^/2. Näin ollen edellisen funktion oikeanpuoleinen integraali häviää ja saadaan

φ(t) = 1

√2π

∞

Z

−∞

cos(tx)e^−x²^/2 dx

= 2

√2π

∞

Z

−∞

1

2cos(tx)e^−x²^/2 dx =e^−t²^/2, t ∈R. (vrt. [13, s. 90])

4 Momentit generoiva funktio

Nyt päästään vihdoin momentit generoivaan funktioon. Tämä kappale sisäl- tää aluksi tietenkin määritelmän, minkä jälkeen esitellään muutamia esimerk- kejä ja momentit generoivan funktion ominaisuuksia. Näiden jälkeen tarkastellaan tietyn jakauman määrittämistä sen momenteista sekä muutamia mo- menttiepäyhtälöitä. Viimeinen luku käsittelee riippumattomien muuttujien summaa.

4.1 Momentit generoivan funktion määritelmä ja pe- rusominaisuuksia

Momentit generoiva funktio on hyödyllinen työkalu todennäköisyyslasken- nassa ja tilastotieteessä. Sen avulla voidaan, nimensä mukaisesti, johtaa satunnaismuuttujan momentit. Tässä tutkielmassa momentit generoivasta funktiosta voidaan käyttää myös merkintää MGF.

Määritelmä 4.1. OlkoonX satunnaismuuttuja, jolla on kertymäfunktioF. Funktio

(4.1) M(s) = E(e^sX)

on tällöin satunnaismuuttujanX momentit generoiva funktio, jos lausekkeen (4.1) oikeanpuoleinen odotusarvo on olemassa jossain nollan ympäristössä.

Toisin sanoen on olemassa h >0 siten, että kaikilla s:n arvoilla−h < s < h, E(e^sX) on olemassa.

[13, s. 87] ja [2, s. 62]

(14)

Tämän pohjalta voidaan tarkentaa, että X:n MGF on M(s) =

∞

X

k=1

e^sxP{X =x}, kun X on diskreetti ja

M(s) =

∞

Z

−∞

e^sxf(x) dx, kun X on jatkuva.

Esimerkki 4.1. Olkoon diskreetin satunnaismuuttujanX tiheysfunktio P{X =k}=

( ₆

π² · _k¹2, k = 1,2, . . .

0 muulloin.

Nyt

E(e^sX) = 6 π²

∞

X

k=1

e^sk

k² =∞, kun s >0.

Tästä nähdään, ettäX:n MGF ei ole olemassa. Itse asiassa myösE(X) =∞.

Esimerkki 4.2. Olkoon X:n tiheysfunktio f(x) =

( ₁

2e^−x/2, x >0

0 muulloin.

Tällöin X on selvästi jatkuva ja M(s) = 1

2

∞

Z

0

e^(s−1/2)x dx

= 1

1−2s, s < 1 2.

Tarkastellaan sitten samaa jakaumaa kuin generoivan funktion yhteydes- sä:

Esimerkki 4.3. Olkoon X:n tiheysfunktio (vrt. esimerkki 3.1) P{X =k}=

( e^{−λ λ}_k!^k, k = 0,1,2, . . .

0 muulloin.

Silloin

M(s) =E(e^sX) = e^−λ

∞

X

k=0

e^skλ^k k!

=e^−λ(1−e^s⁾ kaikillas:n arvoilla.

(vrt. [13, s. 87-88])

(15)

Esimerkki 4.4. Binomijakauman tiheysfunktio on muotoa f(x) = P{X =x}= n

k

!

p^x(1−p)^n−x, x= 0,1, . . . n, missä n on positiivinen kokonaisluku ja 0≤p≤1.

Nyt

M(s) =

n

X

x=0

e^sx n k

!

p^x(1−p)^n−x =

n

X

x=0

n k

!

(pe^s)^x(1−p)^n−x. Binomikaavan (ks. esim. [2, s. 90]) mukaan

n

X

x=0

n x

!

u^xv^n−x = (u+v)ⁿ. Tällöin, kun u=pe^s ja v = 1−p, saadaan

M(s) = [pe^s+ (1−p)]ⁿ.

Lause 4.1. Momentit generoiva funktio määrittää aina tietyn kertymäfunk- tion yksikäsitteisesti. [13, s. 88]

Todistus. Tämän lauseen todistus on esitetty tässä pääpiirteittäin. Tarkem- masta esityksestä kiinnostunut lukija voi tutustua esimerkiksi lähteeseen [4].

(i) Tarkastellaan ensin rajoitettua jatkuvaa satunnaismuuttujaa. Tiede- tään, että kun X on jatkuva

M(s) =E(e^sX) =

∞

Z

−∞

e^sxf(x) dx.

Jos korvataans it:llä, missäton reaaliluku jai=√

−1, silloin sarja suppenee kaikilla t ja voidaan määritellä funktio

φ(t) =M(it) =

∞

Z

−∞

e^itxf(x) dx.

Tämähän onX:n karakteristinen funktio. Tästä nähdään myös, että funktio φ onf:n Fourier-muunnos (ks. esim. [11]). Toisaalta tiedetään, että Fourier- muunnoksen käänteisfunktio saadaan kaavaa

f(x) = 1 2π

∞

Z

−∞

e^−itxφ(t) dt

soveltaen.[6, s. 398]

(16)

Näin nähdään, että karakteristinen funktio φja sitä kautta momentit generoiva funktio M, määrää tiheysfunktion f yksikäsitteisesti, jolloin myös kertymäfunktio on yksikäsitteisesti määritelty.

(ii) Toisena käsitellään tapaus, kun X on diskreetti satunnaismuuttuja, jolla on äärellinen arvojoukko{x₁, x₂, . . . , x_n}, kertymäfunktioF ja momentit generoiva funktio M.

Tällöin

M(s) =

n

X

j=1

e^sx^jF(x_j).

Asetetaan a_j =F(x_j) ja sitten valitaan n kpl soveltuvia s:n erilaisia arvoja s_i ja merkitään b_i =M(s_i). Näin saadaan

b_i =

n

X

j=1

e^sⁱ^x^ja_j

tai matriisimerkinnöillä

B=MA.

TässäB = (b_i) jaA= (a_j) ovatn-sarakevektoreita ja M= (e^sⁱ^x^j) onn×n- matriisi. Saatu matriisiyhtälö voidaan ratkaista A:n suhteen:

A=M⁻¹B,

silloin, kun matriisiMon kääntyvä (ts.M:n determinantin on oltava eri kuin 0).

Tämä voidaan aina järjestää valitsemalla arvot si = i−1, sillä tällöin M:n determinantti on Vandermonden determinantti e^xⁱ:lle,

det







1 1 1 . . . 1

e^sx¹ e^sx² e^sx³ . . . e^sxⁿ e^2sx¹ e^2sx² e^2sx³ . . . e^2sxⁿ

. . .

e^(n−1)sx¹ e^(n−1)sx² e^(n−1)sx³ . . . e^(n−1)sxⁿ







,

jonka arvo on ^Q_i<j(e^xⁱ −e^x^j).

Tällainen determinantti eroaa aina nollasta, jos sen x_j:t ovat eriarvoiset.

Siis sarakevektori A = (a_j) saadaan ratkaistuksi matriisiyhtälöstä, jolloin kertymäfunktio tulee yksikäsitteisesti määritetyksi. [6, s. 370]

Huomautetaan vielä, että jos oletus satunnaismuuttujan äärellisyydestä otetaan pois, edellinen todistus ei välttämättä enää päde.

Seuraava lause selittää, miksi funktiota M(s) kutsutaan momentit gene- roivaksi funktioksi.

(17)

Lause 4.2. Jos satunnaismuuttujan X momentit generoiva funktio, M(s), on olemassa s:lle välillä [−s₀, s₀], kun s₀ >0, on sen kaikkien asteiden deri- vaatat olemassa, kun s = 0 ja

M^(k)(0) =E(X^k), k on positiivinen kokonaisluku.

[13, s. 88]

Todistus. Olkoon M(s) = E(e^sX) satunnaismuuttujanX momentit generoiva funktio.

Erotetaan diskreetti ja jatkuva tapaus toisistaan:

Kun X on diskreetti:

d

dsM(s) = d ds

X

x

e^sxp(x)

=^X

x

d

dse^sxp(x) k (∗)

=^X

x

xe^sxp(x), jolloin

M⁰(0) =^X

x

xe^0xp(x) = ^X

x

xp(x) = E(X).

(∗) suppenevan potenssisarjan voi derivoida termeittäin

Koska _ds^d^kke^sx = x^ke^sx, on selvää, että tulos voidaan yleistää koskemaan myös k. derivaattaa. [5, s. 2]

Kun X on jatkuva ja oletetaan, että integraalimerkin yli voidaan derivoida, saadaan

d

dsM(s) = d ds

∞

Z

−∞

e^sxf(x) dx

=

∞

Z

−∞

(d

dse^sx)f(x)dx

=

∞

Z

−∞

(xe^sx)f(x)dx

=E(Xe^sX).

Näin ollen

M⁰(0) =E(Xe^0X) = E(X).

(18)

Kun jatketaan vastaavalla tavalla päädytään tulokseen M^(k)(0) = d^k

ds^kM(0) =E(X^ke^0X) = E(X^k)

[3, s. 10]

Huomautus 3. Vaihtoehtoisesti, jos MGF, M(s), on olemassa s:lle välillä [−s₀, s₀], kun s₀ > 0, voidaan M(s) ilmaista (yksikäsitteisesti) Maclaurin sarjan kehitelmänä:

M(s) =M(0) + M⁰(0)

1! s+ M⁰⁰(0)

2! s²+· · · ,

jossa siisE(X^k) on termins^k/k! kerroin. Kun muistetaan alaluvun 2.4 mää- ritelmä 2.5, niin saadaan vielä toinen muotoilu:

M(s) =

∞

X

k=0

m_k k! s^k.

Viimeistään tästä nähdään selkeästi, mistä momentit generoivan funktion nimi saadaan.

Esimerkki 4.5. Olkoon nytXjatkuva satunnaismuuttuja, jonka arvojoukko on väli [0,∞) ja kertymäfunktiof(x) =λe^−λx. Silloin

m_n =E(Xⁿ) =

∞

Z

0

xⁿλe^−λx dx=λ(−1)ⁿ dⁿ dλⁿ

∞

Z

0

e^−λx dx

=λ(−1)ⁿ dⁿ dλⁿ

1 λ

= n!

λⁿ. Nyt

M(s) =

∞

X

k=0

m_ks^k k!

=

∞

X

k=0

k!s^k λ^k

1 k!

=

∞

X

k=0

s λ

k

= λ

λ−s. Tämä sarja suppenee vain, jos |s|< λ. [6, s. 396]

Huomautus 4. Satunnaismuuttujan X varianssi voidaan nyt muotoilla myös toisella tavalla (vrt. Määritelmä 2.6), var(X) = E(X²)−(E(X))².

(19)

Esimerkki 4.6. Olkoon X satunnaismuuttuja, jonka tiheysfunktio on f(x) = 1

2e^−x/2, x >0.

Esimerkistä 4.2. saadaan, että M(s) = 1

1−2s, kun s < 1 2. Tällöin

M⁰(s) = 2

(1−2s)² ja M⁰⁰(s) = 4·2

(1−2s)³, s < 1 2. Tästä seuraa, että

E(X) = 2, E(X²) = 8 ja var(X) = 4.

Esimerkki 4.7. Olkoon X satunnaismuuttuja, jonka tiheysfunktio on f(x) =

( 1, 0≤x≤1 0 muulloin.

Nyt

M(s) =

1

Z

0

e^sx dx= e^s−1

s , kaikillas, M⁰(s) = e^s·s−(s^s−1)·1

s² ,

ja

E(X) =M⁰(0) = lim

s→0

se^s−e^s+ 1 s² = 1

2. (vrt. [13, s. 89])

Painotetaan vielä, että odotusarvoE(e^sX) ei ole aina olemassa. Itse asiassa vaatimus siitä, että M(s) on olemassa nollan läheisyydessä, on kova vaatimus, jota jotkut yleiset jakaumat eivät täytä. On olemassa generoiva funktio, joka on olemassa kaikille jakaumille, karakteristinen funktio. Tarkempaa tietoa siitä löytyy tutkielman pohjatiedoista.

4.2 Jakauman määrittäminen momenteista

Käsitellään nyt jakauman määrittämistä sen momenteista. Annetaan joukko vakioita, {µ₀ = 1, µ₁, µ₂, . . .} ja kysytään, voivatko ne olla tietyn kertymä- funktion F momentteja. Tässä vaiheessa on hyvä huomioida muutama asia.

Ensinnäkin josM(s) =E(e^sX) on olemassa jollekin satunnaismuuttujalle X,s:n ollessa nollan läheisyydessä, silloinE(|X|ⁿ)<∞kaikillan≥1. Mutta oletuksestaE(|X|ⁿ)<∞kaikillan≥1 ei kuitenkaan seuraa, ettäX:n MGF on olemassa. [13, s. 90]

(20)

Esimerkki 4.8. Olkoon X satunnaismuuttuja, jonka tiheysfunktio on f(x) =ce^−|x|^α, 0< α <1, −∞< x <∞,

missä con vakio ja määritelty yhtälöstä c

∞

Z

−∞

e^−|x|^α dx= 1.

Olkoon s >0. Tällöin

∞

Z

0

e^sxe^−x^α dx=

∞

Z

0

e^x(s−x^α−1⁾ dx

ja koska α− 1 < 0, ^R₀^∞e^sxe^−x^α dx on ääretön kaikilla s > 0. Näin ollen momentit generoivaa funktiota ei ole olemassa. Kuitenkin

E(|X|ⁿ) = c

∞

Z

−∞

|x|ⁿe^−|x|^α dx= 2c

∞

Z

−∞

xⁿe^−x^α dx <∞ kaikillan ∈Z⁺. Toiseksi, kahdella (tai useammalla) satunnaismuuttujalla voi olla sama joukko momentteja.

Esimerkki 4.9. Olkoon X:llä lognormaalisti jakautunut tiheysfunktio f(x) = (x−√

2π)⁻¹e^−(log^x)²^/2, x >0, ja f(x) = 0, kun x≤0.

Olkoon X_ε:n, |ε| ≤1, tiheysfunktio

f_ε(x) = f(x)[1 +εsin(2πlogx)], x∈R.

[Huomaa, että f_ε ≥0 kaikille ε, |ε| ≤1, ja ^R_−∞^∞ f_ε(x) dx= 1, joten f_ε on tiheysfunktio.] Koska kuitenkin

∞

Z

0

x^kf(x) sin(2πlogx) = 1

√2π

∞

Z

−∞

e^−(t²^/2)+ktsin(2πt) dt

= 1

√2πe^k²^/2

∞

Z

−∞

e^−y²^/2sin(2πy)dy

= 0, niin nähdään, että

∞

Z

0

x^kf(x) dx=

∞

Z

0

x^kf_ε(x) dx,

kaikille ε, kun|ε| ≤1 ja k = 0,1,2, . . .. Mutta f(x)6=f_ε(x).

(21)

[13, s. 91]

Kolmanneksi, jokaisen satunnaismuuttujan X momentit täyttävät tietyt vaatimukset.

Esimerkiksi, josβ_ν =E(|X|^ν), myöhemmin esitettävän Ljapunovin epäyhtä- lön (4.7) perusteella nähdään, että (β_ν)^1/ν onν:n kasvava funktio. Yhtä lailla sen neliömuoto

E

n

X

i=1

X^αⁱt_i

!2

≥0

antaa X:n eri kertalukujen momenttien välisen suhteen. [13, s. 91]

Aiemmin todistettu Lause 4.1 antaa riittävän ehdon tietyn F:n määrit- tämiseen sen momenteista.

Esimerkki 4.10. Olkoon satunnaismuuttujalla X tiheysfunktio f(x) =

( e^−x, kun x≥0 0, kun x <0.

Tällöin

E(X^k) =

∞

Z

0

x^ke^−x dx=k!, ja Huomautuksesta 3 saadaan, että

(4.2) M(s) =

∞

X

k=0

m_ks^k k! =

∞

X

k=0

s^k= 1 1−s,

kun 0 < s < 1, mikä on X:n momentit generoiva funktio, jolloin {mk} määrittää F:n yksikäsitteisesti.

Tarkemmin, jos jollakin vakiolla c

|mk| ≤c^k, k = 1,2, . . . ,

niin ∞

X

k=1

|m_k| k! s^k ≤

∞

X

k=1

(cs)^k

k! < e^cs, kun s >0

ja X:n kertymäfunktio määritetään yksikäsitteisesti. Näin ollen, jos

P{|X| ≤ c} = 1 jollakin c > 0, niin kaikki X:n momentit ovat olemassa täyttäen ehdot |m_k| ≤ c^k, k ≥ 1 ja X:n kertymäfunktio on yksikäsitteisesti määritetty sen momenteista.

Esitetään vielä riittäviä ehtoja, joilla jono momentteja voi määrittää yk- sikäsitteisesti kertymäfunktion.

(i) Satunnaismuuttujan vaihteluväli on äärellinen.

(ii)^P^∞_k=1(m_2k)^−1/2k =∞, kun satunnaismuuttujan vaihteluväli on (−∞,∞).

Jos vaihteluväli on (0,∞), riittää ehdoksi ^P^∞_k=1(m_k)^−1/2k =∞.

(iii) lim_n→∞[(m_2n)^1/2n/2n] on äärellinen. [13, s. 92]

(22)

4.3 Momenttiepäyhtälöitä

Tässä kappaleessa johdetaan muutama epäyhtälö satunnaismuuttujan mo- menteille. Luvun päätulos on Lause 4.3 (sekä seuraus 4.4), joka antaa ylä- rajan häntätodennäköisyydelle (tail probability) jonkin satunnaismuuttujan momentin suhteen. Luku seuraa päälähdettä [13] sivuilta 95-100.

Lause 4.3. OlkoonX satunnaismuuttuja ja olkoonhsellainen, ettäh(X)on ei-negatiivinen satunnaismuuttuja. Jos E(h(X))on olemassa, niin jokaisella ε >0 pätee

(4.3) P{h(X)≥ε} ≤ E(h(X))

ε .

Todistus. Todistetaan tulos, kun X on diskreetti.

Olkoon P{X =x_k}=p_k, k = 1,2, . . . . Tällöin E(h(X)) =^X

k

h(x_k)p_k

= ^X

A

+^X

A^c

!

h(x_k)p_k, missä

A={k :h(x_k)≥ε}.

Nyt

E(h(X))≥^X

A

h(x_k)p_k≥ε^X

A

p_k

=εP{h(X)≥ε}.

Seuraus 4.4. Olkoon h(X) = |X|^r ja ε =K^r, missä r >0 ja K >0. Nyt

(4.4) P{|X| ≥K} ≤ E(|X|^r)

K^r .

Tätä kutsutaan Markovin epäyhtälöksi. Jos vielä määritetään, että h(X) = (X−µ)², ε=K²σ², saadaan Tsebyshevin epäyhtälö:

(4.5) P{|X−µ| ≥Kσ} ≤ 1

K², missä µ=E(X) ja σ² =var(X).

(23)

Huomautus 5. Jos halutaan olla tarkkoja kertymäfunktion määritelmän, F(x) =P{X ≤x}suhteen, voidaan kaava (4.3) muotoilla uudelleen seuraa- valla tavalla:

P{h(X)> ε}< E(h(X))

ε .

Sellaisille satunnaismuuttujille, joilla on äärellinen toisen asteen momentti, epäyhtälö (4.5) on tarkin ilmaisu, johon voidaan päästä.

Esimerkki 4.11. Olkoot

P{X = 0}= 1− 1

K², k K >1 ja vakio P{X =±1}= 1

2K²,

E(X) = 0, E(X²) = 1

K², σ = 1 K. Näin ollen

P{|X| ≥Kσ}=P{|X| ≥1}= 1 K², jolloin päästään yhtäsuuruuteen.

Esimerkki 4.12. Olkoon X:n tiheysfunktio f(x) =

( 1, kun 0< x < 1 0 muulloin.

Nyt

E(X) = 1

2, E(X²) = 1

3, var(X) = 1 3− 1

4 = 1 12 ja

P







|X− 1 2|<2

s 1 12







=P

(1 2− 1

√3 < X < 1 2+ 1

√3

)

= 1.

Tsebyshevin epäyhtälöstä saadaan vielä P







|X−1 2|<2

s 1 12







≥1− 1

4 = 0,75.

Kuvassa 1 (s. 24) verrataan epäyhtälön P ⁿ|X−¹₂| ≥k/√

12^o antamaa ylä- rajaa tarkkaan todennäköisyyteen.

Joissakin tapauksissa on mahdollista tarkentaa arviota vielä Tsebyshevin epäyhtälöstä, jos oletetaan, että korkeamman asteen momentteja on olemassa. Sitä varten tarvitaan seuraava lemma.

(24)

-

k

6

1 √

3 1

0

tarkka

yläraja

l l

ll

Kuva 1: Epäyhtälön antama yläraja sekä tarkka todennäköisyys piirrettynä samaan kuvaajaan.

Lemma 4.5. Olkoon X satunnaismuuttuja siten, ettäE(X) = 0 ja var(X) =σ². Tällöin

(4.6) P{X ≥x} ≤ σ²

σ² +x², jos x >0 ja

(4.7) P{X ≥x} ≥ x²

σ²+x², jos x <0.

Todistus. Olkoon h(t) = (t+c)², c > 0. Silloinh(t)≥0 kaikilla t:n arvoilla ja

h(t)≥(x+c)², kunt ≥x >0.

Tästä seuraa, että

P{X ≥x} ≤P{h(X)≥(x+c)²}

≤ E((X+c)²)

(x+c)² aina, kun c >0 jax >0.

Kaavan (4.7) todistus menee vastaavalla tavalla.

Lause 4.6. Olkoon E(|X|⁴)<∞ ja olkoot E(X) = 0, E(X²) =σ². Silloin P{|X| ≥Kσ} ≤ µ₄−σ⁴

µ₄+σ⁴K⁴−2K²σ⁴, kun K >1, missä µ₄ =E(X⁴).

(25)

Todistus. Sijoitetaan todistusta varten osamäärän (X² − σ²)/(K²σ² −σ²) tilalle X ja asetetaan x= 1 kaavaan (4.6). Siten saadaan, että

P{X²−σ² ≥K²σ²−σ²} ≤ var[(X²−σ²)/(K²σ²−σ²)]

1 +var[(X²−σ²)/(K²σ²−σ²)]

= µ₄−σ⁴

µ₄(K²−1)²+µ₄−σ⁴

= µ₄ −σ⁴

µ₄+σ⁴K⁴−2K²σ⁴, K >1.

Esimerkki 4.13. Olkoon X tasaisesti jakautunut ja sen tiheysfunktio f(x) =

( 1, kun 0< x < 1 0 muulloin.

Tällöin

E(X) = 1

2, var(X) = 1

12, µ4 =E

X− 1 2

2!

= 1 80 ja

P







|X−1 2| ≥2

s 1 12







≤

1 80 −₁₄₄¹

1

80 +₁₄₄¹ ·16−8₁₄₄¹ = 4 49, mistä saadaan

P







|X− 1 2|<2

s 1 12







≥ 45

49 ≈0,92.

Tämä on paljon tarkempi arvio, kuin mitä saadaan Tsebyshevin epäyhtälöstä esimerkissä 4.12.

Lause 4.7(Ljapunovin epäyhtälö). Olkoonβ_n=E(|X|ⁿ)<∞. Nyt saadaan β_k−1^1/(k−1) ≤β_k^1/k,

kun k saa mielivaltaisen arvon väliltä 2≤k ≤n.

Todistus. Käsitellään neliömuotoa:

Q(u, v) =

∞

Z

−∞

(u|x|^(k−1)/2+v|x|^(k+1)/2)²f(x) dx,

(26)

missä ollaan oletettu, ettäX on jatkuva ja f on sen tiheysfunktio. Tässä on siis

Q(u, v) =u²βk−1+ 2uvβ_k+β_k+1v². Selvästikin Q≥0 kaikilla u, v ∈R. Tästä seuraa, että

βk−1 β_k β_k β_k+1

≥0, mikä implikoi, että

β_k^2k ≤β_k−1^k β_k+1^k . Näin ollen

β₁² ≤β₀¹β₂¹, β₂⁴ ≤β₁²β₃², . . . , β_n−1²⁽ⁿ⁻¹⁾ ≤β_n−2ⁿ⁻¹β_nⁿ⁻¹, missä β₀ = 1. Kun otetaan k−1 peräkkäisen tällaisen tulo, saadaan

β_k−1^k ≤β_k^k−1 tai β_k−1^1/(k−1) ≤β_k^1/k. Tästä seuraa, että

β₁ ≤β₂^1/2 ≤β₃^1/3 ≤ · · · ≤β_n^1/n. Yhtäsuuruus on voimassa, jos ja vain jos

β_k^1/k =β_k+1^1/(k+1) kun k = 1,2, . . . .

Toisin sanoen{β_k^1/k}on yhden vakion lukujono, mikä on totta jos ja vain jos

|X| on degeneroitunut. Siis jollain c:n arvolla P{|X|=c}= 1.

(vrt. [13, s. 95-100])

4.4 Riippumattomien muuttujien summa

Tarkastellaan lopuksi vielä tilanteita, joissa on mukana kaksi tai useampi satunnaismuuttuja. Miten momentit generoiva funktio sopii tällöin käytettä- väksi?

Lause 4.8. OlkootXjaY riippumattomia satunnaismuuttujia, joiden MGF:t ovat M_X(s) ja M_Y(s). Tällöin

M_X_+Y(s) = M_X(s)·M_Y(s)