TeoremaCentraldoLimite

(1)

Notas de aula de Inferˆ

encia Estat´ıstica

Centro de Matemática, Computa¸cão e Cogni¸cão Universidade Federal do ABC

Professor Roberto Venegeroles

Aula 3: Teorema Central do Limite

1. Convergˆencia em distribui¸c˜ao

Defini¸cão: Seja {Xn}n≥1 uma seqüencia de variáveis aleatórias definidas num mesmo

espa¸co de probabilidade. Dizemos que Xn converge para X em distribui¸c˜ao, denotando por

Xn−→ X, seD

P[Xn≤ x] → P[X ≤ x], quando n→ ∞

para todo ponto x em que FX(x) = P[X ≤ x] ´e continua.

2. Caracteriza¸cão da convergência em distribui¸cão

Teorema de caracteriza¸cão:Seja_{Xn}n≥1 uma seqüência de variáveis aleatórias com

fun¸c˜oes geradoras de momentos correspondentes {Mn(s)}n≥1, que existem para |s| < s0.

Suponhamos que lim_n→∞Mn(s) = M (s) numa vizinhan¸ca da origem para s, onde M (s) ´e a

fun¸cão geradora de momentos de uma variável aleatória X. Então Xn −→ X.D

Exemplo 1: Seja _{Xn}n≥1 uma seqüência de variáveis aleatórias independentes com

Xn∼ N

¡_2n+3

n+5, n sin(1/n)¢. Temos ent˜ao que Xn D

−→ X. De fato, se Xn∼ N

¡_2n+3

n+5, n sin(1/n)

¢ então sua fun¸cão geradora de momentos será dada por Mn(s) = exp{s

¡_2n+3

n+5¢ +n sin(1/n) s2

2}.

Notando que lim_n→∞ 2n+3_n+5 = 2, lim_n→∞n sin(1/n) = 1 e que a fun¸cão exponencial é continua temos que lim_n→∞Mn(s) = M (s) = exp{2s + s2/2} é fun¸cão geradora de momentos de uma

vari´avel aleat´oria X _{∼ N (2, 1). Concluimos portanto que} Xn −→ N (2, 1).D

3. Teorema Central do Limite

O teorema central do limite é um dos resultados mais notáveis da teoria da probabili-dade, com profundas conseqüências na teoria estat´ıstica. Em linhas gerais, versão clássica deste teorema afirma que a soma de uma grande quantidade de observa¸cões independentes e

(2)

igualmente distribu´ıdas (iid) tem, sob certas condi¸cões gerais, uma distribui¸cão aproximada-mente normal. Em particular, tal aproxima¸cão é melhorada notavelaproximada-mente com o aumento do número de observa¸cões.

Teorema Central do Limite: Seja_{Xn}n≥1 uma seqüencia de variáveis aleatórias iid

com media µ e variˆancia σ2 _{finitas. Considere a soma S}

n = X1+· · · + Xn. Teremos ent˜ao

Sn− nµ

σ√n

D

−→ N (0, 1). (1)

Equivalentemente, para qualquer x_{∈ R:} lim n→∞P · Sn− nµ σ√n ≤ x ¸ = √1 2π Z x −∞ e−s2_/2 ds . (2)

Antes de demonstrar o teorema central, consideremos o seguinte lema:

Lema: Para um conjunto de vari´aveis X1, X2, . . . , Xn que s˜ao independentes temos

V ar[X1+ X2+ . . . + Xn] = V ar[X1] + V ar[X2] + . . . + V ar[Xn]. (3)

Demonstra¸cão do lema: Pode ser feita por indu¸cão, come¸cando pela verifica¸cão do lema para duas variáveis X1 e X2:

V ar[X1+ X2] = E[(X1+ X2)2]− E2[X1+ X2]

= E[X₁2+ 2X1X2+ X22]− (E[X1] + E[X2])2

= E[X₁2] + E[X₂2] + 2E[X1]E[X2]− 4E2[X1] (independˆencia)

= E[X₁2] + E[X₂2] + 2E2[X1]− 4E2[X1]

= E[X₁2]_{− E}2[X1] + E[X22]− E2[X2]

= V ar[X1] + V ar[X2].

Para mais de duas vari´aveis basta tomarmos o par X1 e X2′ = X2+ . . . + Xn, seguindo uma

demonstra¸c˜ao em cadeia.

Demonstra¸cão do Teorema: Vamos definir a seqüencia de variáveis _{Yn}n≥1 para as

quais temos

Yn=

Sn− nµ

σ√n . (4)

´

E importante observar que Ynj´a assume uma forma pr´e-padronizada uma vez que E[Sn] = nµ

e V ar[Sn] = nσ2 (lema). Sua fun¸c˜ao geradora ser´a

Mn(s)≡ MYn(s) = E[e sYn ] = E[es(Sn−nµ)/σ √ n_]

= E[es(X1−µ)/σ√n_{] E[e}s(X2−µ)/σ√n_{] . . . E[e}s(Xn−µ)/σ

√ n_]

= nE[es(X1−µ)/σ√n_]

on

(3)

Consideremos agora uma expans˜ao de Taylor do valor esperado (5): E[es(X1−µ)/σ√n_{] = E} · 1 + s(X1− µ) σ√n + s2_(X 1− µ)2 2σ2_n + R2(sY1) ¸ = E[1] + s σ√nE[X1 − µ] + s2 2nσ2E[(X1 − µ) 2_{] + E[R} 2(sY1)] = 1 + s σ√n0 + s2 2nσ2 σ 2_{+ E[R} 2(sY1)] = 1 + 1 n µ s2 2 + E[nR2(sY1)] ¶ . (6)

Note que, para o resto de Lagrange R2, temos o seguinte limite:

lim n→∞nR2(sY1) = n→∞lim R2[s(X1− µ)/σ√n] 1/n ∝ lim t→0 R2(t) t2 = 0, (7)

para o qual tomamos t_{∝ 1/}√n. Por fim, lembrando que lim n→∞ ³ 1 + x n ´n = ex, (8)

conclu´ımos a partir de (5) e (6) que lim

n→∞Mn(s) = e s2_/2

(9) enquanto que o teorema de caracteriza¸c˜ao garante a convergˆencia:

Sn− nµ

n√σ

D

−→ N (0, 1) . (10) Exemplo 2: Vamos considerar a aproxima¸cão normal da distribui¸cão binomial. Lem-brando que a soma de n variáveis X1, X2, . . . , Xn de Bernoulli iid de parâmetro p resulta

numa binomial X ∼ B(n, p), onde X = X1+ X2+ . . . + Xn (notas de aula 2), deduziremos

que, para n grande, X tem aproximadamente distribui¸c˜ao normal com parˆametros µ = np e σ2 _{= npq, q = 1}_{− p:} MYn(s) = E[e sYn ] = E[es(x−np)/√npq] = e−snp/√npq_E[esx/√npq_] = e−snp/√npq n X x=0 esx/√npqµn x ¶ pxqn−x = e−snp/√npq n X x=0 µn x ¶ (pes/√npq)xqn−x = e−snp/√npq_{(q + pe}s/√npq₎n = (qe−sp/√npq_{+ pe}sq/√npq₎n

(4)

Considerando a expans˜ao de Taylor: qe−sp/√npq_{+ pe}sq/√npq _{= q} µ 1− √sp_npq + s 2_p2 2npq + . . . ¶ + p µ 1 + _√sq npq + s2_q2 2npq + . . . ¶ = p + q + pq(p + q)s 2 2npq + . . . = 1 + s2 2n + . . . encontraremos a geradora da normal padronizada:

lim

n→∞MYn(s) = e

s2_/2

. (11)

Exemplo 3: Um estudo de uma prefeitura indica que 30% das crian¸cas daquela cidade tˆem deficit de aten¸c˜ao na escola. Numa amostra de 200 crian¸cas, qual a probabilidade de que ao menos 50 crian¸cas tenham esse problema?

Vamos considerar que todas as crian¸cas tˆem a mesma chance de ter esse problema. Definindo a vari´avel de Bernoulli Xj:

Xj =½ 1 se a j−´esima crian¸ca tem esse problema.

0 c.c.

temos que X = X1+· · · + X200∼ B(200, 0.30). Ent˜ao, a probabilidade procurada ´e

P[X ≥ 50] = 200 X k=50 µ200 k ¶ 0.3k 0.7200−k (12)

ou seja, um cáculo dif´ıcil de ser realizado. Consideremos então a aproxima¸cão normal para a qual E[X] = 200× 0.3 = 60 e V ar(X) = 200 × 0.3 × 0.7 = 42. Dessa forma, aproximamos a distribui¸cão de X pela distribui¸cão de uma variável aleatória Y ∼ N (0, 1):

Pbinomial[X ≥ 50] ≈ Pnormal · Y ≥ 50√− 60 42 ¸ = Pnormal[Y ≥ −1, 42] = 0.940.

4. Teorema Central do Limite sem supor distribui¸c˜oes idˆenticas

Existem muitas situa¸cões de interesse prático em que as variáveis em questão são in-dependentes embora não necessariamente identicamente distribu´ıdas. Neste casso temos o seguinte resultado que é útil em várias situa¸cões:

Teorema: Seja _{Xn}_n≥1 uma seqüencia de variáveis aleatórias independentes e Sn =

Pn

j=1Xj. Para cada j, sejam µj = E[Xj] e σj2 = V ar(Xj), e denotemos por mn =Pn_j=1µj e

s2 n =

Pn

(5)

a) s2

n → ∞ quando n → ∞,

b) existe uma constante M tal que P[|Xj| ≤ M] = 1 para todo j.

Ent˜ao

Sn− mn

sn D

−→ N (0, 1), (13)

ou seja, para qualquer x_{∈ R,} lim n→∞P · Sn− mn sn ≤ x ¸ = √1 2π Z x −∞ e−s2_/2 ds . (14)

Exemplo 4: Considere uma seqüência de ensaios de Bernoulli independentes com prob-abilidade pi de sucesso no i−ésimo ensaio. Isto é, a seqüência (Xi)_i≥1 é independente e

Xi ∼ Ber(pi). Se P∞i=1pi(1− pi) =∞ ent˜ao

Pn i=1Xi− Pn i=1pi pPn i=1pi(1− pi) D −→ N (0, 1), (15) ou seja, para qualquer x∈ R,

lim n→∞P " Sn−Pni=1pi pPn i=1pi(1− pi) ≤ x # = √1 2π Z x −∞ e−s2_/2 ds . (16)

(6)

Lista de Exerc´ıcios

1) Seja {Yn}_n≥1 uma seqüência de variáveis aleatórias iid com Yn ∼ Poisson(nθ) para

θ > 0. Mostre que _√ θ √ n µ Yn θ − n ¶ D −→ N (0, 1).

2) Suponha que Xn∼ N ¡0,_n1¢ para n ≥ 1. Mostre que Xn−→ X ≡ 0 .D

3) Suponha que um programa de computador tem n = 100 p´aginas de c´odigos. Seja Xi

o número de erros na i−ésima página. Suponha que as variáveis aleatórias Xi são do

tipo Poisson de m´edia 1 e independentes. Seja Y = Pn

j=1Xj o n´umero total de erros.

Utilize o teorema central do limite para aproximar P[Y < 90].

4) Uma marca de chocolate faz a seguinte promo¸cão: alguns dos pacotes premiados in-cluem vales que podem ser trocados camisetas. O número de pacotes premiados que se vendem ao dia em uma loja é uma variável aleatória com distribui¸cão Poisson de parâmetro λ = 0.3. Estime a probabilidade de que em 120 dias se vendam nessa loja mais de 30 pacotes premiados.