Notas de aula de Inferˆ
encia Estat´ıstica
Centro de Matem´atica, Computa¸c˜ao e Cogni¸c˜ao Universidade Federal do ABC
Professor Roberto Venegeroles
Aula 3: Teorema Central do Limite
1. Convergˆencia em distribui¸c˜ao
Defini¸c˜ao: Seja {Xn}n≥1 uma seq¨uencia de vari´aveis aleat´orias definidas num mesmo
espa¸co de probabilidade. Dizemos que Xn converge para X em distribui¸c˜ao, denotando por
Xn−→ X, seD
P[Xn≤ x] → P[X ≤ x], quando n→ ∞
para todo ponto x em que FX(x) = P[X ≤ x] ´e continua.
2. Caracteriza¸c˜ao da convergˆencia em distribui¸c˜ao
Teorema de caracteriza¸c˜ao:Seja{Xn}n≥1 uma seq¨uˆencia de vari´aveis aleat´orias com
fun¸c˜oes geradoras de momentos correspondentes {Mn(s)}n≥1, que existem para |s| < s0.
Suponhamos que limn→∞Mn(s) = M (s) numa vizinhan¸ca da origem para s, onde M (s) ´e a
fun¸c˜ao geradora de momentos de uma vari´avel aleat´oria X. Ent˜ao Xn −→ X.D
Exemplo 1: Seja {Xn}n≥1 uma seq¨uˆencia de vari´aveis aleat´orias independentes com
Xn∼ N
¡2n+3
n+5, n sin(1/n)¢. Temos ent˜ao que Xn D
−→ X. De fato, se Xn∼ N
¡2n+3
n+5, n sin(1/n)
¢ ent˜ao sua fun¸c˜ao geradora de momentos ser´a dada por Mn(s) = exp{s
¡2n+3
n+5¢ +n sin(1/n) s2
2}.
Notando que limn→∞ 2n+3n+5 = 2, limn→∞n sin(1/n) = 1 e que a fun¸c˜ao exponencial ´e continua temos que limn→∞Mn(s) = M (s) = exp{2s + s2/2} ´e fun¸c˜ao geradora de momentos de uma
vari´avel aleat´oria X ∼ N (2, 1). Concluimos portanto que Xn −→ N (2, 1).D
3. Teorema Central do Limite
O teorema central do limite ´e um dos resultados mais not´aveis da teoria da probabili-dade, com profundas conseq¨uˆencias na teoria estat´ıstica. Em linhas gerais, vers˜ao cl´assica deste teorema afirma que a soma de uma grande quantidade de observa¸c˜oes independentes e
igualmente distribu´ıdas (iid) tem, sob certas condi¸c˜oes gerais, uma distribui¸c˜ao aproximada-mente normal. Em particular, tal aproxima¸c˜ao ´e melhorada notavelaproximada-mente com o aumento do n´umero de observa¸c˜oes.
Teorema Central do Limite: Seja{Xn}n≥1 uma seq¨uencia de vari´aveis aleat´orias iid
com media µ e variˆancia σ2 finitas. Considere a soma S
n = X1+· · · + Xn. Teremos ent˜ao
Sn− nµ
σ√n
D
−→ N (0, 1). (1)
Equivalentemente, para qualquer x∈ R: lim n→∞P · Sn− nµ σ√n ≤ x ¸ = √1 2π Z x −∞ e−s2/2 ds . (2)
Antes de demonstrar o teorema central, consideremos o seguinte lema:
Lema: Para um conjunto de vari´aveis X1, X2, . . . , Xn que s˜ao independentes temos
V ar[X1+ X2+ . . . + Xn] = V ar[X1] + V ar[X2] + . . . + V ar[Xn]. (3)
Demonstra¸c˜ao do lema: Pode ser feita por indu¸c˜ao, come¸cando pela verifica¸c˜ao do lema para duas vari´aveis X1 e X2:
V ar[X1+ X2] = E[(X1+ X2)2]− E2[X1+ X2]
= E[X12+ 2X1X2+ X22]− (E[X1] + E[X2])2
= E[X12] + E[X22] + 2E[X1]E[X2]− 4E2[X1] (independˆencia)
= E[X12] + E[X22] + 2E2[X1]− 4E2[X1]
= E[X12]− E2[X1] + E[X22]− E2[X2]
= V ar[X1] + V ar[X2].
Para mais de duas vari´aveis basta tomarmos o par X1 e X2′ = X2+ . . . + Xn, seguindo uma
demonstra¸c˜ao em cadeia.
Demonstra¸c˜ao do Teorema: Vamos definir a seq¨uencia de vari´aveis {Yn}n≥1 para as
quais temos
Yn=
Sn− nµ
σ√n . (4)
´
E importante observar que Ynj´a assume uma forma pr´e-padronizada uma vez que E[Sn] = nµ
e V ar[Sn] = nσ2 (lema). Sua fun¸c˜ao geradora ser´a
Mn(s)≡ MYn(s) = E[e sYn ] = E[es(Sn−nµ)/σ √ n]
= E[es(X1−µ)/σ√n] E[es(X2−µ)/σ√n] . . . E[es(Xn−µ)/σ
√ n]
= nE[es(X1−µ)/σ√n]
on
Consideremos agora uma expans˜ao de Taylor do valor esperado (5): E[es(X1−µ)/σ√n] = E · 1 + s(X1− µ) σ√n + s2(X 1− µ)2 2σ2n + R2(sY1) ¸ = E[1] + s σ√nE[X1 − µ] + s2 2nσ2E[(X1 − µ) 2] + E[R 2(sY1)] = 1 + s σ√n0 + s2 2nσ2 σ 2+ E[R 2(sY1)] = 1 + 1 n µ s2 2 + E[nR2(sY1)] ¶ . (6)
Note que, para o resto de Lagrange R2, temos o seguinte limite:
lim n→∞nR2(sY1) = n→∞lim R2[s(X1− µ)/σ√n] 1/n ∝ lim t→0 R2(t) t2 = 0, (7)
para o qual tomamos t∝ 1/√n. Por fim, lembrando que lim n→∞ ³ 1 + x n ´n = ex, (8)
conclu´ımos a partir de (5) e (6) que lim
n→∞Mn(s) = e s2/2
(9) enquanto que o teorema de caracteriza¸c˜ao garante a convergˆencia:
Sn− nµ
n√σ
D
−→ N (0, 1) . (10) Exemplo 2: Vamos considerar a aproxima¸c˜ao normal da distribui¸c˜ao binomial. Lem-brando que a soma de n vari´aveis X1, X2, . . . , Xn de Bernoulli iid de parˆametro p resulta
numa binomial X ∼ B(n, p), onde X = X1+ X2+ . . . + Xn (notas de aula 2), deduziremos
que, para n grande, X tem aproximadamente distribui¸c˜ao normal com parˆametros µ = np e σ2 = npq, q = 1− p: MYn(s) = E[e sYn ] = E[es(x−np)/√npq] = e−snp/√npqE[esx/√npq] = e−snp/√npq n X x=0 esx/√npqµn x ¶ pxqn−x = e−snp/√npq n X x=0 µn x ¶ (pes/√npq)xqn−x = e−snp/√npq(q + pes/√npq)n = (qe−sp/√npq+ pesq/√npq)n
Considerando a expans˜ao de Taylor: qe−sp/√npq+ pesq/√npq = q µ 1− √spnpq + s 2p2 2npq + . . . ¶ + p µ 1 + √sq npq + s2q2 2npq + . . . ¶ = p + q + pq(p + q)s 2 2npq + . . . = 1 + s2 2n + . . . encontraremos a geradora da normal padronizada:
lim
n→∞MYn(s) = e
s2/2
. (11)
Exemplo 3: Um estudo de uma prefeitura indica que 30% das crian¸cas daquela cidade tˆem deficit de aten¸c˜ao na escola. Numa amostra de 200 crian¸cas, qual a probabilidade de que ao menos 50 crian¸cas tenham esse problema?
Vamos considerar que todas as crian¸cas tˆem a mesma chance de ter esse problema. Definindo a vari´avel de Bernoulli Xj:
Xj =½ 1 se a j−´esima crian¸ca tem esse problema.
0 c.c.
temos que X = X1+· · · + X200∼ B(200, 0.30). Ent˜ao, a probabilidade procurada ´e
P[X ≥ 50] = 200 X k=50 µ200 k ¶ 0.3k 0.7200−k (12)
ou seja, um c´aculo dif´ıcil de ser realizado. Consideremos ent˜ao a aproxima¸c˜ao normal para a qual E[X] = 200× 0.3 = 60 e V ar(X) = 200 × 0.3 × 0.7 = 42. Dessa forma, aproximamos a distribui¸c˜ao de X pela distribui¸c˜ao de uma vari´avel aleat´oria Y ∼ N (0, 1):
Pbinomial[X ≥ 50] ≈ Pnormal · Y ≥ 50√− 60 42 ¸ = Pnormal[Y ≥ −1, 42] = 0.940.
4. Teorema Central do Limite sem supor distribui¸c˜oes idˆenticas
Existem muitas situa¸c˜oes de interesse pr´atico em que as vari´aveis em quest˜ao s˜ao in-dependentes embora n˜ao necessariamente identicamente distribu´ıdas. Neste casso temos o seguinte resultado que ´e ´util em v´arias situa¸c˜oes:
Teorema: Seja {Xn}n≥1 uma seq¨uencia de vari´aveis aleat´orias independentes e Sn =
Pn
j=1Xj. Para cada j, sejam µj = E[Xj] e σj2 = V ar(Xj), e denotemos por mn =Pnj=1µj e
s2 n =
Pn
a) s2
n → ∞ quando n → ∞,
b) existe uma constante M tal que P[|Xj| ≤ M] = 1 para todo j.
Ent˜ao
Sn− mn
sn D
−→ N (0, 1), (13)
ou seja, para qualquer x∈ R, lim n→∞P · Sn− mn sn ≤ x ¸ = √1 2π Z x −∞ e−s2/2 ds . (14)
Exemplo 4: Considere uma seq¨uˆencia de ensaios de Bernoulli independentes com prob-abilidade pi de sucesso no i−´esimo ensaio. Isto ´e, a seq¨uˆencia (Xi)i≥1 ´e independente e
Xi ∼ Ber(pi). Se P∞i=1pi(1− pi) =∞ ent˜ao
Pn i=1Xi− Pn i=1pi pPn i=1pi(1− pi) D −→ N (0, 1), (15) ou seja, para qualquer x∈ R,
lim n→∞P " Sn−Pni=1pi pPn i=1pi(1− pi) ≤ x # = √1 2π Z x −∞ e−s2/2 ds . (16)
Lista de Exerc´ıcios
1) Seja {Yn}n≥1 uma seq¨uˆencia de vari´aveis aleat´orias iid com Yn ∼ Poisson(nθ) para
θ > 0. Mostre que √ θ √ n µ Yn θ − n ¶ D −→ N (0, 1).
2) Suponha que Xn∼ N ¡0,n1¢ para n ≥ 1. Mostre que Xn−→ X ≡ 0 .D
3) Suponha que um programa de computador tem n = 100 p´aginas de c´odigos. Seja Xi
o n´umero de erros na i−´esima p´agina. Suponha que as vari´aveis aleat´orias Xi s˜ao do
tipo Poisson de m´edia 1 e independentes. Seja Y = Pn
j=1Xj o n´umero total de erros.
Utilize o teorema central do limite para aproximar P[Y < 90].
4) Uma marca de chocolate faz a seguinte promo¸c˜ao: alguns dos pacotes premiados in-cluem vales que podem ser trocados camisetas. O n´umero de pacotes premiados que se vendem ao dia em uma loja ´e uma vari´avel aleat´oria com distribui¸c˜ao Poisson de parˆametro λ = 0.3. Estime a probabilidade de que em 120 dias se vendam nessa loja mais de 30 pacotes premiados.