• Nenhum resultado encontrado

TeoremaCentraldoLimite

N/A
N/A
Protected

Academic year: 2021

Share "TeoremaCentraldoLimite"

Copied!
6
0
0

Texto

(1)

Notas de aula de Inferˆ

encia Estat´ıstica

Centro de Matem´atica, Computa¸c˜ao e Cogni¸c˜ao Universidade Federal do ABC

Professor Roberto Venegeroles

Aula 3: Teorema Central do Limite

1. Convergˆencia em distribui¸c˜ao

Defini¸c˜ao: Seja {Xn}n≥1 uma seq¨uencia de vari´aveis aleat´orias definidas num mesmo

espa¸co de probabilidade. Dizemos que Xn converge para X em distribui¸c˜ao, denotando por

Xn−→ X, seD

P[Xn≤ x] → P[X ≤ x], quando n→ ∞

para todo ponto x em que FX(x) = P[X ≤ x] ´e continua.

2. Caracteriza¸c˜ao da convergˆencia em distribui¸c˜ao

Teorema de caracteriza¸c˜ao:Seja{Xn}n≥1 uma seq¨uˆencia de vari´aveis aleat´orias com

fun¸c˜oes geradoras de momentos correspondentes {Mn(s)}n≥1, que existem para |s| < s0.

Suponhamos que limn→∞Mn(s) = M (s) numa vizinhan¸ca da origem para s, onde M (s) ´e a

fun¸c˜ao geradora de momentos de uma vari´avel aleat´oria X. Ent˜ao Xn −→ X.D

Exemplo 1: Seja {Xn}n≥1 uma seq¨uˆencia de vari´aveis aleat´orias independentes com

Xn∼ N

¡2n+3

n+5, n sin(1/n)¢. Temos ent˜ao que Xn D

−→ X. De fato, se Xn∼ N

¡2n+3

n+5, n sin(1/n)

¢ ent˜ao sua fun¸c˜ao geradora de momentos ser´a dada por Mn(s) = exp{s

¡2n+3

n+5¢ +n sin(1/n) s2

2}.

Notando que limn→∞ 2n+3n+5 = 2, limn→∞n sin(1/n) = 1 e que a fun¸c˜ao exponencial ´e continua temos que limn→∞Mn(s) = M (s) = exp{2s + s2/2} ´e fun¸c˜ao geradora de momentos de uma

vari´avel aleat´oria X ∼ N (2, 1). Concluimos portanto que Xn −→ N (2, 1).D

3. Teorema Central do Limite

O teorema central do limite ´e um dos resultados mais not´aveis da teoria da probabili-dade, com profundas conseq¨uˆencias na teoria estat´ıstica. Em linhas gerais, vers˜ao cl´assica deste teorema afirma que a soma de uma grande quantidade de observa¸c˜oes independentes e

(2)

igualmente distribu´ıdas (iid) tem, sob certas condi¸c˜oes gerais, uma distribui¸c˜ao aproximada-mente normal. Em particular, tal aproxima¸c˜ao ´e melhorada notavelaproximada-mente com o aumento do n´umero de observa¸c˜oes.

Teorema Central do Limite: Seja{Xn}n≥1 uma seq¨uencia de vari´aveis aleat´orias iid

com media µ e variˆancia σ2 finitas. Considere a soma S

n = X1+· · · + Xn. Teremos ent˜ao

Sn− nµ

σ√n

D

−→ N (0, 1). (1)

Equivalentemente, para qualquer x∈ R: lim n→∞P · Sn− nµ σ√n ≤ x ¸ = √1 2π Z x −∞ e−s2/2 ds . (2)

Antes de demonstrar o teorema central, consideremos o seguinte lema:

Lema: Para um conjunto de vari´aveis X1, X2, . . . , Xn que s˜ao independentes temos

V ar[X1+ X2+ . . . + Xn] = V ar[X1] + V ar[X2] + . . . + V ar[Xn]. (3)

Demonstra¸c˜ao do lema: Pode ser feita por indu¸c˜ao, come¸cando pela verifica¸c˜ao do lema para duas vari´aveis X1 e X2:

V ar[X1+ X2] = E[(X1+ X2)2]− E2[X1+ X2]

= E[X12+ 2X1X2+ X22]− (E[X1] + E[X2])2

= E[X12] + E[X22] + 2E[X1]E[X2]− 4E2[X1] (independˆencia)

= E[X12] + E[X22] + 2E2[X1]− 4E2[X1]

= E[X12]− E2[X1] + E[X22]− E2[X2]

= V ar[X1] + V ar[X2].

Para mais de duas vari´aveis basta tomarmos o par X1 e X2′ = X2+ . . . + Xn, seguindo uma

demonstra¸c˜ao em cadeia.

Demonstra¸c˜ao do Teorema: Vamos definir a seq¨uencia de vari´aveis {Yn}n≥1 para as

quais temos

Yn=

Sn− nµ

σ√n . (4)

´

E importante observar que Ynj´a assume uma forma pr´e-padronizada uma vez que E[Sn] = nµ

e V ar[Sn] = nσ2 (lema). Sua fun¸c˜ao geradora ser´a

Mn(s)≡ MYn(s) = E[e sYn ] = E[es(Sn−nµ)/σ √ n]

= E[es(X1−µ)/σ√n] E[es(X2−µ)/σ√n] . . . E[es(Xn−µ)/σ

√ n]

= nE[es(X1−µ)/σ√n]

on

(3)

Consideremos agora uma expans˜ao de Taylor do valor esperado (5): E[es(X1−µ)/σ√n] = E · 1 + s(X1− µ) σ√n + s2(X 1− µ)2 2σ2n + R2(sY1) ¸ = E[1] + s σ√nE[X1 − µ] + s2 2nσ2E[(X1 − µ) 2] + E[R 2(sY1)] = 1 + s σ√n0 + s2 2nσ2 σ 2+ E[R 2(sY1)] = 1 + 1 n µ s2 2 + E[nR2(sY1)] ¶ . (6)

Note que, para o resto de Lagrange R2, temos o seguinte limite:

lim n→∞nR2(sY1) = n→∞lim R2[s(X1− µ)/σ√n] 1/n ∝ lim t→0 R2(t) t2 = 0, (7)

para o qual tomamos t∝ 1/√n. Por fim, lembrando que lim n→∞ ³ 1 + x n ´n = ex, (8)

conclu´ımos a partir de (5) e (6) que lim

n→∞Mn(s) = e s2/2

(9) enquanto que o teorema de caracteriza¸c˜ao garante a convergˆencia:

Sn− nµ

n√σ

D

−→ N (0, 1) . (10) Exemplo 2: Vamos considerar a aproxima¸c˜ao normal da distribui¸c˜ao binomial. Lem-brando que a soma de n vari´aveis X1, X2, . . . , Xn de Bernoulli iid de parˆametro p resulta

numa binomial X ∼ B(n, p), onde X = X1+ X2+ . . . + Xn (notas de aula 2), deduziremos

que, para n grande, X tem aproximadamente distribui¸c˜ao normal com parˆametros µ = np e σ2 = npq, q = 1− p: MYn(s) = E[e sYn ] = E[es(x−np)/√npq] = e−snp/√npqE[esx/√npq] = e−snp/√npq n X x=0 esx/√npqµn x ¶ pxqn−x = e−snp/√npq n X x=0 µn x ¶ (pes/√npq)xqn−x = e−snp/√npq(q + pes/√npq)n = (qe−sp/√npq+ pesq/√npq)n

(4)

Considerando a expans˜ao de Taylor: qe−sp/√npq+ pesq/√npq = q µ 1− √spnpq + s 2p2 2npq + . . . ¶ + p µ 1 + sq npq + s2q2 2npq + . . . ¶ = p + q + pq(p + q)s 2 2npq + . . . = 1 + s2 2n + . . . encontraremos a geradora da normal padronizada:

lim

n→∞MYn(s) = e

s2/2

. (11)

Exemplo 3: Um estudo de uma prefeitura indica que 30% das crian¸cas daquela cidade tˆem deficit de aten¸c˜ao na escola. Numa amostra de 200 crian¸cas, qual a probabilidade de que ao menos 50 crian¸cas tenham esse problema?

Vamos considerar que todas as crian¸cas tˆem a mesma chance de ter esse problema. Definindo a vari´avel de Bernoulli Xj:

Xj =½ 1 se a j−´esima crian¸ca tem esse problema.

0 c.c.

temos que X = X1+· · · + X200∼ B(200, 0.30). Ent˜ao, a probabilidade procurada ´e

P[X ≥ 50] = 200 X k=50 µ200 k ¶ 0.3k 0.7200−k (12)

ou seja, um c´aculo dif´ıcil de ser realizado. Consideremos ent˜ao a aproxima¸c˜ao normal para a qual E[X] = 200× 0.3 = 60 e V ar(X) = 200 × 0.3 × 0.7 = 42. Dessa forma, aproximamos a distribui¸c˜ao de X pela distribui¸c˜ao de uma vari´avel aleat´oria Y ∼ N (0, 1):

Pbinomial[X ≥ 50] ≈ Pnormal · Y ≥ 50√− 60 42 ¸ = Pnormal[Y ≥ −1, 42] = 0.940.

4. Teorema Central do Limite sem supor distribui¸c˜oes idˆenticas

Existem muitas situa¸c˜oes de interesse pr´atico em que as vari´aveis em quest˜ao s˜ao in-dependentes embora n˜ao necessariamente identicamente distribu´ıdas. Neste casso temos o seguinte resultado que ´e ´util em v´arias situa¸c˜oes:

Teorema: Seja {Xn}n≥1 uma seq¨uencia de vari´aveis aleat´orias independentes e Sn =

Pn

j=1Xj. Para cada j, sejam µj = E[Xj] e σj2 = V ar(Xj), e denotemos por mn =Pnj=1µj e

s2 n =

Pn

(5)

a) s2

n → ∞ quando n → ∞,

b) existe uma constante M tal que P[|Xj| ≤ M] = 1 para todo j.

Ent˜ao

Sn− mn

sn D

−→ N (0, 1), (13)

ou seja, para qualquer x∈ R, lim n→∞P · Sn− mn sn ≤ x ¸ = √1 2π Z x −∞ e−s2/2 ds . (14)

Exemplo 4: Considere uma seq¨uˆencia de ensaios de Bernoulli independentes com prob-abilidade pi de sucesso no i−´esimo ensaio. Isto ´e, a seq¨uˆencia (Xi)i≥1 ´e independente e

Xi ∼ Ber(pi). Se P∞i=1pi(1− pi) =∞ ent˜ao

Pn i=1Xi− Pn i=1pi pPn i=1pi(1− pi) D −→ N (0, 1), (15) ou seja, para qualquer x∈ R,

lim n→∞P " Sn−Pni=1pi pPn i=1pi(1− pi) ≤ x # = √1 2π Z x −∞ e−s2/2 ds . (16)

(6)

Lista de Exerc´ıcios

1) Seja {Yn}n≥1 uma seq¨uˆencia de vari´aveis aleat´orias iid com Yn ∼ Poisson(nθ) para

θ > 0. Mostre que θ √ n µ Yn θ − n ¶ D −→ N (0, 1).

2) Suponha que Xn∼ N ¡0,n1¢ para n ≥ 1. Mostre que Xn−→ X ≡ 0 .D

3) Suponha que um programa de computador tem n = 100 p´aginas de c´odigos. Seja Xi

o n´umero de erros na i−´esima p´agina. Suponha que as vari´aveis aleat´orias Xi s˜ao do

tipo Poisson de m´edia 1 e independentes. Seja Y = Pn

j=1Xj o n´umero total de erros.

Utilize o teorema central do limite para aproximar P[Y < 90].

4) Uma marca de chocolate faz a seguinte promo¸c˜ao: alguns dos pacotes premiados in-cluem vales que podem ser trocados camisetas. O n´umero de pacotes premiados que se vendem ao dia em uma loja ´e uma vari´avel aleat´oria com distribui¸c˜ao Poisson de parˆametro λ = 0.3. Estime a probabilidade de que em 120 dias se vendam nessa loja mais de 30 pacotes premiados.

Referências

Documentos relacionados

Como forma de contornar a situação, os projetos de linhas urbanas recentes preterem o uso de torres treliçadas, que exigem grandes áreas e faixas par instalação, optando pelo uso

c) O Reino Unido assegurará que a coluna vertebral e os produtos dela derivados com origem em bovinos nascidos ou criados no Reino Unido após 31 de Julho de 1996 e abatidos antes

1 Conceitos B´ asicos de Teoria das Probabilidades 2 Vari´ aveis Aleat´ orias Discretas.. 3 Vari´ aveis Aleat´ orias Cont´ınuas 4 Duas Vari´ aveis Aleat´ orias 5 Vetores de

Se tiver quaisquer efeitos secundários, incluindo possíveis efeitos secundários não indicados neste folheto, fale com o seu médico ou farmacêutico.. O que precisa de saber antes

O uso de peças sobressalentes não aprovadas pode resultar em riscos para o pessoal e causar danos o mau funcionamento do produto.. • Use apenas peças originais e peças de

TRAYENTA DUO é indicado como adjuvante da dieta e do exercício, para melhorar o controle glicêmico em pacientes com diabetes mellitus tipo 2 (DM2), em que a dose máxima tolerada

Objetivo: definir a probabilidade dos valores da Vari´ avel Aleat´ oria (V. A.) sem referˆ encia aos elementos do espa¸ co amostral S.... Classifica¸c˜ ao das Vari´ aveis

Anna Regina Cˆ orbo Vari´ aveis Aleat´ orias Cont´ınuas.. M´ edia de uma