Teorema Limite Central e Lei dos Grandes N´ umeros

4.3.1 Amostragem

Consideremos uma dada experiência aleatória (por exemplo, lan¸camento de um dado com as faces numeradas de 1 a 6) e seja X uma v.a. associada a essa experiência, por exemplo, a v.a. que corresponde ao número da face que fica voltada para cima. Considerem-se n repeti¸cões nas mesmas condi¸cões dessa experiência e sejam X1, X2, . . . , Xn as v.a.’s associadas a cada uma das repeti¸cões.

Então essas variáveis aleatórias são, naturalmente, independentes e, além disso, todas elas têm a mesma distribui¸cão de probabilidade (distribui¸cão igual à da v.a. X) – dizemos então que as variáveis são independentes e identicamente distribu´ıdas (i.i.d.).

Consideremos agora uma outra situa¸cão. Suponhamos que temos uma popula¸cão com uma v.a. X em estudo (por exemplo, a variável altura na popula¸cão dos estudantes da Universidade do Minho).

Consideremos uma v.a. X1 associada `a altura de um indiv´ıduo escolhido aleatoriamente dessa

popula¸cão (i.e., o indiv´ıduo é escolhido ao acaso, e supomos que todos os indiv´ıduos da popula¸cão têm igual probabilidade de serem escolhidos); seja X2 a v.a. associada à altura de novo indiv´ıduo

escolhido aleatoriamente da popula¸cão, e assim sucessivamente, até termos n (n ∈ N) variáveis aleatórias correspondentes, respectivamente, às alturas de n indiv´ıduos escolhidos aleatoriamente da popula¸cão (indiv´ıduos esses que constituem uma amostra casual da popula¸cão). Isto corresponde a escolher ao acaso, com reposi¸cão, uma amostra da popula¸cão (após “extrairmos”um indiv´ıduo da popula¸cão, ele é reposto na popula¸cão) e a considerar as variáveis aleatórias associadas a cada um dos elementos da amostra.6

As variáveis X1, X2, . . . , Xnassim obtidas são também independentes e igualmente distribu´ıdas,

sendo a distribui¸cão de cada Xi igual à distribui¸cão de X.

• Quando, dada uma v.a. X com uma certa distribui¸c˜ao, tivermos n v.a.’s X1, X2, . . . , Xn

i.i.d’s com a mesma distribui¸c˜ao de X, dizemos que o vector aleat´orio X = (X1, . . . , Xn)

é uma amostra aleatória de dimensão n de X.

• Se x = (x1, . . . , xn) for um valor observado do vector aleat´orio X = (X1, . . . , Xn) a

dizemos que x = (x1, . . . , xn) ´e uma amostra aleat´oria observada. a_{No caso de segundo exemplo acima considerado, x}

1seria a altura do primeiro indiv´ıduo seleccionado, x2a altura do segundo indiv´ıduo seleccionado, etc.

Nota: Neste momento, interessa-nos fazer a distin¸cão entre a amostra aleatória, enquanto vector aleatório X = (X1, . . . , Xn), e a amostra observada (ou amostra de observa¸cões), constitu´ıda por

dados, x = (x1, . . . , xn). Como j´a referimos anteriormente, por vezes chamamos amostra ao conjunto

dos dados, não sendo tão “rigorosos”nesta distin¸cão.

4.3.2 Teorema Limite Central (TLC)

Vimos, na Seçcão 4.2.3, que a média X de uma amostra aleatória X = (X1, . . . , Xn) da distribui¸cão

normal X ∼ N (µ, σ) tem uma distribui¸c˜ao normal N (µ,√σ

n) ou, equivalentemente, que X−µ

√ n ∼ N (0, 1).

Nesta seçcão apresentamos um teorema que contém um dos resultados mais interessantes da teoria da Probabilidade – o chamado Teorema Limite Central – o qual pode ser visto como uma ex-

6_{Na pr´}_{atica, ´}_{e frequente fazer-se amostragem sem reposi¸}_c˜_{ao (por exemplo, quando se faz uma sondagem, os} indiv´ıduos seleccionados são auscultados uma única vez) ; no entanto, desde que a dimensão N da popula¸cão seja elevada e n seja pequeno, relativamente a N , podemos considerar que a amostragem com reposi¸cão é praticamente

tensão dos resultados acima enunciados. Informalmente, o TLC estabelece que, sob certas condi¸cões, mesmo quando as variáveis Xi não são normais, mas apenas i.i.d., a distribui¸cão da sua média X,

embora n˜ao normal, pode ser “bem aproximada”por uma distribui¸c˜ao normal. Mais precisamente, tem-se:

Teorema Limite Central

Sejam X1, X2, X3, . . . , v.a.’s i.i.d. com valor m´edio µ e variˆancia finita σ2 e sejam

Sn= X1+ · · · + Xn (4.14)

X = Xn=

X1+ X2+ · · · + Xn

n . (4.15)

Considerem-se, ainda, as v.a’s Yn e Zn definidas por

Yn= Sn− nµ σ√n e Zn= X − µ σ √ n. (4.16)

Então, a fun¸cão de distribui¸cão de Yne a fun¸cão de distribui¸cão de Znconvergem pontualmente

para a fun¸cão de distribui¸cão Φ da v.a. Z ∼ N (0, 1), ou seja, tem-se lim n→∞P Yn≤ x = Φ(x) e lim n→∞P Zn≤ x = Φ(x), onde Φ(x) é a fun¸cão definida por (4.10). a

Dizemos, neste caso, que Yne Znconvergem em distribui¸c˜ao para Z ∼ N (0, 1) e escrevemos Yn d −→ Z ∼ N (0, 1) e Zn d − → Z ∼ N (0, 1) .

Por outras palavras, Sn´e aproximadamente N (nµ, σ

√

n) e X ´e aproximadamente N (µ,√σ

n), desde

que n seja suficientemente grande. Por vezes, escrevemos Sn≈ N (nµ, σ

√

n) e X ≈ N (µ,√σ n) com o significado acima indicado.

Na prática, isto significa que podemos aproximar probabilidades referentes à variável soma Sn=

X1+ · · · + Xn, ou à variável média X, por probabilidades calculadas a partir do modelo normal,

seja qual for a distribui¸cão subjacente às v.a.’s i.i.d Xi 7, desde que n seja grande. Se as v.a.’s não

forem muito assimétricas, basta que seja n > 30 para obtermos uma aproxima¸cão razoável.

Por exemplo, se Xi ∼ Bi(1, p), temos que Sn ∼ Bi(n, p) e o Teorema Limite Central diz-nos

que, para n grande, Sn tem distribui¸c˜ao aproximadamente N (np,pnp(1 − p)).

Na Figura 4.12, apresentam-se, em sobreposi¸cão no mesmo gráfico, a f.m.p. de uma distribui¸cão Bi(100, 0.5) e a f.d.p. da N (50, 5) (note-se que, para n = 100 e p = 0.5, vem pnp(1 − p) = √

25 = 5), onde ´e patente o “ajuste”.

ææææææææææææææææææ ææ æ æ æ æ æ æ æ æ æ æææ æ æ æ æ æ æ æ æ æ æ æ ææææææææææææææææææ 30 40 50 60 70 80 0.02 0.04 0.06 0.08

Figura 4.12: f.m.p Bi ∼ (100, 0.5) (azul) e f.d.p. N (50, 5) (vermelho).

O TLC permite também explicar, de certo modo, por que razão se constata que muitos fenómenos naturais têm uma distribui¸cão semelhante à normal, uma vez que muitos deles podem ser considerados como a “soma”de vários “acontecimentos”aleatórios.

4.3.3 Lei dos Grandes N´umeros

Apresentamos agora outro resultado muito importante da teoria da probabilidade, conhecido por Lei dos Grandes Números (LGN).8 Informalmente, podemos dizer que a LGN descreve o que acontece quando se repete uma mesma experiência um grande número de vezes. De acordo com a LGN, a média dos resultados obtidos com um elevado número de repeti¸cões deve estar próxima do valor esperado (ou valor médio) da distribui¸cão correspondente à experiência em causa, tornando-se cada

8_{A LGN foi provada inicialmente por por Jacob Bernoulli, na quarta parte do seu trabalho Ars Conjectandi, publicado} postumamente em 1713.

vez mais próxima quando o número de repeti¸cões aumenta. De um modo mais rigoroso, tem-se: Lei dos Grandes Números (LGN)

Seja X1, X2, . . . , uma sequˆencia de v.a.’s i.i.d., cada uma delas com valor m´edio E(Xi) = µ. Para

n ∈ N, seja X = Xn= X1+···+X_n n a m´edia de X1, . . . , Xn. Ent˜ao, para qualquer > 0, tem-se

lim

n→∞P (|X − µ| < ) = 1.

Dizemos que Xn converge em probabilidade para µ e escrvemos Xn p

− → µ.

Como aplica¸cão imediata da LGN, suponhamos que efectuamos uma sequência de repeti¸cões independentes de uma dada experiência aleatória. Seja A uma acontecimento fixo e seja p = P (A) a probabilidade desse acontecimento ocorrer nessa experiência e 1 − p a probabilidade de não ocorrer. Seja

Xi =

(

1, se A ocorre na i-ésima repeti¸cão 0, se A não ocorre na i-ésima repeti¸cão

Então Xi são v.a.’s i.i.d. com distribui¸cão Bi(1, p) e µ = E(Xi) = p. Neste caso, a v.a. X = X1+···+Xn

n representa a frequência relativa da ocorrência de A nas n repeti¸cões da experiência, fn(A).

A LGN estabelece, portanto, que fn(A) converge (em probabilidade) para p = P (A). Assim sendo,

faz sentido aproximar P (A) pela frequˆencia relativa da sua ocorrˆencia, quando n for suficientemente grande.

No documento notas de estatística maria joana soares e ricardo severino (páginas 86-90)