• Nenhum resultado encontrado

AMOSTRASDEPOPULAESNORMAIS

N/A
N/A
Protected

Academic year: 2021

Share "AMOSTRASDEPOPULAESNORMAIS"

Copied!
10
0
0

Texto

(1)

Notas de aula de Inferˆ

encia Estat´ıstica

Centro de Matem´atica, Computa¸c˜ao e Cogni¸c˜ao Universidade Federal do ABC

Professores Roberto Venegeroles (diurno) e Cristian Coletti (noturno)

AULA 4: Intervalos de Confian¸ca

1. Amostras de Popula¸c˜oes Normais

Teorema: Seja {X1, X2, . . . , Xn} uma amostra aleat´oria de tamanho n, sendo cada uma

dessas vari´aveis iid tais que X1≤i≤n ∼ N(µ, σ2). Lembrando que a m´edia ¯X e a variˆancia S2

amostrais s˜ao definidas como ¯ X = Pn i=1Xi n , S 2 = Pn i=1(Xi− ¯X)2 n − 1 , (1) ent˜ao

(i) ¯X e S2 s˜ao independentes;

(ii) (n−1)Sσ2 2 ∼ χ2n−1;

(iii) √n( ¯X−µ)S ∼ tn−1; onde χ2

n denota uma vari´avel aleat´oria com distribui¸c˜ao quiquadrado de n graus de

liber-dade, definda como

fn(y) =

1 2n/2Γ(n/2)y

n/2−1e−y/2, y > 0, (2)

para y = χ2, enquanto que t

n denota uma vari´avel aleat´oria com distribui¸c˜ao t de student

de n graus de liberdade, definida por fn(t) = 1 √ πn Γ((n + 1)/2) Γ(n/2) µ 1 + t 2 n ¶−(n+1)/2 , −∞ < t < ∞. (3) Lembremos que a fun¸c˜ao Γ(α) ´e definida por

Γ(α) = Z ∞

0

(2)

Demonstra¸c˜ao: (i) Podemos retomar nossas notas de aula sobre o Teorema Central do Limite, no qual vimos que (exerc´ıcio!)

¯

X ∼ N(µ, σ2/n), Xi− ¯X ∼ N(0, (n − 1/n)σ2). (5)

A fun¸c˜ao geradora de momentos para as vari´aveis Y1 = ¯X e Y2 = Xi− ¯X ser´a

MY1,Y2(s1, s2) = E[e s1X+s¯ 2(Xi− ¯X)] = E[es2Xi+ ¯X(s1−s2) ] = E ( exp " µ s2+ (s1− s2) n ¶ Xi+ (s1− s2) n n X j6=i Xj #) = E ½ exp ·µ s2+ (s1− s2) n ¶ Xi ¸¾ E ( exp " (s1− s2) n n X j6=i Xj #) . (6) Uma vez que

Xi ∼ N(µ, σ2), n X j6=i Xj ∼ N((n − 1)µ, (n − 1)σ2) (7) temos que MY1,Y2(s1, s2) = exp " µ s2+ s1− s2 n ¶ µ + µ s2+ s1− s2 n ¶2 σ2 2 # × exp " (n − 1) n (s1− s2)µ + 1 2 µ s1− s2 n ¶2 (n − 1)σ2 # = exp µ µs1+ s2 1σ2 2n ¶ expµ s 2 2(n − 1)σ2 2n ¶ = MY1(s1)MY2(s2). (8)

Portanto, as vari´aveis ¯X e Xi− ¯X s˜ao independentes pois a fun¸c˜ao geradora da distribui¸c˜ao

conjunta ´e igual ao produto das fun¸c˜oes geradoras das distribui¸c˜oes marginais. Como a ex-press˜aoPn

i=1(Xi− ¯X)2 ´e fun¸c˜ao de Xi− ¯X, que ´e independente de ¯X, podemos concluir que

S2 tamb´em independe de ¯X.

(ii) Comecemos por conhecer a fun¸c˜ao geradora da distribui¸c˜ao quiquadrado: basta notar que (2) ´e um caso especial do modelo Gama(α, β) visto no exemplo 7 da nota de aula 2 para o qual α = n/2 e β = 1/2. De acordo com o exerc´ıcio 1 da mesma nota temos

Mχ2 n(s) = µ β β − s ¶α = (1 − 2s)−n/2. (9) Consideremos agora a seguinte identidade (exerc´ıcio!):

n X i=1 (Xi− µ)2 σ2 = n X i=1 (Xi− ¯X)2 σ2 + n ( ¯X − µ)2 σ2 . (10)

(3)

Lembrando que Zi ≡ (Xi−µ)/σ ∼ N(0, 1), temos que Zi2 ∼ χ21, mais uma vez de acordo com

o exemplo 7 da nota de aula 2. Lembremos tamb´em que a soma de vari´aveis iid dadas por Y1 ≡Pni=1Zi2 nos dar´a como geradora conjunta MY1(s) = [MZ2

i(s)]

n= M χ2

n(s). Escrevamos

agora a equa¸c˜ao (10) na forma simplificada:

Y1 = Y2+ Y3, (11)

onde Y2 ´e dado pelo primeiro termo `a direita de (10), ou seja

Y2 = (n − 1)S2/σ2. (12)

Conforme vimos em (i), Y2 (fun¸c˜ao de S2) e Y3 (fun¸c˜ao de ¯X) s˜ao independentes, de modo

que suas geradoras se relacionam da seguinte forma: MY2(s) = MY1(s) MY3(s) . (13) Para Y3 temos: Y3 = n ( ¯X − µ)2 σ2 = µ Sn− nµ σ√n ¶2 , (14)

onde Sn =Pni=1Xi. Vimos que (Sn−nµ)/σ√n ∼ N(0, 1) (nota de aula 3), portanto Y3 ∼ χ21.

Por fim, teremos

MY2(s) = Mχ2 n(s) Mχ2 1(s) = Mχ2 n−1(s), (15) ou seja (n − 1)S22 ∼ χ2 n−1.

(iii) Note que podemos escrever √ n( ¯X − µ) S = √ n( ¯X−µ)σ q (n−1)S22 n−1 , (16)

que corresponde ao quociente entre duas vari´aveis aleat´orias independentes. O numerador tem distribui¸c˜ao N (0, 1), enquanto que o denominador representa a raiz quadrada de uma vari´avel χ2

n−1 dividida pelo mesmo n´umero de graus de liberdade, n − 1, conforme (ii).

Definamos a vari´avel t de student de n graus de liberdade por t = x

py/n, x ∼ N(0, 1), y ∼ χ

2

n. (17)

A distribui¸c˜ao conjunta fn(x, y) ser´a dada por

fn(x, y) =

1

2n/2√2π Γ(n/2)y

n/2−1e−y/2e−x2

(4)

Fa¸camos agora a mudan¸ca de vari´aveis (x, y) 7→ (t, y). O jacobiano da transforma¸c˜ao ser´a J = ∂(x, y) ∂(t, y) = Ã ∂x ∂t ∂x ∂y ∂y ∂t ∂y ∂y ! =µ py/n 0 −2y/t 1 ¶ , (19)

de modo que teremos para o novo elemento de volume dxdy = |det J|dtdy =py/n dtdy. A fun¸c˜ao de distribui¸c˜ao da nova vari´avel t ser´a dada pela marginal de fn(t, y) integrada em

todo o dom´ınio de y: fn(t) = 1 2n/2√2πn Γ(n/2) Z ∞ 0 dy y(n+1)/2−1e−y(1+t2 /n)/2. (20)

Note que a nova integral na vari´avel y nada mais ´e que a normaliza¸c˜ao do modelo Gama(α, β) (nota de aula 2): βα Γ(α) Z ∞ 0 dy yα−1e−βy = 1 (21) no qual podemos tomar α = (n + 1)/2 e β = (1 + t2/n)/2. O resultado ser´a

fn(t) = 1 2n/2√2πn Γ(n/2) 2(n+1)/2Γ((n + 1)/2) (1 + t2/n)(n+1)/2 = √1 πn Γ((n + 1)/2) Γ(n/2) µ 1 + t 2 n ¶−(n+1)/2 . (22)

Uma vez que o denominador de (16) tem n −1 graus de liberdade, segue que √n( ¯X−µ)S ∼ tn−1.

2. Intervalos para Popula¸c˜oes Normais (uma amostra)

Defini¸c˜ao: Uma vari´avel aleat´oria Q(X1, . . . , Xn, θ) ≡ Q(X, θ) ´e dita pivotal para o

parˆametro θ se sua distribui¸c˜ao for independente de θ.

Exemplo 1: Considere uma amostra aleat´oria de n vari´aveis X1, . . . , Xn distribu´ıdas de

acordo com a seguinte densidade

f (x) = θe−θx, x ≥ 0 (23)

para θ > 0. A vari´avel Sn =Pni=1Xi ∼ Γ(n, θ) (exerc´ıcio!) n˜ao ´e uma quantidade pivotal

para este modelo. Por outro lado, 2θSn ∼ χ22n (exerc´ıcio!) ´e independente de θ, portanto

(5)

Nosso interesse em vari´aveis pivotais vem do fato de que, nestes casos, a constru¸c˜ao de intervalos de confian¸ca do tipo

P[q1 ≤ Q(X; θ) ≤ q2] = γ (24)

´e tal que os limites q1 e q2 s˜ao independentes do parˆametro θ. Al´em disso, se para cada X

existirem θ1(X) e θ2(X) tais que

q1 ≤ Q(X; θ) ≤ q2 ⇔ θ1(X) ≤ θ ≤ θ2(X) (25)

ent˜ao

P[θ1(X) ≤ θ ≤ θ2(X)] = γ ≡ 1 − α (26)

onde γ representa a probabilidade de que a vari´avel θ esteja contida no intervalo aleat´orio [θ1, θ2]. O coeficiente de referˆencia α ´e comumente chamado n´ıvel de significˆancia do intervalo.

Em geral, os intervalos s˜ao constru´ıdos de forma que

P[Q(X; θ) < q1] = P[Q(X; θ) > q2] = α/2. (27)

Considere uma amostra {X1, X2, . . . , Xn} aleat´oria de tamanho n de uma distribui¸c˜ao

N (µ, σ2). Conforme os resultados descritos pelo teorema da sec¸c˜ao 1, podemos estipular

intervalos de confian¸ca para a m´edia µ e para variˆancia σ2 dessa amostra. Vejamos alguns

casos particulares:

(a) Intervalo de confian¸ca para m´edia µ assumindo σ2 conhecida.

A quantidade

Q(X; µ) = X − µ¯

σ/√n (28)

´e pivotal para µ uma vez que sua distribui¸c˜ao ´e N (0, 1), independente portanto de µ. Como a distribui¸c˜ao ´e sim´etrica, o intervalo de confian¸ca ao n´ıvel de significˆancia α pode ser con-stru´ıdo de modo que q1 = −zα/2 e q2 = zα/2, ou seja

¯ X − zα/2 σ √ n ≤ µ ≤ ¯X + zα/2 σ √ n . (29)

Exemplo 2: Se σ2 ´e conhecida, podemos estimar o tamanho n da amostra necess´ario

para que se obtenha uma medida amostral ¯X da m´edia µ (desconhecida) a uma precis˜ao especificada ǫ ≡ |µ − ¯X|, ou seja |µ − ¯X| σ/√n = zα/2 ⇒ n = ³σ zα/2 ǫ ´2 . (30)

(6)

Neste caso temos

Q(X; µ) = X − µ¯

S/√n ∼ tn−1, (31) tamb´em uma grandeza pivotal para µ. Como a distribui¸c˜ao t de student ´e tamb´em sim´etrica, teremos, ao n´ıvel de significˆancia α, o seguinte intervalo

¯ X − tα/2 S √n ≤ µ ≤ ¯X + tα/2 S √n . (32)

Exemplo 3: Se σ2 ´e desconhecida, podemos tamb´em estimar o tamanho n da amostra

necess´ario para que se obtenha uma medida amostral da m´edia a uma precis˜ao ǫ especificada, ou seja ǫ S/√n = tα/2 ⇒ n = µ S tα/2 ǫ ¶2 . (33)

(c) Intervalo de confian¸ca para a variˆancia σ2 assumindo µ desconhecido.

De acordo com a parte (iii) do teorema apresentado na sec¸c˜ao 1, temos como quantidade pivotal para σ2 Q(X; µ) = (n − 1)S 2 σ2 ∼ χ 2 n−1. (34)

Basta localizarmos os parˆametros q1 e q2 tais que

P[χ2n−1< q1] = P[χ2n−1 > q2] = α/2 (35)

e teremos como intervalo de confian¸ca para σ2 ao n´ıvel de significˆancia α

(n − 1)S2 q2 ≤ σ 2 ≤ (n − 1)S 2 q1 . (36)

3. Intervalos para Popula¸c˜oes Normais (duas amostras)

Consideremos agora o caso em que temos duas amostras independentes {X1, . . . , Xn} e

{Y1, . . . , Ym}, sendo X1≤i≤n ∼ N(µ1, σ) e Y1≤j≤m ∼ N(µ2, σ). ´E f´acil notar que (exerc´ıcio!)

¯ X − ¯Y ∼ N µ µ1− µ2, σ2 µ 1 n + 1 m ¶¶ (37) ou, na forma padronizada (pivotal),

¯

X − ¯Y − (µ1− µ2)

σqn1 +m1 ∼ N(0, 1).

(7)

Sendo a variˆancia σ2 conhecida, o intervalo de confian¸ca para a diferen¸ca de m´edias ser´a · ¯ X − ¯Y − zα/2σ r 1 n1 + 1 n2 ≤ (µ1− µ2) ≤ ¯X − ¯ Y + zα/2σ r 1 n1 + 1 n2 ¸ (39) Antes de tratar o caso em que σ2 ´e desconhecida, ´e instrutivo considerar a distribui¸c˜ao

da composi¸c˜ao de variˆancias amostrais. Sabemos que (n − 1)S2 x σ2 ∼ χ 2 n−1, (m − 1)S2 y σ2 ∼ χ 2 m−1 (40)

sendo as variˆancias amostrais iguais a Sx2 = Pn i=1(Xi− ¯X)2 n − 1 , S 2 y = Pm i=1(Yi− ¯Y )2 m − 1 . (41) Devido `a independˆencia de S2 x e Sy2, temos que (n + m − 2)S2 p σ2 ≡ (n − 1)S2 x σ2 + (m − 1)S2 y σ2 ∼ χ 2 n+m−2. (42)

De forma similar ao resultado (iii) podemos agora considerar o caso em que σ2´e desconhecido

por meio da seguinte constru¸c˜ao: ¯ X − ¯Y − (µ1− µ2) Sp q 1 n + 1 m = ¯ X− ¯Y −(µ1−µ2) σ√1 n+ 1 m q (n+m−2)S2 p/σ 2 (n+m−2) ∼ tn+m−2, (43)

uma vez que o numerador de (43) ´e N (0, 1) distribu´ıdo e seu denominador ´e a raiz de uma vari´avel χ2

n+m−2 distribu´ıda divida pelo mesmo n´umero de graus de liberdade, portanto

tn+m−2 distribu´ıda em seu conjunto. O intervalo de confian¸ca para a diferen¸ca entre m´edias no caso em que σ2 ´e desconhecido ser´a

· ¯ X − ¯Y − tα/2Sp r 1 n1 + 1 n2 ≤ (µ 1− µ2) ≤ ¯X − ¯Y + tα/2Sp r 1 n1 + 1 n2 ¸ (44) sendo Sp, de acordo com (42), dado por

Sp2 = (n − 1)S

2

x+ (m − 1)Sy2

n + m − 2 . (45)

Outra situa¸c˜ao de interesse ´e o caso em que as duas amostras tˆem, al´em das m´edias µ1

e µ2, variˆancias distintas σ12 e σ22, de forma que X1≤i≤n ∼ N(µ1, σ1) e Y1≤i≤m ∼ N(µ2, σ2).

Neste caso, cabe estudar a distribui¸c˜ao da raz˜ao de variˆancias amostrais: (m − 1)S2

y/(m − 1)σ22

(n − 1)S2

x/(n − 1)σ21

(8)

A distribui¸c˜ao Fm,npode ser obtida de forma similar `a t de student observando agora que (46)

´e a raz˜ao de duas vari´aveis quiquadrado independentes, cada uma divida por seu respectivo grau de liberdade. Considere duas vari´aveis x e y independentes tais que

w ≡ y/mx/n = n m y x, x ∼ χ 2 n, y ∼ χ2m. (47)

A distribui¸c˜ao conjunta fm,n(x, y) ser´a

fm,n(x, y) =

1

2(m+n)/2Γ(m/2)Γ(n/2)x

n/2−1ym/2−1e−(x+y)/2 (48)

Fa¸camos agora a mudan¸ca de vari´aveis (x, y) 7→ (x, w). O jacobiano da transforma¸c˜ao ser´a J = ∂(x, y) ∂(x, w) = µ ∂x ∂x ∂x ∂w ∂y ∂x ∂y ∂w ¶ =µ 1 −x/w 0 mx/n ¶ , (49)

com elemento de volume dxdy = |det J|dxdw = (m/n)x dxdw. A fun¸c˜ao de distribui¸c˜ao da nova vari´avel w ser´a dada pela marginal de fm,n(x, w) integrada em todo o dom´ınio de x:

fm,n(w) = (m/n)m/2 2(m+n)/2Γ(m/2)Γ(n/2)wm/2−1 Z ∞ 0 dx x(m+n)/2−1e−(1+mw/n)x/2 = (m/n) m/2 2(m+n)/2Γ(m/2)Γ(n/2)w m/2−1Γ(α) βα (50)

de acordo com a integral (21) para α = (m + n)/2 e β = (1 + mw/n)/2, resultando em fm,n(w) = (m/n)m/2 2(m+n)/2 Γ((m + n)/2) Γ(m/2)Γ(n/2) wm/2−1 (1 + (m/n)w)(m+n)/2, w ≥ 0. (51)

A distribui¸c˜ao (51) ´e conhecida como F de Snedecor com m+n graus de liberdade, usualmente representada por Fm,n. O intervalo de confian¸ca para a raz˜ao de variˆancias σ12/σ22, conforme

(46), ´e constru´ıdo de forma que

P[Fm−1,n−1< q1] = P[Fm−1,n−1> q2] = α/2 (52) resultando em · q1 S2 x S2 y ≤ σ 2 1 σ2 2 ≤ q2 S2 x S2 y ¸ . (53)

(9)

Lista de Exerc´ıcios

1) Considere vari´aveis aleat´orias independentes X1≤i≤n ∼ N(µ1, σ2) e Y1≤j≤m ∼ N(µ2, σ2).

Mostre que: a) ¯X ∼ N(µ1, σ2/n); b) Xi− ¯X ∼ N(0, ¡n−1 n ¢ σ 2); c) ¯X − ¯Y ∼ N¡µ1− µ2, σ2 ¡1 n + 1 m¢¢. 2) Verifique a identidade: Pn i=1 (Xi−µ)2 σ2 = Pn i=1 (Xi− ¯X)2 σ2 + n ( ¯X−µ)2 σ2 .

3) Considere uma amostra aleat´oria de n vari´aveis independentes X1, . . . , Xn distribu´ıdas

de acordo com a seguinte densidade

f (x) = θe−θx, x ≥ 0 para θ > 0. Mostre que

a) Sn =Pni=1Xi ∼ Γ(n, θ);

b) 2θSn∼ χ22n.

4) Os pesos de pacotes recebidos por um dep´osito tˆem m´edia de 150 kg e desvio padr˜ao de 25 kg. Qual a probabilidade de 25 pacotes retirados ao acaso e carregados por um elevador n˜ao excederem o limite de seguran¸ca deste, que ´e de 4100 kg? Considere que esta amostra ´e normal, ou seja, para Sn =Pni=1Xi temos

Sn− nµ

σ√n ∼ N(0, 1).

5) Considere uma amostra X1≤i≤nde tamanho n distribu´ıda segundo o modelo de Bernoulli de parˆametro p:

Xi =½ 1 se o i−´esimo elemento for portador de uma caracter´ıstica;

(10)

Sabemos que m´edia e variˆancia para cada Xi s˜ao dadas por µ = p e σ2 = p(1 − p),

respectivamente. Defina a propor¸c˜ao populacional f ≡

Pn i=1Xi

n e calcule E[f ] e V ar[f ].

Considere n suficientemente grande e use o Teorema Central do Limite para criar um intervalo de confian¸ca para a propor¸c˜ao f .

Referências

Documentos relacionados

Os graus de liberdade de um processo s˜ ao as vari´ aveis independentes que devem ser especificadas para definir o processo completamente (resposta do conjunto de equa¸c˜ oes

(UDESC, 2014) O relevo corresponde às formas do terreno que foram moldadas pelos agentes internos e externos sobre a crosta terrestre. Cada forma de relevo corresponde a um estado

O Estudo de Dale Carnegie Training descobriu que “quando você mostra aos colaboradores que eles são respeitados pela organização e que os seus valores e objetivos pessoais

Nessa comunicação centrar-me-ei em partes do capítulo 3 da tese quando analisei como essas mulheres ecumênicas construíram sagrados políticos em diálogos e

Objetivo: definir a probabilidade dos valores da Vari´ avel Aleat´ oria (V. A.) sem referˆ encia aos elementos do espa¸ co amostral S.... Classifica¸c˜ ao das Vari´ aveis

Tipo de aquisição referente a compra de passagem para embarque em meios de transportes diversos (passagens áereas, rodoviárias ou hidroviárias, em âmbito municipal, estadual,

1 Conceitos B´ asicos de Teoria das Probabilidades 2 Vari´ aveis Aleat´ orias Discretas.. 3 Vari´ aveis Aleat´ orias Cont´ınuas 4 Duas Vari´ aveis Aleat´ orias 5 Vetores de

rela c~ ao causal entre duas vari aveis quando concebeu. que uma vari avel mudou devido  a a c~ ao