• Nenhum resultado encontrado

Estatística. 7 - Distribuições Amostrais

N/A
N/A
Protected

Academic year: 2021

Share "Estatística. 7 - Distribuições Amostrais"

Copied!
35
0
0

Texto

(1)

Estatística

(2)

Distribuição constituída de todos os

valores de , considerando todas as

possíveis amostras de tamanho “n”

Distribuição da Média Amostral

x

x

)

(

n i

x

x

x

n

n

x

x

1

1

2

) ( 1 )] ( ) ( ) ( [ 1 ) ( n E X n X E X E X E n x E        

Sendo: x1, x2, ..., xn Variáveis Aleatórias Independentes:

) ( 1 )] ( ) ( ) ( [ 1 ) ( 2 2 n Var X n X Var X Var X Var n X Var        

Parâmetros da Distribuição da Média Amostral

)] ( ) ( ) ( [ 1 ) ( E X1 E X2 E Xn n X E      )] ( ) ( ) ( [ 1 ) ( 1 2 2 n X Var X Var X Var n X Var           

Onde X1, X2, ..., Xn são V.A. com mesma Distr. da V.A. X

x

X Var X Var 2 ) ( ) (       ( ) ) (x E X E

(3)

Exemplo: População = {2,3,6,8,11}

Amostra de 2 (dois) elementos com reposição. N = 5 n = 2

Amostras possíveis: 52 = 25 amostras

(2,2) 2,0 (2,3) 2,5 (2,6) 4,0 (2,8) 5,0 (2,11) 6,5 (3,2) 2,5 (3,3) 3,0 (3,6) 4,5 (3,8) 5,5 (3,11) 7,0 (6,2) 4,0 (6,3) 4,5 (6,6) 6,0 (6,8) 7,0 (6,11) 8,5 (8,2) 5,0 (8,3) 5,5 (8,6) 7,0 (8,8) 8,0 (8,11) 9,5 (11,2) 6,5 (11,3) 7,0 (11,6) 8,5 (11,8) 9,5 (11,11) 11,0 n X Var x N X E x X Var N x X E i n i X n i 2 2 2 2 2 8 , 10 40 , 5 ) ( 25 ) 0 , 6 ( )) ( ( ) ( 0 , 6 25 150 5 0 , 11 ... 5 , 2 0 , 2 ) (                     População: Amostra:

8 10 6 11 6 8 6 6 6 3 6 2 5 1 0 6 5 11 8 6 3 2 2 2 2 2 2 2 2 2 2 , ) ( ) ( ) ( ) ( ) ( ) ( ,                             N x N x i i

(4)

Onde: N  tamanho da população n  tamanho da amostra

• Amostragem sem reposição • População finita: N < 20 •n • Xi: V.A. não Independentes

n

n

X

Var

x

Var

X

E

x

E

X X 2

)

(

)

(

)

(

)

(

1

)

(

)

(

)

(

)

(

2

N

n

N

n

n

X

Var

x

Var

X

E

x

E

X X

• Amostragem com reposição • População infinita: N > 20.n • Xi: V.A. Independentes

Então:

Então:

(5)

Amostras x (2,3) 2,5 (2,6) 4,0 (2,8) 5,0 (2,11) 6,5 (3,6) 4,5 (3,8) 5,5 (3,11) 7,0 (6,8) 7,0 (6,11) 8,5 (8,11) 9,5 0 , 6 10 5 , 9 0 , 4 5 , 2 ) Pr( ) (X   X ixi      E 05 , 4 1 5 2 5 2 8 , 10 1 ) ( 2          N n N n x VarX 10 2 4 5 2 3 5 2 5              ! ! ! Exemplo: População = {2,3,6,8,11}

Amostra de 2 (dois) elementos sem reposição. N = 5 n = 2 Amostras possíveis:

(2,5 6) (4,0 6) ... (9,5 6)

4,05 10 1 ) (x   2   2    2  Var i i para todo x X 10 1 ) Pr(  ) Pr( ) ( ) ( 2 i x i x x x Var

 

(6)

Exemplo: Admite-se que a altura de 300 alunos do sexo masculino de uma dada Escola tem Distribuição

Normal, com  = 172,72 cm e  = 7,62 cm.

Se forem obtidas 80 amostras de 25 alunos cada, quais serão a média e o desvio-padrão da

Distribuição Amostral de ? 524 , 1 25 62 , 7 ) (    n X DPX 461 , 1 1 300 25 300 25 62 , 7 1 ) (         N n N n X DPX 72 , 172 ) (XXE

x

• Com reposição:

Número de possíveis amostras:

• Sem reposição: E(X)  X 172,72

Número de possíveis amostras: 19 1036

25 275 300 25 300           , ! ! ! 61 25

8

4

10

300

)

 ,

(

)

(

)

(

N

300

20

n

20

25

500

Como: então:

(7)

• Se a população não for Normal, mas a amostra for

suficientemente grande então a Distribuição Amostral de pode ser aproximada pela Normal, devido ao Teorema do Limite Central (no caso de população infinita) ou devido à consideração de amostragem com reposição.

Distribuição Amostral de x

Distr. Probab. da População

x, x

 x, x

Distr. Probab. da População Distribuição Amostral de x

x

x

Resultados importantes:

• Se a população for Normal então a Distribuição Amostral de é Normal para qualquer tamanho da amostra, devido ao

Teorema das Combinações Lineares de Variáveis Normais Independentes.

(8)

) 461 , 1 ) ( ; 72 , 172 ) ( (   2   Normal E X Var X x

Exemplo: Admite-se que a altura de 300 alunos do sexo masculino de uma dada Escola tem Distribuição

Normal, com  = 172,72 cm e  = 7,62 cm. Considere

que foram obtidas 80 amostras de 25 alunos cada. Em quantas amostras pode-se esperar que a média se encontre entre 169,67 e 173,48 cm?

Resp.: espera-se que em 80 x 0,6802 = 54 amostras, a média se encontre entre 169,67 e 173,48 cm

Do slide 6, tem-se (sem reposição):

? ) 48 , 173 67 , 169 Pr( :  X   Logo         ) 461 , 1 72 , 172 48 , 173 461 , 1 72 , 172 67 , 169 Pr( ) 48 , 173 67 , 169 Pr( X Z     Pr( 2,09 Z 0,52)        Pr(0 Z 2,09) Pr(0 Z 0,52) 6802 0 1985 0 4817 0,  ,  , 

(9)

4 ) 6 4 2 ( 3 1 3 1 6 3 1 4 3 1 2 ) (X            E

Exemplo: Uma urna contém muitas fichas numeradas: um terço com o número 2, um terço com 4 e um terço com 6.

X: número de uma ficha retirada ao acaso

   2 2 ) ( ) ( ) (X E X E X Var

 

2,66 3 8 4 ) 3 1 6 3 1 4 3 1 2 ( ) (X  2   2   2   2   Var Pr(X=x) X 6 4 2 1/3

(10)

X X E             4   9 36 9 1 6 9 2 5 9 3 4 9 2 3 9 1 2 ) (

Continuação do exemplo da urna com fichas: 2, 4, 6

Extrair amostra de tamanho 2:

33 , 1 2 66 , 2 ) ( 2    n X VarX 6 4 2 3/9 (2,2) (2,4) (2,6) (4,2) (4,4) (4,6) (6,2) (6,4) (6,6) x 2 3 4 3 4 5 4 5 6 ) Pr(X  x

x

3 5 2/9 1/9

Número de diferentes amostras = 32 = 9

1 2 3 4 5 6 7 8 9

(11)

4 )

(XX

E

Continuação do exemplo da urna com fichas: 2, 4, 6

Extrair amostra de tamanho 5:

53 , 0 5 66 , 2 5 ) ( 2    X X Var  6 4 2

Xi: número de vezes que a ficha “i” saiu na amostra de tamanho 5

)

Pr(X  x

x

Número de diferentes amostras = 35 = 243

Xi: Multinomial (Polinomial) 6 4 2 6 4 2 6 6 4 4 2 2 3 1 3 1 3 1 ! ! ! ! 5 ) ; ; Pr( x x x x x x x X x X x X                             243 30 243 10 243 50

5

6

4

2

X

2

X

4

X

6

X

Cálculos no próximo slide

(12)

Continuação do exemplo da urna com fichas: 2, 4, 6

Distribuição da Média Amostral (n=5)

6 4 2 6 4 2 6 6 4 4 2 2 3 1 3 1 3 1 ! ! ! ! 5 ) ; ; Pr( x x x x x x x X x X x X                             X2 X4 X6 5 0 0 10 2 1/243 4 1 0 12 2,4 5/243 4 0 1 14 2,8 5/243 3 2 0 14 2,8 10/243 3 1 1 16 3,2 20/243 3 0 2 18 3,6 10/243 2 3 0 16 3,2 10/243 2 2 1 18 3,6 30/243 2 1 2 20 4 30/244 2 0 3 22 4,4 10/243 1 4 0 18 3,6 5/243 1 3 1 20 4 20/243 1 2 2 22 4,4 30/244 1 1 3 24 4,8 20/243 1 0 4 26 5,2 5/243 0 5 0 20 4 1/243 0 4 1 22 4,4 5/243 0 3 2 24 4,8 10/243 0 2 3 26 5,2 10/243 0 1 4 28 5,6 5/243 0 0 5 30 6 1/243 iXi x Prob. 2 2,4 2,8 3,2 3,6 4 4,4 4,8 5,2 5,6 6 1/243 5/243 15/243 30/243 45/243 51/243 45/243 30/243 15/243 5/243 1/243 x Prob.

(13)

4 )

(XX

E

Continuação do exemplo da urna com fichas: 2, 4, 6

Extrair amostra de tamanho 10:

266 , 0 10 66 , 2 10 ) ( 2    X X Var  5 4 2

Xi: número de vezes que a ficha “i” saiu na amostra de tamanho 10

) Pr(X  x

x

No. de amostras = 310 = 59.049 Xi: Multinomial (Polinomial) 10 6 4 2 X2 X4 X6 X       0,100 0,025 0,150 3 6 0,050 0,075 0,125 2,0 2,2 2,4 2,6 2,8 3,0 3,2 3,4 3,6 3,8 0,00002 0,00017 0,00093 0,00356 0,01042 0,02459 0,04827 0,08027 0,11457 0,14141 4,0 4,2 4,4 4,6 4,8 5,0 5,2 5,4 5,6 5,8 6,0 0,15162 0,14141 0,11457 0,08027 0,04827 0,02459 0,01042 0,00356 0,00093 0,00017 0,00002 Distribuição de Probabilidade de x

Distribuição da Média Amostral

x

6 4 2 6 4 2 6 6 4 4 2 2 3 1 3 1 3 1 ! ! ! ! 10 ) ; ; Pr( x x x x x x x X x X x X                             Evidente aproximação à Distribuição NORMAL

(14)

Distribuição da Freqüência Amostral f

f

: freqüência absoluta com que foi observada alguma característica em cada elemento de uma amostra de tamanho “n”

SUCESSO: quando a característica foi observada FRACASSO: caso contrário

Seja: p = Prob. de Sucesso em cada elemento da amostra q = Prob. de Fracasso

Amostragem com reposição:

f

tem Distribuição Binomial

np f E( )  npq f Var( )            1 ) ( N n N npq f Var

Amostragem sem reposição:

f

tem Distribuição Hipergeométrica

np f

(15)

)

)

(

;

)

(

(

E

f

np

Var

f

npq

Normal

Normal

Normal

Amostras suficientemente grandes,

garantem que a Distribuição de f

(Binomial ou Hipergeométrica) pode ser

aproximada pela Distribuição Normal

Em termos práticos:

n.p

 5 n.q  5 N > 20 x n

garantem uma boa aproximação pela

n.p

 5 n.q  5 N < 20 x n

garantem uma boa aproximação pela

) 1 ) ( ; ) ( (      N n N npq f Var np f E

Normal Normal Normal

(16)

Exemplo:

Verificou-se que 2% das peças produzidas por certa máquina são defeituosas. Qual a Prob. de existirem no máximo 3% de peças defeituosas num lote com 400 peças?

Normal

pela

Aprox

Binomial

f

(

)



.

8 , 2 84 , 7 98 , 0 02 , 0 400 ) ( f  npq      DP 8 02 , 0 400 ) ( f  np    E p = 2% n = 400 n.p = 8 > 5 n.q = 392 > 5 ? ) 12 Pr( %) 3 400 Pr( f    f   ) 5 , 12 Pr( ) 12 Pr( f   fNormal         ) Pr( 1,60) 8 , 2 8 5 , 12 Pr( ) 5 , 12 Pr( f Normal Z Z 9452 , 0 4452 , 0 5 , 0 ) 60 , 1 0 Pr( ) 0 Pr(         Z Z

(17)

Exemplo:

Uma Pesquisa Eleitoral mostrou que certo candidato receberá 46% dos votos.

Qual a Prob. de 200 votantes, escolhidos ao acaso, apresentar a maioria dos votos em favor deste candidato?

Normal

pela

Aprox

Binomial

f

(

)



.

04 , 7 68 , 49 54 , 0 46 , 0 200 ) ( f  npq      DP 92 46 , 0 200 ) ( f  np    E p = 46% ; n = 200 ; n.p = 92 > 5 n.q = 108 > 5 ? ) 100 Pr( %) 50 200 Pr( f    f   ) 5 , 100 Pr( ) 100 Pr( f   fNormal         ) ( 1,21) 04 , 7 92 5 , 100 Pr( ) 5 , 100 Pr( fNormal Z P Z 1131 , 0 3869 , 0 5 , 0 ) 21 , 1 0 Pr( ) 0 Pr(         Z Z

(18)

Exemplo: Uma Pesquisa Eleitoral mostrou que certo

candidato receberá 46% dos votos.

Qual deveria ser o tamanho da amostra de votantes para garantir, com uma Prob. de 95% que tal candidato tenha no mínimo 120 votos?

np

npq

Normal

pela

Aprox

f



.

;

2484 , 0 54 , 0 46 , 0 ) ( fnpqn   nDP 46 , 0 ) ( fnpnE p = 46% n = ? % 95 ) 120 Pr( f   95 , 0 ) 5 , 119 Pr( ) 120 Pr( f   fNormal   95 , 0 ) 2484 , 0 46 , 0 5 , 119 Pr( ) 5 , 119 Pr(        n n Z fNormal

Determinar “n” tal que:

Portanto, da Tabela Normal:

0

2484

1

65

46

0

5

119

,

,

,

,

n

n

Resolvendo esta equação, tem-se:

n=232 p/ Z=1,65 n=290 p/ Z=-1,65

Distribuição da Freqüência Amostral f

Logo:

(19)

Distribuição da Freqüência Amostral Relativa p’

p’ : freqüência relativa com que foi

observada alguma característica numa

amostra de tamanho “n”

Amostragem com reposição:

p np n f E n n f E p E             1 ( ) 1 ) ' ( n pq npq n f Var n n f Var p Var             12 ( ) 12 ) ' (

Amostragem sem reposição:

n

f

p

'

p np n f E n n f E p E             1 ( ) 1 ) ' (                               1 1 1 ) ( 1 ) ' ( 2 2 N n N n pq N n N npq n f Var n n f Var p Var

(20)

1

1

2

2

n

x

x

s

n

i

i

X

)

(

Distribuição da Variância Amostral s

2

A Distribuição de

está relacionada com a

importante Distribuição

(QUI-QUADRADO):

2 X

s

 





  

1 2 2 1 2 i i i X X i

z

x

2

(21)

Distribuição 

2

: Qui-Quadrado

     

   2 1 2 2 1





 

i

x

i

i

z

i2 Sejam xi:

• valores aleatórios independentes

• retirados de uma população Normal (  , 2)

Então:

tem Distribuição Qui-Quadrada com  Graus de Liberdade.

: soma dos quadrados de  valores independentes de variável Normal Reduzida

2 

(22)

Distribuição 

2

: Qui-Quadrado

(23)

 Normal quando    (Teorema do Limite Central)

 

2

E

)

 2

(

2

Var

2 2 2 2 2 1 2 1    

Propriedades da Distribuição 

2

)

(

)

(

2

2

Moda

Μο

:

,

2 2 2 1  

independentes Distr. tabelada:

2 Exemplo: P = 10%  = 3

Tabela: linha (  = 3 ) coluna (P = 10% ) tem-se:

Significa: Probabilidade de um valor

aleatório da variável ser maior do que 6,251 é 10% P P   ) Pr( 2 , 2    

251

6

2

,

,

 P

2

(24)

2 2 1 2 2 2 1 2 2 1

1

1

1

x n i i n i i n

s

n

n

x

x

n

x

x

 

)

(

)

(

2 2 2 1 2 2 1 1 ) ( 1 ) (            n n E n s E x n

Mostra-se que:

tem Distribuição

2

Logo:

2

 x

x

i

Portanto:

2 1 2 2

1

n x

n

s

1 2 1 2 1 ) ( 1 ) ( 4 2 2 2 1 2 2 2                      n n n Var n s Var x  n  

(25)

Exemplo: Retirada uma amostra de 11 elementos, ao acaso, obteve-se s2 (x) = 7,08.

Determinar um intervalo que contenha a variância da população 2 com 90% de

probabilidade. 2 1 2 1 2 1 2 2 1 708 11 1 708               n n n n s , ( ) , ) (

90

,

0

)

Pr(

a

2

b

Pr( 702,8 ) 0,90 1     b a n

90 , 0 ) 8 , 70 8 , 70 Pr( 2 1    a bn

2 1 n

Pr(3,940 2 18,307) 0,90 1    n

940 3 8 70 , ,   b

307 18 8 70 , ,   a

90

,

0

)

92

,

17

83

,

3

Pr(

2

2 1 2 2

1

n x

n

s

Tabela: a = 3,83 b = 17,92

(26)

n x z     E(X)   n X DP( )   1 

n

t

n

x

s

x

)

(

Normal t-Student

Distribuição t - Student

A partir de uma amostra aleatória de n valores retirados de uma população N(, 2), obtêm-se a estatística:

z  N(0, 1),

Substituindo-se  (desconhecido) por sx :

( t - Student com  = n-1)

E(tn-1)=0 n  , s(x)    t  N(0,1) x n s z t 1    1 2 1 1       n t n n 2 1 1 1       n n n z t

(27)

Distribuição t - Student

(28)

Exemplo: Retirada uma amostra aleatória de tamanho 4, de uma população Normal, obteve-se:

) , ( n Normal x 2 99 , 0 Pr 0 0                  n e Z n e       2 8,  x sx  0,4

Determinar um intervalo que tenha a probabilidade de

99% de conter a média  da população:Pr(a    b) = 0,99

Seja Pr(-e0   + e0 ) = 0,99 (*)

P( - e0    + ex 0 ) = 0,99 x x

a = - e0 b = + e0 x x De (*):

Pr 0 0  0,99               n e Z n e

0 z0,5% n e   

t sn n s s z n z e x n x x          0,5% ( 0,5% ) ( 1, 0,5%) 0 Tabela: tn13, 0,5%  5,841

1168 4 4 0 841 5 0 , , ,    e a = - ex 0 = 8,2 – 1,168 = 7,032 b = + ex 0 = 8,2 + 1,168 = 9,368 Pr( 7,032    9,368 ) = 0,99

Distribuição t - Student

(29)

Distribuição da Razão entre Variâncias Amostrais

Sejam 2 amostras independentes, de tamanhos n1 e n2, retiradas de populações Normais e

considere suas variâncias amostrais :

s

12

s

22 Deseja-se conhecer a Distribuição de:

2 2 2 1

s

s

Caso as Populações tenham a mesma variância:

)

,

(

.

1

1

2

1

2 2 2 1

Distr

F

de

Snedecor

n

n

s

s

2 2 1 2 2 1 2 2 2 1 1 2 2 2 2 1 1 1 2 1 2 1 2 1

1

1

      n n n n

n

n

s

s

F

;

(valores da Distr. F de Snedecor: TABELADOS)

1

n

(30)

Distribuição da Razão entre Variâncias Amostrais

(31)

Distribuição da Razão entre Variâncias Amostrais

(32)

Distribuição da Razão entre Variâncias Amostrais

(33)

Exemplo: Considere 2 populações Normais com mesma variância, das quais são retiradas

amostras de tamanhos n1=25 e n2=30.

Calcule a prob. da variância da amostra 1 ser maior do que o dobro da variância da amostra 2. Pergunta: ? ) 2 Pr( 2 2 2 1   s s Da Tabela: 05 , 0 ) 90 , 1 Pr(F24; 29   025 , 0 ) 15 , 2 Pr(F24; 29   Logo: ) 025 , 0 05 , 0 ( 90 , 1 15 , 2 90 . 1 2 05 , 0 ) 2 Pr( 2 2 2 1        s s

Distribuição da Razão entre Variâncias Amostrais

) 2 Pr( ) 2 Pr( ) 2 Pr( 2 1; 2 25 1;30 1 2 2 1        F F s s   04 , 0 ) 2 Pr( 2 2 1   s s

(34)
(35)

Referências

Documentos relacionados

Neste estudo não demonstramos benefício do uso de Lactobacillus casei Shirota na recuperação imunológica, bem como na redução nos níveis de marcadores de ativação

No caso de Ω finito, discreto com F sendo todos os subconjuntos de Ω medi- das equivalentes associam probabilidade positiva aos mesmos

Agora, se forem sorteadas 200 amostras, cada uma delas contendo 2 habitantes desse país, e se forem calculadas as 200 respectivas médias amostrais, a partir delas obteremos o

A remessa, por e-mail, de cópia digitalizada da presente Portaria ao Procurador-Geral de Justiça, ao Presidente do Conselho Superior do Ministério Público, ao Coordenador do CAOP

Se de uma população com parâmetros ( µ , σ 2 ) for retirada uma amostra de tamanho suficientemente grande, a distribuição de x será aproximadamente normal, seja

Retirando-se uma amostra de n elementos de uma população normal com média (μ) e variância (σ²), então, a distribuição amostral da variância amostral segue uma distribuição de

 PARALELA: DESENVOLVIDA DURANTE PERÍODO LETIVO, AO LONGO DE CADA BIMESTRE, FORA DO HORÁRIO DE AULAS, POR MEIO DE MÉTODOS E ATIVIDADES DIFERENCIADAS. EM CASO DE DÚVIDA CONSULTE SEMPRE

Mas se zer- mos esse mesmo experimento com o número de lançamentos N cada vez maior, a distribuição de ocorrência de X será gaussiana, segundo o teorema central do limite.. A