• Nenhum resultado encontrado

Métodos Numéricos e Estatísticos Parte II-Métodos Estatísticos Estimação pontual e intervalar

N/A
N/A
Protected

Academic year: 2021

Share "Métodos Numéricos e Estatísticos Parte II-Métodos Estatísticos Estimação pontual e intervalar"

Copied!
41
0
0

Texto

(1)

Estima¸c˜ao por intervalos

etodos Num´

ericos e Estat´ısticos

Parte II-M´

etodos Estat´ısticos

Estima¸c˜

ao pontual e intervalar

Lu´ısa Morgado

Lic. Eng. Biom´

edica e Bioengenharia-2009/2010

(2)

A Teoria das Probabilidades consiste no estudo dos modelos

matem´

aticos capazes de descrever o comportamento de fen´

omenos

aleat´

orios, modelos esses que se dizem probabil´ısticos.

Foi sobre o estudo de tais modelos que nos debru¸

camos nos

cap´ıtulos anteriores.

Daqui em diante falaremos sobre Estat´ıstica, que consiste num

conjunto de t´

ecnicas quantitativas para recolher, apresentar e

interpretar dados relativos a fen´

omenos aleat´

orios.

(3)

Estima¸c˜ao por intervalos

Amostra e dado estat´ıstico

Dada a impossibilidade de observar toda uma popula¸

ao, ´

e

necess´

ario recolher um subconjunto que se pretende representativo

da popula¸c˜

ao. A esse subconjunto d´

a-se o nome de

amostra.

A cada resultado observado, relativo `

a v.a. (ou caracter´ıstica) de

interesse (i.e., uma caracter´ıstica crucial para o conhecimento do

fen´

omeno aleat´

orio em estudo) d´

a-se o nome de

dado estat´ıstico.

(4)

Trata-se de uma vasto conjunto de procedimentos estat´ısticos que

encontra motiva¸c˜

ao na necessidade de obten¸

ao de amostras

representativas de uma popula¸

ao.

Na popula¸

ao as medidas de localiza¸

ao e de dispers˜

ao s˜

ao

fixas e invariantes; s˜

ao caracter´ısticas da popula¸

ao e

designam-se por parˆ

ametros.

Na amostra, estas medidas s˜

ao estimativas dos parˆ

ametros

da popula¸

ao e designam-se por estat´ısticas.

(5)

Estima¸c˜ao por intervalos

Exemplos de alguns tipos de amostragem

Aleat´

oria sistem´

atica: Uma amostra aleat´

oria sistem´

atica ´

e

constitu´ıda pelos elementos da popula¸

ao seleccionados de k

em k elementos.

Aleat´

oria simples: Significa que todos os elementos da

popula¸

ao tˆ

em a mesma probabilidade de serem escolhidos e

de virem a fazer parte da amostra de dimens˜

ao previamente

fixada.

Estratificada: Inicialmente a popula¸

ao ´

e dividida em

estratos e depois selecciona-se uma amostra em cada estrato.

(6)

Com a recolha da amostra obt´

em-se um conjunto de dados cuja

leitura nada parece contribuir para a compreens˜

ao do fen´

omeno

aleat´

orio em estudo.

A estat´ıstica Descritiva resolve parcialmente este problema,

resumindo e/ou organizando a informa¸

ao contida nos dados .

A inferˆ

encia estat´ıstica compreende um vasto conjunto de m´

etodos

que usando a informa¸

ao contida na amostra, responde a quest˜

oes

espec´ıficas da popula¸c˜

ao, tais como

Indicar valores ou intervalos de valores razo´

aveis para

parˆ

ametros desconhecidos da popula¸

ao;

Averiguar a razoabilidade de conjecturas sobre parˆ

ametros

desconhecidos ou fam´ılias de distribui¸

oes (testes de

(7)

Estima¸c˜ao por intervalos

Sejam

X uma v.a. de interesse;

X

1

, X

2

, . . . , X

n

v.a independentes e identicamente

distribu´ıdas (i.i.d.) a X , i.e., X

i

i .i .d

X ,

i = 1, 2, . . . , n.

Ent˜

ao o vector aleat´

orio X = (X

1

, X

2

, . . . , X

n

) diz-se uma

amostra aleat´

oria (a.a.)

de dimens˜

ao n proveniente da

popula¸

ao X .

`

A observa¸

ao particular da a.a. X = (X

1

, X

2

, . . . , X

n

) d´

a-se

o nome de amostra e representa-se por x = (x

1

, x

2

, . . . , x

n

).

Amostra

(8)

probabil´ıstica da a.a. ´

e dada por

1

Caso discreto

P(X = x )

=

P(X

1

= x

1

, X

2

= x

2

, . . . , X

n

= x

n

)

=

P(X

1

= x

1

) × . . . × P(X

n

= x

n

)

=

n

Y

i =1

P(X

i

= x

i

) =

n

Y

i =1

P(X = x

i

)

2

Caso cont´ınuo

f

X

(x )

=

f

X1,X2,...,Xn

(x

1

, x

2

, . . . , x

n

)

=

f

X1

(x

1

) × . . . × f

Xn

(x

n

)

n n

(9)

Estima¸c˜ao por intervalos

Seja X = (X

1

, X

2

, . . . , X

n

) a.a.de dimens˜

ao n proveniente da

popula¸

ao X .

T diz-se uma estat´ıstica se se tratar de uma fun¸c˜

ao exclusiva

da a.a. i.e., T = T (X ).

Note que T n˜

ao depende de nenhum parˆ

ametro desconhecido.

Estat´ıstica

Exemplo

Estat´ıstica Valor observado da estat´ıstica

M´ınimo da a.a. X(1)= mini =1,...,nXi x(1)= mini =1,...,nxi M´aximo da a.a. X(n)= maxi =1,...,nXi x(n)= mini =1,...,nxi Amplitude da a.a. R = X(n)− X(1) r = x(n)− x(1) M´edia da a.a. X =1

nPni =1Xi x =1nPni =1xi Var. corrigida da a.a. S

2= 1 n−1 Pn i =1(Xi− X )2 =n−11 Pni =1Xi2− 1 n−1X 2 s2= 1 n−1Pni =1(xi− x)2 = 1 n−1 Pn i =1xi2−n−11 x2

Var. n˜ao corrigida da a.a. S 02=1 nPni =1(Xi− X )2 =1nPni =1Xi2−1 nX 2 s02=1nPni =1(xi− x)2 = 1 nPni =1xi2−1nx2

(10)

O objectivo principal da Estat´ıstica ´

e inferir sobre caracter´ısticas da

v.a. de interesse com base na amostra recolhida. Considera-se,

geralmente, que a distribui¸c˜

ao de X ´

e parcial ou totalmente

desconhecida

Parcialmente desconhecida, se conhecermos o tipo

distribucional de X (p.e., Poisson) a menos de um ou mais

parˆ

ametros

Totalmente desconhecida, se o tipo distribucional de X for

especificado de modo muito vago (p.e., distribui¸

ao discreta).

(11)

Estima¸c˜ao por intervalos

Parˆ

ametro desconhecido e espa¸co param´

etrico

Um parˆ

ametro desconhecido ser´

a daqui em diante representado por

θ.

O espa¸co param´

etrico corresponde ao conjunto de todos os valores

poss´ıveis para o parˆ

ametro θ e representa-se por Θ.

Tendo como objectivo adiantar valores razo´

aveis para os

parˆ

ametros desconhecidos na distribui¸

ao da vari´

avel de interesse,

iremos recorrer a estat´ısticas com caracter´ısticas especiais, a que

chamaremos estimadores.

(12)

A estat´ıstica T = T (X ) diz-se um estimador do parˆ

ametro

desconhecido θ se T = T (X ) apenas toma valores no espa¸

co

param´

etrico Θ.

Estimador

Ao valor observado do estimador de θ, t = T (x ) d´

a-se o

nome de estimativa de θ.

Estimativa

Note que o estimador ´

e uma v.a. e como tal tem uma distribui¸

ao

de probabilidade.

(13)

Estima¸c˜ao por intervalos

Um estimador conduzir´

a a estimativas mais rigorosas se usufruir de

algumas propriedades. Vejamos quais.

O estimador do parˆ

ametro desconhecido θ diz-se centrado se

E [T (X )] = θ.

Estimador centrado

O estimador do parˆ

ametro desconhecido θ diz-se enviesado se

∃θ ∈ Θ : E [T (X )] 6= θ.

Estimador enviesado

(14)

O estimador do parˆ

ametro desconhecido θ possui enviesamento dado

por

bias

θ

[T (X )] 6= E [T (X )] − θ.

Enviesamento de um estimador

Notas:

Um estimador centrado possui enviesamento nulo;

Regra geral h´

a mais do que um estimador para um mesmo

parˆ

ametro desconhecido. Quanto menor for o enviesamento

de um estimador mais rigorosas ser˜

ao as estimativas por ele

fornecidas.

(15)

Estima¸c˜ao por intervalos

Suponhamos que X ´e uma v.a. de interesse com distribui¸c˜ao arbitr´aria, valor esperado µ e variˆancia σ2.

A m´edia da a.a. X =1 n

Pn

i =1Xi ´e um estimador centrado de µ pois

E (X ) = E 1 n n X i =1 Xi ! = 1 n n X i =1 E (Xi) = 1 n n X i =1 E (X ) = 1 n n X i =1 µ =1 nnµ = µ A variˆancia corrigida ´e um estimador centrado de σ2uma vez que

E (S2) = E " 1 n − 1 n X i =1 (Xi− X )2 # = 1 n − 1E " n X i =1 Xi2 ! − n(aX )2 # = 1 n − 1 " n X i =1 E (Xi2) − nE [(X )2] # = 1 n − 1 ( n X i =1 [V (Xi) + E2(Xi)] − n[V (X ) + E2(X )] ) = 1 n − 1 " n X i =1 (σ2+ µ2) − n σ 2 n + µ 2 # = 1 n − 1(nσ 2+ nµ2− σ2− nµ2) = 1 n − 1(n − 1)σ 2= σ2.

(16)

ao basta que um estimador seja centrado para garantir

estimativas mais rigorosas. Estas ser˜

ao tanto mais rigorosas

quanto menos o estimador se dispersar em torno do verdadeiro

valor do parˆ

ametro desconhecido.

O erro quadr´

atico m´

edio do estimador T = T (X ), do parˆ

ametro

desconhecido θ ´

e dado por

EQM

θ

[T (X )]

=

E

[T (X ) − θ]

2

= V [T (X )] + {E [T (X )] − θ}

2

=

V [T (X )] + {bias

θ

[T (X )]}

2

Erro quadr´

atico m´

edio

O EQM quantifica a dispers˜ao esperada do estimador em torno do parˆametro desconhecido;

(17)

Estima¸c˜ao por intervalos

Eficiˆ

encia relativa de estimadores

Sendo T

1

(X ) e T

2

(X ) dois estimadores de um mesmo parˆ

ametro

desconhecido θ, define-se

eficiˆ

encia

de T

1

em rela¸

ao a T

2

por

e

θ

[T

1

(X ), T

2

(X )] =

EQM

θ

[T

2

(X )]

EQM

θ

[T

1

(X )]

.

Assim, se

e

θ

[T

1

(X ), T

2

(X )] > 1 ⇔ EQM

θ

[T

2

(X )] > EQM

θ

[T

1

(X )],

e portanto o estimador T

1

(X ) ´

e mais eficiente que o estimador

T

2

(X ).

(18)

Este m´etodo permite obter o valor mais razo´avel de um parˆametro desconhecido, de entre todos os valores poss´ıveis para esse mesmo parˆametro, tendo em conta a amostra recolhida.

A fun¸c˜ao de verosimilhan¸ca L(θ|x ) : Θ → R define-se do seguinte modo: Caso discreto L(θ|x ) = P(X = x |θ) = n Y i =1 P(X = xi|θ), θ ∈ Θ Caso cont´ınuo L(θ|x ) = fX(x |θ) = n Y i =1 fX(xi|θ), θ ∈ Θ

onde P(·|θ) e fX(·|θ) s˜ao a f.p e a f.d.p (resp.) da v.a. de interesse X , tendo em

(19)

Estima¸c˜ao por intervalos

Obtida a a amostra x = (x

1

, . . . , x

n

), a estimativa de m´

axima

verosimilhan¸ca (EMV) do parˆ

ametro desconhecido corresponde ao

ponto de m´

aximo da fun¸

ao de verosimilhan¸ca ou, equivalentemente,

ao ponto de m´

aximo do logaritmo da fun¸

ao de verosimilhan¸

ca. Esta

estimativa representa-se por ˆ

θ e ´

e ent˜

ao dada por

L(ˆ

θ|x ) = max

θ∈Θ

L(θ|x )

ou equivalentemente

ln L(ˆ

θ|x ) = max

θ∈Θ

ln L(θ|x )

Estimativa de m´

axima verosimilhan¸

ca

(20)

Exemplo

Um inqu´erito realizado a um grupo de 1000 indiv´ıduos com queixas de ins´onia revelou que 448 respondem ter dormido bem ap´os a toma de um certo sopor´ıfero.

Deduza a EMV da probabilidade (p) de uma pessoa escolhida ao acaso ter dormido bem tendo tomado o sopor´ıfero.

V.a. de interesse: X =resposta ao inqu´erito Distribui¸c˜ao:

X ∼Bernoulli(p)

Parˆametro desconhecido: p = P(X = 1), 0 ≤ p ≤ 1 F.p.:

P(X = x ) = px(1 − p)1−x, x = 0, 1

Amostra:

x = (x1, . . . , xn) amostra de dimens˜ao n = 1000, proveniente da popula¸c˜ao onde

xi = resposta de i-´esima pessoa. 448

(21)

Estima¸c˜ao por intervalos

Exemplo (cont.)

Fun¸

ao de verosimilhan¸

ca:

L(p|x ) =

Q

n

i =1

P(X = x

i

) =

Q

n

i =1

p

xi

(1 − p)

1−xi

 =

p

Pni =1xi

(1 − p)

n−Pni =1xi

Fun¸

ao de log-verosimilhan¸

ca:

ln L(p|x ) = ln



p

Pni =1xi

(1 − p)

n− Pn i =1xi



=

ln(p)

P

n i =1

x

i

+ ln(1 − p) (n −

P

ni =1

x

i

)

Maximiza¸

ao: A EMV de p, ˆ

p, obt´

em-se resolvendo

ˆ

p :

(

d ln L(p|x ) dp

|

p=ˆp

= 0

(ponto de estacionaridade)

d2ln L(p|x ) dp2

|

p=ˆp

< 0

(ponto de m´

aximo)

(22)

Exemplo (cont.)

ˆ p :    d[ln(p)Pni =1xi+ln(1−p)(n−Pni =1xi)] dp |p=ˆp= 0 d2[ln(p)Pni =1xi+ln(1−p)(n−Pni =1xi)] dp2 |p=ˆp< 0 ⇔    Pn i =1xi p − n−Pni =1xi 1−p  |p=ˆp= 0  −Pni =1xi p2 − n−Pni =1xi (1−p)2  |p=ˆp< 0 ⇔    Pn i =1xi ˆ p − n−Pn i =1xi 1−ˆp  = 0 −Pni =1xi ˆ p2 − n−Pni =1xi (1−ˆp)2 < 0 ⇔ ( (1 − ˆp)Pn i =1xi− ˆp n −Pni =1xi = 0 − Pn i =1xi ˆ p2 − n−Pn i =1xi (1−ˆp)2 < 0 ⇔  ˆ p = 1nPn i =1xi proposi¸c˜ao verdadeira

(23)

Estima¸c˜ao por intervalos

Exemplo (cont.)

Estimador de MV de p: EMV (p) = 1 n Pn i =1Xi= X (m´edia da amostra). Concretiza¸c˜ao: ˆ p = 1 n n X i =1 xi = n ode respostas afirmativas node pessoas inquiridas = 0.448

(24)

Exemplo

Os tempos observado (em anos) at´e `a 1acolis˜ao de detritos espaciais com diˆametro

inferior a 1mm em 4 sat´elites em MEO foram de 1.2, 1.5, 1.8 e 1.4.

Admitindo que tal tempo tem distribui¸c˜ao pertencente ao modelo exponencial de parˆametro λ, vamos determinar o estimador e a estimativa de MV de λ.

V.a. de interesse:

X =tempo (em anos) at´e `a 1acolis˜ao de detritos espaciais

Distribui¸c˜ao: X ∼exponencial(λ) Parˆametro desconhecido: λ, λ > 0 F.d.p.: fX(x ) =  λe−λx, x ≥ 0 0, c.c. Amostra:

x = (x1, . . . , xn) amostra de dimens˜ao n = 4, proveniente da popula¸c˜ao onde

(25)

Estima¸c˜ao por intervalos

Exemplo (cont.)

Fun¸

ao de verosimilhan¸

ca:

L(λ|x ) =

Q

n

i =1

f

X

(x

i

) =

Q

n

i =1

λe

−λxi

 = λ

n

e

−λPni =1xi

Fun¸

ao de log-verosimilhan¸

ca:

ln L(λ|x ) = ln



λ

n

e

−λPni =1xi



= n ln(λ) − λ

P

n

i =1

x

i

Maximiza¸

ao: A EMV de λ, ˆ

λ, obt´

em-se resolvendo

ˆ

λ :

(

d ln L(λ|x ) d λ

|

λ=ˆλ

= 0

(ponto de estacionaridade)

d2ln L(λ|x ) d λ2

|

λ=ˆλ

< 0

(ponto de m´

aximo)

(26)

Exemplo (cont.)

ˆ

λ

:



n λ

P

n i =1

x

i

 |

λ=ˆλ

= 0

λn2

|

λ=ˆλ

< 0

(

n ˆ λ

P

n i =1

x

i

= 0

ˆn λ2

< 0

(

ˆ

λ =

Pnn i =1xi

proposi¸

ao verdadeira

(27)

Estima¸c˜ao por intervalos

Exemplo (cont.)

Estimador de MV de p: EMV (λ) =Pnn i =1Xi = (X ) −1(m´edia da amostra). Concretiza¸c˜ao: ˆ λ = Pnn i =1xi

= (¯x )−1 inverso da m´edia da amostra = 1.475−1= 0.678

Nota: Repare que n˜ao se trata de um estimador centrado de λ.

(28)

A caracteriza¸c˜ao probabil´ıstica de estat´ısticas, de estimadores ou de suas fun¸c˜oes ´e crucial n˜ao s´o para avaliar as propriedades dos estimadores (como p.e., enviesamento, EQM, eficiˆencia), mas tamb´em como veremos a seguir, para obter estimativas intervalares dos parˆametros desconhecidos (aos quais chamaremos intervalos de confian¸ca).

´

E ent˜ao fundamental conhecer a distribui¸c˜ao de uma estat´ıstica, de um estimador ou de sua fun¸c˜ao, `a qual chamamosdistribui¸c˜ao amostral(ou distribui¸c˜ao por

amostragem).

Exemplo

Sendo X = (X1, . . . , Xn) uma a.a. de dimens˜ao n proveniente da popula¸c˜ao X com

f.d. FX(x ), ent˜ao facilmente se mostra que

Estat´ıstica Distribui¸c˜ao amostral X(1)= mini =1,...,nXi FX(1)(x ) = 1 − [1 − FX(x )]n

(29)

Estima¸c˜ao por intervalos

A m´edia ´e, em geral, o estimador de MV (ou de alguma forma est´a com ele relacionada) do valor esperado de uma v.a. de interesse, pelo que ´e fundamental conhecer a sua distribui¸c˜ao.

Seja X = (X1, . . . , Xn) uma a.a. de dimens˜ao n proveniente da popula¸c˜ao X . Ent˜ao

Popula¸c˜ao Distribui¸c˜ao amostral da m´edia X ∼normal(µ, σ2) X ∼normal(µ,σ2

n)

X com distribui¸c˜ao arbitr´aria (n˜ao normal)

E (X ) = µ, V (X ) = σ2, n grande X −µ√σ n

∼normal(0, 1)

O 1odos dois resultados ´e exacto e deve-se ao facto de a combina¸ao linear de

normais ainda possuir distribui¸c˜ao normal.

O 2oresultado ´e aproximado e ´e conhecido como oTeorema do Limite Centrale s´o

deve ser aplicado quando a v.a. n˜ao tem distribui¸c˜ao normal e a dimens˜ao da amostra ´e suficientemente grande.

(30)

Assuma que a press˜ao sist´olica de uma popula¸c˜ao saud´avel segue uma distribui¸c˜ao normal de m´edia 120mmHg e desvio padr˜ao 10mmHg . Num grupo de 25 pessoas, a m´edia da press˜ao sist´olica foi de 124mmHg .

Qual a probabilidade de se encontrar uma m´edia superior a esta numa amostra de 25 indiv´ıduos? Ou, dito de outro modo, qual a propor¸c˜ao de amostras de 25 indiv´ıduos escolhidas ao acaso nessa popula¸c˜ao que tˆem uma m´edia superior a 124mmHg ? De acordo com o 1odos resultados anteriores, a distribui¸ao amostral da m´edia segue

uma distribui¸c˜ao normal de parˆametros µ = 120 e σ2=100

25 = 4, i.e.,

X ∼normal(120, 4).

A probabilidade pedida ´e ent˜ao dada por

P(X > 124) = 1 − P(X ≤ 124) = 1 − FX(124) = 0.023

no scilab:

cdfnor(”PQ”, 124, 120, 2) = 0.977 com consulta das tabelas Sendo Z = X −120∼normal(0, 1)

(31)

Estima¸c˜ao por intervalos

Intervalos de confian¸ca

Para al´

em de uma estimativa pontual para um parˆ

ametro

desconhecido ´

e importante obter um intervalo que nos dˆ

e uma

ideia da confian¸

ca que se pode depositar na estimativa pontual.

Essa estimativa intervalar ´

e designada por intervalo de confian¸

ca

(IC).

A um intervalo de confian¸ca est´

a associado um grau de confian¸

ca,

usualmente representado por (1 − α) × 100%, cujos valores mais

usuais s˜

ao 90%, 95% e 99% (ou, α = 0.1, 0.05, 0.01,

respectivamente).

Antes de mais ´

e necess´

ario descever a situa¸

ao com que lidamos,

em particular

a v.a. X de interesse e a respectiva distribui¸

ao

o parˆ

ametro desconhecido para o qual se pretende obter um IC

outro eventual parˆ

ametro (conhecido ou n˜

ao) da distribui¸

ao

de X .

(32)

IC para o valor esperado de uma popula¸c˜ao normal com variˆancia conhecida

Sendo Z =X −µσ n

, pretendemos determinar aαe bαtal que

P(aα≤ Z ≤ bα) = 1 − α

ou ainda, recorrendo `as tabelas ou ao scilab, determinar aαe bα tal que

 P(Z < aα) =α2 P(Z > bα) = α2 ⇔  aα= Φ−1 α2 = −Φ−1 1 −α2 bα= Φ−1 1 −α2 Assim P(aα≤ Z ≤ bα) = 1 − α ⇔ P(aα≤ X − µ σ √ n ≤ bα) = 1 − α ⇔ P  X − bα× σ √ n≤ µ ≤ X − aα× σ √ n  = 1 − α ⇔ P  X − Φ−11 −α 2  ×√σ n≤ µ ≤ X + Φ −1 1 −α 2  ×√σ n  = 1 − α

(33)

Estima¸c˜ao por intervalos

IC para a m´

edia, variˆ

ancia conhecida

IC para o valor esperado de uma popula¸c˜ao arbitr´aria com variˆancia conhecida

Sendo Z =X −µσ n

∼normal(0, 1) (Teorema do limite central), pretendemos determinar aαe bαtal que

P(aα≤ Z ≤ bα) ' 1 − α

ou ainda, recorrendo `as tabelas ou ao scilab, determinar aαe bα tal que

 P(Z < aα) =α2 P(Z > bα) = α2 ⇐  aα= Φ−1 α2 = −Φ−1 1 −α2 bα= Φ−1 1 −α2 Assim P(aα≤ Z ≤ bα) = 1 − α ⇔ P(aα≤ X − µ σ √ n ≤ bα) ' 1 − α ⇔ P  X − bα× σ √ n≤ µ ≤ X − aα× σ √ n  ' 1 − α ⇔ P  X − Φ−1  1 −α 2  ×√σ n≤ µ ≤ X + Φ −1 1 −α 2  ×√σ n  ' 1 − α IC(1−α)×100%(µ) =  x − Φ−11 −α 2  ×√σ n, x + Φ −1 1 −α 2  ×√σ n 

(34)

Exemplo

O QI numa popula¸

ao segue uma distribui¸

ao normal de variˆ

ancia

15

2

. Com base numa amostra de dimens˜

ao 25, com m´

edia

amostral de 100, vejamos como contruir o IC a 95% para a m´

edia

na popula¸c˜

ao.

Ora

IC

(1−α)×100%

(µ) =



x − Φ

−1



1 −

α

2



×

σ

n

, x + Φ

−1



1 −

α

2



×

σ

n



onde, neste caso α = 0.05.

No scilab, o comando

cdfnor(”X ”, 0, 1, 1 −

0.052

,

0.052

)

devolve-nos o

valor de Φ

−1

1 −

0.052

 = 1.96, logo



(35)

Estima¸c˜ao por intervalos

Quando n˜ao conhecemos o valor de σ2na popula¸c˜ao, ent˜ao a v.a. X −µ√σ n

∼normal(0, 1) deixa de ser ´util. Neste caso, σ2ser´a estimado por S2e usa-se a v.a.

Z =X − µS

√ n

∼ tn−1

e lˆe-se Z possui distribui¸c˜ao de t-student com (n − 1) graus de liberdade. A distribui¸c˜ao de t-student ´e semelhante `a distribui¸c˜ao normal reduzida. ´E sim´etrica em rela¸c˜ao `a m´edia, (0), mas com um desvio padr˜ao dependente de um parˆametro denominado graus de liberdade;

Existe uma distribui¸c˜ao de t-student diferente para cada node graus de

liberdade;

Geralmente, os graus de liberdade correspondem `a diferen¸c a entre a dimens˜ao amostral e o node parˆametros a estimar.

(36)

IC para o valor esperado de uma popula¸c˜ao normal com variˆancia desconhecida

Sendo Z =X −µS n

∼ t(n−1), pretendemos determinar aαe bαtal que

P(aα≤ Z ≤ bα) ' 1 − α

ou ainda, recorrendo `as tabelas ou ao scilab, determinar aαe bα tal que

 P(Z < aα) = α2 P(Z > bα) =α2 ⇐ ( aα= Ft−1(n−1) α2 = −F −1 t(n−1) 1 −α2  bα= Ft−1(n−1) 1 −α2  P(aα≤ Z ≤ bα) = 1 − α ⇔ P(aα≤ X − µ S √ n ≤ bα) ' 1 − α ⇔ P  X − bα× S √ n≤ µ ≤ X − aα× S √ n  ' 1 − α ⇔ P  X − Ft−1(n−1)  1 −α 2  ×√S n≤ µ ≤ X + F −1 t(n−1)  1 −α 2  ×√S n  ' 1 − α

(37)

Estima¸c˜ao por intervalos

Exemplo

A dura¸c˜ao em horas de uma pilha de certa m´aquina possui distribui¸c˜ao que se admite normal com valor esperado e variˆancia desconhecidas. Recolheu-se uma amostra de 10, tendo-se obtido o seguinte conjunto de dados:

x = (251, 238, 236, 229, 252, 253, 245, 242, 235, 230). Determinemos um intervalo de confian¸ca a 99% para µ. Considerando a v.a. Z =X −µS

n

∼ t(n−1), o IC pedido ´e dado por

IC(1−α)×100%(µ) =  x − Ft−1(n−1)  1 −α 2  ×√s n, x + F −1 t(n−1)  1 −α 2  ×√s n  onde α = 0.01, n = 10, x = 241.1, s2= 79.66 e F−1 t(n−1) 1 −α2 = F −1 t(9 1 −0.012 .

No scilab, o comandocdft(”T ”, 9, 1 −0.012 ,0.012 )devolve-nos o valor de = Ft−1 (9) 1 − 0.01 2  = 3.2498, logo IC99%(µ) = " 241.1 − 3.2498 ×r 79.66 10 , 241.1 + 3.2498 × r 79.66 10 # = [231.927, 250.273]

(38)

IC para o valor esperado de uma popula¸c˜ao arbitr´aria com variˆancia desconhecida

Usa-se a v.a. Z =X −µ√S n

∼normal(0, 1) (Teorema do limite central). Pretendemos determinar aα e bαtal que

P(aα≤ Z ≤ bα) ' 1 − α

Recorrendo `as tabelas ou ao scilab, determinar aα e bαtal que

 P(Z < aα) =α2 P(Z > bα) = α2 ⇐  aα= Φ−1 α2 = −Φ−1 1 −α2  bα= Φ−1 1 −α2  P(aα≤ Z ≤ bα) = 1 − α ⇔ P(aα≤ X − µ S √ n ≤ bα) ' 1 − α ⇔ P  X − bα× S √ n≤ µ ≤ X − aα× S √ n  ' 1 − α ⇔ P  X − Φ−11 −α×√S ≤ µ ≤ X + Φ−11 −α×√S  ' 1 − α

(39)

Estima¸c˜ao por intervalos

IC para a variˆ

ancia de uma popula¸c˜

ao normal

IC para a variˆancia de uma popula¸c˜ao normal com valor esperado desconhecido

Usa-se a v.a. Z =(n−1)Sσ2 2

√ n

∼ χ2

(n−1)e lˆe-se Z possui distribui¸c˜ao do qui-quadrado com

(n − 1) graus de liberdade. Como esta distribui¸c˜ao n˜ao ´e sim´etrica em rela¸c˜ao `a origem e tem com suporte R+temos que determinar a

αe bα tal que P(aα≤ Z ≤ bα) ' 1 − α  P(Z < aα) =α2 P(Z > bα) = α2 ⇐        aα= Fχ2−1 (n−1)  α 2  bα= Fχ2−1 (n−1)  1 −α 2  P(aα≤ Z ≤ bα) = 1 − α ⇔ P   aα≤ (n − 1)S2 σ2 √ n ≤ bα   ' 1 − α ⇔ P      (n − 1)S2 F−1 χ2(n−1)  1 −α 2 ≤ σ 2 (n − 1)S2 F−1 χ2(n−1)  α 2       ' 1 − α IC(1−α)×100%(σ2) =      (n − 1)S2 F−1 χ2 (n−1)  1 −α 2  , (n − 1)S2 F−1 χ2 (n−1)  α 2      

(40)

IC para a variˆancia de uma popula¸c˜ao normal com valor esperado conhecido

Procede-se como no caso anterior mas a distribui¸c˜ao de Z passa a ter (n) graus de liberdade.

Nota: No scilab, o comandocdfchi(”X ”, n,α2, 1 −α2)devolve o valor de F−1

χ2 (n)

α 2

(41)

Estima¸c˜ao por intervalos

IC para uma propor¸c˜

ao

Consideremos a popula¸c˜ao X ∼Bernoulli(p), onde a probabilidade de sucesso, p, ´e desconhecida. Consideramos que a dimens˜ao da amostra, n, ´e suficientemente grande (n > 30).

Considera-se a v.a., com distribui¸c˜ao aproximada: Z =rX −p X (1−X ) n ∼normal(0, 1). Determinamos aα e bαpor  aα= −Φ−1 1 −α2  bα= Φ−1 1 −α2  P(aα≤ Z ≤ bα) ' 1 − α ⇔ P   aα≤ X − p q X (1−X ) n ≤ bα   ' 1 − α ⇔ P  X − Φ−1  1 −α 2  × s X (1 − X ) n ≤ p ≤ X + Φ −1 1 −α 2  × s X (1 − X ) n   ' 1 − α

O seguinte IC possui grau de confian¸ca aproximadamente igual a (1 − α) × 100%: IC (p) =  x − Φ−1 1 −α2 ×qx (1−x ) n , x + Φ −1 1 −α 2 × q x (1−x ) n 

Referências

Documentos relacionados

para cada amostra, calculamos o valor observado, t , da estat´ıstica T ; os novos valores t formam uma nova popula¸ c˜ ao, cuja distribui¸ c˜ ao recebe o nome de distribui¸ c˜

Conduza os testes apropriados e fa¸ ca intervalos de confian¸ ca para a diferen¸ca de m´ edias populacionais... Queremos verificar se as resistˆ encias de dois tipos de vigas de a¸

Trata-se de uma concretiza¸ c˜ ao do IAC quando se obt´ em a amostra (x 1 ,.. , x n ), o intervalo passa a ser num´ erico e a interpreta¸ c˜ ao conveniente ´ e: se obtivermos v´

Os dois cap´ıtulos anteriores apresentaram intervalos de confian¸ ca e testes de hip´ oteses para o parˆ ametro de uma ´ unica popula¸ c˜ ao (a m´ edia µ, a variˆ ancia σ 2 ou

De experiˆ encias anteriores, considera-se que a resistˆ encia ao desmoronamento de tais tijolos ´ e normalmente distribu´ıda com valor m´ edio superior ou igual a 200 kg e

Para decidir qual tecnologia será comercializada, a empresa esta interessada em determinar se existe diferença na proporção de ingressos falsos detectados pelos dois

Um conjunto X dotado de uma rela¸c˜ ao de ordem parcial ´e dito ser um conjunto bem-ordenado se todo subconjunto A n˜ ao vazio de X tem um elemento m´ınimo em A.. Mostre que

Mostre que todo conjunto bem-ordenado segundo uma rela¸c˜ ao parcial de ordem ´e tamb´em totalmente ordenado.. segundo a mesma