Métodos Numéricos e Estatísticos Parte II-Métodos Estatísticos Estimação pontual e intervalar

(1)

Estima¸c˜ao por intervalos

M´

etodos Num´

ericos e Estat´ısticos

Parte II-M´

etodos Estat´ısticos

Estima¸c˜

ao pontual e intervalar

Lu´ısa Morgado

Lic. Eng. Biom´

edica e Bioengenharia-2009/2010

(2)

A Teoria das Probabilidades consiste no estudo dos modelos

matem´

aticos capazes de descrever o comportamento de fen´

omenos

aleat´

orios, modelos esses que se dizem probabil´ısticos.

Foi sobre o estudo de tais modelos que nos debru¸

camos nos

cap´ıtulos anteriores.

Daqui em diante falaremos sobre Estat´ıstica, que consiste num

conjunto de t´

ecnicas quantitativas para recolher, apresentar e

interpretar dados relativos a fen´

omenos aleat´

orios.

(3)

Amostra e dado estat´ıstico

Dada a impossibilidade de observar toda uma popula¸

c˜

ao, ´

e

necess´

ario recolher um subconjunto que se pretende representativo

da popula¸c˜

ao. A esse subconjunto d´

a-se o nome de

amostra.

A cada resultado observado, relativo `

a v.a. (ou caracter´ıstica) de

interesse (i.e., uma caracter´ıstica crucial para o conhecimento do

fen´

omeno aleat´

orio em estudo) d´

a-se o nome de

dado estat´ıstico.

(4)

Trata-se de uma vasto conjunto de procedimentos estat´ısticos que

encontra motiva¸c˜

ao na necessidade de obten¸

c˜

ao de amostras

representativas de uma popula¸

c˜

ao.

Na popula¸

c˜

ao as medidas de localiza¸

c˜

ao e de dispers˜

ao s˜

ao

fixas e invariantes; s˜

ao caracter´ısticas da popula¸

c˜

ao e

designam-se por parˆ

ametros.

Na amostra, estas medidas s˜

ao estimativas dos parˆ

ametros

da popula¸

c˜

ao e designam-se por estat´ısticas.

(5)

Exemplos de alguns tipos de amostragem

Aleat´

oria sistem´

atica: Uma amostra aleat´

oria sistem´

atica ´

e

constitu´ıda pelos elementos da popula¸

c˜

ao seleccionados de k

em k elementos.

Aleat´

oria simples: Significa que todos os elementos da

popula¸

c˜

ao tˆ

em a mesma probabilidade de serem escolhidos e

de virem a fazer parte da amostra de dimens˜

ao previamente

fixada.

Estratificada: Inicialmente a popula¸

c˜

ao ´

e dividida em

estratos e depois selecciona-se uma amostra em cada estrato.

(6)

Com a recolha da amostra obt´

em-se um conjunto de dados cuja

leitura nada parece contribuir para a compreens˜

ao do fen´

omeno

aleat´

orio em estudo.

A estat´ıstica Descritiva resolve parcialmente este problema,

resumindo e/ou organizando a informa¸

c˜

ao contida nos dados .

A inferˆ

encia estat´ıstica compreende um vasto conjunto de m´

etodos

que usando a informa¸

c˜

ao contida na amostra, responde a quest˜

oes

espec´ıficas da popula¸c˜

ao, tais como

Indicar valores ou intervalos de valores razo´

aveis para

parˆ

ametros desconhecidos da popula¸

c˜

ao;

Averiguar a razoabilidade de conjecturas sobre parˆ

ametros

desconhecidos ou fam´ılias de distribui¸

c˜

oes (testes de

(7)

Sejam

X uma v.a. de interesse;

X

1

, X

2

, . . . , X

n

v.a independentes e identicamente

distribu´ıdas (i.i.d.) a X , i.e., X

i

∼

i .i .d

X ,

i = 1, 2, . . . , n.

Ent˜

ao o vector aleat´

orio X = (X

1

, X

2

, . . . , X

n

) diz-se uma

amostra aleat´

oria (a.a.)

de dimens˜

ao n proveniente da

popula¸

c˜

ao X .

`

A observa¸

c˜

ao particular da a.a. X = (X

1

, X

2

, . . . , X

n

) d´

a-se

o nome de amostra e representa-se por x = (x

1

, x

2

, . . . , x

n

).

Amostra

(8)

probabil´ıstica da a.a. ´

e dada por

1

_{Caso discreto}

P(X = x )

=

P(X

1

= x

1

, X

2

= x

2

, . . . , X

n

= x

n

)

=

P(X

1

= x

1

) × . . . × P(X

n

= x

n

)

=

n

Y

i =1

P(X

i

= x

i

) =

n

Y

i =1

P(X = x

i

)

2

Caso cont´ınuo

f

X

(x )

=

f

X1,X2,...,Xn

(x

1

, x

2

, . . . , x

n

)

=

f

X1

(x

1

) × . . . × f

Xn

(x

n

)

n n

(9)

Seja X = (X

1

, X

2

, . . . , X

n

) a.a.de dimens˜

ao n proveniente da

popula¸

c˜

ao X .

T diz-se uma estat´ıstica se se tratar de uma fun¸c˜

ao exclusiva

da a.a. i.e., T = T (X ).

Note que T n˜

ao depende de nenhum parˆ

ametro desconhecido.

Estat´ıstica

Exemplo

Estat´ıstica Valor observado da estat´ıstica

M´ınimo da a.a. X₍₁₎= mini =1,...,nXi x(1)= mini =1,...,nxi M´aximo da a.a. X_(n)= maxi =1,...,nXi x(n)= mini =1,...,nxi Amplitude da a.a. R = X(n)− X(1) r = x(n)− x(1) M´edia da a.a. X =1

nPni =1Xi x =1nPni =1xi Var. corrigida da a.a. S

2₌ 1 n−1 Pn i =1(Xi− X )2 =_n−11 Pn_{i =1}X_i2− 1 n−1X 2 s2₌ 1 n−1Pni =1(xi− x)2 = 1 n−1 Pn i =1xi2−n−11 x2

Var. n˜ao corrigida da a.a. S 02₌1 nPni =1(Xi− X )2 =1_nPn_{i =1}X_i2−1 nX 2 s02=1_nPn_{i =1}(xi− x)2 = 1 nPni =1xi2−1nx2

(10)

O objectivo principal da Estat´ıstica ´

e inferir sobre caracter´ısticas da

v.a. de interesse com base na amostra recolhida. Considera-se,

geralmente, que a distribui¸c˜

ao de X ´

e parcial ou totalmente

desconhecida

Parcialmente desconhecida, se conhecermos o tipo

distribucional de X (p.e., Poisson) a menos de um ou mais

parˆ

ametros

Totalmente desconhecida, se o tipo distribucional de X for

especificado de modo muito vago (p.e., distribui¸

c˜

ao discreta).

(11)

Parˆ

ametro desconhecido e espa¸co param´

etrico

Um parˆ

ametro desconhecido ser´

a daqui em diante representado por

θ.

O espa¸co param´

etrico corresponde ao conjunto de todos os valores

poss´ıveis para o parˆ

ametro θ e representa-se por Θ.

Tendo como objectivo adiantar valores razo´

aveis para os

parˆ

ametros desconhecidos na distribui¸

c˜

ao da vari´

avel de interesse,

iremos recorrer a estat´ısticas com caracter´ısticas especiais, a que

chamaremos estimadores.

(12)

A estat´ıstica T = T (X ) diz-se um estimador do parˆ

ametro

desconhecido θ se T = T (X ) apenas toma valores no espa¸

co

param´

etrico Θ.

Estimador

Ao valor observado do estimador de θ, t = T (x ) d´

a-se o

nome de estimativa de θ.

Estimativa

Note que o estimador ´

e uma v.a. e como tal tem uma distribui¸

c˜

ao

de probabilidade.

(13)

Um estimador conduzir´

a a estimativas mais rigorosas se usufruir de

algumas propriedades. Vejamos quais.

O estimador do parˆ

ametro desconhecido θ diz-se centrado se

E [T (X )] = θ.

Estimador centrado

O estimador do parˆ

ametro desconhecido θ diz-se enviesado se

∃θ ∈ Θ : E [T (X )] 6= θ.

Estimador enviesado

(14)

O estimador do parˆ

ametro desconhecido θ possui enviesamento dado

por

bias

θ

[T (X )] 6= E [T (X )] − θ.

Enviesamento de um estimador

Notas:

Um estimador centrado possui enviesamento nulo;

Regra geral h´

a mais do que um estimador para um mesmo

parˆ

ametro desconhecido. Quanto menor for o enviesamento

de um estimador mais rigorosas ser˜

ao as estimativas por ele

fornecidas.

(15)

Suponhamos que X é uma v.a. de interesse com distribui¸cão arbitrária, valor esperado µ e variância σ2_.

A m´edia da a.a. X =1 n

Pn

i =1Xi ´e um estimador centrado de µ pois

E (X ) = E 1 n n X i =1 Xi ! = 1 n n X i =1 E (Xi) = 1 n n X i =1 E (X ) = 1 n n X i =1 µ =1 nnµ = µ A variˆancia corrigida ´e um estimador centrado de σ2_{uma vez que}

E (S2) = E " 1 n − 1 n X i =1 (Xi− X )2 # = 1 n − 1E " _n X i =1 Xi2 ! − n(aX )2 # = 1 n − 1 " n X i =1 E (X_i2) − nE [(X )2] # = 1 n − 1 ( n X i =1 [V (Xi) + E2(Xi)] − n[V (X ) + E2(X )] ) = 1 n − 1 " _n X i =1 (σ2+ µ2) − n σ 2 n + µ 2 # = 1 n − 1(nσ 2_{+ nµ}2_{− σ}2_{− nµ}2₎ = 1 n − 1(n − 1)σ 2_{= σ}2_.

(16)

N˜

ao basta que um estimador seja centrado para garantir

estimativas mais rigorosas. Estas ser˜

ao tanto mais rigorosas

quanto menos o estimador se dispersar em torno do verdadeiro

valor do parˆ

ametro desconhecido.

O erro quadr´

atico m´

edio do estimador T = T (X ), do parˆ

ametro

desconhecido θ ´

e dado por

EQM

θ

[T (X )]

=

E

[T (X ) − θ]

2

= V [T (X )] + {E [T (X )] − θ}

2

=

V [T (X )] + {bias

θ

[T (X )]}

2

Erro quadr´

atico m´

edio

O EQM quantifica a dispers˜ao esperada do estimador em torno do parˆametro desconhecido;

(17)

Eficiˆ

encia relativa de estimadores

Sendo T

1

(X ) e T

2

(X ) dois estimadores de um mesmo parˆ

ametro

desconhecido θ, define-se

eficiˆ

encia

de T

1

em rela¸

c˜

ao a T

2

por

e

θ

[T

1

(X ), T

2

(X )] =

EQM

θ

[T

2

(X )]

EQM

θ

[T

1

(X )]

.

Assim, se

e

θ

[T

1

(X ), T

2

(X )] > 1 ⇔ EQM

θ

[T

2

(X )] > EQM

θ

[T

1

(X )],

e portanto o estimador T

1

(X ) ´

e mais eficiente que o estimador

T

2

(X ).

(18)

Este método permite obter o valor mais razoável de um parâmetro desconhecido, de entre todos os valores poss´ıveis para esse mesmo parâmetro, tendo em conta a amostra recolhida.

onde P(·|θ) e fX(·|θ) s˜ao a f.p e a f.d.p (resp.) da v.a. de interesse X , tendo em

(19)

Obtida a a amostra x = (x

1

, . . . , x

n

), a estimativa de m´

axima

verosimilhan¸ca (EMV) do parˆ

ametro desconhecido corresponde ao

ponto de m´

aximo da fun¸

c˜

ao de verosimilhan¸ca ou, equivalentemente,

ao ponto de m´

aximo do logaritmo da fun¸

c˜

ao de verosimilhan¸

ca. Esta

estimativa representa-se por ˆ

θ e ´

e ent˜

ao dada por

L(ˆ

θ|x ) = max

θ∈Θ

L(θ|x )

ou equivalentemente

ln L(ˆ

θ|x ) = max

θ∈Θ

ln L(θ|x )

Estimativa de m´

axima verosimilhan¸

ca

(20)

Exemplo

Um inquérito realizado a um grupo de 1000 indiv´ıduos com queixas de insónia revelou que 448 respondem ter dormido bem após a toma de um certo sopor´ıfero.

Deduza a EMV da probabilidade (p) de uma pessoa escolhida ao acaso ter dormido bem tendo tomado o sopor´ıfero.

V.a. de interesse: X =resposta ao inqu´erito Distribui¸c˜ao:

X ∼Bernoulli(p)

Parˆametro desconhecido: p = P(X = 1), 0 ≤ p ≤ 1 F.p.:

P(X = x ) = px_{(1 − p)}1−x_, _{x = 0, 1}

Amostra:

x = (x1, . . . , xn) amostra de dimens˜ao n = 1000, proveniente da popula¸c˜ao onde

xi = resposta de i-´esima pessoa. 448

(21)

Exemplo (cont.)

Fun¸

c˜

ao de verosimilhan¸

ca:

L(p|x ) =

Q

n

i =1

P(X = x

i

) =

Q

n

i =1

p

xi

(1 − p)

1−xi

=

p

Pni =1xi

_{(1 − p)}

n−Pni =1xi

Fun¸

c˜

ao de log-verosimilhan¸

ca:

ln L(p|x ) = ln

p

Pni =1xi

_{(1 − p)}

n− Pn i =1xi

=

ln(p)

P

n i =1

x

i

+ ln(1 − p) (n −

P

ni =1

x

i

)

Maximiza¸

c˜

ao: A EMV de p, ˆ

p, obt´

em-se resolvendo

ˆ

p :

(

_{d ln L(p|x )} dp

|

p=ˆp

= 0

(ponto de estacionaridade)

d2_{ln L(p|x )} dp2

|

p=ˆp

< 0

(ponto de m´

aximo)

(22)

Exemplo (cont.)

ˆ p :    d[ln(p)Pn_{i =1}xi+ln(1−p)(n−Pni =1xi)] dp |p=ˆp= 0 d2[ln(p)Pn_{i =1}xi+ln(1−p)(n−Pni =1xi)] dp2 |p=ˆp< 0 ⇔    Pn i =1xi p − n−Pn_{i =1}xi 1−p |p=ˆp= 0 −Pni =1xi p2 − n−Pn_{i =1}xi (1−p)2 |p=ˆp< 0 ⇔    Pn i =1xi ˆ p − n−Pn i =1xi 1−ˆp = 0 −Pni =1xi ˆ p2 − n−Pn_{i =1}xi (1−ˆp)2 < 0 ⇔ ( (1 − ˆp)Pn i =1xi− ˆp n −Pni =1xi = 0 − Pn i =1xi ˆ p2 − n−Pn i =1xi (1−ˆp)2 < 0 ⇔ ˆ p = 1_nPn i =1xi proposi¸c˜ao verdadeira

(23)

Exemplo (cont.)

Estimador de MV de p: EMV (p) = 1 n Pn i =1Xi= X (m´edia da amostra). Concretiza¸c˜ao: ˆ p = 1 n n X i =1 xi = n o_{de respostas afirmativas} no_{de pessoas inquiridas} = 0.448

(24)

Exemplo

Os tempos observado (em anos) at´e `a 1a_colis˜_{ao de detritos espaciais com diˆ}_ametro

inferior a 1mm em 4 sat´elites em MEO foram de 1.2, 1.5, 1.8 e 1.4.

Admitindo que tal tempo tem distribui¸c˜ao pertencente ao modelo exponencial de parˆametro λ, vamos determinar o estimador e a estimativa de MV de λ.

V.a. de interesse:

X =tempo (em anos) at´e `a 1a_colis˜_{ao de detritos espaciais}

Distribui¸c˜ao: X ∼exponencial(λ) Parˆametro desconhecido: λ, λ > 0 F.d.p.: fX(x ) = λe−λx, x ≥ 0 0, c.c. Amostra:

x = (x1, . . . , xn) amostra de dimens˜ao n = 4, proveniente da popula¸c˜ao onde

(25)

Exemplo (cont.)

Fun¸

c˜

ao de verosimilhan¸

ca:

L(λ|x ) =

Q

n

i =1

f

X

(x

i

) =

Q

n

i =1

λe

−λxi

= λ

n

_e

−λPni =1xi

Fun¸

c˜

ao de log-verosimilhan¸

ca:

ln L(λ|x ) = ln

λ

n

e

−λPni =1xi

= n ln(λ) − λ

P

n

i =1

x

i

Maximiza¸

c˜

ao: A EMV de λ, ˆ

λ, obt´

em-se resolvendo

ˆ

λ :

(

_{d ln L(λ|x )} d λ

|

λ=ˆλ

= 0

(ponto de estacionaridade)

d2_{ln L(λ|x )} d λ2

|

_λ=ˆ_λ

< 0

(ponto de m´

aximo)

(26)

Exemplo (cont.)

ˆ

λ

:

_n λ

−

P

n i =1

x

i

|

_λ=ˆ_λ

= 0

−

_λn2

|

_λ=ˆ_λ

< 0

⇔

(

_n ˆ λ

−

P

n i =1

x

i

= 0

−

_ˆn λ2

< 0

⇔

(

ˆ

λ =

Pnn i =1xi

proposi¸

c˜

ao verdadeira

(27)

Exemplo (cont.)

Estimador de MV de p: EMV (λ) =Pnn i =1Xi = (X ) −1_(m´_{edia da amostra).} Concretiza¸c˜ao: ˆ λ = Pnn i =1xi

= (¯x )−1 inverso da m´edia da amostra = 1.475−1= 0.678

Nota: Repare que n˜ao se trata de um estimador centrado de λ.

(28)

A caracteriza¸cão probabil´ıstica de estat´ısticas, de estimadores ou de suas fun¸cões é crucial não só para avaliar as propriedades dos estimadores (como p.e., enviesamento, EQM, eficiência), mas também como veremos a seguir, para obter estimativas intervalares dos parâmetros desconhecidos (aos quais chamaremos intervalos de confian¸ca).

´

E então fundamental conhecer a distribui¸cão de uma estat´ıstica, de um estimador ou de sua fun¸cão, à qual chamamosdistribui¸cão amostral(ou distribui¸cão por

amostragem).

Exemplo

Sendo X = (X1, . . . , Xn) uma a.a. de dimens˜ao n proveniente da popula¸c˜ao X com

f.d. FX(x ), ent˜ao facilmente se mostra que

Estat´ıstica Distribui¸c˜ao amostral X(1)= mini =1,...,nXi FX₍₁₎(x ) = 1 − [1 − FX(x )]n

(29)

A média é, em geral, o estimador de MV (ou de alguma forma está com ele relacionada) do valor esperado de uma v.a. de interesse, pelo que é fundamental conhecer a sua distribui¸cão.

Seja X = (X1, . . . , Xn) uma a.a. de dimensão n proveniente da popula¸cão X . Então

Popula¸cão Distribui¸cão amostral da média X ∼normal(µ, σ2₎ _{X ∼normal(µ,}σ2

n)

X com distribui¸cão arbitrária (não normal)

E (X ) = µ, V (X ) = σ2_{, n grande} X −µ√σ n

∼normal(0, 1)

O 1o_{dos dois resultados ´}_{e exacto e deve-se ao facto de a combina¸}_c˜_{ao linear de}

normais ainda possuir distribui¸c˜ao normal.

O 2o_{resultado ´}_{e aproximado e ´}_{e conhecido como o}_{Teorema do Limite Central}_{e s´}_o

deve ser aplicado quando a v.a. não tem distribui¸cão normal e a dimensão da amostra é suficientemente grande.

(30)

Assuma que a pressão sistólica de uma popula¸cão saudável segue uma distribui¸cão normal de média 120mmHg e desvio padrão 10mmHg . Num grupo de 25 pessoas, a média da pressão sistólica foi de 124mmHg .

Qual a probabilidade de se encontrar uma média superior a esta numa amostra de 25 indiv´ıduos? Ou, dito de outro modo, qual a propor¸cão de amostras de 25 indiv´ıduos escolhidas ao acaso nessa popula¸cão que têm uma média superior a 124mmHg ? De acordo com o 1o_{dos resultados anteriores, a distribui¸}_c˜_{ao amostral da m´}_{edia segue}

uma distribui¸c˜ao normal de parˆametros µ = 120 e σ2₌100

25 = 4, i.e.,

X ∼normal(120, 4).

A probabilidade pedida ´e ent˜ao dada por

P(X > 124) = 1 − P(X ≤ 124) = 1 − F_X(124) = 0.023

no scilab:

cdfnor(”PQ”, 124, 120, 2) = 0.977 com consulta das tabelas Sendo Z = X −120∼normal(0, 1)

(31)

Intervalos de confian¸ca

Para al´

em de uma estimativa pontual para um parˆ

ametro

desconhecido ´

e importante obter um intervalo que nos dˆ

e uma

ideia da confian¸

ca que se pode depositar na estimativa pontual.

Essa estimativa intervalar ´

e designada por intervalo de confian¸

ca

(IC).

A um intervalo de confian¸ca est´

a associado um grau de confian¸

ca,

usualmente representado por (1 − α) × 100%, cujos valores mais

usuais s˜

ao 90%, 95% e 99% (ou, α = 0.1, 0.05, 0.01,

respectivamente).

Antes de mais ´

e necess´

ario descever a situa¸

c˜

ao com que lidamos,

em particular

a v.a. X de interesse e a respectiva distribui¸

c˜

ao

o parˆ

ametro desconhecido para o qual se pretende obter um IC

outro eventual parˆ

ametro (conhecido ou n˜

ao) da distribui¸

c˜

ao

de X .

(32)

IC para o valor esperado de uma popula¸c˜ao normal com variˆancia conhecida

Sendo Z =X −µ_√σ n

, pretendemos determinar aαe bαtal que

P(aα≤ Z ≤ bα) = 1 − α

ou ainda, recorrendo `as tabelas ou ao scilab, determinar aαe bα tal que

P(Z < aα) =α₂ P(Z > bα) = α₂ ⇔ aα= Φ−1 α₂ = −Φ−1 1 −α₂ bα= Φ−1 1 −α₂ Assim P(aα≤ Z ≤ bα) = 1 − α ⇔ P(aα≤ X − µ σ √ n ≤ bα) = 1 − α ⇔ P X − bα× σ √ n≤ µ ≤ X − aα× σ √ n = 1 − α ⇔ P X − Φ−11 −α 2 ×√σ n≤ µ ≤ X + Φ −1 1 −α 2 ×√σ n = 1 − α

(33)

IC para a m´

edia, variˆ

ancia conhecida

IC para o valor esperado de uma popula¸cão arbitrária com variância conhecida

Sendo Z =X −µ_√σ n

∼normal(0, 1) (Teorema do limite central), pretendemos determinar aαe bαtal que

P(aα≤ Z ≤ bα) ' 1 − α

P(Z < aα) =α₂ P(Z > bα) = α₂ ⇐ aα= Φ−1 α₂ = −Φ−1 1 −α₂ bα= Φ−1 1 −α₂ Assim P(aα≤ Z ≤ bα) = 1 − α ⇔ P(aα≤ X − µ σ √ n ≤ bα) ' 1 − α ⇔ P X − bα× σ √ n≤ µ ≤ X − aα× σ √ n ' 1 − α ⇔ P X − Φ−1 1 −α 2 ×√σ n≤ µ ≤ X + Φ −1 1 −α 2 ×√σ n ' 1 − α IC(1−α)×100%(µ) = x − Φ−11 −α 2 ×√σ n, x + Φ −1 1 −α 2 ×√σ n

(34)

Exemplo

O QI numa popula¸

c˜

ao segue uma distribui¸

c˜

ao normal de variˆ

ancia

15

2

. Com base numa amostra de dimens˜

ao 25, com m´

edia

amostral de 100, vejamos como contruir o IC a 95% para a m´

edia

na popula¸c˜

ao.

Ora

IC

_{(1−α)×100%}

(µ) =

x − Φ

−1

1 −

α

2 ×

√

σ

n

, x + Φ

−1

_{1 −}

α

2 ×

√

σ

n

onde, neste caso α = 0.05.

No scilab, o comando

cdfnor(”X ”, 0, 1, 1 −

0.05₂

,

0.05₂

)

devolve-nos o

valor de Φ

−1

1 −

0.05₂

= 1.96, logo

(35)

Quando não conhecemos o valor de σ2na popula¸cão, então a v.a. X −µ√σ n

∼normal(0, 1) deixa de ser ´util. Neste caso, σ2_ser´_{a estimado por S}2_{e usa-se a v.a.}

Z =X − µ_S

√ n

∼ tn−1

e lê-se Z possui distribui¸cão de t-student com (n − 1) graus de liberdade. A distribui¸cão de t-student é semelhante à distribui¸cão normal reduzida. É simétrica em rela¸cão à média, (0), mas com um desvio padrão dependente de um parâmetro denominado graus de liberdade;

Existe uma distribui¸c˜ao de t-student diferente para cada no_{de graus de}

liberdade;

Geralmente, os graus de liberdade correspondem `a diferen¸c a entre a dimens˜ao amostral e o no_{de parˆ}_{ametros a estimar.}

(36)

IC para o valor esperado de uma popula¸c˜ao normal com variˆancia desconhecida

Sendo Z =X −µ_√S n

∼ t_(n−1), pretendemos determinar aαe bαtal que

P(aα≤ Z ≤ bα) ' 1 − α

P(Z < aα) = α₂ P(Z > bα) =α₂ ⇐ ( aα= Ft−1_(n−1) α2 = −F −1 t_(n−1) 1 −α2 bα= Ft−1_(n−1) 1 −α2 P(aα≤ Z ≤ bα) = 1 − α ⇔ P(aα≤ X − µ S √ n ≤ bα) ' 1 − α ⇔ P X − bα× S √ n≤ µ ≤ X − aα× S √ n ' 1 − α ⇔ P X − Ft−1_(n−1) 1 −α 2 ×√S n≤ µ ≤ X + F −1 t_(n−1) 1 −α 2 ×√S n ' 1 − α

(37)

Exemplo

A dura¸cão em horas de uma pilha de certa máquina possui distribui¸cão que se admite normal com valor esperado e variância desconhecidas. Recolheu-se uma amostra de 10, tendo-se obtido o seguinte conjunto de dados:

x = (251, 238, 236, 229, 252, 253, 245, 242, 235, 230). Determinemos um intervalo de confian¸ca a 99% para µ. Considerando a v.a. Z =X −µ_√S

n

∼ t_(n−1), o IC pedido ´e dado por

IC(1−α)×100%(µ) = x − Ft−1_(n−1) 1 −α 2 ×√s n, x + F −1 t_(n−1) 1 −α 2 ×√s n onde α = 0.01, n = 10, x = 241.1, s2_{= 79.66 e F}−1 t_(n−1) 1 −α2 = F −1 t₍₉ 1 −0.012 .

No scilab, o comandocdft(”T ”, 9, 1 −0.01₂ ,0.01₂ )devolve-nos o valor de = F_t−1 (9) 1 − 0.01 2 = 3.2498, logo IC99%(µ) = " 241.1 − 3.2498 ×r 79.66 10 , 241.1 + 3.2498 × r 79.66 10 # = [231.927, 250.273]

(38)

IC para o valor esperado de uma popula¸cão arbitrária com variância desconhecida

Usa-se a v.a. Z =X −µ√S n

∼normal(0, 1) (Teorema do limite central). Pretendemos determinar aα e bαtal que

P(aα≤ Z ≤ bα) ' 1 − α

Recorrendo `as tabelas ou ao scilab, determinar aα e bαtal que

P(Z < aα) =α₂ P(Z > bα) = α₂ ⇐ aα= Φ−1 α₂ = −Φ−1 1 −α₂ bα= Φ−1 1 −α₂ P(aα≤ Z ≤ bα) = 1 − α ⇔ P(aα≤ X − µ S √ n ≤ bα) ' 1 − α ⇔ P X − bα× S √ n≤ µ ≤ X − aα× S √ n ' 1 − α ⇔ P X − Φ−11 −α×√S ≤ µ ≤ X + Φ−11 −α×√S ' 1 − α

(39)

IC para a variˆ

ancia de uma popula¸c˜

ao normal

IC para a variˆancia de uma popula¸c˜ao normal com valor esperado desconhecido

Usa-se a v.a. Z =(n−1)S_σ2 2

√ n

∼ χ2

(n−1)e lˆe-se Z possui distribui¸c˜ao do qui-quadrado com

(n − 1) graus de liberdade. Como esta distribui¸cão não é simétrica em rela¸cão à origem e tem com suporte R+_{temos que determinar a}

αe bα tal que P(aα≤ Z ≤ bα) ' 1 − α P(Z < aα) =α₂ P(Z > bα) = α2 ⇐        aα= F_χ2−1 (n−1) α 2 bα= F_χ2−1 (n−1) 1 −α 2 P(aα≤ Z ≤ bα) = 1 − α ⇔ P   aα≤ (n − 1)S2 σ2 √ n ≤ bα   ' 1 − α ⇔ P      (n − 1)S2 F−1 χ2_(n−1) 1 −α 2 ≤ σ 2_≤ (n − 1)S2 F−1 χ2_(n−1) α 2      ' 1 − α IC(1−α)×100%(σ2) =      (n − 1)S2 F−1 χ2 (n−1) 1 −α 2 , (n − 1)S2 F−1 χ2 (n−1) α 2     

(40)

IC para a variˆancia de uma popula¸c˜ao normal com valor esperado conhecido

Procede-se como no caso anterior mas a distribui¸c˜ao de Z passa a ter (n) graus de liberdade.

Nota: No scilab, o comandocdfchi(”X ”, n,α₂, 1 −α₂)devolve o valor de F−1

χ2 (n)

α 2

(41)

IC para uma propor¸c˜

ao

Consideremos a popula¸cão X ∼Bernoulli(p), onde a probabilidade de sucesso, p, é desconhecida. Consideramos que a dimensão da amostra, n, é suficientemente grande (n > 30).

Considera-se a v.a., com distribui¸c˜ao aproximada: Z =rX −p X (1−X ) n ∼normal(0, 1). Determinamos aα e bαpor aα= −Φ−1 1 −α₂ bα= Φ−1 1 −α₂ P(aα≤ Z ≤ bα) ' 1 − α ⇔ P   aα≤ X − p q X (1−X ) n ≤ bα   ' 1 − α ⇔ P  X − Φ−1 1 −α 2 × s X (1 − X ) n ≤ p ≤ X + Φ −1 1 −α 2 × s X (1 − X ) n   ' 1 − α

O seguinte IC possui grau de confian¸ca aproximadamente igual a (1 − α) × 100%: IC (p) = x − Φ−1 1 −α₂ ×qx (1−x ) n , x + Φ −1 _{1 −}α 2 × q x (1−x ) n