Estima¸c˜ao por intervalos
M´
etodos Num´
ericos e Estat´ısticos
Parte II-M´
etodos Estat´ısticos
Estima¸c˜
ao pontual e intervalar
Lu´ısa Morgado
Lic. Eng. Biom´
edica e Bioengenharia-2009/2010
A Teoria das Probabilidades consiste no estudo dos modelos
matem´
aticos capazes de descrever o comportamento de fen´
omenos
aleat´
orios, modelos esses que se dizem probabil´ısticos.
Foi sobre o estudo de tais modelos que nos debru¸
camos nos
cap´ıtulos anteriores.
Daqui em diante falaremos sobre Estat´ıstica, que consiste num
conjunto de t´
ecnicas quantitativas para recolher, apresentar e
interpretar dados relativos a fen´
omenos aleat´
orios.
Estima¸c˜ao por intervalos
Amostra e dado estat´ıstico
Dada a impossibilidade de observar toda uma popula¸
c˜
ao, ´
e
necess´
ario recolher um subconjunto que se pretende representativo
da popula¸c˜
ao. A esse subconjunto d´
a-se o nome de
amostra.
A cada resultado observado, relativo `
a v.a. (ou caracter´ıstica) de
interesse (i.e., uma caracter´ıstica crucial para o conhecimento do
fen´
omeno aleat´
orio em estudo) d´
a-se o nome de
dado estat´ıstico.
Trata-se de uma vasto conjunto de procedimentos estat´ısticos que
encontra motiva¸c˜
ao na necessidade de obten¸
c˜
ao de amostras
representativas de uma popula¸
c˜
ao.
Na popula¸
c˜
ao as medidas de localiza¸
c˜
ao e de dispers˜
ao s˜
ao
fixas e invariantes; s˜
ao caracter´ısticas da popula¸
c˜
ao e
designam-se por parˆ
ametros.
Na amostra, estas medidas s˜
ao estimativas dos parˆ
ametros
da popula¸
c˜
ao e designam-se por estat´ısticas.
Estima¸c˜ao por intervalos
Exemplos de alguns tipos de amostragem
Aleat´
oria sistem´
atica: Uma amostra aleat´
oria sistem´
atica ´
e
constitu´ıda pelos elementos da popula¸
c˜
ao seleccionados de k
em k elementos.
Aleat´
oria simples: Significa que todos os elementos da
popula¸
c˜
ao tˆ
em a mesma probabilidade de serem escolhidos e
de virem a fazer parte da amostra de dimens˜
ao previamente
fixada.
Estratificada: Inicialmente a popula¸
c˜
ao ´
e dividida em
estratos e depois selecciona-se uma amostra em cada estrato.
Com a recolha da amostra obt´
em-se um conjunto de dados cuja
leitura nada parece contribuir para a compreens˜
ao do fen´
omeno
aleat´
orio em estudo.
A estat´ıstica Descritiva resolve parcialmente este problema,
resumindo e/ou organizando a informa¸
c˜
ao contida nos dados .
A inferˆ
encia estat´ıstica compreende um vasto conjunto de m´
etodos
que usando a informa¸
c˜
ao contida na amostra, responde a quest˜
oes
espec´ıficas da popula¸c˜
ao, tais como
Indicar valores ou intervalos de valores razo´
aveis para
parˆ
ametros desconhecidos da popula¸
c˜
ao;
Averiguar a razoabilidade de conjecturas sobre parˆ
ametros
desconhecidos ou fam´ılias de distribui¸
c˜
oes (testes de
Estima¸c˜ao por intervalos
Sejam
X uma v.a. de interesse;
X
1, X
2, . . . , X
nv.a independentes e identicamente
distribu´ıdas (i.i.d.) a X , i.e., X
i∼
i .i .dX ,
i = 1, 2, . . . , n.
Ent˜
ao o vector aleat´
orio X = (X
1, X
2, . . . , X
n) diz-se uma
amostra aleat´
oria (a.a.)
de dimens˜
ao n proveniente da
popula¸
c˜
ao X .
`
A observa¸
c˜
ao particular da a.a. X = (X
1, X
2, . . . , X
n) d´
a-se
o nome de amostra e representa-se por x = (x
1, x
2, . . . , x
n).
Amostra
probabil´ıstica da a.a. ´
e dada por
1Caso discreto
P(X = x )
=
P(X
1= x
1, X
2= x
2, . . . , X
n= x
n)
=
P(X
1= x
1) × . . . × P(X
n= x
n)
=
nY
i =1P(X
i= x
i) =
nY
i =1P(X = x
i)
2Caso cont´ınuo
f
X(x )
=
f
X1,X2,...,Xn(x
1, x
2, . . . , x
n)
=
f
X1(x
1) × . . . × f
Xn(x
n)
n nEstima¸c˜ao por intervalos
Seja X = (X
1, X
2, . . . , X
n) a.a.de dimens˜
ao n proveniente da
popula¸
c˜
ao X .
T diz-se uma estat´ıstica se se tratar de uma fun¸c˜
ao exclusiva
da a.a. i.e., T = T (X ).
Note que T n˜
ao depende de nenhum parˆ
ametro desconhecido.
Estat´ıstica
Exemplo
Estat´ıstica Valor observado da estat´ıstica
M´ınimo da a.a. X(1)= mini =1,...,nXi x(1)= mini =1,...,nxi M´aximo da a.a. X(n)= maxi =1,...,nXi x(n)= mini =1,...,nxi Amplitude da a.a. R = X(n)− X(1) r = x(n)− x(1) M´edia da a.a. X =1
nPni =1Xi x =1nPni =1xi Var. corrigida da a.a. S
2= 1 n−1 Pn i =1(Xi− X )2 =n−11 Pni =1Xi2− 1 n−1X 2 s2= 1 n−1Pni =1(xi− x)2 = 1 n−1 Pn i =1xi2−n−11 x2
Var. n˜ao corrigida da a.a. S 02=1 nPni =1(Xi− X )2 =1nPni =1Xi2−1 nX 2 s02=1nPni =1(xi− x)2 = 1 nPni =1xi2−1nx2
O objectivo principal da Estat´ıstica ´
e inferir sobre caracter´ısticas da
v.a. de interesse com base na amostra recolhida. Considera-se,
geralmente, que a distribui¸c˜
ao de X ´
e parcial ou totalmente
desconhecida
Parcialmente desconhecida, se conhecermos o tipo
distribucional de X (p.e., Poisson) a menos de um ou mais
parˆ
ametros
Totalmente desconhecida, se o tipo distribucional de X for
especificado de modo muito vago (p.e., distribui¸
c˜
ao discreta).
Estima¸c˜ao por intervalos
Parˆ
ametro desconhecido e espa¸co param´
etrico
Um parˆ
ametro desconhecido ser´
a daqui em diante representado por
θ.
O espa¸co param´
etrico corresponde ao conjunto de todos os valores
poss´ıveis para o parˆ
ametro θ e representa-se por Θ.
Tendo como objectivo adiantar valores razo´
aveis para os
parˆ
ametros desconhecidos na distribui¸
c˜
ao da vari´
avel de interesse,
iremos recorrer a estat´ısticas com caracter´ısticas especiais, a que
chamaremos estimadores.
A estat´ıstica T = T (X ) diz-se um estimador do parˆ
ametro
desconhecido θ se T = T (X ) apenas toma valores no espa¸
co
param´
etrico Θ.
Estimador
Ao valor observado do estimador de θ, t = T (x ) d´
a-se o
nome de estimativa de θ.
Estimativa
Note que o estimador ´
e uma v.a. e como tal tem uma distribui¸
c˜
ao
de probabilidade.
Estima¸c˜ao por intervalos
Um estimador conduzir´
a a estimativas mais rigorosas se usufruir de
algumas propriedades. Vejamos quais.
O estimador do parˆ
ametro desconhecido θ diz-se centrado se
E [T (X )] = θ.
Estimador centrado
O estimador do parˆ
ametro desconhecido θ diz-se enviesado se
∃θ ∈ Θ : E [T (X )] 6= θ.
Estimador enviesado
O estimador do parˆ
ametro desconhecido θ possui enviesamento dado
por
bias
θ[T (X )] 6= E [T (X )] − θ.
Enviesamento de um estimador
Notas:
Um estimador centrado possui enviesamento nulo;
Regra geral h´
a mais do que um estimador para um mesmo
parˆ
ametro desconhecido. Quanto menor for o enviesamento
de um estimador mais rigorosas ser˜
ao as estimativas por ele
fornecidas.
Estima¸c˜ao por intervalos
Suponhamos que X ´e uma v.a. de interesse com distribui¸c˜ao arbitr´aria, valor esperado µ e variˆancia σ2.
A m´edia da a.a. X =1 n
Pn
i =1Xi ´e um estimador centrado de µ pois
E (X ) = E 1 n n X i =1 Xi ! = 1 n n X i =1 E (Xi) = 1 n n X i =1 E (X ) = 1 n n X i =1 µ =1 nnµ = µ A variˆancia corrigida ´e um estimador centrado de σ2uma vez que
E (S2) = E " 1 n − 1 n X i =1 (Xi− X )2 # = 1 n − 1E " n X i =1 Xi2 ! − n(aX )2 # = 1 n − 1 " n X i =1 E (Xi2) − nE [(X )2] # = 1 n − 1 ( n X i =1 [V (Xi) + E2(Xi)] − n[V (X ) + E2(X )] ) = 1 n − 1 " n X i =1 (σ2+ µ2) − n σ 2 n + µ 2 # = 1 n − 1(nσ 2+ nµ2− σ2− nµ2) = 1 n − 1(n − 1)σ 2= σ2.
N˜
ao basta que um estimador seja centrado para garantir
estimativas mais rigorosas. Estas ser˜
ao tanto mais rigorosas
quanto menos o estimador se dispersar em torno do verdadeiro
valor do parˆ
ametro desconhecido.
O erro quadr´
atico m´
edio do estimador T = T (X ), do parˆ
ametro
desconhecido θ ´
e dado por
EQM
θ[T (X )]
=
E
[T (X ) − θ]
2= V [T (X )] + {E [T (X )] − θ}
2=
V [T (X )] + {bias
θ[T (X )]}
2Erro quadr´
atico m´
edio
O EQM quantifica a dispers˜ao esperada do estimador em torno do parˆametro desconhecido;
Estima¸c˜ao por intervalos
Eficiˆ
encia relativa de estimadores
Sendo T
1(X ) e T
2(X ) dois estimadores de um mesmo parˆ
ametro
desconhecido θ, define-se
eficiˆ
encia
de T
1em rela¸
c˜
ao a T
2por
e
θ[T
1(X ), T
2(X )] =
EQM
θ[T
2(X )]
EQM
θ[T
1(X )]
.
Assim, se
e
θ[T
1(X ), T
2(X )] > 1 ⇔ EQM
θ[T
2(X )] > EQM
θ[T
1(X )],
e portanto o estimador T
1(X ) ´
e mais eficiente que o estimador
T
2(X ).
Este m´etodo permite obter o valor mais razo´avel de um parˆametro desconhecido, de entre todos os valores poss´ıveis para esse mesmo parˆametro, tendo em conta a amostra recolhida.
A fun¸c˜ao de verosimilhan¸ca L(θ|x ) : Θ → R define-se do seguinte modo: Caso discreto L(θ|x ) = P(X = x |θ) = n Y i =1 P(X = xi|θ), θ ∈ Θ Caso cont´ınuo L(θ|x ) = fX(x |θ) = n Y i =1 fX(xi|θ), θ ∈ Θ
onde P(·|θ) e fX(·|θ) s˜ao a f.p e a f.d.p (resp.) da v.a. de interesse X , tendo em
Estima¸c˜ao por intervalos
Obtida a a amostra x = (x
1, . . . , x
n), a estimativa de m´
axima
verosimilhan¸ca (EMV) do parˆ
ametro desconhecido corresponde ao
ponto de m´
aximo da fun¸
c˜
ao de verosimilhan¸ca ou, equivalentemente,
ao ponto de m´
aximo do logaritmo da fun¸
c˜
ao de verosimilhan¸
ca. Esta
estimativa representa-se por ˆ
θ e ´
e ent˜
ao dada por
L(ˆ
θ|x ) = max
θ∈Θ
L(θ|x )
ou equivalentemente
ln L(ˆ
θ|x ) = max
θ∈Θ
ln L(θ|x )
Estimativa de m´
axima verosimilhan¸
ca
Exemplo
Um inqu´erito realizado a um grupo de 1000 indiv´ıduos com queixas de ins´onia revelou que 448 respondem ter dormido bem ap´os a toma de um certo sopor´ıfero.
Deduza a EMV da probabilidade (p) de uma pessoa escolhida ao acaso ter dormido bem tendo tomado o sopor´ıfero.
V.a. de interesse: X =resposta ao inqu´erito Distribui¸c˜ao:
X ∼Bernoulli(p)
Parˆametro desconhecido: p = P(X = 1), 0 ≤ p ≤ 1 F.p.:
P(X = x ) = px(1 − p)1−x, x = 0, 1
Amostra:
x = (x1, . . . , xn) amostra de dimens˜ao n = 1000, proveniente da popula¸c˜ao onde
xi = resposta de i-´esima pessoa. 448
Estima¸c˜ao por intervalos
Exemplo (cont.)
Fun¸
c˜
ao de verosimilhan¸
ca:
L(p|x ) =
Q
ni =1
P(X = x
i) =
Q
ni =1
p
xi(1 − p)
1−xi=
p
Pni =1xi(1 − p)
n−Pni =1xiFun¸
c˜
ao de log-verosimilhan¸
ca:
ln L(p|x ) = ln
p
Pni =1xi(1 − p)
n− Pn i =1xi=
ln(p)
P
n i =1x
i+ ln(1 − p) (n −
P
ni =1x
i)
Maximiza¸
c˜
ao: A EMV de p, ˆ
p, obt´
em-se resolvendo
ˆ
p :
(
d ln L(p|x ) dp|
p=ˆp= 0
(ponto de estacionaridade)
d2ln L(p|x ) dp2|
p=ˆp< 0
(ponto de m´
aximo)
Exemplo (cont.)
ˆ p : d[ln(p)Pni =1xi+ln(1−p)(n−Pni =1xi)] dp |p=ˆp= 0 d2[ln(p)Pni =1xi+ln(1−p)(n−Pni =1xi)] dp2 |p=ˆp< 0 ⇔ Pn i =1xi p − n−Pni =1xi 1−p |p=ˆp= 0 −Pni =1xi p2 − n−Pni =1xi (1−p)2 |p=ˆp< 0 ⇔ Pn i =1xi ˆ p − n−Pn i =1xi 1−ˆp = 0 −Pni =1xi ˆ p2 − n−Pni =1xi (1−ˆp)2 < 0 ⇔ ( (1 − ˆp)Pn i =1xi− ˆp n −Pni =1xi = 0 − Pn i =1xi ˆ p2 − n−Pn i =1xi (1−ˆp)2 < 0 ⇔ ˆ p = 1nPn i =1xi proposi¸c˜ao verdadeiraEstima¸c˜ao por intervalos
Exemplo (cont.)
Estimador de MV de p: EMV (p) = 1 n Pn i =1Xi= X (m´edia da amostra). Concretiza¸c˜ao: ˆ p = 1 n n X i =1 xi = n ode respostas afirmativas node pessoas inquiridas = 0.448Exemplo
Os tempos observado (em anos) at´e `a 1acolis˜ao de detritos espaciais com diˆametro
inferior a 1mm em 4 sat´elites em MEO foram de 1.2, 1.5, 1.8 e 1.4.
Admitindo que tal tempo tem distribui¸c˜ao pertencente ao modelo exponencial de parˆametro λ, vamos determinar o estimador e a estimativa de MV de λ.
V.a. de interesse:
X =tempo (em anos) at´e `a 1acolis˜ao de detritos espaciais
Distribui¸c˜ao: X ∼exponencial(λ) Parˆametro desconhecido: λ, λ > 0 F.d.p.: fX(x ) = λe−λx, x ≥ 0 0, c.c. Amostra:
x = (x1, . . . , xn) amostra de dimens˜ao n = 4, proveniente da popula¸c˜ao onde
Estima¸c˜ao por intervalos
Exemplo (cont.)
Fun¸
c˜
ao de verosimilhan¸
ca:
L(λ|x ) =
Q
ni =1
f
X(x
i) =
Q
ni =1
λe
−λxi
= λ
ne
−λPni =1xiFun¸
c˜
ao de log-verosimilhan¸
ca:
ln L(λ|x ) = ln
λ
ne
−λPni =1xi= n ln(λ) − λ
P
ni =1
x
iMaximiza¸
c˜
ao: A EMV de λ, ˆ
λ, obt´
em-se resolvendo
ˆ
λ :
(
d ln L(λ|x ) d λ|
λ=ˆλ= 0
(ponto de estacionaridade)
d2ln L(λ|x ) d λ2|
λ=ˆλ< 0
(ponto de m´
aximo)
Exemplo (cont.)
ˆ
λ
:
n λ−
P
n i =1x
i|
λ=ˆλ= 0
−
λn2|
λ=ˆλ< 0
⇔
(
n ˆ λ−
P
n i =1x
i= 0
−
ˆn λ2< 0
⇔
(
ˆ
λ =
Pnn i =1xiproposi¸
c˜
ao verdadeira
Estima¸c˜ao por intervalos
Exemplo (cont.)
Estimador de MV de p: EMV (λ) =Pnn i =1Xi = (X ) −1(m´edia da amostra). Concretiza¸c˜ao: ˆ λ = Pnn i =1xi= (¯x )−1 inverso da m´edia da amostra = 1.475−1= 0.678
Nota: Repare que n˜ao se trata de um estimador centrado de λ.
A caracteriza¸c˜ao probabil´ıstica de estat´ısticas, de estimadores ou de suas fun¸c˜oes ´e crucial n˜ao s´o para avaliar as propriedades dos estimadores (como p.e., enviesamento, EQM, eficiˆencia), mas tamb´em como veremos a seguir, para obter estimativas intervalares dos parˆametros desconhecidos (aos quais chamaremos intervalos de confian¸ca).
´
E ent˜ao fundamental conhecer a distribui¸c˜ao de uma estat´ıstica, de um estimador ou de sua fun¸c˜ao, `a qual chamamosdistribui¸c˜ao amostral(ou distribui¸c˜ao por
amostragem).
Exemplo
Sendo X = (X1, . . . , Xn) uma a.a. de dimens˜ao n proveniente da popula¸c˜ao X com
f.d. FX(x ), ent˜ao facilmente se mostra que
Estat´ıstica Distribui¸c˜ao amostral X(1)= mini =1,...,nXi FX(1)(x ) = 1 − [1 − FX(x )]n
Estima¸c˜ao por intervalos
A m´edia ´e, em geral, o estimador de MV (ou de alguma forma est´a com ele relacionada) do valor esperado de uma v.a. de interesse, pelo que ´e fundamental conhecer a sua distribui¸c˜ao.
Seja X = (X1, . . . , Xn) uma a.a. de dimens˜ao n proveniente da popula¸c˜ao X . Ent˜ao
Popula¸c˜ao Distribui¸c˜ao amostral da m´edia X ∼normal(µ, σ2) X ∼normal(µ,σ2
n)
X com distribui¸c˜ao arbitr´aria (n˜ao normal)
E (X ) = µ, V (X ) = σ2, n grande X −µ√σ n
∼normal(0, 1)
O 1odos dois resultados ´e exacto e deve-se ao facto de a combina¸c˜ao linear de
normais ainda possuir distribui¸c˜ao normal.
O 2oresultado ´e aproximado e ´e conhecido como oTeorema do Limite Centrale s´o
deve ser aplicado quando a v.a. n˜ao tem distribui¸c˜ao normal e a dimens˜ao da amostra ´e suficientemente grande.
Assuma que a press˜ao sist´olica de uma popula¸c˜ao saud´avel segue uma distribui¸c˜ao normal de m´edia 120mmHg e desvio padr˜ao 10mmHg . Num grupo de 25 pessoas, a m´edia da press˜ao sist´olica foi de 124mmHg .
Qual a probabilidade de se encontrar uma m´edia superior a esta numa amostra de 25 indiv´ıduos? Ou, dito de outro modo, qual a propor¸c˜ao de amostras de 25 indiv´ıduos escolhidas ao acaso nessa popula¸c˜ao que tˆem uma m´edia superior a 124mmHg ? De acordo com o 1odos resultados anteriores, a distribui¸c˜ao amostral da m´edia segue
uma distribui¸c˜ao normal de parˆametros µ = 120 e σ2=100
25 = 4, i.e.,
X ∼normal(120, 4).
A probabilidade pedida ´e ent˜ao dada por
P(X > 124) = 1 − P(X ≤ 124) = 1 − FX(124) = 0.023
no scilab:
cdfnor(”PQ”, 124, 120, 2) = 0.977 com consulta das tabelas Sendo Z = X −120∼normal(0, 1)
Estima¸c˜ao por intervalos
Intervalos de confian¸ca
Para al´
em de uma estimativa pontual para um parˆ
ametro
desconhecido ´
e importante obter um intervalo que nos dˆ
e uma
ideia da confian¸
ca que se pode depositar na estimativa pontual.
Essa estimativa intervalar ´
e designada por intervalo de confian¸
ca
(IC).
A um intervalo de confian¸ca est´
a associado um grau de confian¸
ca,
usualmente representado por (1 − α) × 100%, cujos valores mais
usuais s˜
ao 90%, 95% e 99% (ou, α = 0.1, 0.05, 0.01,
respectivamente).
Antes de mais ´
e necess´
ario descever a situa¸
c˜
ao com que lidamos,
em particular
a v.a. X de interesse e a respectiva distribui¸
c˜
ao
o parˆ
ametro desconhecido para o qual se pretende obter um IC
outro eventual parˆ
ametro (conhecido ou n˜
ao) da distribui¸
c˜
ao
de X .
IC para o valor esperado de uma popula¸c˜ao normal com variˆancia conhecida
Sendo Z =X −µ√σ n
, pretendemos determinar aαe bαtal que
P(aα≤ Z ≤ bα) = 1 − α
ou ainda, recorrendo `as tabelas ou ao scilab, determinar aαe bα tal que
P(Z < aα) =α2 P(Z > bα) = α2 ⇔ aα= Φ−1 α2 = −Φ−1 1 −α2 bα= Φ−1 1 −α2 Assim P(aα≤ Z ≤ bα) = 1 − α ⇔ P(aα≤ X − µ σ √ n ≤ bα) = 1 − α ⇔ P X − bα× σ √ n≤ µ ≤ X − aα× σ √ n = 1 − α ⇔ P X − Φ−11 −α 2 ×√σ n≤ µ ≤ X + Φ −1 1 −α 2 ×√σ n = 1 − α
Estima¸c˜ao por intervalos
IC para a m´
edia, variˆ
ancia conhecida
IC para o valor esperado de uma popula¸c˜ao arbitr´aria com variˆancia conhecida
Sendo Z =X −µ√σ n
∼normal(0, 1) (Teorema do limite central), pretendemos determinar aαe bαtal que
P(aα≤ Z ≤ bα) ' 1 − α
ou ainda, recorrendo `as tabelas ou ao scilab, determinar aαe bα tal que
P(Z < aα) =α2 P(Z > bα) = α2 ⇐ aα= Φ−1 α2 = −Φ−1 1 −α2 bα= Φ−1 1 −α2 Assim P(aα≤ Z ≤ bα) = 1 − α ⇔ P(aα≤ X − µ σ √ n ≤ bα) ' 1 − α ⇔ P X − bα× σ √ n≤ µ ≤ X − aα× σ √ n ' 1 − α ⇔ P X − Φ−1 1 −α 2 ×√σ n≤ µ ≤ X + Φ −1 1 −α 2 ×√σ n ' 1 − α IC(1−α)×100%(µ) = x − Φ−11 −α 2 ×√σ n, x + Φ −1 1 −α 2 ×√σ n
Exemplo
O QI numa popula¸
c˜
ao segue uma distribui¸
c˜
ao normal de variˆ
ancia
15
2. Com base numa amostra de dimens˜
ao 25, com m´
edia
amostral de 100, vejamos como contruir o IC a 95% para a m´
edia
na popula¸c˜
ao.
Ora
IC
(1−α)×100%(µ) =
x − Φ
−11 −
α
2
×
√
σ
n
, x + Φ
−11 −
α
2
×
√
σ
n
onde, neste caso α = 0.05.
No scilab, o comando
cdfnor(”X ”, 0, 1, 1 −
0.052,
0.052)
devolve-nos o
valor de Φ
−11 −
0.052= 1.96, logo
Estima¸c˜ao por intervalos
Quando n˜ao conhecemos o valor de σ2na popula¸c˜ao, ent˜ao a v.a. X −µ√σ n
∼normal(0, 1) deixa de ser ´util. Neste caso, σ2ser´a estimado por S2e usa-se a v.a.
Z =X − µS
√ n
∼ tn−1
e lˆe-se Z possui distribui¸c˜ao de t-student com (n − 1) graus de liberdade. A distribui¸c˜ao de t-student ´e semelhante `a distribui¸c˜ao normal reduzida. ´E sim´etrica em rela¸c˜ao `a m´edia, (0), mas com um desvio padr˜ao dependente de um parˆametro denominado graus de liberdade;
Existe uma distribui¸c˜ao de t-student diferente para cada node graus de
liberdade;
Geralmente, os graus de liberdade correspondem `a diferen¸c a entre a dimens˜ao amostral e o node parˆametros a estimar.
IC para o valor esperado de uma popula¸c˜ao normal com variˆancia desconhecida
Sendo Z =X −µ√S n
∼ t(n−1), pretendemos determinar aαe bαtal que
P(aα≤ Z ≤ bα) ' 1 − α
ou ainda, recorrendo `as tabelas ou ao scilab, determinar aαe bα tal que
P(Z < aα) = α2 P(Z > bα) =α2 ⇐ ( aα= Ft−1(n−1) α2 = −F −1 t(n−1) 1 −α2 bα= Ft−1(n−1) 1 −α2 P(aα≤ Z ≤ bα) = 1 − α ⇔ P(aα≤ X − µ S √ n ≤ bα) ' 1 − α ⇔ P X − bα× S √ n≤ µ ≤ X − aα× S √ n ' 1 − α ⇔ P X − Ft−1(n−1) 1 −α 2 ×√S n≤ µ ≤ X + F −1 t(n−1) 1 −α 2 ×√S n ' 1 − α
Estima¸c˜ao por intervalos
Exemplo
A dura¸c˜ao em horas de uma pilha de certa m´aquina possui distribui¸c˜ao que se admite normal com valor esperado e variˆancia desconhecidas. Recolheu-se uma amostra de 10, tendo-se obtido o seguinte conjunto de dados:
x = (251, 238, 236, 229, 252, 253, 245, 242, 235, 230). Determinemos um intervalo de confian¸ca a 99% para µ. Considerando a v.a. Z =X −µ√S
n
∼ t(n−1), o IC pedido ´e dado por
IC(1−α)×100%(µ) = x − Ft−1(n−1) 1 −α 2 ×√s n, x + F −1 t(n−1) 1 −α 2 ×√s n onde α = 0.01, n = 10, x = 241.1, s2= 79.66 e F−1 t(n−1) 1 −α2 = F −1 t(9 1 −0.012 .
No scilab, o comandocdft(”T ”, 9, 1 −0.012 ,0.012 )devolve-nos o valor de = Ft−1 (9) 1 − 0.01 2 = 3.2498, logo IC99%(µ) = " 241.1 − 3.2498 ×r 79.66 10 , 241.1 + 3.2498 × r 79.66 10 # = [231.927, 250.273]
IC para o valor esperado de uma popula¸c˜ao arbitr´aria com variˆancia desconhecida
Usa-se a v.a. Z =X −µ√S n
∼normal(0, 1) (Teorema do limite central). Pretendemos determinar aα e bαtal que
P(aα≤ Z ≤ bα) ' 1 − α
Recorrendo `as tabelas ou ao scilab, determinar aα e bαtal que
P(Z < aα) =α2 P(Z > bα) = α2 ⇐ aα= Φ−1 α2 = −Φ−1 1 −α2 bα= Φ−1 1 −α2 P(aα≤ Z ≤ bα) = 1 − α ⇔ P(aα≤ X − µ S √ n ≤ bα) ' 1 − α ⇔ P X − bα× S √ n≤ µ ≤ X − aα× S √ n ' 1 − α ⇔ P X − Φ−11 −α×√S ≤ µ ≤ X + Φ−11 −α×√S ' 1 − α
Estima¸c˜ao por intervalos
IC para a variˆ
ancia de uma popula¸c˜
ao normal
IC para a variˆancia de uma popula¸c˜ao normal com valor esperado desconhecido
Usa-se a v.a. Z =(n−1)Sσ2 2
√ n
∼ χ2
(n−1)e lˆe-se Z possui distribui¸c˜ao do qui-quadrado com
(n − 1) graus de liberdade. Como esta distribui¸c˜ao n˜ao ´e sim´etrica em rela¸c˜ao `a origem e tem com suporte R+temos que determinar a
αe bα tal que P(aα≤ Z ≤ bα) ' 1 − α P(Z < aα) =α2 P(Z > bα) = α2 ⇐ aα= Fχ2−1 (n−1) α 2 bα= Fχ2−1 (n−1) 1 −α 2 P(aα≤ Z ≤ bα) = 1 − α ⇔ P aα≤ (n − 1)S2 σ2 √ n ≤ bα ' 1 − α ⇔ P (n − 1)S2 F−1 χ2(n−1) 1 −α 2 ≤ σ 2≤ (n − 1)S2 F−1 χ2(n−1) α 2 ' 1 − α IC(1−α)×100%(σ2) = (n − 1)S2 F−1 χ2 (n−1) 1 −α 2 , (n − 1)S2 F−1 χ2 (n−1) α 2
IC para a variˆancia de uma popula¸c˜ao normal com valor esperado conhecido
Procede-se como no caso anterior mas a distribui¸c˜ao de Z passa a ter (n) graus de liberdade.
Nota: No scilab, o comandocdfchi(”X ”, n,α2, 1 −α2)devolve o valor de F−1
χ2 (n)
α 2
Estima¸c˜ao por intervalos
IC para uma propor¸c˜
ao
Consideremos a popula¸c˜ao X ∼Bernoulli(p), onde a probabilidade de sucesso, p, ´e desconhecida. Consideramos que a dimens˜ao da amostra, n, ´e suficientemente grande (n > 30).
Considera-se a v.a., com distribui¸c˜ao aproximada: Z =rX −p X (1−X ) n ∼normal(0, 1). Determinamos aα e bαpor aα= −Φ−1 1 −α2 bα= Φ−1 1 −α2 P(aα≤ Z ≤ bα) ' 1 − α ⇔ P aα≤ X − p q X (1−X ) n ≤ bα ' 1 − α ⇔ P X − Φ−1 1 −α 2 × s X (1 − X ) n ≤ p ≤ X + Φ −1 1 −α 2 × s X (1 − X ) n ' 1 − α
O seguinte IC possui grau de confian¸ca aproximadamente igual a (1 − α) × 100%: IC (p) = x − Φ−1 1 −α2 ×qx (1−x ) n , x + Φ −1 1 −α 2 × q x (1−x ) n