Inferˆ encia Bayesiana - Aula 5 -
M´arcia D’Elia Branco
Universidade de S˜ao Paulo Instituto de Matem´atica e Estat´ıstica
Estima¸c˜ ao Pontual
?Podemos usar a Moda (MAP) , a M´edia ou a Mediana da distribui¸c˜ao a posteriori.
1. A moda m0´e
argsupθ∈Θf(θ|x) =argsupθ∈Θ f(θ)f(x|θ) Isto ´e f(mo|x)≤f(θ|x),∀θ∈Θ.
Esta associada a fun¸c˜ao de perda zero-um.
Se f(θ)∝C ent˜ao mo= ˆθM V (e.m.v).
No entanto, em geral mon˜ao satisfaz a propriedade de invariˆancia como o e.m.v.
2. A m´edia ´e E[θ|x].
Esta associada a fun¸c˜ao de perda quadr´atica.
E mais apropriada quando a distribui¸´ c˜ao aa posteriori´e sim´etrica.
E bastante conveniente quando temos express˜´ oes fechadas envolvendo os parˆametros da posteriori para E[θ|x].
3. A medianamd´e tal que
P(θ≥md)≤1/2e P(θ≤md)≥1/2.
Esta associada a fun¸c˜ao de perda em valor absoluto.
Pode ser utilizada para distribui¸c˜oes sim´etricas e assim´etricas.
Usualmente n˜ao obtemos express˜oes fechadas pra esta medida.
Pode ser obtida via m´etodos de simula¸c˜ao de Monte Carlo.
Estima¸c˜ ao por regi˜ oes
Defini¸c˜ao 1: Uma regi˜ao R(x)´e uma regi˜ao de credibilidade γ paraθ se
Z
R(x)
f(θ|x)dθ =γ.
Defini¸c˜ao 2: R(x)´e uma regi˜ao de credibilidade γ(0< γ <1) com densidadea posteriorim´axima (HPD) se
R(x) ={θ:f(θ|x)≥Cγ} comCγ >0 a maior constante tal que
Z
R(x)
f(θ|x)dθ =γ.
A regi˜aoR(x) ´e a de menor volume entre as de mesma probabilidade. (Prova feita em sala)
Se a distribui¸c˜ao ´e sim´etrica, ent˜ao a regi˜ao de menor volume
´
e sim´etrica ou de caudas iguais.
Se θ´e cont´ınuo, unidimensional e a densidade ´e unimodal, ent˜ao o HPD ´e uma intervalo [a, b]. Outras formas de densidade podem gerar regi˜oes que s˜ao uni˜oes disjuntas de intervalos.
Estima¸c˜ ao por regi˜ oes
Exemplo 1: x amostra de X|θ∼U(0,θ)
f(θ|x) =b1cb11θ−(b1+1)Ind(c1,∞)(θ)
comb1 =b0+n ,c1=max(x(n), c0)e x(n)=max{x1, . . . , xn}.
HPD de probabilidadeγ ´e dado por
c1; c1
(1−γ)1/b1
.
Exemplo 2: x amostra de X|θ∼Exp(θ). Considere a distribui¸c˜aoa priori conjudadaGa(a, b), ent˜ao
f(θ|x)∝θa−1e−bθθne−θt onde
n
P
i=1
xi =t. Portanto,θ|x∼Ga(A, B) comA=a+n, B=b+t.
Comof(θ|x)´e unimodal a regi˜ao de credibilidade HPD ´e um intervalo(θi, θs) tal que
f(θi |x) =f(θs |x) ⇔ θiA−1e−Bθi =θA−1s e−Bθs.
A obten¸c˜ao do intervalo requer a utiliza¸c˜ao de m´etodos num´ericos.
Estima¸c˜ ao por regi˜ oes
* O IC de caudas iguais ´e invariante por transforma¸c˜oes * De fato, sejamα= 2Bθ eµ= 1/θ ent˜ao
γ =P(θi < θ < θs) =P(2Bθi< α <2Bθs) =
=P(θ−1s < µ < θ−1i )
Logo,(2Bθi,2Bθs) e (1/θs,1/θI)s˜ao IC paraα e µ, respectivamente.
* O HPD n˜ao ´e, em geral, invariante por transforma¸c˜oes *
Comoθ|x∼Ga(A, B) ent˜aoα|x∼Ga(A,1/2)e µ|x∼GI(A, B). Assim,
h1(α|x)∝αA−1e−α/2, α >0, h2(µ|x)∝µ−(A+1)e−B/µ, µ >0.
Resulta que:
h1(2Bθi |x) =h1(2Bθs|x) Portanto(2Bθi,2Bθs)´e um HPD para α.
Por outro lado,
h2(θs−1|x)6=h2(θ−1i |x) Portanto,(1/θs,1/θi)n˜ao ´e uma HPD para µ.
Teste de Hip´ oteses
H0 :θ∈Θ0 Vs H1 :θ∈Θ1 = Θ−Θ0 A chancea posterioriem favor deH0
O(H0, H1 |x) = P(H0|x) P(H1|x) Pode-se definir um processo de decis˜ao da forma:
O(H0, H1 |x)> k1 → aceita-seH0
O(H0, H1 |x)< k2 → rejeita-seH0
O fator de Bayes em favor deH0 ´e
BF01(x) = O(H0, H1 |x) O(H0, H1) em queO(H0, H1) = PP(H(H0)
1) ´e a chance a priori.
O logaritmo na base 10 do fator de Bayes ´e uma medida conhecida como peso da evidˆencia
log BF01(x) =log O(H0, H1 |x)−log O(H0, H1) Jeffreys prop˜oe a seguinte escala de evidˆencia em favor deH0: - Fraca selogBF01∈(0; 0.5)
- Substancial selogBF01∈(0.5; 1) - Forte selogBF01∈(1; 2)
- Decisiva selogBF01>2.
Note queBF10= [BF01]−1 .
Teste de Hip´ oteses
Note que
F B01(x) = f(x|H0)P(H0) f(x|H1)P(H1)
P(H1)
P(H0) = f(x|H0)
f(x|H1) = m0(x) m1(x) Em quemi(x)´e a distribui¸c˜ao preditivaa priori(ou marginal) sob Hi obtida por
mi(x) = Z
Θi
f(x|θ)hi(θ)dθ
sendohi(θ) = C1
ih(θ)IndΘi(θ) a distribui¸c˜ao a priorirestrita ao conjuntoΘi eCi = R
Θi
h(θ)dθ .
* De um modo geral o fator de Bayes depende da distribui¸c˜aoa prioriparah(θ).*
Exemplo 3: Num processo de produ¸c˜ao observou-se 2 pe¸cas fora de determinada especifica¸c˜ao de qualidade entre as 9 selecionadas aos acaso do processo. Considereθ propor¸c˜ao de pe¸cas na
produ¸c˜ao dentro das especifica¸c˜oes e a seguinte distribui¸c˜ao `a priori subjetivaθ∼Be(2,1). Avalie as chances de haver no m´aximo10% de pe¸cas fora das especifica¸c˜oes.
H0 :θ≥0.90 V s H1 :θ≤0.90
P(H0) =P(θ≥0.9) = 1−F(0.9) = 0.190 ondeF(x)´e a f.d.a. daBe(2,1).Neste caso,
O(H0, H1) = 0.19
0.81 = 0.235
EquivalentementeO(H1, H0) = 4.25(a chance a priori em favor deH1).
Teste de Hip´ oteses
A distribui¸c˜ao a posteriori´e dada porθ|x= 7∼Be(9,3)ent˜ao P(H0 |x= 7) = 1−F∗(0.90) = 0.0896e
O(H0, H1|x) = 0.098 EquivalentementeO(H1, H0|x) = 10.2.
Portanto, a posteriori a probabilidade deH1 ´e 10.2 vezes a probabilidade deH0.
Al´em disso, BF10(x) = 2.4.
Portanto, a chance em favor deH1 aumentou 2.4 vezes ap´os a observa¸c˜ao de x.
Considere um outro resultado amostral,x= 9. Neste caso, θ|x= 9∼Be(11,1).Ent˜ao,
P(H0 |x= 9) = 0.6861e O(H0, H1 |x) = 2.186.
Neste caso, nossa opini˜ao a posteriori muda de sentido, isto ´e, a probabilidade a posteriori deH0 ´e 2.186 vezes a de H1.
O fator de Bayes ´e dada por
B(x) = 2.186 0.235 = 9.3
Evidenciando que este dado ´e muito mais informativo que o primeiro.
Teste de Hip´ oteses
Exemplo 4: x1, x2, . . . , xn observa¸c˜oes de umaN(µ, σ2),com σ2 conhecida eh(µ)∝C. Portanto,
µ|x¯∼N(¯x, σ2/n).
Vamos testarH0 :µ≤µ0 contra H1 :µ > µ0 Temos que
P(H0 |x) =P(µ≤µ0 |x) = Φ
µ0−¯x σ/√
n
e
O(H0, H1) = Φ
µ0−¯x σ/√
n
1−Φ µ0−¯x
σ/√ n
Observe que o n´ıvel descritivo do teste MP cl´assico ´e P( ¯X ≥x¯|µ0) = 1−Φ
x¯−µ0 σ/√
n
=P(H0 |x).
Sejamn= 4,x¯= 106, σ2= 400 eµ0 = 100. Ent˜ao, P(H0|x) = 0.274
Sob o ponto de vista cl´assico n˜ao rejeita-se H0. Mesmo que O(H1, H0|x) = 2.653
Portanto, a probabilidade deH1 ser verdadeira ´e 2.6 vezes a deH0.
Teste de Hip´ oteses
O Problema de Hip´oteses categ´oricas
Um problema importante surge quando as dimens˜oes de Θ0 e Θ1
n˜ao s˜ao concidentes. Por exemplo,
H0 :θ=θ0 Vs H1 :θ6=θ0
Se utilizarmos com distribui¸c˜ao a prioriuma f.d.p. h(θ), ent˜ao P(θ=θ0) = 0.
Poss´ıveis solu¸c˜oes:
1) Usar o argumento de que este problema n˜ao ´e realista, pois se a v.a. ´e cont´ınua deveriamos testar H0 :θ∈V(θ0)contra
H1 :θ /∈V(θ0), onde V(θ0) ´e uma pequena regi˜ao contendoθ0. 2) Construir uma regi˜ao de credibilidade (HPD) paraθ e observar seθ0 pertence ou n˜ao a esta regi˜ao.
3) Considerar uma distribui¸c˜ao a priorimista para θ, tal que P(H0) =p0 e P(H1) = 1−p0 =p1.O ´ultimo valor de probabilidade ser´a distribu´ıdo pelos pontos em θ6=θ0 segundo uma densidadeh1(θ).
A distribui¸c˜ao a posterioriresulta em h(θ|x) =
( p0f(x|θf(x)0), θ=θ0
(1−p0)h1(θ)f(x|θ)f(x) , θ6=θ0 onde,
f(x) =p0f(x|θ0) + (1−p0)f1(x) e f1(x) =
Z
θ6=θ0
f(x|θ)h1(θ)dθ.
Teste de Hip´ oteses
Portanto,
P(H0 |x) =h(θ0 |x) =
1 +1−p0
p0
1 BF01(x)
−1
comBF01(x) = ff(x|θ0)
1(x) .
Exemplo 5: Um laborat´orio farmacˆeutico deseja avaliar a efic´acia de um novo medicamento relativamente ao existente no mercado.
Para tal considerou 10 pares de pacientes (sob condi¸c˜oes similares em rela¸c˜ao a outra vari´aveis de controle). Um elemento de cada par tomou o novo medicamento enquanto o outro tomou o antigo.
Observados os resultados verificou-se uma melhora relativa de 6 tratados com o novo medicamento e 4 tratados com o antigo.
Deseja-se saber se os medicamentos s˜ao igualmente eficientes.
X : n´umero de pares de pacientes que tiveram o melhor resultado com o medicamento novo.
θ: ´e a probabilidade do novo medicamento produzir um melhor resultado do que o antigo.
Hip´oteses: H0 :θ= 1/2 contraH1 :θ6= 1/2.
A distribui¸c˜ao a priori: Be(a, a) sim´etrica em torno de 1/2. Al´em disso, o analista crˆe que 97.5 % dos valores de θest˜ao entre 0.10 e 0.90. Com o uso destes percentis chegamos a uma distribui¸c˜ao Be(2,2)como uma priori raso´avel para θ.
Assumindop0 = 1/2, temos
f1(6) =C10,6Beta(8,6)/Beta(2,2) = 0.12e BF01(6) = 1.68 e O(H0, H1|x) = 0.63/0.37 = 1.7
Favorecendo a hip´oteseH0 de equivalˆencia entre os medicamentos.
Teste de Hip´ oteses
Tabela 1: Fatores de Bayes e probabilidadesa posteriori Be(2,2) Be(1,1) Be(1/2, 1/2)
BF01(x) 1.68 2.26 3.32
P(θ= 1/2|x) 0.63 0.69 0.77 Evidˆencia 0.225 0.354 0.521
valor−P = 0.75 Be(1/2,1/2)´e a priori de Jeffreys.