M´arciaD’EliaBranco InferˆenciaBayesiana-Aula5-

(1)

Inferˆ encia Bayesiana - Aula 5 -

M´arcia D’Elia Branco

Universidade de S˜ao Paulo Instituto de Matem´atica e Estat´ıstica

(2)

Estima¸c˜ ao Pontual

?Podemos usar a Moda (MAP) , a M´edia ou a Mediana da distribui¸c˜ao a posteriori.

1. A moda m0´e

argsupθ∈Θf(θ|x) =argsupθ∈Θ f(θ)f(x|θ) Isto ´e f(mo|x)≤f(θ|x),∀θ∈Θ.

Esta associada a fun¸c˜ao de perda zero-um.

Se f(θ)∝C ent˜ao mo= ˆθ_{M V} (e.m.v).

No entanto, em geral mon˜ao satisfaz a propriedade de invariˆancia como o e.m.v.

(3)

2. A m´edia ´e E[θ|x].

Esta associada a fun¸c˜ao de perda quadr´atica.

E mais apropriada quando a distribui¸´ cão aa posteriorié simétrica.

E bastante conveniente quando temos express˜´ oes fechadas envolvendo os parˆametros da posteriori para E[θ|x].

3. A medianamd´e tal que

P(θ≥md)≤1/2e P(θ≤md)≥1/2.

Esta associada a fun¸c˜ao de perda em valor absoluto.

Pode ser utilizada para distribui¸cões simétricas e assimétricas.

Usualmente n˜ao obtemos express˜oes fechadas pra esta medida.

Pode ser obtida via m´etodos de simula¸c˜ao de Monte Carlo.

(4)

Estima¸c˜ ao por regi˜ oes

Defini¸cão 1: Uma região R(x)é uma região de credibilidade γ paraθ se

Z

R(x)

f(θ|x)dθ =γ.

Defini¸cão 2: R(x)é uma região de credibilidade γ(0< γ <1) com densidadea posteriorimáxima (HPD) se

R(x) ={θ:f(θ|x)≥Cγ} comCγ >0 a maior constante tal que

Z

R(x)

f(θ|x)dθ =γ.

(5)

A regi˜aoR(x) ´e a de menor volume entre as de mesma probabilidade. (Prova feita em sala)

Se a distribui¸cão é simétrica, então a região de menor volume

´

e sim´etrica ou de caudas iguais.

Se θé cont´ınuo, unidimensional e a densidade é unimodal, então o HPD é uma intervalo [a, b]. Outras formas de densidade podem gerar regiões que são uniões disjuntas de intervalos.

(6)

Estima¸c˜ ao por regi˜ oes

Exemplo 1: x amostra de X|θ∼U_(0,θ)

f(θ|x) =b1c^b₁¹θ^−(b¹⁺¹⁾Ind_(c₁,∞)(θ)

comb1 =b0+n ,c1=max(x_(n), c0)e x_(n)=max{x₁, . . . , xn}.

HPD de probabilidadeγ ´e dado por

c1; c1

(1−γ)^1/b¹

.

(7)

Exemplo 2: x amostra de X|θ∼Exp(θ). Considere a distribui¸c˜aoa priori conjudadaGa(a, b), ent˜ao

f(θ|x)∝θ^a−1e^−bθθⁿe^−θt onde

n

P

i=1

xi =t. Portanto,θ|x∼Ga(A, B) comA=a+n, B=b+t.

Comof(θ|x)é unimodal a região de credibilidade HPD é um intervalo(θ_i, θ_s) tal que

f(θ_i |x) =f(θ_s |x) ⇔ θ_i^A−1e^−Bθⁱ =θ^A−1_s e^−Bθ^s.

A obten¸cão do intervalo requer a utiliza¸cão de métodos numéricos.

(8)

Estima¸c˜ ao por regi˜ oes

* O IC de caudas iguais é invariante por transforma¸cões * De fato, sejamα= 2Bθ eµ= 1/θ então

γ =P(θ_i < θ < θ_s) =P(2Bθ_i< α <2Bθ_s) =

=P(θ⁻¹_s < µ < θ⁻¹_i )

Logo,(2Bθi,2Bθs) e (1/θs,1/θI)s˜ao IC paraα e µ, respectivamente.

* O HPD não é, em geral, invariante por transforma¸cões *

(9)

Comoθ|x∼Ga(A, B) ent˜aoα|x∼Ga(A,1/2)e µ|x∼GI(A, B). Assim,

h1(α|x)∝α^A−1e^−α/2, α >0, h₂(µ|x)∝µ^−(A+1)e^−B/µ, µ >0.

Resulta que:

h₁(2Bθ_i |x) =h₁(2Bθ_s|x) Portanto(2Bθ_i,2Bθ_s)´e um HPD para α.

Por outro lado,

h₂(θ_s⁻¹|x)6=h₂(θ⁻¹_i |x) Portanto,(1/θ_s,1/θ_i)n˜ao ´e uma HPD para µ.

(10)

Teste de Hip´ oteses

H₀ :θ∈Θ₀ Vs H₁ :θ∈Θ₁ = Θ−Θ₀ A chancea posterioriem favor deH₀

O(H₀, H₁ |x) = P(H₀|x) P(H1|x) Pode-se definir um processo de decis˜ao da forma:

O(H0, H1 |x)> k1 → aceita-seH0

O(H0, H1 |x)< k2 → rejeita-seH0

O fator de Bayes em favor deH₀ ´e

BF₀₁(x) = O(H₀, H₁ |x) O(H0, H1) em queO(H0, H1) = ^P_P^(H_(H⁰⁾

1) ´e a chance a priori.

(11)

O logaritmo na base 10 do fator de Bayes ´e uma medida conhecida como peso da evidˆencia

log BF₀₁(x) =log O(H₀, H₁ |x)−log O(H₀, H₁) Jeffreys prop˜oe a seguinte escala de evidˆencia em favor deH₀: - Fraca selogBF₀₁∈(0; 0.5)

- Substancial selogBF01∈(0.5; 1) - Forte selogBF₀₁∈(1; 2)

- Decisiva selogBF₀₁>2.

Note queBF10= [BF01]⁻¹ .

(12)

Teste de Hip´ oteses

Note que

F B01(x) = f(x|H0)P(H0) f(x|H1)P(H1)

P(H1)

P(H0) = f(x|H0)

f(x|H1) = m0(x) m1(x) Em quem_i(x)´e a distribui¸c˜ao preditivaa priori(ou marginal) sob Hi obtida por

mi(x) = Z

Θi

f(x|θ)hi(θ)dθ

sendoh_i(θ) = _C¹

ih(θ)Ind_Θ_i(θ) a distribui¸c˜ao a priorirestrita ao conjuntoΘ_i eC_i = R

Θi

h(θ)dθ .

* De um modo geral o fator de Bayes depende da distribui¸c˜aoa prioriparah(θ).*

(13)

Exemplo 3: Num processo de produ¸cão observou-se 2 pe¸cas fora de determinada especifica¸cão de qualidade entre as 9 selecionadas aos acaso do processo. Considereθ propor¸cão de pe¸cas na

produ¸cão dentro das especifica¸cões e a seguinte distribui¸cão à priori subjetivaθ∼Be(2,1). Avalie as chances de haver no máximo10% de pe¸cas fora das especifica¸cões.

H0 :θ≥0.90 V s H1 :θ≤0.90

P(H0) =P(θ≥0.9) = 1−F(0.9) = 0.190 ondeF(x)´e a f.d.a. daBe(2,1).Neste caso,

O(H0, H1) = 0.19

0.81 = 0.235

EquivalentementeO(H₁, H₀) = 4.25(a chance a priori em favor deH1).

(14)

Teste de Hip´ oteses

A distribui¸cão a posteriorié dada porθ|x= 7∼Be(9,3)então P(H0 |x= 7) = 1−F^∗(0.90) = 0.0896e

O(H0, H1|x) = 0.098 EquivalentementeO(H1, H0|x) = 10.2.

Portanto, a posteriori a probabilidade deH1 ´e 10.2 vezes a probabilidade deH₀.

Al´em disso, BF10(x) = 2.4.

Portanto, a chance em favor deH1 aumentou 2.4 vezes ap´os a observa¸c˜ao de x.

(15)

Considere um outro resultado amostral,x= 9. Neste caso, θ|x= 9∼Be(11,1).Ent˜ao,

P(H₀ |x= 9) = 0.6861e O(H₀, H₁ |x) = 2.186.

Neste caso, nossa opinião a posteriori muda de sentido, isto é, a probabilidade a posteriori deH₀ é 2.186 vezes a de H₁.

O fator de Bayes ´e dada por

B(x) = 2.186 0.235 = 9.3

Evidenciando que este dado ´e muito mais informativo que o primeiro.

(16)

Teste de Hip´ oteses

Exemplo 4: x1, x2, . . . , xn observa¸c˜oes de umaN(µ, σ²),com σ² conhecida eh(µ)∝C. Portanto,

µ|x¯∼N(¯x, σ²/n).

Vamos testarH₀ :µ≤µ₀ contra H₁ :µ > µ₀ Temos que

P(H₀ |x) =P(µ≤µ₀ |x) = Φ

µ0−¯x σ/√

n

e

O(H0, H1) = Φ

µ0−¯x σ/√

n

1−Φ µ0−¯x

σ/√ n

Observe que o n´ıvel descritivo do teste MP cl´assico ´e P( ¯X ≥x¯|µ₀) = 1−Φ

x¯−µ₀ σ/√

n

=P(H₀ |x).

(17)

Sejamn= 4,x¯= 106, σ²= 400 eµ₀ = 100. Ent˜ao, P(H0|x) = 0.274

Sob o ponto de vista cl´assico n˜ao rejeita-se H0. Mesmo que O(H₁, H₀|x) = 2.653

Portanto, a probabilidade deH₁ ser verdadeira ´e 2.6 vezes a deH₀.

(18)

Teste de Hip´ oteses

O Problema de Hip´oteses categ´oricas

Um problema importante surge quando as dimens˜oes de Θ0 e Θ1

n˜ao s˜ao concidentes. Por exemplo,

H0 :θ=θ0 Vs H1 :θ6=θ0

Se utilizarmos com distribui¸c˜ao a prioriuma f.d.p. h(θ), ent˜ao P(θ=θ0) = 0.

Poss´ıveis solu¸c˜oes:

1) Usar o argumento de que este problema não é realista, pois se a v.a. é cont´ınua deveriamos testar H0 :θ∈V(θ0)contra

H₁ :θ /∈V(θ₀), onde V(θ₀) é uma pequena região contendoθ₀. 2) Construir uma região de credibilidade (HPD) paraθ e observar seθ0 pertence ou não a esta região.

(19)

3) Considerar uma distribui¸cão a priorimista para θ, tal que P(H0) =p0 e P(H1) = 1−p0 =p1.O último valor de probabilidade será distribu´ıdo pelos pontos em θ6=θ₀ segundo uma densidadeh₁(θ).

A distribui¸c˜ao a posterioriresulta em h(θ|x) =

( p₀^f(x|θ_f(x)⁰⁾, θ=θ₀

(1−p₀)^h¹^(θ)f(x|θ)_f(x) , θ6=θ₀ onde,

f(x) =p₀f(x|θ₀) + (1−p₀)f₁(x) e f₁(x) =

Z

θ6=θ0

f(x|θ)h₁(θ)dθ.

(20)

Teste de Hip´ oteses

Portanto,

P(H₀ |x) =h(θ₀ |x) =

1 +1−p0

p₀

1 BF₀₁(x)

−1

comBF01(x) = ^f_f^(x|θ⁰⁾

1(x) .

Exemplo 5: Um laboratório farmacêutico deseja avaliar a eficácia de um novo medicamento relativamente ao existente no mercado.

Para tal considerou 10 pares de pacientes (sob condi¸cões similares em rela¸cão a outra variáveis de controle). Um elemento de cada par tomou o novo medicamento enquanto o outro tomou o antigo.

Observados os resultados verificou-se uma melhora relativa de 6 tratados com o novo medicamento e 4 tratados com o antigo.

Deseja-se saber se os medicamentos s˜ao igualmente eficientes.

(21)

X : n´umero de pares de pacientes que tiveram o melhor resultado com o medicamento novo.

θ: ´e a probabilidade do novo medicamento produzir um melhor resultado do que o antigo.

Hip´oteses: H₀ :θ= 1/2 contraH₁ :θ6= 1/2.

A distribui¸cão a priori: Be(a, a) simétrica em torno de 1/2. Além disso, o analista crê que 97.5 % dos valores de θestão entre 0.10 e 0.90. Com o uso destes percentis chegamos a uma distribui¸cão Be(2,2)como uma priori rasoável para θ.

Assumindop₀ = 1/2, temos

f₁(6) =C_10,6Beta(8,6)/Beta(2,2) = 0.12e BF01(6) = 1.68 e O(H0, H1|x) = 0.63/0.37 = 1.7

Favorecendo a hip´oteseH₀ de equivalˆencia entre os medicamentos.

(22)

Teste de Hip´ oteses

Tabela 1: Fatores de Bayes e probabilidadesa posteriori Be(2,2) Be(1,1) Be(1/2, 1/2)

BF₀₁(x) 1.68 2.26 3.32

P(θ= 1/2|x) 0.63 0.69 0.77 Evidˆencia 0.225 0.354 0.521

valor−P = 0.75 Be(1/2,1/2)´e a priori de Jeffreys.