An´
alise Bayesiana de Decis˜
ao
Parte 3: posteriores em fam´ılias conjugadas
Paul Kinas
A P´ılula do Dia Seguinte (RU486)
1 Estudo da eficiˆencia do RU486 em Edinburgh
800 mulheres que procuraram o centro de sa´ude para procedimento
sorteio 1:1 entre procedimento padr˜ao (C) e tratado com RU486 (R)
objetivo ´e verificar se em ”R” a probabilidade de gravidez ´e menor que em ”C”
2 Para uma mulher gr´avida (G) qual ´e o valor de θ = P(R|G ) ?
Se P(G |R) = P(G |C ) ent˜ao θ = 0.5
Se P(G |R) < P(G |C ) (o esperado!) ent˜ao θ < 0.5 Se P(G |R) > P(G |C ) (??) ent˜ao θ > 0.5
A P´ılula do Dia Seguinte (RU486)
o modelo probabil´ıstico e os dados
1 θ = P(R|G )= P(G |R)·P(R) P(G ) e (1 − θ) = P(C |G )= P(G |C )·P(C ) P(G ) 2 θ 1−θ = P(G |R)·P(R) P(G |C )·P(C )
3 Mas, no exemplo, P(R) = P(C ) j´a que as duas amostras s˜ao
aprox do mesmo tamanho.
4 Logo,
θ
1 − θ =
P(G |R) P(G |C )
A P´ılula do Dia Seguinte (RU486)
o modelo probabil´ıstico e os dados
1 O modelo e os dados
n = 4: total de mulheres que engravidaram;
X = 0: n´umero de gr´avidas pertencentes ao grupo ”R”; θ = P(R|G ) (valor desconhecido e de interesse) X segue distribui¸c˜ao B(n, θ)
2 Distribui¸c˜oes a priori sobre θ
a. p(θ = 1/4) = 0.2 p(θ = 1/2) = 0.6 p(θ = 3/4) = 0.2
b. p(θ) = 1 para 0 < θ < 1 (distribui¸c˜ao Uniforme)
A P´ılula do Dia Seguinte (RU486)
solu¸c˜
ao para a priori [a]
θ p(θ) p(X |θ) p(X |θ) · p(θ) p(θ|X ) 0.25 0.2 0.317 0.0633 0.623 0.50 0.6 0.063 0.0375 0.369 0.75 0.2 0.004 0.0008 0.008 Soma 1.0 0.1016 1.000 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 Prori teta p(teta) 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 Posteriori teta p(teta|x)
A P´ılula do Dia Seguinte (RU486)
solu¸c˜
ao para a priori [b]
Posterior ∝ Verossimilhan¸ca Binomial x Priori Uniforme p(θ|x ) ∝ θx(1 − θ)n−xθα−1(1 − θ)β−1 0.0 0.2 0.4 0.6 0.8 1.0 0 1 2 3 4 5 teta p(teta)
Familia Conjugada de Distribui¸c˜
oes
Defini¸c˜ao: Sejam F uma fam´ılia de distribui¸c˜oes para a verossimilhan¸ca p(x |θ) e P uma fam´ılia de distribui¸c˜oes para a priori p(θ).
Dizemos que F e P s˜ao fam´ılias conjugadas se a distribui¸c˜ao
Familia Conjugada de Distribui¸c˜
oes
Fam´ılias Binomial e Beta
Exemplo 1: Se a verossimilhan¸ca p(X |θ) tem distribui¸c˜ao Bin(n, θ) e a priori p(θ) tem distribui¸c˜ao Beta(α, β), ent˜ao a posterior p(θ|X ) ter´a distribui¸c˜ao Beta(α∗ = α + X , β∗ = β + n − X ).
1 Para o exemplo do RU486, com X ∼ Bin(n = 4, θ) e X = 0
priori Uniforme ´e Beta(α = 1, β = 1) posterior ´e Beta(α∗= 1, β∗= 5)
2 E (θ|X ) = X +α
n+β
3 priori LIP (Jeffreys) α = β = 0.5
Fam´ılias Binomial e Beta:
como atribuir α e β informativos?
1 Berry, D. (1996) – p´aginas 213 a 216
2 Atribuir um valor esperado a priori para θ. Este valor (r )
representa a m´edia da priori Beta(α, β).
3 Informar um caso de gravidez(n = 1) pertencente ao grupo R
(x = 1) e reavaliar o valor esperado de θ (r+) possivelmente
r+> r e ser´a a media da distribui¸c˜ao posterior:
r+= (α + x )/[(α + x ) + (β + n − x )]
4 Calcular α e β como fun¸c˜oes de r e r+: (Ex.: n = 1 e X = 1)
α = r (1 − r
+)
r+− r β =
(1 − r )(1 − r+) r+− r
A P´ılula do Dia Seguinte (RU486)
solu¸c˜
ao para a priori informativa
> r <- 0.30 > r.plus <- 0.40 > alpha <- r*(1-r.plus)/(r.plus-r) > beta <- (1-r)*(1-r.plus)/(r.plus-r) > c(alpha,beta) [1] 1.8 4.2 0.0 0.2 0.4 0.6 0.8 1.0 0 1 2 3 teta p(teta)
Familia Conjugada de Distribui¸c˜
oes
Fam´ılias Poisson e Gama
Exemplo 2: Se a verossimilhan¸ca p(X |θ) tem distribui¸c˜ao Poi (nθ) e a priori p(θ) tem distribui¸c˜ao Gama(α, β), ent˜ao a posterior p(θ|X ) ter´a distribui¸c˜ao Gama(α∗= α + x , β∗= β + n).
1 A distribui¸c˜ao Gama(α, β) para θ > 0 tem f.d.p. dada por:
p(θ) = β
α
Γ(α)θ
α−1e−βθ α > 0 e β > 0
2 Uma contagem X segue distribui¸c˜ao de Poisson com
parˆametro µ = nθ, sendo n n´umero de unidades e θ a m´edia
por unidade, tem f.m.p dada por:
p(X |θ) = e
−nθ(nθ)x
Modelo Probabil´ıstico para Decaimento Radiaotivo
1 Tempo (T ) para decaimento segue distribui¸c˜ao exponecial
p(T |θ) = θe−θT para T > 0 e θ > 0
2 N´umero de emiss˜oes no intervalo [0, t] (Xt) tem distribui¸c˜ao
Poisson
P(Xt = x |θ) = e
−θt(θt)x
x ! para x = 0, 1, 2, ...
3 Meia-vida (φ) ´e a mediana da distribui¸c˜ao de T : φ = ln 2 · θ−1
Exemplo: a Meia-vida do Carbono 137 ´e φ = 27 anos. Logo
a sua taxa de decaimento ´e θ = 0.026 por ano.
Modelo Probabil´ıstico para Decaimento Radiaotivo
(continua¸c˜
ao)
1 Material radioativo com taxa desconhecida θ
2 Prioris p(θ) ∼ Gama(α, β)
3 Contagem de emiss˜oes em [0, 120) foi deNt = 4
4 Fam´ılias conjugadas Poisson e Gama
p(θ|Nt) ∼ Gama(α + Nt, β + t)
5 E (θ|Nt) = α+Nt β+t
Distribui¸c˜
ao Posterior da Taxa de Decaimento
0.00 0.02 0.04 0.06 0.08 0.10 0.12 0 5 10 15 20 25Posterior de teta (Priori ~ Gama(0,01, 0.01))
teta
p(teta|N)
Familia Conjugada de Distribui¸c˜
oes
Fam´ılias Normal e Normal-Gama (Preliminares)
1 distribiui¸c˜ao Normal parametrizada com precis˜ao
X ∼ N∗(µ, τ ) p(x |µ, τ ) =r τ 2πexp −τ (x − µ) 2 2
2 distribui¸c˜ao (bi-dimensional) Normal-Gama:
p(µ, τ ) = p(µ|τ ) · p(τ ) com
p(µ|τ ) ∼ N∗(µ0, λ0τ ), λ0 > 0
Familia Conjugada de Distribui¸c˜
oes
Fam´ılias Normal e Normal-Gama
Exemplo 3: Se p( ¯X |µ, τ ) tem distribui¸c˜aoo N∗(µ, nτ ) e se (µ, τ ) tem distribui¸c˜ao priori NG (µ0, λ0, α0, β0), ent˜ao p(µ, τ | ¯X , S2) ter´a
distribui¸c˜ao NG (µ1, λ1, α1, β1) com parˆametros
µ1= λ0µ0+ n ¯X λ0+ n α1 = α0+ n 2 λ1= λ0+ n β1 = β0+ (n − 1)S2 2 + nλ0( ¯X − µ0)2 2(λ0+ n)
Ganho de Peso de Leit˜
oes
1 Amostra de n = 20 leit˜oes com ganho de peso m´edio
¯
X = 30kg e desvio padr˜ao S = 10kg.
2 Priori NG (µ0 = 45, λ0= 2, α0 = 2, β0 = 100)
> n <- 20; x.bar <- 30; S <- 10
> mu0 <- 45; lambda0 <- 2; alpha0 <- 2; beta0 <- 100 > mu1 <- (lambda0*mu0+n*x.bar)/(lambda0+n) > lambda1 <- lambda0+n > alpha1 <- alpha0+n/2 > beta1 <- beta0+(n-1)*S^2/2+n*lambda0*(x.bar-mu0)^2/ + (2*(lambda0+n)) > round(c(mu1,lambda1,alpha1,beta1),2) [1] 31.36 22.00 12.00 1254.55
Ganho de Peso de Leit˜
oes
(distribui¸c˜
oes posteriores marginais)
0.00 0.01 0.02 0.03 0.04 0.05 0.06 0 50 100 150 tau p(tau|dados) 20 30 40 50 60 70 0.00 0.05 0.10 0.15 mu p(m u|dados)
Distribui¸c˜
ao Marginal p(µ|¯
x , S )
1 µ =
q
β1
λ1α1 · T + µ1
tem distribui¸c˜ao Student n˜ao-central p(µ|¯x , S ) ∼ St(2α1, µ1,
p
β1/(λ1α1))
2 T tem distribui¸c˜ao de Student (padronizada) com g = 2α1
graus de liberdade (St(g , 0, 1))
3 Exerc´ıcio 4.7 (p.113) para calcular densidades de uma Student
n˜ao-central St(g , µ1, σ1) p(µ) = pT µ − µ1 σ1 · dT dµ = pT µ − µ1 σ1 · 1 σ1
Familia Conjugada Normal e Normal-Gama
Prioris n˜
ao-informativas
Exemplo 3(B): Se p( ¯X |µ, τ ) tem distribui¸c˜aoo N∗(µ, nτ ) e se (µ, τ ) tem distribui¸c˜ao priori n˜ao-informativa (Jeffreys) p(µ, τ ) = 1/τ , ent˜ao p(µ, τ | ¯X , S2) ter´a distribui¸c˜ao NG (µ1, λ1, α1, β1) com parˆametros
µ1 = ¯X α1 = n − 1 2 λ1 = n β1 = (n − 1)S2 2
Ganho de peso de Leit˜
oes: o impacto da priori
µ σ =p1/τ Percentil I NI I NI 2.5% 26.86 25.32 7.98 7.60 50.0% 31.36 30.00 10.37 10.19 97.5% 35.86 34.68 14.22 14.61FIM
OBRIGADO paulkinas@furg.br