ABD Parte3

(1)

An´

alise Bayesiana de Decis˜

ao

Parte 3: posteriores em fam´ılias conjugadas

Paul Kinas

(2)

A P´ılula do Dia Seguinte (RU486)

1 Estudo da eficiˆencia do RU486 em Edinburgh

800 mulheres que procuraram o centro de sa´ude para procedimento

sorteio 1:1 entre procedimento padr˜ao (C) e tratado com RU486 (R)

objetivo ´e verificar se em ”R” a probabilidade de gravidez ´e menor que em ”C”

2 Para uma mulher gr´avida (G) qual ´e o valor de θ = P(R|G ) ?

Se P(G |R) = P(G |C ) ent˜ao θ = 0.5

Se P(G |R) < P(G |C ) (o esperado!) ent˜ao θ < 0.5 Se P(G |R) > P(G |C ) (??) ent˜ao θ > 0.5

(3)

A P´ılula do Dia Seguinte (RU486)

o modelo probabil´ıstico e os dados

1 θ = P(R|G )= P(G |R)·P(R) P(G ) e (1 − θ) = P(C |G )= P(G |C )·P(C ) P(G ) 2 θ 1−θ = P(G |R)·P(R) P(G |C )·P(C )

3 Mas, no exemplo, P(R) = P(C ) j´a que as duas amostras s˜ao

aprox do mesmo tamanho.

4 Logo,

θ

1 − θ =

P(G |R) P(G |C )

(4)

A P´ılula do Dia Seguinte (RU486)

o modelo probabil´ıstico e os dados

1 O modelo e os dados

n = 4: total de mulheres que engravidaram;

X = 0: número de grávidas pertencentes ao grupo ”R”; θ = P(R|G ) (valor desconhecido e de interesse) X segue distribui¸cão B(n, θ)

2 _Distribui¸_c˜_{oes a priori sobre θ}

a. p(θ = 1/4) = 0.2 p(θ = 1/2) = 0.6 p(θ = 3/4) = 0.2

b. p(θ) = 1 para 0 < θ < 1 (distribui¸c˜ao Uniforme)

(5)

A P´ılula do Dia Seguinte (RU486)

solu¸c˜

ao para a priori [a]

θ p(θ) p(X |θ) p(X |θ) · p(θ) p(θ|X ) 0.25 0.2 0.317 0.0633 0.623 0.50 0.6 0.063 0.0375 0.369 0.75 0.2 0.004 0.0008 0.008 Soma 1.0 0.1016 1.000 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 Prori teta p(teta) 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 Posteriori teta p(teta|x)

(6)

A P´ılula do Dia Seguinte (RU486)

solu¸c˜

ao para a priori [b]

Posterior ∝ Verossimilhan¸ca Binomial x Priori Uniforme p(θ|x ) ∝ θx(1 − θ)n−xθα−1(1 − θ)β−1 0.0 0.2 0.4 0.6 0.8 1.0 0 1 2 3 4 5 teta p(teta)

(7)

Familia Conjugada de Distribui¸c˜

oes

Defini¸cão: Sejam F uma fam´ılia de distribui¸cões para a verossimilhan¸ca p(x |θ) e P uma fam´ılia de distribui¸cões para a priori p(θ).

Dizemos que F e P s˜ao fam´ılias conjugadas se a distribui¸c˜ao

(8)

Familia Conjugada de Distribui¸c˜

oes

Fam´ılias Binomial e Beta

Exemplo 1: Se a verossimilhan¸ca p(X |θ) tem distribui¸cão Bin(n, θ) e a priori p(θ) tem distribui¸cão Beta(α, β), então a posterior p(θ|X ) terá distribui¸cão Beta(α∗ = α + X , β∗ = β + n − X ).

1 Para o exemplo do RU486, com X ∼ Bin(n = 4, θ) e X = 0

priori Uniforme ´e Beta(α = 1, β = 1) posterior ´e Beta(α∗= 1, β∗= 5)

2 E (θ|X ) = X +α

n+β

3 _{priori LIP (Jeffreys) α = β = 0.5}

(9)

Fam´ılias Binomial e Beta:

como atribuir α e β informativos?

1 Berry, D. (1996) – p´aginas 213 a 216

2 Atribuir um valor esperado a priori para θ. Este valor (r )

representa a m´edia da priori Beta(α, β).

3 Informar um caso de gravidez(n = 1) pertencente ao grupo R

(x = 1) e reavaliar o valor esperado de θ (r+) possivelmente

r+> r e ser´a a media da distribui¸c˜ao posterior:

r+= (α + x )/[(α + x ) + (β + n − x )]

4 Calcular α e β como fun¸c˜oes de r e r+: (Ex.: n = 1 e X = 1)

α = r (1 − r

+₎

r+_{− r} β =

(1 − r )(1 − r+) r+_{− r}

(10)

A P´ılula do Dia Seguinte (RU486)

solu¸c˜

ao para a priori informativa

> r <- 0.30 > r.plus <- 0.40 > alpha <- r*(1-r.plus)/(r.plus-r) > beta <- (1-r)*(1-r.plus)/(r.plus-r) > c(alpha,beta) [1] 1.8 4.2 0.0 0.2 0.4 0.6 0.8 1.0 0 1 2 3 teta p(teta)

(11)

Familia Conjugada de Distribui¸c˜

oes

Fam´ılias Poisson e Gama

Exemplo 2: Se a verossimilhan¸ca p(X |θ) tem distribui¸cão Poi (nθ) e a priori p(θ) tem distribui¸cão Gama(α, β), então a posterior p(θ|X ) terá distribui¸cão Gama(α∗= α + x , β∗= β + n).

1 _{A distribui¸c˜}_{ao Gama(α, β) para θ > 0 tem f.d.p. dada por:}

p(θ) = β

α

Γ(α)θ

α−1_e−βθ _{α > 0} _e _{β > 0}

2 Uma contagem X segue distribui¸c˜ao de Poisson com

parâmetro µ = nθ, sendo n número de unidades e θ a média

por unidade, tem f.m.p dada por:

p(X |θ) = e

−nθ_(nθ)x

(12)

Modelo Probabil´ıstico para Decaimento Radiaotivo

1 Tempo (T ) para decaimento segue distribui¸c˜ao exponecial

p(T |θ) = θe−θT para T > 0 e θ > 0

2 Número de emissões no intervalo [0, t] (X_t) tem distribui¸cão

Poisson

P(Xt = x |θ) = e

−θt_(θt)x

x ! para x = 0, 1, 2, ...

3 Meia-vida (φ) ´e a mediana da distribui¸c˜ao de T : φ = ln 2 · θ−1

Exemplo: a Meia-vida do Carbono 137 ´e φ = 27 anos. Logo

a sua taxa de decaimento ´e θ = 0.026 por ano.

(13)

Modelo Probabil´ıstico para Decaimento Radiaotivo

(continua¸c˜

ao)

1 Material radioativo com taxa desconhecida θ

2 Prioris p(θ) ∼ Gama(α, β)

3 _{Contagem de emiss˜}_{oes em [0, 120) foi de}_N_t _{= 4}

4 Fam´ılias conjugadas Poisson e Gama

p(θ|Nt) ∼ Gama(α + Nt, β + t)

5 _{E (θ|N}_t_{) =} α+Nt β+t

(14)

Distribui¸c˜

ao Posterior da Taxa de Decaimento

0.00 0.02 0.04 0.06 0.08 0.10 0.12 0 5 10 15 20 25

Posterior de teta (Priori ~ Gama(0,01, 0.01))

teta

p(teta|N)

(15)

Familia Conjugada de Distribui¸c˜

oes

Fam´ılias Normal e Normal-Gama (Preliminares)

1 _{distribiui¸c˜}_{ao Normal parametrizada com precis˜}_ao

X ∼ N∗(µ, τ ) p(x |µ, τ ) =r τ 2πexp −τ (x − µ) 2 2

2 _{distribui¸c˜}_{ao (bi-dimensional) Normal-Gama:}

p(µ, τ ) = p(µ|τ ) · p(τ ) com

p(µ|τ ) ∼ N∗(µ0, λ0τ ), λ0 > 0

(16)

Familia Conjugada de Distribui¸c˜

oes

Fam´ılias Normal e Normal-Gama

Exemplo 3: Se p( ¯X |µ, τ ) tem distribui¸cãoo N∗(µ, nτ ) e se (µ, τ ) tem distribui¸cão priori NG (µ0, λ0, α0, β0), então p(µ, τ | ¯X , S2) terá

distribui¸c˜ao NG (µ1, λ1, α1, β1) com parˆametros

µ1= λ0µ0+ n ¯X λ0+ n α1 = α0+ n 2 λ1= λ0+ n β1 = β0+ (n − 1)S2 2 + nλ0( ¯X − µ0)2 2(λ0+ n)

(17)

Ganho de Peso de Leit˜

oes

1 Amostra de n = 20 leit˜oes com ganho de peso m´edio

¯

X = 30kg e desvio padr˜ao S = 10kg.

2 Priori NG (µ₀ = 45, λ₀= 2, α₀ = 2, β₀ = 100)

> n <- 20; x.bar <- 30; S <- 10

> mu0 <- 45; lambda0 <- 2; alpha0 <- 2; beta0 <- 100 > mu1 <- (lambda0*mu0+n*x.bar)/(lambda0+n) > lambda1 <- lambda0+n > alpha1 <- alpha0+n/2 > beta1 <- beta0+(n-1)*S^2/2+n*lambda0*(x.bar-mu0)^2/ + (2*(lambda0+n)) > round(c(mu1,lambda1,alpha1,beta1),2) [1] 31.36 22.00 12.00 1254.55

(18)

Ganho de Peso de Leit˜

oes

(distribui¸c˜

oes posteriores marginais)

0.00 0.01 0.02 0.03 0.04 0.05 0.06 0 50 100 150 tau p(tau|dados) 20 30 40 50 60 70 0.00 0.05 0.10 0.15 mu p(m u|dados)

(19)

Distribui¸c˜

ao Marginal p(µ|¯

x , S )

1 µ =

q

β1

λ1α1 · T + µ1

tem distribui¸c˜ao Student n˜ao-central p(µ|¯x , S ) ∼ St(2α1, µ1,

p

β1/(λ1α1))

2 T tem distribui¸c˜ao de Student (padronizada) com g = 2α₁

graus de liberdade (St(g , 0, 1))

3 Exerc´ıcio 4.7 (p.113) para calcular densidades de uma Student

n˜ao-central St(g , µ1, σ1) p(µ) = pT µ − µ1 σ1 · dT dµ = pT µ − µ1 σ1 · 1 σ1

(20)

Familia Conjugada Normal e Normal-Gama

Prioris n˜

ao-informativas

Exemplo 3(B): Se p( ¯X |µ, τ ) tem distribui¸cãoo N∗(µ, nτ ) e se (µ, τ ) tem distribui¸cão priori não-informativa (Jeffreys) p(µ, τ ) = 1/τ , então p(µ, τ | ¯X , S2) terá distribui¸cão NG (µ1, λ1, α1, β1) com parâmetros

µ1 = ¯X α1 = n − 1 2 λ1 = n β1 = (n − 1)S2 2

(21)

Ganho de peso de Leit˜

oes: o impacto da priori

µ σ =p1/τ Percentil I NI I NI 2.5% 26.86 25.32 7.98 7.60 50.0% 31.36 30.00 10.37 10.19 97.5% 35.86 34.68 14.22 14.61

(22)

FIM

OBRIGADO paulkinas@furg.br