ABD Parte6

(1)

An´

alise Bayesiana de Decis˜

ao

Parte 6: inferˆ

encia estat´ıstica e decis˜

ao sob

incerteza

Paul Kinas

(2)

An´

alise Bayesiana de Decis˜

ao: elementos

1 Decis˜oes – Uma lista (exaustiva e exclusiva) decis˜oes

(escolhas): δ1, . . . , δm.

2 _{Eventos – Uma lista (exaustiva e exclusiva) de “estados da}

natureza” (hip´oteses) θ1, . . . , θn.

As incertezas associadas a θs s˜ao representadas por

(distribui¸c˜oes de) probabilidades p(θ).

3 Perdas – A cada par (δ_i, θ_j est´a associada uma consequˆencia

(ci ,j) usualmente determinada por uma fun¸c˜ao de perda

ci ,j = L(δi, θj)

4 Dados – A coleta de dados (x ), seja por experimentos

controlados ou por estudos observacionais, poder´a modificar a

incerteza associada aos θs gerando as probabilidades posteriores p(θj|x).

Nota: a última etapa não é essencial para que uma análise decisória possa ser realizada

(3)

ABD Exemplo Peixe-Galo (1)

θ tamanho de primeira matura¸c˜ao (Lt50) em cm.

A, B e C s˜ao petrechos de pesca com diferentes seletividades

por comprimento. Estados da Natureza (θ) δ < 20 20 ` 25 25 ` 30 30 ` 35 35 ` 40 > 40 A * * * * * * B * * L(δ, θ) * * * C * * * * * * p(θ|x )

(4)

ABD Exemplo Peixe-Galo (2)

A obten¸cão de LT 50 será tratado na próxima aula. Estados da Natureza (θ) δ < 20 20 ` 25 25 ` 30 30 ` 35 35 ` 40 > 40 A * * * * * * B * * L(δ, θ) * * * C * * * * * * p(θ|x ) 0.005 0.127 0.620 0.229 0.019 0.000

(5)

ABD Exemplo Peixe-Galo (3)

Estados da Natureza (θ) δ < 20 20 ` 25 25 ` 30 30 ` 35 35 ` 40 > 40 A 1 0 2 4 6 8 B 3 2 1 0 2 4 C 4 3 2 1 0 2 p(θ|x ) 0.005 0.127 0.620 0.229 0.019 0.000

Defini¸c˜ao: No conjunto ∆ = {δi; i = 1, 2, . . . , m} de todas as

poss´ıveis decis˜oes, denomina-se como decis˜ao de Bayes δB aquela

(6)

ABD Exemplo Peixe-Galo (4)

Perda Esperada para δi:

¯ Li = X j L(δi, θj) · p(θj|x) Estados da Natureza (θ) δ < 20 20 ` 25 25 ` 30 30 ` 35 35 ` 40 > 40 L¯ A 1 0 2 4 6 8 2.27 B 3 2 1 0 2 4 0.93 C 4 3 2 1 0 2 1.87 p(θ|x ) 0.005 0.127 0.620 0.229 0.019 0.000

(7)

Inferˆ

encia e Decis˜

ao

Defini¸c˜ao:

O estimador de Bayes do parˆametro θ, condicionado aos dados x

e simbolizado por δB(x ), ´e o valor de δ(x ) ∈ Θ que minimiza a

perda esperada sobre a distribui¸c˜ao posterior: δB(x ) = min

δ(x )

Z

(8)

Alguns Estimadores (pontuais) de Bayes

a. Perda quadr´atica

L(θ, δ(x )) = [θ − δ(x )]2

O estimador de Bayes ser´a δB(x ) = Ep(θ|x )[θ], ou seja, a

m´edia da distribui¸c˜ao posterior.

b. Perda absoluta

L(θ, δ(x )) = |θ − δ(x )|

O estimador de Bayes ser´a a mediana da distribui¸c˜ao posterior.

c. Perda 0-1

L(θ, δ(x )) = (

0, se θ = δ(x )

1, se θ 6= δ(x )

Neste caso o estimador de Bayes ser´a a maior moda de

(9)

Gest˜

ao Precaut´

oria Bayesiana: as cotas da tainha em 2018

1 _{Modelo Bayesiano para dinˆ}_{amica de biomassa. Sum´}_{arios da}

distribui¸cão posterior do rendimento máximo sustentável θ:

M´edia = 7.99t; DP = 3.17t; Mediana = 7.73t

2 Cota de captura ´e um limite biologicamente aceit´avel

LBA < θ. Fun¸c˜ao de perda precaut´oria (k > 1): L(θ, LBA) =

(

(θ − LBA)2, se LBA < θ

k · (θ − LBA)2, se LBA > θ

3 Se k = 1 ent˜ao LBA = ¯θ; quanto maior for k, menor ser´a

LBA em rela¸c˜ao a ¯θ.

4 Utilizou-se o percentil 30% para LBA, ou seja

P(θ < LBA|x ) = 0.30; isso equivale a k = 4.6

5 A variˆancia posterior de δ(x ) = LBA:

(10)

Estimativas Intervalares

Intervalo de Credibilidade (CrI): ´e o intervalo posterior

delimitado por percentis. Por exemplo, CrI90 ´e o intervalo

(θa, θb) tal que θa = θ5% e θb= θ95%.

Intervalo de M´axima Densidade (HDI): ´e o intervalo posterior

delimitado de modo que todo valor de θ pertencente ao intervalo tem densidades maior que qualquer valor de θ fora do intervalo

(11)

Revisitando a P´ılula do Dia Seguinte (RU486)

Consideremos uma distribui¸c˜ao posterior θ ∼ Beta(1.5, 5.5).

Construimos as duas estimativas intervalares de 90% > # CrI-90:

> qbeta(c(0.05,0.95),1.5,5.5) [1] 0.0301821 0.4945387

> #HDI-90

> library(HDInterval)

> hdi(qbeta, 0.9, shape1= 1.5, shape2 = 5.5)

lower upper

0.003102928 0.422529616 attr(,"credMass")

(12)

Revisitando a P´ılula do Dia Seguinte (RU486)

Compara¸c˜ao dos Dois intervalos:

CrI-90; HDI-90 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.5 1.0 1.5 2.0 2.5 3.0 teta dbeta(x, 1.5, 5.5)

(13)

HDI para posteriores obtidos em MCMC

Reexaminamos a compara¸cão da propor¸cão de fêmeas de

caranguejos nas ´areas A e B (Exercicio 1, Parte4)

deltaAB Density −0.05 0.00 0.05 0.10 0.15 0 2 4 6 8 10 12 > hdi(deltaAB,0.90) lower upper 0.007553817 0.118440197 attr(,"credMass") [1] 0.9

(14)

Teste de Hip´

oteses

Terminologia:

1 δ₀ denota decis˜ao em favor de H₀;

δ1 denota decis˜ao em favor de H1

2 w₀ é a penaliza¸cão se a decisãoδ₀ for errada;

w1 é a penaliza¸cão se a decisãoδ1 for errada

3 _p₀_{(x ) = P(H}₀|x) = P(θ ∈ Θ₀|x): prob. posterior de H₀_;

(15)

Tabela Decis´

oria para Teste de Hip´

oteses

Realidade (desconhecida) Decis˜ao H0: θ ∈ Θ0 H1 : θ ∈ Θ1 δ0 0 w1 δ1 w0 0 Prob p0(x ) p1(x )

Decis˜ao de Bayes: minimizar a perda esperada; ou seja, preferir δ1

somente quando w0p0(x ) < w1p1(x )

Deve-se rejeitar a hip´otese H0 somente se sua probabilidade

posterior p0(x ) for inferior a

w1

w0+ w1

(16)

Fator de Bayes (BF)

1 _Hip´_{oteses H}₀ _{: θ ∈ Θ}₀ _{versus H}₁ _{: θ ∈ Θ}₁

2 Para i ∈ {0, 1} definimos as probabilidades a priori p_i = P(H_i)

e a e a posteriori pi(x ) = P(Hi|x) das hip´oteses

3 chance a priori contra H₀

o(1, 0) = p1 p0

4 chance a posteriori contra H₀

o(1, 0|x ) = p1(x ) p0(x )

(17)

Fator de Bayes (FB)

FB1,0 =

o(1, 0|x ) o(1, 0)

Crit´erios conforme Jeffreys:

FB1,0 Evidˆencia Contra H0

1.0 - 3.2 fraca (*)

3.2 - 10.0 substancial (**)

10.0 - 100.0 forte (***)

(18)

Decis˜

ao de Bayes re-expressa pelo Fator de Bayes

Deve-se rejeitar a hip´otese H0 sempre que o Fator de Bayes (FB)

satisfizer a desigualdade FB_(1,0) > w0 w1

· o(1, 0). Caso contr´ario, H0

n˜ao ser´a rejeitado.

Obs: quando a priori fixarmos P(H0) = P(H1), ent˜ao segue que

(19)

Alguns coment´

arios sobre Teste de Hip´

oteses

1 Testesunilaterais (i.e.: θ ≤ θ₀ versusθ > θ₀) s˜ao facilmente

avaliados pelo FB

2 Em testes bilateriais(i.e.: θ = θ₀ versus θ 6= θ₀) sugiro utilizar

HDI ou CrI para avaliar θ0 (para uma solu¸c˜ao via TH ver em

K&A, pp. 151 e 152)

3 Um teste Bayesiano que leva em conta w₀ e w₁ ´e mais

completo que um teste frequentista convencional que somente dá aten¸cão ao Erro I através do p-valor (?)

(20)

Inferˆ

encia Preditiva

1 inferˆencias sobre dados futuros (˜x ), com base em dados

passados (x ) e num modelo parametrizado por θ

2 _{densidade de probabilidade preditiva posterior p(˜}_{x |x ) se define}

da seguinte forma

a. se θ ´e um conjunto discreto de valores p(˜x |x ) =X

i

p(˜x |θi)p(θi|x)

b. se θ ´e cont´ınuo em algum intervalo [θE, θD]

p(˜x |x ) = θD

Z

θE

(21)

FIM

OBRIGADO paulkinas@furg.br