An´
alise Bayesiana de Decis˜
ao
Parte 6: inferˆ
encia estat´ıstica e decis˜
ao sob
incerteza
Paul Kinas
An´
alise Bayesiana de Decis˜
ao: elementos
1 Decis˜oes – Uma lista (exaustiva e exclusiva) decis˜oes
(escolhas): δ1, . . . , δm.
2 Eventos – Uma lista (exaustiva e exclusiva) de “estados da
natureza” (hip´oteses) θ1, . . . , θn.
As incertezas associadas a θs s˜ao representadas por
(distribui¸c˜oes de) probabilidades p(θ).
3 Perdas – A cada par (δi, θj est´a associada uma consequˆencia
(ci ,j) usualmente determinada por uma fun¸c˜ao de perda
ci ,j = L(δi, θj)
4 Dados – A coleta de dados (x ), seja por experimentos
controlados ou por estudos observacionais, poder´a modificar a
incerteza associada aos θs gerando as probabilidades posteriores p(θj|x).
Nota: a ´ultima etapa n˜ao ´e essencial para que uma an´alise decis´oria possa ser realizada
ABD Exemplo Peixe-Galo (1)
θ tamanho de primeira matura¸c˜ao (Lt50) em cm.
A, B e C s˜ao petrechos de pesca com diferentes seletividades
por comprimento. Estados da Natureza (θ) δ < 20 20 ` 25 25 ` 30 30 ` 35 35 ` 40 > 40 A * * * * * * B * * L(δ, θ) * * * C * * * * * * p(θ|x )
ABD Exemplo Peixe-Galo (2)
A obten¸c˜ao de LT 50 ser´a tratado na pr´oxima aula. Estados da Natureza (θ) δ < 20 20 ` 25 25 ` 30 30 ` 35 35 ` 40 > 40 A * * * * * * B * * L(δ, θ) * * * C * * * * * * p(θ|x ) 0.005 0.127 0.620 0.229 0.019 0.000
ABD Exemplo Peixe-Galo (3)
Estados da Natureza (θ) δ < 20 20 ` 25 25 ` 30 30 ` 35 35 ` 40 > 40 A 1 0 2 4 6 8 B 3 2 1 0 2 4 C 4 3 2 1 0 2 p(θ|x ) 0.005 0.127 0.620 0.229 0.019 0.000Defini¸c˜ao: No conjunto ∆ = {δi; i = 1, 2, . . . , m} de todas as
poss´ıveis decis˜oes, denomina-se como decis˜ao de Bayes δB aquela
ABD Exemplo Peixe-Galo (4)
Perda Esperada para δi:
¯ Li = X j L(δi, θj) · p(θj|x) Estados da Natureza (θ) δ < 20 20 ` 25 25 ` 30 30 ` 35 35 ` 40 > 40 L¯ A 1 0 2 4 6 8 2.27 B 3 2 1 0 2 4 0.93 C 4 3 2 1 0 2 1.87 p(θ|x ) 0.005 0.127 0.620 0.229 0.019 0.000
Inferˆ
encia e Decis˜
ao
Defini¸c˜ao:
O estimador de Bayes do parˆametro θ, condicionado aos dados x
e simbolizado por δB(x ), ´e o valor de δ(x ) ∈ Θ que minimiza a
perda esperada sobre a distribui¸c˜ao posterior: δB(x ) = min
δ(x )
Z
Alguns Estimadores (pontuais) de Bayes
a. Perda quadr´atica
L(θ, δ(x )) = [θ − δ(x )]2
O estimador de Bayes ser´a δB(x ) = Ep(θ|x )[θ], ou seja, a
m´edia da distribui¸c˜ao posterior.
b. Perda absoluta
L(θ, δ(x )) = |θ − δ(x )|
O estimador de Bayes ser´a a mediana da distribui¸c˜ao posterior.
c. Perda 0-1
L(θ, δ(x )) = (
0, se θ = δ(x )
1, se θ 6= δ(x )
Neste caso o estimador de Bayes ser´a a maior moda de
Gest˜
ao Precaut´
oria Bayesiana: as cotas da tainha em 2018
1 Modelo Bayesiano para dinˆamica de biomassa. Sum´arios da
distribui¸c˜ao posterior do rendimento m´aximo sustent´avel θ:
M´edia = 7.99t; DP = 3.17t; Mediana = 7.73t
2 Cota de captura ´e um limite biologicamente aceit´avel
LBA < θ. Fun¸c˜ao de perda precaut´oria (k > 1): L(θ, LBA) =
(
(θ − LBA)2, se LBA < θ
k · (θ − LBA)2, se LBA > θ
3 Se k = 1 ent˜ao LBA = ¯θ; quanto maior for k, menor ser´a
LBA em rela¸c˜ao a ¯θ.
4 Utilizou-se o percentil 30% para LBA, ou seja
P(θ < LBA|x ) = 0.30; isso equivale a k = 4.6
5 A variˆancia posterior de δ(x ) = LBA:
Estimativas Intervalares
Intervalo de Credibilidade (CrI): ´e o intervalo posterior
delimitado por percentis. Por exemplo, CrI90 ´e o intervalo
(θa, θb) tal que θa = θ5% e θb= θ95%.
Intervalo de M´axima Densidade (HDI): ´e o intervalo posterior
delimitado de modo que todo valor de θ pertencente ao intervalo tem densidades maior que qualquer valor de θ fora do intervalo
Revisitando a P´ılula do Dia Seguinte (RU486)
Consideremos uma distribui¸c˜ao posterior θ ∼ Beta(1.5, 5.5).
Construimos as duas estimativas intervalares de 90% > # CrI-90:
> qbeta(c(0.05,0.95),1.5,5.5) [1] 0.0301821 0.4945387
> #HDI-90
> library(HDInterval)
> hdi(qbeta, 0.9, shape1= 1.5, shape2 = 5.5)
lower upper
0.003102928 0.422529616 attr(,"credMass")
Revisitando a P´ılula do Dia Seguinte (RU486)
Compara¸c˜ao dos Dois intervalos:
CrI-90; HDI-90 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.5 1.0 1.5 2.0 2.5 3.0 teta dbeta(x, 1.5, 5.5)
HDI para posteriores obtidos em MCMC
Reexaminamos a compara¸c˜ao da propor¸c˜ao de fˆemeas de
caranguejos nas ´areas A e B (Exercicio 1, Parte4)
deltaAB Density −0.05 0.00 0.05 0.10 0.15 0 2 4 6 8 10 12 > hdi(deltaAB,0.90) lower upper 0.007553817 0.118440197 attr(,"credMass") [1] 0.9
Teste de Hip´
oteses
Terminologia:
1 δ0 denota decis˜ao em favor de H0;
δ1 denota decis˜ao em favor de H1
2 w0 ´e a penaliza¸c˜ao se a decis˜aoδ0 for errada;
w1 ´e a penaliza¸c˜ao se a decis˜aoδ1 for errada
3 p0(x ) = P(H0|x) = P(θ ∈ Θ0|x): prob. posterior de H0;
Tabela Decis´
oria para Teste de Hip´
oteses
Realidade (desconhecida) Decis˜ao H0: θ ∈ Θ0 H1 : θ ∈ Θ1 δ0 0 w1 δ1 w0 0 Prob p0(x ) p1(x )Decis˜ao de Bayes: minimizar a perda esperada; ou seja, preferir δ1
somente quando w0p0(x ) < w1p1(x )
Deve-se rejeitar a hip´otese H0 somente se sua probabilidade
posterior p0(x ) for inferior a
w1
w0+ w1
Fator de Bayes (BF)
1 Hip´oteses H0 : θ ∈ Θ0 versus H1 : θ ∈ Θ1
2 Para i ∈ {0, 1} definimos as probabilidades a priori pi = P(Hi)
e a e a posteriori pi(x ) = P(Hi|x) das hip´oteses
3 chance a priori contra H0
o(1, 0) = p1 p0
4 chance a posteriori contra H0
o(1, 0|x ) = p1(x ) p0(x )
Fator de Bayes (FB)
FB1,0 =
o(1, 0|x ) o(1, 0)
Crit´erios conforme Jeffreys:
FB1,0 Evidˆencia Contra H0
1.0 - 3.2 fraca (*)
3.2 - 10.0 substancial (**)
10.0 - 100.0 forte (***)
Decis˜
ao de Bayes re-expressa pelo Fator de Bayes
Deve-se rejeitar a hip´otese H0 sempre que o Fator de Bayes (FB)
satisfizer a desigualdade FB(1,0) > w0 w1
· o(1, 0). Caso contr´ario, H0
n˜ao ser´a rejeitado.
Obs: quando a priori fixarmos P(H0) = P(H1), ent˜ao segue que
Alguns coment´
arios sobre Teste de Hip´
oteses
1 Testesunilaterais (i.e.: θ ≤ θ0 versusθ > θ0) s˜ao facilmente
avaliados pelo FB
2 Em testes bilateriais(i.e.: θ = θ0 versus θ 6= θ0) sugiro utilizar
HDI ou CrI para avaliar θ0 (para uma solu¸c˜ao via TH ver em
K&A, pp. 151 e 152)
3 Um teste Bayesiano que leva em conta w0 e w1 ´e mais
completo que um teste frequentista convencional que somente d´a aten¸c˜ao ao Erro I atrav´es do p-valor (?)
Inferˆ
encia Preditiva
1 inferˆencias sobre dados futuros (˜x ), com base em dados
passados (x ) e num modelo parametrizado por θ
2 densidade de probabilidade preditiva posterior p(˜x |x ) se define
da seguinte forma
a. se θ ´e um conjunto discreto de valores p(˜x |x ) =X
i
p(˜x |θi)p(θi|x)
b. se θ ´e cont´ınuo em algum intervalo [θE, θD]
p(˜x |x ) = θD
Z
θE
FIM
OBRIGADO paulkinas@furg.br