M´arciaD’EliaBranco InferˆenciaBayesiana-Aula1-

(1)

Inferˆ encia Bayesiana - Aula 1 -

M´arcia D’Elia Branco

Universidade de S˜ao Paulo Instituto de Matem´atica e Estat´ıstica www.ime.usp.br/ mbranco - sala 295-A -

(2)

Paradigmas Bayesiano

Fazer inferência é usar a informa¸cão para reduzir a incerteza sobre um objeto em estudo.

Existe duas fontes de informa¸cão: amostral (associado ao experimento) e conhecimentos prévios (sua experiência de vida)

A incerteza a respeito de tudo o que ´e desconhecido deve ser traduzida por uma medida de probabilidade.

Interpreta¸c˜oes subjetiva ou l´ogica de probabilidade.

Probabilidade como uma medida pessoal de incerteza, não como o limite da frequência relativa (postura clássica).

(3)

Na escola Bayesiana cada observa¸cão é única.

A escola Clássica é baseada na possibilidade de repetir experimentos sob as mesmas condi¸cões.

Exemplo 1: Interpreta¸c˜ao da medida de probabilidade.

EC:Se lan¸camosnvezes a mesma moeda sob as mesmas condi¸cões e calculamos a frequência relativa do número de caras, este valor se estabilizará em 1/2 (limite da frequência relativa).

EB:Para você a credibilidade na ocorrência de cara é a mesma que na não ocorrência. Se você tiver que apostar contra um oponente no resultado da moeda (cara) deverá apostar 1 contra 1.

Ent˜aoP rob(cara) = 1/2.

(4)

Compara¸c˜ ao com a inferˆ encia cl´ assica

Exemplo 2: Faz sentido utilizar toda a informa¸c˜ao dispon´ıvel ou somente a amostral ´e relevante?

Vocˆe deseja inferir sobre a capacidade de uma pessoa acertar resultados. Apresentam-se para o teste

∗ um especialista em m´usica que diz ser capaz de diferir as m´usicas de Haydn e Mozart.

∗ um bˆebado que diz ser capaz de acertar os resultados no lan¸camento de uma moeda.

Se ambos são submetidos a dez provas e acertam todas elas, então sua inferência baseada nos dados é a mesma. Será razoável?

(5)

Em estudos de popula¸cão de peixes os cientistas estão interessados na rela¸cão entre o tamanho e a maturidade sexual da fêmea de uma determinada espécie de peixe. O interesse é determinar o tamanho em que cerca de 50 % das fêmeas alcan¸cam a maturidade sexual, denominado tamanho de matura¸cão.

Os dados na Tabela 1 representam o tamanho e a maturidade sexual de 17 fˆemeas capturadas na costa sul do Brasil.

Considere yi o número de fêmeas maduras e ni o número total de fêmeas. p_i é a probabilidade de que uma fêmea na classe iesteja madura.

(6)

Motiva¸c˜ ao: Estudo da maturidade sexual do peixe-galo.

Tabela 1: N´umero de fˆemeas maduras por tamanho.

Comprimento (cm) Total Maduras

10 - 20 3 0

20 - 30 5 1

30 - 40 4 3

40 - 70 5 5

Suponhayi uma Binomial(ni, pi) com pi a probabilidade de que uma fêmea na classeiesteja madura. x_i é o ponto médio da classei. O modelo log´ıstico é dado por

log pi

1−p_i

=β0+β1(xi−x)¯

(7)

A quantidade principal de interesse ´e LT₅₀=−β₀

β₁ + ¯x, obtida quando substitui-sep_i por 0.5.

A análise Bayesiana resulta na obten¸cão da distribui¸cão de probabilidade associada a LT50.

Esta distribui¸c˜ao de probabilidade representa a incerteza a posterior sobre a quantidade de interesse.

A partir da distribui¸c˜ao a posterior, pode-se obter uma estima¸c˜ao pontual igual a 28 cm e um intervalo, de probabilidade 0.95, igual a (22.65 ; 35.25).

(8)

Motiva¸c˜ ao: Estudo da maturidade sexual do peixe-galo.

LT50 depende de dois parâmetros desconhecidos β0 e β1, os quais também possuem uma distribui¸cão de probabilidade a posterior.

Iniciamos com uma medida de probabilidade a priori f(β₀, β₁), por exemplo, normal bivariada.

Para obter a medida a posterior utilizamos a f´ormula de Bayes f(β0, β1 |y) = f(y|β0, β1)f(β0, β1)

f(y) ,

onde f(y|β0, β1)é a probabilidade conjunta dey1, y2, . . . , y_k supondo os parâmetros conhecidos. No nosso caso, esta probabilidade é o produto de binomias.

A quantidade f(y) é a distribui¸cão marginal e é obtida pela integra¸cão do numerador. Não existe solu¸cão anal´ıtica e algoritmos numéricos são necessários.

(9)

Sob a abordagem clássica os parâmetros podem ser estimados utilizando-se os estimadores de máxima verossimilhan¸ca e a teoria assintótica normal.

As estimativas pontuais, e por intervalo, de m´axima verossimilhan¸ca de β₁ s˜ao 0.266 e (-00188 ; 0.5526), com confian¸ca de 95 % .

Sob a abordagem Bayesiana, o intervalo de credibilidade ´e (0.112 ; 0.795), com probabilidade 95 %.

Esta diferen¸ca justifica-se pela assimetria observada na distribui¸c˜ao a posteriori.

Enquanto que o intervalo cl´assico indica queβ1 pode ser zero, a distribui¸c˜aoa posterioriindica claramente um valor positivo.

(10)

O modelo param´ etrico probabil´ıstico.

Uma medida de probabilidade P é definida em um espa¸co (X,A),onde Aé uma sigma álgebra de elementos mensuráveis.

Um espa¸co paramétrico estat´ıstico é um conjunto (fam´ılia) de medidas de probabilidade, associadas a um vetor aleatórioX, indexadas por um parâmetroθ,

(X,A, P_θ), ∀θ

Sob o ponto de vista Bayesiano ´e preciso definir uma medida de probabilidade a prior para θ,

(Θ,B, π)

(11)

Sob certas suposi¸c˜oes, ´e poss´ıvel definir uma medida de probabilidade conjunta paraX e θ .

Usa-se a f´ormula de Bayes para obter a medida de

probabilidade condicional de θdado o resultado da amostra X =x

f(θ|x) = P(X=x|θ)f(θ) P

Θ

P(X=x|θ)f(θ)

f(θ|x) = f(x|θ)f(θ) R

Θ

f(x|θ)f(θ)dθ

(12)

O modelo param´ etrico binomial

Exemplo 1: O modelo binomial.

X|θ, n∼Bin(n, θ) ,0< θ <1e ninteiro.

Suponhan conhecido, ´e preciso definir uma medida de probabilidade paraθ.

Prior 1:

θ 0.25 0.50 0.75 f(θ) 0.25 0.50 0.25

Paran= 2 a posterior ´e

θ 0.25 0.50 0.75

f(θ|x= 0) 0.500 0.440 0.060 f(θ|x= 1) 0.214 0.572 0.214 f(θ|x= 2) 0.060 0.440 0.500

(13)

Prior 2: θ∼Beta(a, b). Então sua fun¸cão de densidade é f(θ) = Γ(a+b)

Γ(a)Γ(b)θ^a−1(1−θ)^b−1 , a >0 b >0.

Para obter a marginalf(x) integra-se emθ

f(x) =

1

Z

0

f(θ)C_n,x(θ)^x(1−θ)^n−xdθ.

Observe que n˜ao h´a necessidade de preocupar-se com a quantidade C_n,x (constante) pois

f(θ|x) = θ^a+x−1(1−θ)^b+n−x−1

1

R(θ)^a+x(1−θ)^b+n−x−1dθ

(14)

O modelo param´ etrico binomial.

Podemos mostrar que a distribui¸c˜ao a posteriori´e θ|x∼Beta(a+x, b+n−x).

Se as distribui¸cõesa priori ea posteriori estão na mesma classe de distribui¸cões, dizemos que são conjugadas em rela¸cão ao modelo estat´ısticoX|θ.

Como escolhera eb ?

Se a=btemos uma distribui¸c˜ao sim´etrica.

Se a=b= 1 temos uma uniforme.

A média e a variância a priorisão E[θ] = _a+bâ

V ar[θ] = _(a+b)2^ab(a+b+1).

(15)

0.0 0.2 0.4 0.6 0.8 1.0

0.00.51.01.52.0

Densidades Beta simetricas

x

densidade

(16)

Gr´ aficos da densidade Beta

0.0 0.2 0.4 0.6 0.8 1.0

0.00.51.01.52.02.5

Densidades Beta assimetricas a < b

x

densidade

(17)

Usando o seu conhecimento para construir suaa priori.

∗Qual o significado deθ?

∗Informa¸c˜oesa priori

θ (0.00 - 0.25) (0.25 - 0.50) (0.50 - 0.75) (0.75 - 1.00)

Prob. 0.10 0.40 0.40 0.10

∗Densidadea priori : θ∼Beta(3,3)

θ (0.00 - 0.25) (0.25 - 0.50) (0.50 - 0.75) (0.75 - 1.00)

Pbeta. 0.1035 0.3965 0.3965 0.1035

(18)

Gr´ aficos das densidades a posteriori com n=2 e priori Beta(3,3)

0.0 0.2 0.4 0.6 0.8 1.0

0.01.02.0

Priori e Posteriori, n=2, x=0

x

densidade

0.0 0.2 0.4 0.6 0.8 1.0

0.01.02.0

x

densidade

0.0 0.2 0.4 0.6 0.8 1.0

0.01.02.0

x

densidade

(19)

0.0 0.2 0.4 0.6 0.8 1.0

051015

x

densidade

0.0 0.2 0.4 0.6 0.8 1.0

0246

x densidade 051015

densidade

(20)

Gr´ aficos das densidades a posteriori com n=50 e priori Beta(50,50)

0.0 0.2 0.4 0.6 0.8 1.0

02468

Priori e Posteriori, n=50, x=0 (Priori II)

x

densidade

0.0 0.2 0.4 0.6 0.8 1.0

0246810

x

densidade

0.0 0.2 0.4 0.6 0.8 1.0

02468

x

densidade