• Nenhum resultado encontrado

M´arciaD’EliaBranco InferˆenciaBayesiana-Aula1-

N/A
N/A
Protected

Academic year: 2022

Share "M´arciaD’EliaBranco InferˆenciaBayesiana-Aula1-"

Copied!
20
0
0

Texto

(1)

Inferˆ encia Bayesiana - Aula 1 -

M´arcia D’Elia Branco

Universidade de S˜ao Paulo Instituto de Matem´atica e Estat´ıstica www.ime.usp.br/ mbranco - sala 295-A -

(2)

Paradigmas Bayesiano

Fazer inferˆencia ´e usar a informa¸c˜ao para reduzir a incerteza sobre um objeto em estudo.

Existe duas fontes de informa¸c˜ao: amostral (associado ao experimento) e conhecimentos pr´evios (sua experiˆencia de vida)

A incerteza a respeito de tudo o que ´e desconhecido deve ser traduzida por uma medida de probabilidade.

Interpreta¸c˜oes subjetiva ou l´ogica de probabilidade.

Probabilidade como uma medida pessoal de incerteza, n˜ao como o limite da frequˆencia relativa (postura cl´assica).

(3)

Na escola Bayesiana cada observa¸c˜ao ´e ´unica.

A escola Cl´assica ´e baseada na possibilidade de repetir experimentos sob as mesmas condi¸c˜oes.

Exemplo 1: Interpreta¸c˜ao da medida de probabilidade.

EC:Se lan¸camosnvezes a mesma moeda sob as mesmas condi¸c˜oes e calculamos a frequˆencia relativa do n´umero de caras, este valor se estabilizar´a em 1/2 (limite da frequˆencia relativa).

EB:Para vocˆe a credibilidade na ocorrˆencia de cara ´e a mesma que na n˜ao ocorrˆencia. Se vocˆe tiver que apostar contra um oponente no resultado da moeda (cara) dever´a apostar 1 contra 1.

Ent˜aoP rob(cara) = 1/2.

(4)

Compara¸c˜ ao com a inferˆ encia cl´ assica

Exemplo 2: Faz sentido utilizar toda a informa¸c˜ao dispon´ıvel ou somente a amostral ´e relevante?

Vocˆe deseja inferir sobre a capacidade de uma pessoa acertar resultados. Apresentam-se para o teste

∗ um especialista em m´usica que diz ser capaz de diferir as m´usicas de Haydn e Mozart.

∗ um bˆebado que diz ser capaz de acertar os resultados no lan¸camento de uma moeda.

Se ambos s˜ao submetidos a dez provas e acertam todas elas, ent˜ao sua inferˆencia baseada nos dados ´e a mesma. Ser´a razo´avel?

(5)

Em estudos de popula¸c˜ao de peixes os cientistas est˜ao interessados na rela¸c˜ao entre o tamanho e a maturidade sexual da fˆemea de uma determinada esp´ecie de peixe. O interesse ´e determinar o tamanho em que cerca de 50 % das fˆemeas alcan¸cam a maturidade sexual, denominado tamanho de matura¸c˜ao.

Os dados na Tabela 1 representam o tamanho e a maturidade sexual de 17 fˆemeas capturadas na costa sul do Brasil.

Considere yi o n´umero de fˆemeas maduras e ni o n´umero total de fˆemeas. pi ´e a probabilidade de que uma fˆemea na classe iesteja madura.

(6)

Motiva¸c˜ ao: Estudo da maturidade sexual do peixe-galo.

Tabela 1: N´umero de fˆemeas maduras por tamanho.

Comprimento (cm) Total Maduras

10 - 20 3 0

20 - 30 5 1

30 - 40 4 3

40 - 70 5 5

Suponhayi uma Binomial(ni, pi) com pi a probabilidade de que uma fˆemea na classeiesteja madura. xi ´e o ponto m´edio da classei. O modelo log´ıstico ´e dado por

log pi

1−pi

01(xi−x)¯

(7)

A quantidade principal de interesse ´e LT50=−β0

β1 + ¯x, obtida quando substitui-sepi por 0.5.

A an´alise Bayesiana resulta na obten¸c˜ao da distribui¸c˜ao de probabilidade associada a LT50.

Esta distribui¸c˜ao de probabilidade representa a incerteza a posterior sobre a quantidade de interesse.

A partir da distribui¸c˜ao a posterior, pode-se obter uma estima¸c˜ao pontual igual a 28 cm e um intervalo, de probabilidade 0.95, igual a (22.65 ; 35.25).

(8)

Motiva¸c˜ ao: Estudo da maturidade sexual do peixe-galo.

LT50 depende de dois parˆametros desconhecidos β0 e β1, os quais tamb´em possuem uma distribui¸c˜ao de probabilidade a posterior.

Iniciamos com uma medida de probabilidade a priori f(β0, β1), por exemplo, normal bivariada.

Para obter a medida a posterior utilizamos a f´ormula de Bayes f(β0, β1 |y) = f(y|β0, β1)f(β0, β1)

f(y) ,

onde f(y|β0, β1)´e a probabilidade conjunta dey1, y2, . . . , yk supondo os parˆametros conhecidos. No nosso caso, esta probabilidade ´e o produto de binomias.

A quantidade f(y) ´e a distribui¸c˜ao marginal e ´e obtida pela integra¸c˜ao do numerador. N˜ao existe solu¸c˜ao anal´ıtica e algoritmos num´ericos s˜ao necess´arios.

(9)

Sob a abordagem cl´assica os parˆametros podem ser estimados utilizando-se os estimadores de m´axima verossimilhan¸ca e a teoria assint´otica normal.

As estimativas pontuais, e por intervalo, de m´axima verossimilhan¸ca de β1 s˜ao 0.266 e (-00188 ; 0.5526), com confian¸ca de 95 % .

Sob a abordagem Bayesiana, o intervalo de credibilidade ´e (0.112 ; 0.795), com probabilidade 95 %.

Esta diferen¸ca justifica-se pela assimetria observada na distribui¸c˜ao a posteriori.

Enquanto que o intervalo cl´assico indica queβ1 pode ser zero, a distribui¸c˜aoa posterioriindica claramente um valor positivo.

(10)

O modelo param´ etrico probabil´ıstico.

Uma medida de probabilidade P ´e definida em um espa¸co (X,A),onde A´e uma sigma ´algebra de elementos mensur´aveis.

Um espa¸co param´etrico estat´ıstico ´e um conjunto (fam´ılia) de medidas de probabilidade, associadas a um vetor aleat´orioX, indexadas por um parˆametroθ,

(X,A, Pθ), ∀θ

Sob o ponto de vista Bayesiano ´e preciso definir uma medida de probabilidade a prior para θ,

(Θ,B, π)

(11)

Sob certas suposi¸c˜oes, ´e poss´ıvel definir uma medida de probabilidade conjunta paraX e θ .

Usa-se a f´ormula de Bayes para obter a medida de

probabilidade condicional de θdado o resultado da amostra X =x

f(θ|x) = P(X=x|θ)f(θ) P

Θ

P(X=x|θ)f(θ)

f(θ|x) = f(x|θ)f(θ) R

Θ

f(x|θ)f(θ)dθ

(12)

O modelo param´ etrico binomial

Exemplo 1: O modelo binomial.

X|θ, n∼Bin(n, θ) ,0< θ <1e ninteiro.

Suponhan conhecido, ´e preciso definir uma medida de probabilidade paraθ.

Prior 1:

θ 0.25 0.50 0.75 f(θ) 0.25 0.50 0.25

Paran= 2 a posterior ´e

θ 0.25 0.50 0.75

f(θ|x= 0) 0.500 0.440 0.060 f(θ|x= 1) 0.214 0.572 0.214 f(θ|x= 2) 0.060 0.440 0.500

(13)

Prior 2: θ∼Beta(a, b). Ent˜ao sua fun¸c˜ao de densidade ´e f(θ) = Γ(a+b)

Γ(a)Γ(b)θa−1(1−θ)b−1 , a >0 b >0.

Para obter a marginalf(x) integra-se emθ

f(x) =

1

Z

0

f(θ)Cn,x(θ)x(1−θ)n−xdθ.

Observe que n˜ao h´a necessidade de preocupar-se com a quantidade Cn,x (constante) pois

f(θ|x) = θa+x−1(1−θ)b+n−x−1

1

R(θ)a+x(1−θ)b+n−x−1

(14)

O modelo param´ etrico binomial.

Podemos mostrar que a distribui¸c˜ao a posteriori´e θ|x∼Beta(a+x, b+n−x).

Se as distribui¸c˜oesa priori ea posteriori est˜ao na mesma classe de distribui¸c˜oes, dizemos que s˜ao conjugadas em rela¸c˜ao ao modelo estat´ısticoX|θ.

Como escolhera eb ?

Se a=btemos uma distribui¸c˜ao sim´etrica.

Se a=b= 1 temos uma uniforme.

A m´edia e a variˆancia a prioris˜ao E[θ] = a+ba

V ar[θ] = (a+b)2ab(a+b+1).

(15)

0.0 0.2 0.4 0.6 0.8 1.0

0.00.51.01.52.0

Densidades Beta simetricas

x

densidade

(16)

Gr´ aficos da densidade Beta

0.0 0.2 0.4 0.6 0.8 1.0

0.00.51.01.52.02.5

Densidades Beta assimetricas a < b

x

densidade

(17)

Usando o seu conhecimento para construir suaa priori.

∗Qual o significado deθ?

∗Informa¸c˜oesa priori

θ (0.00 - 0.25) (0.25 - 0.50) (0.50 - 0.75) (0.75 - 1.00)

Prob. 0.10 0.40 0.40 0.10

∗Densidadea priori : θ∼Beta(3,3)

θ (0.00 - 0.25) (0.25 - 0.50) (0.50 - 0.75) (0.75 - 1.00)

Pbeta. 0.1035 0.3965 0.3965 0.1035

(18)

Gr´ aficos das densidades a posteriori com n=2 e priori Beta(3,3)

0.0 0.2 0.4 0.6 0.8 1.0

0.01.02.0

Priori e Posteriori, n=2, x=0

x

densidade

0.0 0.2 0.4 0.6 0.8 1.0

0.01.02.0

Priori e Posteriori, n=2, x=1

x

densidade

0.0 0.2 0.4 0.6 0.8 1.0

0.01.02.0

Priori e Posteriori, n=2, x=2

x

densidade

(19)

0.0 0.2 0.4 0.6 0.8 1.0

051015

Priori e Posteriori, n=50, x=0

x

densidade

0.0 0.2 0.4 0.6 0.8 1.0

0246

Priori e Posteriori, n=50, x=25

x densidade 051015

Priori e Posteriori, n=50, x=50

densidade

(20)

Gr´ aficos das densidades a posteriori com n=50 e priori Beta(50,50)

0.0 0.2 0.4 0.6 0.8 1.0

02468

Priori e Posteriori, n=50, x=0 (Priori II)

x

densidade

0.0 0.2 0.4 0.6 0.8 1.0

0246810

Priori e Posteriori, n=50, x=25 (Priori II)

x

densidade

0.0 0.2 0.4 0.6 0.8 1.0

02468

Priori e Posteriori, n=50, x=50 (Priori II)

x

densidade

Referências

Documentos relacionados

O trabalho no CEPDOMP caracteriza-se pela grande interface entre ensino, pesquisa e extensão, contribuindo para o despertar e a formação de estudantes no

b) O não comparecimento de TODOS para a realização dessa prova. Caso ocorra alguma das situações previstas no item 7 e ainda restarem candidatos não selecionados anteriormente para

Há os minérios, que são extraídos do solo (como o ouro, o diamante e outros); os materiais de origem vegetal extraídos das plantas (como o látex usado para fazer a borracha); os

É de suma importância que o profissional enfermeiro saiba a linguagem não verbal a LIBRAS, pois essa é a comunicação mais eficiente com o cliente surdo, dando a

Probabilidade como uma medida pessoal de incerteza, n˜ ao como o limite da frequˆ encia relativa (postura cl´ assica).... Introdu¸

O mapa temático apresentado aos educandos na sala despertou a atenção dos alunos, principalmente pelo espaço representado (parte da cidade de Viçosa-MG) fazer parte

ICEUBI2015 - INTERNATIONAL CONFERENCE ON ENGINEERING 2015 – 2-4 Dec 2015 – University of Beira Interior – Covilhã, Portugal - o berçário (infantário 2) apresenta valores

Os testes de desequilíbrio de resistência DC dentro de um par e de desequilíbrio de resistência DC entre pares se tornarão uma preocupação ainda maior à medida que mais