Técnicas computacionais em probabilidade e estatística II

(1)

T´ ecnicas computacionais em probabilidade e estat´ıstica II

M´arcia D’Elia Branco

Universidade de S˜ao Paulo Instituto de Matem´atica e Estat´ıstica

http:www.ime.usp.br/ mbranco

AULA 8: M´etodos de Monte Carlo baseados em Cadeias de Markov: Diagn´ostico.

(2)

Melhorando o desempenho dos algoritmos MCCM

1. Constru¸c˜ao e uso da amostra MCCM

Construir ncadeia paralelas e após m itera¸cões, supondo obtido o equil´ıbrio, compor uma amostra independente de tamanhon. Processo pouco eficiente, pois n×mvalores são descartados.

Considerar uma única cadeia e após mitera¸cões, compor a amostra com os próximosn valores. A amostra não é

independente. Se as autocorrela¸cões são muito altas pode ser necessário uma amostra muito grande para percorrer todo espa¸co paramétrico.

Uma alternativa é considerar saltos de comprimentok, após m itera¸cões, para compor uma amostra aproximadamente independente. Neste caso, precisamos simular m+knvalores.

Uso de um pequeno numero de cadeias paralelas como um estudo inicial para verificar a convergência da média ergódica.

A amostra final ser´a composta usando os nvalores seguintes

(3)

A amostra simulada é um conjunto de vetores de dimensão d, θ⁽¹⁾, . . . , θ⁽ⁿ⁾ da distribui¸cão multivariada limiteπ.

No entanto, ´e garantido que as componentes marginais do vetor formam uma amostra da distribui¸c˜ao marginal correspondente.

Além disso, para qualquer fun¸cãot(θ)podemos construir também uma amostra MCCM usando os valores simulados da cadeia original.

¯t=P

t^(j)/n ser´a um estimador consistente paraE[t(θ)].

Intervalos de credibilidade aproximados podem ser obtidos considerando-se os percentis da amostra simulada.

A densidade marginal da i-ésima componente do vetor pode ser estimada pelo alisamento do histograma. Uma maneira mais eficiênte é considerar a seguinte estimativa

(4)

Melhorando o desempenho dos algoritmos MCCM

2. Reparametriza¸c˜ao

A escolha de uma parametriza¸c˜ao adequado pode ser muito

´

util para aumentar a eficiˆencia do algoritmo.

Se o vetor de parˆametros for altamente correlacionado o algoritmo deve demorar para percorrer todo espa¸co param´etrico.

Exemplo 1: Normal bivariada (θ₁, θ₂)∼N₂(µ,Σ).

Utilizando-se a propriedade de que as distribui¸cões condicionais são também normal, podemos implementar um algoritmo GS

simulando de tais distribui¸c˜oes.

O próximo gráfico ilustra a trajetória dos primeiros 5 pontos de cadeia, considerando uma correla¸cão de−0.97 entre θ1 e θ2.

(5)

Trajet´ orias do GS de uma normal bivariada

(6)

Melhorando o desempenho dos algoritmos MCCM

Exemplo 2: Modelo simples de efeito aleat´orio.

y_ij =µ+α_i+ǫ_ij, ǫ_ij ∼N(0, σ²) ind.

µmédia geral, n_i é o tamanho da amostra do i-ésimo grupo, α_i efeito aleatório associado aoi-ésimo grupo, α_i ∼N(0, τ²), comj = 1, . . . , n_i e i= 1, . . . , m.

Usando uma distribui¸c˜ao a priori impr´opriaπ(µ)∝C e supondo conhecidasσ² e τ² obtemos os seguintes valores para as

correla¸c˜oes a posteriori entre os parˆametros

Cor(µ, α_i) =−

1 +σ²/n_i τ²/m

−1/2

e Cor(α_i, α_j) =

1 +σ²/n_i τ²/m

−1

(7)

Melhorando o desempenho dos algoritmos MCCM

Reparametriza¸cão proposta: β_i =µ+α_i. Os novos valores de correla¸cão a posteriori são

Cor(µ, β_i) =−

1 + mτ² σ²/n_i

−1/2

e Cor(β_i, β_j) =

1 + mτ² σ²/n_i

−1

Seσ²/n_i é muito menor queτ²/messas correla¸cões serão menores que as obtidas anteriormente e portanto, a reparametriza¸cão é indicada (ver Gelfand, Sahu e Carlin, 1995).

(8)

Melhorando o desempenho dos algoritmos MCCM

3. Uso de blocos

No algoritmoGS usualmente simulamos de distribui¸c˜oes condicionais completas unidimensionais

π(θ_i |θ_−i), i= 1, . . . , d.

Alternativamente, podemos considerar grupos de parâmetros e particionar o vetor paramétrico em θ= (α₁, . . . , α_k) em que α_j são vetores com alguns componentes θ, denominados blocos.

O proposito deste procedimento é obter uma correla¸cão menor entre os blocos do que entre os parâmetros originais θ_i´s.

(9)

Diagn´ osticos de Convergˆ encia

1. An´alise gr´afica

Usualmente são analisados os gráficos das médias ergódicas, da(s) trajetória(s) da(s) cadeia(s) e das autocorrela¸cões.

Exemplo de gráficos das médias ergódicas:

(10)

Diagn´ osticos de Convergˆ encia

Exemplo de gr´aficos de trajet´orias das cadeias:

(11)

Diagn´ osticos de Convergˆ encia

Exemplo de trajet´oria de cadeia M-H com baixa taxa de aceita¸c˜ao:

(12)

Diagn´ osticos de Convergˆ encia

Exemplo comparativo de diversas proposta no M-H:

(13)

Diagn´ osticos de Convergˆ encia

Exemplo de gr´aficos de autocorrela¸c˜oes:

(14)

Diagn´ osticos de Convergˆ encia

2. A estat´ısticaZ de Geweke.

Geweke(1992) propõe uma análise baseado em séries temporais, considerando que t⁽¹⁾, . . . , t^(n+m) definem uma série temporal.

Após um per´ıodo de aquecimento (m), a série é dividida em duas amostras. Uma no inicio de tamanho n_b e outra no final de tamanho n_a. Para cada uma dessas amostras é obtida a média amostral, ¯t_b e ¯t_a, respectivamente.

A estat´ıstica ´e dada por

Z_G= ¯t_a−¯t_b

qV ar(¯ˆ t_a) + ˆV ar(¯t_b)

ZG converge para uma distribui¸c˜ao Normal padr˜ao.

(15)

Diagn´ osticos de Convergˆ encia

Valores grandes de Z_G indicam discordˆancia entre as amostras iniciais e finais da cadeia, indicando a falta de convergˆencia.

Os valores de variˆancia s˜ao estimados usando densidade espectral.

Sugest˜ao para tamanho das amostras: n_b = 0.1nen_a= 0.5n.

2. A estat´ısticaR de Gelman e Rubin.

Considera m cadeias paralelas e utiliza idéias de análise de variância.

Relaciona as variˆancias entre (B) e dentro (W) das cadeias, dadas por:

B= n Xⁿ

(¯t −t)¯² e 1 X^m

n

X(t^(j)−¯t)²

(16)

Diagn´ osticos de Convergˆ encia

A variˆancia a posteriori pode ser consistentemente estimada por σˆ² = (1−1/n)W + (1/n)B.

Após a convergência a variabilidade entre cadeias deve ser pequena, portanto a variância W deverá estar próxima deσˆ². A estat´ıstica é dada por

R= rσˆ²

W.

Valores pr´oximos de 1 indicam convergˆencia.

(17)

Software

BUGS (Bayesian Using Gibbs Sampling) : http://www.mrc-bsu.cam.ac.uk/bugs WinBUGS for the beginners: YouTube.

Package R2WinBUGS para R.

Package codapara R: Diagn´ostico de convergˆencia.

(18)

O pacote WinBUGS

Trabalha basicamente com trˆes arquivos: ”‘model”’, ”‘data”’ e

”‘initial”’.

Em ”‘model”’ estão as especifica¸cões das distribui¸cões dos dados, das distribui¸cões a priori e rela¸cões entre os parâmetros.

Em ”‘data”’ est˜ao especificados os dados no formato de lista.

Em ”‘initial”’ os valores inciais utilizados pelo algoritmo MCMC, devem ser especificados para todos os parˆametros do modelo. Existe a alternativa de pedir para gerar valores iniciais.

(19)

(20)