Exerc´ıcio simulado 1: - Exerc´ıcios simulados

4.4 Exerc´ıcios simulados

4.4.1 Exerc´ıcio simulado 1:

Foi simulada uma realiza¸c˜ao do processo Gaussiano em um conjunto S composto por N = 1000 pontos localizados no quadrante [0, 1] × [0, 1], com,

YN = µ1N + ωN + N

ωN ∼ N (0, CN)

N ∼ N (0, τ2IN)

na qual, 1N representa un vetor de N uns e CN = CN(ξ) ´e a matriz de covariˆancias, que

depende do vetor de parâmetros ξ e é obtida por meio da fun¸cão de correla¸cão Matérn, da seguinte forma:

CN[si, sj] = σ2ρ(h), onde, h ´e a distˆancia entre si e sj e

ρ(h) = 1 2ν−1_Γ(ν) h φ ν Kν h φ , (4.8)

onde h ´e a distˆancia euclidiana entre os pontos si e sj, para todo i, j ∈ {1, . . . N }.

Os valores dos parâmetros usados na simula¸cão são µ = 4, σ2 = 0.8, τ2 = 0.1 e ν = 0.5, o valor de φ foi selecionado de forma que o valor da correla¸cão na media das distâncias fosse aproximadamente 0.05, portanto o valor selecionado foi, φ = 0.16.

A amostra original foi dividida em dois grupo, um contendo 200 pontos que serão considerados como a amostra observada e os restantes 800 pontos serão usados para fazer previsão. A partir de este conjunto de observa¸cões foi feita a estima¸cão dos parâmetros

via MCMC, usando o processo Gaussiano e Gaussiano preditivo, com distribui¸c˜ao a priori dada por:

µ ∼ N (0, 100) τ2 ∼ GI(2, 0.1) σ2 ∼ GI(2.05, 1) (4.9) φ ∼G(0.25M ediana(D), 0.25),

na qual, M ediana(D) é a mediana das distâncias entre as observa¸cões, supondo o valor de ν = 0.5 conhecido. Foi feito um MCMC com 200000 itera¸cões, com um burn-in de 2000 e thin de 50. Assim, o tamanho efetivo da amostra foi de 3961, para a qual foi verificada a convergência usando os testes de Geweke e Raftery (ver se¸cão A.4). As cadeias obtidas junto com os histogramas da amostra a posteriori podem ser vistas no Apêndice (ver Figuras B.2.1 e B.2.2 ).

Também, foi feita estima¸cão dos parâmetros do modelo de PGVP no caso em que K = S com θ = 0 e ao incluir o θ como parâmetro desconhecido no modelo (PGVPO), ao considerar ν = 0.5, usando MCMC com 200000 itera¸cões e burn-in de 10000 e thin de 20 (mais detalhes na se¸cão B.1). A distribui¸cão a priori considerada foi uma priori independente, que é dada pela equa¸cão (4.9) para os parâmetros em comum com o processo Gaussiano e para o parâmetro de ordena¸cão dos dados a priori é dada por:

θ ∼ U (E), (4.10)

com, E = {jπ₅, para, 0 ≤ j ≤ 9}. Os resultados da estima¸c˜ao encontram-se na Tabela 4.3.

Com o proposito de comparar a performance do Processo Gaussiano de vizinhos pr´oximos quando a ordena¸c˜ao dos dados muda, foram considerados cada um dos 10 ˆ

angulos diferentes em E, e para cada um deles foi gerada uma amostra da distribui¸cão a posteriori via MCMC como 200000 itera¸cões. A Figura 4.5 apresenta um box plot da amostra a posteriori obtida para cada um dos parâmetros usando: o PG; PGP com 36 e 81 nós; PGVP para cada ângulo θ ∈ E e o PGVP estimando θ (PGVPO) com K = S, onde, a linha vermelha representa o verdadeiro valor do parâmetro. Nesta Figura, é poss´ıvel observar um desempenho semelhante na estima¸cão para o processo de vizinhos

próximos na estima¸cão de todos os parâmetros do modelo. Além disso, pode-se destacar a performance ruim do processo preditivo com 36 nós e observar o viés na estima¸cão do parâmetro τ2 ao usar o processo preditivo com 36 e 81 nós.

Parˆametro PG PGP 81 n´os

Simulado Media (2.5%; 97.5%) Var Media (2.5%; 97.5%) Var

µ = 4 4.0778 (3.0347;4.9518) 0.2104 3.9494 (3.1859;4.4827) 0.1051 φ = 0.16 0.2369 (0.1163;0.5400) 0.0203 0.1653 (0.0710;0.4017) 0.0080 σ2 _{= 0.8} _1.1726 _{(0.6396;2.4776)} _0.3861 _1.5333 _{(0.8825;2.7236)} _0.2512

τ2 = 0.1 0.1035 (0.0560;0.1716) 0.0009 0.2911 (0.2272;0.3705) 0.0016

Parˆametro PGVP: m=15, θ = 0 PGVP: m=15, variando θ

Simulado Media (2.5%; 97.5%) Var Media (2.5%; 97.5%) Var

µ = 4 4.2385 (3.5544;4.9450) 0.1187 4.3496 (4.0489;4.6751) 0.0252 φ = 0.16 0.1878 (0.1034;0.3720) 0.0057 0.1514 (0.0907;0.2703) 0.0026 σ2 = 0.8 1.1295 (0.6809;2.1530) 0.1611 1.0510 (0.6665;1.8009) 0.0988 τ2 _{= 0.1} _0.0901 _{(0.0514;0.1440)} _0.0006 _0.1037 _{(0.0566;0.1696)} _0.0009

Tabela 4.3: Estimativas (media, quantis de 2.5 e 9.75 e variância) dos parâmetros, usando MCMC, do processo Gaussiano, do processo Gaussiano preditivo (81 nós), processo Gaussiano de vizinhos próximos com no máximo 15 vizinhos, ordenando segundo o ângulo 0 e o PGVP estimando theta, supondo ν = 0.5 conhecido.

Figura 4.5: Box plot de amostras da posteriori para µ (superior esquerdo), τ2 (superior direito), σ2 (inferior esquerdo) e φ (inferior direito) usando: o PG; o PGP com 36 e 81 n´os; o PGVP K = S, com 10 ˆ

angulos diferentes (PGVP j com j = 0, . . . , 9, representa o ângulo jπ/5 ) e o PGVP variando o ângulo de ordena¸cão θ (PGVPO).

Usando as cadeias geradas anteriormente em cada modelo considerado, foi obtida a previs˜ao para os 800 pontos reservados. A Figura 4.6, apresenta o EQMP, MCRPS e IS para: o P G; o P GP com dos conjuntos de n´os (de 36 e 81 pontos); o PGVP com os 10 ˆ

onde GR representa uma grade regular de tamanho 200; e o PGVP ao incluir o parˆametro θ para os dois conjuntos de referˆencia considerados (PGVPO).

Figura 4.6: EQMP, MCRPS e IS no caso do processo Gaussiano de vizinhos próximos com no máximo 15 vizinhos, para 10 ângulo de ordena¸cão diferentes θ. As linhas horizontais representam os valores de cada critério para o processo Gaussiano, Gaussiano preditivo com 36 e 81 nós e o processo Gaussiano de vizinhos próximos ao incluir o ângulo no modelo (PGVPO). Onde os critérios foram calculados utilizando a amostra obtida via MCMC.

Pode-se observar que, para esta amostra, o EQMP obtido usando o PGVP para os diferentes valores de θ não apresenta uma varia¸cão muito grande no caso que K = S e que este apresenta uma melhor performance do que quando K = GR. Como era de se esperar, o PGVPO é um valor médio dos EQMP calculados para cada ordena¸cão, isto

vale também para os critérios MCRPS e IS. O MCRPS indica que a melhor previsão, depois da obtida com o PGP de 81 nós, é obtida para alguns ângulos ao usar o PGVP com K = GR. O IS indica que a melhor performance preditiva, depois do PG e PGP-81 nós, é obtida pelo PGVP quando K = S.

A Tabela 4.4 apresenta os valores dos critérios de compara¸cão considerados anteriormente, ao utilizar: o processo Gaussiano de vizinhos próximos (PGVP) para os ˆ

angulos correspondentes aos critérios de ordena¸cão utilizados na literatura; e o processo de vizinhos próximos variando θ (PGVPO). Isto, no caso que m = 15, com conjunto de referência dado por: os locais observados (S) e a grade regular (GR). Nela, pode-se observar que segundo estes critérios os melhores resultados foram obtidos por o PGVP onde os dados foram ordenados segundo a ordenada no caso do conjunto de referência K = S. Enquanto, no caso em que o conjunto de referência considerado é uma grade regular, os melhores resultados foram obtidos no caso em que os dados foram ordenados segundo o ângulo θ = 7π/4 que corresponde ao critério de ordena¸cão segundo a soma das coordenadas. Ao comparar os resultados obtidos por cada grade pode ser observar que segundo os critérios EQM P e IS os melhores resultados são obtidos ao utilizar a grade observada como conjunto de referência. Mas, o M CRP S (o qual esta baseado em duas replicas da distribui¸cão preditiva) indica que a grade regular obteve melhores resultados, exceto quando os dados são ordenados pela ordenada. Este resultado é um pouco contrario ao que foi observado no Exemplo 4.2, onde os melhores resultados foram obtidos com a grade regular, isto pode se dever ao fato de que estamos usando n observa¸cões para estimar os parâmetros do modelo e o processo latente, que no caso de K = S é um vetor latente com n componentes, enquanto, no caso em que K ∩ S = ∅ é preciso estimar dois vetores latentes cada um com n componentes.

K = S K = GR PGVP com PGVP com Crit´erio θ = 0 θ = 3π 4 θ = 7π 4 PGVPO θ = 0 θ = 3π 4 θ = 7π 4 PGVPO

(Ordenada) (Abscissa) (Soma) (Ordenada) (Abscissa) (Soma)

EQMP 0.9362 0.9846 0.9970 0.9444 1.2014 1.0476 1.0320 1.0509

MCRPS -13.0236 -13.5682 -13.8045 -13.1762 -13.5072 -12.5040 -12.4682 -12.5550

IS 3.1338 3.2360 3.2823 3.1457 3.5002 3.2963 3.2697 3.3035

Tabela 4.4: EQMP, MCRPS, IS para: o PGVP ao considerar a ordena¸cão dos dados pela ordenada, abscissa, e soma das coordenadas onde foram coletados; e o PGVPO. Isto, ao considerar dois conjunto de referência: as localiza¸cões observadas (S) e uma grade regular (GR). Com número máximo de vizinhos m = 15 e ν = 0.5.

Aspecto computacional: Na pratica é poss´ıvel obter uma cadeia relativamente pequena para os parâmetros do modelo PGVPO usando um conjunto E, a qual, será considerada como prova piloto. Baseados em dita cadeia, pode-se escolher um subconjunto de ângulos que sejam os mais prováveis Er, para depois, realizar o processo

de inferência via MCMC usando o espa¸co paramétrico reduzido o qual permite que a introdu¸cão do parâmetro θ não incremente muito o custo computacional, isto, devido ao calculo das matrizes A e Γ ao mudar o ângulo de ordena¸cão. Para nosso exerc´ıcio simulado foi considerado um conjunto de ordena¸cões E com 10 ângulos diferentes e para exemplificar como a redu¸cão do espa¸co paramétrico de θ afeta a previsão, foram utilizadas as grades S e GR e uma cadeia de 50000 itera¸cões. Utilizando uma amostra de ditas cadeias, foram escolhidos 5 e 2 ângulos para o PGVPO com conjuntos de referência S e GR respectivamente. Na Figura 2.8 no Apêndice, podem-se observar os ângulos selecionados em cada caso. A estima¸cão dos parâmetros foi feita via MCMC usando uma cadeia com 200000 itera¸cões, após isso foi feita a previsão dos 800 pontos reservados para isto e os critérios de compara¸cão foram calculados neste caso e são apresentados na Tabela 4.5. Nela pode se observar que os valores dos critérios utilizando o espa¸co paramétrico reduzido são muito próximos dos obtidos usando os 10 ângulos iniciais, e o custo computacional certamente é menor.

PGVPO com m = 15, Er

Crit´erio K = S K = GR

EQMP 0.9443 1.0459

MCRPS -13.1757 -12.5536

IS 3.1455 3.3076

Tabela 4.5: EQMP, MCRPS, IS para o PGVPO com conjunto de referência dado por: as localiza¸cões observadas (S), a grade regular (GR), utilizando um espa¸co paramétrico reduzido para θ, com número máximo de vizinhos m = 15 e ν = 0.5.

No documento Sobre a Especificação da Estrutura de Vizinhança no Processo Gaussiano de Vizinhos Próximos (páginas 66-73)