• Nenhum resultado encontrado

4.4 Exerc´ıcios simulados

4.4.1 Exerc´ıcio simulado 1:

Foi simulada uma realiza¸c˜ao do processo Gaussiano em um conjunto S composto por N = 1000 pontos localizados no quadrante [0, 1] × [0, 1], com,

YN = µ1N + ωN + N

ωN ∼ N (0, CN)

N ∼ N (0, τ2IN)

na qual, 1N representa un vetor de N uns e CN = CN(ξ) ´e a matriz de covariˆancias, que

depende do vetor de parˆametros ξ e ´e obtida por meio da fun¸c˜ao de correla¸c˜ao Mat´ern, da seguinte forma:

CN[si, sj] = σ2ρ(h), onde, h ´e a distˆancia entre si e sj e

ρ(h) = 1 2ν−1Γ(ν)  h φ ν Kν  h φ  , (4.8)

onde h ´e a distˆancia euclidiana entre os pontos si e sj, para todo i, j ∈ {1, . . . N }.

Os valores dos parˆametros usados na simula¸c˜ao s˜ao µ = 4, σ2 = 0.8, τ2 = 0.1 e ν = 0.5, o valor de φ foi selecionado de forma que o valor da correla¸c˜ao na media das distˆancias fosse aproximadamente 0.05, portanto o valor selecionado foi, φ = 0.16.

A amostra original foi dividida em dois grupo, um contendo 200 pontos que ser˜ao considerados como a amostra observada e os restantes 800 pontos ser˜ao usados para fazer previs˜ao. A partir de este conjunto de observa¸c˜oes foi feita a estima¸c˜ao dos parˆametros

via MCMC, usando o processo Gaussiano e Gaussiano preditivo, com distribui¸c˜ao a priori dada por:

µ ∼ N (0, 100) τ2 ∼ GI(2, 0.1) σ2 ∼ GI(2.05, 1) (4.9) φ ∼G(0.25M ediana(D), 0.25),

na qual, M ediana(D) ´e a mediana das distˆancias entre as observa¸c˜oes, supondo o valor de ν = 0.5 conhecido. Foi feito um MCMC com 200000 itera¸c˜oes, com um burn-in de 2000 e thin de 50. Assim, o tamanho efetivo da amostra foi de 3961, para a qual foi verificada a convergˆencia usando os testes de Geweke e Raftery (ver se¸c˜ao A.4). As cadeias obtidas junto com os histogramas da amostra a posteriori podem ser vistas no Apˆendice (ver Figuras B.2.1 e B.2.2 ).

Tamb´em, foi feita estima¸c˜ao dos parˆametros do modelo de PGVP no caso em que K = S com θ = 0 e ao incluir o θ como parˆametro desconhecido no modelo (PGVPO), ao considerar ν = 0.5, usando MCMC com 200000 itera¸c˜oes e burn-in de 10000 e thin de 20 (mais detalhes na se¸c˜ao B.1). A distribui¸c˜ao a priori considerada foi uma priori independente, que ´e dada pela equa¸c˜ao (4.9) para os parˆametros em comum com o processo Gaussiano e para o parˆametro de ordena¸c˜ao dos dados a priori ´e dada por:

θ ∼ U (E), (4.10)

com, E = {jπ5, para, 0 ≤ j ≤ 9}. Os resultados da estima¸c˜ao encontram-se na Tabela 4.3.

Com o proposito de comparar a performance do Processo Gaussiano de vizinhos pr´oximos quando a ordena¸c˜ao dos dados muda, foram considerados cada um dos 10 ˆ

angulos diferentes em E, e para cada um deles foi gerada uma amostra da distribui¸c˜ao a posteriori via MCMC como 200000 itera¸c˜oes. A Figura 4.5 apresenta um box plot da amostra a posteriori obtida para cada um dos parˆametros usando: o PG; PGP com 36 e 81 n´os; PGVP para cada ˆangulo θ ∈ E e o PGVP estimando θ (PGVPO) com K = S, onde, a linha vermelha representa o verdadeiro valor do parˆametro. Nesta Figura, ´e poss´ıvel observar um desempenho semelhante na estima¸c˜ao para o processo de vizinhos

pr´oximos na estima¸c˜ao de todos os parˆametros do modelo. Al´em disso, pode-se destacar a performance ruim do processo preditivo com 36 n´os e observar o vi´es na estima¸c˜ao do parˆametro τ2 ao usar o processo preditivo com 36 e 81 n´os.

Parˆametro PG PGP 81 n´os

Simulado Media (2.5%; 97.5%) Var Media (2.5%; 97.5%) Var

µ = 4 4.0778 (3.0347;4.9518) 0.2104 3.9494 (3.1859;4.4827) 0.1051 φ = 0.16 0.2369 (0.1163;0.5400) 0.0203 0.1653 (0.0710;0.4017) 0.0080 σ2 = 0.8 1.1726 (0.6396;2.4776) 0.3861 1.5333 (0.8825;2.7236) 0.2512

τ2 = 0.1 0.1035 (0.0560;0.1716) 0.0009 0.2911 (0.2272;0.3705) 0.0016

Parˆametro PGVP: m=15, θ = 0 PGVP: m=15, variando θ

Simulado Media (2.5%; 97.5%) Var Media (2.5%; 97.5%) Var

µ = 4 4.2385 (3.5544;4.9450) 0.1187 4.3496 (4.0489;4.6751) 0.0252 φ = 0.16 0.1878 (0.1034;0.3720) 0.0057 0.1514 (0.0907;0.2703) 0.0026 σ2 = 0.8 1.1295 (0.6809;2.1530) 0.1611 1.0510 (0.6665;1.8009) 0.0988 τ2 = 0.1 0.0901 (0.0514;0.1440) 0.0006 0.1037 (0.0566;0.1696) 0.0009

Tabela 4.3: Estimativas (media, quantis de 2.5 e 9.75 e variˆancia) dos parˆametros, usando MCMC, do processo Gaussiano, do processo Gaussiano preditivo (81 n´os), processo Gaussiano de vizinhos pr´oximos com no m´aximo 15 vizinhos, ordenando segundo o ˆangulo 0 e o PGVP estimando theta, supondo ν = 0.5 conhecido.

Figura 4.5: Box plot de amostras da posteriori para µ (superior esquerdo), τ2 (superior direito), σ2 (inferior esquerdo) e φ (inferior direito) usando: o PG; o PGP com 36 e 81 n´os; o PGVP K = S, com 10 ˆ

angulos diferentes (PGVP j com j = 0, . . . , 9, representa o ˆangulo jπ/5 ) e o PGVP variando o ˆangulo de ordena¸c˜ao θ (PGVPO).

Usando as cadeias geradas anteriormente em cada modelo considerado, foi obtida a previs˜ao para os 800 pontos reservados. A Figura 4.6, apresenta o EQMP, MCRPS e IS para: o P G; o P GP com dos conjuntos de n´os (de 36 e 81 pontos); o PGVP com os 10 ˆ

onde GR representa uma grade regular de tamanho 200; e o PGVP ao incluir o parˆametro θ para os dois conjuntos de referˆencia considerados (PGVPO).

Figura 4.6: EQMP, MCRPS e IS no caso do processo Gaussiano de vizinhos pr´oximos com no m´aximo 15 vizinhos, para 10 ˆangulo de ordena¸c˜ao diferentes θ. As linhas horizontais representam os valores de cada crit´erio para o processo Gaussiano, Gaussiano preditivo com 36 e 81 n´os e o processo Gaussiano de vizinhos pr´oximos ao incluir o ˆangulo no modelo (PGVPO). Onde os crit´erios foram calculados utilizando a amostra obtida via MCMC.

Pode-se observar que, para esta amostra, o EQMP obtido usando o PGVP para os diferentes valores de θ n˜ao apresenta uma varia¸c˜ao muito grande no caso que K = S e que este apresenta uma melhor performance do que quando K = GR. Como era de se esperar, o PGVPO ´e um valor m´edio dos EQMP calculados para cada ordena¸c˜ao, isto

vale tamb´em para os crit´erios MCRPS e IS. O MCRPS indica que a melhor previs˜ao, depois da obtida com o PGP de 81 n´os, ´e obtida para alguns ˆangulos ao usar o PGVP com K = GR. O IS indica que a melhor performance preditiva, depois do PG e PGP-81 n´os, ´e obtida pelo PGVP quando K = S.

A Tabela 4.4 apresenta os valores dos crit´erios de compara¸c˜ao considerados anteriormente, ao utilizar: o processo Gaussiano de vizinhos pr´oximos (PGVP) para os ˆ

angulos correspondentes aos crit´erios de ordena¸c˜ao utilizados na literatura; e o processo de vizinhos pr´oximos variando θ (PGVPO). Isto, no caso que m = 15, com conjunto de referˆencia dado por: os locais observados (S) e a grade regular (GR). Nela, pode-se observar que segundo estes crit´erios os melhores resultados foram obtidos por o PGVP onde os dados foram ordenados segundo a ordenada no caso do conjunto de referˆencia K = S. Enquanto, no caso em que o conjunto de referˆencia considerado ´e uma grade regular, os melhores resultados foram obtidos no caso em que os dados foram ordenados segundo o ˆangulo θ = 7π/4 que corresponde ao crit´erio de ordena¸c˜ao segundo a soma das coordenadas. Ao comparar os resultados obtidos por cada grade pode ser observar que segundo os crit´erios EQM P e IS os melhores resultados s˜ao obtidos ao utilizar a grade observada como conjunto de referˆencia. Mas, o M CRP S (o qual esta baseado em duas replicas da distribui¸c˜ao preditiva) indica que a grade regular obteve melhores resultados, exceto quando os dados s˜ao ordenados pela ordenada. Este resultado ´e um pouco contrario ao que foi observado no Exemplo 4.2, onde os melhores resultados foram obtidos com a grade regular, isto pode se dever ao fato de que estamos usando n observa¸c˜oes para estimar os parˆametros do modelo e o processo latente, que no caso de K = S ´e um vetor latente com n componentes, enquanto, no caso em que K ∩ S = ∅ ´e preciso estimar dois vetores latentes cada um com n componentes.

K = S K = GR PGVP com PGVP com Crit´erio θ = 0 θ = 3π 4 θ = 7π 4 PGVPO θ = 0 θ = 3π 4 θ = 7π 4 PGVPO

(Ordenada) (Abscissa) (Soma) (Ordenada) (Abscissa) (Soma)

EQMP 0.9362 0.9846 0.9970 0.9444 1.2014 1.0476 1.0320 1.0509

MCRPS -13.0236 -13.5682 -13.8045 -13.1762 -13.5072 -12.5040 -12.4682 -12.5550

IS 3.1338 3.2360 3.2823 3.1457 3.5002 3.2963 3.2697 3.3035

Tabela 4.4: EQMP, MCRPS, IS para: o PGVP ao considerar a ordena¸c˜ao dos dados pela ordenada, abscissa, e soma das coordenadas onde foram coletados; e o PGVPO. Isto, ao considerar dois conjunto de referˆencia: as localiza¸c˜oes observadas (S) e uma grade regular (GR). Com n´umero m´aximo de vizinhos m = 15 e ν = 0.5.

Aspecto computacional: Na pratica ´e poss´ıvel obter uma cadeia relativamente pequena para os parˆametros do modelo PGVPO usando um conjunto E, a qual, ser´a considerada como prova piloto. Baseados em dita cadeia, pode-se escolher um subconjunto de ˆangulos que sejam os mais prov´aveis Er, para depois, realizar o processo

de inferˆencia via MCMC usando o espa¸co param´etrico reduzido o qual permite que a introdu¸c˜ao do parˆametro θ n˜ao incremente muito o custo computacional, isto, devido ao calculo das matrizes A e Γ ao mudar o ˆangulo de ordena¸c˜ao. Para nosso exerc´ıcio simulado foi considerado um conjunto de ordena¸c˜oes E com 10 ˆangulos diferentes e para exemplificar como a redu¸c˜ao do espa¸co param´etrico de θ afeta a previs˜ao, foram utilizadas as grades S e GR e uma cadeia de 50000 itera¸c˜oes. Utilizando uma amostra de ditas cadeias, foram escolhidos 5 e 2 ˆangulos para o PGVPO com conjuntos de referˆencia S e GR respectivamente. Na Figura 2.8 no Apˆendice, podem-se observar os ˆangulos selecionados em cada caso. A estima¸c˜ao dos parˆametros foi feita via MCMC usando uma cadeia com 200000 itera¸c˜oes, ap´os isso foi feita a previs˜ao dos 800 pontos reservados para isto e os crit´erios de compara¸c˜ao foram calculados neste caso e s˜ao apresentados na Tabela 4.5. Nela pode se observar que os valores dos crit´erios utilizando o espa¸co param´etrico reduzido s˜ao muito pr´oximos dos obtidos usando os 10 ˆangulos iniciais, e o custo computacional certamente ´e menor.

PGVPO com m = 15, Er

Crit´erio K = S K = GR

EQMP 0.9443 1.0459

MCRPS -13.1757 -12.5536

IS 3.1455 3.3076

Tabela 4.5: EQMP, MCRPS, IS para o PGVPO com conjunto de referˆencia dado por: as localiza¸c˜oes observadas (S), a grade regular (GR), utilizando um espa¸co param´etrico reduzido para θ, com n´umero m´aximo de vizinhos m = 15 e ν = 0.5.

Documentos relacionados