Processo Poisson/gama - Processos Pontuais Espaciais

3.3 Processos Pontuais Espaciais

3.3.3 Processo Poisson/gama

Além dos processos de Cox log-gaussianos, outra abordagem mais simples e muito utilizada para a modelagem de dados de contagem é modelá-las diretamente através de um processo gaussiano após uma transforma¸cão na variância. Entretanto, este tipo de modelagem não é inteiramente adequada, pois falha em refletir a natureza discreta das contagens. Por outro lado, os próprios processos de Cox log-gaussianos, apesar da popularidade, podem não ser adequados quando lida-se com agrega¸cão ou refinamento de parti¸cões da região de interesse. Como dito anteriormente, isto acontece devido ao fato de que a estrutura logar´ıtmica conduz a produtos das médias do processo de Poisson ao invés de somas quando considera-se uniões de subregiões vizinhas.

Com o intuito de modelar dados de contagem espacialmente referenciados de forma mais flex´ıvel e natural, Wolpert e Ickstadt (1998) propuseram uma nova classe de modelos duplamente estocásticos. A nova abordagem assume um processo de Poisson não homogêneo para explicar contagens observadas em uma determinada região de interesse

cuja intensidade é definida como uma convolu¸cão de processos gama. Desta forma, é poss´ıvel assumir que a intensidade do processo de Poisson varie de forma cont´ınua na região de interesse. Além disto, como estas intensidades não estão sujeitas a transforma¸cões (logar´ıtmica, por exemplo), agrega¸cão ou refinamento de parti¸cões vizinhas são naturalmente tratadas na modelagem.

Especificamente, Wolpert e Ickstadt(1998) assumem um processo pontual de Poisson n˜ao homogˆeneo {Z(x), x ∈ D}, como descrito anteriormente, para descrever as contagens em uma determinada regi˜_{ao D ⊂ R}d_{. Assim, se Z(dx) ´}_{e uma medida aleat´}_{oria de Poisson,}

ent˜ao

Z(dx) ∼ P oi(Λ(dx)). (3.31)

Por defini¸cão, como dito anteriormente, a estrutura de dependência espacial é considerada na modelagem através da segunda estrutura hierárquica do modelo, isto é, através da intensidade do processo de Poisson. Neste caso, Λ(dx) é definido como um processo de convolu¸cão da forma Λ(dx) = Z S k(dx, s)Γ(ds), (3.32) em que Γ(ds) ∼ Ga(α(ds), β(s)) (3.33)

representa uma medida aleatória gama, como descrito anteriormente na Subse¸cão 3.2.1, com medida de forma α(ds) e fun¸cão de escala β(s). A estrutura de convolu¸cão é res- ponsável por induzir a estrutura de dependência espacial, uma vez que o processo gama tem incrementos independentes. O processo gama correspondente a medida aleatória Γ(ds) pode ser constru´ıdo através do resultado apresentado pelo Teorema apresentado na Subse¸cão 3.2.3, baseado em sua representa¸cão discreta. Aqui, k(dx, s) = k(x, s)w(dx), em que k(x, s) representa um kernel não negativo escolhido de forma que k(dx, s) = k(x, s)w(dx) e Λ(dx) = Λ(x)w(dx) estejam bem definidos para uma medida de re- ferência w(dx).

Pode ser demonstrado que, para A e A0, subconjuntos de D, a esperan¸ca marginal de Z(A) pode ser escrita como

E(Z(A)) = Z

k(A, s)

β(s) α(ds) (3.34)

e a covariˆancia marginal entre Z(A) e Z(A0) pode ser escrita como

Cov(Z(A), Z(A0)) = Z S k(A ∩ A0, s) β(s) α(ds) + Z S k(A, s)k(A0, s) β(s)2 α(ds). (3.35)

Assuma α(ds) = α(s)Π(ds), em que Π(ds) é uma medida de probabilidade, como dis- cutido no Teorema apresentado na Subse¸cão 3.2.3. Para que não haja problemas de identificabilidade na estima¸cão do modelo, pode-se assumir que as fun¸cões α(s) e β(s) são constantes e representam a informa¸cão a priori a respeito do processo gama Γ(s).

O procedimento de inferência para estes modelos lan¸cam mão de métodos MCMC com o objetivo de avaliar a distribui¸cão a posteriori de todas as quantidades envolvidas na modelagem, inclusive o processo gama Γ(s), que é definido a priori como visto em (3.33). Em particular, são utilizados o amostrador de Gibbs e o algoritmo de Metropolis- Hastings. Para que o procedimento de inferência seja viável, são considerados dados aumentados. Além disto, para simular o processo gama a posteriori, como esquema de amostragem no algoritmo MCMC, é utilizado o algoritmo ILM, descrito na Se¸cão 3.2.3. Estes métodos permitem uma generaliza¸cão do procedimento de inferência tradicional baseado na conjuga¸cão de modelos Poisson/gama. Detalhes sobre este procedimento de inferência serão discutidos de forma particular para os modelos propostos neste tra- baho, como extensão da metodologia proposta porWolpert e Ickstadt(1998), no cap´ıtulo seguinte.

Cap´ıtulo 4

Modelos Espa¸co-Temporais de

Convolu¸c˜ao de Processos Gama

A classe de modelos propostas no presente trabalho estende para o contexto espa¸co- temporal a classe dos modelos espaciais propostos por Wolpert e Ickstadt(1998), descritos no cap´ıtulo anterior, ao considerar uma evolu¸cão temporal dinâmica da intensidade do processo de Poisson. Esta evolu¸cão é feita através de convolu¸cões, especificamente através da integra¸cão de kernels sobre as intensidades em diferentes instantes de tempo. Esta estrutura de convolu¸cão do modelo é responsável pela propaga¸cão da intensidade ao longo do espa¸co e do tempo. A base teórica dos modelos propostos neste cap´ıtulo permite a utiliza¸cão de estruturas de probabilidade flex´ıveis de forma a criar modelos espa¸co-temporais adequados para qualquer resolu¸cão espacial. Além de conservar as pro- priedades e vantagens da metodologia proposta por Wolpert e Ickstadt(1998), incluindo a utiliza¸cão do algoritmo ILM no procedimento de inferência, podem ser inclu´ıdas no modelo outras quantidades que visam caracterizar o comportamento espa¸co-temporal do fenômeno ou a região de interesse. Por exemplo, no contexto ecológico, pode-se incluir na modelagem estruturas com o objetivo de capturar crescimento e descrescimento po- pulacional, movimento de organismos na região de interesse ao longo do tempo, além de efeitos direcionais destes movimentos.

Com o intuito de avaliar a performance dos modelos propostos, s˜ao realizados estu- dos com dados artificiais simulados em espa¸cos unidimensionais e bidimensionais. Como

ilustra¸cão da nova abordagem, uma aplica¸cão a dados reais referentes a popula¸cões de pássaros é realizada. Especificamente, deseja-se investigar o comportamento espa¸co- temporal da espécie melro de cervejeiro, comum na América do Norte, através de contagens observadas em uma região da Califórnia, Estados Unidos, durante alguns anos de 1999 a 2008. Detalhes da abordagem proposta são descritos a seguir.

4.1 Modelagem Proposta

Seja Yt(x) um processo de Poisson definido no espa¸co D ⊂ Rd no tempo t, para

t = 1, . . . , T . Portanto, assume-se

Yt(dx) ∼ P oi(Λt(dx)). (4.1)

Aqui, assume-se que a medida de intensidade Λt(dx) evolui dinamicamente no tempo

através de uma convolu¸cão, que é definida através da integra¸cão de uma medida h(dx, r) sobre a medida de intensidade no tempo anterior, Λt−1(dx), como

Λt(dx) =

h(dx, r)Λt−1(dr). (4.2)

Para o tempo t = 0, define-se Λ0(dx) atrav´es da integra¸c˜ao de uma medida k0(dx, s)

sobre um processo gama Γ(s) definido no espa¸co S ⊂ Rd_{, conforme proposto por}_Wolpert

e Ickstadt (1998) em (3.32). Assim, tem-se

Λ0(dx) =

k0(dx, s)Γ(ds). (4.3)

Aqui, assume-se h(dx, r) = h(x, r)dx de forma que Λt(dx) = Λt(x)dx e k0(dx, s) =

k0(x, s)dx de forma que Λ0(dx) = Λ0(x)dx, em que h(x, r) e k0(x, s) s˜ao kernels, a

princ´ıpio, normalizados, isto ´e, R_Xh(dx, r) = 1 e R_Dk0(dx, r) = 1. Por fim, o processo

gama ´e definido de forma que

Γ(ds) ∼ Ga(α(ds), β), (4.4)

em que a fun¸cão de escala β(s) = β em (3.33) é assumida constante, para fins de simpli- fica¸cão.

Em (4.2) e (4.3), os kernels h(x, r) and k0(x, s) s˜ao escolhidos de forma a refletir

as caracter´ısticas espa¸co-temporais da região e do fenômeno sob investiga¸cão. O kernel h(x, r), em particular, é responsável pela dispersão ou propaga¸cão. Intuitivamente, suponha que organismos se movimentem no espa¸co (região) D ao longo do tempo. O kernel h(x, r) é responsável por este movimento conforme o tempo varia. Em outras palavras, a popula¸cão de organismos em uma determinada localiza¸cão e em um deter- minado instante de tempo é uma pondera¸cão da popula¸cão nas demais localiza¸cões no tempo anterior. Isto é levado em considera¸cão no modelo através da convolu¸cão em (4.2). A intensidade nesta localiza¸cão depende da distância entre ela e as demais localiza¸cões, e dos parâmetros do kernel h(x, r).

Um importante aspecto do modelo aqui apresentado é o fato de que a convolu¸cão em (4.2) pode ser reescrita como fun¸cão do processo gama em (4.3), conforme descrito a seguir.

No documento Modelos Baseados em Convoluções de Processos Aleatórios para Dados de Contagem Espacialmente Referenciados (páginas 94-99)