3.3 Processos Pontuais Espaciais
3.3.3 Processo Poisson/gama
Al´em dos processos de Cox log-gaussianos, outra abordagem mais simples e muito utilizada para a modelagem de dados de contagem ´e model´a-las diretamente atrav´es de um processo gaussiano ap´os uma transforma¸c˜ao na variˆancia. Entretanto, este tipo de modelagem n˜ao ´e inteiramente adequada, pois falha em refletir a natureza discreta das contagens. Por outro lado, os pr´oprios processos de Cox log-gaussianos, apesar da popularidade, podem n˜ao ser adequados quando lida-se com agrega¸c˜ao ou refinamento de parti¸c˜oes da regi˜ao de interesse. Como dito anteriormente, isto acontece devido ao fato de que a estrutura logar´ıtmica conduz a produtos das m´edias do processo de Poisson ao inv´es de somas quando considera-se uni˜oes de subregi˜oes vizinhas.
Com o intuito de modelar dados de contagem espacialmente referenciados de forma mais flex´ıvel e natural, Wolpert e Ickstadt (1998) propuseram uma nova classe de mo- delos duplamente estoc´asticos. A nova abordagem assume um processo de Poisson n˜ao homogˆeneo para explicar contagens observadas em uma determinada regi˜ao de interesse
cuja intensidade ´e definida como uma convolu¸c˜ao de processos gama. Desta forma, ´e poss´ıvel assumir que a intensidade do processo de Poisson varie de forma cont´ınua na regi˜ao de interesse. Al´em disto, como estas intensidades n˜ao est˜ao sujeitas a trans- forma¸c˜oes (logar´ıtmica, por exemplo), agrega¸c˜ao ou refinamento de parti¸c˜oes vizinhas s˜ao naturalmente tratadas na modelagem.
Especificamente, Wolpert e Ickstadt(1998) assumem um processo pontual de Poisson n˜ao homogˆeneo {Z(x), x ∈ D}, como descrito anteriormente, para descrever as contagens em uma determinada regi˜ao D ⊂ Rd. Assim, se Z(dx) ´e uma medida aleat´oria de Poisson,
ent˜ao
Z(dx) ∼ P oi(Λ(dx)). (3.31)
Por defini¸c˜ao, como dito anteriormente, a estrutura de dependˆencia espacial ´e considerada na modelagem atrav´es da segunda estrutura hier´arquica do modelo, isto ´e, atrav´es da intensidade do processo de Poisson. Neste caso, Λ(dx) ´e definido como um processo de convolu¸c˜ao da forma Λ(dx) = Z S k(dx, s)Γ(ds), (3.32) em que Γ(ds) ∼ Ga(α(ds), β(s)) (3.33)
representa uma medida aleat´oria gama, como descrito anteriormente na Subse¸c˜ao 3.2.1, com medida de forma α(ds) e fun¸c˜ao de escala β(s). A estrutura de convolu¸c˜ao ´e res- pons´avel por induzir a estrutura de dependˆencia espacial, uma vez que o processo gama tem incrementos independentes. O processo gama correspondente a medida aleat´oria Γ(ds) pode ser constru´ıdo atrav´es do resultado apresentado pelo Teorema apresentado na Subse¸c˜ao 3.2.3, baseado em sua representa¸c˜ao discreta. Aqui, k(dx, s) = k(x, s)w(dx), em que k(x, s) representa um kernel n˜ao negativo escolhido de forma que k(dx, s) = k(x, s)w(dx) e Λ(dx) = Λ(x)w(dx) estejam bem definidos para uma medida de re- ferˆencia w(dx).
Pode ser demonstrado que, para A e A0, subconjuntos de D, a esperan¸ca marginal de Z(A) pode ser escrita como
E(Z(A)) = Z
S
k(A, s)
β(s) α(ds) (3.34)
e a covariˆancia marginal entre Z(A) e Z(A0) pode ser escrita como
Cov(Z(A), Z(A0)) = Z S k(A ∩ A0, s) β(s) α(ds) + Z S k(A, s)k(A0, s) β(s)2 α(ds). (3.35)
Assuma α(ds) = α(s)Π(ds), em que Π(ds) ´e uma medida de probabilidade, como dis- cutido no Teorema apresentado na Subse¸c˜ao 3.2.3. Para que n˜ao haja problemas de identificabilidade na estima¸c˜ao do modelo, pode-se assumir que as fun¸c˜oes α(s) e β(s) s˜ao constantes e representam a informa¸c˜ao a priori a respeito do processo gama Γ(s).
O procedimento de inferˆencia para estes modelos lan¸cam m˜ao de m´etodos MCMC com o objetivo de avaliar a distribui¸c˜ao a posteriori de todas as quantidades envolvidas na modelagem, inclusive o processo gama Γ(s), que ´e definido a priori como visto em (3.33). Em particular, s˜ao utilizados o amostrador de Gibbs e o algoritmo de Metropolis- Hastings. Para que o procedimento de inferˆencia seja vi´avel, s˜ao considerados dados aumentados. Al´em disto, para simular o processo gama a posteriori, como esquema de amostragem no algoritmo MCMC, ´e utilizado o algoritmo ILM, descrito na Se¸c˜ao 3.2.3. Estes m´etodos permitem uma generaliza¸c˜ao do procedimento de inferˆencia tradicional baseado na conjuga¸c˜ao de modelos Poisson/gama. Detalhes sobre este procedimento de inferˆencia ser˜ao discutidos de forma particular para os modelos propostos neste tra- baho, como extens˜ao da metodologia proposta porWolpert e Ickstadt(1998), no cap´ıtulo seguinte.
Cap´ıtulo 4
Modelos Espa¸co-Temporais de
Convolu¸c˜ao de Processos Gama
A classe de modelos propostas no presente trabalho estende para o contexto espa¸co- temporal a classe dos modelos espaciais propostos por Wolpert e Ickstadt(1998), descri- tos no cap´ıtulo anterior, ao considerar uma evolu¸c˜ao temporal dinˆamica da intensidade do processo de Poisson. Esta evolu¸c˜ao ´e feita atrav´es de convolu¸c˜oes, especificamente atrav´es da integra¸c˜ao de kernels sobre as intensidades em diferentes instantes de tempo. Esta estrutura de convolu¸c˜ao do modelo ´e respons´avel pela propaga¸c˜ao da intensidade ao longo do espa¸co e do tempo. A base te´orica dos modelos propostos neste cap´ıtulo permite a utiliza¸c˜ao de estruturas de probabilidade flex´ıveis de forma a criar modelos espa¸co-temporais adequados para qualquer resolu¸c˜ao espacial. Al´em de conservar as pro- priedades e vantagens da metodologia proposta por Wolpert e Ickstadt(1998), incluindo a utiliza¸c˜ao do algoritmo ILM no procedimento de inferˆencia, podem ser inclu´ıdas no modelo outras quantidades que visam caracterizar o comportamento espa¸co-temporal do fenˆomeno ou a regi˜ao de interesse. Por exemplo, no contexto ecol´ogico, pode-se incluir na modelagem estruturas com o objetivo de capturar crescimento e descrescimento po- pulacional, movimento de organismos na regi˜ao de interesse ao longo do tempo, al´em de efeitos direcionais destes movimentos.
Com o intuito de avaliar a performance dos modelos propostos, s˜ao realizados estu- dos com dados artificiais simulados em espa¸cos unidimensionais e bidimensionais. Como
ilustra¸c˜ao da nova abordagem, uma aplica¸c˜ao a dados reais referentes a popula¸c˜oes de p´assaros ´e realizada. Especificamente, deseja-se investigar o comportamento espa¸co- temporal da esp´ecie melro de cervejeiro, comum na Am´erica do Norte, atrav´es de conta- gens observadas em uma regi˜ao da Calif´ornia, Estados Unidos, durante alguns anos de 1999 a 2008. Detalhes da abordagem proposta s˜ao descritos a seguir.
4.1
Modelagem Proposta
Seja Yt(x) um processo de Poisson definido no espa¸co D ⊂ Rd no tempo t, para
t = 1, . . . , T . Portanto, assume-se
Yt(dx) ∼ P oi(Λt(dx)). (4.1)
Aqui, assume-se que a medida de intensidade Λt(dx) evolui dinamicamente no tempo
atrav´es de uma convolu¸c˜ao, que ´e definida atrav´es da integra¸c˜ao de uma medida h(dx, r) sobre a medida de intensidade no tempo anterior, Λt−1(dx), como
Λt(dx) =
Z
D
h(dx, r)Λt−1(dr). (4.2)
Para o tempo t = 0, define-se Λ0(dx) atrav´es da integra¸c˜ao de uma medida k0(dx, s)
sobre um processo gama Γ(s) definido no espa¸co S ⊂ Rd, conforme proposto porWolpert
e Ickstadt (1998) em (3.32). Assim, tem-se
Λ0(dx) =
Z
S
k0(dx, s)Γ(ds). (4.3)
Aqui, assume-se h(dx, r) = h(x, r)dx de forma que Λt(dx) = Λt(x)dx e k0(dx, s) =
k0(x, s)dx de forma que Λ0(dx) = Λ0(x)dx, em que h(x, r) e k0(x, s) s˜ao kernels, a
princ´ıpio, normalizados, isto ´e, RXh(dx, r) = 1 e RDk0(dx, r) = 1. Por fim, o processo
gama ´e definido de forma que
Γ(ds) ∼ Ga(α(ds), β), (4.4)
em que a fun¸c˜ao de escala β(s) = β em (3.33) ´e assumida constante, para fins de simpli- fica¸c˜ao.
Em (4.2) e (4.3), os kernels h(x, r) and k0(x, s) s˜ao escolhidos de forma a refletir
as caracter´ısticas espa¸co-temporais da regi˜ao e do fenˆomeno sob investiga¸c˜ao. O ker- nel h(x, r), em particular, ´e respons´avel pela dispers˜ao ou propaga¸c˜ao. Intuitivamente, suponha que organismos se movimentem no espa¸co (regi˜ao) D ao longo do tempo. O kernel h(x, r) ´e respons´avel por este movimento conforme o tempo varia. Em outras palavras, a popula¸c˜ao de organismos em uma determinada localiza¸c˜ao e em um deter- minado instante de tempo ´e uma pondera¸c˜ao da popula¸c˜ao nas demais localiza¸c˜oes no tempo anterior. Isto ´e levado em considera¸c˜ao no modelo atrav´es da convolu¸c˜ao em (4.2). A intensidade nesta localiza¸c˜ao depende da distˆancia entre ela e as demais localiza¸c˜oes, e dos parˆametros do kernel h(x, r).
Um importante aspecto do modelo aqui apresentado ´e o fato de que a convolu¸c˜ao em (4.2) pode ser reescrita como fun¸c˜ao do processo gama em (4.3), conforme descrito a seguir.