Fragilidade espacial - An´ alise explorat´ oria

2.3 An´ alise explorat´ oria

3.1.3 Fragilidade espacial

Fragilidades espaciais são um caso particular de fragilidades partilhadas vistas na seçcão

II-3.1.2, mas dada a sua importância para o nosso trabalho, iremos dedicar-lhes uma maior aten¸cão. Consideremos a fun¸cão de risco

hik(t | Qk, xik) = h0(t) exp(x>ikβ + Qk), (3.10)

onde Qk≡ log qk é o logaritmo da fragilidade qk associada à k-ésima região do estudo.

Nas seçcõesII-3.1.1 eII-3.1.2 cada indiv´ıduo, ou grupo de indiv´ıduos, possu´ıa a sua própria fragilidade, que era independente dos outros indiv´ıduos, ou grupo de indiv´ıduos, respectiva- mente. Dentro do mesmo grupo a fragilidade era partilhada, mas independente da fragilidade evidenciada pelos outros grupos. Estas suposi¸cões de independência são comuns, mesmo se estivermos a falar de grupos sob o ponto de vista geográfico (distritos, concelhos, freguesias, etc.). Contudo, são muitas vezes são irrealistas, pois é natural esperar-se que regiões vizinhas partilhem alguma da heterogeneidade não observada. Dados com uma estrutura espacial cor- relacionada implicam que as observa¸cões não podem, em geral, ser supostas como mutuamente independentes, pois regiões vizinhas tendem a ser semelhantes entre si. Este padrão espacial – autocorrela¸cão espacial – pode ser usado como informa¸cão útil para compreender as influências latentes, mas não permite a aplica¸cão dos métodos de inferência estat´ıstica, constru´ıdos sob a suposi¸cão de independência entre observa¸cões. Assim, somos remetidos para os modelos com

3.1 Modelos de sobrevivˆencia com fragilidade

fragilidades espaciais correlacionadas.

A estat´ıstica espacial lida essencialmente com três situa¸cões: processos pontuais, geoes- tat´ıstica e dados por área (“areal data” ou “lattice data”). Será sobre este último tipo que nos iremos debru¸car. Dados por área surgem quando temos uma área, D, particionada em K sub-áreas mais pequenas, Dk, k = 1, . . . , K, indexadas arbitrariamente (de forma regular ou

irregular, mas de limites bem definidos). O interesse primário reside em estudar uma variável Y medida em cada sub-área Dk e perceber também as similitudes, caso existam, entre sub-áreas

(regiões) vizinhas, através da dependência espacial entre as fragilidades exibidas por cada região (Banerjee et al.,2004).

A modela¸cão espacial é a incorpora¸cão de informa¸cões de adjacência para as observa¸cões vizinhas. De uma perspectiva bayesiana isso implica a incorpora¸cão de uma distribui¸cão a priori para lidar com a dependência espacial na fun¸cão de risco. O efeito aleatório espacial é, então, introduzido com o intuito de capturar uma poss´ıvel sobredispersão que costuma estar presente neste tipo de observa¸cões. Portanto, esse efeito mede o deslocamento da média, em cada sub-área, relativamente ao efeito global, representado pela ordenada na origem. O modelo mais popular é o modelo autorregressivo condicional (CAR) que incorpora a correla¸cão espacial através de um vector de efeitos aleatórios variando espacialmente (Besag et al.,1991).

Modelo autoregressivo condicional (CAR)

Ao adoptar uma distribui¸cão de fragilidade espacial gama, esta não permitiria definir uma estrutura de covariância de forma simples, ao contrário do cenário em que as fragilidades são consideradas como Gaussianas. Portanto, consideraremos efeitos aleatórios espaciais que se correlacionam segundo um modelo gaussiano, procurando, assim, uma distribui¸cão a priori que tenha em conta a varia¸cão extra presente nos dados de sobrevivência espaciais.

Besag et al.(1991) prop˜oe que a distribui¸c˜ao a priori para as fragilidades espaciais correlacionadas, Q = (Q1≡ log q1, . . . , Qn≡ log qK), seja da forma

π(Q | τ2) ∝ 1 τ2(n/2)exp    − 1 2τ2 X l6=k alk(Ql− Qk)2    , (3.11)

onde alk são os elementos da matriz de adjacência A, ou matriz de pondera¸cões, para as áreas

Dk em estudo e τ2 ´e o hiperparˆametro de fragilidade espacial. As entradas alk desta matriz

indicam se as áreas Dl e Dk são ou não vizinhas e qual o “peso” da sua vizinhan¸ca. Os pesos

podem ser definidos através de distâncias ou de uma outra qualquer fun¸cão mais geral dos centros das áreas. Uma outra escolha (aquela que iremos utilizar neste trabalho) é considerar alk= 1, se as áreas Dl e Dk partilham fronteiras, e alk= 0, caso contrário. Usualmente all = 0,

pois nenhuma área é vizinha dela própria. A distribui¸cão conjunta a priori (II-3.11) é conhecida como distribui¸cão CAR(τ2).

Uma vantagem do modelo CAR é possibilitar definir a distribui¸cão conjunta (II-3.11) à custa de distribui¸cões condicionais com distribui¸cão normal:

Ql | Ql6=k ∼ N 1 al+ X k alkQk, τ2 al+ ! , l, k = 1, . . . , K, (3.12)

onde al+representa o número de vizinhos da área Dl. Repare-se que em (II-3.12) a média de uma

fragilidade coincide com a média das fragilidades dos seus vizinhos, enquanto que a variância é inversamente proporcional ao número de vizinhos.

Contudo, a distribui¸cão a priori CAR é imprópria, o que pode ser provado notando que, somando uma qualquer constante aos efeitos aleatórios, Ql, (II-3.11) não se altera (Banerjee

et al.,2004). Como consequência, o modelo CAR só pode ser usado como distribui¸cão a priori e não como uma verosimilhan¸ca, sendo introduzida numa segunda etapa de uma formula¸cão hierárquica. Esta distribui¸cão a priori CAR é membro da classe das distribui¸cões a priori de diferen¸cas dois a dois (Besag e Kooperberg,1995), as quais são identitificáveis a menos de uma constante aditiva. Desta forma, para permitir que os dados identifiquem a ordenada na origem, β0, na fun¸cão de risco (II-3.10), temos que considerar a restri¸cão PKk=1Qk= 0.

A implementa¸cão bayesiana destes modelos através de métodos MCMC é simples (e.g. via WinBUGS). No caso de supormos uma distribui¸cão Weibull para o risco de base, a distribui¸cão conjunta a posteriori do modelo (II-3.10), substituindo q por Q na expressão (II-3.8), será dada por: π(α, β, Q | D) ∝ L(α, β, Q|D)π(Q | τ )π(τ )π(α)π(β) ∝ K Y k=1 nk Y i=1 αtα−1_ik qkexp{x>i β} δik expn−tα_ikqkexp(x>i β) o × × 1 τ2(n/2)exp    − 1 2τ2 X l6=k alk(Ql− Qk)2    π(τ )π(α)π(β). (3.13)

Usualmente consideram-se distribui¸c˜oes a priori vagas, mas pr´oprias, para α, β e κ. Tipicamente β ∼ N (µ0, Σ0), α ∼ G(α0, α1) e τ ∼ G(τ0, τ1).

No documento Métodos bayesianos aplicados à modelagem conjunta de dados longitudinais e de sobrevivência (páginas 88-90)