2.3 An´ alise explorat´ oria
3.1.3 Fragilidade espacial
Fragilidades espaciais s˜ao um caso particular de fragilidades partilhadas vistas na sec¸c˜ao
II-3.1.2, mas dada a sua importˆancia para o nosso trabalho, iremos dedicar-lhes uma maior aten¸c˜ao. Consideremos a fun¸c˜ao de risco
hik(t | Qk, xik) = h0(t) exp(x>ikβ + Qk), (3.10)
onde Qk≡ log qk ´e o logaritmo da fragilidade qk associada `a k-´esima regi˜ao do estudo.
Nas sec¸c˜oesII-3.1.1 eII-3.1.2 cada indiv´ıduo, ou grupo de indiv´ıduos, possu´ıa a sua pr´opria fragilidade, que era independente dos outros indiv´ıduos, ou grupo de indiv´ıduos, respectiva- mente. Dentro do mesmo grupo a fragilidade era partilhada, mas independente da fragilidade evidenciada pelos outros grupos. Estas suposi¸c˜oes de independˆencia s˜ao comuns, mesmo se estivermos a falar de grupos sob o ponto de vista geogr´afico (distritos, concelhos, freguesias, etc.). Contudo, s˜ao muitas vezes s˜ao irrealistas, pois ´e natural esperar-se que regi˜oes vizinhas partilhem alguma da heterogeneidade n˜ao observada. Dados com uma estrutura espacial cor- relacionada implicam que as observa¸c˜oes n˜ao podem, em geral, ser supostas como mutuamente independentes, pois regi˜oes vizinhas tendem a ser semelhantes entre si. Este padr˜ao espacial – autocorrela¸c˜ao espacial – pode ser usado como informa¸c˜ao ´util para compreender as influˆencias latentes, mas n˜ao permite a aplica¸c˜ao dos m´etodos de inferˆencia estat´ıstica, constru´ıdos sob a suposi¸c˜ao de independˆencia entre observa¸c˜oes. Assim, somos remetidos para os modelos com
3.1 Modelos de sobrevivˆencia com fragilidade
fragilidades espaciais correlacionadas.
A estat´ıstica espacial lida essencialmente com trˆes situa¸c˜oes: processos pontuais, geoes- tat´ıstica e dados por ´area (“areal data” ou “lattice data”). Ser´a sobre este ´ultimo tipo que nos iremos debru¸car. Dados por ´area surgem quando temos uma ´area, D, particionada em K sub-´areas mais pequenas, Dk, k = 1, . . . , K, indexadas arbitrariamente (de forma regular ou
irregular, mas de limites bem definidos). O interesse prim´ario reside em estudar uma vari´avel Y medida em cada sub-´area Dk e perceber tamb´em as similitudes, caso existam, entre sub-´areas
(regi˜oes) vizinhas, atrav´es da dependˆencia espacial entre as fragilidades exibidas por cada regi˜ao (Banerjee et al.,2004).
A modela¸c˜ao espacial ´e a incorpora¸c˜ao de informa¸c˜oes de adjacˆencia para as observa¸c˜oes vizinhas. De uma perspectiva bayesiana isso implica a incorpora¸c˜ao de uma distribui¸c˜ao a priori para lidar com a dependˆencia espacial na fun¸c˜ao de risco. O efeito aleat´orio espacial ´e, ent˜ao, introduzido com o intuito de capturar uma poss´ıvel sobredispers˜ao que costuma estar presente neste tipo de observa¸c˜oes. Portanto, esse efeito mede o deslocamento da m´edia, em cada sub-´area, relativamente ao efeito global, representado pela ordenada na origem. O modelo mais popular ´e o modelo autorregressivo condicional (CAR) que incorpora a correla¸c˜ao espacial atrav´es de um vector de efeitos aleat´orios variando espacialmente (Besag et al.,1991).
Modelo autoregressivo condicional (CAR)
Ao adoptar uma distribui¸c˜ao de fragilidade espacial gama, esta n˜ao permitiria definir uma estrutura de covariˆancia de forma simples, ao contr´ario do cen´ario em que as fragilidades s˜ao consideradas como Gaussianas. Portanto, consideraremos efeitos aleat´orios espaciais que se correlacionam segundo um modelo gaussiano, procurando, assim, uma distribui¸c˜ao a priori que tenha em conta a varia¸c˜ao extra presente nos dados de sobrevivˆencia espaciais.
Besag et al.(1991) prop˜oe que a distribui¸c˜ao a priori para as fragilidades espaciais correla- cionadas, Q = (Q1≡ log q1, . . . , Qn≡ log qK), seja da forma
π(Q | τ2) ∝ 1 τ2(n/2)exp − 1 2τ2 X l6=k alk(Ql− Qk)2 , (3.11)
onde alk s˜ao os elementos da matriz de adjacˆencia A, ou matriz de pondera¸c˜oes, para as ´areas
Dk em estudo e τ2 ´e o hiperparˆametro de fragilidade espacial. As entradas alk desta matriz
indicam se as ´areas Dl e Dk s˜ao ou n˜ao vizinhas e qual o “peso” da sua vizinhan¸ca. Os pesos
podem ser definidos atrav´es de distˆancias ou de uma outra qualquer fun¸c˜ao mais geral dos centros das ´areas. Uma outra escolha (aquela que iremos utilizar neste trabalho) ´e considerar alk= 1, se as ´areas Dl e Dk partilham fronteiras, e alk= 0, caso contr´ario. Usualmente all = 0,
pois nenhuma ´area ´e vizinha dela pr´opria. A distribui¸c˜ao conjunta a priori (II-3.11) ´e conhecida como distribui¸c˜ao CAR(τ2).
Uma vantagem do modelo CAR ´e possibilitar definir a distribui¸c˜ao conjunta (II-3.11) `a custa de distribui¸c˜oes condicionais com distribui¸c˜ao normal:
Ql | Ql6=k ∼ N 1 al+ X k alkQk, τ2 al+ ! , l, k = 1, . . . , K, (3.12)
onde al+representa o n´umero de vizinhos da ´area Dl. Repare-se que em (II-3.12) a m´edia de uma
fragilidade coincide com a m´edia das fragilidades dos seus vizinhos, enquanto que a variˆancia ´e inversamente proporcional ao n´umero de vizinhos.
Contudo, a distribui¸c˜ao a priori CAR ´e impr´opria, o que pode ser provado notando que, somando uma qualquer constante aos efeitos aleat´orios, Ql, (II-3.11) n˜ao se altera (Banerjee
et al.,2004). Como consequˆencia, o modelo CAR s´o pode ser usado como distribui¸c˜ao a priori e n˜ao como uma verosimilhan¸ca, sendo introduzida numa segunda etapa de uma formula¸c˜ao hier´arquica. Esta distribui¸c˜ao a priori CAR ´e membro da classe das distribui¸c˜oes a priori de diferen¸cas dois a dois (Besag e Kooperberg,1995), as quais s˜ao identitific´aveis a menos de uma constante aditiva. Desta forma, para permitir que os dados identifiquem a ordenada na origem, β0, na fun¸c˜ao de risco (II-3.10), temos que considerar a restri¸c˜ao PKk=1Qk= 0.
A implementa¸c˜ao bayesiana destes modelos atrav´es de m´etodos MCMC ´e simples (e.g. via WinBUGS). No caso de supormos uma distribui¸c˜ao Weibull para o risco de base, a distribui¸c˜ao conjunta a posteriori do modelo (II-3.10), substituindo q por Q na express˜ao (II-3.8), ser´a dada por: π(α, β, Q | D) ∝ L(α, β, Q|D)π(Q | τ )π(τ )π(α)π(β) ∝ K Y k=1 nk Y i=1 αtα−1ik qkexp{x>i β} δik expn−tαikqkexp(x>i β) o × × 1 τ2(n/2)exp − 1 2τ2 X l6=k alk(Ql− Qk)2 π(τ )π(α)π(β). (3.13)
Usualmente consideram-se distribui¸c˜oes a priori vagas, mas pr´oprias, para α, β e κ. Tipicamente β ∼ N (µ0, Σ0), α ∼ G(α0, α1) e τ ∼ G(τ0, τ1).