• Nenhum resultado encontrado

param´etricos, n˜ao vinculados a esta hip´otese, como o modelo aditivo de Aalen (Aalen, 1980,

1989).

3.6.3 Estima¸c˜ao do risco de base

Na sec¸c˜aoI-3.6.2considerou-se a estima¸c˜ao do parˆametro de interesse β no modelo de riscos proporcionais, podendo ser suficiente para investigar o efeito das covari´aveis na fun¸c˜ao de risco. Contudo, a plena compreens˜ao da fun¸c˜ao de risco est´a incompleta sem o conhecimento do risco de base. Usando a equa¸c˜ao (I-3.25), a fun¸c˜ao de risco para um indiv´ıduo pode ser estimada, desde que j´a se tenha uma estimativa para h0(t).

Uma forma de encarar a fun¸c˜ao de risco de base ´e especific´a-la. Neste caso, a fun¸c˜ao de risco correspondente a qualquer distribui¸c˜ao abordada na sec¸c˜ao I-3.5 poder´a ser usada como h0(t).

Um modelo param´etrico com riscos proporcionais ´e o modelo Weibull, pelo que se pode adoptar uma fun¸c˜ao de risco de base Weibull, implicando que todos os indiv´ıduos tenham uma fun¸c˜ao de risco, que ´e semelhante na sua forma (Weibull).

Da sec¸c˜ao I-3.5.2 sabemos que a fun¸c˜ao de risco duma distribui¸c˜ao W(α, λ) ´e h(t | α, λ) = λαtα−1. O modelo de regress˜ao a´ı constru´ıdo supunha a introdu¸c˜ao das covari´aveis atrav´es do parˆametro de escala, λ, considerando que λ = exp(x>β). Note-se que, na fun¸c˜ao de risco do modelo de riscos proporcionais (I-3.25), podemos considerar que h0(t) coincide com αtα−1,

obtendo-se aquilo que ´e usual chamar-se de modelo de Cox com um risco de base com distribui¸c˜ao Weibull

h(t | x) = αtα−1exp(x>β). (3.30)

Para se estimar a fun¸c˜ao de risco de base faz-se uso de t´ecnicas indirectas que podem ser: (i) param´etricas, se visarem a diminui¸c˜ao do n´umero de parˆametros a ser estimados, para que a fun¸c˜ao de risco de base fique bem especificada (a distribui¸c˜ao mais utilizada ´e a Weibull, por ser simples e mais flex´ıvel que a distribui¸c˜ao exponencial); (ii) n˜ao-param´etricas, se visam dar mais flexibilidade ao modelo, sendo desnecess´ario supor uma distribui¸c˜ao dos tempos de sobrevivˆencia. Nesta ´ultima s˜ao utilizados, muito frequentemente, modelos de risco constante por tro¸cos, processos Gama (Kalbfleisch(1978) e Burridge(1981)), processos beta (Hjort,1990) e processos de Dirichlet (Ferguson e Phadia (1979) e Susarla e Van Ryzin (1976)). Uma boa discuss˜ao sobre abordagens n˜ao-param´etricas pode ser encontrada emIbrahim et al.(2001).

3.7

Avalia¸c˜ao do modelo

Ap´os um modelo ser ajustado a um conjunto de dados ´e necess´ario avaliar a sua adequabili- dade. Contudo, no contexto da an´alise de sobrevivˆencia, os m´etodos de avalia¸c˜ao do ajustamento tˆem de lidar com a existˆencia de censura, o que os torna um pouco mais complicados do que

os correspondentes m´etodos utilizados em outros modelos de regress˜ao. Muitos procedimentos de avalia¸c˜ao s˜ao baseados em quantidades conhecidas como res´ıduos. Estes valores, calculados para cada indiv´ıduo, tˆem a particularidade de, quando o ajuste do modelo ´e satisfat´orio, o seu comportamento ser conhecido, pelo menos de forma aproximada.

3.7.1 Res´ıduos de Cox-Snell

Os res´ıduos mais usados na an´alise de sobrevivˆencia s˜ao os res´ıduos de Cox-Snell (Cox e Snell, 1968). Seja θ o vector de parˆametros a estimar no modelo. Os res´ıduos de Cox-Snell, condicionalmente aos parˆametros, s˜ao definidos como o valor da fun¸c˜ao de risco cumulativo avaliada nos momentos de evento observado, ti, ou seja,

riCS(ti| ˆθ) =

Z ti

0

hi(s|xi(s), ˆθ)ds. (3.31)

Se o modelo se ajusta bem aos dados esperamos que riCS(ti|.) tenha uma distribui¸c˜ao exponencial

unit´aria. Em vez de simplesmente substitu´ırmos os parˆametros, θ, pela sua estimativa, ˆθ, podemos calcular o valor esperado a posteriori dos res´ıduos Cox-Snell:

rCSi (ti) =

Z

riCS(ti|θ)π(θ|D)dθ. (3.32)

Na pr´atica, estamos a calcular rCS

i (ti), que s˜ao os res´ıduos nos tempos de falha observados, e,

portanto, quando o tempo de observa¸c˜ao ´e censurado, riCS(Ti) tamb´em o ser´a. Para levar em

linha de conta a censura na verifica¸c˜ao do ajuste do modelo, podemos comparar graficamente a estimativa de Kaplan-Meier da fun¸c˜ao de sobrevivˆencia de riCS(ti) com a fun¸c˜ao de sobrevivˆencia

da distribui¸c˜ao exponencial unit´aria.

3.7.2 Res´ıduos Martingala

Os res´ıduos Martingala fornecem uma medida da diferen¸ca entre o n´umero observado de mortes no intervalo (0, ti), onde ti ´e o tempo de falha para o indiv´ıduo i e o n´umero de mortes

estimadas pelo modelo. O res´ıduo Martingala para o i-´esimo indiv´ıduo ´e:

riM = δi− rCSi , (3.33)

onde δ ´e o indicador de evento. O gr´afico destes res´ıduos vs uma covari´avel, indica como a forma funcional desta covari´avel se deve parecer. Em particular, um gr´afico que seja uma recta indica que ´e necess´ario um termo linear. Para ajudar na interpreta¸c˜ao o gr´afico ´e aconselh´avel analisar uma suaviza¸c˜ao dos res´ıduos por interm´edio do LOESS (“LOcal regrESSion” (Cleveland et al.,

4

Modelos conjuntos

Os modelos conjuntos para dados longitudinais e de sobrevivˆencia tˆem tido um crescente de- senvolvimento na literatura. Tsiatis e Davidian(2004) ´e um trabalho nuclear nesta tem´atica, ofe- recendo, inclusivamente, uma revis˜ao abrangente desde os prim´ordios destes modelos. Ibrahim et al. (2001) dedicam especial aten¸c˜ao ao assunto, desenvolvendo alguns dos modelos mais im- portantes, tanto frequencistas como bayesianos. Recentemente, houve uma edi¸c˜ao especial da revista Lifetime Data Analysis com 7 artigos inteiramente dedicados `a tem´atica (Chen e Gus- tafson, 2011), bem como a publica¸c˜ao de um livro exclusivamente sobre modelos conjuntos (Rizopoulos,2012b).

Nas pr´oximas sec¸c˜oes iremos abordar os conceitos b´asicos dos modelos conjuntos (sec¸c˜ao

I-4.1), come¸cando pelos m´etodos mais utilizados para modelar cada um dos processos longitu- dinal e de sobrevivˆencia em separado (sec¸c˜ao I-4.2). Seguir-se-´a a apresenta¸c˜ao dos crit´erios de aplicabilidade (sec¸c˜aoI-4.2.4) e dos principais modelos conjuntos (sec¸c˜aoI-4.3). Na sec¸c˜aoI-4.4

apresenta-se a evolu¸c˜ao da literatura sobre a tem´atica, nomeadamente a n´ıvel das ferramentas de diagn´ostico, terminando com os desafios computacionais que os modelos conjuntos enfrentam.

4.1

Conceitos b´asicos e nota¸c˜ao

Consideremos que Ti∗ ´e o verdadeiro tempo de ocorrˆencia do evento de interesse para o i- ´

esimo indiv´ıduo, i = 1, . . . , N . Como vimos no cap´ıtuloI-3, o tempo de sobrevivˆencia verdadeiro n˜ao ´e, por norma, observado para todos os indiv´ıduos e est´a sujeito aos v´arios tipos de censura. Posto isto, o que observamos ´e Ti = min{Ti∗, Ci}, onde Ci ´e o tempo de censura. Recordemos

que δi = 1[Ti∗ ≤ Ci] ´e o indicador de ocorrˆencia de evento, em que δi = 1 indica uma falha e

δi = 0 indica uma observa¸c˜ao censurada `a direita. Portanto, os dados observados no processo

de sobrevivˆencia, para popula¸c˜oes homog´eneas, consistem nos pares {(Ti, δi); i = 1, . . . , N }.

no instante t para o i-´esimo indiv´ıduo. Devemos notar que n˜ao temos observa¸c˜oes do marcador para todos os instantes, mas apenas em ocasi˜oes espec´ıficas, {tij ≤ Ti, j = 1, . . . , ni}, nas

quais h´a uma medi¸c˜ao do marcador longitudinal. Portanto, os dados longitudinais observados consistem no conjunto de medidas Yi(t) = {Yi(tij) ≡ Yij, 0 ≤ tij < Ti, j = 1, . . . ni}, denominado

hist´oria dos valores observados do marcador, ou na sua forma vectorial, yi = (Yi1, . . . , Yini).

Tipicamente sup˜oe-se que, para cada um dos N pacientes, existe um processo subjacente do marcador, Yi∗ = {Yi∗(t), t ≥ 0, i = 1, . . . , N }, denominado traject´oria, que n˜ao ´e observado, e como tal, pode ser encarada como latente. A traject´oria representa os verdadeiros valores da medida longitudinal para todos os instantes t ≥ 0. Portanto, aquilo a que se tem acesso s˜ao representa¸c˜oes, nos instantes considerados, de alguma fun¸c˜ao dos verdadeiros valores, Yi∗(t). Desta forma o valor observado do resultado longitudinal no instante tij, contaminado com um

erro de medida, ei(tij), ´e dado por

Yi(tij) = Yi∗(tij) + ei(tij). (4.1)

Repare-se que a formula¸c˜ao anterior, al´em de admitir a intermitˆencia das observa¸c˜oes longi- tudinais, possibilita ainda que diferentes indiv´ıduos tenham um diferente n´umero de medi¸c˜oes ao longo do tempo e que os instantes possam ser diferentes para cada i. A traject´oria pos- sui informa¸c˜ao sobre a medida longitudinal e ao ser vista como um factor latente, permite-nos encar´a-la como a representa¸c˜ao do verdadeiro estado de sa´ude do paciente nas suas v´arias di- mens˜oes ou apenas como uma ferramenta para induzir rela¸c˜oes.

Dois dos principais objectivos da modela¸c˜ao conjunta s˜ao: (i) caracterizar padr˜oes de mu- dan¸ca dentro do biomarcador; (ii) caracterizar a associa¸c˜ao entre altera¸c˜oes do biomarcador e o tempo-at´e-evento. O primeiro dos objectivos citados pode envolver, por exemplo, o c´alculo de E[Yi(t)|xi] ou V[Yi(t)|xi], onde xi ´e um vector de covari´aveis de base (e.g. indicador de

tratamento). Contudo, a literatura sobre modelos conjuntos tem-se centrado mais no segundo des´ıgnio e, em geral, a forma utilizada para explanar as rela¸c˜oes entre o verdadeiro tempo de sobrevivˆencia, T∗, o verdadeiro valor do marcador longitudinal, Y∗(t), e covari´aveis de base, xi,

´e estabelecer a rela¸c˜ao atrav´es de um modelo de riscos relativos com covari´aveis dependentes do tempo (vide sec¸c˜ao I-3.6.1) da seguinte forma (Kalbfleisch e Prentice,2002):

h(t|Y∗(t)) = lim ∆t→0 1 ∆tP (t ≤ T ∗ < t + δ|T≥ t, Y(t), x i) = h0(t)φ(Y∗(t), xi; θ), (4.2)

onde φ(Y∗(t), xi; θ) ´e uma fun¸c˜ao da hist´oria da covari´avel dependente do tempo at´e ao instante

t, Y∗(t) = {Y∗(u), 0 ≤ u < t}, especificada a menos de um parˆametro, ou vector de parˆametros, θ.