• Nenhum resultado encontrado

2.3 An´ alise de Sobrevivˆ encia

2.3.2 M´ etodos n˜ ao param´ etricos

Estimador de Kaplan-Meier

A estima¸c˜ao da fun¸c˜ao de sobrevivˆencia ´e um aspecto fundamental em estudos de sobrevivˆencia, visto ser utilizada para estimar qual a probabilidade de um indiv´ıduo sobreviver pelo menos at´e um determinado instante.

Quando n˜ao existem observa¸c˜oes censuradas, numa amostra de dimens˜ao n, a fun¸c˜ao de sobrevivˆencia, num instante t, pode ser estimada a partir dos tempos de

vida observados. Obtem-se ent˜ao a fun¸c˜ao de sobrevivˆencia emp´ırica que ´e dada por ˆ

S(t) = n´umero de observa¸c˜oes > t

n , t ≥ 0

Kaplan e Meier (1958) propuseram um estimador n˜ao param´etrico para a fun¸c˜ao de sobrevivˆencia, quando estamos na presen¸ca de observa¸c˜oes censuradas. Este estimador ´e designado por estimador de Kaplan-Meier (KM) ou estimador produto- limite.

Suponhamos que t1, t2, ..., tks˜ao os k instantes de morte distintos numa amostra

de dimens˜ao n(k ≤ n), tal que t1 < t2 < ... < tk. Seja di o n´umero de mortes

ocorridas em ti e ni o n´umero de indiv´ıduos em risco no instante ti, ou seja, o

n´umero de indiv´ıduos vivos e n˜ao censurados imediatamente antes do instante ti,

i = 1, 2, ...., k. O estimador de Kaplan-Meier da fun¸c˜ao de sobrevivˆencia ´e dado por ˆ S(t) = Y i:ti≤t  ni− di ni  = Y i:ti≤t  1 − di ni  . (2.9)

Um indiv´ıduo com tempo de censura igual a ti deve ser inclu´ıdo no conjunto de

indiv´ıduos em risco imediatamente antes de ti, uma vez que o instante de morte

precede o instante de censura.

A estimativa ˆS(t) ´e uma fun¸c˜ao em escada que decresce logo ap´os cada instante de morte ti, e tem-se que:

• ˆS(t) = 1 para 0 ≤ t < t1 ;

• se a maior observa¸c˜ao registada ´e um instante de censura, t∗ (neste caso nk>

dk), ent˜ao a fun¸c˜ao de sobrevivˆencia nunca toma o valor 0 e apenas est´a

definida at´e esse instante, t∗, sendo ˆ

S(t) = ˆS(tk) para tk < t < t∗

• se o instante de morte tk for a maior observa¸c˜ao registada, ent˜ao

ˆ

S(t) = 0 para t ≥ tk

Breslow e Crowley (1974) e Meier (1975) provaram que ˆS(t) ´e um estimador con- sistente de S(t), sob certas condi¸c˜oes de regularidade, e tem distribui¸c˜ao assint´otica normal. ˆS(t) pode ser considerado como um estimador de m´axima verosimilhan¸ca n˜ao param´etrica de S(t). A estimativa da variˆancia do estimador ˆS(t) ´e dada por

d V arh ˆS(t)i=h ˆS(t)i 2 X i:ti≤t di ni(ni− di) (2.10)

conhecida como f´ormula de Greenwood.

Obtem-se um intervalo de confian¸ca para a fun¸c˜ao de sobrevivˆencia, num dado instante t, baseado em que o estimador da fun¸c˜ao de sobrevivˆencia nesse instante tem

distribui¸c˜ao normal, com valor m´edio S(t) e variˆancia estimada dV arh ˆS(t) i

. Tem-se ent˜ao um intervalo de 100(1 − α)% de confian¸ca para a fun¸c˜ao de sobrevivˆencia no instante t, definido por

ˆ S(t) ± z1−α/2 r d V arh ˆS(t) i ,

onde zα ´e o quantil de probabilidade α da distribui¸c˜ao N (0, 1).

Para al´em da estima¸c˜ao da fun¸c˜ao de sobrevivˆencia, em muitas situa¸c˜oes interessa tamb´em estimar a fun¸c˜ao de risco cumulativa H(t). De acordo com (2.8) sabe-se que H(t) = − log S(t), e sendo ˆS(t) o estimador de Kaplan-Meier da fun¸c˜ao de sobrevivˆencia, um estimador natural de H(t) ser´a

ˆ

H(t) = − log ˆS(t). Por (2.9) temos ent˜ao

ˆ H(t) = − X i:ti≤t log  1 − di ni  ,

para ti ≤ t < ti+1, i = 1, 2, ...., k e t1, t2, ..., tk s˜ao os instantes distintos de morte,

com tk+1 = ∞.

Estimador de Nelson-Aalen

Uma alternativa para estimar a fun¸c˜ao de risco cumulativa ´e utilizar o estimador proposto por Nelson (1972) e estudado por Aalen (1978), designado por estimador de Nelson-Aalen.

Suponhamos que t1, t2, ..., tk s˜ao os k instantes de morte distintos de uma

amostra de dimens˜ao n(k ≤ n), tal que t1 < t2 < ... < tk. Seja di o n´umero

de mortes ocorridas em ti e ni o n´umero de indiv´ıduos em risco no instante ti,

i = 1, 2, ...., k. O estimador de Nelson-Aalen da fun¸c˜ao de risco cumulativa ´e dado por ˆ H(t) = X i:ti≤t di ni . (2.11)

Este estimador apresenta propriedades que o tornam prefer´ıvel ao estimador de Kaplan-Meier para amostras pequenas, embora quando existem ainda muitos in- div´ıduos em risco, as estimativas sejam semelhantes. Contudo, quando as amostras s˜ao suficientemente grandes, as estimativas de Kaplan-Meier e Nelson-Aalen da fun¸c˜ao de sobrevivˆencia s˜ao muito pr´oximas. Neste trabalho optou-se por utilizar o estimador de Kaplan-Meier para a estima¸c˜ao da fun¸c˜ao de sobrevivˆencia, bem como para a fun¸c˜ao de risco cumulativa (Anexo 1, Anexo 2, Anexo 3 e Anexo 4), uma vez que este estimador ´e uma generaliza¸c˜ao da fun¸c˜ao de sobrevivˆencia emp´ırica.

Estimativa da mediana

Tendo em conta que a distribui¸c˜ao do tempo de sobrevivˆencia ´e, geralmente, assim´etrica positiva, ´e aconselh´avel a utiliza¸c˜ao da mediana na an´alise de dados de sobrevivˆencia. Uma vez estimada a fun¸c˜ao de sobrevivˆencia pelo estimador de Kaplan-Meier, facilmente se obt´em uma estimativa da mediana, ˆt(50), dada por

ˆ

t(50) = minnti : ˆS(ti) ≤ 0.5

o

, (2.12)

sendo ti o i-´esimo tempo de morte ordenado, i = 1, 2, ...., k.

A estimativa da mediana define-se como o menor tempo de sobrevivˆencia obser- vado para o qual a estimativa da fun¸c˜ao de sobrevivˆencia ´e inferior ou igual a 0.5, ou seja, corresponde ao tempo no qual se estima que 50% dos indiv´ıduos em estudo estejam vivos. No entanto, quando mais de metade das observa¸c˜oes s˜ao censuradas n˜ao ´e poss´ıvel estimar a mediana desta forma, visto que a estimativa da fun¸c˜ao de sobrevivˆencia tomar´a sempre valores superiores a 0.5. Neste caso ´e usual utilizar um outro percentil da distribui¸c˜ao para descrever o tempo de sobrevivˆencia estimado, ou ent˜ao determinar as estimativas de sobrevivˆencia aos 5, 10 e 15 anos, por exemplo.

De um modo geral, a estimativa do percentil de probabilidade p ´e dado por ˆ

t(p) = minnti : ˆS(ti) ≤ 1 − (p/100)

o . sendo ti o i-´esimo tempo de morte ordenado, i = 1, 2, ...., k.

Estimador de Kaplan-Meier com estratifica¸c˜ao

O estimador de Kaplan-Meier com estratifica¸c˜ao, estando os indiv´ıduos em es- tudo divididos em diferentes grupos de acordo com as categorias de cada vari´avel, permite estimar as fun¸c˜oes de sobrevivˆencia, separadamente para cada um dos gru- pos. Assim, para cada vari´avel a curva de sobrevivˆencia ´e estimada separadamente para cada grupo, o que possibilita, de modo informal, avaliar se essa vari´avel tem influˆencia no tempo de sobrevivˆencia.

Depois das fun¸c˜oes de sobrevivˆencia serem estimadas e representadas grafica- mente ser´a importante testar se existem entre as curvas de sobrevivˆencia diferen¸cas significativas desses diversos grupos.

Para comparar as fun¸c˜oes de sobrevivˆencia s˜ao geralmente utilizados testes n˜ao param´etricos, designados por testes de ordem (rank test), visto a estat´ıstica de teste depender unicamente das ordens das observa¸c˜oes. Deste modo, avaliam se existem diferen¸cas significativas na sobrevivˆencia entre dois ou mais grupos diferentes. Neste trabalho, dos testes n˜ao param´etricos existentes optou-se por utilizar o teste log-rank e o teste de Peto-Peto dado estarem dispon´ıveis no software estat´ıstico R. Os testes referidos s˜ao usados para testar a igualdade de fun¸c˜oes de sobrevivˆencia, i.e., a hip´otese a testar ´e

Teste log-rank

Baseado no trabalho de Mantel e Haenszel (1959), Mantel (1966) propos um teste, geralmente, designado por teste log-rank ou teste de Mantel-Haenszel.

Suponha-se que temos dois grupos (1 e 2) a que correspondem duas amostras de m e n indiv´ıduos, respectivamente, e t1 < t2 < ... < tk s˜ao os k instantes de morte

distintos relativos aos m + n indiv´ıduos. Sabe-se que existem nij indiv´ıduos em

risco no grupo i, (i = 1, 2), imediatamente antes do instante tj, e que nesse instante

morreram d1j indiv´ıduos do grupo 1 e d2j indiv´ıduos do grupo 2, para j = 1, 2, ...., k.

Assim, dj = d1j + d2j corresponde ao n´umero total de mortes ocorridas nos dois

grupos, no total dos nj = n1j + n2j indiv´ıduos em risco, no instante tj.

A informa¸c˜ao relevante em cada instante tj (j = 1, 2, ...., k) pode ser resumida

numa tabela de contigˆencia 2 × 2:

no de mortes no de sobreviventes no de ind. em risco Grupo em tj para al´em de tj em tj

1 d1j n1j− d1j n1j

2 d2j n2j− d2j n2j

Total dj nj− dj nj

Considera-se a hip´otese nula, de igualdade das fun¸c˜oes de sobrevivˆencia nos dois grupos distintos. Ent˜ao, supondo H0 verdadeira, a distribui¸c˜ao de d1j, condicional

aos totais marginais, ´e hipergeom´etrica, sendo que

p(d1j|dj, nj) =  dj d1j   nj−dj n1j−d1j   nj n1j 

e, por conseguinte, sob H0, o valor m´edio condicional da vari´avel aleat´oria d1j ´e

dado por eij = n1jndj

j , que representa o n´umero esperado de indiv´ıduos que morrem

no instante tj no grupo 1. A variˆancia condicional de d1j ´e dada por

υ1j =

n1jn2jdj(nj− dj)

n2

j(nj− 1)

. (2.13)

Com o intuito de obter uma medida global do desvio dos valores observados de d1j em rela¸c˜ao aos valores esperados ´e importante combinar a informa¸c˜ao das k

tabelas de contigˆencia 2 × 2, considerando a estat´ıstica

UL= k

X

j=1

(d1j − e1j) , (2.14)

em que P d1j −P e1j ´e a diferen¸ca entre o total de mortes observadas e esperadas

Dado que se pode assumir a independˆencia entre as mortes ocorridas nos k instantes, a variˆancia de UL´e apenas a soma das variˆancias de d1j, sendo assim

V ar(UL) = k

X

j=1

υ1j = VL. (2.15)

A estat´ıstica de teste proposta por Mantel e Haenszel (1959) ´e dada por WL=

UL2 VL

,

que sob a hip´otese H0 tem distribui¸c˜ao assint´otica Qui-quadrado com 1 grau de

liberdade (χ21).

A hip´otese H0 ´e rejeitada para valores grandes da estat´ıstica, ou seja, para

WL > χ21−α, sendo χ21−α o quantil de probabilidade 1 − α da distribui¸c˜ao Qui-

quadrado com 1 grau de liberdade.

Teste de Peto-Peto

Um outro teste n˜ao param´etrico utilizado para testar a igualdade de duas ou mais fun¸c˜oes de sobrevivˆencia ´e o teste proposto por Peto e Peto (1972), designado por teste de Peto-Peto. Este teste ´e uma generaliza¸c˜ao do teste de Mann-Whitney- Wilcoxon quando estamos na presen¸ca de observa¸c˜oes censuradas, e considera a estat´ıstica UP = k X j=1 wj(d1j − e1j) , (2.16)

em que, tal como j´a referido anteriormente, d1j ´e o n´umero de mortes ocorridas para

o grupo 1, no instante tj, e e1j ´e dado por eij = n1jdj

nj .

A diferen¸ca entre esta estat´ıstica (UP) e a do teste log-rank (2.14) est´a no peso

associado a cada diferen¸ca (d1j− e1j); enquanto que no teste log-rank este peso tem

o valor 1, j´a no teste de Peto-Peto o peso ´e wj = ˜S(tj), em que ˜S(tj) corresponde a

uma estimativa da fun¸c˜ao de sobrevivˆencia conjunta, e ´e definida por ˜ S(tj) = Y ti≤tj  1 − di ni+ 1  ,

que ´e semelhante ao estimador de Kaplan-Meier para a amostra conjunta. A variˆancia de UP ´e representada por

VP = k X j=1 h ˜S(tj)i2 υ1j,

onde υ1j ´e dada por (2.13) e a estat´ıstica de teste ´e WP = U2 P VP ,

que, sob a hip´otese H0, tem distribui¸c˜ao assint´otica Qui-quadrado com 1 grau de

liberdade (χ2 1).

A hip´otese H0 ´e rejeitada para valores grandes da estat´ıstica, ou seja, para

WP > χ21−α.

Notemos que tanto o teste log-rank como o teste de Peto-Peto fazem parte de uma classe de testes sugerida por Tarone e Ware (1977). Nesta classe de testes, a estat´ıstica de teste ´e dada por

n Pk j=1wj(d1j − e1j) o2 Pk j=1w2j υ1j

em que υ1j representa a variˆancia condicional de d1j.

Para cada teste nesta classe, wj representa um determinado peso, em cada instante

de morte tj, nomeadamente

• wj = 1, j = 1, 2, ...., k Teste log-rank

• wj = ˜S(tj), j = 1, 2, ...., k Teste de Peto-Peto

• wj = nj, j = 1, 2, ...., k Teste de Gehan

Compara¸c˜ao entre mais de dois grupos

O teste log-rank e o teste de Peto-Peto podem ser generalizados de modo a permitir a compara¸c˜ao de trˆes ou mais grupos (g ≥ 3). Define-se analogamente a estat´ıstica U de forma a comparar o n´umero de mortes observadas com o n´umero de mortes esperadas no grupo 1, 2, ...., g − 1. Por extens˜ao de (2.14) e (2.16) obt´em-se

ULr = k X j=1 (drj − erj) , (2.17) UP r = k X j=1 wj(drj− erj) , (2.18) para r = 1, 2, ...., g − 1, e erj = n1jndj

j . Notemos que (2.17) e (2.18) podem ser ex-

O elemento (r, r0) da matriz de covariˆancia para o teste log-rank (VL) e para o

teste de Peto-Peto (VP) ´e dado por

VLrr0 = k X j=1 nrjdj(nj − dj) nj(nk− 1)  δrr0 − nr0j nj  , (2.19) VP rr0 = k X j=1 n2jnrjdj(nj − dj) nj(nk− 1)  δrr0 − nr0j nj  , (2.20)

para r, r0 = 1, 2, ...., g − 1 e onde δrr0 ´e tal que

δrr0 =

  

1 se r = r0,

0 se caso contr´ario. Para cada teste, sob a validade de H0,

H0 : S1(t) = S2(t) = ... = Sg(t) ,∀t

a estat´ıstica de teste ´e dada respectivamente por, U0LV−1L UL,

e

U0PV−1P UP,

com distribui¸c˜ao assint´otica Qui-quadrado com g − 1 graus de liberdade (χ2 g−1).