• Nenhum resultado encontrado

A Análise de Sobrevivência é um ramo da Estatística que estuda o tempo. de vida, ou seja, o tempo que decorre entre um instante inicial bem definido

N/A
N/A
Protected

Academic year: 2021

Share "A Análise de Sobrevivência é um ramo da Estatística que estuda o tempo. de vida, ou seja, o tempo que decorre entre um instante inicial bem definido"

Copied!
105
0
0

Texto

(1)   

(2) .       .             .  

(3) 

(4) .

(5)     

(6)    .  .  !" #$  %&  '  !  . ()  *+.   

(7)   . ,-...

(8) Resumo A An´alise de Sobrevivˆencia ´e um ramo da Estat´ıstica que estuda o tempo de vida, ou seja, o tempo que decorre entre um instante inicial bem definido at´e um acontecimento de interesse. A necessidade de desenvolver uma nova ´area e novas metodologias estat´ısticas tem a ver principalmente com duas motiva¸c˜oes. A primeira ´e que raramente os dados de sobrevivˆencia se distribuem simetricamente, ali´as, na maioria das vezes, s˜ao assim´etricos positivos; por isso, n˜ao ´e razo´avel admitir que sejam normalmente distribu´ıdos. Um outro problema tem a ver com a poss´ıvel presen¸ca de dados censurados, ou seja, quando para alguns indiv´ıduos n˜ao se pode observar a realiza¸c˜ao do acontecimento de interesse durante o estudo; isto pode acontecer, por exemplo, quando o indiv´ıduo ainda estiver vivo no final do estudo ou quando for perdido para o follow up. Neste caso apenas se disp˜oe de uma informa¸c˜ao parcial sobre o tempo de vida desses indiv´ıduos. O objetivo principal desta tese ´e descrever os principais m´etodos n˜ao param´etricos que se encontram nesta ´area da estat´ıstica, ou seja, t´ecnicas que foram desenvolvidas sem fazer nenhuma hip´otese sobre a distribui¸c˜ao do tempo de vida. No primeiro cap´ıtulo desta disserta¸c˜ao apresentam-se os conceitos b´asicos relacionados com o tempo de vida: fun¸c˜ ao de sobrevivˆencia, fun¸c˜ao de risco, tipos de. i.

(9) censura e de truncatura. No segundo e no terceiro cap´ıtulos introduzem-se os principais m´etodos n˜ao param´etricos de estima¸c˜ao, assim como os testes de hip´oteses para a compara¸c˜ao de curvas de sobrevivˆencia. Nos cap´ıtulos 4 e 5 s˜ao abordados dois problemas que se encontram muito frequentemente: a presen¸ca de riscos competitivos e fun¸c˜oes de risco que se cruzam. Finalmente, no u ´ltimo cap´ıtulo ´e apresentada uma an´alise de alguns conjuntos de dados, que permitem ilustrar diferentes situa¸c˜oes que podem surgir no ˆambito da an´alise de sobrevivˆencia, usando o software estat´ıstico R e SPSS.. Palavras-chave: An´alise de sobrevivˆencia, m´etodos n˜ao param´etricos, riscos competitivos.. ii.

(10) Abstract Survival Analysis is an area of Statistics which studies survival time, that is, the time from a well-defined initial instant to an event of interest. The need to develop a new area and new statistical methodologies is mainly related to two reasons. Firstly, survival data are rarely symmetrically distributed; in fact, most of the times, data are asymmetrically positive and, for this reason, it is not appropriate to admit that they are normally distributed. Secondly, there is the possibility of having censored data, when the event of interest cannot be observed for some individuals during the study. For example, when the individual is still alive at the end of the study or he is lost for the follow up. In this case, we have only a partial information about the survival time of these individuals. The main objective of this thesis is to describe the most important non parametric methods in this area of Statistics, that is, techniques which were developed without making any hypothesis about the distribution of the survival time. The first chapter shows the basic concepts related to survival time: survival function, hazard function, types of censoring and truncation. In the second and third chapters, non parametric estimating methods are described, and also hypothesis tests to compare survival curves. Chapters 4 and 5 deal with two very common. iii.

(11) problems: competing risks and crossing hazard functions. Finally, the last chapter presents an analysis of some data sets using the statistical software R and SPPS, in order to illustrate different situations arising in the Survival Analysis field.. Keywords: Survival analysis, non parametric methods, competing risks.. iv.

(12) Conte´ udo. 1 Conceitos e defini¸ co ˜es b´ asicas. 1. 1.1. Fun¸c˜ao de sobrevivˆencia . . . . . . . . . . . . . . . . . . . . .. 1. 1.2. Fun¸c˜ao de risco . . . . . . . . . . . . . . . . . . . . . . . . . .. 2. 1.3. Rela¸c˜oes entre as fun¸c˜oes . . . . . . . . . . . . . . . . . . . .. 4. 1.4. Vida residual m´edia . . . . . . . . . . . . . . . . . . . . . . .. 5. 1.5. Quantis do tempo de vida . . . . . . . . . . . . . . . . . . . .. 6. 1.6. Censura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 6. 1.6.1. Censura `a direita . . . . . . . . . . . . . . . . . . . . .. 6. 1.6.2. Censura `a esquerda . . . . . . . . . . . . . . . . . . . .. 7. 1.6.3. Censura intervalar . . . . . . . . . . . . . . . . . . . .. 8. 1.6.4. Censura n˜ao informativa . . . . . . . . . . . . . . . . .. 8. Truncatura . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 9. 1.7.1. Truncatura `a esquerda . . . . . . . . . . . . . . . . . .. 9. 1.7.2. Truncatura `a direita . . . . . . . . . . . . . . . . . . .. 9. 1.7. 2 Estima¸ c˜ ao n˜ ao param´ etrica pontual e intervalar 2.1. 11. Estimador de Kaplan-Meier . . . . . . . . . . . . . . . . . . .. 11. 2.1.1. 14. Estimativa da variˆancia . . . . . . . . . . . . . . . . .. v.

(13) 2.2. Estimador de Nelson-Aalen . . . . . . . . . . . . . . . . . . .. 16. 2.3. Estimativa do valor m´edio e dos quantis do tempo de vida . .. 17. 2.4. Intervalos de confian¸ca para a fun¸c˜ao de sobrevivˆencia . . . .. 18. 2.5. Intervalos de confian¸ca para o valor m´edio e os quantis . . . .. 22. 3 Testes de hip´ oteses. 24. 3.1. Teste log-rank . . . . . . . . . . . . . . . . . . . . . . . . . . .. 24. 3.2. Teste de Gehan . . . . . . . . . . . . . . . . . . . . . . . . . .. 27. 3.3. O teste log-rank e a proporcionalidade dos riscos . . . . . . .. 29. 3.4. Teste de Tarone-Ware . . . . . . . . . . . . . . . . . . . . . .. 31. 3.5. Outros testes . . . . . . . . . . . . . . . . . . . . . . . . . . .. 32. 3.6. Testes estratificados . . . . . . . . . . . . . . . . . . . . . . .. 33. 3.7. Teste log-rank para tendˆencia . . . . . . . . . . . . . . . . . .. 34. 4 Compara¸ c˜ ao de duas fun¸ c˜ oes de risco que se cruzam. 36. 4.1. Introdu¸c˜ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 37. 4.2. Testes de Renyi . . . . . . . . . . . . . . . . . . . . . . . . . .. 38. 4.3. Teste de Cramer-Von Mises para dados censurados . . . . . .. 39. 4.4. Teste t para dados censurados . . . . . . . . . . . . . . . . . .. 40. 4.5. Outros m´etodos utilizados . . . . . . . . . . . . . . . . . . . .. 42. 5 Riscos Competitivos. 45. 5.1. Introdu¸c˜ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 45. 5.2. Defini¸c˜oes b´asicas . . . . . . . . . . . . . . . . . . . . . . . . .. 46. 5.3. Estima¸c˜ao da fun¸c˜ao de incidˆencia cumulativa . . . . . . . . .. 49. 5.4. Estima¸c˜ao intervalar . . . . . . . . . . . . . . . . . . . . . . .. 53. vi.

(14) 5.5. Testes de hip´oteses . . . . . . . . . . . . . . . . . . . . . . . .. 55. 5.5.1. Teste de Gray . . . . . . . . . . . . . . . . . . . . . . .. 55. 5.5.2. Teste de Pepe e Mori . . . . . . . . . . . . . . . . . . .. 57. 6 Exemplos de aplica¸ c˜ ao. 59. 6.1. Progn´ostico para mulheres com cancro da mama . . . . . . .. 6.2. An´alise de sobrevivˆencia para pacientes afetados por cancro g´astrico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 6.3. 59. 65. Tempo at´e `a primeira infe¸c˜ao para pacientes com insuficiˆencia renal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 70. Bibliografia. 73. A Gr´ aficos e tabelas. 76. vii.

(15) Cap´ıtulo 1. Conceitos e defini¸c˜ oes b´ asicas O objetivo principal da an´alise de sobrevivˆencia ´e analisar e modelar tempos at´e `a realiza¸c˜ao de um acontecimento de interesse, como, por exemplo, tempos at´e `a falha de uma componente el´etrica ou tempos at´e `a reca´ıda de uma dada doen¸ca. Nalguns casos pode acontecer que o tempo de ”vida” n˜ ao seja observado pelo investigador, porque um indiv´ıduo ainda pode estar vivo depois do limite de observa¸c˜ao ou porque saiu prematuramente do estudo. Neste cap´ıtulo v˜ ao ser apresentadas, al´em das principais no¸c˜oes indispens´aveis para desenvolver a teoria, tamb´em as diferentes formas de censura e truncatura que podem surgir quando, por v´arias raz˜oes, n˜ao se disp˜oe de uma informa¸c˜ao completa sobre a dura¸c˜ao da vida dos indiv´ıduos.. 1.1. Fun¸ c˜ ao de sobrevivˆ encia. Seja T uma vari´avel aleat´oria absolutamente cont´ınua e n˜ao negativa, cujos valores representam os tempos de vida dos indiv´ıduos que pertencem a uma dada popula¸c˜ao homog´enea. A fun¸c˜ao de sobrevivˆencia ´e definida como S(t) = P (T > t) = 1 − F (t) , 1. t≥0. (1.1).

(16) onde F ´e a fun¸c˜ao de distribui¸c˜ao de T . S(t) ´e portanto a probabilidade do tempo de vida ser maior que t. Trata-se de uma fun¸c˜ao mon´ otona n˜ao crescente tal que lim S(t) = 0.. S(0) = 1 e. 1.2. t→+∞. Fun¸ c˜ ao de risco. A fun¸c˜ao de risco representa o risco de morte num dado instante t e pode ser considerada como a probabilidade aproximada de um indiv´ıduo morrer em t condicionada `a sobrevivˆencia at´e esse instante. De uma maneira mais formal tem-se P (t ≤ T < t + dt | T ≥ t) . dt→0 dt. h(t) = lim. (1.2). Uma fun¸c˜ao de risco satisfaz as seguintes propriedades h(t) ≥ 0 ,. Z. +∞. h(t)dt = +∞. 0. Ao contr´ario do que se passa para a fun¸c˜ao de sobrevivˆencia, existem v´arios comportamentos poss´ıveis para a fun¸c˜ao de risco. De facto, a fun¸c˜ao de risco pode ser Crescente: corresponde a uma popula¸c˜ao sujeita a um envelhecimento gradual, ou seja, quando a probabilidade de morrer num determinado instante, para os indiv´ıduos que sobreviveram at´e esse instante, aumenta com o tempo.. 2.

(17) Decrescente: trata-se de uma situa¸c˜ao menos frequente e acontece quando h´a uma elevada probabilidade inicial de morte e o risco diminui com o tempo. Isto acontece por exemplo em pacientes sujeitos a transplante. Constante: quando o tempo de vida segue uma distribui¸c˜ao exponencial. Bathtub-shaped: modelo adequado para popula¸c˜oes seguidas desde o nascimento at´e a morte reais, onde os indiv´ıduos tˆem um alto risco de morte nos primeiros instantes de vida para depois decrescer, estabilizarse e logo continuar a aumentar devido ao normal processo de envelhecimento. Hump-shaped: quando o risco de morte tende a aumentar inicialmente e a diminuir depois de um determinado instante. Pode-se encontrar esta situa¸c˜ao nos pacientes sujeitos a cirurgia, onde existe um elevado risco de morte que ´e crescente nos primeiros tempos depois da opera¸c˜ao, devido a hemorragias ou infe¸c˜oes, diminuindo com o passar do tempo. Definimos tamb´em a fun¸c˜ao de risco cumulativa dada por H(t) =. Z. t. h(u)du 0. 3. (1.3).

(18) 1.3. Rela¸ c˜ oes entre as fun¸ c˜ oes. A partir de (1.1) e (1.2) podem-se facilmente obter algumas rela¸c˜oes interessantes entre a fun¸c˜ao de risco e a fun¸c˜ao de sobrevivˆencia. Da defini¸c˜ao de probabilidade condicional tem-se que P (t ≤ T < t + dt | T ≥ t) =. F (t + dt) − F (t) P (t ≤ T < t + dt) = . P (T ≥ t) S(t). A fun¸c˜ao de risco pode ent˜ao ser escrita como h(t) = lim. dt→0. Mas limdt→0. n. F (t+dt)−F (t) dt. o. . F (t + dt) − F (t) dt. . 1 . S(t). ´e por defini¸c˜ao a derivada da fun¸c˜ao F (t) em. ordem a t, que ´e a correspondente fun¸c˜ao densidade de probabilidade f (t). Por isso temos h(t) =. f (t) . S(t). (1.4). Al´em disso, segue-se que h(t) = −. d {log S(t)} . dt. (1.5). Integrando entre 0 e t ambos os membros de (1.5) tem-se −. Z. t. h(u)du = log S(t). 0. Logo,   Z t h(u)du . S(t) = exp −. (1.6). 0. Finalmente, usando a (1.3) obt´em-se S(t) = exp {−H(t)}.. 4. (1.7).

(19) 1.4. Vida residual m´ edia. A vida residual m´edia ´e uma fun¸c˜ao de grande interesse na an´alise de sobrevivˆencia e representa, para indiv´ıduos de idade t, o tempo m´edio de vida ´ portanto o valor m´edio do tempo de vida residual. que lhes resta viver. E A vida residual m´edia ´e definida da seguinte forma mrl(t) = E (T − t | T > t) . Tem-se obviamente que mrl(0) = µ = E(T ). Sendo T uma vari´avel aleat´oria n˜ao negativa e absolutamente cont´ınua a fun¸c˜ao vida residual m´edia pode ser escrita como mrl(t) =. R∞ t. (u − t)f (u)du . S(t). Integrando por partes no numerador e tendo em conta que S(∞) = 0 obt´emse mrl(t) =. R∞ t. S(u)du S(t). Desta u ´ltima rela¸c˜ao e do facto que S(0) = 1 segue que µ = E(T ) = mrl(0) =. Z. ∞. (1.8). S(u)du.. 0. Da mesma forma podemos relacionar a variˆancia de T com a fun¸c˜ao de R∞ sobrevivˆencia. Tendo em conta que E(T 2 ) = 0 u2 f (u)du tem-se var(T ) = 2. Z. ∞. 0. t S(t)dt −. 5. Z. ∞. 0. S(u)du. 2. ..

(20) 1.5. Quantis do tempo de vida. Define-se quantil de probabilidade p da distribui¸c˜ao de T como sendo o valor tp tal que S(tp ) = 1 − p. A mediana do tempo de vida ´e ent˜ao o quantil de probabilidade 0.5, ou seja, o valor t0.5 tal que S(t0.5 ) = 0.5 A mediana ´e a medida mais adequada para carecterizar a localiza¸c˜ao da distribui¸c˜ao do tempo de vida, visto esta ser geralmente assim´etrica positiva.. 1.6. Censura. Como j´a foi mencionado na introdu¸c˜ao, a censura ´e um dos aspetos mais importantes da an´alise de sobrevivˆencia. H´a presen¸ca de censura quando n˜ao ´e observada a realiza¸c˜ao do acontecimento de interesse durante o per´ıodo de observa¸c˜ao. Em seguida, vamos apresentar os tipos de censura mais usuais, assim como v´ arios exemplos.. 1.6.1. Censura ` a direita. Neste caso a u ´nica informa¸c˜ao de que se disp˜oe ´e que o tempo de vida do indiv´ıduo excede um determinado valor. Apresentamos trˆes tipos de censura `a direita: Censura de tipo I: o acontecimento ´e observado s´o se ocorrer antes de um instante pr´e-determinado t0 (limite de observa¸c˜ao). Desta 6.

(21) maneira, a cada indiv´ıduo em estudo ´e associado um par de vari´aveis (X, δ), onde δ toma o valor 0 se o tempo de vida T for maior que t0 , ou 1 se o acontecimento de interesse for observado antes de t0 . umero de mortes observadas ´e Assim sendo X = min {T, t0 } e o n´ aleat´orio. Pode acontecer tamb´em que os indiv´ıduos sejam sujeitos a per´ıodos de observa¸ca˜o t1 , t2 . . . , tn diferentes; neste caso fala-se de censura m´ ultipla. Censura de tipo II: este tipo de censura surge quando o estudo decorre at´e `a morte dos primeiros r indiv´ıduos, com r < n, sendo os outros n − r indiv´ıduos tratados como censurados. Neste caso todos os indiv´ıduos entram no estudo no mesmo instante. Ao contr´ario do que acontece na censura de tipo I, aqui o tempo de dura¸c˜ao do estudo ´e aleat´orio. Experiˆencias que envolvem este tipo de censura s˜ao utilizadas, por exemplo, para testar a vida de equipamentos eletr´onicos onde, por vezes, ´e preciso poupar tempo e dinheiro. Censura aleat´ oria: os indiv´ıduos entram no estudo de forma aleat´oria; em ensaios cl´ınicos, por exemplo, de acordo com a data de diagn´ostico. Assim sendo, se o estudo terminar numa data pr´e-fixada, o tempo decorrido desde que o indiv´ıduo entra em estudo at´e o final deste ´e aleat´orio.. 1.6.2. Censura ` a esquerda. O tempo de vida associado a um indiv´ıduo da amostra ´e considerado censurado `a esquerda se for menor que o correspondente tempo registado no 7.

(22) estudo. Isto quer dizer que o acontecimento de interesse j´a ocorreu antes da u ´ltima observa¸c˜ao registada. Assim como no caso anterior, a cada indiv´ıduo ´e associado um par de vari´aveis (X, ε), onde X ´e igual ao tempo de vida T se este for observado e ε indica quando isto acontece (ε = 1) ou n˜ao (ε = 0).. 1.6.3. Censura intervalar. Um tipo de censura mais geral surge quando o acontecimento de interesse ocorre entre dois instantes observados. Uma censura deste tipo manifesta-se, por exemplo, em ensaios cl´ınicos ou estudos longitudinais onde os pacientes s˜ao sujeitos a controlos peri´odicos e a u ´nica informa¸c˜ao que se tem ´e que o tempo de vida cai num certo intervalo de tempo.. 1.6.4. Censura n˜ ao informativa. Este tipo de censura manifesta-se quando existe independˆencia entre o mecanismo de morte e de censura. Em outras palavras, os indiv´ıduos que s˜ ao censurados no instante t tˆem que ser representativos de todos os indiv´ıduos que sobvreviveram at´e esse instante. Por exemplo, os indiv´ıduos que s˜ao perdidos para o follow up tˆem que ser censurados por causas relacionadas com efeitos secund´arios do tratamento e n˜ao por terem um risco de morte muito elevado ou muito baixo. De um ponto de vista mais estat´ıstico podese dizer que existe censura n˜ ao informativa quando a distribui¸c˜ao do tempo de censura n˜ao depende do parˆametro θ que indexa a distribui¸c˜ao do tempo de vida. A hip´otese de censura n˜ao informativa revela-se crucial na descri¸c˜ao dos principais m´etodos da An´alise de Sobrevivˆencia.. 8.

(23) 1.7. Truncatura. Fala-se de truncatura quando apenas s˜ao estudados os indiv´ıduos cujo tempo de vida est´a contido num certo intervalo (YL , YR ). Se o acontecimento de interesse n˜ao cair dentro deste intervalo, o indiv´ıduo n˜ao ´e considerado no estudo. Ao contr´ario da censura, onde se disp˜oe de dados parciais, neste caso, o investigador n˜ao recebe nenhuma informa¸c˜ao sobre esse indiv´ıduo e nem se apercebe da sua existˆencia.. 1.7.1. Truncatura ` a esquerda. Quando YR = +∞ fala-se de truncatura `a esquerda e s´o s˜ao inclu´ıdos no estudo os indiv´ıduos cujo tempo de vida excede o tempo de truncatura YL . Na ´area biom´edica, YL pode coincidir, por exemplo, com a ocorrˆencia de um acontecimento interm´edio tal como a reca´ıda de uma dada doen¸ca. Todos os indiv´ıduos que morrem antes da reca´ıda s˜ao automaticamente exclu´ıdos sem deixar nenhuma informa¸c˜ao. O instante de truncatura YL ´e, por vezes, designado por tempo de entrada tardia, devido ao facto de que os indiv´ıduos s˜ao seguidos a partir deste instante posterior ao instante inicial ”natural” at´e `a sua morte ou censura. A truncatura `a esquerda ´e o tipo de truncatura mais difuso nos estudos de an´alise de sobrevivˆencia.. 1.7.2. Truncatura ` a direita. Da mesma forma, quando YL = 0 fala-se de truncatura `a direita e consideramse apenas os indiv´ıduos cujo tempo de vida ´e menor ou igual a um dado instante conhecido YR . Truncatura deste tipo encontra-se, por exemplo, 9.

(24) quando se quer estudar o tempo at´e `a ocorrˆencia de certa doen¸ca e os dados provˆem de um registo de casos confirmados da doen¸ca (registo oncol´ogico, registo de doentes com SIDA).. 10.

(25) Cap´ıtulo 2. Estima¸c˜ ao n˜ ao param´ etrica pontual e intervalar Um dos primeiros passos para analisar conjuntos de dados de sobrevivˆencia consiste em resumir numericamente e representar graficamente os tempos de vida dos indiv´ıduos que pertencem a uma dada popula¸c˜ao. Neste cap´ıtulo v˜ao ser apresentadas as principais metodologias n˜ao param´etricas para obter estimativas da fun¸c˜ao de sobrevivˆencia, da fun¸c˜ao de risco e de outras quantidades com elas relacionadas.. 2.1. Estimador de Kaplan-Meier. Vamos supor inicialmente que dispomos de uma u ´nica amostra de tempos de vida onde nenhuma das observa¸c˜oes ´e censurada. Neste caso a fun¸c˜ao de sobrevivˆencia S(t) pode ser estimada atrav´es da fun¸c˜ao de sobrevivˆencia emp´ırica , isto ´e umero de indiv´ıduos com tempo de vida ≥ t ˆ = n´ S(t) . n´ umero de indiv´ıduos na amostra. (2.1). Esta fun¸c˜ao ´e igual a 1 para valores de t inferiores ao primeiro instante de morte, e igual a 0 depois do u ´ltimo. Trata-se de uma fun¸c˜ao em escada e ´e 11.

(26) constante entre dois instantes de morte consecutivos. Este estimador n˜ao pode ser utilizado quando a amostra cont´em dados censurados, porque um tempo censurado antes de um instante t0 n˜ao d´a informa¸c˜ao para estimar a fun¸c˜ao de sobrevivˆencia em t0 . Vamos ent˜ao apresentar o m´etodo de Kaplan-Meier (1958) para estimar a fun¸c˜ao de sobrevivˆencia na presen¸ca de dados censurados `a direita. Pode-se resumir nos passos seguintes 1. Consideramos uma amostra de dimens˜ao n e sejam t(1) , t(2) , . . . , t(r) os instantes de morte distintos e ordenados com r ≤ n. Seja t(0) o instante inicial do estudo. Vamos considerar os seguintes intervalos   t(j) , t(j+1) com j = 1, . . . , r e t(r+1) = +∞ 2. Seja nj o n´ umero de indiv´ıduos que est˜ao vivos imediatamente antes umero de mortes ocorridas em t(j) . de t(j) e seja dj o n´   3. O intervalo de tempo t(j) , t(j+1) inclui um u ´nico instante de morte.. Por isso, a probabilidade de um indiv´ıduo morrer nesse intervalo ´e estimada por. dj nj .. A correspondente probabilidade de sobreviver para. al´em desse intervalo ´e estimada por. nj −dj nj .. 4. Supondo que as mortes ocorrem independentemente umas das outras, a fun¸c˜ao de sobrevivˆencia estimada num ponto t do intervalo   t(k) , t(k+1) ´e a probabilidade estimada de sobreviver para al´em do. instante t(k) , ou seja, a probabilidade de sobreviver para al´em do in  tervalo t(k) , t(k+1) e de todos os intervalos precedentes. A estimativa 12.

(27) de Kaplan-Meier da fun¸c˜ao de sobrevivˆencia ´e ent˜ao dada por ˆ = S(t).  k  Y nj − d j nj. (2.2). j=1. ˆ = 1 para t < t(1) . com t(k) ≤ t < t(k+1) , k = 1, 2, . . . , r e S(t) ˆ n˜ao ´e definida Podemos notar que se a maior observa¸c˜ao τ for censurada, S(t) ˆ = S(t ˆ (r) ) para t(r) ≤ t ≤ τ . Caso contr´ario, se o para t > τ ; neste caso S(t) maior tempo registado for um instante de morte (t(r) ) tem-se que nr = dr e ˆ = 0 para t ≥ t(r) . S(t) O gr´afico da estimativa de Kaplan-Meier da fun¸c˜ao de sobrevivˆencia ´e uma fun¸c˜ao em escada, decrescente, onde as probabilidades estimadas s˜ao constantes entre instantes de morte consecutivos. Se a amostra n˜ao tivesse tempos de vida censurados, ent˜ao na rela¸ca˜o (2.2) nj − dj = nj+1 para j = 1, 2, . . . , k e a mesma fun¸c˜ao se poderia escrever ˆ = n2 · n3 · . . . · nk+1 . S(t) n1 n 2 nk Isto ´e ˆ = nk+1 S(t) n1 ˆ = 1 para t < t(1) e S(t) ˆ = 0 para t ≥ t(r) . para k = 1, 2, . . . , r − 1 com S(t) Note-se que n1 ´e o n´ umero de indiv´ıduos em risco imediatamente antes do primeiro instante de morte (ou seja, o n´ umero total de indiv´ıduos presentes na amostra), e nk+1 ´e o n´ umero de indiv´ıduos com tempos de sobrevivˆencia ˆ maiores ou iguais a t(k+1) . Tem-se ent˜ao que, na ausˆencia de censura, S(t) ´e simplesmente a fun¸c˜ao de sobrevivˆencia emp´ırica definida em (2.1). A estimativa de Kaplan-Meier ´e ent˜ao uma generaliza¸c˜ao da fun¸c˜ao de sobre13.

(28) vivˆencia emp´ırica para dados censurados. A partir da rela¸c˜ao (1.7) temos tamb´em que H(t) = − log S(t).. (2.3). A fun¸c˜ao de risco cumulativa pode ent˜ao ser estimada por ˆ H(t) =−. k X. log. j=1. . nj − d j nj. . para t(k) ≤ t < t(k+1) , k = 1, 2, . . . , r , onde t(1) , t(2) , . . . , t(r) s˜ao os instantes de morte ordenados.. 2.1.1. Estimativa da variˆ ancia. Vamos agora calcular uma estimativa da variˆancia do estimador de KaplanMeier, elemento essencial para avaliar a precis˜ao do estimador e instrumento u ´til para a constru¸c˜ao de intervalos de confian¸ca. Consideramos o estimador de Kaplan-Meier da fun¸c˜ao de sobrevivˆencia definido em (2.2) . Ent˜ao tem-se ˆ = log S(t). k X. log. j=1. .  nj − d j , nj. ˆ ´e dada por e a variˆancia do logaritmo de S(t)    k i X nj − d j ˆ var log S(t) = var log nj h. (2.4). j=1. Seja Sj a vari´avel aleat´oria que representa o n´ umero de indiv´ıduos que sobre  vivem para al´em do intervalo t(j) , t(j+1) . Podemos supor que esta vari´avel. segue uma distribui¸c˜ao binomial de parˆametros nj e pj onde pj ´e a ver-. dadeira probabilidade de sobreviver para al´em desse intervalo. O n´ umero 14.

(29)   observado de indiv´ıduos que sobrevivem para al´em de t(j) , t(j+1) ´e dado por nj − dj .. Tem-se E(Sj ) = nj pj Sendo pˆj =. Sj nj. e. var(Sj ) = nj pj (1 − pj ).. obt´em-se que. E(ˆ pj ) = pj. e. var(ˆ pj ) =. nj pj (1 − pj ) pj (1 − pj ) = . 2 nj nj. A variˆancia de pˆj pode ent˜ ao ser estimada por var(ˆ ˆ pj ) = com p∗j =. p∗j (1 − p∗j ) nj. (2.5). nj −dj nj .. Com o objetivo de obter a variˆancia de log pˆj vamos usar um m´etodo, designado por m´etodo delta, que nos permite aproximar a variˆancia de uma fun¸c˜ao de uma vari´avel aleat´ oria, isto ´e var {g(X)} ≈. .  dg(X) 2 var(X).

(30) dX

(31) X=E(X). Utilizando esta u ´ltima rela¸c˜ao obt´em-se var {log pˆj } ≈. 1 var(ˆ pj ) p2j. e recorrendo a (2.5) temos var ˆ {log pˆj } ≈. (1 − p∗j ) dj . = ∗ nj pj nj (nj − dj ). Assim sendo, considerando a rela¸c˜ao (2.4) podemos escrever k o X ˆ var ˆ log S(t) ≈. n. j=1. 15. dj . nj (nj − dj ). (2.6).

(32) Aplicando mais uma vez (2.6) tem-se n o ˆ var log S(t) ≈. o n 1 ˆ S(t) . var [S(t)]2. Chegamos assim finalmente ` a f´ormula de Greenwood dada por k o X 2 ˆ ˆ var ˆ S(t) ≈ [S(t)]. n. j=1. dj nj (nj − dj ). (2.7). para t(k) ≤ t < t(k+1) .. 2.2. Estimador de Nelson-Aalen. Uma maneira alternativa para estimar a fun¸c˜ao de risco cumulativa consiste em utilizar o estimador de Nelson-Aalen, dado por ˜ H(t) =. k X dj nj. (2.8). j=1. para t(k) ≤ t < t(k+1) , k = 1, 2, . . . , r. Trata-se da soma das probabilidades estimadas de morte desde o primeiro at´e o k-´esimo intervalo considerado. Consequentemente a fun¸ca˜o de sobrevivˆencia pode ser estimada, com base em (1.7), da seguinte forma ˜ = S(t). k Y. j=1.  dj . exp − nj . (2.9). ˜ S(t) ´e designado por estimador de Breslow da fun¸c˜ao de sobrevivˆencia. Pode-se notar que a estimativa de Kaplan-Meier ´e uma aproxima¸c˜ao de 1 ordem desta. Para mostrar isso consideramos o desenvolvimento em s´erie de Taylor da fun¸c˜ao exponencial e−x = 1 − x +. x 2 x3 − + ..., 2! 3!. 16.

(33) que ´e aproximadamente igual a 1 − x quando x for pequeno. Tem-se ent˜ao que . dj exp − nj. . ≈1−. dj nj − d j = nj nj. enquanto dj for pequeno relativamente a nj . Assim sendo o estimador de Kaplan-Meier em (2.2) ´e aproximado pelo estimador de Nelson-Aalen dado pela rela¸c˜ao (2.9). Sendo e−x ≥ 1 − x para todos os valores x, a estimativa de Nelson-Aalen da fun¸c˜ao de sobrevivˆencia ser´a sempre maior que a correspondente estimativa de Kaplan-Meier para todos os instantes considerados; contudo, as duas estimativas s˜ao muito pr´oximas, sobretudo para tempos relativamente pequenos, ou seja, enquanto h´a muitos indiv´ıduos em risco.. 2.3. Estimativa do valor m´ edio e dos quantis do tempo de vida. Uma estimativa para o tempo m´edio de vida, definido em (1.8), pode-se facilmente calcular atrav´es do estimador de Kaplan-Meier da fun¸c˜ao de sobrevivˆencia. Corresponde a calcular a ´area abaixo do gr´afico deste estimador, fazendo µ ˆ=. Z. ∞. ˆ S(t)dt.. 0. Sendo t(1) , t(2) , . . . , t(r) os instantes de morte, tem-se µ ˆr =. r X i=1.  ˆ (i−1) ) t(i) − t(i−1) , S(t. (2.10). ˆ (0) ) = 1 e t(0) = 0. Esta estimativa ´e apropriada s´o quando a maior onde S(t observa¸c˜ao corresponde a um tempo de vida, sendo o estimador de KaplanMeier, caso contr´ario, definido at´e `a maior observa¸c˜ao censurada. De uma 17.

(34) forma geral pode-se escrever ˆ (r) )(τ − t(r) ), ˆr + (1 − δτ )S(t µ ˆτ = µ. (2.11). onde τ ´e a maior observa¸c˜ao da amostra, δτ = 1 quando τ corresponde a um tempo de vida (e neste caso τ = t(r) e µ ˆτ = µ ˆr ) e δτ = 0 quando τ ´e uma observa¸c˜ao censurada. O estimador de Kaplan-Meier pode ser utilizado tamb´em para calcular estimativas dos quantis da distribui¸c˜ao do tempo de vida. De uma maneira geral tem-se n o  tˆp = min t(i) : Sˆ t(i) ≤ 1 − p .. (2.12). No caso particular em que a fun¸c˜ao de sobrevivˆencia estimada ´e exatamente   igual a 1 − p para um certo intervalo t(i) , t(i+1) , Collett [2] sugere estimar. o correspondente quantil pelo ponto m´edio desse intervalo, isto ´e tˆp =. t(i) + t(i+1) . 2. Quando p = 0.5 obtemos a estimativa da mediana do tempo de vida.. 2.4. Intervalos de confian¸ ca para a fun¸ c˜ ao de sobrevivˆ encia. Nesta sec¸c˜ao vamos usar os estimadores j´a introduzidos anteriormente para calcular intervalos de confian¸ca da fun¸c˜ao de sobrevivˆencia. Uma vez fixado um n´ıvel de confian¸ca 1 − α, espera-se que o verdadeiro valor da fun¸c˜ao de sobrevivˆencia, num instante pr´e-determinado t0 , caia nesse intervalo. O intervalo de confian¸ca mais utilizado no software estat´ıstico para a fun¸c˜ao 18.

(35) de sobrevivˆencia num instante t0 ´e dado por !. ˆ 0 ) − z1− α S(t 2. r. n. ˆ 0) var ˆ S(t. o. ˆ 0 ) + z1− α , S(t 2. r. n. ˆ 0) var ˆ S(t. o. ". ,. onde z1− α2 ´e o quantil de probabilidade 1 − α2 da distribui¸c˜ao normal padr˜ao n o ˆ 0 ) ´e a estimativa da variˆancia do estimador de Kaplan-Meier no e var ˆ S(t ponto t0 dada pela f´ormula de Greenwood (2.7).. Podem ser constru´ıdos intervalos de confian¸ca com uma maior precis˜ao ˆ 0 ). Os limites de confian¸ca asatrav´es de transforma¸c˜oes adequadas de S(t sim obtidos podem ser depois re-transformados para obter o intervalo para S(t0 ). Uma primeira possibilidade ´e considerar uma log-transforma¸c˜ao da ˆ 0 )}. A variˆancia fun¸c˜ao de risco cumulativa, ou seja, Tˆ(t0 ) = log {− log S(t ˆ 0 ) pode ser calculada utilizando aproximada deste valor transformado de S(t a rela¸c˜ao (2.6). Como j´a vimos anteriormente k o X ˆ var ˆ log S(t) ≈. n. dj . nj (nj − dj ). j=1. Usando a rela¸c˜ao (2.6) tem-se var[log(−X)] ≈ ˆ 0 ) tem-se e com X = log S(t .  var ˆ Tˆ(t0 ) ≈ n. .  1 var(X) ,

(36) X 2

(37) X=E(X) 1. ˆ 0) log S(t. o2. k X j=1. dj . nj (nj − dj ). Denotando com (Tl , Tu ) e (Sl , Su ) os intervalos de confian¸ca para T (t0 ) e S(t0 ) respetivamente, obt´em-se Tu = Tˆ(t0 ) + z1− α2 19. r.   var ˆ Tˆ(t0 ).

(38) . . . . ˆ 0) log (− log (Su )) = log − log S(t. . + z1− α2. !. ˆ 0 ) exp z1− α − log (Su ) = − log S(t 2 ˆ 0) Su = S(t. r.   var ˆ Tˆ(t0 ). . var ˆ Tˆ(t0 ).   q exp z1− α var ˆ (Tˆ(t0 )) 2. r. . ". .. Da mesma forma pode-se calcular o limite inferior dado por ˆ 0) Sl = S(t. .  −1 q exp z1− α var ˆ (Tˆ(t0 )) 2. e o intervalo que assim se obt´em ´e dado por. . onde θ = exp z1− α2. r.  . ˆ 0 )θ ˆ 0 )1/θ , S(t S(t. var ˆ Tˆ(t0 ). . . . Note-se que este intervalo, ao contr´ario. do anterior, n˜ao ´e sim´etrico relativamente `a estimativa da fun¸c˜ao de sobrevivˆencia no ponto t0 . O u ´ltimo intervalo que vamos considerar obt´em-se atrav´es de uma transforma¸c˜ao da fun¸c˜ao de sobrevivˆencia mais complicada que prevˆe o uso da raiz quadrada do arco seno, isto ´e .  sin2  max .  sin2  min.       .   ˆ 0 )1/2 − 0.5 × z1− α 0, arcsin S(t 2.    .   π ˆ 0 )1/2 + 0.5 × z1− α , arcsin S(t 2  2  . r n o ˆ 0) ! var ˆ S(t ˆ 0) S(t.  "1/2    ˆ 0) S(t ,  ˆ 0)  1 − S(t  . r n o ˆ 0) ! var ˆ S(t ˆ 0) S(t.  "1/2    ˆ 0) S(t .  ˆ 0)  1 − S(t  . Os intervalos que temos considerados at´e agora s´o s˜ao v´alidos para valores fixados de t. Nalguns casos pode ser interessante calcular bandas de 20.

(39) confian¸ca que possam ”garantir”, com um dado n´ıvel de confian¸ca, que a fun¸c˜ao de sobrevivˆencia caia dentro delas para todos os valores t pertencentes a um dado intervalo. Por outras palavras, queremos encontrar duas fun¸c˜oes aleat´orias L(t) e U (t) tais que P [L(t) ≤ S(t) ≤ U (t) para qualquer t : tL ≤ t ≤ tU ] = 1 − α. Chama-se banda de confian¸ca para S(t) de n´ıvel 1 − α ao dito intervalo [L(t), U (t)]. Vamos agora apresentar um m´etodo para construir estas bandas.. Este. m´etodo foi proposto por Nair [12] e permite calcular bandas de confian¸ca que s˜ao proporcionais aos respetivos intervalos ”ponto a ponto” analisados anteriormente. Estas bandas s˜ao designadas por EP bands. Consideramos dois instantes tL < tU tais que tL seja maior ou igual ao mais pequeno instante de morte observado e tU menor ou igual ao maior tempo registado. Definem-se n o ˆ L) n var ˆ S(t   aL = ˆ L )} var ˆ {S(t 2 ˆ {S(tL )} 1 + n ˆ 2. (2.13). {S(tL )}. n. o ˆ U) n var ˆ S(t  . aU = ˆ U )} ˆ {S(t ˆ U )}2 1 + n var {S(t 2 ˆ. (2.14). {S(tU )}. Temos trˆes tipos de bandas, correspondentes aos trˆes intervalos de confian¸ca j´a apresentados, isto ´e Lineares " ! r r o o n n ˆ ˆ + cα (aL , aU ) var ˆ ˆ − cα (aL , aU ) var , S(t) ˆ S(t) ˆ S(t) S(t) 21.

(40) Transforma¸c˜ao logaritmo. . ˆ θ ˆ 1/θ , S(t) S(t). . θ = exp. ,. r  o n   ˆ   S(t) (a , a ) var ˆ c  α L U  ˆ ln S(t) ˆ S(t).   .   . Transforma¸c˜ao arcsine-square root r    o n  ! "1/2  ˆ   S(t) var ˆ     ˆ  S(t) 2 1/2 ˆ , − 0.5 cα (aL , aU ) sin max 0, arcsin S(t)  ˆ ˆ   S(t) 1 − S(t)     .  sin2  min.    π  2  .   ˆ 1/2 + 0.5 cα (aL , aU ) , arcsin S(t). r o n ! ˆ var ˆ S(t) ˆ S(t).  "1/2    ˆ  S(t)   ˆ  1 − S(t)  . onde cα (aL , aU ) s˜ao coeficientes que dependem do n´ıvel de confian¸ca escolhido e das quantidades definidas em (2.13) e (2.14).. 2.5. Intervalos de confian¸ ca para o valor m´ edio e os quantis. Intervalos de confian¸ca para o valor m´edio s˜ao calculados `a custa da variˆancia do estimador definido em (2.11). A variˆancia deste estimador ´e estimada por var(ˆ ˆ µτ ) =. r Z X i=1. τ. ˆ S(t)dt. ti. 2. di . ni (ni − di ). Um intervalo aproximado de 100(1 − α)% de confian¸ca para o valor m´edio ´e dado por µ ˆτ ± z1− α2. p. var(ˆ ˆ µτ ).. (2.15). Intervalos de confian¸ca aproximados para a mediana e os outros quantis podem ser facilmente calculados uma vez que se conhece uma estimativa 22.

(41) da variˆancia destas quantidades. Uma express˜ao para a variˆancia pode ser obtida a partir da rela¸c˜ao (2.6). Temos ent˜ao i. h. ˆ tˆ(p)) ≈ var S(. !. "2 ˆ tˆ(p)) dS( var[tˆ(p)]

(42) dtˆ(p)

(43) tˆ(p)=E (tˆ(p)). (2.16). onde tˆ(p) ´e o estimador do quantil de probabilidade p da distribui¸c˜ao do ˆ tˆ(p)) ´e a estimativa de Kaplan-Meier no ponto tˆ(p). tempo de vida e S( ˆ tˆ(p)) Tem-se agora que − dS( = fˆ(tˆ(p)), ou seja uma estimativa da densidade dtˆ(p). de probabilidade do tempo de vida no ponto tˆ(p). De (2.16) obt´em-se var ˆ tˆ(p) ≈ . . !. 1 ˆ ˆ f (t(p)). "2. i h ˆ tˆ(p)) . var ˆ S(. O desvio padr˜ao de tˆ(p) ´e aproximado ent˜ao por.  se ˆ tˆ(p) ≈. i h 1 ˆ tˆ(p)) , se ˆ S( fˆ(tˆ(p)). (2.17). ˆ tˆ(p)) ´e obtido atrav´es da f´ormula de Greenquanto o desvio padr˜ao de S( enwood (2.7). O intervalo pretendido pode-se escrever nesta forma tˆ(p) ± z1− α2 se{ ˆ tˆ(p)}. (2.18). onde z1− α2 ´e o quantil de probabilidade 1 − α2 da distribui¸c˜ao normal padr˜ao. Trata-se de um intervalo aproximado no sentido em que a probabilidade do intervalo (aleat´orio) conter o verdadeiro valor do quantil n˜ao ´e exatamente 1 − α.. 23.

(44) Cap´ıtulo 3. Testes de hip´ oteses Vamos considerar neste cap´ıtulo o problema da compara¸c˜ao de dois grupos de indiv´ıduos relativamente ao seu padr˜ao de sobrevivˆencia. Queremos testar as seguintes hip´oteses H0 : S1 (t) = S2 (t). vs. H1 : S1 (t) 6= S2 (t). onde Si (t), i = 1, 2 s˜ao as fun¸c˜oes de sobrevivˆencia das duas popula¸c˜oes de onde foram selecionados dois grupos de indiv´ıduos de dimens˜ao m e n respetivamente.. 3.1. Teste log-rank. Para construir este teste come¸camos por considerar o n´ umero de mortes e de indiv´ıduos em risco em cada grupo em estudo. Sejam t(1) , t(2) , . . . , t(r) os instantes de morte distintos do conjunto dos n + m indiv´ıduos. Vamos ent˜ao definir as seguintes quantidades: d1j : n´ umero de mortes no instante t(j) no grupo 1 d2j : n´ umero de mortes no instante t(j) no grupo 2 24.

(45) n1j : n´ umero de indiv´ıduos em risco imediatamente antes de t(j) no grupo 1 umero de indiv´ıduos em risco imediatamente antes de t(j) no n2j : n´ grupo 2 Tem-se ent˜ao que no total e no instante t(j) h´a dj = d1j + d2j mortes e nj = n1j + n2j indiv´ıduos em risco. Podemos resumir a situa¸c˜ao na tabela de contingˆencia seguinte Grupo 1 2 Total. Mortes em t(j) d1j d2j dj. Vivos al´em de t(j) n1j − d1j n2j − d2j nj − d j. Em risco antes de t(j) n1j n2j nj. Consideramos agora a hip´otese nula de que n˜ao haja diferen¸ca no que diz respeito `a sobrevivˆencia entre os dois grupos. Uma maneira para averiguar a validade desta hip´otese ´e considerar a diferen¸ca entre o n´ umero observado de indiv´ıduos que morreram nos dois grupos em cada instante de morte e o n´ umero esperado sob a hip´otese nula. Supondo que os totais marginais da tabela anterior s˜ao fixos e a hip´otese de independˆencia entre os grupos verdadeira, as entradas da tabela s´o s˜ao determinadas a partir do valor d1j . Podemos ent˜ao tratar D1j como sendo uma vari´avel aleat´oria que toma valores entre 0 e min {dj , n1j }. Segue que D1j tem distribui¸c˜ao hipergeom´etrica condicional ao facto de ter fixado as margens da tabela, em que dj  nj −dj  P (D1j = d1j ) =. 25. d1j. n1j −d1j  nj n1j. ..

(46) O valor m´edio da distribui¸ca˜o hipergeom´etrica, neste caso o n´ umero esperado de indiv´ıduos que morrem no instante t(j) no grupo 1, ´e dado por E (D1j ) = e1j =. n1j dj . nj. Sob a hip´otese nula, a probabilidade de morrer no instante t(j) n˜ao depende do grupo e, por isso, ´e dada por. dj nj .. Multiplicando por n1j obtemos assim o. n´ umero esperado de mortes em t(j) no grupo 1. Para obter uma medida do desvio entre o valor observado de D1j e o seu valor esperado vamos considerar a estat´ıstica seguinte UL =. r X j=1. (D1j − e1j ). (3.1). que ´e dada pela diferen¸ca entre o n´ umero total de mortes observadas no grupo 1 e o correspondente n´ umero esperado. O valor m´edio desta estat´ıstica ´e zero sendo E(D1j ) = e1j , e a sua variˆancia ´e simplesmente a soma das variˆancias de cada D1j sendo estas vari´aveis aleat´orias independentes entre si. Tem-se ent˜ao var(D1j ) = v1j =. n1j n2j dj (nj − dj ) . n2j (nj − 1). (3.2). Consequentemente var(UL ) =. r X. v1j = VL .. (3.3). j=1. Pode-se mostrar que UL tem uma distribui¸c˜ao assint´otica normal, e por isso √UL , VL. sob a hip´otese nula, segue uma distribui¸c˜ao assint´otica normal padr˜ao U √ L ∼ N (0, 1). VL. 26.

(47) Tendo o quadrado de uma vari´avel normal padr˜ao uma distribui¸c˜ao quiquadrado com um grau de liberdade, obt´em-se UL2 ∼ χ21 . VL. (3.4). Rejeita-se a hip´otese nula para valores ”grandes” da estat´ıstica de teste. Mais especificamente, uma vez fixado um n´ıvel de significˆancia α, a regi˜ao cr´ıtica ´e dada pelo seguinte intervalo  χ21, 1−α , +∞. onde χ21, 1−α ´e o quantil de probabilidade 1 − α da distrbui¸c˜ao qui-quadrado   com um grau de liberdade, ou seja tal que P χ21 > χ21, 1−α = α. Se n˜ao quisermos fixar o n´ıvel de significˆancia do teste, podemos obter o valor-p dado por   p = P χ21 > χ2obs .. 3.2. Teste de Gehan. Este teste ´e uma generaliza¸c˜ao do teste de Mann-Whitney-Wilcoxon para dados censurados e permite-nos, assim como o teste anterior, testar a hip´otese nula de igualdade das fun¸c˜oes de sobrevivˆencia. Vamos considerar a amostra conjunta dos tempos registados relativos aos dois grupos e associamos a cada tempo ti uma vari´avel indicatriz δi , onde  1 se ti ´e tempo de vida observado δi = 0 se ti ´e uma observa¸c˜ao censurada `a direita Vamos definir agora a seguinte pontua¸c˜ao   +1 se (tk > tj , δj = 1) ou (tk = tj , δk = 0, δj = 1) −1 se (tk < tj , δk = 1) ou (tk = tj , δk = 1, δj = 0) Ukj = U (tk , tj ) =  0 no caso contr´ario 27.

(48) onde estamos a comparar um determinado instante tk fixado com todos os restantes tempos observados. Mais especificamente tem-se: +1 quando o tempo de vida associado ao k-´esimo indiv´ıduo for de certeza maior que o tempo de vida do j-´esimo indiv´ıduo: isto pode acontecer quando tk > tj sendo tj um tempo de vida observado (tk pode ser um tempo de vida assim como uma observa¸c˜ao censurada), ou quando tk = tj sendo tk uma observa¸c˜ao censurada e tj um tempo de vida observado. -1 quando o tempo de vida associado ao k-´esimo indiv´ıduo for de certeza menor que o tempo de vida do j-´esimo indiv´ıduo: isto acontece quando tk < tj sendo tj um tempo de vida observado (tk pode ser um tempo de vida assim como uma observa¸c˜ao censurada), ou quando tk = tj sendo tj uma observa¸c˜ao censurada e tk um tempo de vida observado. 0 quando n˜ao se consegue ordenar tk com tj . Seja agora Uk′ =. m+n X. Ukj. para k = 1, . . . , m + n. j=1. (j 6= k). a pontua¸c˜ao atribu´ıda a cada observa¸c˜ao tk , que representa portanto a diferen¸ca entre o n´ umero das restantes observa¸c˜oes que s˜ao de certeza menores umero daquelas que s˜ao de certeza maiores que tk . que tk e o n´ A estat´ıstica de teste considerada ´e ent˜ao U=. m+n X k=1. Uk′. para k : tk ∈ amostra 1. 28. (3.5).

(49) Sendo, sob a validade da hip´ otese nula, m+n X mn (Uk′ )2 , E(U ) = 0 e var(U ) = (m + n)(m + n − 1) k=1. a estat´ıstica Z =. √ U var(U ). tem distribui¸c˜ao assint´otica normal padr˜ao.. Uma maneira equivalente de escrever a estat´ıstica de teste ´e UG =. r X j=1. nj (D1j − e1j ),. (3.6). onde nj , D1j e e1j s˜ao as mesmas quantidades definidas no par´agrafo 3.1 e r ´e o n´ umero de instantes de morte distintos na amostra conjunta. A diferen¸ca principal entre UG e UL , definida em (3.1), ´e que no teste de Gehan cada parcela D1j − e1j ´e ponderada pelo correspondente n´ umero de indiv´ıduos em risco nj . Isto quer dizer que as diferen¸cas D1j −e1j tˆem menos peso para instantes em que o n´ umero de indiv´ıduos que ainda est˜ ao vivos ´e relativamente pequeno, ou seja, para instantes perto do limite de observa¸c˜ao. Esta estat´ıstica ´e ent˜ao menos sens´ıvel na cauda direita da distribui¸c˜ao do tempo de vida. A variˆancia de UG ´e dada por var(UG ) =. r X. n2j v1j = VG ,. j=1. com v1j definida em (3.2). Assim sendo a estat´ıstica. 2 UG VG. tem distribui¸c˜ao. assint´otica qui-quadrado com um grau de liberdade quando a hip´otese nula for verdadeira.. 3.3. O teste log-rank e a proporcionalidade dos riscos. O teste log-rank ´e o teste mais potente quando os riscos de mortes relati´ ainda bastante potente quando vos aos dois grupos sejam proporcionais. E 29.

(50) as fun¸c˜oes de risco n˜ao forem proporcionais e n˜ao se cruzarem. Mostra-se inadequado para fun¸c˜oes de risco que se cruzam. Para estabelecer qual ´e o teste mais apropriado na dete¸c˜ao de afastamentos da hip´otese de igualdade podemos utilizar um resultado que nos diz que se as fun¸c˜oes de risco forem proporcionais ent˜ao as correspondentes fun¸c˜oes de sobrevivˆencia n˜ao se cruzam. Para mostrar isso vamos supor que h1 (t) e h2 (t) representam o risco de morte num instante t para um indiv´ıduo pertencente ao grupo 1 e ao grupo 2, respetivamente. Se estes riscos forem proporcionais ent˜ao pode-se escrever h1 (t) = ψ h2 (t) onde ψ > 0 ´e uma constante que n˜ao depende de t. Logo,   Z t   Z t h1 (u)du = exp − ψ h2 (u)du . exp − 0. 0. A partir de (1.6), se S1 (t) e S2 (t) forem as fun¸c˜oes de sobrevivˆencia dos dois grupos, pode-se escrever S1 (t) = {S2 (t)}ψ . Sendo S(t) uma fun¸c˜ao que s´ o pode tomar valores entre 0 e 1, este resultado mostra que S1 (t) ´e maior (menor) que S2 (t) quando ψ < 1 (> 1), para todos os valores de t. Isto quer dizer que se as fun¸c˜oes de risco forem proporcionais ent˜ao as fun¸c˜oes de sobrevivˆencia nunca se cruzam; trata-se, obviamente, de uma condi¸c˜ao necess´aria mas n˜ao suficiente para ter riscos proporcionais. Assim sendo, uma maneira n˜ ao rigorosa para averiguar a validade da hip´otese de riscos proporcionais consiste em considerar o gr´afico das estimativas de Kaplan-Meier da fun¸c˜ao de sobrevivˆencia: se as curvas relativas aos dois grupos n˜ao se cruzarem, a hip´otese de proporcionalidade dos riscos pode ser 30.

(51) justificada e o teste log-rank pode-se considerar apropriado. Obviamente pode acontecer que as estimativas das fun¸c˜oes de sobrevivˆencia se cruzem apesar das correspondentes fun¸c˜oes de risco serem proporcionais; por isso ´e preciso ter algum cuidado na interpreta¸c˜ao destes gr´aficos.. A hip´otese de riscos proporcionais pode tamb´em ser avaliada atrav´es de um m´etodo gr´afico. Como vimos anteriormente, se a hip´otese de riscos proporcionais for verdadeira tem-se que h1 (t) = eβ h2 (t) ⇔ S1 (t) = S2 (t)exp (β) ou, de uma forma equivalente, log(− log S1 (t)) = β + log(− log S2 (t)). Sendo Sˆ1 (t) e Sˆ2 (t) as estimativas de Kaplan-Meier de S1 (t) e S2 (t), o gr´afico de log(− log Sˆ1 (t)) versus t tender´a a ser paralelo ao gr´afico de log(− log Sˆ2 (t)) versus t se os riscos forem proporcionais. Por isso, a distˆancia entre estes dois gr´aficos deve-se manter razoavelmente constante ao longo do tempo.. 3.4. Teste de Tarone-Ware. Os testes log-rank e de Gehan pertencem a uma classe de testes n˜ao param´etricos onde a estat´ıstica utilizada pode ser escrita, de uma forma geral, como hP. r j=1 wj (D1j − e1j ) Pr 2 j=1 wj v1j. 31. i2. ,. (3.7).

(52) onde wj s˜ao constantes conhecidas que atribuem diferentes pesos `as parcelas das somas. A distribui¸c˜ao assint´otica, sob a hip´otese H0 , ´e um qui-quadrado com um grau de liberdade. Para o teste log-rank tem-se que wj = 1, enquanto para o teste de Gehan wj = nj . Um compromisso entre os dois ´e dado pelo teste de Tarone-Ware onde as fun¸c˜oes peso s˜ao wj =. 3.5. √. nj .. Outros testes. Uma outra alternativa ao teste de Mann-Whitney-Wilcoxon para dados censurados ´e dada pelo teste de Peto-Peto. Define-se a seguinte estimativa da fun¸c˜ao de sobrevivˆencia ˘ = S(t). Y . t(i) ≤t. di 1− ni + 1. . ,. (3.8). que ´e bastante pr´oxima da estimativa de Kaplan-Meier (2.2). Peto e Peto ˘ i ). Andersen et al. [14] prop˜oem usar as seguintes fun¸c˜oes peso w(ti ) = S(t ˘ i ) ni . [1] sugerem w(ti ) = S(t ni +1 Fleming e Harrington [3] apresentaram uma classe muito geral de testes que inclui, como casos especiais, o teste log-rank e uma vers˜ao do teste de Mann-Whitney-Wilcoxon muito pr´oxima `aquela sugerida por Peto e Peto. ˆ o estimador de Kaplan-Meier para a amostra conjunta. As fun¸c˜oes Seja S(t) peso propostas s˜ao h iq ˆ i−1 ) , ˆ i−1 )p 1 − S(t wp,q (ti ) = S(t. p ≥ 0, q ≥ 0.. Pode-se notar que a estimativa da fun¸c˜ao de sobrevivˆencia ´e calculada em ˆ no ti−1 : assim sendo, os pesos em ti s˜ao calculados `a custa do valor de S(t) 32.

(53) instante de morte anterior. Quando p = q = 0, como caso trivial, obt´em-se o teste log-rank, enquanto que, quando p = 1 e q = 0, temos uma vers˜ao do teste de Mann-Whitney-Wilcoxon. Quando q = 0 e p > 0 os pesos d˜ ao mais importˆancia `a fase inicial do estudo onde os valores da fun¸c˜ao de sobrevivˆencia s˜ao maiores. Pelo contr´ario, quando p = 0 e q > 0, estes testes d˜ao mais peso aos acontecimentos que ocorrem na fase final do estudo. Atrav´es de uma adequada escolha dos valores de p e q podem-se construir testes com a m´axima potˆencia para detetar diferen¸cas entre as experiˆencias de vida das duas popula¸c˜oes consideradas.. 3.6. Testes estratificados. Nalgumas situa¸c˜oes pode ser preciso comparar a sobrevivˆencia de conjuntos de indiv´ıduos tendo em conta a presen¸ca de algumas vari´aveis adicionais. Por exemplo, para comparar o efeito de dois diferentes tratamentos de quimioterapia, os dados de sobrevivˆencia dispon´ıveis ao investigador podem ser estratificados segundo o sexo, a idade, a proveniˆencia do paciente (centro cl´ınico) ou outros fatores de risco relacionados com a doen¸ca em estudo. Vamos apresentar o teste log-rank para dados estratificados. Seja ULk o valor da estat´ıstica de teste (3.1) calculada para cada estrato k com k = 1, 2, . . . , s, onde s ´e o n´ umero dos estratos analisados. Seja VLk a variˆancia de ULk calculada atrav´es de (3.2) e (3.3). O teste log-rank estratificado baseia-se na estat´ıstica Ps ULk )2 WS = Pk=1 s k=1 VLk (. 33. (3.9).

(54) que tem distribui¸c˜ao assint´otica qui-quadrado com um grau de liberdade sob a validade de H0 . Comparando o valor observado desta estat´ıstica com o quantil χ21, 1−α , pode-se tomar a decis˜ao de rejeitar ou n˜ao a hip´otese de igualdade entre os efeitos dos tratamentos para todos os estratos considerados, ao n´ıvel de significˆancia α.. 3.7. Teste log-rank para tendˆ encia. Em muitas situa¸c˜oes, ao comparar trˆes ou mais amostras de dados de sobrevivˆencia, os grupos de indiv´ıduos podem ser ordenados com respeito a determinadas caracter´ısticas (diferentes doses de tratamento, est´adio da doen¸ca, etc). Pode acontecer que, aplicando o teste log-rank tradicional, a an´alise feita n˜ao consiga detetar diferen¸cas significativas entre as v´arias fun¸c˜oes de sobrevivˆencia, embora o risco de morte esteja a variar entre os grupos. Por isso, ´e mais apropriado recorrer a uma vers˜ao modificada do teste que utilize a informa¸c˜ao contida na ordena¸c˜ao dos grupos. O teste log-rank para tendˆencia baseia-se na estat´ıstica UT =. g X k=1. wk (dk − ek ). (3.10). onde g ´e o n´ umero de grupos ordenados, wk ´e uma constante relativa ao k-´esimo grupo com k = 1, 2, . . . , g e dk =. rk X. dkj. ,. j=1. ek =. rk X. ekj. j=1. s˜ao respetivamente o n´ umero observado e esperado de mortes no k-´esimo grupo, onde rk ´e o n´ umero de instantes de morte correspondente. As constantes wk s˜ao, por vezes, escolhidas de maneira que sejam igualmente 34.

(55) distanciadas, o que corresponde a uma tendˆencia linear atrav´es dos grupos: por exemplo, se tivermos trˆes grupos, uma poss´ıvel escolha seria 1, 2, 3. A variˆancia de UT ´e dada por VT =. g X k=1. (wk − w) ¯ 2 ek. onde w ¯ ´e uma m´edia ponderada das constantes wk em que os pesos s˜ao os n´ umeros esperados de mortes ek , isto ´e. Logo, a estat´ıstica WT =. UT2 VT. Pg k=1 wk ek w ¯= P . g k=1 ek. tem distribui¸c˜ao assint´otica qui-quadrado com. um grau de liberdade, sob a validade da hip´otese de que n˜ao existe tendˆencia atrav´es dos g grupos.. 35.

(56) Cap´ıtulo 4. Compara¸c˜ ao de duas fun¸c˜ oes de risco que se cruzam Vamos considerar agora o problema do cruzamento de duas fun¸c˜oes de risco. Como j´a vimos anteriormente, o teste log-rank ´e o m´etodo ´otimo para avaliar o efeito de diferentes tratamentos no caso de riscos proporcionais. Contudo, quando as fun¸c˜oes de risco se cruzam num qualquer instante desconhecido, esta hip´otese n˜ao ´e obviamente v´alida. Este fen´omeno surge, por exemplo, quando os tratamentos tˆem efeitos diferentes ao longo do desenvolvimento de uma doen¸ca e o risco de morte varia de forma significativa. Uma maneira para estabelecer se as fun¸c˜oes de risco se cruzam ´e considerar as correspondentes fun¸c˜oes de sobrevivˆencia. Sendo a fun¸c˜ao de sobrevivˆencia uma transforma¸c˜ao mon´otona da fun¸c˜ao de risco cumulativa, pode-se concluir que, se as fun¸c˜oes de sobrevivˆencia se cruzarem num dado ponto, ent˜ao tamb´em as correspondentes fun¸c˜oes de risco se cruzam pelo menos uma vez. Obviamente o contr´ario n˜ao ´e verdadeiro, ou seja, ´e poss´ıvel que as fun¸c˜oes de sobrevivˆencia n˜ao se cruzem e que as fun¸c˜oes de risco sim. Neste sentido, o m´etodo de Kaplan-Meier pode-nos ajudar a ter uma ideia. 36.

(57) sobre o poss´ıvel cruzamento das fun¸c˜oes de risco.. 4.1. Introdu¸ c˜ ao. Nesta sec¸c˜ao vamos introduzir o problema em quest˜ao de um ponto de vista mais formal. Geralmente, interessa testar a hip´otese de igualdade entre as fun¸c˜oes de risco contra a hip´otese alternativa espec´ıfica de cruzamento, isto ´e H0 : h1 (t) = h0 (t). para qualquer t ∈ [0, τ ]. vs H1 : h1 e h0 cruzam-se num ponto γ ∈ [0, τ ] onde h0 e h1 s˜ao as fun¸c˜oes de risco dos grupos de controlo e de tratamento, respetivamente, γ ´e o ponto de cruzamento, [0, τ ] ´e o intervalo de interesse e τ ´e o maior tempo de vida observado. Assumindo que as fun¸c˜oes de risco sejam ambas cont´ınuas, tem-se que a hip´otese alternativa pode ser interpretada de duas formas diferentes: h1 (t) < h0 (t) quando t < γ, h1 (t) = h0 (t) quando t = γ e h1 (t) > h0 (t) quando t > γ. Isto quer dizer que o tratamento traz benef´ıcios s´o na primeira fase da doen¸ca e que n˜ao tem vantagens a longo prazo. Por exemplo, tratamentos como a quimioterapia e a radioterapia podem melhorar as condi¸c˜oes do paciente no per´ıodo a seguir `a dete¸c˜ao da doen¸ca, sem produzirem benef´ıcios significativos numa fase mais avan¸cada. h1 (t) > h0 (t) quando t < γ, h1 (t) = h0 (t) quando t = γ e h1 (t) < h0 (t) quando t > γ. 37.

(58) Tratamentos deste tipo tˆem vantagens a longo prazo mas podem aumentar o risco de morte na fase inicial da doen¸ca. As interven¸c˜oes cir´ urgicas s˜ao um bom exemplo neste sentido, sendo bastante elevada a probabilidade de infe¸c˜oes no per´ıodo p´os-operat´orio. Os testes que vamos apresentar tˆem uma maior potˆencia do que os referidos no cap´ıtulo 3 para detetar diferen¸cas entre fun¸c˜oes de risco que se cruzam.. 4.2. Testes de Renyi. As estat´ısticas de teste que vamos considerar nesta sec¸c˜ao s˜ao uma generaliza¸c˜ao para dados censurados da estat´ıstica de Kolmogorov-Smirnov usada para comparar duas amostras na ausˆencia de censura. Para construir estes testes vamos calcular o valor da estat´ıstica (3.7) para alguma fun¸c˜ao peso em cada instante de morte registado. Quando as fun¸c˜oes de risco se cruzam, os valores absolutos destas quantidades admitem um m´aximo num instante anterior ao maior tempo de vida registado. Quando este valor for elevado, rejeita-se a hip´otese nula em favor da hip´otese alternativa. Suponhamos ent˜ao que temos duas amostras independentes de dimens˜ao n e m, respetivamente. Sejam t1 < t2 < . . . < tr os instantes de morte distintos na amostra conjunta, d1j , d2j , n1j , n2j , dj , nj as mesmas quantidades definidas na sec¸c˜ao 3.1 e w(t) uma fun¸c˜ao peso. Por exemplo, para a vers˜ao ”log-rank” tem-se w(tj ) = 1 e para a vers˜ao ”Gehan” w(tj ) = nj . Para cada valor tj calculamos Z(tj ) dado por Z(tj ) =. X. tk ≤tj. . w(tk ) d1k − n1k 38. . dk nk. . ,. j = 1, . . . , r.

(59) Seja agora σ(τ ) o desvio padr˜ao de Z(τ ), dado por 2. σ (τ ) =. X. dk w(tk ). 2. tk ≤τ. . n1k nk. . n2k nk. . nk − d k nk − 1. . onde τ ´e o maior instante tk para o qual n1k , n2k > 0. A estat´ıstica de teste ´e dada por Q=. sup{|Z(t)|, t ≤ τ } . σ(τ ). (4.1). Se a hip´otese nula for verdadeira, a distribui¸c˜ao de Q pode ser aproximada pela distribui¸c˜ao de sup {|B(x)|, 0 ≤ x ≤ 1}, onde B ´e um movimento browniano padr˜ao. Valores cr´ıticos de Q podem ser encontrados em KleinMoeschberger [6].. 4.3. Teste de Cramer-Von Mises para dados censurados. Para construir este teste recordemos que a estimativa de Nelson-Aalen para a fun¸c˜ao de risco cumulativa em cada grupo ´e dada por X dij , i = 1, 2. nij. ˜ i (t) = H. tj ≤t. ˜ i (t) ´e dada por Uma estimativa da variˆancia de H σi2 (t) =. X. tj ≤t. dij , i = 1, 2. nij (nij − 1). ˜ 1 (t) e H ˜ 2 (t), e por isso precisamos O teste baseia-se na diferen¸ca entre H de calcular tamb´em σ 2 (t) = σ12 (t) + σ22 (t) que ´e a variˆancia estimada de ˜ 1 (t) − H ˜ 2 (t). A estat´ıstica de Cramer-Von Mises ´e dada por H Q1 =. . 1 2 σ (τ ). 2 Z. τ 0. h. ˜ 1 (t) − H ˜ 2 (t) H. 39. i2. dσ 2 (t),. (4.2).

(60) que pode ser calculada da seguinte maneira Q1 =. . 1 2 σ (τ ). 2 X h ti ≤τ. ˜ 1 (ti ) − H ˜ 2 (ti ) H. i2 . σ 2 (ti ) − σ 2 (ti−1 ). . onde t0 = 0 e a soma ´e calculada para todos os instantes de morte distintos inferiores a τ . Quando a hip´otese nula for verdadeira, a distribui¸c˜ao de Q1 pode ser aproximada, para grandes amostras, pela distribui¸c˜ao de R1 = R1 2 e um movimento browniano padr˜ao. 0 [B(x)] dx, onde B ´ Uma vers˜ao alternativa da estat´ıstica de Cramer-Von Mises ´e dada por #2 Z τ"˜ ˜ 2 (t) H1 (t) − H Q2 = n dA(t) (4.3) 1 + nσ 2 (t) 0. que ´e calculada como #2 " X H ˜ 2 (ti ) ˜ 1 (ti ) − H Q2 = n [A(ti ) − A(ti−1 )]. 1 + nσ 2 (ti ) ti ≤τ. onde A(t) =. nσ 2 (t) . 1+nσ 2 (t). Quando a hip´otese nula for verdadeira, a distribui¸c˜ao. de Q2 pode ser aproximada, para grandes amostras, pela distribui¸c˜ao de R A(τ ) R2 = 0 [B 0 (x)]2 dx, onde B 0 ´e uma ponte browniana. Valores cr´ıticos de. Q2 podem ser encontrados em Klein-Moeschberger [6].. 4.4. Teste t para dados censurados. O teste t tradicional baseia-se na diferen¸ca entre as m´edias das amostras provenientes das duas popula¸c˜oes em estudo. Da rela¸c˜ao (1.8) podemos ver que o valor m´edio populacional pode ser aproximado pela ´area abaixo da estimativa de Kaplan-Meier da fun¸c˜ao de sobrevivˆencia, como vimos em (2.10) e (2.11). Uma generaliza¸c˜ao do teste t para dados censurados ´e dada ent˜ao por um 40.

(61) teste baseado na ´area abaixo do gr´afico de Sˆ1 (t) − Sˆ2 (t), no intervalo onde ambas as amostras ainda tˆem indiv´ıduos em risco. Para construir o teste consideramos os tempos observados da amostra conjunta. Sejam ent˜ao t1 < t2 . . . < tn os tempos de vida ordenados (censurados ou n˜ao) e dij , cij e nij o n´ umero de mortes, o n´ umero de tempos censurados e o n´ umero de indiv´ıduos em risco no instante tj na i-´esima amostra, com i = 1, 2. Sejam Sˆi (t) o estimador de Kaplan-Meier correspondente `a i-´esima amostra e Sˆp (t) o estimador de Kaplan-Meier relativo `a amostra conjunta. h i cij ˆ i (t) = Q Seja G 1 − tj ≤t nij o estimador de Kaplan-Meier do tempo censurado. Para construir a estat´ıstica de teste definimos tamb´em a seguinte fun¸c˜ao peso w(t) =. ˆ 1 (t)G ˆ 2 (t) nG , ˆ 1 (t) + n2 G ˆ 2 (t) n1 G. 0 ≤ t ≤ tD. onde n1 e n2 s˜ao as dimens˜ oes das duas amostras, n = n1 + n2 e tD ´e o ˆ i (t), w(t) ´e limite de observa¸c˜ao. Pode-se notar que, dada a defini¸c˜ao de G constante entre duas observa¸c˜oes censuradas sucessivas e que, quando houver uma forte concentra¸c˜ao de observa¸c˜oes censuradas em qualquer uma das amostras, w(t) ´e pr´oximo de 0. Al´em disso, como caso trivial, se os dados n˜ ao forem censurados tem-se que w(t) = 1, ∀t. A estat´ıstica de teste ´e dada por T =. r. n 1 n2 n. Z. tD 0. h i w(t) Sˆ1 (t) − Sˆ2 (t) dt. que pode ser calculada como T =. r. D−1 h i n1 n2 X [ti+1 − ti ] w(ti ) Sˆ1 (ti ) − Sˆ2 (ti ) . n i=1. 41. (4.4).

(62) No entanto, ´e usual considerar a estat´ıstica de teste dada por Z =. T σ ˆp ,. sendo. σ ˆp2 uma estimativa da variˆancia de T . Quando a hip´otese nula for verdadeira, Z segue uma distribui¸c˜ao assint´otica normal padr˜ao.. 4.5. Outros m´ etodos utilizados. Os testes que apresent´amos at´e agora neste cap´ıtulo tˆem uma boa sensibilidade para detetar diferen¸cas entre fun¸c˜oes de risco que se cruzam. Isto acontece porque conseguem evitar, ao contr´ario de outros testes tradicionais como o teste log-rank, que as diferen¸cas detetadas inicialmente sejam anuladas pelas diferen¸cas de sinal oposto detetadas depois do ponto do cruzamento. Os m´etodos que vamos referir agora s˜ao generaliza¸c˜oes do teste logrank com fun¸c˜oes peso especiais. Os pesos tradicionais dos testes cl´assicos s˜ao todos positivos; uma solu¸c˜ao natural para resolver este problema ´e considerar fun¸c˜oes peso que mudem de sinal depois do instante de cruzamento. Mantel e Stablein [8] prop˜ oem o seguinte m´etodo: quando o ponto de cruzamento γ for conhecido podem-se construir as mesmas tabelas de contingˆencia definidas para o teste log-rank e seguir a mesma metodologia proposta por Mantel e Haenszel. Em seguida, em vez de considerar a diferen¸ca entre o valor observado e o valor esperado relativos a todas as tabelas, define-se a seguinte estat´ıstica. Wγ =. hP. r j=1 (D1j. − e1j ) δ(tj , γ) VL. onde δ(tj , γ) =. . 1 tj < γ −1 tj > γ. 42. i2. (4.5).

(63) e VL ´e definida em (3.3). Wγ tem distribui¸c˜ao assint´otica qui-quadrado com um grau de liberadade. Uma situa¸c˜ao mais comum acontece quando, por v´arias raz˜oes, se suspeita que as fun¸c˜oes de risco se cruzam sem conhecer a localiza¸c˜ao do ponto de cruzamento γ. Neste caso a estat´ıstica proposta ´e W = supγ Wγ , onde estamos a considerar o supremo do conjunto de todas as estat´ısticas definidas anteriormente para hipot´eticos pontos de cruzamento γ. Para usar este teste a distribui¸c˜ao de W sob a hip´otese nula deve ser calculada por simula¸c˜ao, visto que a sua distribui¸c˜ao exata, assim como a assint´otica, n˜ao s˜ao facilmente obtidas. Um outro teste foi proposto por Moreau et al. [10]. Os pesos considerados s˜ao dados por   wi = 1 + log − log Sˆi ,. onde Sˆi ´e a estimativa de Kaplan-Meier da fun¸c˜ao de sobrevivˆencia em ti . Pode-se demonstrar que os pesos s˜ao inicialmente negativos e passam a ser positivos quando Sˆi toma o valor 0.69. Al´em disso, este teste tem propriedades ´otimas para a hip´otese alternativa espec´ıfica dada por H1 : H1 (t) = (H0 (t))b. (4.6). onde H0 (t) e H1 (t) s˜ao as fun¸c˜oes de risco cumulativas do grupo de controlo e do grupo de tratamento respetivamente, e b 6= 1 ´e uma constante positiva. Da rela¸c˜ao (4.6) e sendo a fun¸c˜ao de risco a 1 derivada da fun¸c˜ao de risco cumulativa, tem-se que h1 (t) = b h0 (t) (H0 (t))b−1 . 43.

(64) Segue que, quando b > 1 (< 1) a raz˜ao dos riscos ´e menor (maior) que 1 at´e um determinado instante; depois deste instante, a fun¸c˜ao de risco ´e maior (menor) que 1. O ponto de cruzamento γ satisfaz a seguinte condi¸c˜ao b (H0 (γ))b−1 = 1, sendo h0 (γ) = h1 (γ).. 44.

(65) Cap´ıtulo 5. Riscos Competitivos 5.1. Introdu¸ c˜ ao. Como j´a foi dito anteriormente, a an´alise de sobrevivˆencia ´e um ramo da estat´ıstica que estuda o tempo de vida, ou seja, o tempo decorrido a partir de um determinado instante inicial at´e `a ocorrˆencia de um dado acontecimento de interesse. Por exemplo, para avaliar o tempo at´e `a morte devida ao cancro da mama, as pacientes s˜ao seguidas desde o dia do diagn´ostico ` vezes pode aconat´e ao dia da morte ou at´e um limite de observa¸c˜ao. As tecer que uma paciente morra por causas n˜ao relacionadas com o cancro da mama. O termo riscos competitivos aplica-se a qualquer situa¸c˜ao na qual um indiv´ıduo esteja sujeito a duas ou mais causas de ”morte” distintas: n˜ao h´ a apenas um u ´nico acontecimento de interesse; podemos dizer que existem acontecimentos ”competitivos”.. Um investigador cl´ınico pode estar interessado em examinar, al´em da mortalidade dos indiv´ıduos por um determinado cancro, outros acontecimentos como a reca´ıda da doen¸ca ou ocorrˆencia de cancros secund´arios. Neste con-. 45.

Referências

Documentos relacionados

2 - OBJETIVOS O objetivo geral deste trabalho é avaliar o tratamento biológico anaeróbio de substrato sintético contendo feno!, sob condições mesofilicas, em um Reator

Nessa situação temos claramente a relação de tecnovívio apresentado por Dubatti (2012) operando, visto que nessa experiência ambos os atores tra- çam um diálogo que não se dá

Para além dos módulos anteriores, que foram definidos como objectivos mínimos para o trabalho desta dissertação de mestrado, foi ainda construído um conjunto de

5 “A Teoria Pura do Direito é uma teoria do Direito positivo – do Direito positivo em geral, não de uma ordem jurídica especial” (KELSEN, Teoria pura do direito, p..

To demonstrate that SeLFIES can cater to even the lowest income and least financially trained individuals in Brazil, consider the following SeLFIES design as first articulated

Quando conheci o museu, em 2003, momento em foi reaberto, ele já se encontrava em condições precárias quanto à conservação de documentos, administração e organização do acervo,

Neste estudo foram estipulados os seguintes objec- tivos: (a) identifi car as dimensões do desenvolvimento vocacional (convicção vocacional, cooperação vocacio- nal,

Dessa forma, a partir da perspectiva teórica do sociólogo francês Pierre Bourdieu, o presente trabalho busca compreender como a lógica produtivista introduzida no campo