UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO DE CIˆENCIAS EXATAS E DA TERRA
PROGRAMA DE P ´OS-GRADUA ¸C ˜AO EM MATEM ´ATICA APLICADA E ESTAT´ISTICA
MODELO DE TEMPO DE FALHA ACELERADO COM FRA ¸C ˜AO DE CURA
UMA ABORDAGEM UNIFICADA
Alysson L´ıvio Vasconcelos Guedes
MODELO DE TEMPO DE FALHA ACELERADO COM
FRA ¸
C ˜
AO DE CURA
UMA ABORDAGEM UNIFICADA
Alysson L´ıvio Vasconcelos Guedes
´
Area de Concentra¸c˜ao: Probabilidade e Estat´ıstica
Orientadora: Profa. Dra. Dione Maria Valen¸ca
Disserta¸c˜ao apresentada ao Corpo Docente do
Programa de P´os-Gradua¸c˜ao em Matem´atica
Aplicada e Estat´ıstica - CCET - UFRN, como
requisito parcial para obten¸c˜ao do t´ıtulo de
Mestre em Matem´atica Aplicada e Estat´ıstica.
Natal, outubro de 2011
Fazei, pois, descer de vosso santo c´eu a sabedoria, e envia-a do trono de vossa gl´oria, para que, junto de mim, tome parte em meus trabalhos.
Sabedoria 9-10
Catalogação da Publicação na Fonte. UFRN / SISBI / Biblioteca Setorial Centro de Ciências Exatas e da Terra – CCET.
Guedes, Alysson Lívio Vasconcelos.
Modelo de tempo de falha acelerado com fração de cura: uma abordagem unificada / Alysson Lívio Vasconcelos Guedes. - Natal, 2011.
52 f. il.:
Orientador(a): Profa. Dra. Dione Maria Valença.
Dissertação (Mestrado) – Universidade Federal do Rio Grande do Norte. Centro de Ciências Exatas e da Terra. Programa de Pós-Graduação em Matemática Aplicada e Estatística.
1. Análise de sobrevivência – Dissertação. 2. Programa computacional R – Dissertação. 2. Fração de cura – Dissertação. 3. Câncer de mama – Dissertação. I. Valença, Dione Maria. II. Título.
Agradecimentos
Agrade¸co a Deus pai e a Santa Maria por todas as bˆen¸c˜aos que recebi em toda a
minha vida.
Agrade¸co a toda paciˆencia e aten¸c˜ao da minha orientadora Dione Maria Valen¸ca
que com um cora¸c˜ao de m˜ae soube orientar este trabalho. `
A minha amada m˜ae, `a minha madrinha Socorro e aos meus irm˜aos por serem fonte
de amor e apoio em toda minha vida. Agrade¸co especialmente ao meu pai, que como
exemplo de homem de car´ater, deu sua vida `a doar-se pela fam´ılia e ao pr´oximo.
Aos meus amigos e companheiros de mestrado Juliane Caroline, Kelly Christina,
Kaline Nascimento, Tatiane Farache, Jeane Lima, Cl´audia Macedo, Daniel Matos e
todos os demais pela amizade e pelo acolhimento. `
A Nara Ang´elica e a toda fam´ılia Mesquita por serem como uma fam´ılia pra mim
nessa etapa final do trabalho.
Aos meus amigos de toda a vida Gedvan Dias, Luciana Vital, Thiago Gouveia,
Nadja Cristina, Marcus Vin´ıcius, Nailson Cunha e aos irm˜aos Curvelo. `
A todos os professores e servidores do PPGMAE. `
A Capes pelo apoio financeiro.
Resumo
Neste trabalho apresentamos um estudo sobre o modelo de tempo de falha acelerado
gama generalizado com fra¸c˜ao de cura sob uma abordagem unificada. O modelo se
prop˜oe a estimar simultaneamente o efeito de covari´aveis na acelera¸c˜ao/desacelera¸c˜ao
do tempo at´e a ocorrˆencia de um evento e na fra¸c˜ao de cura. O m´etodo ´e implementado
nosoftware estat´ıstico livre R. Por fim o modelo ´e aplicado a dados reais referente ao tempo at´e o retorno da doen¸ca em pacientes diagnosticados com cˆancer de mama.
Palavras-chave: An´alise de sobrevivˆencia , Fra¸c˜ao de cura, Cˆancer de mama
Abstract
In this work we study the accelerated failure-time generalized Gamma regression
models with a unified approach. The models attempt to estimate simultaneously the
effects of covariates on the acceleration/deceleration of the timing of a given event and
the surviving fraction. The method is implemented in the free statistical software R.
Finally the model is applied to a real dataset referring to the time until the return of
the disease in patients diagnosed with breast cancer.
Keywords: Survival analysis , cure fraction, breast cancer
Sum´
ario
1 Introdu¸c˜ao 1
1.1 Objetivos . . . 2
1.2 Descri¸c˜ao dos cap´ıtulos . . . 3
2 An´alise de Sobrevivˆencia 4 2.1 Conceitos fundamentais de An´alise de Sobrevivˆencia . . . 4
2.1.1 Fun¸c˜ao de sobrevivˆencia . . . 5
2.1.2 Fun¸c˜ao taxa de falha ou fun¸c˜ao risco . . . 5
2.1.3 Censura . . . 5
2.1.4 Representa¸c˜ao dos dados de sobrevivˆencia . . . 6
2.2 Modelos de Tempo de Falha Acelerado . . . 8
3 Modelos de Sobrevivˆencia com Fra¸c˜ao de Cura 9 3.1 Modelo de Mistura Padr˜ao . . . 10
3.2 Modelo de tempo de promo¸c˜ao . . . 11
3.3 Modelo Unificado . . . 12
3.4 Alguns casos particulares do modelo unificado . . . 14
3.4.1 Modelo de Mistura Padr˜ao . . . 15
3.4.2 Modelo de Tempo de Promo¸c˜ao . . . 16
3.4.3 Fun¸c˜ao de Verossimilhan¸ca . . . 16
3.4.4 Verossimilhan¸ca Marginal . . . 19
3.5 Incluindo Covari´aveis na Fra¸c˜ao de Cura . . . 20
3.5.1 Fun¸c˜ao de Verossimilhan¸ca . . . 21
4 Modelos de tempo de falha acelerado com fra¸c˜ao de Cura: Uma
abor-dagem unificada 22
4.1 Regress˜ao log-gama generalizada . . . 22
4.2 MTFA incluindo covari´aveis na fra¸c˜ao de cura . . . 24
4.3 Casos Particulares do MTFA com fra¸c˜ao de cura unificado . . . 26
4.3.1 MTFA l.g.g. com modelo de mistura padr˜ao . . . 26
4.3.2 MTFA l.g.g com Modelo de Tempo de Promo¸c˜ao . . . 27
4.4 Estimando os parˆametros . . . 28
5 Reprodu¸c˜ao de resultados e Aplica¸c˜ao 30 5.1 Reprodu¸c˜ao de resultados . . . 30
5.1.1 MTFA l.g.g. com modelo de mistura padr˜ao . . . 30
5.1.2 MTFA l.g.g. com modelo de tempo de promo¸c˜ao . . . 31
5.2 Aplica¸c˜ao . . . 32
5.3 Descri¸c˜ao das covari´aveis . . . 33
5.4 Ajuste de modelos sem fra¸c˜ao de cura . . . 34
5.5 Ajuste dos MTFA l.g.g. padr˜ao com fra¸c˜ao de cura . . . 37
6 Considera¸c˜oes finais 39 A Comandos no R 41 A.1 Regress˜ao Log-gama Generalizada com covari´aveis . . . 41
A.2 MTFA l.g.g com Modelo de Mistura Padr˜ao . . . 44
A.3 MTFA l.g.g com Modelo de Tempo de Promo¸c˜ao . . . 45
B Demonstra¸c˜oes 48 B.1 Fun¸c˜ao de sobrevivˆencia populacional . . . 48
B.2 Casos particulares do Modelo Unificado . . . 49
B.2.1 Modelo de Mistura Padr˜ao . . . 49
B.2.2 Modelo de Tempo de Promo¸c˜ao . . . 49
Cap´ıtulo 1
Introdu¸
c˜
ao
Em modelos de sobrevivˆencia, estamos interessados em estudar o tempo at´e a
ocor-rˆencia de um evento de interesse comumente chamado ”tempo at´e a falha” ou ”tempo
de vida”. Por´em, em algumas situa¸c˜oes, uma propor¸c˜ao da popula¸c˜ao pode ser
con-siderada ”curada”, ou seja, alguns indiv´ıduos n˜ao est˜ao mais sujeitos ao evento de
in-teresse. Os modelos que tratam desta abordagem s˜ao chamados de modelos de fra¸c˜ao
de cura. Um grande n´umero de observa¸c˜oes censuradas `a direita em um per´ıodo de
acompanhamento suficiente, pode ser um indicativo da presen¸ca de indiv´ıduos curados
na popula¸c˜ao. Por exemplo, em estudos sobre a recidiva de determinados tipos de
cˆancer, muitos pesquisadores consideram que um paciente estar´a curado se n˜ao houver
reincidˆencia da doen¸ca num per´ıodo de 5 a 10 anos ap´os aplica¸c˜ao de tratamentos,
sendo este tempo determinado pela experiˆencia do pesquisador.
Modelos de sobrevivˆencia com fra¸c˜ao de cura tem sido extensivamente discutidos
na literatura estat´ıstica por v´arios autores. Uma abordagem dada inicialmente por
Boag (1949) e Berkson e Gage (1952) , considera uma mistura de distribui¸c˜oes. Neste
modelo, conhecido como modelo de mistura padr˜ao, ´e assumido que uma fra¸c˜ao π da popula¸c˜ao est´a curada, e a restante 1−π, n˜ao curada. O livro de Maller e Zhou (1996) apresenta diversas referˆencias sobre trabalhos que abordam modelos de mistura.
Alternativamente, Yakovlev et al. (1993) prop˜oem uma nova classe de mistura
en-volvendo uma estrutura de riscos competitivos, que foi estendida por Chen et al. (1999),
1.1 Objetivos 2
o qual nos referimos como modelo de tempo de promo¸c˜ao. Uma abordagem unificada, que inclui o modelo de mistura padr˜ao e o modelo de tempo de promo¸c˜ao como dois
casos especiais, ´e discutido em Rodrigues et al. (2009). Neste contexto, a distribui¸c˜ao
assumida para a vari´avel latente, representando o n´umero de causas que competem para
a ocorrˆencia do evento, determina uma classe de modelos. As distribui¸c˜oes Bernoulli e
Poisson representam respectivamente os modelos de mistura e de tempo de promo¸c˜ao.
Yamaguchi (1992) prop˜oe uma extens˜ao dos modelos de tempo de falha acelerado
log-Gama generalizada com fra¸c˜ao de cura inserido na forma de modelo de mistura,
considerando tamb´em a fra¸c˜ao de cura como fun¸c˜ao das covari´aveis. Em uma
abor-dagem semelhante, Ortega et al. (2009) prop˜oe uma extens˜ao para modelos de regress˜ao
Gama Generalizada incluindo fra¸c˜ao de cura em um modelo de tempo de promo¸c˜ao,
al´em de apresentar resultados sobre influˆencia local e res´ıduos para este modelo.
1.1
Objetivos
Neste trabalho, partindo da abordagem unificada dada em Rodrigues et al. (2009)
estudamos as extens˜oes dos modelo de regress˜ao Log-Gama Generalizada dadas por
Yamaguchi (1992) e Ortega et al. (2009), propondo ent˜ao uma ´otica unificada para
essas extens˜oes. Em seguida apresentamos de forma diferenciada o ajuste destes
mo-delos atrav´es do software estat´ıstico R (R Development Core Team 2011). Aplicamos
esta abordagem em um conjunto de dados reais obtidos de Macedo e Valen¸ca (2009),
contendo informa¸c˜oes a respeito de 355 pacientes com cˆancer de mama atendidas no
Hospital Prof. Dr. Luiz Antˆonio, Natal RN, no per´ıodo de 1991 `a 1995, para estudar
o efeito de covari´aveis no tempo em que as pacientes permanecem livres do retorno da
doen¸ca bem como seus efeitos sobre a fra¸c˜ao de cura, ap´os terem sido submetidas ao
1.2 Descri¸c˜ao dos cap´ıtulos 3
1.2
Descri¸
c˜
ao dos cap´ıtulos
No Cap´ıtulo seguinte mostramos uma breve introdu¸c˜ao `a an´alise de sobrevivˆencia
e seus principais conceitos. No Capitulo 3 abordamos os modelos cl´assicos de fra¸c˜ao
de cura e o modelo unificado proposto por Rodrigues et al. (2009). No quarto
cap´ı-tulo abordamos os modelos propostos por Yamaguchi (1992) e por Ortega et al. (2009)
que estendem o modelo de tempo de falha acelerado log-gama generalizado associando
covari´aveis tanto ao tempo de vida quanto `a fra¸c˜ao de curados. Atrav´es dessa ´otica
discutimos um modelo unificado para os modelos de tempo de falha acelerado com
fra¸c˜ao de cura. No Capitulo 5 ajustamos os modelos a dados reais atrav´es do software
estat´ıstico R, reproduzindo inicialmente as aplica¸c˜oes dadas por Yamaguchi (1992) e
Rodrigues et al. (2009). Guardamos os comandos usados no R para o Apˆendice A e
al-gumas demonstra¸c˜oes para o Apˆendice B. Reservamos para Capitulo 6 as considera¸c˜oes
Cap´ıtulo 2
An´
alise de Sobrevivˆ
encia
Neste cap´ıtulo fazemos uma breve introdu¸c˜ao aos principais conceitos de an´alise
de sobrevivˆencia e ao Modelos de Tempo de Falha Acelerado.
2.1
Conceitos fundamentais de An´
alise de
Sobre-vivˆ
encia
A an´alise de sobrevivˆencia tem um papel importante em v´arias ´areas de
conhe-cimento como engenharia e ciˆencias biol´ogicas. Sua vari´avel de interesse ´e o tempo
at´e a ocorrˆencia de um certo evento, tamb´em chamado de tempo de vida ou tempo
at´e a falha podendo ser, por exemplo, o tempo de dura¸c˜ao de um certo componente
eletrˆonico, o tempo at´e a morte de um paciente, ou ainda, o tempo at´e o retorno de
uma doen¸ca (recidiva) em um paciente.
A vari´avel aleat´oria T corresponde ao tempo at´e a ocorrˆencia de um determinado evento de interesse de alguma popula¸c˜ao. ParaT devemos definir: o tempo de in´ıcio, como a data de in´ıcio do estudo por exemplo; a escala de medida, que ´e em geral o
tempo do estudo, podendo ser outra medida como quilometragem de um carro; e um
evento de interesse, como a morte do paciente.
2.1 Conceitos fundamentais de An´alise de Sobrevivˆencia 5
2.1.1
Fun¸
c˜
ao de sobrevivˆ
encia
SejaT uma vari´avel aleat´oria cont´ınua, n˜ao negativa com fun¸c˜ao densidade de pro-babilidadef(t) e fun¸c˜ao distribui¸c˜ao acumuladaF(t). Definimos a fun¸c˜ao sobrevivˆencia deT como:
S(t) =P(T > t) =
Z t
0
f(u)du= 1−F(t) t >0. (2.1) Note que S(t) ´e uma fun¸c˜ao mon´otona decrescente com S(0) = 1 e
S(∞) = limt→∞S(t) = 0.
2.1.2
Fun¸
c˜
ao taxa de falha ou fun¸
c˜
ao risco
A fun¸c˜ao risco corresponde `a taxa de falha instantˆanea no momento t.
h(t) = lim
∆t→0
P(t ≤T < t+ ∆t|T ≥t)
∆t
= lim
∆t→0
1 ∆t
P(t≤T < t+ ∆t)
P(T ≥t) = lim
∆t→0
1 ∆t
F(t+ ∆t)−F(t)
S(t)
= 1
S(t)∆limt→0
F(t+ ∆t)−F(t)
∆t
= 1
S(t)F
′(t) = f(t)
S(t).
(2.2)
Da defini¸c˜ao dada na equa¸c˜ao (2.1) temos ainda que:
f(t) =−dS(t)
dt . (2.3)
2.1.3
Censura
Uma ocorrˆencia frequente em dados de sobrevivˆencia ´e a presen¸ca de censura, que ´e
caracterizada pela observa¸c˜ao apenas parcial da resposta. Isto se refere a situa¸c˜oes em
2.1 Conceitos fundamentais de An´alise de Sobrevivˆencia 6
a observa¸c˜ao n˜ao pode ser mais acompanhada ou devido ao final do experimento. Isto
significa que toda informa¸c˜ao referente `a resposta se resume ao conhecimento de que
o tempo de falha ´e superior `aquele observado. Sem a presen¸ca de censura, as
t´ecni-cas estat´ıstit´ecni-cas cl´assit´ecni-cas, como an´alise de regress˜ao e planejamento de experimentos,
poderiam ser utilizadas na an´alise deste tipo de dados, provavelmente usando uma
transforma¸c˜ao para a resposta.
Tipos de censura
O tipo de censura mais comum ´e a censura `a direita. ´E dito `a direita pois o tempo
at´e a ocorrˆencia do evento de interesse ´e superior ao tempo registrado. Desprezar essa
informa¸c˜ao faria com que o risco de ocorrˆencia do evento de interesse fosse
superesti-mado, pois o tempo at´e a falha ´e desconhecido, mas o evento de interesse n˜ao ocorreu
at´e o ´ultimo momento observado. Os trˆes mais conhecidos mecanismos de censura `a
direita s˜ao:
• Censura do Tipo I: O estudo ser´a terminado ap´os um per´ıodo pr´e-estabelecido
de tempo. As observa¸c˜oes para os quais o evento de interesse n˜ao foi observado
at´e este tempo s˜ao ditas censuradas;
• Censura do Tipo II: O estudo ser´a terminado ap´os ter ocorrido o evento de
interesse para um n´umero pr´e-estabelecido de observa¸c˜oes;
• Censura Aleat´oria: Ocorre se a observa¸c˜ao for retirada no decorrer do estudo
sem ter ocorrido o evento de interesse ou se o evento de interesse ocorrer por uma
raz˜ao diferente da estudada.
2.1.4
Representa¸
c˜
ao dos dados de sobrevivˆ
encia
Considere uma vari´avel aleat´oria positiva T representando o tempo at´e a falha e
2.1 Conceitos fundamentais de An´alise de Sobrevivˆencia 7
T∗ =min(T, C) e al´em disso definimos uma indicadora de forma
δ=
1 se T ≤C
0 se T > C
A representa¸c˜ao dos dados para o i-´esimo individuo, sendo i = 1, . . . , n, ´e o par (t∗
i, δi), sendo t∗i o valor observado de T∗ para o individuoi e δi vari´avel indicadora de
censura definida acima.
Considere, como ocorre na pr´atica, a sobrevivˆencia dos pacientes portadores de
alguma doen¸ca associada a informa¸c˜oes (caracter´ısticas) como o tipo de tratamento
usado, idade, etc. Para tratar da dependˆencia dos tempos de sobrevivˆencia com estas
informa¸c˜oes auxiliares associamos a cada indiv´ıduo um vetor de medidas (vari´aveis
discretas ou cont´ınuas), chamado geralmente de vetor de covari´aveis, e denotado por
x= (1, x1, . . . , xp)′.
Assim os dados de sobrevivˆencia s˜ao da forma:
t δ x1 · · · xp
t1 δ1 x11 · · · x1p
... ... ... ... ...
tn δn xn1 · · · xnp
Uma maneira de determinar o relacionamento entre o tempo de sobrevivˆencia e as
covari´aveis ´e atrav´es de um modelo de regress˜ao. Uma classe importante de modelos
de regress˜ao para tratar de dados de sobrevivˆencia ´e a classe dos Modelos de Tempo
2.2 Modelos de Tempo de Falha Acelerado 8
2.2
Modelos de Tempo de Falha Acelerado
Considere os modelos de posi¸c˜ao e escala caracterizados pelo fato que Y = logT
possui um distribui¸c˜ao com parˆametro de posi¸c˜ao µe de escala σ. Desta forma temos
Y =µ+σǫ, (2.4)
sendo−∞< µ <∞ eσ > 0.
Considerando a presen¸ca de p covari´aveis, assumimos que µ = µ(x) = x′β sendo
x = (1, x1, . . . , xp)′ um vetor de covari´aveis e β = (β0, β1, . . . , βp)′ um vetor de
parˆa-metros desconhecidos. Sejam g(·) e G(·) as fun¸c˜oes densidade de probabilidade e de sobrevivˆencia de ǫ respectivamente, ent˜ao a fun¸c˜ao densidade de probabilidade de Y
para um dado vetor de covari´aveis xser´a dada por
f(y;x,β, σ) = 1
σg
y−x′β σ
− ∞< y <∞, (2.5) e a de sobrevivˆencia por
S(y;x,β, σ) =G
y−x′β σ
− ∞< y <∞, (2.6) Desta forma o modelo 2.4 ´e um modelo log-linear paraT com res´ıduoǫ. Chamamos este modelo de Modelo de Tempo de Falha Acelerado devido ao fato que as covari´aveis tˆem a fun¸c˜ao de acelerar ou desacelerar o tempo de ocorrˆencia do evento
Cap´ıtulo 3
Modelos de Sobrevivˆ
encia com
Fra¸
c˜
ao de Cura
Os modelos cl´assicos de An´alise de Sobrevivˆencia pressup˜oem que quando o tempo
vai para o infinito a probabilidade de sobrevivˆencia ´e igual a zero (limt→∞S(t) = 0).
Quando a probabilidade de sobrevivˆencia no infinito ´e diferente de zero (limt→∞S(t) =π)
interpretamos esta quantidadeπ > 0 como uma fra¸c˜ao de curados (Miller et al. 1981). N˜ao podemos observar o conjunto de dados no infinito, por´em para alguns casos a
existˆencia de uma fra¸c˜ao de cura parece ser bem razo´avel. Por exemplo tome o tempo
at´e que um casal rec´em casado se divorciar ou o tempo at´e a conclus˜ao de curso de
um estudante. Esses eventos podem nunca acontecer. Ou seja, existe uma parcela da
popula¸c˜ao que chamamos de “imune ao evento”. Entendemos por imunes os indiv´ıduos
que n˜ao est˜ao sujeitos `a ocorrˆencia do evento de interesse. Em algumas situa¸c˜oes, como
pacientes de cˆancer, podemos usar a terminologia curados.
Observando a calda direita do gr´afico da fun¸c˜ao de sobrevivˆencia estimada
(Esti-mador de Kaplan-Meier) podemos ter um indicativo da presen¸ca de imunes. Uma calda
bem acima de zero sugere uma fra¸c˜ao de curados como ilustrado pela Figura 3.1.
Um fator que pode nos levar a considerar a presen¸ca de imunes em um conjunto de
dados ´e a alta presen¸ca de censura `a direta ao fim do estudo. Por´em um estudo com
tempo de acompanhamento relativamente curto pode nos levar a uma falsa conclus˜ao
da existˆencia de imunes, pois o evento de interesse ainda pode ocorrer para muitas
3.1 Modelo de Mistura Padr˜ao 10
Figura 3.1: Fun¸c˜ao de Sobrevivˆencia estimada para os dados de tempo at´e a conclus˜ao do curso de gradua¸c˜ao em Estat´ıstica da UFRN - 1997 a 2004. Amostra com n = 414 alunos.
serva¸c˜oes. Desta forma, Maller e Zhou (1996) sugerem um tempo de acompanhamento
suficientemente grande, citando como exemplo, um problema real de uma esp´ecie de
tartaruga em que ´e dif´ıcil a identifica¸c˜ao do sexo. Essa identifica¸c˜ao pode ser feita
ape-nas por cirurgia ou no momento em que uma tartaruga coloca ovos, sendo declarado
desta forma fˆemea. Portanto para identificar a propor¸c˜ao de fˆemeas em uma amostra
dessas tartarugas o estudo deve durar pelo menos at´e a maturidade da esp´ecie.
3.1
Modelo de Mistura Padr˜
ao
Em uma abordagem dada inicialmente por Boag (1949) e Berkson e Gage (1952) ´e
proposto um modelo param´etrico que consiste em uma mistura de distribui¸c˜oes. Uma
representa a fun¸c˜ao de sobrevivˆencia dos indiv´ıduos suscet´ıveis ao evento de interesse,
que ir˜ao falhar, e a outra uma fun¸c˜ao degenerada que permite tempos de vida infinitos
para os imunes. Nos referimos a esse modelo comomodelo de mistura padr˜ao. Assuma que um indiv´ıduo i est´a associado `a uma vari´avel aleat´oria M sendo:
M =
1 se o indiv´ıduo suscet´ıvel ao evento
3.2 Modelo de tempo de promo¸c˜ao 11
e tamb´em
P(M =m) =
π se m= 0 1−π se m= 1
Veja que todos os indiv´ıduos comM = 0 tem T =∞. Portanto:
P(T > t|M = 0) = 1
P(T > t|M = 1) =S∗(t)
Portanto para todo t≥0 a verdadeira fun¸c˜ao de sobrevivˆencia para a popula¸c˜ao ´e dada por:
Sp(t) = P(T > t) = P(T > t, Mi = 0) +P(ti > t, Mi = 1)
= P(T > t|Mi = 0)P(Mi = 0) +P(T > t|Mi = 1)P(Mi = 1)
= π+ (1−π)S∗(t)
(3.1)
3.2
Modelo de tempo de promo¸
c˜
ao
Um modelo alternativo ´e proposto por Yakovlev et al. (1993) e Chen et al. (1999)
referido por Rodrigues et al. (2008) como modelo de tempo de promo¸c˜ao. Este modelo
consiste em pressupor a existˆencia de v´arias causas que competem entre si para causar
no indiv´ıduo o evento de interesse.
Sejam Z1, Z2, ..., ZM vari´aveis aleat´orias latentes que representam os tempos at´e a
ocorrˆencia de um evento de interesse, sendoM uma vari´avel aleat´oria n˜ao observ´avel que representa o n´umero de causas que competem para produzir o evento de interesse.
SeM = 0 definimos Z0 tal que P(Z0 =∞) = 1 e neste caso dizemos que o indiv´ıduo
n˜ao ´e suscet´ıvel ao evento de interesse. O tempo de sobrevivˆencia observ´avel ´e definido
como T = min{Z0, Z1, ..., ZM}. Assumindo M como uma vari´avel aleat´oria com
3.3 Modelo Unificado 12
distribu´ıdas com fun¸c˜ao de distribui¸c˜ao F(·) e sobrevivˆencia S(·) = 1−F(·). Temos que a fun¸c˜ao de sobrevivˆencia populacional ´e dada por:
Sp(t) = e−θF(t). (3.2)
A fra¸c˜ao de cura correspondente ao modelo 3.2 ´e dada por:
lim
t→∞Sp(t) =e −θ.
3.3
Modelo Unificado
Abordamos agora o modelo de fra¸c˜ao de cura unificado proposto por Rodrigues
et al. (2009) que representa uma extens˜ao dos modelos de longa dura¸c˜ao proposto por
Chen et al. (1999).
Como antes, seja M, uma vari´avel aleat´oria representando o n´umero de causas ou riscos da ocorrˆencia de um particular evento de interesse com distribui¸c˜ao denotada por
p(m) =P(M =m), m= 0,1,2, ...
Considere que, dado M =m, Zj,j = 1, ...m, s˜ao vari´aveis aleat´orias independentes
e identicamente distribu´ıdas, representando o tempo de ocorrˆencia do evento de
inte-resse devido `a j-´esima causa ou risco, com fun¸c˜ao de sobrevivˆencia S(·) = 1−F(·) e fun¸c˜ao de densidade de probabilidadef(·) independentes de M.
O tempo at´e ocorrˆencia do evento de interesse para um indiv´ıduo da popula¸c˜ao ´e
dado por T = min{Z0, ..., ZM}, sendo que P(Z0 = ∞) = 1. Esta suposi¸c˜ao admite
a possibilidade de uma propor¸c˜ao p(0) da popula¸c˜ao n˜ao apresentar a ocorrˆencia do evento de interesse. As vari´aveis aleat´orias Zj e M s˜ao vari´aveis latentes, ou seja, n˜ao
observ´aveis, enquanto T ´e uma vari´avel observ´avel. Sejaa =am uma sequˆencia de n´umeros reais. Se
3.3 Modelo Unificado 13
converge para s ∈ [0,1], ent˜ao definimos Aa(s) como a fun¸c˜ao geradora da sequˆencia
am (Feller 2008).
A fun¸c˜ao de sobrevivˆencia populacional deT definido porSp(t) = P(T > t) ´e dada
abaixo (sua demonstra¸c˜ao encontra-se no Apˆendice B.1).
Sp(t) = Ap(S(t)) = ∞
X
m=0
p(m)(S(t))m, (3.4)
sendoAp(·) a fun¸c˜ao geradora da sequˆencia p=p(m). Note queSp ´e impr´opria, ou
seja, o limt→∞Sp(t) = p(0) = P(M = 0) > 0 corresponde `a propor¸c˜ao de indiv´ıduos
imunes ou curados, ou seja, a fra¸c˜ao de cura.
Podemos ent˜ao apresentar a fun¸c˜ao Sp(t) dada em (3.4) como uma mistura de
dis-tribui¸c˜oes
semelhante ao Modelo de Mistura Padr˜ao apresentado na Se¸c˜ao 3.1.
Defina S∗(t) = P(T > t|M > 0), ´e f´acil ver que esta pode ser representada por
S∗(t) = P∞
m=1p∗(m)[S(t)]m, sendo p∗(m) = p(m)
1−p(0) a fun¸c˜ao de sobrevivˆencia
condi-cional de T dada a ocorrˆencia do evento de interesse, temos ent˜ao que o modelo de fra¸c˜ao de cura unificado proposto por Rodrigues et al. (2009) pode ser representado
por
Sp(t) =p(0) + (1−p(0))S∗(t) (3.5)
Note tamb´em que S∗(t) ´e uma fun¸c˜ao de sobrevivˆencia pr´opria pois
limt→∞S∗(t) = 0.
A fun¸c˜ao de densidade para a popula¸c˜ao ´e obtida pelo negativo da derivada de
(3.4), ou seja,
fp(t) =−
∂Sp(t)
∂t =−S
′ p(t) =
∞
X
m=0
f(t)p(m)m(S(t))m−1. (3.6) Decorre de (3.5) que a fun¸c˜ao densidade condicional `a ocorrˆencia do evento de
3.4 Alguns casos particulares do modelo unificado 14
f∗(t) = −∂S∗(t)
∂t =−S
∗′(t). (3.7)
A fun¸c˜ao risco incondicional `a ocorrˆencia do evento de interesse, denotado porhp(t)
´e dada por
hp(t) =
fp(t)
Sp(t)
, (3.8)
e a condicional `a ocorrˆencia do evento de interesse por
h∗(t) = f∗(t)
S∗(t). (3.9)
3.4
Alguns casos particulares do modelo unificado
Sabemos que M ´e uma vari´avel aleat´oria discreta representando o n´umero de pos-s´ıveis causas que podem levar um indiv´ıduo ao evento de interesse. Nesta se¸c˜ao
apre-sentamos algumas fun¸c˜oes geradoras (retiradas de Feller 2008) das probabilidades
as-sociadas a importantes distribui¸c˜oes de probabilidade que podemos usar para definir
M.
• SE M ∼ Bernoulli(1−θ), p(m) = (1−θ)mθ1−m, sendo 0 < θ < 1 e m = 0, 1
ent˜ao
Ap(s) = θ+ (1−θ)s.
• Se M ∼ Binomia(θ), p(m) = mn
θm(1− θ)n−m, sendo 0 < θ < 1, n ≥ 1 e
m = 0,1,2, . . . ent˜ao
Ap(s) = (1−θ+θs)n.
• Se M ∼Poisson(θ),p(m) = e−θθm
m! , sendoθ > 0 e m= 0,1,2, . . . ent˜ao
Ap(s) =e−θ(1−s).
3.4 Alguns casos particulares do modelo unificado 15
ent˜ao
Ap(s) =
θ
1−(1−θ)s.
• Se M ∼BinomiaNegativa(η, θ),p(m) = Γ(ηΓ(η−−11+m))m!
ηθ 1+ηθ
m
(1 +ηθ)−
1
η, sendoθ >
0, η > −1
θ e m = 0,1,2, . . . nesta vers˜ao mais geral da distribui¸c˜ao binomial
negativa (Piegorsch 1990; Saha e Paul 2005) temos
Ap(s) = (1 +ηθ(1−s))−
1
η.
Devemos por´em observar com mais cuidado dois desses casos particulares, pois estes
se apresentam como os resultados das Se¸c˜oes 3.1 e 3.2.
3.4.1
Modelo de Mistura Padr˜
ao
Considere que M possui uma distribui¸c˜ao Bernoulli(1 − θ). Desta forma
p(m) = Pθ(M = m) = (1 − θ)mθ1−m, m = 0, 1. Logo existe apenas uma causa
que pode levar um indiv´ıduo ao evento de interesse, portanto, T = min{Z0, Z1} com
P(Z0 = ∞) = 1 e P(Z1 > z) = S(z). Sendo p(0) = Pθ(M = 0) = θ a fra¸c˜ao de
cura correspondente. Os resultados obtidos est˜ao relacionados ao modelo de mistura
padr˜ao visto na Se¸c˜ao 3.1. As respectivas fun¸c˜oes de sobrevivˆencia, densidade e risco
populacionais e condicionais `a ocorrˆencia do avento de interesse s˜ao dadas por:
Fun¸c˜oes de Fun¸c˜ao Populacional de T Fun¸c˜ao condicional
`a ocorrˆencia do evento de interesse
Sobrevivˆencia Sp(t) = θ+ (1−θ)S∗(t) S∗(t) =S(t)
Densidade fp(t) = (1−θ)f∗(t) f∗(t) =f(t)
Risco hp(t) =f(t)
1−θ
θ+ (1−θ)S(t) h
∗(t) = f(t)
3.4 Alguns casos particulares do modelo unificado 16
3.4.2
Modelo de Tempo de Promo¸
c˜
ao
Considerando que o n´umero de poss´ıveis causas que podem levar um indiv´ıduo ao
evento de interesse seja M ∼ Poisson(θ). Neste caso temos p(m) = Pθ(M = m) = e−θθm
m! , m = 0,1,2, . . . com T = min{Z0, Z1, . . . , ZM}, P(Z0 =∞) = 1 e P(Z1 > z) =
S(z). A fra¸c˜ao de cura neste caso ´e dada por p(0) = Pθ(M = 0) = e−θ. Os resultados
obtidos est˜ao relacionados com o modelo de tempo de promo¸c˜ao visto em 3.2. As
respectivas fun¸c˜oes de sobrevivˆencia, densidade e risco populacionais e condicionais `a
ocorrˆencia do evento de interesse s˜ao dadas por:
Fun¸c˜oes de Fun¸c˜ao Populacional de T Fun¸c˜ao condicional
`a ocorrˆencia do evento de interesse
Sobrevivˆencia Sp(t) =e−θ(1−S(t)) S∗(t) =
exp{−θ(1−S(t))} −exp{−θ}
1−exp{−θ}
Densidade fp(t) =θf(t)e−θ(1−S(t)) f∗(t) =
exp{−θ(1−S(t))}
1−exp{−θ} θf(t)
Risco hp(t) = θf(t) h∗(t) =
exp{−θ(1−S(t))}
exp{−θ(1−S(t))} −exp{−θ}hp(t)
3.4.3
Fun¸
c˜
ao de Verossimilhan¸
ca
Suponha uma amostra com n indiv´ıduos e para cada indiv´ıduo i, i= 1, . . . , n, s˜ao associados as seguintes vari´aveis:
• Mi: Vari´avel aleat´oria n˜ao observ´avel discreta com fun¸c˜ao de probabilidade
Pθ(Mi =mi) =pθ(mi), sendo θ um vetor de parˆametros desconhecidos;
• Zij: Vari´aveis i.i.d. n˜ao observ´aveis representando o tempo at´e a ocorrˆencia do
evento de interesse devido `aj-´esima causa ou risco, j = 1, ..., Mi, com fun¸c˜ao
dis-tribui¸c˜aoF(·;ψ), fun¸c˜ao de sobrevivˆenciaS(·;ψ) = 1−F(·;ψ) e fun¸c˜ao densidade
3.4 Alguns casos particulares do modelo unificado 17
• Ti: tempo de falha observado, dado por Ti = min{Ti∗, Ci}, com
T∗
i = min{Zi0, Zi1, . . . , ZiMi} e Ci o tempo de censura para o individuo i; • δi: indicador de falha, sendo δi =
1 , se T∗ i ≤Ci
0 , se T∗ i > Ci
;
O conjunto dos dados completos ´e representado porDc = (n,T,δ,M), sendo T =
(T1, T2, . . . , Tn)′, δ = (δ1, δ2, . . . , δn)′, M = (M1, M2, . . . , Mn)′ e o conjunto de dados
observados por D = (n,T,δ). A fun¸c˜ao de verossimilhan¸ca relativa `a distribui¸c˜ao conjunta dos vetoresT,δ e Mpode ser representada por:
L(ψ, θ;Dc) = Qi=1n f(ti, δi, mi)
= Qn
i=1f(ti, δi|mi)pθ(mi).
(3.10)
Sejam fT e g as fun¸c˜oes densidade de probabilidade de Ti∗ e Ci respectivamente, e
ST e Gsuas fun¸c˜oes de sobrevivˆencia. Ent˜ao:
ST(t|mi) = P(Ti ≥t|Mi =mi)
= P(min{Z0, Z1, . . . , Zmi} ≥t)
= P(Z0 ≥t, Z1 ≥t, . . . , Zmi ≥t)
= P(Z0 ≥t)P(Z1 ≥t), . . . , P(Zmi ≥t)
= 1·S(t;ψ)·S(t;ψ)· · ·S(t;ψ) = S(t;ψ)mi.
(3.11)
Por (3.6) temos
fT(t|mi) =
∂Sp(t|mi)
∂t
= mif(t;ψ)S(t;ψ)mi−1.
(3.12)
A express˜ao f(ti, δi|Mi =mi) pode ser particionada em dois casos disjuntos. Para
δi = 0 e para δi = 1. Desta forma, e utilizando (3.11) e (3.12), temos:
3.4 Alguns casos particulares do modelo unificado 18
f(ti, δi|mi) = lim ∆t→0
P(ti ≤Ti < ti+ ∆t, δ = 0|Mi =mi)
∆ti
= lim
∆ti→0
P(ti ≤Ci < ti+ ∆t, Ti∗ > Ci|Mi =mi)
∆t
∼
= lim
∆ti→0
P(ti ≤Ci < ti+ ∆t, Ti∗ > t|Mi =mi)
∆t
= lim
∆t→0
P(ti ≤Ci < ti+ ∆ti|Mi =mi)
∆t
P(Ti > t|Mi =mi)
= g(ti|mi)ST(ti|mi)
= S(ti;ψ)mig(ti|mi)
(3.13)
e paraδ = 1
f(ti, δi|mi) = lim ∆t→0
P(ti ≤Ti < ti+ ∆t, δ= 1|Mi =mi)
∆t
= lim
∆t→0
P(ti ≤Ti∗ < ti+ ∆t, Ti∗ ≤Ci|Mi =mi)
∆t
∼
= lim
∆t→0
P(ti ≤Ti∗ < ti+ ∆t, Ci ≥t|Mi =mi)
∆t
= lim
∆t→0
P(ti ≤Ti∗ < ti+ ∆t|Mi =mi)
∆t
P(Ci ≥t|Mi =mi)
= fT(ti|mi)G(ti|mi)
= G(ti|mi)mif(ti;ψ)S(ti;ψ)mi−1.
(3.14)
Portanto, de (3.13) e (3.14), a distribui¸c˜ao de (ti, δi) dadoMi =mi, i= 1, . . . , n ´e
f(ti, δi|mi) =
S(ti;ψ)mig(ti|mi) seδ = 0
G(ti|mi)mif(ti;ψ)S(ti;ψ)mi−1 seδ = 1
(3.15)
3.4 Alguns casos particulares do modelo unificado 19
f(ti, δi|mi) = [S(ti;ψ)mig(ti|mi)]1−δi
G(ti|mi)mif(ti;ψ)S(ti;ψ)mi−1
δi
(3.16)
Substituindo (3.16) em (3.10) temos que a fun¸c˜ao de verossimilhan¸ca para os dados
completos, sob a suposi¸c˜ao de censura n˜ao informativa para os parˆametros de interesse
e usando um certo abuso de linguagem para abandonar o s´ımbolo “proporcional” ´e:
L(ψ, θ;Dc) = n
Y
i=1
[S(ti;ψ)mi]1−δi
mif(ti;ψ)S(ti;ψ)mi−1
δi
pθ(mi) (3.17)
3.4.4
Verossimilhan¸
ca Marginal
Para obter a verossimilhan¸ca marginal fazemos o somat´orio da distribui¸c˜ao conjunta
de (Ti,δi, Mi) nas vari´aveis n˜ao observadas mi.
f(ti, δi) = ∞
X
mi=0
f(ti, δi, mi)
=
∞
X
mi=0
f(ti, δi|mi)pθ(mi)
(3.18)
Portanto a verossimilhan¸ca marginal para o conjunto de dados observados
D= (n,T,δ) ´e dada por:
L(ψ, θ;D) =
n
Y
i=1 ∞
X
mi=0
[S(ti;ψ)mi]1− δi
mif(ti;ψ)S(ti;ψ)mi−1
δi
pθ(mi). (3.19)
Abordando agora o modelo de sobrevivˆencia de longa dura¸c˜ao consideramos (3.19)
nos seguintes casos:
3.5 Incluindo Covari´aveis na Fra¸c˜ao de Cura 20
L(ψ, θ;D) =
n Y i=1 ∞ X m=0
[pθ(mi)S(ti;ψ)mi]
=
n
Y
i=1
Sp(ti;φ),
(3.20)
sendo φ= (ψ, θ). Recorrendo `a (3.4) na ´ultima passagem.
• δ = 1
L(φ;D) =
n Y i=1 ∞ X m=0
f(ti;ψ)pθ(mi)miS(ti;ψ)mi−1
=
n
Y
i=1
fp(ti;φ),
(3.21)
recorrendo `a (3.6) na ´ultima passagem. Desta forma, sintetizando (3.20) e (3.21)
em uma ´unica equa¸c˜ao
L(φ;D) =
n
Y
i=1
[Sp(ti;φ)]1−δi[fp(ti;φ),]δi (3.22)
3.5
Incluindo Covari´
aveis na Fra¸
c˜
ao de Cura
Descrevemos na Se¸c˜ao 2.2 os modelos de tempo falha acelerado que associam
co-vari´aveis ao tempo de vida atrav´es do parˆametro de posi¸c˜ao µ = x′β. Em modelos de sobrevivˆencia com fra¸c˜ao de cura, as covari´aveis podem ser inclu´ıdas atrav´es do
parˆametroθ =θ(x′γ) sendoγ = (γ0, γ1, . . . , γp) um vetor de coeficientes de regress˜ao.
Nos modelos de Mistura e de Promo¸c˜ao (vistos nas se¸c˜oes 3.1 e 3.2) essa associa¸c˜ao
entre covari´aveis e fra¸c˜ao de cura est´a relacionada com `a fun¸c˜ao de liga¸c˜ao canˆonica
considerada em Modelos Lineares Generalizados (Nelder e Wedderburn 1972). Portanto
associamos covari´aveis ao Modelo de Mistura considerando a liga¸c˜ao log´ıstica:
θ(x′γ) = e x′γ
3.5 Incluindo Covari´aveis na Fra¸c˜ao de Cura 21
θ(x′γ) = ex′γ.
Aqui desejamos descrever no contexto do modelo unificado, a inclus˜ao de
covari´a-veis no parˆametro θ. Considere que θ =θ(x′γ) ´e uma fun¸c˜ao das covari´aveis. Assim,
seja M uma vari´avel aleat´oria discreta representando o n´umero de causas que podem levar um indiv´ıduo a ocorrˆencia do evento de interesse com fun¸c˜ao de probabilidade
p(m) = Pθ(M = m), m = 0,1,2, ... . Dado M = m sejam Zj, j = 1, ...m,
vari-´aveis aleat´orias independentes e identicamente distribu´ıdas, representando o tempo
de ocorrˆencia do evento de interesse devido `a j-´esima causa ou risco, com fun¸c˜ao de
sobrevivˆencia S(·;ψ) = 1−F(·;ψ) e fun¸c˜ao de densidade de probabilidade f(·;ψ) in-dependentes de M. Esta inclus˜ao de covari´aveis na fra¸c˜ao de cura ´e apresentada em Rodrigues et al. (2008) usando como exemplo para a densidade de Z a distribui¸c˜ao Weibull para o Modelo de Mistura e para o Modelo de Promo¸c˜ao.
3.5.1
Fun¸
c˜
ao de Verossimilhan¸
ca
Sejam x= (xi1, xi2, . . . , xip)′ vetor de covari´aveis relacionado a cada indiv´ıduo em
uma amostra de tamanhon. Sejaγ = (γ1, γ2, . . . , γp) coeficientes de regress˜ao
associa-dos `a fra¸c˜ao de curaassocia-dos atrav´es de θ(x′γ) pela fun¸c˜ao de probabilidade da vari´avel
aleat´oria M, pγ(m) = Pθ(x′γ)(M = m), m = 0,1,2, ... ent˜ao de forma muito seme-lhante a se¸c˜ao 3.4.3 obtemos a fun¸c˜ao de verossimilhan¸ca para os dados completos
Dc = (n,x,T,δ,M):
L(φ;Dc) = n
Y
i=1
[S(ti;ψ)mi]1− δim
if(ti;ψ)S(ti;ψ)mi−1
δi
pγ(mi), (3.23) sendoφ = (ψ, γ) e a verossimilhan¸ca marginal para os dados observadosD= (n,x,T,δ) dada por:
L(φ;D) =
n
Y
i=1
[Sp(ti;φ)]1− δi
[fp(ti;φ)] δi
Cap´ıtulo 4
Modelos de tempo de falha
acelerado com fra¸
c˜
ao de Cura: Uma
abordagem unificada
Vimos no Cap´ıtulo anterior modelos que fazem uso de covari´aveis apenas na fra¸c˜ao
de cura. Usando o Modelo de Mistura Padr˜ao Yamaguchi (1992) estende o MTFA
log-gama generalizado para a avaliar simultaneamente o efeito de covari´aveis tanto
na acelera¸c˜ao/desacelera¸c˜ao do tempo de falha quanto seus efeitos na fra¸c˜ao de cura.
De forma similar Ortega et al. (2009) utiliza o MTFA log-gama generalizado usando
o Modelo de Tempo de Promo¸c˜ao. Neste Cap´ıtulo propomos uma vis˜ao unificada
para estes modelos e observamos essas duas abordagens como casos particulares de um
modelo geral. Por fim implementamos esses casos no software R.
4.1
Regress˜
ao log-gama generalizada
A partir da distribui¸c˜ao gama generalizada introduzida por Stacy (1962) e
repara-metrizada por Prentice (1974), Farewell e Prentice (1977) e Lawless (1980) apresentam
o modelo de regress˜ao log-gama generalizado estendido (l.g.g.). O modelo l.g.g.
esten-dido ´e de grande importˆancia pois possui como casos particulares alguns dos modelos
param´etricos mais usados na an´alise de sobrevivˆencia como os modelos weilbull e
log-normal.
4.1 Regress˜ao log-gama generalizada 23
Considere um vetor de covari´aveis x, de ordem p×1, associado com o tempo de vida T para cada indiv´ıduo. Modelos de tempo de falha acelerado s˜ao modelos de regress˜ao que se caracterizam pelo fato da vari´avel Y = log(T) ter uma distribui¸c˜ao com parˆametro de posi¸c˜ao µ(x) =β′x, e um parˆametro de escala σ constante. Pode
ser representada por:
Y = log(T) = βx′ +σǫ, (4.1)
sendo σ > 0 e β=(β1,· · ·, βp)T parˆametros desconhecidos e ǫ um erro aleat´orio cuja
distribui¸c˜ao n˜ao depende dex.
A fam´ılia estendida log-gama generalizada (l.g.g.) paraY ´e obtida quando assumi-mos queǫ tem densidade
fǫ(ǫ) =
|q| Γ(q−2
)(q− 2)(q−2
)exp{q−1ǫ−q−2exp(qǫ)} se q 6= 0 1
√
2π exp(− ǫ−2
2 ) se q= 0,
(4.2)
e fun¸c˜ao de sobrevivˆencia
Sǫ(ǫ) =
Q[q−2, q−2e{qǫ}] se q <0
1−Q[q−2, q−2e{qǫ}] se q >0
1−Φ(ǫ) seq = 0,
(4.3)
sendo −∞< q <∞ e Q(k, a) a fun¸c˜ao integral gama incompleta
Q(k, a) =
Z ∞
a
tk−1
Γ(k)e
−t
dt. (4.4)
Obtemos como casos particulares do modelo l.g.g. estendido o modelo Weibull para
4.2 MTFA incluindo covari´aveis na fra¸c˜ao de cura 24
4.2
MTFA incluindo covari´
aveis na fra¸
c˜
ao de cura
A inclus˜ao de fra¸c˜ao de cura com covari´aveis ao MTFA permite uma an´alise
si-multˆanea da influˆencia das covari´aveis na acelera¸c˜ao/desacelera¸c˜ao do tempo de falha
e seus efeitos na fra¸c˜ao de curados.
Suponha para uma amostra denindiv´ıduos o vetor de covari´aveisxi = (xi1, xi2, . . . , xip)′.
Seja Mi o n´umero de causas ou riscos da ocorrˆencia do evento de interesse para cada
indiv´ıduo com fun¸c˜ao de probabilidade pγ(mi) = Pθ(x′γ)(Mi = mi), mi = 0,1,2, ..., sendo γ = (γ0, γ1, . . . , γp)′ vetor de parˆametros desconhecidos associados `a fra¸c˜ao de
cura. Dado Mi = mi, sejam Zij, j = 1, ...mi, vari´aveis aleat´orias independentes e
identicamente distribu´ıdas, com fun¸c˜ao densidade de probabilidade e de sobrevivˆencia
independentes de M representando o tempo at´e a ocorrˆencia do evento de interesse para oi-´esimo indiv´ıduo. Considere tamb´emT∗
i = min{Zi0, Zi1, . . . , ZiMi}o tempo at´e
a ocorrˆencia do evento de interesse para o indiv´ıduoi.
Tomando a vari´avel aleat´oriaWij = log(Zij) como pertencente `a fam´ılia de modelos
de posi¸c˜ao e escala temos
Wij =x′iβ+σǫi,
sendoβ = (β0, β1, . . . , βp)′ vetor de parˆametros desconhecidos associados ao tempo
de falha e ǫ uma vari´avel aleat´oria com fun¸c˜ao densidade de probabilidade g(·;ξ) e fun¸c˜ao de sobrevivˆenciaG(·;ξ), sendo ξ um vetor de parˆametros desconhecidos.
Ent˜ao a fun¸c˜ao densidade de probabilidade deWij para um dado vetor de covari´aveis
xi ser´a dada por
f(wij;xi,β, σ, ξ) =
1
σg
wij −x′iβ
σ ;ξ
, (4.5)
e fun¸c˜ao de sobrevivˆencia dada por
S(wij;xi,β, σ, ξ) = G
wij −x′iβ
σ ;ξ
4.2 MTFA incluindo covari´aveis na fra¸c˜ao de cura 25
Considere agora Ti = min{Ti∗, Ci} e Yi = log(Ti) respectivamente o tempo at´e a
ocorrˆencia do evento de interesse observado e seu logaritmo, sendo T∗
i o tempo at´e a
ocorrˆencia do evento de interesse e Ci o tempo de censura, para o i-´esimo indiv´ıduo.
Portanto Yi = min{logT∗,logC} e logT∗ = min{log(Zi0),log(Zi1), . . . ,log(ZiMi)}
en-t˜ao obtemos de forma semelhante `a equa¸c˜ao 3.4 a fun¸c˜ao de sobrevivˆencia populacional
dada por
P(logTi∗ > vi) =Sp(vi;φ) = ∞
X
mi=0
pγ(mi)[S(vi;xi,β, σ, ξ)]
mi, (4.7)
sendo vi = log(ti) e φ = (β,γ, σ, ξ). Tamb´em de forma semelhante ao modelo
unificado (equa¸c˜ao 3.5) apresentamos o MTFA com Fra¸c˜ao de Cura Unificado dado por:
Sp(vi;φ) = pγ(0) + (1−pγ(0))S∗(vi;φ), (4.8) sendo pγ(0) a fra¸c˜ao de cura dependente de γ, e
S∗(vi;φ) = ∞
X
mi=1
[p∗γ(mi)S(vi;x,β, σ, ξ)]
mi, sendo p∗
γ(mi) =
pγ(mi) 1−pγ(0)
,
a fun¸c˜ao de sobrevivˆencia dependente `a ocorrˆencia do evento de interesse. A fun¸c˜ao de
densidade populacional ser´a
fp(vi;φ) = −Sp′(vi;φ) (4.9)
De forma similar aos resultados obtidos na se¸c˜ao 3.4.3 temos que a fun¸c˜ao de
verossimilhan¸ca para os dados completosDc = (n,x,Y,δ,M), sendoY = (y1, . . . , yn)
o vetor do logaritmo dos tempos observados e δ = (δ1, . . . , δn) o vetor dos indicadores
de censura, ser´a
L(φ;Dc) = n
Y
i=1
[S(yi;φ)mi]1−δi
mif(yi;φ)S(yi;φ)mi−1
δi
4.3 Casos Particulares do MTFA com fra¸c˜ao de cura unificado 26
e a verossimilhan¸ca marginal para os dados observadosD= (n,x,Y,δ) ser´a
L(φ;D) =
n
Y
i=1
[Sp(yi;φ)]1−δi[fp(yi;φ)]δi. (4.11)
4.3
Casos Particulares do MTFA com fra¸
c˜
ao de cura
unificado
Vimos na se¸c˜ao 3.4 alguns casos particulares para o n´umeroM de poss´ıveis causas que podem levar um indiv´ıduo ao evento de interesse para o modelo unificado (equa¸c˜ao
3.5). Apresentamos nesta se¸c˜ao alguns casos particulares para diferentes distribui¸c˜oes
de Mi e assumimos o modelo de regress˜ao log-gama generalizado para log (Zij),
i= 1, . . . , n ej = 1, . . . , Mi.
4.3.1
MTFA l.g.g. com modelo de mistura padr˜
ao
Partindo do MTFA com fra¸c˜ao de cura unificado apresentado na equa¸c˜ao 4.8,
atribu´ımos para a vari´avel aleat´oriaM uma distribui¸c˜ao Bernoulli(1−θ). Desta forma as fun¸c˜oes de densidade e de sobrevivˆencias populacionais s˜ao semelhantes `as
apresen-tadas na se¸c˜ao 3.4.1. A partir das equa¸c˜oes 4.11, 4.5 e 4.6 apresentamos fun¸c˜ao de
verossimilhan¸ca
L(φ;D) =
n
Y
i=1
θ(x′iγ) + (1−θ(x′iγ))G
yi−x′iβ
σ ;ξ
1−δi
(1−θ(x′iγ))
1
σg
yi−x′iβ
σ ;ξ
δi
,
(4.12)
sendoφ= (β,γ, σ, ξ),yi = log(t∗i) o logaritmo do tempo observado, δi o indicador se o
tempo ´e de falha ou de censura,γ = (γ0, γ1, . . . , γp)′ o vetor de covari´aveis de regress˜ao
associados `a fra¸c˜ao de cura, β = (β0, β1, . . . , βp)′ o vetor de covari´aveis de regress˜ao
associados ao tempo de falha eθ(x′iγ) = x′iγ
1+x′iγ.
Apre-4.3 Casos Particulares do MTFA com fra¸c˜ao de cura unificado 27
sentamos ent˜ao a fun¸c˜ao de log-verossimilhan¸ca para o MTFA l.g.g. com modelo de
mistura:
l(β,γ, σ, q;D) = Pn
i=1[(1−δi) log[(1−θ(x′iγ))Sǫ(ǫi;q,β, σ)−logσ) +θ(x′iγ)]
+δi[log(1−θ(x′iγ)) + logfǫ(ǫi;q,β, σ)−logσ]],
(4.13)
sendo ǫi = (log(ti)−x′iβ)/σ. Desta forma conseguimos apresentar o mesmo resultado
mostrado por Yamaguchi (1992).
4.3.2
MTFA l.g.g com Modelo de Tempo de Promo¸
c˜
ao
Partindo novamente do MTFA com fra¸c˜ao de cura unificado apresentado na equa¸c˜ao
4.8, atribu´ımos agora para a vari´avel aleat´oria M uma distribui¸c˜ao Poisson(θ). Desta forma as fun¸c˜oes de densidade e de sobrevivˆencias populacionais s˜ao semelhantes `as
apresentadas na se¸c˜ao 3.4.2. A partir das equa¸c˜oes 4.11, 4.5 e 4.6 apresentamos fun¸c˜ao
de verossimilhan¸ca
L(φ;D) = Qn
i=1
"
e−θ(x
′
iγ)
1−G
yi−x′
iβ σ ;ξ
#1−δi
×
"
θ(x′ iγ)σ1f
y
i−x′iβ
σ ;ξ
e−θ(x
′
iγ)
1−G
yi−x′
iβ σ ;ξ
#δi
= Qn
i=1
("
e−θ(x
′
iγ)
1−G
yi−x′
iβ σ ;ξ
#
h
θ(x′ iγ)1σf
y
i−x′iβ
σ ;ξ
iδi
)
.
(4.14)
As fun¸c˜oesgeGcorrespondem respectivamente `as fun¸c˜oes de densidade e de sobre-vivˆencia do modelo de regress˜ao log-gama generalizado. Apresentamos ent˜ao a fun¸c˜ao
4.4 Estimando os parˆametros 28
l(β,γ, σ, q;D) = Pn
i=1[−θ(x′iγ)(1−Sǫ(ǫi;q,β, σ))
+δi(log(θ(x′iγ))−log(σ) + log(fǫ(ǫi;q,β, σ)))],
= P
i∈C{log(θ(x′iγ))−log(σ) + log(fǫ(ǫi;q,β, σ))}
−θ(x′
iγ)(1−Sǫ(ǫi;q,β, σ))
(4.15)
sendo a nota¸c˜ao i ∈ C correspondente aos itens censurados e ǫi = (log(ti)−x′iβ)/σ.
Desta forma conseguimos apresentar o mesmo resultado mostrado por Ortega et al.
(2009).
4.4
Estimando os parˆ
ametros
Para obter as estimativas de verossimilhan¸ca dos coeficientes β, γ e σ, Yamaguchi (1992) utiliza o m´etodo de Newton-Raphson em um procedimento de 2 etapas
apresen-tado em Lawless (1982) para o MTFA l.g.g. fazendo uma adapta¸c˜ao para a inclus˜ao de
covari´aveis na fra¸c˜ao de cura. Ortega et al. (2009) utiliza-se da sub-rotinaMAXBFGS
dispon´ıvel no software Ox (ver, por exemplo, Doornik 2001) utilizando tamb´em do
pro-cedimento de 2 etapas.
Este procedimento consiste em fixarmos diferentes valores paraqno intervalo [−3,3] e encontramos as estimativas de m´axima verossimilhan¸ca β˜(q), γ˜(q) e ˜σ(q) determi-nado a fun¸c˜ao de verossimilhan¸ca maximizada Lmax(q), o maior valor de Lmax(q) nos
retornar´a ˆq. As estimativas de m´axima verossimilhan¸ca de β, γ e σ s˜ao respectiva-mente os valores de βˆ = β˜(ˆq), γˆ = ˜γ(ˆq) e ˆσ = ˜σ(ˆq). Os valores de q s˜ao escolhidos no intervalo [−3,3] pois a fun¸c˜ao densidade da distribui¸c˜ao l.g.g. pouco se diferencia para valores distantes deq= 0. O m´etodo em duas etapas ´e recomendado na literatura pois evita problemas de convergˆencia para a estima¸c˜ao dos parˆametros (ver detalhes
em Valen¸ca 1994).
Neste trabalhos propomos a estima¸c˜ao dos parˆametros atrav´es da sub-rotinaoptim
4.4 Estimando os parˆametros 29
da fun¸c˜ao de verossimilhan¸ca marginalizada (equa¸c˜ao 4.11). Inicialmente tentamos a
estima¸c˜ao simultˆanea dos parˆametros β, γ, σ e q, por´em n˜ao obtivemos convergˆencia nos resultados. Constru´ımos ent˜ao um algoritmo utilizando-se do m´etodo em 2 etapas
obtendo resultados muito semelhantes aos obtidos por Yamaguchi (1992) e Ortega et al.
Cap´ıtulo 5
Reprodu¸
c˜
ao de resultados e
Aplica¸
c˜
ao
Neste Cap´ıtulo reproduzimos os resultados obtidos por Yamaguchi (1992) e Ortega
et al. (2009) em seus respectivos trabalhos usando nosso algor´ıtimo apresentado no
Apˆendice A. Em seguida estudamos um conjunto de dados reais obtidos de Macedo e
Valen¸ca (2009), contendo informa¸c˜oes a respeito de 355 pacientes com cˆancer de mama
atendidas no Hospital Prof. Dr. Luiz Antˆonio, Natal RN, no per´ıodo de 1991 `a 1995.
5.1
Reprodu¸
c˜
ao de resultados
Para confirmar a eficiˆencia do nosso algor´ıtimo, reproduzimos alguns resultados
relevantes para o nosso estudo.
5.1.1
MTFA l.g.g. com modelo de mistura padr˜
ao
Em seu artigo Yamaguchi (1992) estuda a mobilidade inter-firmas de trabalhadores
no Jap˜ao, observando o tempo at´e separa¸c˜ao do empregado em diferentes empresas.
Desta forma um trabalhador que se aposenta em um empresa corresponde a um
indiv´ı-duo “imune”. As covari´aveis envolvidas s˜ao o tamanho da empresa, medido pelo n´umero
de funcion´arios ou se a empresa ´e governamental, e o tipo de empregado, classificados
como colarinho azul para trabalhos que requerem m˜ao-de-obra f´ısica e colarinho branco
5.1 Reprodu¸c˜ao de resultados 31
para os que n˜ao s˜ao considerados trabalhos manuais.
Tabela 5.1: Estimativa dos parˆametros para o MTFA l.g.g. com modelo de mistura padr˜ao - 1975 Social Stratification and Mobility Survey in Japan
Parˆametro Obtidos no R Originais
Estimativa E.P. p.valor(Wald) Estimativa E.P. p.valor(Wald)
β0 1,74 0,069 0,000 1,81 0,07 0,000
β1−4 -0,24 0,094 0,011 -0,24 0,07 0,000
β5−29 -0,15 0,078 0,057 -0,15 0,08 0,057
β30−299 -0,17 0,082 0,034 -0,14 0,08 0,089
β300−999 -0,26 0,100 0,010 -0,25 0,10 0,012
βGoverno -0,18 0,101 0,082 -0,18 0,10 0,072
βC.Azul 0,08 0,053 0,130 -0,08 0,05 0,134
σ 0,84 0,025 0,000 0,85 -0,16 0,000
γ0 -1,26 0,231 0,000 -0,38 0,21 0,072
γ1−4 -7,21 10,168 0,478 −∞ ∞ 1,000
γ5−29 -2,42 0,656 0,000 -2,36 0,62 0,000
γ30−299 -1,01 0,287 0,000 -0,75 0,34 0,028
γ300−999 -0,67 0,312 0,032 -0,18 0,37 0,617
γGoverno -0,42 0,251 0,096 -0,11 0,28 0,689
γC.Azul 1,11 0,230 0,000 -0,60 0,28 0,036
Na Tabela 5.1 vemos a semelhan¸ca entre os resultados obtidos por Yamaguchi e os
obtidos pelo nosso algor´ıtimo. Podemos ver por´em uma dificuldade de convergˆencia
quanto aos coeficientes que assintoticamente v˜ao para −∞ e para∞.
5.1.2
MTFA l.g.g. com modelo de tempo de promo¸
c˜
ao
Ortega et al. (2009) apresenta uma aplica¸c˜ao para dados de pacientes com cˆancer
de pele ,obtido de Ibrahim et al. (2001), para o MTFA l.g.g. com modelo de tempo
de promo¸c˜ao. Sendo as covari´aveis x1: Tratamento; x2: Idade em anos; x3: Tipo de
5.2 Aplica¸c˜ao 32
Tabela 5.2: Estimativas dos parˆametros para o MTFA l.g.g. com modelo de tempo de promo¸c˜ao - Dados de cˆancer de pele retirados de Ibrahim et al. (2005)
Parˆametro Obtidos no R Originais
Estimativa E.P. p.valor(Wald) Estimativa E.P. p.valor(Wald)
βx0 1,472 0,485 0,002 1,433 0,481 0,002
βx1 0,583 0,166 <0,001 0,580 0,166 <0,001
βx2 -0,005 0,006 0,417 -0,004 0,006 0,457
βx3 -0,234 0,083 0,005 -0,231 0,083 0,005
βx4 -0,391 0,171 0,022 -0,387 0,171 0,023
βx5 -0,024 0,232 0,917 -0,027 0,232 0,908
βx6 0,036 0,024 0,136 0,035 0,024 0,138
σ 1,211 0,154 <0,001 1,182 0,147 <0,001
γx0 -0,867 0,525 0,099 -0,929 0,522 0,075
γx1 0,489 0,198 0,013 0,486 0,197 0,014
γx2 0,006 0,007 0,403 0,007 0,007 0,366
γx3 0,203 0,095 0,032 0,205 0,094 0,029
γx4 -0,420 0,198 0,034 -0,416 0,198 0,036
γx5 0,124 0,267 0,643 0,122 0,267 0,647
γx6 0,053 0,029 0,070 0,053 0,029 0,072
Observamos novamente na Tabela 5.2 uma grande semelhan¸ca entre os coeficientes
j´a publicados e os coeficientes por obtidos n´os. Devido ao fato de conseguirmos
re-produzir razoavelmente os resultados anteriores tivemos confian¸ca para aplicar nosso
algor´ıtimo em um conjunto de dados reais.
5.2
Aplica¸
c˜
ao
Consideramos um conjunto de dados proveniente de 355 pacientes diagnosticados
com cˆancer de mama no Hospital Prof. Dr. Luiz Antˆonio Unidade I da Liga Contra
o Cˆancer (Natal/RN). Estas informa¸c˜oes foram obtidas em car´ater retrospectivo ao
per´ıodo de 1991 `a 1995. No estudo realizado por Macedo e Valen¸ca (2009) ´e utilizado
o modelo de regress˜ao de Cox, (Cox 1972), para observar o efeito de covari´aveis no
tempo em que as pacientes permanecem livres do retorno da doen¸ca (recidiva). No
mesmo estudo pode-se observar evidˆencias da existˆencia de fra¸c˜ao de cura devido `a alta
5.3 Descri¸c˜ao das covari´aveis 33
de Kaplan e Meier (1958) na Figura (5.1). Este fato nos levou `a aplica¸c˜ao do Modelo
de Tempo de Falha Acelerado Log-Gama Generalizado com Fra¸c˜ao de Cura. Todos os
resultados foram obtidos atrav´es dos software estat´ıstico R, os comandos encontram-se
no Apˆendice A.
Figura 5.1: Estimativas de Kaplan-Meier para o tempo at´e a recidiva de pacientes com cˆancer de mama- Natal/RN 1991 `a 1995
5.3
Descri¸
c˜
ao das covari´
aveis
Descrevemos agora as covari´aveis significantes ao nosso estudo, por´em Macedo
e Valen¸ca (2009) fizeram uma an´alise sobre um conjunto maior de covari´aveis
rela-cionadas ao cˆancer de mama, al´em da sua devida contextualiza¸c˜ao na ´area m´edica.
PLC Propor¸c˜ao de linfonodos axilares comprometidos com met´astase, categorizada em trˆes grupos: 0%; entre 0% e 50% e acima de 50%. Com as vari´aveis indicadoras
PLC.1 e PLC.2.
Tabela 5.3: O fator PLC
PLC2 Vari´aveis indicadorasPLC2.1 PLC2.2
0% 0 0
entre 0% e 50% 1 0
acima de 50% 0 1
5.4 Ajuste de modelos sem fra¸c˜ao de cura 34
TNC Tipo de tratamento n˜ao-cir´urgico ao qual a paciente foi submetida. Catego-rizada em dois grupos: tratamentos com hormonoterapia e tratamentos sem
hor-monoterapia. Com a vari´avel indicadora TNC.1.
Tabela 5.4: O fator TNC
TNC Vari´avel indicadoraTNC.1
Com hormonoterapia 0
Sem hormonoterapia 1
A Figura 5.3 ilustra as fun¸c˜oes de sobrevivˆencia estimada para os 2 grupos.
Figura 5.2: Estimativas de Kaplan-Meier para o tempo at´e a recidiva de pacientes com cˆancer de mama para a covari´avel PLC. Natal/RN 1991 `a 1995
Figura 5.3: Estimativas de Kaplan-Meier para o tempo at´e a recidiva de pacientes com cˆancer de mama para a covari´avel PLC. Natal/RN 1991 `a 1995
5.4
Ajuste de modelos sem fra¸
c˜
ao de cura
Ajustamos essas covari´aveis para o modelo de regress˜ao de Cox. Pelos resultados
da tabela (5.5) vemos que as pacientes com propor¸c˜ao de linfonodos comprometidos
5.4 Ajuste de modelos sem fra¸c˜ao de cura 35
se comparadas com as pacientes com propor¸c˜ao de linfonodos comprometidos igual a
zero. As pacientes que se submeteram aos tratamentos sem hormˆonios tˆem um risco de
recidiva da doen¸ca aproximadamente 3,5 vezes maior quando comparadas com aquelas
que se submeteram aos tratamentos com hormˆonios, indicando que a hormonioterapia
´e o elemento diferenciador que contribui no aumento do tempo livre de recidiva.
Tabela 5.5: Resultados do ajuste do modelo de regress˜ao de Cox para o tempo at´e a recidiva de pacientes com cˆancer de mama. Natal/RN 1991 `a 1995
Parˆametro Estimativa exp(Estimativa) E.P. p-valor
βP LC.1 0,486 1,630 0,244 0,047
βP LC.2 1,927 6,870 0,274 <0,001
βT N C.1 1,270 3,560 0,283 <0,001
Complementamos essa an´alise com o ajuste da regress˜ao log-gama generalizada.
Figura 5.4: Contorno da verossimilhan¸ca maximizada Lmax(q) para a regress˜ao
log-gama generalizada, dados de pacientes com cˆancer de mama - Natal/RN 1991 `a 1995
A figura 5.4 ilustra os diferentes valores para a fun¸c˜ao de log-verossimilhan¸ca em
rela¸c˜ao ao parˆametroq, conforme descrito na se¸c˜ao 4.4.
A partir deste ajuste desejamos escolher um modelo mais simples. O teste da raz˜ao
de verossimilhan¸ca, utilizado para selecionar os submodelos da log-gama generalizada
5.4 Ajuste de modelos sem fra¸c˜ao de cura 36
Tabela 5.6: Resultados do ajuste do modelo de regress˜ao log-gama generalizada para o tempo at´e a recidiva de pacientes com cˆancer de mama. Natal/RN 1991 `a 1995
Parˆametro Estimativa E.P. p.valor(Wald)
β0 5,798 0,202 <0,001
βP LC.1 -0,415 0,219 0,058
βP LC.2 -1,855 0,282 <0,001
βT N C.1 -1,212 0,288 <0,001
σ 1,197 0,099 <0,001
i adequa¸c˜ao do modelo de regress˜ao Weibull: T RV = 3.1516 (p-valor = 0.0759) ii adequa¸c˜ao do modelo de regress˜ao log-normal:T RV = 1.1872 (p-valor = 0.2759).
Este resultado indica o modelo log-normal como adequado para o conjunto de dados.
Faremos ent˜ao interpreta¸c˜oes por esse modelo.
Tabela 5.7: Resultados do ajuste do modelo de regress˜ao log-normal para o tempo at´e a recidiva de pacientes com cˆancer de mama. Natal/RN 1991 `a 1995
Parˆametro Estimativa exp{Estimativa} E.P. p.valor(Wald)
β0 5,705 300,366 0,202 <0,001
βP LC.1 -0,412 0,662 0,221 0,0629
βP LC.2 -1,882 0,152 0,299 <0,001
βT N C.1 -1,267 0,282 0,313 <0,001
σ 1,410 – 0,080 <0,001
Com base nos valores obtidos na Tabela 5.7 podemos inferir que o tempo mediano
at´e a recidiva das pacientes com uma propor¸c˜ao de linfonodos axilares
comprometi-dos com met´astase acima de 50% ´e aproximadamente 85% menor em compara¸c˜ao aos
pacientes sem linfonodos axilares comprometidos. As pacientes que se submeteram
aos tratamentos sem hormonioterapia tˆem um tempo mediano de recidiva da doen¸ca
aproximadamente 72% maior quando comparadas com aquelas que se submeteram aos
tratamentos com hormonioterapia. Esses resultados refor¸cam os obtidos pelo modelo
5.5 Ajuste dos MTFA l.g.g. padr˜ao com fra¸c˜ao de cura 37
5.5
Ajuste dos MTFA l.g.g. padr˜
ao com fra¸
c˜
ao de
cura
As Figuras 5.5 e 5.6 mostram o contorno da verossimilhan¸ca maximizada para os
diferentes valores estimados de Lmax(q) para o MTFA l.g.g. padr˜ao com modelo de
mistura padr˜ao e com modelo de tempo de promo¸c˜ao respectivamente. A estimativas
de m´axima verossimilhan¸ca dos coeficientesβˆ, γˆ e ˆσ obtidas pelo software estat´ıstico R para os dois modelos s˜ao apresentados na Tabela (5.8).
Figura 5.5: Contorno da verossimi-lhan¸ca maximizada Lmax(q) para o
MTFA l.g.g. padr˜ao com modelo mis-tura padr˜ao, dados de pacientes com cˆancer de mama. Natal/RN 1991 `a 1995
Figura 5.6: Contorno da verossimi-lhan¸ca maximizada Lmax(q) para o
MTFA l.g.g. padr˜ao com modelo tempo de promo¸c˜ao, dados de pacientes com cˆancer de mama. Natal/RN 1991 `a 1995
Pelos resultados apresentados na Tabela 5.8 para o MTFA l.g.g. padr˜ao com
mo-delo de mistura padr˜ao vemos que os parˆametros do vetor β associados `a acelera-¸c˜ao/desacelera¸c˜ao do tempo at´e a ocorrˆencia do evento de interesse do MTFA l.g.g.
padr˜ao com modelo de mistura padr˜ao apresentados na Tabela 5.8 apresentam
resulta-dos semelhantes ao apresentaresulta-dos na se¸c˜ao 5.4. Para os parˆametrosγ apenas a vari´avel PLC.2 ´e significante, ou seja, existe diferen¸ca significativa para a fra¸c˜ao de curadas nas
com-5.5 Ajuste dos MTFA l.g.g. padr˜ao com fra¸c˜ao de cura 38
para¸c˜ao com as pacientes que apresentam 0%. O fato deγP LC.2 ser negativo indica que
a propor¸c˜ao de curadas ´e menor em compara¸c˜ao com as pacientes que apresentam 0%.
N˜ao existe diferen¸ca significativa na fra¸c˜ao de curadas entre as pacientes com 0% e as
pacientes com PLC entre 0% e 50%.
Tabela 5.8: Resultados do ajuste para MTFA l.g.g. padr˜ao com modelo de mistura padr˜ao e modelo de tempo de promo¸c˜ao - Dados de pacientes com cˆancer de mama. Natal/RN 1991 `a 1995
Modelo de Mistura Padr˜ao Modelo de Tempo de Promo¸c˜ao Coeficiente Estimativa E.P. p.valor Coeficientes Estimativa E.P. p.valor
β0 4,494 0,495 <0,001 β0 5,593 1,372 <0,001
βP LC.1 0,411 0,504 0,415 βP LC.1 0,543 0,816 0,506
βP LC.2 -0,895 0,474 0,059 βP LC.2 -0,170 0,787 0,829
βT N C.1 -0,765 0,372 0,039 βT N C.1 -0,321 0,795 0,687
σ 1,030 0,134 <0,001 σ 1,592 0,404 <0,001
γ0 0,785 0,560 0,161 γ0 -0,184 0,935 0,844
γP LC.1 -1,773 1,598 0,267 γP LC.1 0,983 0,793 0,215
γP LC.2 -2,744 1,181 0,020 γP LC.2 1,754 0,758 0,021
γT N C.1 -2,061 1,550 0,184 γT N C.1 0,918 0,848 0,279
Os demais resultados parecem ser conflitantes com os resultados das se¸c˜oes
ante-riores. A vari´avel PLC n˜ao apresenta significˆancia na fra¸c˜ao de curados em nenhum
dos 2 modelos, o que parece contrariar a Figura 5.2. O MTFA l.g.g. padr˜ao com
modelo tempo de promo¸c˜ao n˜ao apresenta significˆancia em nenhuma das covari´aveis
no vetor β o que tamb´em contraria os resultados anteriores. Acreditamos que estas incoerˆencias podem ser devidas `a inclus˜ao do parˆametro γ0 nos modelos e n˜ao devido
`a algum erro no algoritmo apresentado, pois reproduzimos de forma muito similar os
resultados de Yamaguchi (1992) e Ortega et al. (2009) com seus respectivos bancos de
Cap´ıtulo 6
Considera¸
c˜
oes finais
Nesta disserta¸c˜ao estudamos os modelos de sobrevivˆencia com fra¸c˜ao de cura, dando
ˆenfase a uma abordagem unificada destes modelos. Al´em disso, discutimos os modelos
de tempo de falha acelerados com fra¸c˜ao de cura, que permitem a observa¸c˜ao do efeito
de covari´aveis tanto na acelera¸c˜ao/desacelera¸c˜ao do tempo at´e a ocorrˆencia do evento
de interesse como tamb´em na fra¸c˜ao de cura, e sugerimos uma ´otica unificada sobre
esses modelos.
Particularizamos este modelo, que chamamos de Modelo de Tempo Falha Acelerado
com Fra¸c˜ao Cura Unificado, para os casos em que ele corresponde ao MTFA log-gama
generalizada padr˜ao com modelo de mistura padr˜ao e MTFA log-gama generalizada
padr˜ao com modelo de tempo de promo¸c˜ao, e aplicamos `a um conjunto de dados reais
de pacientes com cˆancer de mama.
Os resultados foram obtidos atrav´es de um algor´ıtimo no software estat´ıstico R. Que
se mostrou eficaz para reproduzir resultados j´a existentes na literatura, mas que por´em
apresentou resultados pouco coerentes quando aplicados ao nosso conjunto de dados.
Acreditamos que essas incoerˆencias s˜ao devido `a algum problema de convergˆencia ou
devido `a inclus˜ao do parˆametro γ0 no modelo.
40
Para trabalhos futuros propomos um estudo sobre os res´ıduos do Modelo de Tempo
Falha Acelerado com Fra¸c˜ao Cura Unificado, a constru¸c˜ao de um algor´ıtimo no software
R mais flex´ıvel a respeito da inclus˜ao ou retirada de covari´aveis e tamb´em que seja
Apˆ
endice A
Comandos no R
O m´etodo aqui utilizado faz uso da fun¸c˜ao “optim” do pacote base do software R para maximizar a fun¸c˜ao de verossimilhan¸ca. Podemos utilizar o mesmo m´etodo
para encontrar outros estimadores de m´axima verossimilhan¸ca. Primeiro definiremos
as principais fun¸c˜oes para compor a fun¸c˜ao de verossimilhan¸ca que ser´a maximizada.
Usamos tamb´em a fun¸c˜ao“Rgamma”do pacote“zipfR”(Evert e Baroni (2008)) que corresponde `a fun¸c˜ao integral gama incompleta (equa¸c˜ao 4.4).
A.1
Regress˜
ao Log-gama Generalizada com
cova-ri´
aveis
#Fun¸c~ao densidade da log-gama generalizada f=function(z,q) if (q!=0)
(((abs(q)/gamma(q^-2)*(q^-2)^q^-2*exp((z/q)-(q^-2)*exp(q*z))))) else if (q==0)
dnorm(z)
#Fun¸c~ao de sobreviv^encia
S= function(z,q) if (q>0) Rgamma(q^-2*exp(q*z),q^-2) else if
(q<0) 1-Rgamma(q^-2*exp(q*z),q^-2) else if (q==0) (1-pnorm(z))
Devemos agora gerar a fun¸c˜ao de verossimilhan¸ca que deve ser maximizada. Sendo
os argumentos de entrada
• par →Parˆametros a serem estimados