• Nenhum resultado encontrado

Determinação dos fatores associados à sobrevida de mulheres com câncer de mama via modelos de longa duração Weibull Modificado

N/A
N/A
Protected

Academic year: 2021

Share "Determinação dos fatores associados à sobrevida de mulheres com câncer de mama via modelos de longa duração Weibull Modificado"

Copied!
6
0
0

Texto

(1)

1

Agradecimento ao CNPq pelo apoio financeiro 2

Agradecimento ao PIC pelo apoio financeiro 3 cleytonzan@yahoo.com.br 4 gerson.yoshinari@usp.br 5 pgleici@fmrp.usp.br 6 dfln@ufscar.br

Determinação dos fatores associados à sobrevida de mulheres com

câncer de mama via modelos de longa duração Weibull Modificado

Cleyton Zanardo de Oliveira – CER, DEs, UFSCar 1 3 Gerson Hiroshi Yoshinari Júnior – FMRP/USP 2 4 Gleici da Silva Castro Perdoná – FMRP/USP 1 5 Francisco Louzada Neto – CER, DEs, UFSCar 1 6

1. Introdução

O câncer de mama é a neoplasia de incidência mais frequente na população feminina mundial, com um risco aproximado de 12% de ocorrência durante a vida, além de uma mortalidade de 5% (Parkin et al., 2005). Com os avanços terapêuticos, a contribuição para o aumento da sobrevida geral em pacientes com câncer de mama é uma realidade (Peto et al., 2000) (Taylor et al., 2003).

Quando um grupo de pacientes é seguido até uma data pré-estabelecida, para a observação do tempo até a ocorrência de um evento, pode acontecer que na data de término do acompanhamento uma parcela do grupo não tenha ainda sofrido o evento de interesse. Se isso ocorre para uma parcela grande do grupo, ainda que se estenda o prazo, existem indícios de que um modelo adequado para a função de sobrevivência teórica do tempo até a ocorrência do evento seja um modelo de longa duração. A forma apresentada pela estimativa não paramétrica da função de risco nesse tipo de estudo indica que o modelo deve ser flexível no sentido de permitir que a função de risco seja uma função crescente, decrescente, constante ou em forma de U. Os modelos paramétricos usuais (Colosimo e Giolo, 2006) não são apropriados para descrever tais curvas, no entanto Perdoná (2006) sugere uma generalização para modelos de longa duração, e trata um caso particular, o modelo Weibull modificado de longa duração, como proposta para contemplar os problemas existentes na prática médica.

Neste trabalho consideraremos os estudos realizados até o presente momento em relação ao modelo Weibull modificado de longa duração (WMLD), e os casos particulares modelo Weibull de longa duração (WLD), modelo Exponencial de longa duração(ELD) bem como os modelos Weibull (W) e exponencial (E) para um problema de câncer de mama. Na seção 2 apresentamos a formulação do modelo e seus casos particulares. Na seção 3 apresentamos a metodologia utilizada na estimação dos parâmetros e seleção dos modelos, na seção 4 apresentamos a aplicação a um problema na área médica, câncer de mama. Finalizamos na seção 5 com as conclusões dos resultados obtidos.

2. Formulação do modelo

O modelo Weibull modificado de longa duração (WMLD) foi apresentado por Perdoná (2006). Sua função de Sobrevida é dado por,

(

)

{

[

( )

t

]

}

e

t

p

p

t

S

;

α

,

γ

,

β

,

=

1

1

exp

α

γ β (1)

(2)

(

)

( ) (

)

[

( )

]

( )

[

]

{

t

}

t

e

t

p

t

e

t

t

t

p

p

t

β γ β γ γ

α

β

α

β

γ

α

β

γ

α

λ

+

+

=

exp

1

1

exp

/

,

,

,

;

(2)

Sendo

α

é o parâmetro de escala,

γ

o parâmetro de forma,

β

é o parâmetro associado ao fator acelerador e por fim p o parâmetro associado a presença de longa duração, que pode ser considerado igual a um menos a fração de cura. O modelo proposto possui vários casos particulares já conhecidos na literatura que podem descrever ou não a longa duração tais como a Weibull de longa duração, a Exponencial de longa duração, a Weibull e a exponencial.

Quando o parâmetro

β

é igual a 0, encontramos o modelo Weibull de longa duração (WLD), sendo sua função taxa de falha dada por

(

)

[

( )

]

( )

[

]

{

γ

}

γ γ γ

α

α

α

γ

α

λ

t

p

t

t

p

p

t

=

exp

1

1

exp

,

,

;

1 e sobrevida

(

)

{

[

( )

γ

]

}

α

γ

α

p

p

t

t

S

;

,

,

=

1

1

exp

. Para

β

=0 e

γ

=1, encontramos o modelo exponencial de longa duração (ELD), e suas funções são dadas por,

(

)

[

( )

]

(

)

{

t

}

p

t

t

p

p

t

α

α

α

α

λ

γ

=

exp

1

1

exp

,

;

1 e

(

t

p

)

p

{

[

t

]

}

S

;

α

,

γ

,

=

1

1

exp

α

. Considerando

β

=0 e p=1 encontramos o modelo Weibull (W), muito utilizado e que não considera a presença de longa duração. Suas funções são dadas por,

(

)

1

,

;

α

γ

=

γα

γ γ−

λ

t

t

e

S

(

t

;

α

,

γ

)

= exp

{

( )

α

t

γ

}

. E por fim, considerando

β

=0 e

γ

=1 e p=1

encontramos o modelo exponencial (E), suas funções são dadas por,

λ

(

t

;

α

)

=

α

e

(

t

)

{

t

}

S

;

α

= exp

α

.

Na figura 1 apresentamos as formas mais comuns do risco para o modelo WMLD quando fixamos

α

=0.01. No painel esquerdo o risco decresce inicialmente e posteriormente possui comportamento unimodal na presença de longa duração. O quadro central apresenta o risco na forma unimodal e por fim no quadro da direita temos o risco decrescente.

Figura 1: Função de risco do modelo Weibull modificado de longa duração, para os casos:

γ

=0.4 e

β

=0.1 (painel esquerdo);

γ

=1 e

β

=0,1 (painel central);

γ

=0.4 e

β

=0.01 (painel direito).

3. Inferência

Uma característica da análise de sobrevivência é a presença de censura nos dados. Sendo assim, os parâmetros são estimados utilizando o estimador de máxima verossimilhança tomando certo cuidado ao escrever a função de verossimilhança. A estrutura da função de verossimilhança possui uma parcela referente aos tempos de sobrevivência onde ocorreu o evento, e uma parcela referente aos tempos de sobrevivência onde ocorreu a censura. Desta forma, seja t1, t2,..., tn uma amostra aleatória e independente, a função de verossimilhança é dada por:

(3)

= = +

=

r i n r i i i

S

t

t

f

L

1 1

)

;

(

)

;

(

)

(

θ

θ

θ

(4) A primeira parcela,

= r i i

t

f

1

)

;

(

θ

, refere-se aos dados que não foram censurados, ou seja, aos

tempos de sobrevivência dos indivíduos que sofreram o evento. Já a segunda parcela,

+ = n r i i

t

S

1

)

;

(

θ

,

refere-se aos dados que foram censurados. Considerando uma variável indicadora de censura (

δ

i), em que recebe o valor 1 se é um tempo de sobrevivência sem censura, ou 0 se o tempo for censurado. A função de verossimilhança pode ser reescrita como:

[

] [

]

[

]

= − =

=

=

n i i i n i i i

S

t

t

S

t

t

f

L

i i i 1 1 1

)

;

(

)

;

(

)

;

(

)

;

(

)

(

θ

θ

θ

λ

θ

δ

θ

δ δ (5)

Para encontrar os parâmetros da distribuição em estudo, basta derivar o logaritmo da função de verossimilhança, em função do parâmetro a ser estimado, igualando a zero. Maiores detalhes podem ser encontrados em Colosimo et. al. (2006), Carvalho et al. (2005) e Louzada-Neto et. al. (2002).

Assim, para uma amostra de variáveis aleatórias independentes X1,X2, ...,Xn, associadas aos tempos de sobrevivência e C1,C2, ...,Cn associadas aos tempos censurados, definindo Ti = min(Xi,Ci),

δ

i= I(Ti

Ci), a função de verossimilhança da WMLD é dada por

(

)

(

( ) (

)

[

( )

]

)

i

(

{

[

( )

]

}

)

i n i t t

e

t

p

t

e

t

t

t

p

p

t

L

δ β γ δ β γ γ

α

β

α

β

γ

α

β

γ

α

− =

+

+

=

1 1

exp

1

1

exp

/

,

,

,

;

(6)

As equações pelas primeiras derivadas de cada parâmetro igualadas a zero não possuem soluções analíticas, porem utilizamos métodos iterativos, como por exemplo, o método de Newton ou quase-Newton (Dennis, Gay e Welsch,1981), para obtermos aproximações das estimativas dos parâmetros.

Para incluirmos as informações dos possíveis fatores associados a um individuo vir a experimentar o evento de interesse, precisamos introduzir tais informações no modelo, associando a cada covariável um parâmetros a ser estimado. Para isso, X é a matriz de covariáveis e

β

l um vetor de parâmetros relacionado a cada covariável (l). Isso significa que estamos interessados em modelar a dependência entre a proporção de “curados” e os fatores associados ao evento de interesse, no caso do câncer de mama, os fatores associados às pacientes “curadas”. Podemos modelar esta dependência por um componente logístico (Ghitany et al 1994), tal que,

)

exp(

1

)

exp(

)

(

l l

X

X

x

p

p

β

β

+

=

=

.

Neste caso a função de sobrevida do modelo WMLD é dada por,

(

)

{

[

( )

t

]

}

l l c l

t

e

X

X

t

S

α

γ β

β

β

β

β

β

γ





+

=

1

exp

)

exp(

1

)

exp(

1

,

,

,

;

(7)

Yu et al (2008) propôs introduzir as informações dos fatores de riscos no parâmetro de longa duração e também no parâmetro de escala quando tratamos de um modelo encaixado à Weibull. Desta forma a curva de sobrevida para o modelo WMLD para um grupo de indivíduos que estariam expostos aos mesmos fatores de riscos seria dada por,

(4)

(

)

{

[

(

(

)

)

t

]

}

c l l c l

X

t

e

X

X

t

S

β

γ β

β

β

β

β

β

γ

1

exp

exp

)

exp(

1

)

exp(

1

,

,

,

;





+

=

(8)

Sendo que

β

l é um vetor dos parâmetros dos fatores de risco associado ao efeito da longa duração e

β

c é um vetor dos parâmetros dos fatores de risco associado ao efeito da curta duração.

3.1. Seleção de modelos

Para um mesmo conjunto de dados pode-se ajustar mais de um modelo de sobrevivência. Sendo assim, existe a necessidade de escolhemos qual o melhor modelo. Uma forma de escolha do modelo mais satisfatório são os métodos gráficos (Colosimo et al., 2006), (Carvallho et al., 2005). No entanto, a análise gráfica é subjetiva, podendo o mesmo gráfico ser interpretado de formas diferente. Para resolver este problema, uma forma de escolhermos o melhor modelo é através do teste de hipótese, onde:

H0: O modelo de interesse é adequado H1: O modelo de interesse não é adequado

Para realizar o teste de hipótese, geralmente se utiliza a estatística da razão de verossimilhanças em modelos encaixados (Cox e Hinkley, 1974) dado por:

( )

( )

[

( )

G

( )

M

]

G T

L

L

L

L

TRV

θ

θ

θ

θ

ˆ

log

ˆ

log

2

ˆ

ˆ

log

2

=

=

Sendo

L

( )

θ

ˆ

T é a Máxima Verossimilhança do modelo a ser testado e

L

( )

θ

ˆ

G é a Máxima Verossimilhança do modelo geral dos modelos a serem testado, ou seja, os modelos a serem testados devem ser obrigatoriamente casos particulares do modelo geral.

A estatística TRV sob H0, possui aproximadamente distribuição qui-quadrado com graus de liberdade igual a diferença do número de parâmetros dos modelos sendo comparados.

No entanto, quando o estudo trata de modelos que não são encaixados, o teste de hipótese torna-se inapropriado. Uma forma de escolher o melhor modelo é comparando os critérios AIC (Akaike information criterion) (Akaike, 1978) e BIC (Bayesian information criterion) (Schwarz, 1978). Os dois critérios são dados respectivamente por:

( )

[ ]

L

p

AIC

=

2

log

θ

ˆ

+

2

;

BIC

=

2

log

[ ]

L

( )

θ

ˆ

+

p

ln(

n

)

Sendo que d é a soma do número de parâmetros do modelo que será testado e n é o número de indivíduos em estudo. Calculam-se os AIC e BIC para todas as os modelos estimados. O melhor modelo ajustado aos dados, será aquele que tiver menor valor AIC e BIC.

4. Aplicação

Os tempos de sobrevivências referem-se a 40 pacientes provenientes do ambulatório de mastologia do Hospital das Clínicas de Ribeirão Preto da Faculdade de Medicina de Ribeirão Preto - São Paulo Gozzo(2008). Os dados referem-se a tempos de sobrevivência, da cirurgia até o óbito ou término da pesquisa em pacientes que foram diagnosticadas com neoplasia maligna de mama.

Consideramos os diferentes modelos apresentados para o ajuste sem considerarmos covariáveis, inicialmente. Para esses dados estimamos a curva de sobrevivência por Kaplan-Meier e segundo os modelos WMLD, WLD, ELD, W e E, Figura 2. Pelo gráfico observamos que a função de sobrevivência estimada por Kaplan-Meier se estabiliza em aproximadamente 0,6 devido a ocorrência de censura do tipo I. Isto indica que modelos de longa duração são os indicados para a presente aplicação. Graficamente, tanto o modelo WLD quanto o modelo WMLD ajustam melhor a curva de

(5)

sobrevivência empírica (Kaplan Meier), inclusive o final da curva que os modelos usuais (W e E) não ajustam adequadamente. O modelo ELD não apresenta um ajuste adequado.

Figura 2: Comparação da curva de sobrevivência estimada por Kaplan-Meier com as curvas de sobrevivência estimadas pela WMLD, WLD, ELD, W e E

Tabela 1: estimativas dos parâmetros, MV e valores dos critérios de seleção AIC e BIC

Modelo

α

β

γ

p

log(

L

(

θ

ˆ

))

AIC BIC

WMLD 1/267.12 0.878 1.41 0.39 28.38 64.76 71.51

WLD 1/3 3.51 0.44 28.69 63.38 68.45

ELD 1/10.48 0.99 33.49 70.99 74.37

W 1/10.48 28.98 61.96 65.34

E 4.77 2.66 33.49 68.99 70.69

Na Tabela 1 apresentamos as estimativas dos parâmetros para cada modelo, e os valores dos critérios de seleção. Observamos que os valores dos critérios AIC são próximos nos ajustes dos modelos WMLD e WLD, no entanto a WLD ainda possui melhor ajuste. Já os modelos ELD possui maior valor do critério AIC do que os demais. Pelo critério BIC temos o menor valor observado para W, seguida pela WLD e E.

5. Conclusão

Neste resumo, trabalhamos com o modelo Weibull modificado de longa duração que foi apresentado por Perdoná (2006). A sua função taxa de falha é bastante flexível, possibilitando o ajuste quando temos o risco crescente, decrescente, unimodal ou em forma de U. Ainda, esse modelo possibilita um algoritmo que particulariza diversos modelos de longa duração conhecidos na literatura, tais como a Weibull de longa duração e a Exponencial de longa duração, e modelos mais simples como, por exemplo, a Weibull e a exponencial. A estimação dos parâmetros foi feita pelo

(6)

método da máxima verossimilhança, utilizando métodos iterativos para aproximações quando necessário.

Os ajustes com melhor desempenho foram observados para os modelos WMLD e WLD. Comparando estes ajustes com a curva empírica de Kaplan Méier notamos que ambas as funções são semelhantes nos primeiros tempos de sobrevida, no entanto a WMLD se adere melhor aos tempos relacionados à longa duração do que a WLD.

Entre os modelos que consideram a longa duração, os critérios de seleção AIC e BIC indicam que a WMLD e WLD possuem os melhores ajustes. Sendo assim, em uma próxima etapa iremos incorporar as covariáveis nestes modelos e determinaremos os fatores associados a sobrevidas de mulheres com câncer de mama. Estes resultados serão apresentados durante o congresso.

6. Referencias bibliográficas

[1] Akaike, H. (1978). A Bayesian analysis of the minimum AIC procedure. Annals of the Institute of Statistical Mathematics.

[2] Binbing Yu, Yingwei Peng: Mixture cure models for multivariate survival data. Computational Statistics & Data Analysis 52(3): 1524-1532 (2008)

[3] CARVALHO, M. S.; ANDREOZZI, V. L.; CODEÇO, C. T.; BARBOSA, M. T. S.; SHIMAKURA, S. E.

Análise de sobrevida: teoria e aplicações em saúde. Rio de Janeiro: FIOCRUZ, 2005, 1a. ed.,396p

[4] COLOSIMO, E. A.; GIOLO, S. R. Análise de Sobrevivência Aplicada. São Paulo: Edgard Blucher, 2006, 1a. ed., 392p.

[5] COX, D. R.; HINKLEY, D. V. Theoretical Statistics. Chapman and Hall, London, 1974.

[6] DENNIS, J. E.; GAY, D. M.; WELSCH, R. E. An adaptive nonlinear least-squares algorithm. ACM Transactions on Mathematical Software 7, 348-383, 1981

[7] GHITANY M. E., MALLER R. A. and ZHOU X., Exponential mixture models with long-term

survivors and covariates. J. Multivariate Anal. 49 (1994), pp. 218–241.

[8] Gozzo, T. O. (2008). Toxicidade ao tratamento quimioter_apico em mulheres com câncer de mama. Doctorate Thesis - Escola de Enfermagem de Ribeirão Preto, USP, Sãoo Paulo, Brazil.

[9] LOUZADA-NETO, F., & ACHCAR, J. A. (2002). Introdução à Análise de Sobrevivência e

Confiabilidade. Maringá: Minicurso: III Jornada Regional de Estatística e II Semana de Estatística.

[10] PARKIN DM, BRAY F, FERLAY J et al (2005) Global cancer statistics, 2002. CA Cancer J Clin 55:74-108.

[11] PERDONÁ, G. S. C. Modelos de risco aplicados à análise de sobrevivência. São Carlos: USP, 2006. 148p. Tese apresentada ao Instituto de Ciências Matemáticas e de Computação - ICMC - USP, como parte dos requisitos para obtenção do título de Doutor em Ciências - Ciências da computação e Matemática Computacional.

[12] PETO R, BOREHAM J, CLARKE M et al (2000) UK and USA breast cancer deaths down 25% in year 2000 at ages 20-69 years. Lancet 355:1822.

[13] TAYLOR R, DAVIS P, BOYAGES J (2003) Long-term survival of women with breast cancer in New South Wales. Eur J Cancer 39:215-222.

Referências

Documentos relacionados

a) Termo de Colaboração: instrumento pelo qual são formalizadas as parcerias estabelecidas pela administração pública com organizações da sociedade civil,

tratando do ambiente escolar, quando a criança se desvincula do seio familiar para inserir na escola ela já trás consigo um referencial de aprendizagem referente aos

Na configuração do sistema de automação ou fieldbus, o sistema IO-Link é representado pelo IO-Link mestre e integrado usando a descrição de dispositivo apropriada (por exemplo,

1) O mapeamento de vestígios físicos e biológicos evidenciou que a Florestas da Tijuca já foi intensamente utilizada e grande parte de sua cobertura florestal já passou

Elaboração de um problema – deve ser contextualizado, introduzindo os alunos no assunto que se quer trabalhar e ofereça condições para que eles possam pensar nas

Em geral, os blocos intertravados de concreto das marcas avaliadas deixaram a desejar em qualidade, pois a maioria dos resultados obtidos nos ensaios, principalmente nos

Acredita-se que as pes- soas especiais devem estar presentes não só como ouvintes, mas como agentes que possam estar envolvidos nas discussões e decisões sobre uma

Se você vai para o mundo da fantasia e não está consciente de que está lá, você está se alienando da realidade (fugindo da realidade), você não está no aqui e