Comparação de modelos para a análise de dados censurados à direita

(1)

Compara¸

c˜

ao de modelos para a an´

alise de

dados censurados `

a direita

Niter´oi - RJ, Brasil 09 de julho de 2019

(2)

La´ıs Pereira Peixoto de Moraes

Compara¸

c˜

ao de modelos para a

an´

alise de dados censurados `

a direita

Trabalho de Conclus˜ao de Curso

Monografia apresentada para obten¸c˜ao do grau de Bacharel em Estat´ıstica pela Universidade Federal Fluminense.

Orientador: Prof. Jony Arrais Pinto Junior

Niter´oi - RJ, Brasil 09 de julho de 2019

(3)

La´ıs Pereira Peixoto de Moraes

Compara¸

c˜

ao de modelos para a an´

alise de

dados censurados `

a direita

Monografia de Projeto Final de Gradua¸cão sob o t´ıtulo “Com-para¸cão de modelos para a análise de dados censurados à di-reita”, defendida por La´ıs Pereira Peixoto de Moraes e apro-vada em 09 de julho de 2019, na cidade de Niterói, no Estado do Rio de Janeiro, pela banca examinadora constitu´ıda pelos professores:

Prof. Dr. Jony Arrais Pinto Junior Departamento de Estat´ıstica – UFF

Profa. Dra. Ludmilla da Silva Viana Jacobson Departamento de Estat´ıstica – UFF

Prof. Dr. Luis Guillermo Coca Velarde Departamento de Estat´ıstica – UFF

(4)

Bibliotecário responsável: Ana Nogueira Braga - CRB7/4776

M827c Moraes, Laís Pereira Peixoto de

Comparação de modelos para a análise de dados censurados à direita / Laís Pereira Peixoto de Moraes ; Jony Arrais Pinto Junior, orientador. Niterói, 2019.

164 f. : il.

Trabalho de Conclusão de Curso (Graduação em

Estatística)-Universidade Federal Fluminense, Instituto de Matemática e Estatística, Niterói, 2019.

1. Análise de sobrevivência. 2. Inferência Bayesiana. 3. Modelo Cox. 4. Modelo Poisson. 5. Produção intelectual. I. Pinto Junior, Jony Arrais, orientador. II. Universidade Federal Fluminense. Instituto de Matemática e Estatística. III. Título.

(5)

-´

E comum o interesse por analisar dados provenientes de acompanhamentos ao longo do tempo. Um caso importante refere-se a análise dos dados de sobrevivência que são compostos por covariáveis e pela variável de interesse denominada tempo de sobrevivência. Esta última, é responsável por medir o tempo até a ocorrência do evento desejado e sua principal caracter´ıstica é a presen¸ca de censura. Diz-se que um dado de sobrevivência é censurado quando o tempo registrado não contém o evento desejado. Note que, os dados censurados possuem alguma informa¸cão a respeito do evento analisado, portanto, devem ser incorporados a análise.

Dentre as ferramentas dispon´ıveis para a análise de regressão com dados censurados, as mais usadas são o modelo Cox e o modelo de Poisson. O primeiro é adequado para um modelo de regressão cuja variável resposta é o tempo de sobrevivência e o segundo quando a variável resposta se refere a contagem do evento de interesse. A proposta deste trabalho é realizar um estudo comparativo entre esses modelos e verificar a influência do número de censuras nas estima¸cões. Para isso, foi adotada a abordagem Bayesiana e considerou-se dados de sobrevivência com censura à direita.

Dessa forma, diversas simula¸cões foram feitas para os modelos considerados através de algoritmos implementados manualmente no programa R. Os resultados obtidos indicaram que os dois algoritmos MCMC convergiram de acordo com o critério de Gelman-Rubin. Porém, ao comparar as amplitudes dos intervalos de credibilidade dos modelos, o modelo Cox obteve o melhor desempenho uma vez que tinham os menores tamanhos. Portanto, apesar de ser poss´ıvel aplicar ambos os modelos na análise dos dados de sobrevivência, conforme o aumento da porcentagem de censura, deve-se optar por usar o modelo Cox ao invés do Poisson.

(6)

Lista de Figuras Lista de Tabelas 1 Introdu¸cão p. 12 1.1 Objetivos . . . p. 15 1.2 Organiza¸cão . . . p. 15 2 Materiais e Métodos p. 16

2.1 Análise de Sobrevivência . . . p. 17 2.1.1 Especificando o Tempo de Sobrevivência . . . p. 19 2.1.2 Rela¸cões entre Fun¸cões . . . p. 20 2.2 Inferência Bayesiana . . . p. 21 2.2.1 Estima¸cão dos parâmetros . . . p. 22 2.2.2 Monte Carlo via Cadeia de Markov (MCMC) . . . p. 23 2.3 Modelo Cox . . . p. 25 2.3.1 Abordagem bayesiana . . . p. 26 2.4 Modelo de Poisson . . . p. 28 2.4.1 Abordagem bayesiana . . . p. 31 3 Resultados p. 33 3.1 Simula¸cão . . . p. 33 3.1.1 Caso 1 . . . p. 34

(7)

3.1.3 Caso 3 . . . p. 46

4 Conclus˜ao p. 51

Referˆencias p. 52

Anexo A -- Demonstra¸c˜oes p. 55

A.1 Rela¸cões entre fun¸cões do tempo de sobrevivência . . . p. 55 A.2 Fun¸cão de verossimilhan¸ca para o modelo Cox . . . p. 55

Anexo B -- Estudos simulados p. 57

B.1 Caso 1 - Simula¸cão 1 . . . p. 57 B.2 Caso 1 - Simula¸cão 2 . . . p. 61 B.3 Caso 1 - Simula¸cão 3 . . . p. 66 B.4 Caso 1 - Simula¸cão 4 . . . p. 70 B.5 Caso 1 - Simula¸cão 5 . . . p. 75 B.6 Caso 1 - Simula¸cão 6 . . . p. 80 B.7 Caso 1 - Simula¸cão 7 . . . p. 84 B.8 Caso 1 - Simula¸cão 8 . . . p. 89 B.9 Caso 2 - Simula¸cão 1 . . . p. 93 B.10 Caso 2 - Simula¸cão 2 . . . p. 98 B.11 Caso 2 - Simula¸cão 3 . . . p. 102 B.12 Caso 2 - Simula¸cão 4 . . . p. 107 B.13 Caso 2 - Simula¸cão 5 . . . p. 111 B.14 Caso 2 - Simula¸cão 6 . . . p. 116 B.15 Caso 2 - Simula¸cão 7 . . . p. 120 B.16 Caso 2 - Simula¸cão 8 . . . p. 125

(8)

B.18 Caso 3 - Simula¸cão 2 . . . p. 134 B.19 Caso 3 - Simula¸cão 3 . . . p. 138 B.20 Caso 3 - Simula¸cão 4 . . . p. 143 B.21 Caso 3 - Simula¸cão 5 . . . p. 147 B.22 Caso 3 - Simula¸cão 6 . . . p. 152 B.23 Caso 3 - Simula¸cão 7 . . . p. 156 B.24 Caso 3 - Simula¸cão 8 . . . p. 161

(9)

1 Transforma¸cão para dados de contagem . . . p. 31 2 Fun¸cão de sobrevivência emp´ırica linha (—) e intervalo de confian¸ca de

95% (´area hachurada) . . . p. 34 3 Tra¸co das cadeias - modelo Cox caso 1 (10% de censura). . . p. 35 4 Correlogramas - modelo Cox caso 1 (10% de censura). . . p. 36 5 Histogramas dos coeficientes de regress˜ao modelo Cox caso 1 com

inter-valo de credibilidade 95% em vermelho. . . p. 37 6 Estimativas para h0(t) e H0(t) no modelo Cox caso 1. . . p. 37 7 Tra¸co das cadeias - modelo Poisson caso 1 (10% de censura). . . p. 38 8 Correlogramas - modelo Poisson caso 1 (10% de censura). . . p. 38 9 Histogramas dos coeficientes de regress˜ao modelo Poisson caso 1 com

intervalo de credibilidade 95% em vermelho. . . p. 40 10 Fun¸c˜ao de sobrevivˆencia emp´ırica linha (—) e intervalo de confian¸ca de

95% (´area hachurada) . . . p. 40 11 Tra¸co das cadeias - modelo Cox Caso 2 (30% de censura). . . p. 41 12 Correlogramas - modelo Cox Caso 2 (30% de censura). . . p. 42 13 Histogramas dos coeficientes de regress˜ao modelo Cox Caso 2 com

inter-valo de credibilidade 95% em vermelho. . . p. 42 14 Estimativas para h0(t) e H0(t) no modelo Cox Caso 2. . . p. 43 15 Tra¸co das cadeias - modelo Poisson no Caso 2 (30% de censura). . . . p. 43 16 Correlogramas - modelo Poisson no Caso 2 (30% de censura). . . p. 44 17 Histogramas dos coeficientes de regress˜ao modelo Poisson Caso 2 com

(10)

19 Tra¸co das cadeias - modelo Cox Caso 3 (50% de censura). . . p. 46 20 Correlogramas - modelo Cox Caso 3 (50% de censura). . . p. 47 21 Histogramas dos coeficientes de regress˜ao modelo Cox Caso 3 com

inter-valo de credibilidade 95% em vermelho. . . p. 48 22 Estimativas para h0(t) e H0(t) no modelo Cox Caso 3. . . p. 48 23 Tra¸co das cadeias - modelo Poisson Caso 3 (50% de censura). . . p. 49 24 Correlogramas - modelo Poisson Caso 3 (50% de censura). . . p. 49 25 Histogramas dos coeficientes de regress˜ao modelo Poisson Caso 3 com

(11)

1 Estat´ısticas descritivas da amostra a posteriori - modelo Cox caso 1 . . p. 36 2 Estat´ısticas descritivas da amostra a posteriori - modelo Poisson caso 1 p. 39 3 Estat´ısticas descritivas da amostra a posteriori - modelo Cox Caso 2 . . p. 41 4 Estat´ısticas descritivas da amostra a posteriori - modelo Poisson Caso 2 p. 45 5 Estat´ısticas descritivas da amostra a posteriori - modelo Cox Caso 3 . . p. 47 6 Estat´ısticas descritivas da amostra a posteriori - modelo Poisson Caso 3 p. 50

(12)

1 Introdu¸

c˜

ao

Os estudos que consideram variáveis explicativas se preocupam em definir modelos que descrevam o efeito destas covariáveis na variável de interesse. Frequentemente, usam-se os modelos lineares e os lineares generalizados por usam-se adequarem a diversos cenários. Contudo, há situa¸cões em que seu uso produz perda de eficiência ou resultados viciados. Isto ocorre, por exemplo, ao avaliar o tempo entre fenômenos onde é poss´ıvel que o evento de interesse não seja observado. Tem-se, então, que a variável resposta possui valores incompletos e se recai na abordagem dos chamados dados censurados.

A Análise de Sobrevivência é o ramo da Estat´ıstica que fornece ferramentas para o ajuste de dados censurados. Ela possui inúmeras aplica¸cões estando, geralmente, re-lacionada aos estudos referentes ao tempo desde um instante inicial até ocorrência do evento desejado. Em estudos cl´ınicos, por exemplo, pode-se estar interessado nos fatores que influenciam no tempo do diagnóstico até o óbito por alguma doen¸ca. Desta forma, acompanha-se um grupo de pacientes e se registra o tempo sob observa¸cão além de outras caracter´ısticas relevantes. No final, obtém-se dados completos que registram o tempo do ´

obito e dados incompletos por causas não controláveis como o realocamento de pacientes em outros hospitais ou mortes não relacionadas a doen¸ca observada.

Os dados de sobrevivência incluem, portanto, a variável de interesse denominada tempo de sobrevivência e variáveis independentes. O tempo de sobrevivência mede o tempo até o evento de interesse dado um ponto de partida. No exemplo anterior, foi definido o diagnóstico como tempo inicial. Além disso, o tempo de sobrevivência é sujeito a censura o que nos impede de observar o tempo exato de ocorrência do evento desejado. Logo, a variável resposta é formada por dados completos e incompletos.

Um fato importante ao tratar dados censurados é com rela¸cão ao tipo de censura. Sendo a principal caracter´ıstica dos dados de sobrevivência, a censura é classifica como: tipo I, se ultrapassa o término do estudo; tipo II quando o número de ocorrências do evento é satisfeita ou tipo III por perdas aleatórias da informa¸cão pretendida. Não obstante, ela

(13)

também é dita censura à direita, à esquerda ou intervalar, segundo a posi¸cão da ocorrência do evento com rela¸cão ao tempo registrado. A censura à direita está presente na maioria das vezes tais como no exemplo citado. Neste caso, só pode ter havido a morte de um paciente realocado em algum tempo depois da sua última observa¸cão. Apenas os métodos de análise que contemplam a censura à direita serão abordados neste trabalho.

Perceba que, mesmo sendo dados incompletos, os dados censurados possuem alguma informa¸cão a respeito do evento analisado. Existe, portanto, uma necessidade de incor-porá-los na análise estat´ıstica já que eles são capazes de enriquecer o entendimento sobre a caracter´ıstica estudada. Essa incorpora¸cão deve ser apta a distinguir dados completos e censurados a fim de evitar estima¸cões viciadas. Se fosse aplicado modelos lineares ge-neralizados considerando apenas a distribui¸cão assimétrica do tempo de sobrevivência, estima¸cões viciadas seriam obtidas. Porque, ao contrário dos modelos de sobrevivência, estes modelos não distinguem dados completos e censurados.

Dentro da análise de sobrevivência, os modelos de regressão são divididos entre pa-ramétrico, se assume uma distribui¸cão para a variável dependente e semi-paramétrico, caso contrário. Existem muitos modelos paramétricos, dentre eles, o modelo de tempo de vida acelerado. A vantagem deste modelo se dá em sua forma próxima aos modelos de regressão linear tradicionais o que facilita a interpreta¸cão de seus coeficientes. No entanto, na prática é dif´ıcil adequar uma distribui¸cão aos dados, principalmente em es-tudos cl´ınicos, pois a presen¸ca de fontes de perturba¸cão (heterogeneidade) nem sempre é controlável.

Na literatura, o modelo semi-paramétrico é o mais popular já que alivia o ajuste de uma distribui¸cão para a variável resposta, tempo de sobrevivência. O modelo Cox (Cox, 1972)[1], como o é conhecido, investiga a rela¸cão entre os preditores e o tempo de sobrevivência através da fun¸cão de risco (ou hazard ). Como consequência, o modelo Cox possui em sua constru¸cão um componente não-paramétrico que garante a sua flexibilidade. A única restri¸cão deste modelo é com rela¸cão ao efeito dos preditores na fun¸cão de risco que deve ser independente do tempo. Devido a essa restri¸cão, o modelo Cox também é chamado de modelo de riscos proporcionais.

A Análise de Sobrevivência está presente em diversas áreas e a aplica¸cão do modelo Cox amplamente difundido. Na área de finan¸cas, Gepp e Kumar et al (2015)[2] aplicam o modelo Cox para prever se certo negócio sofrerá uma crise financeira (financial dis-tress). Em oncologia, Damascena (2017) [3] utilizam riscos proporcionais para investigar a ocorrência de mucosite oral grave e os fatores associados em pacientes pediátricos com

(14)

tumores hematológicos e sólidos, submetidos a tratamento oncológico. Em agronomia, Maia (2011) [4], aplicou este mesmo método na análise de anomalias da temperatura da superf´ıcie do mar sobre o tempo até o in´ıcio da esta¸cão chuvosa.

Além da clara vantagem proporcionada pelo al´ıvio quanto a distribui¸cão, o modelo de riscos proporcionais possui como casos particulares os modelos de riscos proporcionais paramétricos (Kalbfleisch e Prentice, 1980)[5]. Em 2014, George et al [6] publicaram um artigo discutindo o modelo Cox e as abordagens paramétricas. Um fator recorrente e que afeta a condi¸cão de riscos proporcionais é a presen¸ca de covariáveis dependentes do tempo. No entanto, isso não se torna um problema uma vez que o modelo Cox comporta este tipo de variável explicativa. Bastos (2003)[7], por exemplo, ajustou os modelos de Cox para covariáveis independentes e dependentes do tempo.

Um método alternativo para o ajuste de dados censurados é o modelo log-linear ou de Poisson. Trata-se de um caso particular dos modelos lineares generalizados (MLG) que ajusta uma regressão para dados de contagem. No caso em que a variável resposta se refere ao tempo até evento, transforma-se estes dados em número de ocorrências do fenômeno desejado até um tempo t. Ao realizar essa contagem por intervalo de tempo, tem-se que a distribui¸cão de Poisson aparece naturalmente. Portanto, os novos dados obtidos por essa transforma¸cão seguem uma distribui¸cão de Poisson que satisfaz indiretamente a condi¸cão de razão de riscos proporcionais.

Em 2008, Mwangi [8] realizou um estudo comparativo entre os modelos de Cox e de Poisson. Neste estudo, ele verificou que a aplica¸cão desses modelos produziram resultados similares e levaram às mesmas conclusões independente da natureza dos dados (contagem ou tempo). No entanto, não foi levado em considera¸cão diferentes n´ıveis de censuras. A proposta deste trabalho é realizar também um estudo comparativo entre esses modelos e verificar a influencia do número de censura nas estima¸cões. Porém, adotando a abordagem Bayesiana.

Nessa abordagem, por meio das informa¸cões dispon´ıveis a respeito do problema em questão, busca-se diminuir a incerteza com rela¸cão a quantidade de interesse. Para tanto, utiliza-se o teorema de Bayes como mecanismo formal de atualiza¸cão das incertezas. Isto é, tem-se uma quantidade de interesse cuja intensidade de incerteza associada é descrita através de um modelo probabil´ıstico. Ao passo que novas informa¸cões são obtidas, esse modelo probabil´ıstico é atualizado via teorema de Bayes.

(15)

1.1 Objetivos

O presente Trabalho de Conclusão de Curso tem por objetivo comparar os modelos de regressão para dados censurados mais usados segundo a abordagem bayesiana para diferentes porcentagens de censuras. Especificamente, tem-se interesse pelo modelo Cox e pelo modelo de Poisson. Em ambos os casos, a censura será à direita.

1.2 Organiza¸

c˜

ao

Inicialmente, no Cap´ıtulo 1 é apresentada a introdu¸cão que comporta uma visão geral sobre este trabalho, no Cap´ıtulo 2 estão dispostos os conceitos básicos em Análise de Sobrevivência e Inferência Bayesiana. Em seguida, têm-se a defini¸cão dos modelos de Cox e de Poisson sob o ponto de vista bayesiano. No Cap´ıtulo 3, os resultados obtidos por meio dos modelos definidos no cap´ıtulo anterior são apresentados com base em estudos de dados simulados. No Cap´ıtulo 4, as conclusões deste trabalho são apresentadas.

(16)

2 Materiais e M´

etodos

´

E comum o interesse por analisar dados provenientes de acompanhamentos ao longo do tempo. Neste caso, pode-se citar a obten¸cão de séries temporais. No entanto, ao se analisar o tempo decorrido até a ocorrência de um fenômeno de interesse, tem-se uma nova classe de dados chamados dados de sobrevivência. Eles se caracterizam pela presen¸ca de censura na variável de interesse, tempo de sobrevivência. Tem-se, então, que esta variável não se refere ao registro pontual de um fato no tempo, mas sim ao tempo acumulado até que ele o seja observado ou que se perca a unidade sob observa¸cão. A distin¸cão entre dados completos e parciais ocorre por meio da variável indicadora de falha. A presen¸ca desta variável na composi¸cão do tempo de sobrevivência se torna um problema para as técnicas convencionais de análise (como lidar com dados incompletos?). Para resolver este problema, desenvolveu-se um conjunto de técnicas para dados censurados, a Análise de Sobrevivência.

O termo análise de sobrevivência refere-se basicamente a situa¸cões médicas envol-vendo dados censurados. Entretanto, condi¸cões similares ocorrem em outras áreas como em engenharia cujo termo mais usado é Confiabilidade. Seja qual for o caso, é normal o interesse em avaliar o efeito de covariáveis na variável resposta. Dentre os modelos de regressão para dados de sobrevivência, o mais famoso é o modelo semi-paramétrico ou modelo Cox. No entanto, devido a caracter´ıstica assimétrica do tempo de sobrevivência e a familiaridade dos pesquisadores com os modelos de regressão lineares generalizados (MLG), também é comum o uso do modelo de Poisson como alternativa. O presente tra-balho tem por objetivo fornecer o ajuste desses dois modelos via abordagem bayesiana. Portanto, neste cap´ıtulo, serão apresentados os conceitos básicos em Análise de Sobre-vivência. Em seguida, apresenta-se os conceitos de Inferência Bayesiana. E, por fim, tem-se a defini¸cão do modelo semi-paramétrico de regressão para dados de sobrevivência (modelo Cox). Bem como um caso particular de modelos lineares generalizados, o modelo de Poisson, sendo ambos definidos sob o ponto de vista bayesiano.

(17)

2.1 An´

alise de Sobrevivˆ

encia

Os dados de sobrevivência têm como variável resposta o tempo de sobrevivência, ou seja, o tempo até a ocorrência de um determinado evento. Estes eventos por serem na maioria das vezes indesejáveis são chamados de falha. Em situa¸cões médicas, por exem-plo, a falha, geralmente, se refere ao óbito do paciente. Da´ı o termo ”sobrevivência”que se refere ao tempo em que o paciente resistiu até a ocorrência do óbito. Além disso, como o tempo de sobrevivência é uma resposta temporal obtida de estudos prospectivos e de longa dura¸cão, é poss´ıvel não observar o evento de interesse durante o per´ıodo de estudo. Portanto, os dados de sobrevivência são compostos por dados completos e dados censu-rados que se referem, respectivamente, a observa¸cão completa e incompleta do fenômeno de interesse.

A presen¸ca de censura é a principal caracter´ıstica dos dados de sobrevivência e compõe a variável resposta. Ela é representada por uma variável indicadora de falha, que vale 1 se a observa¸cão falhou e 0 se foi censurada. Dessa forma, os dados de sobrevivência para o i-ésimo indiv´ıduo sob estudo é dado pela trinca (ti, δi, xi) tal que ti representa o tempo de sobrevivência, δi a variável indicadora de falha e xi o seu conjunto de covariáveis. For-malmente, para n indiv´ıduos acompanhados, o tempo de sobrevida do i-ésimo indiv´ıduo é dado por ti = min(Fi, Ci) com Fi e Ci variáveis independentes referentes ao tempo de falha e tempo de censura, respectivamente e δi = I(Fi ≤ Ci) a variável indicadora de falha. Note que, não se deve confundir censura com truncamento. Esta última refere-se a uma condi¸cão que deve ser satisfeita para a observa¸cão do tempo de sobrevivência. Por exemplo, se ao estudar o tempo de vida dos moradores de uma região considera-se apenas os dados retirados da previdência, então só aqueles aposentados ou que se aposentaram durante o estudo fazem parte da amostra. Veja que, em estudos com truncamento, alguns dados não são acompanhados a partir do tempo inicial.

As causas da ocorrência de censura (ou mecanismos de censura) são classificadas da seguinte forma: censura tipo I, se o estudo será terminado após um per´ıodo pr´ e-estabelecido de tempo. Censura tipo II, se o estudo será terminado após uma quantidade pré-estabelecida de indiv´ıduos apresentarem falha. E, censura tipo III quando há perda de observa¸cões no decorrer do estudo. No entanto, a classifica¸cão mais importante de censura é com rela¸cão a posi¸cão entre o evento e o tempo registrado. Neste caso, tem-se as seguintes caracteriza¸cões: censura à direita quando a ocorrência do evento está à direita do tempo registrado, censura à esquerda quando o evento já ocorreu quando o indiv´ıduo foi observado. Por fim, tem-se a censura intervalar quando se sabe que o evento ocorreu

(18)

dentro de um intervalo de tempo conhecido. A seguir, tem-se alguns exemplos de estudos que apresentaram censura.

Exemplo 2.1.1. Um estudo cl´ınico aleatorizado foi realizado para investigar o efeito da terapia com esteróide no tratamento de hepatite viral aguda (Gregory et. al., 1976)[9]. Por 16 semanas, cada paciente foi acompanhado ou até a morte (evento de interesse) ou até a perda de acompanhamento.

Exemplo 2.1.2. Um estudo foi realizado para determinar a idade em que as crian¸cas aprendem a ler em uma comunidade. Quando os pesquisadores come¸caram a pesquisa algumas crian¸cas já sabiam ler, porém elas não lembravam com que idade tinham apren-dido.

Exemplo 2.1.3. Um estudo retrospectivo foi realizado com 94 mulheres com diagnóstico precoce de câncer de mama com o objetivo de pesquisar duas terapias: (a) somente radio-terapia e (b) radioradio-terapia em conjunto da quimioradio-terapia (Klein e Moeschberger, 1997)[10]. As pacientes foram acompanhadas a cada 4-6 meses e, em cada visita, foram registrados: o tipo de retra¸cão da mama e o tempo até o aparecimento de uma retra¸cão moderada ou severa da mama.

No exemplo 2.1.1, tem-se que mecanismo de censura é aleatório uma vez que houve perdas ao longo do tempo de estudo (16 semanas) e a censura é à direita, pois só é poss´ıvel observar o efeito da terapia após o seu uso. Com rela¸cão ao exemplo 2.1.2, tem-se que a censura é à esquerda, pois o evento de interesse (aprender a ler) ocorreu em algum tempo anterior ao tempo observado. Neste exemplo, as crian¸cas que aprenderam a ler não sabiam exatamente quando isso ocorreu. Por fim, no exemplo 2.1.3, tem-se censura intervalar já que, ao registrar periodicamente o tempo, tem-se per´ıodos entre os quais o evento de interesse pode ter ocorrido ou não.

Os mecanismos de censura não condicionam a uma exclusiva caracteriza¸cão da cen-sura. Em outras palavras, estes mecanismos estão subordinados ao esquema do estudo, mas a caracteriza¸cão da censura com rela¸cão a posi¸cão do evento no tempo, não. A censura é, portanto, uma caracter´ıstica intr´ınseca dos dados na qual o pesquisador não possui influência (Lee, 1980[11] possui um cap´ıtulo para o condu¸cão de estudos cl´ınicos de sobrevivência). A censura mais comum é à direita (não importa o mecanismo) Neste trabalho, será analisado apenas dados de sobrevivência com censura do tipo III à direita que para facilitar será dita censura.

(19)

2.1.1 Especificando o Tempo de Sobrevivˆ

encia

Os tempos de sobrevivência são variáveis que medem o tempo até evento de interesse e estão sujeitos a varia¸cões (Lee, 1980)[11]. Portanto, trata-se de uma variável aleatória T não negativa, usualmente cont´ınua e, que pode conter censuras. Sabe-se também que dados censurados não são dados faltantes e sim incompletos, uma vez que contém in-forma¸cão relevante ao estudo. Por isso, eles devem ser incorporados à análise estat´ıstica por meio dos métodos de análise de sobrevivência já que são capazes de distinguir dados completos e censurados. Assim, inicia-se o estudo dos dados de sobrevivência por meio da defini¸cão das principais fun¸cões usadas para especificar a variável aleatória T .

Defini¸cão 2.1.4. Fun¸cão de sobrevivência

Seja T uma variável aleatória referente ao tempo de sobrevivência. A fun¸cão de sobrevivência, denotada por S(t), é definida como a probabilidade de uma observa¸cão não falhar (ou seja, sobreviver) por pelo menos ao tempo t. Ela é dada por:

S(t) = P (T ≥ t) = 1 − F (t), (2.1)

tal que F(·) ´e a distribui¸c˜ao acumulada de T.

A fun¸cão de sobrevivência caracteriza-se por ser decrescente assumindo valor 1 em t = 0 e tender a 0 para valores muito grandes de tempo. Ela fornece também estat´ısticas de interesse como: tempo mediano, tempo médio, percentis.

A próxima fun¸cão muito usada em análise de sobrevivência é a fun¸cão taxa de risco h(t) responsável por descrever a distribui¸cão do tempo de vida dos indiv´ıduos. Ou seja, ela descreve a forma com que a incidência de falha muda com o tempo levando em consi-dera¸cão que o indiv´ıduo havia sobrevivido até o in´ıcio do per´ıodo observado.

Defini¸c˜ao 2.1.5. Fun¸c˜ao de taxa de risco

A fun¸c˜ao de taxa de falha de T num intervalo [t, t + ∆t) ´e definida como: h(t) = lim

∆t→0+

P (t ≤ T < t + ∆t|T ≥ t)

∆t . (2.2)

O gráfico da fun¸cão de risco pode assumir três formas básicas: crescente, decrescente ou constante. Podendo ainda, assumir uma forma correspondente a combina¸cão de algu-mas das curvas básicas, como por exemplo a curva banheira. Assim, devido a variedade de configura¸cões poss´ıveis, ela é mais informativa do que a fun¸cão de sobrevivência e sua modelagem é um importante método para dados de sobrevivência.

(20)

Finalmente, apresenta-se a fun¸cão de taxa de risco acumulada. Esta fun¸cão é definida, como o nome sugere, da seguinte forma.

Defini¸c˜ao 2.1.6. Fun¸c˜ao de Taxa de Risco Acumulada

A fun¸c˜ao de taxa de risco acumulada do indiv´ıduo ´e dada por: H(t) =

Z t 0

h(u)du. (2.3)

Trata-se de uma fun¸cão sem interpreta¸cão direta, porém útil na avalia¸cão da fun¸cão de maior interesse, a fun¸cão taxa de falha h(t). Isso é evidênciado na estima¸cão n˜ ao-paramétrica, uma vez que Λ(t) possui um estimador com propriedades ótimas e h(t) é dif´ıcil de ser estimada.

2.1.2 Rela¸

c˜

oes entre Fun¸

c˜

oes

Tome T uma variável aleatória cont´ınua e não negativa que corresponde ao tempo de sobrevivência, as fun¸cões definidas anteriormente são matematicamente equivalentes. Ou seja, a partir de uma é poss´ıvel obter as outras por meio de opera¸cões matemáticas. As principais rela¸cões entre as fun¸cões são:

h(t) = f (t)

S(t), (2.4)

H(t) = −log(S(t)), (2.5)

S(t) = exp{−H(t)}. (2.6)

As demonstra¸c˜oes para as equa¸c˜oes 2.4, 2.5 e 2.6 encontram-se no Anexo A.

Nesta se¸cão, foi vista que a presen¸ca de dados censurados impacta na análise dos dados de sobrevivência e que eles devem ser incorporados na análise estat´ısticas por meio das técnicas da Análise de Sobrevivência. A censura é classifica como à direita, à esquerda ou intervalar dentre as quais a mais comum é a censura à direita. Em seguida, foram definidas as formas de especifica¸cão para a variável aleatória tempo de sobrevida. A próxima se¸cão é dedicada aos conceitos em Inferência Bayesiana que serão necessários para a defini¸cão dos modelos de regressão para dados de sobrevivência sob esta abordagem.

(21)

2.2 Inferˆ

encia Bayesiana

A inferência estat´ıstica tem como objetivo tirar conclusões a respeito de quantidades não observáveis (parâmetros) de determinada popula¸cão a partir de sua amostra. As técnicas normalmente utilizadas se baseiam na abordagem frequentista que por sua vez são suscet´ıveis ao tamanho da amostra. Uma maneira de tornar essas conclusões mais consistentes é por meio da abordagem bayesiana.

A Inferência Bayesiana é baseada nas ideias do pastor inglês Thomas Bayes (1702-1761) que foi responsável por desenvolver um caso particular do Teorema de Bayes. Porém, foi Richard Price ao perceber sua importância que o popularizou. A abordagem bayesiana para a inferência estat´ıstica considera que a única maneira satisfatória de descrever incer-tezas é por meio da probabilidade. Dessa forma, o parâmetro de interesse θ assume um modelo probabil´ıstico que é atualizado com novas informa¸cões via aplica¸cão do Teorema de Bayes. A seguir, tem-se o Teorema de Bayes, para uma única variável θ.

Teorema 2.2.1. Teorema de Bayes Aplicado a Inferˆencia Bayesiana

Inicialmente, todo o conhecimento a respeito de θ é resumido probabilisticamente através da distribui¸cão a priori p(θ). Este conhecimento nem sempre é suficiente, logo obtém-se uma amostra aleatória X = (X1, ..., Xn) relacionada a θ para adquirir mais informa¸cão. Esta informa¸cão é resumida via fun¸cão de verossimilhan¸ca l(θ) ou, analoga-mente, p(x|θ). O Teorema de Bayes é a regra de atualiza¸cão que fornece a distribui¸cão a posteriori p(θ|x). Ele é definido como:

p(θ|x) = p(θ)p(x|θ)

R p(x, θ)dθ. (2.7)

Como 1/R p(x, θ)dθ n˜ao depende de θ, tem-se que 2.6 ´e usualmente apresentada por:

p(θ|x) ∝ p(θ)p(x|θ). (2.8)

A distribui¸cão a priori deve representar probabilisticamente o conhecimento que se tem sobre o parâmetro de interesse θ antes da realiza¸cão do experimento. Portanto, todos os procedimentos bayesianos exigem a defini¸cão dessa quantidade. As principais formas de especifica¸cão são: priori conjugada ou priori não informativa (Migon e Gamerman, 1999)[12]. A distribui¸cão a priori é conjugada quando as distribui¸cões a priori e a poste-riori pertencem à mesma fam´ılia. Caso não haja informa¸cão dispon´ıvel sobre o parâmetro θ, deseja-se que a distribui¸cão a priori tenha pouca influência nas inferências, isto é, que ela seja não informativa. Selecionada uma distribui¸cão a priori adequada ao problema, o

(22)

outro componente importante é a fun¸cão de verossimilhan¸ca. Defini¸cão 2.2.2. Fun¸cão de Verossimilhan¸ca

Suponha uma popula¸cão X relacionada ao parâmetro de interesse θ. Uma amostra aleatória simples de tamanho n (X1, ..., Xn) é retirada dessa popula¸cão. Assim, dado os valores observados da amostra, a fun¸cão de verossimilhan¸ca é definida como:

L(θ|x) = n Y

i=1

f (xi|θ) (2.9)

Em análise de sobrevivência, os dados amostrais são agrupados em completos (n˜ ao-censurados) e censurados. Posto isto, cada dado completo contribui para a fun¸cão de verossimilhan¸ca 2.9 com a densidade e os censurados com a fun¸cão de sobrevivência. Ainda que de acordo com o mecanismo de censura a fun¸cão de verossimilhan¸ca seja modificada por uma constante, ela mantém o mesmo núcleo (Colosimo e Giolo, 2006)[13]. Portanto, a fun¸cão de verossimilhan¸ca 2.9 para qualquer mecanismo de censura é dada por: L(θ) = n Y i=1 f (ti, θ)δiS(ti, θ)1−δi. (2.10)

2.2.1 Estima¸

c˜

ao dos parˆ

ametros

As estima¸cões em Inferência Bayesiana são feitas com base na distribui¸cão a posteriori que contém toda a informa¸cão probabil´ıstica a respeito do parâmetro de interesse. As estima¸cões são divididas entre pontuais e intervalares. As estima¸cões pontuais são obtidas por meio de estat´ısticas apropriadas que resumem numericamente o comportamento do parâmetro θ. Já as estima¸cões intervalares são mais informativas, pois consideram a variabilidade dos dados. Os principais estimadores bayesianos são melhores entendidos no contexto da Teoria da Decisão (Ehlers, 2003; Migon e Gamerman, 1999)[14][12]. A seguir, dado um espa¸co paramétrico Θ que contém o parâmetro de interesse θ, os principais estimadores bayesianos são:

• m´edia a posteriori, E(θ|x):

E(θ|x) = Z

θ∈Θ

θp(θ|x)dθ, com fun¸c˜ao de perda 1 _quadr´_{atica L(δ, θ) = (δ − θ)}2_.

1_{A fun¸c˜}_{ao perda, denotada por l(θ, a), pode ser interpretada como a perda sofrida ao tomar a decis˜}_ao

(23)

• quantil α a posteriori, Q(α): Q(α) = ( θ0 ∈ Θ : Z θ0 −∞ p(θ|x)dθ = α ) ,

se α = 0.5 tem-se a mediana a posteriori e a fun¸c˜ao perda ´e L(δ, θ) = |δ − θ|. • intervalo 100(1 − α)% de credibilidade a posteriori, (LI, LS):

(LI, LS) = ( (LI0, LS0) ⊂ Θ2 : Z LS0 LI0 p(θ|x)dθ = 1 − α ) , α ∈ (0, 1),

se o intervalo é simétrico, então LI = Q(α/2) e LS = Q(1 − α/2).

A seguir, apresenta-se os métodos de amostragem da distribui¸cão a posteriori de uma variável de interesse θ (ou de um conjunto de variáveis θ). Trata-se das rotinas de simula¸cão Monte Carlo via Cadeias de Markov (MCMC) muito usados em Inferência Bayesiana (área geralmente com uma necessidade computacional intensa), pois são rápidos e eficientes (Barbosa et al., 2010)[16].

2.2.2 Monte Carlo via Cadeia de Markov (MCMC)

A abordagem bayesiana oferece via teorema de Bayes uma forma consistente de se modificar as informa¸cões sobre o parâmetro. No entanto, como em muitas situa¸cões práticas a distribui¸cão a posteriori é analiticamente intratável, durante muito tempo sua aplica¸cão esteve limitada devido a exigência computacional. Foi a partir da introdu¸cão dos métodos de Monte Carlo via Cadeia de Markov, sendo o amostrador de Gibbs (Geman e Geman, 1984)[17] e o algoritmo de Metropolis-Hastings (Metropolis et al., 1953 e Hastings, 1970)[18][19] os mais famosos, que ela se difundiu.

A ideia central desses métodos de simula¸cão é construir uma Cadeia de Markov da qual seja fácil gerar uma amostra e que haja uma distribui¸cão de equil´ıbrio. Ou seja, garante-se que a amostra é uma Cadeia de Markov:

• homogˆenea; • irredut´ıvel; • aperi´odica.

Na prática, a verifica¸cão de convergência é bastante estudada e pode envolver métodos sofisticados de análise. Porém, uma verifica¸cão da convergência muitas vezes suficiente

(24)

pode ser obtida por meio de gráficos e medidas descritivas sobre θ. O desenho do com-portamento de θ ao longo das itera¸cões e as análises dos gráficos com as autocorrela¸cões são as principais técnicas visuais usadas para a verifica¸cão de convergência. Outra forma de se realizar esse diagnóstico é por meio da estat´ıstica de Gelman-Rubin (Veja (Gelman e Rubin, (1992) [20] e Brooks e Gelman (1997)[21] para descri¸cão completa do método). Trata-se de uma medida que analisa a diferen¸ca entre múltiplas cadeias de Markov ao com-parar as varia¸cões estimadas entre e dentro das cadeias para cada parâmetro do modelo, valores próximos a um indicam convergência.

Algoritmo de Metropolis-Hastings

Seja a distribui¸cão de interesse a distribui¸cão a posteriori (θ|x) com θ = (θ1, ..., θs). Considere, também, que todas as condicionais completas (θi|θ−i, x) estejam dispon´ıveis (θ−i = θ1, ..., θi−1, θi+1, ..., θs), mas não se sabe gerar amostras de cada uma delas. As amostras de θi são obtidas a partir de uma distribui¸cão condicional proposta ao valor atual de θi, q(θ (p) i |θ (a) i ), tal que θ (p) i é o valor proposto e θ (a)

i ´e o valor atual para i = 1, ..., s. A seguir, tem-se o esquema de amostragem:

1. Inicialize θ(0) = (θ₁(0), ..., θs(0))0 e k = 1;

2. Obtenha um novo valor θ(k) _{a partir de θ}(k−1) _{por meio de sucessivas gera¸c˜}_{oes de} valores. Assim, para i = 1, ..., S, fa¸ca:

(i) Gere uma proposta para θ_i(k) de θ(p)_i ∼ q(θi|θ (k−1)

i );

(ii) Calcule a probabilidade de aceita¸c˜ao

α(θk, θ(k−1)) = min 1,

p(θ(p)_i |θ_i(a), x)q(θ_i(k−1)|θ(p)_i ) p(θ_i(k−1)|θ(a)_i , x)q(θ(p)_i |θ_i(k−1))

!

; (2.11)

(ii) Gere um valor u de u U (0, 1);

(ii) Se u < α(θk, θ(k−1)), n˜ao rejeite o valor proposto. 3. Fa¸ca k = k + 1, volte ao passo 2.

Amostrador de Gibbs

Suponha que a distribui¸cão de interesse é a distribui¸cão a posteriori p(θ|x) com θ = (θ1, ..., θS). Considere, também, que todas as condicionais completas a posteriori p(θi|θ−i, x)i = 1, ..., n estejam dispon´ıveis e que sabe-se gerar amostras de cada uma de-las. Assim, o esquema de amostragem é dado por:

(25)

1. Inicialize θ(0) = (θ₁(0), ..., θs(0))0 e k = 1;

2. Obtenha um novo valor para θ(k) a partir de θ(k−1) através de sucessivas gera¸cões de valores. Para i = 1 até S, gere um valor para θ(k)_i de

θ_i(k)∼ p(θi|θ (k) 1 , ..., θ (_k) i−1, θ (k+1) i+1 , ..., θ k−1 S , x),

3. Fa¸ca k = k + 1 e volte para 2, repetindo o procedimento at´e alcan¸car a convergˆencia.

Para o Amostrador de Gibbs, é necessário conhecer todas as condicionais completas, isto é, conhecer a fam´ılia de distribui¸cão ao qual elas pertencem. Enquanto que, no al-goritmo de Metropolis-Hastings, não é necessário que a distribui¸cão condicional completa seja conhecida. Assim, com os conceitos vistos em Análise de Sobrevivência e em In-ferência Bayesiana, pode-se, agora, prosseguir para a defini¸cão dos modelos de Cox e de Poisson sob o ponto de vista bayesiano.

2.3 Modelo Cox

O modelo Cox (1972)[1] é um modelo de regressão semi-paramétrico, pois não assume uma distribui¸cão de probabilidade para o tempo de sobrevivência e, portanto, consi-dera componentes paramétricos e não-paramétricos. O componente paramétrico pode ser qualquer fun¸cão não-negativa das covariáveis e seus coeficientes (Storer et al, 1983)[22], usualmente, fun¸cão exponencial. Assim, o modelo Cox é dado por:

h(t, x) = h0(t)exp{xβ}, (2.12)

tal que x é a matriz de covariáveis (n × p) e β é o vetor de coeficientes de tamanho p. O modelo Cox supõe que para dois indiv´ıduos distintos, os tempos de sobrevivência são independentes e que a rela¸cão entre os preditores e o risco é multiplicativa. Porém, a suposi¸cão mais importante desse modelo é a razão de riscos proporcionais ao longo do tempo. Isso significa que, para dois indiv´ıduos distintos i e j presentes na amostra, a razão dos riscos não depende do tempo, como pode ser observado a seguir.

hi(t) hj(t)

= h0(t)exp{xiβ} h0(t)exp{xjβ} = exp{β(xi − xj)}

(26)

o risco relativo, i.e., um aumento ou diminui¸cão de exp{xβ} do risco associado a uma varia¸cão unitária de determinada caracter´ıstica, tomando todas as outras constantes. Por exemplo, seja uma covariável x que assume apenas valores 0 ou 1, o risco é dado por:

h(t|x) =    h0(t), se x = 0 h0(t)eβ, se x = 1, logo: h(t|X = 1) = h(t|X = 0)eβ

tal que: se eβ _{= 1, ent˜}_{ao o risco ´}_{e igual nos dois grupos. Se e}β _{< 1, o risco ´}_{e e}β _vezes menor no grupo 1 do que no grupo 0. Caso contr´ario, o risco no grupo 1 ´e eβ vezes maior do que no grupo 0.

2.3.1 Abordagem bayesiana

Seguindo para a modelagem bayesiana de 2.12, a fun¸c˜ao de verossimilhan¸ca dada por 2.10 para o modelo Cox ´e:

L(β, h0) = n Y i=1 [h0(ti)exp{x0iβ}] δi exp{−H0(ti)exp{x0iβ}}.

Aplicando o teorema de Bayes e assumindo que a distribui¸cão a priori conjunta p(β, h0) = p(β)p(h0), tem-se que a distribui¸cão a posteriori conjunta é:

p(β, h0|x) ∝ p(β)p(h0) n Y i=1 [h0(ti)exp{x0iβ}] δi exp{−H0(ti)exp{x0iβ}}. (2.13)

Veja que, os parâmetros de interesse são os coeficientes β da regressão. Assim, to-mando a condicional completa de β a partir de 2.13, i.e, isolando apenas os termos que dependem de β, tem-se que:

p(β|H0, x) ∝ p(β)exp ( _n X i=1 h xiβδi− H0exiβ i ) .

Como β pode assumir qualquer valor em R, a distribui¸c˜ao a priori pode ser definida como:

β ∼ N ormal(m, V ),

(27)

Assim, a distribui¸c˜ao condicional completa de β ´e: p(β|H0, x) ∝ exp −1 2(β − m) T_V−1 (β − m) (2.14) × exp ( _n X i=1 h xiβδi− H0(ti)exiβ i ) .

Note que, a distribui¸cão 2.14 ainda depende da fun¸cão risco acumulada H0. Deve-se, portanto, obter estas quantidades para a estima¸cão de β. Para manter a estrutura semi-paramétrica do modelo Cox, Kalbfleisch porpôs em 1978 [23] que a priori H0(t) é um Processo Gama tal que seus parâmetros são:

E(H0(t)) = H∗(t), uma fun¸c˜ao positiva conhecida V (H0(t)) =

H∗(t) c .

com incrementos, definidos por h0 = dH0, independentes e com distribui¸c˜ao a priori Gama com parˆametros de forma e escala cdH(t) e c, respectivamente.

dH0(t) ∼ Gama(cdH∗(t), c).

A condicional completa de h0(t) = dH0(t) para todo tempo de falha ti ´e dada por: p(dH0(ti)|x, β) ∝ dH0(ti)cdH ∗_(t i)+δi−1 _(2.15) × exp    −dh0(ti)(c + X j∈R(ti) exj_β)    ,

tal que R(ti) refere-se ao conjunto de ´ındices das observa¸cões sob risco (observa¸cões que não falham ou não foram censuradas) no instante de falha ti. Portanto, a condicional completa de h0(ti) é conhecida, dH0(ti) ∼ Gama(cdH∗(ti) + δi, c +

P

j∈R(ti)e

xj_β).

A condicional completa dada por 2.15 é para a fun¸cão risco base h0 no tempo de falha ti. É necessário definir a fun¸cão de risco acumulada H0 em todos os tempos observados para substituir na condicional completa de β. Assumindo que entre tempos de falhas a fun¸cão de risco é constante, pode-se aproximar H0 por uma fun¸cão escada. No caso, assumiu-se que H0(t) =

Pt

u=0h0(u) com pontos de descontinuidade nos tempos de falha. Sabe-se que a condicional completa de β possui distribui¸cão desconhecida, enquanto que a condicional completa de H0 é conhecida. Portanto, para obter-se os valores de β é necessário combinar o MCMC via algoritmo de Metropolis-Hastings com o MCMC via

(28)

Amostrador de Gibbs. Essa combina¸c˜ao se deu da seguinte forma:

1. Inicialize θ(0) = (β(0), H₀(0)) e k = 1;

2. Obtenha um novo valor para θ(k) a partir de θ(k−1) atrav´es de sucessivas gera¸c˜oes de valores.

(a) Amostre h(k+1)₀ ∼ p(h0|β(k−1), X) (condicional completa 2.15) usando passo de Gibbs e aproxima-se H0 por H

(k+1)

0 (ti) =Pt_u=0i h0(u);

(b) Amostre β(k+1) ∼ p(β|H₀(k−1), X) (condicional completa 2.14) usando passo de Metropolis-Hastings com distribui¸c˜ao proposta dada por: β(p) = β(k−1)+ u, com u ∼ N (0, Vβ)

3. Fa¸ca k = k + 1 e volte para 2.

Um método alternativo para o ajuste de dados censurados é o modelo de Poisson descrito a seguir. Trata-se de um modelo linear generalizado (MLG) responsável por ajustar o número de eventos por intervalo de tempo. Portanto, o modelo de Poisson ajusta a contagem de eventos enquanto o modelo Cox ajusta uma fun¸cão do tempo de sobrevivência, taxa de risco. Na próxima se¸cão, também será discutido como realizar a transforma¸cão dos dados de sobrevivência para dados de contagem.

2.4 Modelo de Poisson

Nelder e Wedderburn (1972)[24] propuseram a classe de modelos lineares generalizados (MLG). Eles tinham como objetivo ampliar as propostas de distribui¸cão de probabilidade para a variável resposta e flexibilizar a rela¸cão funcional entre a média da variável resposta (µ) e o preditor linear (XTβ). Para isso, considera-se que a variável resposta pertence a fam´ılia exponencial e a rela¸cão funcional assume qualquer forma monótona (diferenciável) ao qual é denominada fun¸cão de liga¸cão.

No caso de dados de contagem, tem-se uma amostra de tamanho n dada por y1, ..., yn tal que suas realiza¸cões correspondem a variáveis aleatórias com distribui¸cão de Poisson, Yi ∼ P oisson(µi). O modelo de regressão é definido como:

log(µi) = XTi β, (2.16)

(29)

liga¸cão ser a fun¸cão logar´ıtmica. Nesse modelo, os coeficientes βj representam a mudan¸ca esperada no logaritmo da média por mudan¸ca unitária em xj.

Um modelo descrito por Armitage (1966) assume que uma variável Ni referente ao número de ocorrências do evento segue distribui¸cão Poisson com média µi = hiTi. De forma que, no subgrupo i (i = 1, ..., I), Ti é uma medida de exposi¸cão e se assume que hi segue um modelo log-linear. Isso define um modelo log-linear para taxas tal que:

log(µi) = log(Ti) + XTi β. (2.17)

Veja que, o modelo 2.17 possui exatamente os mesmos coeficientes β presentes no modelo anterior. Logo, os coeficientes β dos modelos considerados são comparáveis. A diferen¸ca se dá pelo termo log(Ti) ao qual é chamado offset. Trata-se de um termo conhe-cido de coeficiente fixo igual a 1 e que se relaciona a alguma medida de exposi¸cão. Esta medida, dependendo do contexto, pode ser tanto o tamanho da popula¸cão no subgrupo i quanto o tempo total que a popula¸cão desse subgrupo esteve sob observa¸cão (Holford, 1980) [25].

Em dados de sobrevivência, é poss´ıvel aplicar o modelo log-linear para taxas descrito anteriormente, conforme foi notado por Holford (1980) e Laird e Olliver (1981) em artigos independentes. Eles perceberam que, a fun¸cão de verossimilhan¸ca do modelo exponencial por partes (pieacewise exponential ) e do modelo log-linear para taxas 2.17 coincidem.

Para o tempo de sobrevivência dividido em intervalos e supondo que a fun¸cão de risco base é constante dentro de cada um, o modelo exponencial por partes é dado por:

hij = hjexp{XiTβ}

tal que hjé fun¸cão assumida constante dentro do intervalo j e exp{xiTβ} é o risco relativo para um indiv´ıduo de covariável xi em compara¸cão ao grupo base em determinado tempo. Transformando os dados de sobrevivência de forma que os intervalos entram na forma¸cão dos subgrupos. E, supondo que dentro de cada intervalo a fun¸cão risco base é constante. O modelo exponencial por partes pode ser aplicado para a nova variável referente ao número de ocorrências do evento no intervalo com médias

(30)

conforme foi apresentado por Armitage (1966) [26]. Tomando o logaritmo, segue que: log(µij) = log(tij) + log(hj) + XiTβ, (2.18) sendo tij o tempo de exposi¸cão e log(hj) é uma fun¸cão do intervalo j. Esse modelo pode ainda ser reescrito de forma que log(hj) “passa para dentro do preditor linear”tal que log(µij) = log(tij) + XiTβ. Portanto, o modelo exponencial por partes equivale ao modelo log-linear para a variável referente ao número de ocorrências do evento obtida da transforma¸cão dos dados.

A demonstra¸cão das equivalências entre as fun¸cões de verossimilhan¸ca do modelo log-linear e do modelo exponencial por partes pode ser vista em Rodr´ıguez (2007) [27] que, também, forneceu o passo a passo para a transforma¸cão dos dados de sobrevivência em dados de contagem. Essa transforma¸cão consiste em:

1. Dividir o tempo de sobrevivˆencia em J intervalos definidos como [τj−1, τj);

2. Criar uma medida de exposi¸c˜ao denotada por tij que corresponde ao tempo vivido pelo indiv´ıduo i no intervalo j (tempo sob risco) tal que:

tij =            τj− τj−1, se ti > τj, ti− τj−1, se τj−1 < ti < τj, 0, se ti < τj−1;

3. Criar indicadores de falha denotados por dij tais que:

dij =  



δi, se ti pertence ao intervalo j, 0, caso contr´ario;

4. Criar os subgrupos agrupando segundo intervalo e vari´avel categ´orica.

Na Figura 1, tem-se a visualiza¸cão do passo a passo anterior para a transforma¸cão dos dados de sobrevivência em dados de contagem. Observe que, nesse trabalho, os intervalos considerados foram todos de mesmo tamanho e iguais a 1. A seguir, tem-se a descri¸cão do modelo log-linear 2.18 para dados de sobrevivência transformados via abordagem bayesiana.

(31)

Figura 1: Transforma¸c˜ao para dados de contagem

2.4.1 Abordagem bayesiana

Com a transforma¸cão dos dados de sobrevivências, tem-se que a nova variável ob-servada Yi refere-se ao número de falhas no subgrupo i (i = 1, ..., I) tem distribui¸cão de Poisson com média µi = hiti. O modelo log-linear para taxas 2.17 tem a seguinte fun¸cão de verossimilhan¸ca: L(β) = I Y i=1 " exiTβti_(x iTβti)yi yi! # .

Os coeficientes β da regress˜_{ao podem assumir qualquer valor em R, ent˜ao assumindo} como distribui¸c˜ao a priori para β:

β ∼ N ormal(m, V ),

tal que m e V é o vetor de média e matriz de variância-covariância, respectivamente. Pelo Teorema de Bayes, segue que a distribui¸cão a posteriori :

p(β|x) ∝ exp −1 2(β − m) T_V−1 (β − m) I Y i=1 h exiTβti_(x iTβti)yi i . (2.19)

(32)

gerados da posteriori ser´a via Metropolis-Hastings com a seguinte distribui¸c˜ao proposta: β(p) = β(a)+ u,

(33)

3 Resultados

Neste cap´ıtulo, é apresentado os resultados de um dos estudos simulados realizados para os modelos Cox e Poisson considerando casos com diferentes porcentagem de censura. Todos os estudos apresentaram resultados similares, porém optou-se por apresentar apenas um deles por questão de simplicidade. Inicialmente, é apresentado os valores usados para a simula¸cão dos dados de sobrevivência e para as distribui¸cões a priori. Em seguida, os resultados obtidos para ambos os modelos são apresentados divididos em três casos.

3.1 Simula¸

c˜

ao

Neste trabalho, foram considerados trˆes casos com diferentes n´ıveis de censura. Para cada caso, foi gerada uma amostra dos tempos de sobrevivˆencia do modelo Cox-Weibull (Bender et al., 2005 [28]) definido por:

h(t|X, β, α, λ) = αλtα−1eXβ, (3.1)

tal que X é o vetor de covariáveis, α e λ são os parâmetros da distribui¸cão Weibull e β são os coeficientes da regressão.

Essas amostras geradas foram compostas por 100 observa¸cões e duas covariáveis (X1, X2) cada uma com distribui¸cão de Bernoulli com p = 0, 5. Os outros parâmetros foram definidos como: (β1, β2)T = (1, −1)T, λ = 1 e α = 1. E, os n´ıveis de censura considerados foram: 10%, 30% e 50%.

Em seguida, os modelos Cox e Poisson foram ajustados via abordagem bayesiana de acordo com o definido nas se¸cões 2.3.1 e 2.4.1, respectivamente. O objetivo foi verificar a qualidade do ajuste do modelo alternativo em capturar os efeitos das covariáveis. Bem como, analisar o desempenho dessas abordagens em cenários com diferentes n´ıveis de censura. A inferência foi feita com base nas amostras a posteriori obtidas para os modelos de interesse através dos algoritmos MCMC implementados manualmente no programa R

(34)

(R Core Team, 2008 [29]). Os valores assumidos a priori foram: β ∼ N " 0 0 # , " 100 0 0 100 #! ,

para os coeficientes β tanto no modelo Cox quanto no Poisson e, H₀∗(t) = 1

10t c = 0, 1

para a fun¸c˜ao risco base do modelo Cox, segundo Soares (2003) [7].

Em ambos os modelos, foram geradas duas cadeias cada uma com 75000 itera¸c˜oes. As amostras a posteriori foram obtidas selecionando uma dessas cadeias e utilizando burn-in de 2000 e lag = 50. Assim, os tamanhos dessas amostras foram de 1461 observa¸c˜oes em todos os casos.

3.1.1 Caso 1

No primeiro caso, considerou-se dados de sobrevivência com 10% de censura. O seu tempo mediano foi de 0, 704. Na Figura 2, tem-se a distribui¸cão emp´ırica dos tempos de sobrevivência gerados sem as covariáveis para se ter uma ideia visual de sua distribui¸cão. Nos dois primeiros instantes, cerca de 75% das observa¸cões sa´ıram do estudo devido a falha ou censura. As censuras encontram-se indicadas no gráfico por “|”.

Figura 2: Fun¸cão de sobrevivência emp´ırica linha (—) e intervalo de confian¸ca de 95% (área hachurada)

(35)

Inicialmente, verificou-se a qualidade das amostras a posteriori obtidas pelo algoritmo MCMC implementado para o modelo Cox por meio da análise visual do tra¸co das cadeias e dos gráficos de autocorrela¸cão. O diagnóstico do MCMC para esse modelo encontra-se nas Figuras 3 e 4.

Pela visualiza¸cão do comportamento das cadeias através do tra¸co para cada coefici-ente de regressão, é razoável supor que a partir do burn-in especificado anteriormente houve convergência devido à estabilidade ao redor dos reais valores dos parâmetros e a so-breposi¸cão das cadeias. Formalmente, o cálculo da estat´ıstica de Gelman-Rubin também indica a existência de convergência uma vez que os valores obtidos estão muito próximos de 1.

(a) Tra¸co β1 (b) Tra¸co β2

Figura 3: Tra¸co das cadeias - modelo Cox caso 1 (10% de censura).

Pelos correlogramas da Figura 4, percebe-se como as autocorrela¸cões amostrais di-minuem em fun¸cão das defasagens (lag). Veja que, os elementos selecionados a cada 50 observa¸cões, fornecem amostras cujos termos se tornaram independentes a partir dessa distância.

Logo, o algoritmo MCMC implementado para o modelo Cox gerou cadeias capazes de fornecer amostras que produzem boas estimativas para os coeficientes de regressão uma vez que se garantiu a convergência. Garantiu-se também que essas amostras formadas por elementos retirados a cada 50 observa¸cões são independentes.

(36)

Figura 4: Correlogramas - modelo Cox caso 1 (10% de censura).

As estat´ısticas sumarizando as informa¸cões obtidas pela amostra do modelo Cox encontram-se na Tabela 1. Os resultados mostrados na tabela abaixo foram retirados da cadeia 1 para ambos os parâmetros. O estimador pontual usado foi a média que forne-ceu estimativas próximas aos verdadeiros valores dos parâmetros. Veja que, as distâncias entre a média e o real foram de −0, 023 e −0, 103 para os coeficientes β1 e β2, respectiva-mente. E, as amplitudes dos intervalos de credibilidade foram iguais a 0, 979 e 1, 105.

Tabela 1: Estat´ısticas descritivas da amostra a posteriori - modelo Cox caso 1

Parˆametro Real M´edia D.P. 2,5% 50% 97,5%

β1 1 0,977 0,252 0,476 0,977 1,455

β2 −1 −1,103 0,276 −1,674 −1,097 −0,569

A Figura 5 apresenta os histogramas da distribui¸cão a posteriori para os coeficientes de regressão estimados. Perceba que, os verdadeiros valores dos parâmetros estão contidos nos respectivos intervalos de credibilidade de 95% destacados em vermelho. Trata-se de uma representa¸cão visual das medidas resumo presentes na Tabela 1.

(37)

Figura 5: Histogramas dos coeficientes de regress˜ao modelo Cox caso 1 com intervalo de credibilidade 95% em vermelho.

A Figura 6(b) apresenta a fun¸cão risco base acumulada. Os verdadeiros valores da fun¸cão risco (H0(t) = t, ∀t) estão contidos no intervalo de credibilidade. E, na Figura 6(a) tem-se a fun¸cão de risco base obtida por meio de uma aproxima¸cão simples de H0.

(a) h0(t) (b) log(H0(t))

(38)

Analogamente, tem-se o diagnóstico do MCMC para o modelo Poisson. Assim como no modelo anterior, existe a convergência das cadeias (Figura 7). E, para a mesma distância de defasagem, tem-se que as amostras obtidas são compostas por elementos independentes (Figura 8).

Figura 7: Tra¸co das cadeias - modelo Poisson caso 1 (10% de censura).

(39)

Com rela¸cão ao diagnóstico visual dos algoritmos MCMC implementados em cada modelo, tem-se que em ambos é poss´ıvel obter boas amostras. Porém, notou-se que a estat´ıstica de Gelman-Rubin foi maior no modelo Poisson.

Na Tabela 2, encontram-se as estat´ısticas sumarizando as informa¸cões obtidas pela amostra da abordagem alternativa com base na primeira cadeia gerada em cada parâmetro. Pode-se perceber que em compara¸cão ao modelo Cox, as amplitudes dos intervalos de cre-dibilidade dos coeficientes de regressão foram maiores. As distâncias entre a média e o real valor dos parâmetros β1 e β2 foram, respectivamente, iguais a 0, 049 e −0, 191. E, as amplitudes foram de 2, 144 e 2, 329 para esses mesmos parâmetros. Dessa forma, o modelo Poisson teve um erro maior (em módulo) com rela¸cão as estimativas pontuais e, também, intervalos com maiores amplitudes em compara¸cão ao modelo Cox.

Na Figura 9, encontram-se os histogramas para as distribui¸cões amostrais de cada coeficiente do modelo Poisson com os intervalos de credibilidade 95% destacados em ver-melho. É poss´ıvel notar visualmente que as amplitudes no modelo Poisson foram maiores que no modelo anterior. Assim, apesar de ambos os modelos satisfazerem os critérios de convergência e fornecerem amostras de boa qualidade para a estima¸cão dos coeficientes, o modelo Poisson apresentou um desempenho inferior ao modelo Cox segundo os critérios analisados.

Tabela 2: Estat´ısticas descritivas da amostra a posteriori - modelo Poisson caso 1

β1 1 1,049 0,548 0,006 1,044 2,150 β2 −1 −1,191 0,606 −2, 358 −1,209 −0, 029 Intercepto - −0,098 0,495 −1, 080 −0,078 0,822 Intervalo:2 - −0,359 0,784 −1, 959 −0,306 1,021 Intervalo:3 - −0,659 1,113 −3, 065 −0,568 1,206 Intervalo:4 - −0,950 1,779 −5, 168 −0,716 1,804 Intervalo:5 - 0,134 1,678 −4, 002 0,387 2,584 Intervalo:6 - −15,111 8,733 −30, 515 −15,687 0,727 Intervalo:7 - −11,500 9,783 −34, 149 −8,476 1,525 Intervalo:8 - −15,041 12,829 −41, 875 −13,459 1,939 Intervalo:9 - −13,629 12,917 −43, 122 −9,243 1,763 Intervalo:10 - −2,101 4,070 −11, 234 −1,398 3,725

(40)

Figura 9: Histogramas dos coeficientes de regress˜ao modelo Poisson caso 1 com intervalo de credibilidade 95% em vermelho.

3.1.2 Caso 2

Nesta se¸cão, os resultados apresentados referem-se aos dados de sobrevivência com 30% de censura. Na Figura 10, encontra-se a distribui¸cão emp´ırica sem as covariáveis. O tempo mediano foi de 0, 883 e cerca de 76% dos dados falharam ou foram censurados nos dois primeiros instantes.

(41)

Assim como na se¸c˜ao anterior, avaliou-se primeiro a qualidade dos algoritmos imple-mentados ao considerar dados com porcentagem maior de censura. Nas Figuras 11 e 12, encontram-se, respectivamente, os tra¸cos das cadeias e os correlogramas do modelo Cox.

Figura 11: Tra¸co das cadeias - modelo Cox Caso 2 (30% de censura).

Pela análise visual dos tra¸cos das cadeias (Figura 11), pode-se observar que mesmo com dados de sobrevivência com uma maior porcentagem de censura, o algoritmo MCMC implementado para o modelo Cox produziu cadeias que convergiram. As estat´ısticas de Gelman-Rubin foram próximas a 1, mas em compara¸cão ao caso anterior seus valores fo-ram maiores, possivelmente devido ao aumento de censura. As análises dos correlogramas (Figura 12) também indicaram uma diminui¸cão das autocorrela¸cões segundo o número de lags, tornando-se próximos a zero para valores maiores ou iguais a 50.

As estat´ısticas sumarizando as informa¸cões obtidas pela amostra do modelo Cox encontram-se na Tabela 3. As amplitudes dos intervalos foram de 1, 229 e 1, 203, logo houve um aumento em compara¸cão a esse mesmo modelo no caso anterior (0, 979 e 1, 105). Por sua vez, as distâncias entre a média e os seus reais valores foram de −0, 271 e 0, 116 para β1 e β2, respectivamente.

Tabela 3: Estat´ısticas descritivas da amostra a posteriori - modelo Cox Caso 2

β1 1 0,729 0,318 0,112 0,733 1,341

(42)

Figura 12: Correlogramas - modelo Cox Caso 2 (30% de censura).

Os histogramas com a distribui¸cão a posteriori dos coeficientes de regressão estimados estão na Figura 13. A fun¸cão risco base acumulada e a aproxima¸cão da fun¸cão risco base h0(t) se encontram na Figura 14.

Figura 13: Histogramas dos coeficientes de regress˜ao modelo Cox Caso 2 com intervalo de credibilidade 95% em vermelho.

(43)

(a) h0(t) (b) log(H0(t))

Figura 14: Estimativas para h0(t) e H0(t) no modelo Cox Caso 2.

Analogamente, foi verificada a qualidade do algoritmo MCMC para o modelo Poisson. Em rela¸cão ao caso anterior, foi poss´ıvel observar a convergência através da análise visual dos tra¸cos das cadeias e do cálculo das estat´ısticas de Gelman-Rubin.

Figura 15: Tra¸co das cadeias - modelo Poisson no Caso 2 (30% de censura).

Por sua vez, a análise dos correlogramas também indicou a diminui¸cão das correla¸cões entre observa¸cões e se observou que esse mesmo modelo necessita de uma defasagem maior

(44)

que 50 para se garantir a independência. No entanto, devido ao número de itera¸cões realizadas, optou-se por selecionar os elementos amostrais a cada 50 observa¸cões para manter o mesmo tamanho de amostra.

Figura 16: Correlogramas - modelo Poisson no Caso 2 (30% de censura).

As amostras obtidas pela cadeia 1 mantendo o burn-in de 2000 observa¸cões e o lag de 50 apresentaram correla¸cões aproximadamente iguais a 0, 15 e 0, 14 para os parâmetros β1 e β2, respectivamente. Na Tabela 4, encontram-se as estat´ısticas descritivas obtidas por essa amostra. As distâncias entre as médias e seus reais valores foram iguais a −0, 179 e 0, 084 para β1 e β2, respectivamente. E, as amplitudes foram de 2, 704 e 2, 505 para esses mesmos parâmetros. Na Figura 17, tem-se os intervalos de credibilidade presentes na tabela destacados em vermelho. Pode-se perceber visualmente que as amplitudes desses intervalos foram maiores no modelo Poisson em compara¸cão ao modelo Cox.

Assim, os algoritmos MCMC aplicados aos dados de sobrevivência com 30% de censura satisfizeram as condi¸cões de convergência segundo o critério de Gelman-Rubin. Compa-rando ambos os modelos, o modelo Poisson apresentou desempenho inferior em rela¸cão ao Cox devido a maior amplitude dos intervalos de credibilidade. Houve também que devido ao número de itera¸cões, as amostras obtidas pelo modelo Poisson eram compostas por observa¸cões com correla¸cões o que diminuiu a qualidade das estima¸cões realizadas.

(45)

Tabela 4: Estat´ısticas descritivas da amostra a posteriori - modelo Poisson Caso 2

β1 1 0,821 0,677 −0, 477 0,812 2, 227 β2 −1 −0,916 0,650 −2, 206 −0,904 0, 299 Intercepto - −0,393 0,584 −1, 586 −0,363 0, 633 Intervalo:2 - −0,148 0,819 −1, 912 −0,082 1, 263 Intervalo:3 - −0,410 1,475 −3, 882 −0,183 1, 893 Intervalo:4 - −2,578 3,652 −12, 576 −1,632 1, 729 Intervalo:5 - −1,982 3,949 −13, 268 −0,872 2, 676 Intervalo:6 - −22,021 13,015 −51, 716 −20,110 −0, 771 Intervalo:7 - −4,998 7,446 −24, 750 −2,484 3, 082 Intervalo:8 - −15,362 13,939 −46, 115 −12,438 2, 253 Intervalo:9 - −11,199 9,020 −30, 752 −10,889 2, 649 Intervalo:10 - −15,434 15,189 −54, 960 −10,418 2, 921

Figura 17: Histogramas dos coeficientes de regress˜ao modelo Poisson Caso 2 com intervalo de credibilidade 95% em vermelho.

(46)

3.1.3 Caso 3

No último caso que corresponde ao cenário com 50% dos dados de sobrevivência censu-rados, apresenta-se na Figura 18 o gráfico com a distribui¸cão emp´ırica sem as covariáveis. O tempo mediano foi de 1, 27 e aproximadamente 60% das observa¸cões ou, falharam ou foram censuradas nos dois primeiros instantes.

Os gráficos para os tra¸cos das cadeias (Figura 19) e os correlogramas (Figura 20) confirmaram visualmente a convergência do algoritmo MCMC para o modelo Cox. Os valores das estat´ısticas de Gelman-Rubin próximas a um confirmaram essa afirma¸cão.

(47)

Figura 20: Correlogramas - modelo Cox Caso 3 (50% de censura).

No entanto, vale ressaltar que nesse caso tais estat´ısticas obtiveram os maiores valores em rela¸cão a esse mesmo modelo aplicado nos casos anteriores. Na Tabela , tem-se as estat´ısticas da amostra obtida da cadeia 1 do modelo Cox. Perceba que, os erros das estimativas pontuais foram de 0, 023 e 0, 005 para os coeficientes β1 e β2, respectivamente. As amplitudes dos intervalos de credibilidade foram iguais a 1, 381 e 1, 43 para esses mesmos parâmetros. Em compara¸cão aos casos anteriores para o modelo Cox, este caso obteve as maiores amplitudes.

Tabela 5: Estat´ısticas descritivas da amostra a posteriori - modelo Cox Caso 3

β1 1 0,977 0,358 0,276 0,975 1,657

β2 −1 −1,005 0,367 −1, 735 −1,002 −0, 305

Na Figura 21, encontra-se a distribui¸cão a posteriori dos coeficientes de regressão nos modelos Cox com os intervalos de credibilidade marcados em vermelho. Na Figura 22, tem-se a fun¸cão risco base acumulada H0(t) e a aproxima¸cão da fun¸cão risco base. Veja que, nesse caso a fun¸cão risco base acumulada H0(t) possuiu a maior parte dos seus

(48)

verdadeiros valores fora do intervalo de credibilidade de 95%.

Figura 21: Histogramas dos coeficientes de regress˜ao modelo Cox Caso 3 com intervalo de credibilidade 95% em vermelho.

(a) h0(t) (b) log(H0(t))

Figura 22: Estimativas para h0(t) e H0(t) no modelo Cox Caso 3.

Nas Figuras 23 e 24, encontram-se respectivamente os gr´aficos com os tra¸cos das cadeias e os correlogramas. Pode-se verificar visualmente a convergˆencia e as estat´ısticas

(49)

de Gelman-Rubin próximas a um também corroboram com essa afirma¸cão.

Figura 23: Tra¸co das cadeias - modelo Poisson Caso 3 (50% de censura).

Figura 24: Correlogramas - modelo Poisson Caso 3 (50% de censura).

Assim como no caso anterior, para alcan¸car amostras com observa¸cões independen-tes é necessário usar defasagens maiores que 50 conforme indicado pelos correlogramas. No entanto, também optou-se por manter lag de tamanho igual a 50. Mantendo esse valor e usando um burn-in igual a 2000, obteve-se amostras cujas estat´ısticas descritivas encontram-se na Tabela 6. As distâncias foram de 0, 086 e −0, 058 para os coeficientes

(50)

β1 e β2, respectivamente. E, as amplitudes foram de 2, 621 e 2, 775 para esses mesmos parˆametros.

Tabela 6: Estat´ısticas descritivas da amostra a posteriori - modelo Poisson Caso 3

β1 1 1,086 0,664 −0, 245 1,079 2,376 β2 −1 −1,058 0,707 −2, 485 −1,043 0,290 Intercepto - −0,955 0,626 −2, 309 −0,905 0,156 Intervalo:2 - 0,577 0,827 −1, 077 0,595 2,154 Intervalo:3 - 0,365 1,196 −2, 476 0,510 2,380 Intervalo:4 - −3,542 4,229 −13, 44 −2,462 2,06 Intervalo:5 - −0,029 2,279 −5, 608 0,359 3,537 Intervalo:6 - −9,174 10,834 −42, 785 −6,208 3, 395 Intervalo:7 - −0,391 4,722 −12, 506 0,748 5,574

Figura 25: Histogramas dos coeficientes de regress˜ao modelo Poisson Caso 3 com intervalo de credibilidade 95% em vermelho.

(51)

4 Conclus˜

ao

Os resultados obtidos confirmam que os modelo Cox e Poisson podem ser usados na análise dos dados de sobrevivência apesar da diferen¸ca de natureza das variáveis de-pendentes. No modelo Cox, tem-se que a variável dependente se refere ao tempo de sobrevivência, enquanto no modelo de Poisson ela se refere ao número de falhas. Ambos os modelos foram ajustados via inferência bayesiana considerando casos com 10%, 30% e 50% de censura.

Em cada caso, foi realizado um estudo simulado com nove simula¸cões. Contudo, por questões de simplicidade, o presente trabalho apresentou apenas uma dessas simula¸cões. O tempo computacional do algoritmo MCMC para o modelo Cox foi maior que no Poisson devido a sua complexidade. No modelo Cox, foi necessário estimar primeiro fun¸cão risco base via passo de Gibbs para depois estimar os coeficientes de regressão via Metropolis-Hastings. Enquanto que, no modelo Poisson, todos os parâmetros puderam ser estimados via Metropolis-Hastings.

Pode-se perceber que os algoritmos MCMC de ambos os modelos convergiram in-dependentemente do número de censuras. Logo, as amostras obtidas pelos algoritmos implementados foram suficientes para fornecer boas aproxima¸cões das condicionais com-pletas dos coeficientes de regressão. Dessa forma, pode-se afirmar que tanto o modelo Cox quanto o Poisson foram capazes de capturar os efeitos das covariáveis.

Porém, ao comparar as estimativas obtidas entre os modelos em cada caso, o mo-delo Cox teve o melhor desempenho. Tanto os erros das estimativas pontuais quanto as amplitudes dos intervalos de credibilidade foram menores no modelo Cox mesmo com o aumento da porcentagem de censura. Portanto, apesar de ser mais pesado computacio-nalmente, o modelo Cox obteve melhor desempenho nas estimativas em compara¸cão ao Poisson que é menos intenso computacionalmente.