• Nenhum resultado encontrado

Modelo de regressão para um processo de renovação Weibull com termo de fragilida...

N/A
N/A
Protected

Academic year: 2017

Share "Modelo de regressão para um processo de renovação Weibull com termo de fragilida..."

Copied!
185
0
0

Texto

(1)

Escola Superior de Agricultura “Luiz de Queiroz”

Modelo de regress˜

ao para um processo de renova¸c˜

ao Weibull com

termo de fragilidade

Jos´

e Carlos Fogo

Tese apresentada para obten¸c˜ao do t´ıtulo de Doutor em Agronomia. ´Area de concentra¸c˜ao: Estat´ıstica e Experimenta¸c˜ao Agronˆomica

(2)

Estat´ıstico

Modelo de regress˜ao para um processo de renova¸c˜ao Weibull com termo de

fragilidade

Orientadora:

Prof. Dr. CLARICE G. B. DEM ´ETRIO

Tese apresentada para obten¸c˜ao do t´ıtulo de Doutor em Agronomia. ´Area de concentra¸c˜ao: Estat´ıstica e Experimenta¸c˜ao Agronˆomica

Piracicaba

(3)

DadosInternacionais de Catalogação na Publicação (CIP) DIVISÃO DE BIBLIOTECA E DOCUMENTAÇÃO - ESALQ/USP

Fogo, José Carlos

Modelo de regressão para um processo de renovação Weibull com termo de fragilidade / José Carlos Fogo. - - Piracicaba, 2007.

184 p. : il.

Tese (Doutorado) - - Escola Superior de Agricultura Luiz de Queiroz, 2007. Bibliografia.

1. Análise de sobrevivência 2. Processos estocásticos pontuais 3. Simulação (Estatística) I. Título

CDD 519.536

(4)

`

A minha esposa Elza pelo amor, pela compreens˜ao, pelo apoio e por ser o pilar que d´a sustenta¸c˜ao `a nossa fam´ılia com sua for¸ca e determina¸c˜ao.

(5)

AGRADECIMENTOS

Com a conclus˜ao do trabalho e obten¸c˜ao do sucesso almejado, todos os mo-mentos passados retornam em nossas mentes: pessoas, lugares, sensa¸c˜oes, tudo fica na lembran¸ca valorizando ainda mais o nosso feito. A todas as pessoas que, direta ou indi-retamente, contribu´ıram para que esse projeto alcan¸casse ˆexito, deixo, aqui, meus sinceros agradecimentos.

`

A Profa Dra Clarice Garcia Borges Dem´etrio a orienta¸c˜ao sempre dedicada, a

amizade, confian¸ca e incentivo em todo o decorrer do trabalho.

Ao Profo Francisco Louzada Neto a valiosa colabora¸c˜ao no projeto.

`

A Universidade Federal de S˜ao Carlos e professores do Departamento de Es-tat´ıstica a confian¸ca, proporcionando as condi¸c˜oes necess´arias para a realiza¸c˜ao do trabalho. Aos professores Wagner Borges, Roseli Aparecida Leandro e Jos´e Antonio Frizzoni as valiosas sugest˜oes e coment´arios quando da realiza¸c˜ao do meu exame de quali-fica¸c˜ao.

Aos professores e funcion´arios do Departamento de Ciˆencias Exatas da ESALQ/USP que me propiciaram as condi¸c˜oes para a realiza¸c˜ao do trabalho.

Aos colegas e amigos de doutorado Beth, Ana Maria, Denise, Genevile e Pedro a for¸ca, a amizade, a troca de experiˆencias e a aten¸c˜ao recebida em todos os momentos que estivemos juntos, momentos esses que ficar˜ao para sempre.

A Todos os colegas do Departamento de Estat´ıstica deixo meus sinceros agra-decimentos pela colabora¸c˜ao e confian¸ca, em especial `as Profas Cristina e Vera e ao Prof.

Luiz Milan, os valiosos conselhos e sugest˜oes.

Ao Sr. Val´erio e D. Lurdes, que no papel de avˆo e av´o, dedicaram tanto carinho ao meu filho durante minhas ausˆencias.

`

A minha m˜ae Antonia, meu pai Vil´ezio e toda minha fam´ılia, o carinho e a compreens˜ao, sempre rezando por mim e acreditando no meu trabalho.

(6)

SUM ´ARIO

RESUMO . . . 8

ABSTRACT . . . 9

LISTA DE FIGURAS . . . 10

LISTA DE TABELAS . . . 13

1 INTRODUC¸ ˜AO . . . 17

2 CONCEITOS INICIAIS . . . 20

2.1 Eventos terminais e recorrentes . . . 20

2.2 Popula¸c˜oes homogˆeneas e heterogˆeneas . . . 21

2.3 Observa¸c˜oes dos dados . . . 23

2.4 Censura . . . 23

2.4.1 Tipos de censuras . . . 25

2.5 Modelos de sobrevivˆencia cont´ınuos . . . 27

2.5.1 Algumas considera¸c˜oes sobre a fun¸c˜ao de risco . . . 30

2.5.2 A fun¸c˜ao de verossimilhan¸ca . . . 32

2.6 Modelos discretos . . . 34

2.7 Modelos de regress˜ao . . . 35

2.7.1 Modelos de regress˜ao param´etricos . . . 38

2.7.1.1 Modelo exponencial . . . 38

2.7.1.2 Modelo de Weibull . . . 39

2.7.2 Modelos de regress˜ao semiparam´etricos . . . 40

2.7.2.1 Modelo de regress˜ao de Cox . . . 40

2.8 Processos de contagem . . . 43

2.8.1 No¸c˜oes b´asicas de processos de contagem . . . 43

2.8.2 Processos de Poisson . . . 51

2.8.2.1 Processo de Poisson homogˆeneo (HPP) . . . 52

2.8.2.2 Processo de Poisson n˜ao homogˆeneo (NHPP) . . . 53

2.8.3 Processos de renova¸c˜ao . . . 54

2.9 Modelo de fragilidade . . . 61

(7)

2.9.2 A distribui¸c˜ao para a fragilidade . . . 66

3 MODELO DE REGRESS ˜AO PARA UM PROCESSO DE RENOVAC¸ ˜AO . . . 68

3.1 Modelo de regress˜ao para um processo de renova¸c˜ao limitado pelo n´umero de falhas 68 3.2 Modelo de regress˜ao para um processo de renova¸c˜ao limitado pelo tempo . . . 69

3.3 Modelo de fragilidade para um processo de renova¸c˜ao limitado pelo tempo . . . . 71

3.3.1 Modelo de regress˜ao para um processo de renova¸c˜ao com fragilidade gama . . . 72

4 M´ETODOS . . . 76

4.1 Simula¸c˜ao de um modelo de regress˜ao para um processo de renova¸c˜ao com distri-bui¸c˜ao Weibull, limitado pelo n´umero de falhas . . . 76

4.2 Simula¸c˜ao de um modelo de regress˜ao para um processo de renova¸c˜ao com distri-bui¸c˜ao Weibull, limitado pelo tempo . . . 79

4.3 Simula¸c˜ao de um modelo de regress˜ao para um processo de renova¸c˜ao com distri-bui¸c˜ao Weibull, com censuras, limitado pelo n´umero de falhas . . . 80

4.3.1 Corre¸c˜ao do v´ıcio de ˆβ0 pelo processo de “bootstrap” . . . 81

4.4 Simula¸c˜ao de um modelo de regress˜ao para um processo de renova¸c˜ao com distri-bui¸c˜ao Weibull, com termo de fragilidade com distridistri-bui¸c˜ao gama . . . 83

5 RESULTADOS . . . 86

5.1 Simula¸c˜ao de um modelo de regress˜ao para um processo de renova¸c˜ao com distri-bui¸c˜ao Weibull . . . 86

5.1.1 An´alise das variˆancias dos estimadores. . . 94

5.1.2 Processo de renova¸c˜ao limitado pelo tempo . . . 104

5.1.3 Conclus˜ao . . . 105

5.2 Simula¸c˜ao de um modelo de regress˜ao para um processo de renova¸c˜ao com distri-bui¸c˜ao Weibull e dados censurados . . . 107

5.2.1 Variˆancia das estimativas, para um processo de renova¸c˜ao com dados censurados 113 5.2.2 Corre¸c˜ao do v´ıcio nas estimativas deβ0 . . . 126

5.2.3 Conclus˜ao . . . 128

(8)

5.3.1 An´alise das variˆancias das estimativas para as simula¸c˜oes do modelo com termo

de fragilidade . . . 130

5.3.2 Conclus˜ao . . . 133

REFERˆENCIAS . . . 146

APˆENDICES . . . 150

(9)

RESUMO

Modelo de regress˜ao para um processo de renova¸c˜ao Weibull com termo de

fragilidade

Processsos de renova¸c˜ao s˜ao um caso especial de processos pontuais envolvendo eventos recorrentes nos quais um item ou unidade, ap´os a ocorrˆencia de uma falha, ´e reco-locado na mesma condi¸c˜ao de novo. Devido a essa propriedade os tempos entre ocorrˆencias para um processo de renova¸c˜ao s˜ao independentes e a sua fun¸c˜ao intensidade ´e dada pela fun¸c˜ao de risco. Fatores que interferem nos tempos de recorrˆencia de unidades distintas, ou indiv´ıduos, e que n˜ao s˜ao observados, podem ser modelados com a inclus˜ao de um termo de fragilidade no modelo. Neste trabalho ´e apresentado o desenvolvimento de um modelo de regress˜ao para um processo de renova¸c˜ao com tempos entre ocorrˆencias com distribui¸c˜ao de Weibull. Na modelagem foi considerada, ainda, a presen¸ca de censuras e a inclus˜ao de um termo de fragilidade para explicar a rela¸c˜ao existente entre os tempos de recorrˆencias de uma unidade. A metodologia ´e desenvolvida para o caso em que v´arias unidades s˜ao acometidas por eventos recorrentes. Nas simula¸c˜oes realizadas foram analisadas as probabilidades de co-bertura emp´ıricas do intervalo de confian¸ca normal assint´otico e tamb´em o comportamento das variˆancias dos estimadores. A presen¸ca de censuras na amostra inflacionou as variˆancias dos estimadores de m´axima verossimilhan¸ca al´em de produzir estimativas viciadas para um dos parˆametros da regress˜ao, sendo que o v´ıcio do estimador foi corrigido por meio de um processo ”bootstrap”. Na modelagem sem termo de fragilidade, os resultados das an´alises das probabilidades de cobertura emp´ırica dos intervalos de confian¸ca assint´oticos mostraram uma boa aproxima¸c˜ao com os valores esperados, mas com certos cuidados a serem toma-dos, especialmente nos procedimentos baseados na simetria das distribui¸c˜oes emp´ıricas. A inclus˜ao de um termo de fragilidade na modelagem, por sua vez, causou uma perturba¸c˜ao na estima¸c˜ao m´axima verossimilhan¸ca com um aumento nas variˆancias dos estimadores di-retamente associados `a variabilidade do termo de fragilidade. Al´em disso, as coberturas emp´ıricas dos intervalos de confian¸ca assint´oticos foram, na grande maioria superestimadas, com resultados satisfat´orios apenas para o parˆametro de forma da distribui¸c˜ao Weibull.

(10)

ABSTRACT

Regression model for a Weibull renewall process distribution with a frailty effect

Renewal Processes are a special case of point processes involving recurrent events in which a unit, after a failure, is restored to the like new condition. Due to that property the times between occurrences for a renewal process are independent and its in-tensity function is given by the hazard function. Random factors not observed, that affects the recurrence times of the units, can be explained by a frailty term added in the model. In this work a regression model is presented for a renewal process with Weibull distribution for the times between occurrences. The modeling considers censored times and a frailty variable to explain the relationship among the recurrence times of a unit. The methodo-logy was developed for the situation where several units are submitted by recurrent events. The empirical probabilities of coverage of the asymptotic normal confidence interval and the behavior of the variances of the estimators were analyzed in the simulations performed. The presence of censures in the sample inflated the variances of the maximum likelihood estimators besides to produce biased estimates for the regression parameters. The bias of the estimator was corrected by ”bootstrap” procedure. The analysis of the probability of empirical coverage of the asymptotic confidence intervals, without frailty, presented a good approximation to the nominal values, but some observations about procedures have to be made on the symmetry of the empirical distributions. The frailty term incorporated at the modeling disturbed the maximum likelihood estimation increasing estimators’ variability, directly associated to the variance of the fragility term. In the most of the cases, the empi-rical coverages of the asymptotic confidence intervals were overestimated, with satisfactory results just for the shape parameter of the Weibull distribution.

(11)

LISTA DE FIGURAS

Figura 1 - Representa¸c˜ao gr´afica para dados terminais e recorrentes, respectivamente 22

Figura 2 - Representa¸c˜ao gr´afica de censuras `a direita, de tipo I e tipo II . . . 27

Figura 3 - A esquerda, fun¸c˜oes de densidade Weibull para δ = 0,8; 1,0 e 2,0 e a direita, respectivas fun¸c˜oes de risco . . . 30

Figura 4 - Tipos diferentes de fun¸c˜oes de risco . . . 32

Figura 5 - Representa¸c˜ao gr´afica de um processo de contagem . . . 44

Figura 6 - Representa¸c˜ao gr´afica individual, de falha (x) e censura (o), na forma de processo de contagem . . . 49

Figura 7 - Processo de renova¸c˜ao com tempo limite . . . 60

Figura 8 - Processo de renova¸c˜ao com tempo limitetL (as linhas horizontais indicam

as unidades e as marcas sobre as linhas, as recorrˆencias do evento) . . . . 62

Figura 9 - Decaimento das variˆancias de ˆδ, ˆβ0 e ˆβ1, com n fixo, para δ= 0,8 . . . 98

Figura 10 - Decaimento das variˆancias de ˆδ, ˆβ0 e ˆβ1, com n fixo, para δ= 1,0 . . . 99

Figura 11 - Decaimento das variˆancias de ˆδ, ˆβ0 e ˆβ1, com n fixo, para δ= 2,0 . . . 100

Figura 12 - Decaimento das variˆancias de ˆδ, ˆβ0 e ˆβ1, com m fixo, para δ= 0,8 . . . . 101

Figura 13 - Decaimento das variˆancias de ˆδ, ˆβ0 e ˆβ1, com m fixo, para δ= 1,0 . . . . 102

Figura 14 - Decaimento das variˆancias de ˆδ, ˆβ0 e ˆβ1, com m fixo, para δ= 2,0 . . . . 103

Figura 15 - Decaimento das variˆancias de ˆδ, ˆβ0 e ˆβ1, comδ = 2,0, para o caso limitado

pelo tempo . . . 106

Figura 16 - Decaimento das variˆancias de ˆδ, ˆβ0 e ˆβ1, com n fixo, para δ = 2,0 e

propor¸c˜ao de censuras p= 0.30 . . . 118

Figura 17 - Decaimento das variˆancias de ˆδ, ˆβ0 e ˆβ1, com n fixo, para δ = 2,0 e

propor¸c˜ao de censuras p= 0.20 . . . 119

Figura 18 - Decaimento das variˆancias de ˆδ, ˆβ0 e ˆβ1, com n fixo, para δ = 2,0 e

propor¸c˜ao de censuras p= 0.05 . . . 120

Figura 19 - Decaimento das variˆancias de ˆδ, ˆβ0 e ˆβ1, com n fixo, para δ = 2,0 e

propor¸c˜ao de censuras p= 0.01 . . . 121

Figura 20 - Decaimento das variˆancias de ˆδ, ˆβ0 e ˆβ1, com m fixo, para δ = 2,0 e

(12)

Figura 21 - Decaimento das variˆancias de ˆδ, ˆβ0 e ˆβ1, com m fixo, para δ = 2,0 e

propor¸c˜ao de censuras p= 0.20 . . . 123

Figura 22 - Decaimento das variˆancias de ˆδ, ˆβ0 e ˆβ1, com m fixo, para δ = 2,0 e

propor¸c˜ao de censuras p= 0.05 . . . 124

Figura 23 - Decaimento das variˆancias de ˆδ, ˆβ0 e ˆβ1, com m fixo, para δ = 2,0 e

propor¸c˜ao de censuras p= 0.01 . . . 125

Figura 24 - Decaimento das variˆancias de ˆα, para α= 0,2 e δ = 0,8, 1,0 e 2,0, respec-tivamente, com n fixo . . . 155

Figura 25 - Decaimento das variˆancias de ˆδ, para α= 0,2 e δ = 0,8, 1,0 e 2,0, respec-tivamente, com n fixo . . . 156

Figura 26 - Decaimento das variˆancias de ˆβ0, para α = 0,2 e δ = 0,8, 1,0 e 2,0,

respectivamente, com n fixo . . . 157

Figura 27 - Decaimento das variˆancias de ˆβ1, para α = 0,2 e δ = 0,8, 1,0 e 2,0,

respectivamente, com n fixo . . . 158

Figura 28 - Decaimento das variˆancias de ˆα, para α= 0,2 e δ = 0,8, 1,0 e 2,0, respec-tivamente, com m fixo . . . 159

Figura 29 - Decaimento das variˆancias de ˆδ, para α= 0,2 e δ = 0,8, 1,0 e 2,0, respec-tivamente, com m fixo . . . 160

Figura 30 - Decaimento das variˆancias de ˆβ0, para α = 0,2 e δ = 0,8, 1,0 e 2,0,

respectivamente, com m fixo . . . 161

Figura 31 - Decaimento das variˆancias de ˆβ1, para α = 0,2 e δ = 0,8, 1,0 e 2,0,

respectivamente, com m fixo . . . 162

Figura 32 - Decaimento das variˆancias de ˆα, para α= 0,5 e δ = 0,8, 1,0 e 2,0, respec-tivamente, com n fixo . . . 163

Figura 33 - Decaimento das variˆancias de ˆδ, para α= 0,5 e δ = 0,8, 1,0 e 2,0, respec-tivamente, com n fixo . . . 164

Figura 34 - Decaimento das variˆancias de ˆβ0, para α = 0,5 e δ = 0,8, 1,0 e 2,0,

respectivamente, com n fixo . . . 165

Figura 35 - Decaimento das variˆancias de ˆβ1, para α = 0,5 e δ = 0,8, 1,0 e 2,0,

(13)

Figura 36 - Decaimento das variˆancias de ˆα, para α= 0,5 e δ = 0,8, 1,0 e 2,0, respec-tivamente, com m fixo . . . 167

Figura 37 - Decaimento das variˆancias de ˆδ, para α= 0,5 e δ = 0,8, 1,0 e 2,0, respec-tivamente, com m fixo . . . 168

Figura 38 - Decaimento das variˆancias de ˆβ0, para α = 0,5 e δ = 0,8, 1,0 e 2,0,

respectivamente, com m fixo . . . 169

Figura 39 - Decaimento das variˆancias de ˆβ1, para α = 0,5 e δ = 0,8, 1,0 e 2,0,

(14)

LISTA DE TABELAS

Tabela 1 - Resultados das simula¸c˜oes para ˆδ, geradas com δ = 0,8 . . . 88

Tabela 2 - Resultados das simula¸c˜oes para ˆδ, geradas com δ = 1,0 . . . 89

Tabela 3 - Resultados das simula¸c˜oes para ˆδ, geradas com δ = 2,0 . . . 89

Tabela 4 - Resultados das simula¸c˜oes para ˆβ0, geradas com δ= 0,8 . . . 90

Tabela 5 - Resultados das simula¸c˜oes para ˆβ0, geradas com δ= 1,0 . . . 91

Tabela 6 - Resultados das simula¸c˜oes para ˆβ0, geradas com δ= 2,0 . . . 92

Tabela 7 - Resultados das simula¸c˜oes para ˆβ1, geradas com δ= 0,8 . . . 93

Tabela 8 - Resultados das simula¸c˜oes para ˆβ1, geradas com δ= 1,0 . . . 93

Tabela 9 - Resultados das simula¸c˜oes para ˆβ1, geradas com δ= 2,0 . . . 94

Tabela 10 -Coeficientes angulares de log[ ˆvar(.)] x log(m) para n fixo . . . 96

Tabela 11 -Coeficientes angulares de log[ ˆvar(.)] x log(n), para m fixo . . . 97

Tabela 12 -Resultados das simula¸c˜oes com δ = 2,0, para para o caso limitado pelo tempo . . . 104

Tabela 13 -Coeficiente angular de log[ ˆvar(.)] x log(m), para o caso limitado pelo tempo105 Tabela 14 -Resultados das simula¸c˜oes para ˆδ, com δ = 2,0 e propor¸c˜ao de censuras p= 0,30 . . . 108

Tabela 15 -Resultados das simula¸c˜oes para ˆδ, com δ = 2,0 e propor¸c˜ao de censuras p= 0,20 . . . 109

Tabela 16 -Resultados das simula¸c˜oes para ˆδ, com δ = 2,0 e propor¸c˜ao de censuras p= 0,05 . . . 110

Tabela 17 -Resultados das simula¸c˜oes para ˆδ, com δ = 2,0 e propor¸c˜ao de censuras p= 0,01 . . . 110

Tabela 18 -Resultados das simula¸c˜oes para ˆβ1, com δ = 2,0 e propor¸c˜ao de censuras p= 0,30 . . . 111

Tabela 19 -Resultados das simula¸c˜oes para ˆβ1, com δ = 2,0 e propor¸c˜ao de censuras p= 0,20 . . . 112

(15)

Tabela 21 -Resultados das simula¸c˜oes para ˆβ1, com δ = 2,0 e propor¸c˜ao de censuras

p= 0,01 . . . 113

Tabela 22 -Raz˜ao entre as variˆancias das esimativas com e sem censuras . . . 114

Tabela 23 -Coeficientes angulares de log[ ˆvar(.)] x log(m) para n fixo, na presen¸ca de censuras . . . 116

Tabela 24 -Coeficientes angulares de log[ ˆvar(.)] x log(n) para m fixo, na presen¸ca de censuras . . . 117

Tabela 25 -V´ıcio do estimador de m´axima verossimilhan¸ca deβ0, para dados censurados126

Tabela 26 -Probabilidade de cobertura do estimador corrigido ˆβc

0, para m fixo e δ =

2,0, com dados censurados . . . 128

Tabela 27 -Raz˜ao entre as variˆancias de ˆβc

0 e variˆancia das estimativas sem censuras . 128

Tabela 28 -M´edias das raz˜oes das variˆancias do modelo com fragilidade e do modelo sem fragilidade e sem censuras, em rela¸c˜ao aos parˆametros α e δ . . . 132

Tabela 29 -Resultados das simula¸c˜oes para ˆα, comδ = 0,8 e parˆametro de fragilidade

α = 0,2 . . . 134

Tabela 30 -Resultados das simula¸c˜oes para ˆα, comδ = 1,0 e parˆametro de fragilidade

α = 0,2 . . . 134

Tabela 31 -Resultados das simula¸c˜oes para ˆα, comδ = 2,0 e parˆametro de fragilidade

α = 0,2 . . . 135

Tabela 32 -Resultados das simula¸c˜oes para ˆδ, comδ = 0,8 e parˆametro de fragilidade

α = 0,2 . . . 135

Tabela 33 -Resultados das simula¸c˜oes para ˆδ, comδ = 1,0 e parˆametro de fragilidade

α = 0,2 . . . 136

Tabela 34 -Resultados das simula¸c˜oes para ˆδ, comδ = 2,0 e parˆametro de fragilidade

α = 0,2 . . . 136

Tabela 35 -Resultados das simula¸c˜oes para ˆβ0, comδ= 0,8 e parˆametro de fragilidade

α = 0,2 . . . 137

Tabela 36 -Resultados das simula¸c˜oes para ˆβ0, comδ= 1,0 e parˆametro de fragilidade

(16)

Tabela 37 -Resultados das simula¸c˜oes para ˆβ0, comδ= 2,0 e parˆametro de fragilidade

α = 0,2 . . . 138

Tabela 38 -Resultados das simula¸c˜oes para ˆβ1, comδ= 0,8 e parˆametro de fragilidade

α = 0,2 . . . 138

Tabela 39 -Resultados das simula¸c˜oes para ˆβ1, comδ= 1,0 e parˆametro de fragilidade

α = 0,2 . . . 139

Tabela 40 -Resultados das simula¸c˜oes para ˆβ1, comδ= 2,0 e parˆametro de fragilidade

α = 0,2 . . . 139

Tabela 41 -Resultados das simula¸c˜oes para ˆα, comδ = 0,8 e parˆametro de fragilidade

α = 0,5 . . . 140

Tabela 42 -Resultados das simula¸c˜oes para ˆα, comδ = 1,0 e parˆametro de fragilidade

α = 0,5 . . . 140

Tabela 43 -Resultados das simula¸c˜oes para ˆα, comδ = 2,0 e parˆametro de fragilidade

α = 0,5 . . . 141

Tabela 44 -Resultados das simula¸c˜oes para ˆδ, comδ = 0,8 e parˆametro de fragilidade

α = 0,5 . . . 141

Tabela 45 -Resultados das simula¸c˜oes para ˆδ, comδ = 1,0 e parˆametro de fragilidade

α = 0,5 . . . 142

Tabela 46 -Resultados das simula¸c˜oes para ˆδ, comδ = 2,0 e parˆametro de fragilidade

α = 0,5 . . . 142

Tabela 47 -Resultados das simula¸c˜oes para ˆβ0, comδ= 0,8 e parˆametro de fragilidade

α = 0,5 . . . 143

Tabela 48 -Resultados das simula¸c˜oes para ˆβ0, comδ= 1,0 e parˆametro de fragilidade

α = 0,5 . . . 143

Tabela 49 -Resultados das simula¸c˜oes para ˆβ0, comδ= 2,0 e parˆametro de fragilidade

α = 0,5 . . . 144

Tabela 50 -Resultados das simula¸c˜oes para ˆβ1, comδ= 0,8 e parˆametro de fragilidade

α = 0,5 . . . 144

Tabela 51 -Resultados das simula¸c˜oes para ˆβ1, comδ= 1,0 e parˆametro de fragilidade

(17)

Tabela 52 -Resultados das simula¸c˜oes para ˆβ1, comδ= 2,0 e parˆametro de fragilidade

α = 0,5 . . . 145

Tabela 53 -Coeficientes angulares de log[ ˆvar(.)] x log(m) para o parˆametro da distri-bui¸c˜ao da fragilidade igual a 0,2 e 0,5 . . . 151

Tabela 54 -Coeficientes angulares de log[ ˆvar(.)] x log(n) para o parˆametro da distri-bui¸c˜ao da fragilidade igual a 0,2 e 0,5 . . . 152

Tabela 55 -Raz˜ao entre as variˆancias do modelo com fragilidade e do modelo sem fragilidade e sem censuras . . . 153

Tabela 56 -M´edias das raz˜oes entre as variˆancias do modelo com fragilidade e do modelo sem fragilidade e sem censuras, em rela¸c˜ao ao n´umero de unidades

m . . . 154

(18)

1 INTRODUC¸ ˜AO

Processsos de renova¸c˜ao (RP) s˜ao um caso especial de processos pontuais, nos quais um item ou unidade, ap´os a ocorrˆencia de uma falha, ´e recolocado na mesma condi¸c˜ao de novo (ou t˜ao bom quanto novo) por meio de uma a¸c˜ao corretiva ou de manuten¸c˜ao. Em fun¸c˜ao disso, segue-se que os tempos entre as ocorrˆencias s˜ao iid segundo uma intensidade

λ(.). A literatura para eventos recorrentes ´e bastante ampla e tem crescido muito nos ´ultimos anos, acompanhando o desenvolvimento computacional. Ascher e Feingold (1984) e Rigdon e Basu (2000) apresentam detalhes da teoria. Klein e Moeschberger (1997) e Andersen et al. (1993) apresentam a teoria para eventos recorrentes sob o enfoque de processos de contagem. Dados de eventos recorrentes s˜ao estudados atrav´es de modelos de fragilidade, conforme pode-se observar em Klein e Moeschberger (1997) e Colosimo e Giolo (2006).

O modelo para dados de sobrevivˆencia na forma de processos pontuais mais explorado ´e o modelo introduzido por Cox (1972b), tamb´em conhecido como processo de

renova¸c˜ao modulado, ou RPM, o qual engloba diferentes tipos de processos conforme a

defini¸c˜ao dos parˆametros envolvidos. Gill (1984) apresenta o modelo de Cox (1972a) sob o enfoque da teoria de processos de contagem multivariados, extendendo a teoria assint´otica por meio de martingales. Lawless e Thiagarajah (1996) apresentam um modelo misto que engloba tanto um termo detendˆencia, como um termo derenova¸c˜ao e Lindqvist et al. (2003) unificaram oito tipos de modelos similares ao de Lawless e Thiagarajah, considerando o processo transformado para as intensidades acumuladas. Em seu modelo, Lindqvist engloba os processos de Poisson, de renova¸c˜ao e os modelos mistos, o qual chamou de processo de

renova¸c˜ao e tendˆencia TRP (trend renewal process), bem como esses mesmo modelos com

a incorpora¸c˜ao de um termo de heterogeneidade, ou fragilidade. Mais recentemente, Guo et al. (2006) apresentaram um modelo misto, alternativo ao modelo de Lawless e Thiagarajah, no qual o termo referente `a renova¸c˜ao foi substitu´ıdo pelo n´umero esperado de falhar do processo N(t), visando simplicar a aplica¸c˜ao do modelo na pr´atica.

(19)

apresenta um estudo comparativo de modelos de regress˜ao em processos de Poisson e em Silva (2001), tˆem-se detalhes da teoria para modelos de regress˜ao sob o enfoque de processos de contagem.

A estima¸c˜ao dos parˆametros por meio do m´etodo de m´axima verossimilhan¸ca, na maior parte das situa¸c˜oes, considera a aproxima¸c˜ao assint´otica dos estimadores na cons-tru¸c˜ao de intervalos de confian¸ca ou em teste de hip´otese. A teoria estat´ıstica, no entanto, apresenta in´umeros exemplos de casos nos quais as propriedades assint´oticas n˜ao funcionam conforme o esperado, especialmente quando se trabalha com dados censurados. Johnson et al. (1995) citam um exemplo no qual o estimador de m´axima verossimilhan¸ca do parˆametro de forma do modelo de Weibull apresenta um v´ıcio quando se incorporam dados censurados. Em estudos com eventos recorrentes, como ´e o caso dos processos de renova¸c˜ao, pode existir uma dependˆencia nos dados referente a um fator aleat´orio, n˜ao mensur´avel e que pode levar a v´ıcios nas estimativas dos parˆametros do modelo. Al´em disso, a n˜ao inclus˜ao de covari´aveis importantes na modelagem pode causar um aumento significativo na heterogeneidade n˜ao observada, o que pode afetar as inferˆencias sobre as covari´aveis presentes no modelo (COLOSIMO E GIOLO, 2006). Os modelos de fragilidade tˆem sido desenvolvidos com o intuito de minizar os efeitos decorrentes dessas situa¸c˜oes. Os modelos mais difundidos consideram um termo de fragilidades w agindo de forma multiplicativa na fun¸c˜ao de risco

Este trabalho tem como objetivo o desenvolvimento de de um modelo de re-nova¸c˜ao para eventos recorrentes para uma quantidade de unidades em teste, introduzindo na modelagem a presen¸ca de um termo de fragilidade explicando o relacionamento entre as recorrˆencias de uma unidade ou um indiv´ıduo. Pretende-se, ainda, estudar o comportamento assint´otico dos estimadores de m´axima verossimilhan¸ca pela quantifica¸c˜ao da probabilidade de cobertura dos intervalos asint´oticos, em situa¸c˜oes nas quais observam-se dados censu-rados; avaliar o decaimento das variˆancias dos estimadores com o aumento do n´umero de unidades e da quanridade de recorrˆencias por unidade e estudar o efeito da fragilidade na va-riabilidade dos estimadoresnas e nas probabilidades de coberturas dos inervalos de confian¸ca asint´oticos.

(20)
(21)

2 CONCEITOS INICIAIS

An´alise de Sobrevivˆencia ´e formada pelo conjunto de t´ecnicas estat´ısticas

uti-lizadas para o estudo de dados de tempos de vida de um indiv´ıduo, item ou componente. Este tempo de vida ´e uma medida contada a partir de um tempo inicial, bem definido, at´e a ocorrˆencia de um evento em particular, o qual se deseja estudar. O intervalo de tempo que vai do instante inicial at´e a ocorrˆencia do evento de interesse poder´a ser chamado de

tempo de sobrevivˆenvia ou de sobrevida, tempo de falha ou simplesmente tempo de vida.

A an´alise de tempos de vida tem sido aplicada preferencialmente na pesquisa m´edica, onde recebe o nome de an´alise de sobrevivˆencia e na ´area industrial, onde comp˜oe um conjunto de t´ecnicas denominadas de an´alise de confiabilidade.

Em an´alise de sobrevivˆencia, o tempo de origem corresponde ao instante de entrada de um indiv´ıduo em um estudo. Esse instante pode coincidir com o instante do diagn´ostico de uma doen¸ca; in´ıcio de um tratamento; ocorrˆencia de um evento adverso (por exemplo infarto); recorrˆencia de uma doen¸ca; etc. O tempo final pode ser o tempo at´e a cura, tamb´em chamado de tempo de remiss˜ao; at´e a primeira manifesta¸c˜ao da doen¸ca; tempo de recorrˆencia ou, se tratando de doen¸ca terminal, tempo at´e a morte do paciente. Se o tempo final culminar com a morte do paciente, ent˜ao, o dado resultante ser´a de fato um tempo de sobrevivˆencia. Dados n˜ao terminais s˜ao chamados de tempo at´e o evento

(COLLETT, 2003).

Em an´alise de confiabilidade, o equivalente ao tempo de sobrevivˆencia ´e co-nhecido como tempo de falha, quando um componente ou sistema deixa de operar satifato-riamente.

2.1 Eventos terminais e recorrentes

(22)

terminal quando se tem interesse em observ´a-lo uma ´unica vez, como ´e o caso da primeira gravidez ou cura de uma doen¸ca. Note que no segundo caso o tempo ser, ou n˜ao, terminal depende da defini¸c˜ao do estudo que se est´a realizando.

Eventos n˜ao terminais, por sua vez, ocorrem quando a observa¸c˜ao n˜ao se encerra com a ocorrˆencia do evento de interesse, podendo o mesmo acontecer por diversas vezes durante o per´ıodo de observa¸c˜ao e s˜ao conhecidos por eventos recorrentes. Eventos recorrentes s˜ao muito comuns em confiabilidade quando se observa a ocorrˆencia de falhas de um equipamento, ou m´aquina, durante um estudo ou durante a sua vida ´util (RIGDON E BASU, 2000). Na pesquisa m´edica, podem-se encontrar dados de eventos recorrentes quando se estuda a reincidˆencia de doen¸cas ou sintomas, como por exemplo em estudos sobre a AIDS. Em Barreto et al. (1994), ´e apresentado um estudo da recorrˆencia de diarr´eia infantil com dados da Universidade Federal da Bahia.

Uma caracter´ıstica importante dos dados de eventos recorrentes ´e a de-pendˆencia temporal, ou estoc´astica, permitindo a modelagem desses dados atrav´es de m´etodos de sobrevivˆencia em processos de contagem (AALEN, 1978).

Na Figura 1, tem-se a representa¸c˜ao gr´afica para dados terminais e recorrentes. Para os dados terminais, o s´ımbolo “x” representa a ocorrˆencia do evento, no caso a morte ou falha e indica o final da observa¸c˜ao. Para os dados recorrentes, o s´ımbolo “x” representa as recorrˆencias do evento e o s´ımbolo “o” indica que a observa¸c˜ao j´a se encerrou, por´em outras ocorrˆencias do evento poder˜ao ocorrer al´em daquele instante (que ser˜ao definidos

comotempos de censuras).

2.2 Popula¸c˜oes homogˆeneas e heterogˆeneas

(23)

0 5 10 15

1

2

3

4

Tempo

Indivíduos

x x

x x

0 5 10 15 20 25

1

2

3

4

Tempo

Indivíduos

x x x x

x x x

x x x

x x

Figura 1 - Representa¸c˜ao gr´afica para dados terminais e recorrentes, respectivamente

dispon´ıveis juntamente com o tempo at´e o evento. Essas vari´aveis ou, covari´aveis, rece-ber˜ao o nome de vari´aveis explanat´orias ou explicativas, pois descrevem as caracter´ısticas individuais de cada paciente. Quando os tempos de sobrevivˆencia est˜ao relacionados com as covari´aveis, diz-se que a popula¸c˜ao dos ind´ıviduos, ou unidades, ´e uma popula¸c˜ao

hete-rogˆenea.

Normalmente, as covari´aveis s˜ao medidas uma ´unica vez ao longo do estudo sendo, portanto, consideradas fixas. Contudo, podem-se encontrar conjuntos de dados em que as covari´aveis tamb´em variam com o tempo, uma vez que seus valores se modificam durante o per´ıodo de observa¸c˜ao.

(24)

experi-mentos com cobaias, criadas em laborat´orios exclusivamente para ensaios cl´ınicos ou, ent˜ao, na ind´ustria, em que os componentes em teste podem ser considerados todos “iguais”.

2.3 Observa¸c˜oes dos dados

Na literatura de an´alise de sobrevivˆencia s˜ao apresentados basicamente dois mecanismos para a observa¸c˜ao de dados. No primeiro caso, tem-se uma popula¸c˜ao infinita, com parˆametros desconhecidos, que devem ser estimados atrav´es de uma amostra. As caracter´ısticas associadas a cada indiv´ıduo s˜ao fixas, mas podem variar entre os mesmos, originando uma distribui¸c˜ao populacional cujos parˆametros s˜ao aqueles que se quer conhecer (CARVALHO et al., 2005).

O segundo mecanismo pressup˜oe que as caracter´ısticas individuais obedecem a uma lei estoc´astica, comum a todos. Uma mesma caracter´ıstica poder´a ser mensurada repetidas vezes para um mesmo indiv´ıduo, ou item, possuindo uma distribui¸c˜ao desconhe-cida, que se deseja determinar. Portanto, essas caracter´ısticas n˜ao s˜ao fixas, podendo variar com o tempo.

Geralmente, tem-se apenas um conjunto de observa¸c˜oes para cada indiv´ıduo, o que impede a descri¸c˜ao da distribui¸c˜ao individual, contudo, as inferˆencias poder˜ao ser obtidas considerando-se que os indiv´ıduos s˜ao homogˆeneos e independentes (CARVALHO et al., 2005).

Os dois mecanismos descritos permitem generaliza¸c˜oes. Assim, a popula¸c˜ao infinita, que serve de fonte para a amostra em estudo, pode ser formada de misturas de popula¸c˜oes com diferentes distribui¸c˜oes. De forma an´aloga, as leis estoc´asticas que regem a distribui¸c˜ao das medidas realizadas em um ´unico indiv´ıduo n˜ao precisam ser necessariamente iguais, implicando numa amostra com indiv´ıduos heterogˆeneos entre si. Essas id´eias dar˜ao origem aos modelos conhecidos como de efeitos aleat´orios ou de fragilidade (CARVALHO et al., 2005).

2.4 Censura

(25)

maneira geral, ocorre quando o tempo at´e o evento para alguns indiv´ıduos, n˜ao ´e observado (LAWLESS, 1982). A censura ocorre porque, de alguma maneira, o indiv´ıduo deixa de ser acompanhado ou porque ele morre de uma causa n˜ao relacionada com o estudo ou tratamento.

Outra forma de censura ocorre quando o estudo, ou experimento, deve ser encerrado e ainda existem itens funcionando, ou indiv´ıduos vivos, cujos tempos de sobre-vivˆencia, obviamente, ainda n˜ao foram observados.

A falta de informa¸c˜ao, ou censura, ocorre normalmente com rela¸c˜ao ao tempo final do acompanhamento de um indiv´ıduo, ou grupo de indiv´ıduos. Nessa situa¸c˜ao, nem todos os indiv´ıduos tˆem seus tempos de sobrevivˆencia observados. A perda de informa¸c˜ao tamb´em pode se dar no ´ıncio do estudo, quando n˜ao se conhece o tempo inicial de alguns dos indiv´ıduos. As causas de perda de informa¸c˜ao s˜ao v´arias, sendo algumas delas:

i) ´obitos por causa n˜ao relacionada ao estudo;

ii) t´ermino do estudo;

iii) perda de contato com o paciente;

iv) recusa em continuar participando do estudo e conseq¨uente abandono por parte do paciente;

v) abandono do estudo devido a efeitos colaterais do tratamento.

Em confiabilidade, dentre as causas mais comuns, destaca-se a falha por um motivo n˜ao relacionado com o experimento; mudan¸cas nos procedimentos por descuido ou acidente e, principalmente, devido ao encerramento do experimento, j´a que neste caso, o monitoramento ´e constante.

(26)

2.4.1 Tipos de censuras

A censura, conforme j´a foi visto, ocorre de diversas maneiras influenciando a constru¸c˜ao da fun¸c˜ao de verossimilhan¸ca. Nesta se¸c˜ao, ser˜ao apresentadas as principais formas de censura encontradas nos estudos de tempos de vida. Para se estudarem os tipos de censuras, no entanto, ´e necess´ario que se considere a forma como os dados s˜ao coletados e especialmente como o estudo (ou experimento) dever´a ser encerrado. A seguir, ser˜ao apresentados os trˆes tipos mais comuns de censuras.

i) Censura de tipo I: ´e mais comum em estudos m´edicos, em que os indiv´ıduos s˜ao

incorporados ao estudo no decorrer do per´ıodo de observa¸c˜ao, conforme v˜ao sendo recrutados. Tamb´em pode aparecer na ´area industrial quando a confiabilidade das unidades em teste ´e muito elevada, o que faz com que o tempo de observa¸c˜ao seja muito longo. Na censura de tipo I o estudo, ou experimento, ´e conduzido at´e um tempo limite L, pr´e-fixado, quando o n´umero de ocorrˆenciasr do evento ´e registrado. Como, na maioria dos estudos m´edicos, nem todos os pacientes entram em estudo ao mesmo tempo, cada indiv´ıduo tem o seu tempo de censuraLi,i= 1,2, ..., n(LAWLESS, 1982).

Dessa forma, os indiv´ıduos, cujas mortes forem observadas, ter˜ao seus tempos de vida registrados e, aqueles que ainda permacerem vivos, ter˜ao seus tempos censurados. Uma caracter´ıstica importante da censura de tipo I ´e que o n´umero de falhas, ou mortes, ´e aleat´orio.

ii) Censura de tipo II: ´e mais comum em confiabilidade, principalmente quando o custo

do experimento ´e muito elevado. Nesse esquema de censura, fixa-se o n´umero r de falhas e o experimento ´e conduzido com n unidades em teste,n > r, at´e que r dessas unidades tenham falhado. As nr unidades que ainda continuam em funcionamento ap´os a ocorrˆencia das r falhas, ter˜ao seus tempos de vida censurados em tr, em que

tr ´e o tempo de falha do r-´esimo item. Note que em censura de tipo II os tempos de

falhas s˜ao naturalmente ordenados, ou seja, T1 =T(1), T2 =T(2), ..., Tr =T(r).

iii) Censura aleat´oria: em alguns tipos de estudos na ´area m´edica, os pacientes podem ser

(27)

termina numa data pr´e-estabelecida, ent˜ao, os tempos de censuras daqueles pacientes que ainda permacem vivos, ou sem terem experimentado o evento de interesse, ser˜ao aleat´orios. Freq¨uentemente, nestes casos, consideram-se censuras de tipo I, assumindo dados condicionados nos tempos de censuras (LAWLESS, 1982).

Al´em dessa classifica¸c˜ao, podem-se diferenciar as censuras conforme o instante de ocorrˆencia. Normalmente, a censura ocorre no final do experimento, ou seja, numa posi¸c˜ao`a direita na escala do tempo. No entanto, pode acontecer de a censura ser observada antes do in´ıcio do estudo propriamente dito, ou `a esquerda e at´e mesmo dentro de um

intervalo de tempo.

a) Censura `a direita: ocorre quando o tempo de censura ´e menor do que o tempo real de

sobrevivˆencia, n˜ao observado. Setc´e o tempo de censura eT o tempo de sobrevivˆencia,

ent˜ao, na censura `a direita T > tc. Por exemplo, um indiv´ıduo em tratamento

de-vido a uma doen¸ca terminal, deixa de ser acompanhado, por´em sua ´ultima condi¸c˜ao registrada o considera como “vivo”.

b) Censura `a esquerda: ocorre quando n˜ao se conhece o momento exato da ocorrˆencia de

um evento, mas sabe-se que este aconteceu antes de um tempo determinado, ou seja,

T < tc. Em estudos sobre o tempo do primeiro contato com as drogas, muitas vezes

os jovens n˜ao tˆem a resposta exata, mas sabe-se que ´e anterior a uma determinada data.

c) Censura por intervalo, ou intervalar: ao se realizar um estudo, muitas vezes o

acom-panhamento dos indiv´ıduos somente pode ser realizado em visitas ou entrevistas a intervalos de tempos regulares (semanais, quinzenais, mensais, etc...), quando se veri-fica a ocorrˆencia, ou n˜ao, do evento de interesse. Durante um visita, ao se constatar que o evento ocorreu, pode-se afirmar apenas que o mesmo aconteceu durante o inter-valo de tempo transcorrido entre a visita anterior, tk−1 e a visita atual,tk,k = 1,2, ....

O tempo de sobrevivˆencia, portanto, dever´a pertencer ao intervalo (tk−1;tk), ou seja,

(tk−1 < T < tk).

(28)

comum. No esquema de tipo II, a censura `a direita ´e predominante. Na pr´oxima sess˜ao ser´a apresentada a constru¸c˜ao da fun¸c˜ao de verossimilhan¸ca considerando censuras de tipo I, `a direita. A constru¸c˜ao da verossimilhan¸ca para casos de censuras `a esquerda pode ser encontrada em Lawless (1982) e uma express˜ao geral para diversos tipos de censuras ´e apre-sentada por Klein e Moeschberger (1997). Na Figura 2, s˜ao apreapre-sentadas as representa¸c˜oes gr´aficas dos esquemas de tipo I e tipo II, com censuras `a direita.

Censura Tipo I

Tempo

Indivíduos

0 4 8 L

x

x x

x x

x

Censura Tipo II

Tempo

Indivíduos

0 6 12 18 24

x x

x x x t(1)

t(2)

t(3)

t(r−1)

t(r)

t(r)

t(r)

Figura 2 - Representa¸c˜ao gr´afica de censuras `a direita, de tipo I e tipo II

2.5 Modelos de sobrevivˆencia cont´ınuos

O tempo de sobrevivˆenciat de um indiv´ıduo pode ser considerado como uma observa¸c˜ao de uma vari´avel aleat´oriaT, n˜ao negativa e comfdp f(t), representando os tem-pos de vida de uma popula¸c˜ao. Esses dados de sobrevivˆencia podem ser resumidos atrav´es de duas fun¸c˜oes de central interesse em an´alise de sobrevivˆencia: afun¸c˜ao de sobrevivˆencia

e a fun¸c˜ao de risco, ou “hazard” (COLLETT, 2003).

(29)

Considere uma vari´avel aleat´oria T, n˜ao negativa, representando os tempos de vida dos indiv´ıduos de uma popula¸c˜ao. Normalmente, T ´e assumida como sendo uma vari´avel cont´ınua. Afun¸c˜ao de distribui¸c˜ao deT ´e definida como (BERGER E CASELLA, 2002)

F(t) =P (T t),

e a fun¸c˜ao densidade de probabilidade (fdp) de T ´e dada por

f(t) = ∂

∂tF(T).

A fdp pode ainda ser representada em termos da probabilidade de ocorrˆencia de um evento num intervalo infinitesimal de tamanhodt. Em Lee (1980), tem-se que

f(t) = lim

dt→0

P(T t+dt)P (T t)

dt . (1)

Note que a defini¸c˜ao (1) ´e, de fato, a defini¸c˜ao da derivada de F(t).

A fun¸c˜ao de sobrevivˆencia, S(t), ´e definida como a probabilidade de que o tempo de vida T seja maior do que, ou igual, a um determinado valor t,

S(t) = P(T t) =

Z ∞

t

f(u)du

ou ainda,

S(t) = 1F(t).

A fun¸c˜ao de sobrevivˆencia ´e uma medida da probabilidade de que um indiv´ıduo sobreviva, do instante inicial, a al´em do instantet (COLLETT, 2003).

A fun¸c˜ao de risco ´e definida como sendo a probabilidade de ocorrˆencia do evento de interersse num intervalo [t, t+dt), condicionada `a sobrevivˆencia no instante t, dividida pelo tamanho do intervalo, ou seja,

h(t) = lim

dt→0

P (tT t+dt|T t)

dt . (2)

A fun¸c˜ao de risco especifica a taxa instantˆanea de morte, ou falha, no instante

(30)

(COLLETT, 2003). Al´em disso, ´e importante observar que, apesar de se utilizar o termo risco, h(t) ´e uma taxa, e n˜ao uma probabilidade. Sua unidade ´e tempo−1 e pode assumir

qualquer valor real positivo, n˜ao estando restrita ao intervalo [0,1].

Da defini¸c˜ao de probabilidade condicional pode-se obter a seguinte rela¸c˜ao:

h(t) = lim

dt→0

P (t T t+dt)

dt P(T t)

= 1

P(T t) dtlim→0

P (t T t+dt)

dt =

f(t)

S(t). (3)

Como ∂S(t)/∂t=f(t), pode-se ainda escrever

h(t) =

∂tlog[S(t)].

Integrando-se ambos os lados em rela¸c˜ao at, obt´em-se a fun¸c˜ao de risco

acu-mulado, definida como

H(t) =log[S(t)],

de onde se pode escrever

S(t) = exp{−H(t)}. (4)

Uma forma alternativa de (4), bastante comum, ´e dada por

S(t) = exp

½

Z t 0

h(u)du

¾

. (5)

Das equa¸c˜oes (3) e (5), pode-se obter uma express˜ao bastante ´util para repre-sentar a fun¸c˜ao de densidade da vari´avel aleat´oriaT,

f(t) = h(t) exp

½

Z t 0

h(u)du

¾

. (6)

Como exemplo, considere uma vari´avel aleat´oria T, representando o tempo de vida de indiv´ıduos sujeitos a um certo tipo de tratamento. Suponha que T tenha uma distribui¸c˜ao de probabilidade de Weibull com fdp

f(t) = λ δ tδ−1 exp©

−λ tδª

(31)

Ent˜ao, a fun¸c˜ao de risco para o modelo Weibull ´e dada por

h(t) = λ δ tδ−1. (8)

A distribui¸c˜ao de Weibull ´e, talvez, a mais utilizada para dados de tempos de vida (LAWLESS, 1982), pois os seus dois parˆametrosλeδlhe d˜ao uma grande flexibilidade, uma vez que permitem modelar diferentes tipos de taxas de falhas. Na Figura 3 s˜ao apre-sentadas fun¸c˜oes densidades Weibull, com suas respectivas fun¸c˜oes de risco, para diferentes valores deδ.

0.0 0.5 1.0 1.5 2.0 2.5

0.0

0.5

1.0

1.5

tempo

f

(

t

)

δ = 2.0 δ = 1.0 δ = 0.8

0.0 0.5 1.0 1.5 2.0

0.0

0.5

1.0

1.5

2.0

tempo

h

(

t

)

δ = 2.0

δ = 1.0

δ = 0.8

Figura 3 - A esquerda, fun¸c˜oes de densidade Weibull para δ = 0,8; 1,0 e 2,0 e a direita,

respectivas fun¸c˜oes de risco

Como caso especial, quando δ = 1, tem-se a distribui¸c˜ao exponencial que historicamente foi o primeiro modelo aplicado em estudos de tempos de vida (FOGO, 1994). A distribui¸c˜ao exponencial ´e conhecida pela sua propriedade de falta de mem´oria, que pode ser representada pela sua taxa de risco constante. De fato, para δ = 1, de (8) tem-se

h(t) =λ.

2.5.1 Algumas considera¸c˜oes sobre a fun¸c˜ao de risco

(32)

propor¸c˜ao esperada de indiv´ıduos, com idade t, que poder˜ao falhar num pequeno intervalo de tempo [t;t+dt).

A fun¸c˜ao de risco h(t) ´e bastante ´util para se determinar a distribui¸c˜ao dos tempos de sobrevivˆenvia e para descrever a maneira com que a chance de ocorrˆencia de uma falha, ou morte, muda com o tempo (KLEIN E MOSCHBERGER, 1997). Diferentes tipos de fun¸c˜oes de risco s˜ao observadas dependendo do formato do gr´afico deh(t). Por exemplo, a taxa de ocorrˆencia de um evento pode ser crescente, decrescente, constante, em forma de banheira (“bathtub-shaped”), em forma de “corcova” (“humpshaped”) ou possuindo alguma caracter´ıstica que descreve o mecanismo de falhas. A Figura 4 apresenta diferentes tipos de fun¸c˜oes de risco.

Modelos com fun¸c˜ao de risco crescente, apresentado pela fun¸c˜ao h2(t) na

Fi-gura 4, surgem naturalmente em consequˆencia do envelhecimento ou desgate de material. ´E tamb´em uma forma bastante comum no final da vida das pessoas ou da vida ´util de pe¸cas ou equipamentos. Pode ser observada em pacientes em fase terminal e que n˜ao respondem mais ao tratamento. Taxas de risco decrescentes, h3(t), s˜ao menos comuns, mas podem ser

encontradas quando h´a uma chance grande de falha nos per´ıodos iniciais de vida, como em certos tipos de dispositivos eletrˆonicos. Tamb´em podem ser observadas em pacientes que se recuperam de cirurgias simples ou em bebˆes nos primeiros anos de vida. A fun¸c˜ao de risco em forma de banheira, h1(t), ´e historicamente utilizada em demografia para representar a

taxa de mortalidade de popula¸c˜oes com uma taxa inicial elevada, que cai at´e um determi-nado patamar, onde permanece constante por um longo per´ıodo de tempo, vindo a crescer drasticamente no final da vida. Pode tamb´em representar a taxa de falhas de m´aquinas que passam por um per´ıodo inicial de ajuste, mas que permanecem com taxas constantes durante todo o per´ıodo de vida ´util, vindo a crescer rapidamente no per´ıodo final do tempo de vida. A fun¸c˜ao de risco h4(t), em forma de “corcova”, pode ser observada em pacientes

(33)

cu-mum. Esse mecanismo de falha ´e encontrado durante per´ıodos isolados do tempo de vida de indiv´ıduos ou equipamentos, tal como apresentado pela fun¸c˜aoh1(t). Por exemplo, pode

ser usada para representar o risco de morte em indiv´ıduos entre 18 e 25 anos, quando a principal causa de morte ´e por acidente.

0 1 2 3 4 5 6

0.0

0.5

1.0

1.5

2.0

tempo

h

(

t

)

h1(t) h2(t) h3(t) h4(t) h5(t)

Figura 4 - Tipos diferentes de fun¸c˜oes de risco

2.5.2 A fun¸c˜ao de verossimilhan¸ca

Suponha o conjuntoD com os dados den indiv´ıduos. Considere que o tempo de vida doi-´esimo indiv´ıduo seja representado pela var´avel aleat´oria Xi e que, associado ao

i-´esimo indiv´ıduo existe um tempo de censura fixoLi.

(34)

indiv´ıduo tem um tempo de censura Li, tal que o tempo de vida do i-´esimo indiv´ıduo ´e

observado apenas quandoXi ≤Li, i= 1,2, ..., n. Os dados de sobrevivˆenvia do indiv´ıduo i

ser˜ao representados por pares do tipo (Ti, ci),i= 1,2, . . . , n, sendo que

Ti =min(Xi, Li) e ci =

1, seXi ≤Li,

0, seXi > Li.

Os tempos de sobrevivˆenviaT1, T2, ..., Tn ser˜ao assumidos iid, comfdp f(t|θ),

em queθ´e o vetor de paramˆetros. Se ci = 1, ent˜ao, Ti representa o tempo de sobrevivˆencia

do indiv´ıduo ie se ci = 0, Ti, representa o seu tempo de censura e, como

P (Ti, ci = 1) =P (Ti|ci = 1)P (ci = 1) =f(ti|θ)

e

P(Ti =Li, ci = 0) =P(ci = 0) =S(ti|θ),

ent˜ao, afdp conjunta deTi e ci ´e dada por

f(ti, ci|θ) = [f(ti|θ)]ci[S(ti|θ)]1−ci.

Dessa forma, a fun¸c˜ao de verossimilhan¸ca para dados sujeitos a censuras do tipo I, `a direita, ´e obtida de

L(θ| D) =

n

Y

i=1

f(ti, ci|θ)

=

n

Y

i=1

[f(ti|θ)]ci[S(ti|θ)]1−ci.

Utilizando as rela¸c˜oes (5) e (6), obt´em-se uma representa¸c˜ao da fun¸c˜ao de verossimilhan¸ca expressa unicamente em termos da fun¸c˜ao de risco, ou seja,

L(θ| D) =

( n

Y

i=1

[h(ti|θ)]ci

)

exp

½

Z ti 0

h(u|θ)du

¾

. (9)

Para popula¸c˜oes heterogˆeneas, o conjunto D ´e formado por

(35)

sendo que ti ´e o valor observado do tempo de sobrevivˆencia, ci ´e a fun¸c˜ao indicadora de

censura e zi ´e o vetor de covari´aveis observadas para o indiv´ıduo i. A fun¸c˜ao de risco

´e dependente do vetor de parˆametros θ, acrescido dos parˆametros referentes ao vetor de covari´aveisz, e a fun¸c˜ao de verossimilhan¸ca, dada em (9), passa a ser expressa por

L(θ| D) =

( n

Y

i=1

[h(ti|zi,θ)]ci

)

exp

½

Z ti 0

h(u|zi,θ)du

¾

. (10)

2.6 Modelos discretos

Apesar de n˜ao ser o enfoque deste texto, a modelagem discreta para tempos de vida ser´a rapidamente apresentada nesta se¸c˜ao.

Algumas vezes a vari´avelT pode indicar o “tempo de vida” de uma m´aquina pelo n´umero de ciclos ou pelo n´umero de realiza¸c˜oes de alguma tarefa, como exemplo, para m´aquinas fotocopiadoras considera-se o n´umero de c´opias realizadas. Nestas situa¸c˜oes, ´e mais conveniente tratarT como uma vari´avel aleat´oria discreta, assumindo valores 01<

2< . . . com probabilidade

p(ti) =P (T =ti), i= 1,2, . . . ,

e fun¸c˜ao de sobrevivˆencia

S(ti) = P(T > ti) =

X

i:ti>t

p(ti).

Da mesma forma como no caso cont´ınuo, para o caso discreto S(t) tamb´em ´e mon´otona, decrescente, cont´ınua `a esquerda, comS(0) = 1 e S() = limt→∞S(t) = 1.

A fun¸c˜ao de risco ´e definida por

h(ti) = P (T =ti|T ≥ti) =

p(ti)

S(ti−1)

, i= 1,2, . . . . (11)

Como p(ti) =S(ti−1)−S(ti), ent˜ao, pode-se reescrever (11) como

h(ti) = 1−

S(ti)

S(ti−1)

, i= 1,2, . . . , (12)

e, como a fun¸c˜ao de sobrevivˆencia pode ser escrita como o produto de probabilidades con-dicionais, ou seja,

S(t) = Y

i:ti≤t

S(ti)

S(ti−1)

(36)

ent˜ao, de (12) e (13) a fun¸c˜ao de sobrevivˆencia est´a relacionada com a fun¸c˜ao de risco atrav´es da express˜ao

S(t) = Y

i:ti≤t

[1h(ti)].

A fun¸c˜ao de risco acumulado pode ser definida como

H(t) = X

i:ti≤t

h(ti),

por´em, neste caso a rela¸c˜ao H(t) =log [S(t)] n˜ao ´e valida.

Cox e Oakes (1984) sugerem definir a fun¸c˜ao de risco acumulado por

H(t) = X

i:ti≤t

[1h(ti)],

pois essa forma preserva a rela¸c˜aoS(t) = exp{−H(t)}. Para valores pequenos de h(ti), os

resultados das duas express˜oes s˜ao muito pr´oximos.

SeT ´e uma vari´avel aleat´oria positiva com fun¸c˜ao de risco h(t) definida pela soma de uma fun¸c˜ao cont´ınua hc(t) e uma fun¸c˜ao discreta hd(t), com massa nos tempos

0t1 ≤t2 ≤. . ., ent˜ao a fun¸c˜ao de sobrevivˆencia est´a relacionada com a taxa de falhas pelo

produto integral1 de [1h(t)]dt, definido como se segue (KLEIN E MOESCHBERGER,

1997):

S(t) = Y

i:ti≤t

[1hd(ti)] exp

½Z t

0

hc(u)du

¾

.

2.7 Modelos de regress˜ao

Os resultados apresentados na se¸c˜ao anterior referem-se a modelos univariados, com uma ´unica distribui¸c˜ao de probabilidade para os tempos de vida. Na pr´atica, no entanto, muitas aplica¸c˜oes envolvem a presen¸ca de um vetor z de vari´aveis concomitantes, ou covari´aveis. Uma quest˜ao de especial relevˆancia consiste em investigar a influˆencia destas covari´aveis nos tempos de vida dos componentes, ou pacientes, o que usualmente ´e feito por meio de modelos de regress˜ao.

1

(37)

Em estudos com pacientes com cˆancer de pulm˜ao, por exemplo, normalmente deseja-se medir a influˆencia no tempo de vida dos pacientes de vari´aveis tais como sexo, est´agio da doen¸ca ao ser diagnosticada, n´umero de cigarros fumados por dia, outros casos na fam´ılia, etc. Em estudos na ´area industrial, pode-se querer medir a influˆencia da varia¸c˜ao de voltagem, temperatura e umidade do ambiente, material utilizado, procedˆencia da mat´eria prima, dentre outras. Uma situa¸c˜ao bastante comum na ´area industrial e que se utiliza de modelos de regress˜ao ocorre no estudo de testes acelerados (NELSON, 1970).

A influˆencia das covari´aveis no tempo de vida de popula¸c˜oes heterogˆeneas pode ser representada por meio da modelagem da fun¸c˜ao de risco h(t). A literatura es-tat´ıstica apresenta uma ampla bilbiografia sobre os modelos de regress˜ao. Em Collet (2003) e Carvalho et al. (2005), tem-se uma ˆenfase em modelos semiparam´etricos, especialmente o modelo de riscos proporcionais de Cox. Modelos param´etricos s˜ao especialmente apresen-tados em Lawless (1982) e Klein e Moeschberger (1997). Os modelos de regress˜ao podem, ainda, ser expressos atrav´es da teoria de processos de contagem, por meio do modelo de Aalen (1978), conforme apresentado em Gill (1984).

Considere um conjunto de dados de tempos de vida D com n unidades in-dependentes e p covari´aveis. Se T ´e uma vari´avel aleat´oria que representa o tempo de ocorrˆencia de um evento, o modelo de regress˜ao estabelece que a fun¸c˜ao de risco de um componente, ou indiv´ıduo, no tempot, dado o vetor de covari´aveisz´e

h(ti|zi) =h0(ti)g(zi|β), (14)

sendo que zi ´e o vetor de covari´aveis do componentei, β ´e o vetor de parˆametros a serem

estimados eg(·) uma fun¸c˜ao positiva das covari´aveis. A fun¸c˜aoh0(t) ´e conhecida porfun¸c˜ao

de risco de base, sendo a fun¸c˜ao de risco de um componente para o qual g(z) = 1. A

fun¸c˜aog(zi) pode ser interpretada como um risco relativo de um componente com vetor de

covari´aveiszi, em rela¸c˜ao a um componente para o qual z=0 (COLLETT, 2003).

A fun¸c˜aoh0(t), assim como a fun¸c˜aog(z) pode envolver parˆametros

desconhe-cidos. Quando h0(t) ´e indexada por um, ou mais parˆametros, os modelos s˜ao considerados

param´etricos. Al´em disso, na regress˜ao param´etrica, ´e necess´ario que uma distribui¸c˜ao de

(38)

Uma propriedade importante do modelo (14) ´e que a raz˜ao entre os riscos de dois componentes n˜ao depende do tempo, ou seja, os riscos s˜aoproporcionais. Por exemplo, a raz˜ao de riscos de dois componentes com covari´aveiszi e zj ´e dada por

h(ti|zi)

h(tj|zj)

= g(zi|β)

g(zj|β)

.

Devido a essa propriedade, o modelo (14) ´e conhecido como modelo de riscos

proporcionais.

Para a especifica¸c˜ao do modelo (14), a fun¸c˜ao g(z) deve ser n˜ao negativa e, assim, uma escolha apropriada consiste em fazer g(z) = exp{β′z}. Dessa forma, a fun¸c˜ao de risco para o componentei, pode ser reescrita por

h(ti|zi) =h0(ti) exp{β′zi}. (15)

Das rela¸c˜oes (5) e (14) tem-se que

S(t|z) = exp

½

Z t 0

h0(u)g(z|β)du ¾

,

em que se segue que a fun¸c˜ao de sobrevivˆencia de T, dadas as covari´aveis z ´e

S(t|z) = [S0(t)]g(

z|β)

, (16)

sendo que S0(t|z) = exp n

−Rt

0 h0(u)du

o

´e a fun¸c˜ao de sobrevivˆencia de base de um com-ponente para o qualg(z|β) = 1.

De (16), verifica-se uma ordena¸c˜ao na fam´ılia de riscos proporcionais, pois para dois componentes (ou indiv´ıduos) com vetores de covari´aveisz1 ez2, tem-se que, para

todot >0, S(t|z1)≥S(t|z2), ou vice-versa (LAWLESS, 1982).

Nos modelos de riscos proporcionais, as vari´aveis concomitantes tˆem um efeito multiplicativo sobre a fun¸c˜ao de risco, o que, na maioria das vezes parece bastante razo´avel. Em algumas situa¸c˜oes, entretanto, o efeito das covari´aveis ´e expresso aditivamente na fun¸c˜ao de risco, como por exemplo

h(ti|zi) = h0(ti) +g(zi|β), (17)

(39)

Os modelos aditivos n˜ao s˜ao muito comuns, pois a estima¸c˜ao dos parˆametros do modelo ´e, de certa forma, complicada. Geralmente, a estima¸c˜ao ´e feita atrav´es de m´etodos n˜ao param´etricos, baseados em processos de contagem (TOMAZELLA, 2003). O modelo aditivo mais conhecido ´e o modelo de Aalen (1980). Uma vers˜ao param´etrica dos modelos de regress˜ao aditivos foi apresentada por Andersen et al. (1993).

2.7.1 Modelos de regress˜ao param´etricos

Os modelos de regress˜ao param´etricos ocorrem quando os tempos de sobre-vivˆencia s˜ao assumidos como tendo uma distribui¸c˜ao de probabilidade, indexada por um, ou mais, parˆametros. Como resultado direto dessa suposi¸c˜ao, as estat´ısticas e inferˆencias para o modelo considerado ser˜ao mais precisas.

Dentre os modelos param´etricos mais explorados na literatura podem-se des-tacar os modelos exponencial, de Weibull, gama e lognormal. A seguir, ser˜ao descritos os modelos exponencial e de Weibull, que pertencem `a classe dos modelos de riscos proporcio-nais.

2.7.1.1 Modelo exponencial

SejaT uma vari´avel aleat´oria representando o tempo de vida de componentes, ou indiv´ıduos, num estudo de sobrevivˆencia e seja z um vetor de covari´aveis associadas a esses componentes. O modelo exponencial dever´a ser utilizado quando se assume que o risco ´e constante ao longo do tempo. No modelo exponencial, a fdp deT ´e da forma

f(t|λ) = λ(z)e−λt, t0 e λ >0.

O parˆametroλdepende das covari´aveis atrav´es da rela¸c˜aoλ =g(z|β) e como o risco no modelo exponencial ´e constante e igual aλ, ent˜aoh(t|z) =g(z|β). Considerando a rela¸c˜ao em (15), o modelo de regress˜ao exponencial ´e definido por

h(t|z) = exp{β′z}= exp{β0+β1z1+. . .+βpzp}, (18)

sendo que β′ = (β0, β1, . . . , βp) ´e o vetor de parˆametros do modelo de regress˜ao e o vetor

de covari´aveis ´e do tipo z′ = (1, z

1, . . . , zp). Inferˆencias para os parˆametros do modelo s˜ao

(40)

Apesar de sua simplicidade, o modelo exponencial tem sido largamente utili-zado, especialmente na ´area industrial.

2.7.1.2 Modelo de Weibull

O modelo de Weibull ´e o modelo de regress˜ao mais utilizado pela sua versa-tilidade em acomodar diversas situa¸c˜oes pr´aticas. A distribui¸c˜ao de Weibull, dada em (7), apresenta um parˆametro de escala λ e um parˆametro de forma δ, sendo que o modelo de regress˜ao mais comum considera apenas o parˆametro λ dependente das covari´aveis. Desta forma, a fun¸c˜ao de risco para o modelo de Weibull ´e definida por

h(t|z) =λ δ tδ−1 =δ tδ−1g(z|β), (19)

em que λ=g(z|β) e h0(t) = δtδ−1.

Considerando g(z|β) = exp{β′z}, a fun¸c˜ao de risco pode ser escrita por

h(t|z) =δ tδ−1 exp{β′z}. (20)

e, considerando os vetores β e zcomo em (18), tem-se

h(t|z) =δ tδ−1 exp{β0+β1z1+. . .+βpzp}.

Pelo resultado (20), a raz˜ao dos riscos de dois componentes com vetores de covari´aveisz1 e z2 ´e

h(t1|z1)

h(t2|z2)

= exp{β

z

1}

exp{β′z2}

= exp{β′(z1−z2)},

que n˜ao depende de t, o que caracteriza o modelo de Weibull como um modelo de riscos proporcionais.

Observe que as covari´aveis tˆem um efeito multiplicativo no risco em (20), o que ´e uma caracter´ıstica dos modelos de riscos proporcionais. Contudo, quando se considera o logaritmo dos tempos de vida, ou seja, tomando Y = log(T), a distribui¸c˜ao de Y dado z

´e da forma

f(y|z) = 1

σ exp

½

yµ(z)

σ −exp

·

yµ(z)

σ

¸¾

, −∞< y < , (21)

(41)

Com a fun¸c˜ao assumida para g(z) em (15),µ(z) = σβ′z. Assim, de (21), Y

pode ser representado na forma de um modelo log linear com

Y =µ(z) +σW =z′β∗+σW, (22)

sendo que β∗ = σβ e W ´e uma vari´avel de erro com distribui¸c˜ao valor extremo padr˜ao (JOHNSON et al., 1995).

O modelo (22) ´e um modelo do tipoloca¸c˜ao-escala com erroW, muito comum quando se utiliza o logaritmo do tempo de vida.

Estimativas e inferˆencias para o modelo de Weibull, bem como para o modelo loca¸c˜ao-escala (22), podem ser obtidas por meio da fun¸c˜ao de verossimilhan¸ca (10). Outros modelos de regress˜ao param´etricos podem ser encontrados em Lawless (1982) e Klein e Moeschberger (1997), que apresentam os m´etodos de estima¸c˜ao para dados completos e censurados.

2.7.2 Modelos de regress˜ao semiparam´etricos

Na se¸c˜ao anterior foram apresentados alguns modelos de regress˜ao pa-ram´etricos para dados de sobrevivˆencia. Os modelos papa-ram´etricos sup˜oem uma fun¸c˜ao de distribui¸c˜ao de probabilidades para o tempo de vidaT, por´em, algumas vezes, essa su-posi¸c˜ao pode n˜ao ser adequada. Al´em disso, em muitas aplica¸c˜oes pr´aticas, pode-se ter o interesse de estimar os efeitos das covari´aveis sobre o tempo de vida das unidades em teste ou sobre o tempo de vida de pacientes em estudo.

Sob esse enfoque, Cox (1972a) propˆos o modelo semiparam´etrico de riscos

proporcionais, que passou a ser conhecido como modelo de riscos proporcionais de Cox

ou, simplesmente, modelo de Cox. O modelo de Cox, devido a sua praticidade, alcan¸cou rapidamente um enorme sucesso entre os estat´ısticos, sendo o modelo mais utilizado na an´alise de dados de sobrevida na ´area m´edica.

2.7.2.1 Modelo de regress˜ao de Cox

(42)

princ´ıpio da proporcionalidade, podem-se estimar esses efeitos sem que seja necess´ario fazer qualquer suposi¸c˜ao a respeito dos tempos de vida. Foi pensando nisso que Cox (1972a) criou o modelo de riscos proporcionais.

Sejah0(t) uma fun¸c˜ao de risco de base arbrit´aria eβ′ = (β0, . . . , βp) um vetor

de parˆametros. O modelo proposto por Cox ´e da forma

h(ti|zi) =h0(ti) exp{β′zi}, (23)

que tem a mesma forma do modelo apresentado em (15), por´em, o modelo de Cox ´e dito semiparam´etrico pois n˜ao assume nenhuma distribui¸c˜ao estat´ıstica parah0(t).

De fato, os modelos semiparam´etricos s˜ao assim chamados pois assumem uma forma param´etrica apenas para os efeitos das covari´aveis, representados pela fun¸c˜aog(z|β). A fun¸c˜ao de risco de base, neste caso, ´e tratada de uma forma n˜ao param´etrica.

O modelo de Cox comporta muito bem dados com censuras al´em de incor-porar naturalmente covari´aveis com dependˆencia no tempo. Adapta-se muito bem ao tipo de dado obtido em ensaios de tempos de vida, pois combina elegantemente as abordagens param´etricas e n˜ao param´etricas da inferˆencia estat´ıstica (GILL, 1984). Por tudo isso, o modelo de riscos proporcionais proposto por Cox (1972a) se tornou muito popular, sendo exaustivamente explorado em aplica¸c˜oes de dados de tempos de vida. Por ter sido muito estudado, um grande n´umero de contribui¸c˜oes tˆem sido verificadas desde a sua publica¸c˜ao (LAWLESS, 1982). Hoje em dia, pode-se encontrar uma completa e ampla literatura so-bre o modelo de Cox, com destaques para Cox e Oakes (1984); Lawless (1982); Klein e Moeschberger (1997); Collett (2003), dentre outros.

Para a estimativa do vetor β, Cox introduziu o conceito da verossimilhan¸ca

parcial. Na verossimilhan¸ca parcial, considera-se apenas a informa¸c˜ao das unidades sob risco

no tempo t por meio do vetor de covari´aveis z, pois a fun¸c˜ao de risco de base ´e eliminada devido `a propriedade de proporcionalidade. Essa formula¸c˜ao ´e semelhante aos modelos n˜ao param´etricos, mas, neste caso, permite que os efeitos sejam estimados atrav´es da fun¸c˜ao de verossimilhan¸ca.

(43)

em que r ´e o n´umero de falhas observadas. A verossimilhan¸ca parcial, baseada no modelo de riscos proporcionais (23), ´e expressa por

L(β|D) =

r

Y

i=1

exp©

β′z(i) ª

P

j∈R(t(i))exp{β

z

j}, (24)

sendo que R(t(i)) ´e o conjunto de unidades em risco no instante t(i), ou seja, ´e o conjunto

de unidades em opera¸c˜ao e n˜ao censuradas no instante imediatamente anterior at(i).

Considerando os dados na forma (Ti, ci,zi), a verossimilhan¸ca parcial dada em

(24) pode ser escrita na forma

L(β|D) =

n

Y

i=1 "

exp{β′zi}

P

j∈R(ti)exp{β

z

j}

#ci

, (25)

em que R(ti) ´e o conjunto em risco no instante ti.

As estimativas de m´axima verossimilhan¸ca dos parˆametros β’s s˜ao obtidas maximizando-se o logaritmo de (25) por meio de m´etodos num´ericos. Essa maximiza¸c˜ao, geralmente, ´e alcan¸cada utilizando-se o m´etodo de Newton-Raphson.

Muitos autores buscaram demonstrar as propriedades assint´oticas dos estima-dores do modelo, confirmando as conjecturas de Cox, mas em todos os casos os resultados foram restritos a situa¸c˜oes especiais. Uma nova abordagem, no entanto, foi introduzida por Aalen (1978), apresentando o modelo Cox sob o enfoque de processos de contagem, em que a fun¸c˜ao de risco pode ser descrita em termos da intensidade de um processo de contagem multivariado e que permitiu demonstrar as propriedades assint´oticas do modelo de forma natural (GILL, 1984).

As aplica¸c˜oes do modelo de Cox tˆem considerado, exclusivamente, a suposi¸c˜ao de riscos proporcionais, em que as covari´aveis tˆem um efeito multiplicativo sobre o tempo de vida dos indiv´ıduos ou unidades. Isso tem atendido satisfatoriamente a maioria dos casos abordados, por´em, podem ocorrer situa¸c˜oes nas quais a suposi¸c˜ao de proporcionalidade n˜ao seja v´alida. Nestes casos, outros modelos semiparam´etricos poder˜ao ser considerados, tal como o modelo aditivo de Aalen (1980).

(44)

Tomazella (2003) obteve estimativas cl´assicas e Bayesianas utilizando-se de t´ecnicas com-putacionais como “bootstrap” e MCMC.

2.8 Processos de contagem

Uma forma alternativa na abordagem de dados de sobrevivˆencia, atrav´es da teoria de processos de contagem, foi desenvolvida por Aalen (1978). Em seu trabalho, Aalen (1978) combinou elementos de integra¸c˜ao estoc´astica, teoria de martingale para tempos cont´ınuos e teoria de processos de contagem numa metodologia que permite facilmente o desenvolvimento de t´ecnicas de inferˆencia para dados de sobrevivˆencia na presen¸ca de censuras. A grande vantagem dessa formula¸c˜ao ´e que permite acomodar com facilidade tanto dados com censuras, quanto situa¸c˜oes mais complexas, tais como, covari´aveis dependentes no tempo, eventos recorrentes e eventos m´ultiplos. Uma descri¸c˜ao mais detalhada dessa teoria, pode ser encontrada em Andersen et al. (1993) e Fleming e Harmington (1991).

2.8.1 No¸c˜oes b´asicas de processos de contagem

Um processo de contagem{N(t), t0}´e o n´umero de eventos de um processo pontual em [0, t], ou seja, N(t) ´e um processo estoc´astico que assume os valores 0,1,2, . . .

registrando um salto do valor i1 ao valor i, quando o evento de interesse ocorre pela

i-´esima vez,i= 0,1,2, . . . . N(t) ´e igual a zero at´e que se registre a primeira ocorrˆencia do evento, quando ent˜ao, salta para o valor 1. O processo cont´ınua at´e uma nova ocorrˆencia do evento, quando ´e registrado um novo salto para o valor 2, e assim, v˜ao se registrando saltos sucessivos, de tamanho 1, at´e o encerramento das observa¸c˜oes, Figura 5.

Um processo de contagem {N(t), t 0}, ´e um processo estoc´astico com as seguintes propriedades

i) N(0) = 0;

ii) N(t)<;

iii) N(t) ´e cont´ınuo `a direita;

(45)

0.0 0.2 0.4 0.6 0.8 1.0

0

5

10

15

20

tempo

N

(

t

)

Figura 5 - Representa¸c˜ao gr´afica de um processo de contagem

N(t) ´e, portanto, uma vari´avel aleat´oria que representa o n´umero de falhas no intervalo [0, t]. Para um intervalo qualquer (a, b] o n´umero de falhas ´e definido por

N(a, b] =N(b)N(a),

Um processo{N(t), t0}´e dito terincrementos independentes se o n´umero de falhas em intervalos disjuntos s˜ao independentes, ou seja, se para todo 0 t1 < t2 <

. . . < tk, as vari´aveis alat´oriasN(t1)−N(t0), . . . , N(tk)−N(tk−1) s˜ao independentes.

Imagem

Figura 3 - A esquerda, fun¸c˜oes de densidade Weibull para δ = 0, 8; 1, 0 e 2, 0 e a direita, respectivas fun¸c˜oes de risco
Figura 5 - Representa¸c˜ao gr´afica de um processo de contagem
Tabela 15 - Resultados das simula¸c˜oes para ˆ δ, com δ = 2, 0 e propor¸c˜ao de censuras p = 0, 20
Tabela 16 - Resultados das simula¸c˜oes para ˆ δ, com δ = 2, 0 e propor¸c˜ao de censuras p = 0, 05 m n d ¯ 1 d ¯ 2 x¯ δ ˆ s 2ˆ δ L U C 3 2,8 2,9 3,39581 5,305298000 0,060 0,011 0,930* 7 6,6 6,7 2,36000 0,375154300 0,052 0,012 0,937 2 15 14,2 14,3 2,15295 0
+7

Referências

Documentos relacionados

Para disciplinar o processo de desenvolvimento, a Engenharia de Usabilidade, também conceituada e descrita neste capítulo, descreve os métodos estruturados, a

forficata recém-colhidas foram tratadas com escarificação mecânica, imersão em ácido sulfúrico concentrado durante 5 e 10 minutos, sementes armazenadas na geladeira (3 ± 1

Discussion The present results show that, like other conditions that change brain excitability, early environmental heat exposure also enhanced CSD propagation in adult rats.. The

Pode haver alguns acordos prévios, como visto na classificação proposta em trabalho anterior (GUERRERO, 2006), mas estes são propostos sempre mantendo elevado

[Informar a data, o nome e a assinatura do dirigente máximo que aprovou o documento Termo de Abertura do Projeto antes deste projeto ser solicitado ao Governador pelo

Local de realização da avaliação: Centro de Aperfeiçoamento dos Profissionais da Educação - EAPE , endereço : SGAS 907 - Brasília/DF. Estamos à disposição

O segundo Beneficiário será designado pelo Segurado na Proposta de Adesão, podendo ser substituído a qualquer tempo, mediante solicitação formal assinada pelo próprio Segurado, para

Analysis of relief and toponymy of the landscape based on the interpretation of the military topographic survey: Altimetry, Hypsometry, Hydrography, Slopes, Solar orientation,