Aplica¸cão: análise de dados da área financeira

O conjunto de dados a ser analisado representa 65535 cadastros de clientes de uma determinada institui¸cão financeira brasileira. O interesse é estudar o tempo até que estes deixem a institui¸cão, isto é, deixar de ter relacionamento com a empresa. Neste estudo, quando o indiv´ıduo deixa a entidade, o seu tempo é dito observado, já no caso em que o cliente é ainda ativo, o seu tempo é dito censurado. Para esses indiv´ıduos, além do tempo e do indicador de censura, foram registrados: o sexo, a idade, o estado civil e o n´ıvel de escolaridade.

Para os dados disponibilizados, têm-se a presen¸ca de 41787 censuras que representam 63,76% dos clientes, ou seja, há evidência de que uma propor¸cão de indiv´ıduos são imunes ao evento de interesse, que neste caso, é interromper o relacionamento com a institui¸cão. Além disso, como pode ser visto na Figura 4, a sobrevivência estimada pelo método de Kaplan-Meier se mantem a um n´ıvel aproximadamente constante e estritamente maior do que zero, durante um per´ıodo de tempo razoável (tempo máximo observado no estudo foi de 2770 dias e o m´ınimo foi de 14 dias). No apêndice C, são apresentados todos os gráficos

para as covariáveis e estes também apontam fortes evidências de que existe uma propor¸cão de indiv´ıduos não suscept´ıveis ao evento de interesse.

0,00 0,25 0,50 0,75 1,00 0 1000 2000

Tempo (em dias)

(

)

Figura 4 – Gráfico da fun¸cão de sobrevivência estimada usando o método Kaplan-Meier para os tempos até que o cliente abandone a institui¸cão financeira.

Para análise desses dados, optou-se por ajustar o modelo de regressão de tempo de promo¸cão log-F generalizado, pois existem evidências que este é o modelo que melhor descreve o mecanismo gerador dos tempos (ver Apêndice C). Partindo desse modelo, foi associado covariáveis tanto no termo de fra¸cão de cura quanto no termo relacionado com os tempos dos clientes não curados. Neste caso, de forma simplificada é assumido que o parâmetro de posi¸cão fica em fun¸cão de um preditor linear, da seguinte forma:

µi = β0+ β1xi1+ β2xi2+ β3xi3+ β4xi4

e o parâmetro associado a distribui¸cão do número de causas, que foi assumida como Poisson (modelo de tempo de promo¸cão), fica expresso da seguinte maneira:

log (θi) = γ0+ γ1zi1+ γ2zi2+ γ3zi3+ γ4zi4,

com i = 1, . . . , 65535 e xi1 = zi1(sexo do cliente i), xi2 = zi2 (estado civil do cliente i),

xi3 = zi4 (faixa de idade do cliente i) e xi1 = zi1 (n´ıvel de escolaridade do cliente i).

Nesta aplica¸cão, o principal objetivo de interesse é saber quais são perfis dos clientes que são mais suscept´ıveis a abandonar a institui¸cão financeira. Sendo assim, para responder tal indaga¸cão foi estimada a fra¸cão de cura, que para esses dados, representa a fra¸cão de clientes fidelizados, ou seja, aqueles que não deixarão de ser clientes da empresa por um

Cap´ıtulo 6. Reprodu¸c˜ao de resultados e aplica¸c˜ao 71

longo per´ıodo de tempo. Logo, os perfis que estão associados a baixa fra¸cão de clientes fidelizados são os de potenciais chance de rompimento do relacionamento com a organiza¸cão. Na Figura 5são apresentadas as fra¸cões de clientes fidelizados segundo os perfis de clientes da institui¸cão financeira. Neste gráfico, pode-se observar que os clientes que não informam o estado civil, independente do sexo, da faixa de idade e n´ıvel de escolaridade são os mais prop´ıcios a romper o relacionamento com a institui¸cão financeira, pois são os perfis relacionados as mais baixas fra¸cões de clientes fidelizados (região mais clara). Já os clientes fidelizados, geralmente, são mais velhos e possuem doutorado ou pós-doutorado (região mais escura).

Ensino médio incompleto Ensino médio Graduação incompleta/completa Mestrado Não informado: Doutorado/Pós−doutorado

Ensino médio incompleto Ensino médio Graduação incompleta/completa Mestrado Viúvo: Doutorado/Pós−doutorado

Ensino médio incompleto Ensino médio Graduação incompleta/completa Mestrado Divorciado: Doutorado/Pós−doutorado

Ensino médio incompleto Ensino médio Graduação incompleta/completa Mestrado União Estável: Doutorado/Pós−doutorado

Ensino médio incompleto Ensino médio Graduação incompleta/completa Mestrado Casado: Doutorado/Pós−doutorado Ensino médio incompleto Ensino médio Graduação incompleta/completa Mestrado Solteiro: Doutorado/Pós−doutorado F eminino: 18 |− 21 21 |− 25 25 |− 30 30 |− 35 35 |− 40 40 |− 45 45 |− 50 50 |− 60 60 |− 70 70 |− Masculino: 18 |− 21 21 |− 25 25 |− 30 30 |− 35 35 |− 40 40 |− 45 45 |− 50 50 |− 60 60 |− 70 70 |−

Sexo e Faixa de idade

Estado civil e Nív el de escolar idade 0,0 0,1 0,2 0,3 0,4 0,5 Fração de clientes fidelizados:

Figura 5 – Fra¸c˜ao de clientes fidelizados sengundo os perfis de clientes da institui¸c˜ao financeira.

Ao fim dessa aplica¸cão, pôde-se concluir por meio do modelo utilizado que a empresa deve investir em pol´ıticas de reten¸cão de clientes, em que os principais clientes foco dessa pol´ıtica são: os que não informam o estado civil ou estão em união estável, os mais jovens e os que possui baixo grau de escolaridade. Além disso, globalmente, a institui¸cão só consegue fidelizar 2,91% dos seus clientes, o que é um percentual relativamente baixo, para mais detalhes consulte o Apêndice C.

7 Considera¸c˜oes finais

O que motivou este estudo foi o fato de que em muitas ocasiões era desejado ajustar modelos flex´ıveis de sobrevivência com fra¸cão de cura, uma vez que, estes são mais real´ısticos e possibilitam em muitas situa¸cões um melhor ajuste aos dados. Porém, quando desejava-se utilizar estes modelos em uma aplica¸cão, o primeiro entrave que se encontrava era ter que fazer toda a programa¸cão desses modelos em algum software para, em seguida fazer o uso do mesmo. Dessa forma, para um usuário experiente em pacotes estat´ısticos isso não seria um barreira se a programa¸cão desses modelos fossem realizadas de forma rápida. Contudo, é necessário enfatizar que nem sempre ou na maioria das vezes o usuário tem disponibilidade de tempo ou recursos para fazer as análises e, desta forma, acabam optando por usar alternativas mais simples que não resolvem o problema de maneira consistente.

Do ponto de vista teórico foram estudados e descritos de forma detalhada os modelos gama generalizado, F generalizado e Weibull na forma estendida de Marshall- Olkin, dentro do contexto da fam´ılia de posi¸cão e escala. Foi mostrado que o modelo Weibull na forma estendida de Marshall-Olkin é membro da fam´ılia de posi¸cão e escala. Ademais, foi descutido a modelagem para dados de sobrevivência com fra¸cão de cura sob uma abordagem unificada e a obten¸cão do logaritmo da fun¸cão de verossimilhan¸ca para os modelos de tempo de falha acelerado com fra¸cão de cura.

Neste contexto, movido pela necessidade de ajustar tais modelos, foi desenvolvido um pacote em ambiente R denominado de flexcure, que possibilita o ajuste de modelos flex´ıveis de tempo de falha acelerado com fra¸cão de cura. Essa implementa¸cão permite o uso dos modelos com fra¸cão de cura através de rotinas amigáveis, de forma semelhante ao pacote survival, usado com frequência para análise de dados de sobrevivência com modelos convencionais.

Para constru¸cão desse pacote foi realizada uma ampla pesquisa sobre as rotinas já publicadas para analisar dados de sobrevivênicia com fra¸cão de cura. Após a busca, foi observado que a revisão histórica apresentada na introdu¸cão deste trabalho com o n´ıvel de detalhamento assumido é inédita. Nesta revisão foi observado que, para outros pacotes estat´ısticos já existem algumas propostas para o ajuste de modelos com fra¸cão de cura. Contudo, o uso de distribui¸cões flex´ıveis para maioria desses programas ainda não é poss´ıvel. Além disso, poucos dos software pesquisados disponibilizam o ajuste do modelo de tempo de promo¸cão, e isso vale para as solu¸cões dispon´ıveis para linguagem R, refor¸cando assim, a contribui¸cão que é feita através do pacote flexcure para essa linguagem. O pacote foi avaliado por meio de simula¸cões e comparado com uma proposta

Cap´ıtulo 7. Considera¸c˜oes finais 73

existente na literatura para o caso do modelo de mistura padrão. Nas simula¸cões observou- se que o desempenho do flexcure foi similar ao do gfcure. Além disso, na maioria dos cenários avaliados, as estimativas dos parâmetros associados à fra¸cão de cura e ao tempo dos elementos não imunes são bem estimadas pelo pacote proposto. Deve-se dar um destaque que a implementa¸cão do modelo de tempo de falha acelerado log-F generalizado com fra¸cão de cura do tipo tempo de promo¸cão é uma caracter´ıstica única do pacote flexcure em rela¸cão aos trabalhos revisados. Além disso, como foi ilustrado no Cap´ıtulo

6, pode-se ver que o pacote aqui proposto fornece resultados confiáveis, sendo uma boa alternativa para ajustar e explorar dados de sobrevivência com fra¸cão de curados.

Ao longo da pesquisa e implementa¸cão do pacote, deparou-se com algumas ideias interessantes que poderiam ser inclu´ıdas na nossa proposta. Sendo assim, do ponto de vista computacional, como proposta para trabalhos futuros, pode-se pensar em desenvolver uma nova versão do flexcure que tenha melhor perfomance com grandes bases de dados, pois notou-se que neste caso o ajuste do modelo se tornava muito demorado. Por exemplo, para os dados área financeira teve-se que esperar em torno de quatro horas para observar o ajuste, porém tinha-se muitos parâmetros a ser estimados. Sendo assim, a fim de resolver esse problema, pode-se desenvolver todas rotinas usando a linguagem C ou C++ através do pacote Rcpp de Eddelbuettel et al. (2011). Ainda nesse contexto, uma outra alternativa é usar programa¸cão em paralelo usando pacotes como, por exemplo, parallel de R Core Team (2015) ou foreach deAnalytics e Weston (2014). Do ponto de vista metodológico, algumas propostas para amplia¸cão do pacote são ferramentas para análise de res´ıduos e para permitir a descrimina¸cão de subclasses dos modelos flex´ıveis discutidos neste trabalho.

Referˆencias

ABRAMOWITZ, M.; STEGUN, I. A. Handbook of mathematical functions: with formulas, graphs, and mathematical tables. [S.l.]: Courier Dover Publications, 1972. Citado 2 vezes nas p´aginas 29e 34.

AKAIKE, H. A new look at the statistical model identification. Automatic Control, IEEE Transactions on, Ieee, v. 19, n. 6, p. 716–723, 1974. Citado na p´agina44.

ANALYTICS, R.; WESTON, S. foreach: Foreach looping construct for R. [S.l.], 2014. R package version 1.4.2. Dispon´ıvel em: <http://CRAN.R-project.org/package=foreach>.

Citado na p´agina 73.

ARAUJO, A. M. M. de. Aplica¸cão de modelos de mistura de longa dura¸cão em dados de reincidência ao crime. 95 f. Disserta¸cão (Mestrado em Engenharia de Produ¸cão) — Universidade Federal de Santa Catarina, Florianópolis, 2004. Citado na página 20. BALAKRISHNAN, N.; JOHNSON, N. L.; KOTZ, S. Continuous Univariate Distributions. [S.l.]: Wiley Series in Probability and Mathematical Statistics, 1994. Citado na página 27. BALAKRISHNAN, N.; JOHNSON, N. L.; KOTZ, S. Continuous Univariate Distributions. [S.l.]: Wiley Series in Probability and Mathematical Statistics, 1995. Citado 2 vezes nas páginas 27e 34.

BERKSON, J.; GAGE, R. P. Survival curve for cancer patients following treatment. Journal of the American Statistical Association, Taylor & Francis Group, v. 47, n. 259, p. 501–515, 1952. Citado 3 vezes nas p´aginas 19, 21e 40.

BERZOFSKY, M. E.; BIEMER, P. P. Weak identifiablility in latent class analysis. In: Proceedings of the ASA Section on Survey Methodology, Joint Statistical Meetings. [S.l.: s.n.], 2012. Citado 2 vezes nas p´aginas 66e 68.

BOAG, J. W. Maximum likelihood estimates of the proportion of patients cured by cancer therapy. Journal of the Royal Statistical Society. Series B (Methodological), JSTOR, v. 11, n. 1, p. 15–53, 1949. Citado 2 vezes nas p´aginas 19e 21.

BOLFARINE, H.; SANDOVAL, M. C. Introdu¸cão à inferência estat´ıstica. [S.l.]: SBM, 2001. v. 2. Citado na página 43.

CAI, C. et al. smcure: An r-package for estimating semiparametric mixture cure models. Computer methods and programs in biomedicine, Elsevier, v. 108, n. 3, p. 1255–1260, 2012.

Citado na p´agina 22.

CAI, C. et al. smcure: Fit Semiparametric Mixture Cure Models. [S.l.], 2013. R package version 2.0. Dispon´ıvel em:<http://CRAN.R-project.org/package=smcure>. Citado na

p´agina 22.

CARNEIRO, H. P. de A. Testes de hipóteses em modelos de sobrevivência com fra¸cão de cura. 78 f. Disserta¸cão (Mestrado em Matemática Aplicada e Estat´ıstica) — Universidade Federal do Rio Grande do Norte, Natal - RN, 2012. Citado 2 vezes nas páginas 83e 84.

Referˆencias 75

CASELLA, G.; BERGER, R. L. Statistical inference. [S.l.]: Duxbury Pacific Grove, CA, 2002. v. 2. Citado na p´agina 45.

CASTRO, M. D.; CANCHO, V. G.; RODRIGUES, J. A hands-on approach for fitting long-term survival models under the gamlss framework. Computer methods and programs in biomedicine, Elsevier, v. 97, n. 2, p. 168–177, 2010. Citado na p´agina 22.

CHEN, M. H.; IBRAHIM, J. G.; SINHA, D. A new bayesian model for survival data with a surviving fraction. Journal of the American Statistical Association, Taylor & Francis Group, v. 94, n. 447, p. 909–919, 1999. Citado 2 vezes nas p´aginas 19 e40.

CIAMPI, A.; HOGG, S. A.; KATES, L. Regression analysis of censored survival data with the generalized f family-an alternative to the proportional hazards model. Statistics in medicine, Wiley Online Library, v. 5, n. 1, p. 85–96, 1986. Citado 2 vezes nas p´aginas 33

e 35.

COLOSIMO, E. A.; GIOLO, S. R. Análise de sobrevivência aplicada. In: ABE-Projeto Fisher. [S.l.]: Edgard Blücher, 2006. Citado 2 vezes nas páginas 24e 27.

CORBI`ERE, F.; JOLY, P. A sas macro for parametric and semiparametric mixture cure models. Computer methods and programs in biomedicine, Elsevier, v. 85, n. 2, p. 173–180, 2007. Citado na p´agina 21.

CORDEIRO, G. M.; LEMONTE, A. J. On the marshall–olkin extended weibull distribution. Statistical Papers, Springer, v. 54, n. 2, p. 333–353, 2013. Citado 2 vezes nas p´aginas 27e 29.

COX, C. The generalized f distribution: an umbrella for parametric survival analysis. Statistics in medicine, Wiley Online Library, v. 27, n. 21, p. 4301–4312, 2008. Citado na p´agina 36.

DOORNIK, J. A. An object-oriented matrix programming language ox 6. Timberlake Consultants Ltd, 2009. Citado na p´agina 68.

EDDELBUETTEL, D. et al. Rcpp: Seamless r and c++ integration. Journal of Statistical Software, v. 40, n. 8, p. 1–18, 2011. Citado na p´agina 73.

FAREWELL, V. T.; PRENTICE, R. L. A study of distributional shape in life testing. Technometrics, JSTOR, p. 69–75, 1977. Citado na p´agina32.

FONSECA, R. S.; VALEN ¸CA, D. M.; BOLFARINE, H. Cure rate survival models with missing covariates: a simulation study. Journal of Statistical Computation and Simulation, Taylor & Francis, v. 83, n. 1, p. 97–113, 2013. Citado na p´agina 48.

GAMEL, J. W. et al. Parametric cure models of relative and cause-specific survival for grouped survival times. Computer methods and programs in biomedicine, Elsevier, v. 61, n. 2, p. 99–110, 2000. Citado na p´agina 21.

GUEDES, A. L. V. Modelo de tempo de falha acelerado com fra¸cão de cura: uma abordagem unificada. 53 f. Disserta¸cão (Mestrado em Matemática Aplicada e Estat´ıstica) — Universidade Federal do Rio Grande do Norte, Natal - RN, 2011. Citado 2 vezes nas

IBRAHIM, J. G.; CHEN, M.-H.; SINHA, D. Bayesian survival analysis. [S.l.]: Wiley Online Library, 2001. Citado 3 vezes nas p´aginas 16, 68e 69.

JACKSON, C. flexsurv: Flexible parametric survival models. [S.l.], 2014. R package version 0.3. Dispon´ıvel em: <http://CRAN.R-project.org/package=flexsurv>. Citado na p´agina 47.

JENKINS, S. P. SPSURV: Stata module to fit split population survival (’cure’) model. 2001. Statistical Software Components, Boston College Department of Economics, Boston College Department of Economics. Dispon´ıvel em: <http: //ideas.repec.org/c/boc/bocode/s418601.html>. Citado na p´agina 21.

KALBFLEISCH, J. D.; PRENTICE, R. L. The statistical analysis of failure time data. [S.l.]: John Wiley & Sons, 2002. Citado 6 vezes nas p´aginas 27, 29, 34,35, 42e 43. KAPLAN, E. L.; MEIER, P. Nonparametric estimation from incomplete observations. Journal of the American statistical association, Taylor & Francis, v. 53, n. 282, p. 457–481, 1958. Citado na p´agina26.

KHODABIN, M.; AHMADABADI, A. Some properties of generalized gamma distribution. Mathematical Sciences, v. 4, n. 1, p. 9–28, 2010. Citado na p´agina 31.

LAI, C. D. Constructions and applications of lifetime distributions. Applied Stochastic Models in Business and Industry, Wiley Online Library, v. 29, n. 2, p. 127–140, 2013. Citado na p´agina 27.

LAMBERT, P. C. Modeling of the cure fraction in survival studies. Stata Journal, STATA PRESS 4905 LAKEWAY PARKWAY, COLLEGE STATION, TX 77845 USA, v. 7, n. 3, p. 351, 2007. Citado na p´agina 21.

LAWLESS, J. F. Inference in the generalized gamma and log gamma distributions. Technometrics, Taylor & Francis, v. 22, n. 3, p. 409–419, 1980. Citado na p´agina 32.

LAWLESS, J. F. Statistical models and methods for lifetime data. [S.l.]: John Wiley & Sons, 2003. Citado 11 vezes nas p´aginas 26, 27, 28, 29,30, 32, 33, 42,65, 68e 88. LI, C.-S.; TAYLOR, J. M. A semi-parametric accelerated failure time cure model. Statistics in medicine, Wiley Online Library, v. 21, n. 21, p. 3235–3247, 2002. Citado na p´agina 22.

LOUZADA NETO, F.; GRANZOTTO, D. C. T.; PERDON Á, G. d. S. C. Fideliza¸cão e reten¸cão de clientes: Uma aplica¸cão de modelos de mistura com longa dura¸cão. Tecnologia de Crédito, Serasa Experian, v. 74, p. 09–19, 2010. Citado na página 20.

MACEDO, C. P. C.; VALEN ¸CA, D. M. Aplica¸cão do modelo de cox para identificar fatores de risco em pacientes com câncer de mama. Revista Brasileira de Estatıstica, 2009. Citado na página 37.

MALLER, R. A.; ZHOU, X. Survival analysis with long-term survivors. [S.l.]: Wiley New York, 1996. Citado 2 vezes nas p´aginas37 e41.

MARSHALL, A. W.; OLKIN, I. A new method for adding a parameter to a family of distributions with application to the exponential and weibull families. Biometrika, Biometrika Trust, v. 84, n. 3, p. 641–652, 1997. Citado 4 vezes nas p´aginas27,29,30 e31.

Referˆencias 77

MARSHALL, A. W.; OLKIN, I. Life distributions: Structure of Nonparametric, Semiparametric, and Parametric Families. [S.l.]: Springer, 2007. Citado na p´agina29. NOCEDAL, J.; WRIGHT, S. Numerical optimization. [S.l.]: Springer Science & Business Media, 2006. Citado na p´agina 47.

ORTEGA, E. M. M. et al. A new class of survival regression models with cure fraction. Journal of Data Science, v. 12, n. 1, p. 107–136, 2014. Citado na p´agina 22.

ORTEGA, E. M. M.; CANCHO, V. G.; PAULA, G. A. Generalized log-gamma regression models with cure fraction. Lifetime Data Analysis, Springer, v. 15, n. 1, p. 79–106, 2009. Citado 4 vezes nas p´aginas 17,65, 68e 69.

PENG, Y. Fitting semiparametric cure models. Computational statistics & data analysis, Elsevier, v. 41, n. 3, p. 481–490, 2003. Citado na p´agina 22.

PENG, Y.; DEAR, K. B. G. A nonparametric mixture model for cure rate estimation. Biometrics, Wiley Online Library, v. 56, n. 1, p. 237–243, 2000. Citado 2 vezes nas p´aginas 21e 22.

PENG, Y.; DEAR, K. B. G.; DENHAM, J. W. A generalized F mixture model for cure rate estimation. Statistics in medicine, v. 17, n. 8, p. 813–830, 1998. Citado 6 vezes nas p´aginas 20, 34,35, 48, 65e 67.

PRENTICE, R. L. A log gamma model and its maximum likelihood estimation. Biometrika, Biometrika Trust, v. 61, n. 3, p. 539–544, 1974. Citado 3 vezes nas p´aginas

32,33 e116.

PRENTICE, R. L. Discrimination among some parametric models. Biometrika, Biometrika Trust, v. 62, n. 3, p. 607–614, 1975. Citado 3 vezes nas p´aginas 33, 35 e36.

R Core Team. R: A Language and Environment for Statistical Computing. Vienna, Austria, 2015. Dispon´ıvel em: <http://www.R-project.org/>. Citado 3 vezes nas p´aginas 20,46 e73.

RODRIGUES, J. et al. On the unification of long-term survival models. Statistics & Probability Letters, Elsevier, v. 79, n. 6, p. 753–759, 2009a. Citado 4 vezes nas p´aginas 19,

26,37 e39.

RODRIGUES, J. et al. Com–poisson cure rate survival models and an application to a cutaneous melanoma data. Journal of Statistical Planning and Inference, Elsevier, v. 139, n. 10, p. 3605–3611, 2009b. Citado na p´agina 22.

SACCILOTTO, R. Tutorial: ggplot2. Basil´eia, 2010. Dispon´ıvel em: <http: //www.ceb-institute.org/bbs/wp-content/uploads/2011/09/handout ggplot2.pdf>. Citado na p´agina 90.

SANTOS NETO, M. et al. The marshall-olkin extended weibull family of distributions. Journal of Statistical Distributions and Applications, Springer, v. 1, n. 1, p. 9, 2014. Citado na p´agina 29.

SAS INSTITUTE INC. The NLMIXED Procedure. Carry, NC, 2000. 2419–2504 p. SAS/STAT User’s guide, Version 8. Citado na p´agina 21.

SCHWARZ, G. et al. Estimating the dimension of a model. The annals of statistics, Institute of Mathematical Statistics, v. 6, n. 2, p. 461–464, 1978. Citado na p´agina 44. SPOSTO, R. Cure model analysis in cancer: an application to data from the children’s cancer group. Statistics in medicine, Wiley Online Library, v. 21, n. 2, p. 293–312, 2002. Citado na p´agina 19.

STACY, E. W. A generalization of the gamma distribution. The Annals of Mathematical Statistics, JSTOR, p. 1187–1192, 1962. Citado 2 vezes nas p´aginas 30e 31.

STASINOPOULOS, D. M.; RIGBY, R. A. Generalized additive models for location scale and shape (gamlss) in r. Journal of Statistical Software, v. 23, n. 7, p. 1–46, 2007. Citado na p´agina 22.

SY, J. P.; TAYLOR, J. M. Estimation in a Cox proportional hazards cure model. Biometrics, Wiley Online Library, v. 56, n. 1, p. 227–236, 2000. Citado 2 vezes nas p´aginas 21e 22.

THERNEAU, T. M. A Package for Survival Analysis in S. [S.l.], 2015. 118 p. R package version 2.37-7. Dispon´ıvel em: <http://CRAN.R-project.org/package=survival>. Citado

na p´agina 20.

THERNEAU, T. M.; GRAMBSCH, P. M. Modeling Survival Data: Extending the Cox Model. New York: Springer, 2000. Citado na p´agina 20.

TOURNOUD, M.; ECOCHARD, R. Application of the promotion time cure model with time-changing exposure to the study of hiv/aids and other infectious diseases. Statistics in medicine, Wiley Online Library, v. 26, n. 5, p. 1008–1021, 2007. Citado na página 19. VALEN ¸CA, D. M. O modelo de regressão gama generalizada para discriminar entre modelos paramétricos de tempo de vida. 143 f. Disserta¸cão (Mestrado em Estat´ıstica) — Universidade Estadual de Campinas, Campinas - SP, 1994. Citado 3 vezes nas páginas

31,32 e33.

WICKHAM, H. ggplot2: elegant graphics for data analysis. Springer New York, 2009. ISBN 978-0-387-98140-6. Dispon´ıvel em: <http://had.co.nz/ggplot2/book>. Citado na

p´agina 89.

WICKHAM, H.; FRANCOIS, R. dplyr: A Grammar of Data Manipulation. [S.l.], 2015. R package version 0.4.2. Dispon´ıvel em: <http://CRAN.R-project.org/package=dplyr>.

Citado na p´agina 89.

YAKOVLEV, A. Y.; TSODIKOV, A. D. Stochastic models of tumor latency and their biostatistical applications. Singapore: World Scientific, 1996. v. 1. Citado 2 vezes nas p´aginas 19e 40.

YAMAGUCHI, K. Accelerated failure-time regression models with a regression model of surviving fraction: an application to the analysis of ”permanent employment”in japan. Journal of the American Statistical Association, Taylor & Francis Group, v. 87, n. 418, p. 284–292, 1992. Citado 4 vezes nas p´aginas16, 17, 65e 67.

YIN, G.; IBRAHIM, J. G. Cure rate models: a unified approach. Canadian Journal of Statistics, Wiley Online Library, v. 33, n. 4, p. 559–570, 2005. Citado na p´agina 19.

Referˆencias 79

YU, B. et al. Cansurv: a windows program for population-based cancer survival analysis. Computer methods and programs in biomedicine, Elsevier, v. 80, n. 3, p. 195–203, 2005.

Citado na p´agina 20.

ZHANG, J.; PENG, Y. A new estimation method for the semiparametric accelerated failure time mixture cure model. Statistics in medicine, Wiley Online Library, v. 26, n. 16, p. 3157–3171, 2007. Citado na p´agina 22.

APÊNDICE A – Demonstra¸cão da obten¸cão

No documento Modelos flexíveis de sobrevivência com fração de cura: implementação computacional (páginas 70-89)