• Nenhum resultado encontrado

Aplica¸c˜ao: an´alise de dados da ´area financeira

O conjunto de dados a ser analisado representa 65535 cadastros de clientes de uma determinada institui¸c˜ao financeira brasileira. O interesse ´e estudar o tempo at´e que estes deixem a institui¸c˜ao, isto ´e, deixar de ter relacionamento com a empresa. Neste estudo, quando o indiv´ıduo deixa a entidade, o seu tempo ´e dito observado, j´a no caso em que o cliente ´e ainda ativo, o seu tempo ´e dito censurado. Para esses indiv´ıduos, al´em do tempo e do indicador de censura, foram registrados: o sexo, a idade, o estado civil e o n´ıvel de escolaridade.

Para os dados disponibilizados, tˆem-se a presen¸ca de 41787 censuras que representam 63,76% dos clientes, ou seja, h´a evidˆencia de que uma propor¸c˜ao de indiv´ıduos s˜ao imunes ao evento de interesse, que neste caso, ´e interromper o relacionamento com a institui¸c˜ao. Al´em disso, como pode ser visto na Figura 4, a sobrevivˆencia estimada pelo m´etodo de Kaplan-Meier se mantem a um n´ıvel aproximadamente constante e estritamente maior do que zero, durante um per´ıodo de tempo razo´avel (tempo m´aximo observado no estudo foi de 2770 dias e o m´ınimo foi de 14 dias). No apˆendice C, s˜ao apresentados todos os gr´aficos

para as covari´aveis e estes tamb´em apontam fortes evidˆencias de que existe uma propor¸c˜ao de indiv´ıduos n˜ao suscept´ıveis ao evento de interesse.

0,00 0,25 0,50 0,75 1,00 0 1000 2000

Tempo (em dias)

S

^

(

t

)

Figura 4 – Gr´afico da fun¸c˜ao de sobrevivˆencia estimada usando o m´etodo Kaplan-Meier para os tempos at´e que o cliente abandone a institui¸c˜ao financeira.

Para an´alise desses dados, optou-se por ajustar o modelo de regress˜ao de tempo de promo¸c˜ao log-F generalizado, pois existem evidˆencias que este ´e o modelo que melhor descreve o mecanismo gerador dos tempos (ver Apˆendice C). Partindo desse modelo, foi associado covari´aveis tanto no termo de fra¸c˜ao de cura quanto no termo relacionado com os tempos dos clientes n˜ao curados. Neste caso, de forma simplificada ´e assumido que o parˆametro de posi¸c˜ao fica em fun¸c˜ao de um preditor linear, da seguinte forma:

µi = β0+ β1xi1+ β2xi2+ β3xi3+ β4xi4

e o parˆametro associado a distribui¸c˜ao do n´umero de causas, que foi assumida como Poisson (modelo de tempo de promo¸c˜ao), fica expresso da seguinte maneira:

log (θi) = γ0+ γ1zi1+ γ2zi2+ γ3zi3+ γ4zi4,

com i = 1, . . . , 65535 e xi1 = zi1(sexo do cliente i), xi2 = zi2 (estado civil do cliente i),

xi3 = zi4 (faixa de idade do cliente i) e xi1 = zi1 (n´ıvel de escolaridade do cliente i).

Nesta aplica¸c˜ao, o principal objetivo de interesse ´e saber quais s˜ao perfis dos clientes que s˜ao mais suscept´ıveis a abandonar a institui¸c˜ao financeira. Sendo assim, para responder tal indaga¸c˜ao foi estimada a fra¸c˜ao de cura, que para esses dados, representa a fra¸c˜ao de clientes fidelizados, ou seja, aqueles que n˜ao deixar˜ao de ser clientes da empresa por um

Cap´ıtulo 6. Reprodu¸c˜ao de resultados e aplica¸c˜ao 71

longo per´ıodo de tempo. Logo, os perfis que est˜ao associados a baixa fra¸c˜ao de clientes fidelizados s˜ao os de potenciais chance de rompimento do relacionamento com a organiza¸c˜ao. Na Figura 5s˜ao apresentadas as fra¸c˜oes de clientes fidelizados segundo os perfis de clientes da institui¸c˜ao financeira. Neste gr´afico, pode-se observar que os clientes que n˜ao informam o estado civil, independente do sexo, da faixa de idade e n´ıvel de escolaridade s˜ao os mais prop´ıcios a romper o relacionamento com a institui¸c˜ao financeira, pois s˜ao os perfis relacionados as mais baixas fra¸c˜oes de clientes fidelizados (regi˜ao mais clara). J´a os clientes fidelizados, geralmente, s˜ao mais velhos e possuem doutorado ou p´os-doutorado (regi˜ao mais escura).

Ensino médio incompleto Ensino médio Graduação incompleta/completa Mestrado Não informado: Doutorado/Pós−doutorado

Ensino médio incompleto Ensino médio Graduação incompleta/completa Mestrado Viúvo: Doutorado/Pós−doutorado

Ensino médio incompleto Ensino médio Graduação incompleta/completa Mestrado Divorciado: Doutorado/Pós−doutorado

Ensino médio incompleto Ensino médio Graduação incompleta/completa Mestrado União Estável: Doutorado/Pós−doutorado

Ensino médio incompleto Ensino médio Graduação incompleta/completa Mestrado Casado: Doutorado/Pós−doutorado Ensino médio incompleto Ensino médio Graduação incompleta/completa Mestrado Solteiro: Doutorado/Pós−doutorado F eminino: 18 |− 21 21 |− 25 25 |− 30 30 |− 35 35 |− 40 40 |− 45 45 |− 50 50 |− 60 60 |− 70 70 |− Masculino: 18 |− 21 21 |− 25 25 |− 30 30 |− 35 35 |− 40 40 |− 45 45 |− 50 50 |− 60 60 |− 70 70 |−

Sexo e Faixa de idade

Estado civil e Nív el de escolar idade 0,0 0,1 0,2 0,3 0,4 0,5 Fração de clientes fidelizados:

Figura 5 – Fra¸c˜ao de clientes fidelizados sengundo os perfis de clientes da institui¸c˜ao financeira.

Ao fim dessa aplica¸c˜ao, pˆode-se concluir por meio do modelo utilizado que a empresa deve investir em pol´ıticas de reten¸c˜ao de clientes, em que os principais clientes foco dessa pol´ıtica s˜ao: os que n˜ao informam o estado civil ou est˜ao em uni˜ao est´avel, os mais jovens e os que possui baixo grau de escolaridade. Al´em disso, globalmente, a institui¸c˜ao s´o consegue fidelizar 2,91% dos seus clientes, o que ´e um percentual relativamente baixo, para mais detalhes consulte o Apˆendice C.

7 Considera¸c˜oes finais

O que motivou este estudo foi o fato de que em muitas ocasi˜oes era desejado ajustar modelos flex´ıveis de sobrevivˆencia com fra¸c˜ao de cura, uma vez que, estes s˜ao mais real´ısticos e possibilitam em muitas situa¸c˜oes um melhor ajuste aos dados. Por´em, quando desejava-se utilizar estes modelos em uma aplica¸c˜ao, o primeiro entrave que se encontrava era ter que fazer toda a programa¸c˜ao desses modelos em algum software para, em seguida fazer o uso do mesmo. Dessa forma, para um usu´ario experiente em pacotes estat´ısticos isso n˜ao seria um barreira se a programa¸c˜ao desses modelos fossem realizadas de forma r´apida. Contudo, ´e necess´ario enfatizar que nem sempre ou na maioria das vezes o usu´ario tem disponibilidade de tempo ou recursos para fazer as an´alises e, desta forma, acabam optando por usar alternativas mais simples que n˜ao resolvem o problema de maneira consistente.

Do ponto de vista te´orico foram estudados e descritos de forma detalhada os modelos gama generalizado, F generalizado e Weibull na forma estendida de Marshall- Olkin, dentro do contexto da fam´ılia de posi¸c˜ao e escala. Foi mostrado que o modelo Weibull na forma estendida de Marshall-Olkin ´e membro da fam´ılia de posi¸c˜ao e escala. Ademais, foi descutido a modelagem para dados de sobrevivˆencia com fra¸c˜ao de cura sob uma abordagem unificada e a obten¸c˜ao do logaritmo da fun¸c˜ao de verossimilhan¸ca para os modelos de tempo de falha acelerado com fra¸c˜ao de cura.

Neste contexto, movido pela necessidade de ajustar tais modelos, foi desenvolvido um pacote em ambiente R denominado de flexcure, que possibilita o ajuste de modelos flex´ıveis de tempo de falha acelerado com fra¸c˜ao de cura. Essa implementa¸c˜ao permite o uso dos modelos com fra¸c˜ao de cura atrav´es de rotinas amig´aveis, de forma semelhante ao pacote survival, usado com frequˆencia para an´alise de dados de sobrevivˆencia com modelos convencionais.

Para constru¸c˜ao desse pacote foi realizada uma ampla pesquisa sobre as rotinas j´a publicadas para analisar dados de sobrevivˆenicia com fra¸c˜ao de cura. Ap´os a busca, foi observado que a revis˜ao hist´orica apresentada na introdu¸c˜ao deste trabalho com o n´ıvel de detalhamento assumido ´e in´edita. Nesta revis˜ao foi observado que, para outros pacotes estat´ısticos j´a existem algumas propostas para o ajuste de modelos com fra¸c˜ao de cura. Contudo, o uso de distribui¸c˜oes flex´ıveis para maioria desses programas ainda n˜ao ´e poss´ıvel. Al´em disso, poucos dos software pesquisados disponibilizam o ajuste do modelo de tempo de promo¸c˜ao, e isso vale para as solu¸c˜oes dispon´ıveis para linguagem R, refor¸cando assim, a contribui¸c˜ao que ´e feita atrav´es do pacote flexcure para essa linguagem. O pacote foi avaliado por meio de simula¸c˜oes e comparado com uma proposta

Cap´ıtulo 7. Considera¸c˜oes finais 73

existente na literatura para o caso do modelo de mistura padr˜ao. Nas simula¸c˜oes observou- se que o desempenho do flexcure foi similar ao do gfcure. Al´em disso, na maioria dos cen´arios avaliados, as estimativas dos parˆametros associados `a fra¸c˜ao de cura e ao tempo dos elementos n˜ao imunes s˜ao bem estimadas pelo pacote proposto. Deve-se dar um destaque que a implementa¸c˜ao do modelo de tempo de falha acelerado log-F generalizado com fra¸c˜ao de cura do tipo tempo de promo¸c˜ao ´e uma caracter´ıstica ´unica do pacote flexcure em rela¸c˜ao aos trabalhos revisados. Al´em disso, como foi ilustrado no Cap´ıtulo

6, pode-se ver que o pacote aqui proposto fornece resultados confi´aveis, sendo uma boa alternativa para ajustar e explorar dados de sobrevivˆencia com fra¸c˜ao de curados.

Ao longo da pesquisa e implementa¸c˜ao do pacote, deparou-se com algumas ideias interessantes que poderiam ser inclu´ıdas na nossa proposta. Sendo assim, do ponto de vista computacional, como proposta para trabalhos futuros, pode-se pensar em desenvolver uma nova vers˜ao do flexcure que tenha melhor perfomance com grandes bases de dados, pois notou-se que neste caso o ajuste do modelo se tornava muito demorado. Por exemplo, para os dados ´area financeira teve-se que esperar em torno de quatro horas para observar o ajuste, por´em tinha-se muitos parˆametros a ser estimados. Sendo assim, a fim de resolver esse problema, pode-se desenvolver todas rotinas usando a linguagem C ou C++ atrav´es do pacote Rcpp de Eddelbuettel et al. (2011). Ainda nesse contexto, uma outra alternativa ´e usar programa¸c˜ao em paralelo usando pacotes como, por exemplo, parallel de R Core Team (2015) ou foreach deAnalytics e Weston (2014). Do ponto de vista metodol´ogico, algumas propostas para amplia¸c˜ao do pacote s˜ao ferramentas para an´alise de res´ıduos e para permitir a descrimina¸c˜ao de subclasses dos modelos flex´ıveis discutidos neste trabalho.

Referˆencias

ABRAMOWITZ, M.; STEGUN, I. A. Handbook of mathematical functions: with formulas, graphs, and mathematical tables. [S.l.]: Courier Dover Publications, 1972. Citado 2 vezes nas p´aginas 29e 34.

AKAIKE, H. A new look at the statistical model identification. Automatic Control, IEEE Transactions on, Ieee, v. 19, n. 6, p. 716–723, 1974. Citado na p´agina44.

ANALYTICS, R.; WESTON, S. foreach: Foreach looping construct for R. [S.l.], 2014. R package version 1.4.2. Dispon´ıvel em: <http://CRAN.R-project.org/package=foreach>.

Citado na p´agina 73.

ARAUJO, A. M. M. de. Aplica¸c˜ao de modelos de mistura de longa dura¸c˜ao em dados de reincidˆencia ao crime. 95 f. Disserta¸c˜ao (Mestrado em Engenharia de Produ¸c˜ao) — Universidade Federal de Santa Catarina, Florian´opolis, 2004. Citado na p´agina 20. BALAKRISHNAN, N.; JOHNSON, N. L.; KOTZ, S. Continuous Univariate Distributions. [S.l.]: Wiley Series in Probability and Mathematical Statistics, 1994. Citado na p´agina 27. BALAKRISHNAN, N.; JOHNSON, N. L.; KOTZ, S. Continuous Univariate Distributions. [S.l.]: Wiley Series in Probability and Mathematical Statistics, 1995. Citado 2 vezes nas p´aginas 27e 34.

BERKSON, J.; GAGE, R. P. Survival curve for cancer patients following treatment. Journal of the American Statistical Association, Taylor & Francis Group, v. 47, n. 259, p. 501–515, 1952. Citado 3 vezes nas p´aginas 19, 21e 40.

BERZOFSKY, M. E.; BIEMER, P. P. Weak identifiablility in latent class analysis. In: Proceedings of the ASA Section on Survey Methodology, Joint Statistical Meetings. [S.l.: s.n.], 2012. Citado 2 vezes nas p´aginas 66e 68.

BOAG, J. W. Maximum likelihood estimates of the proportion of patients cured by cancer therapy. Journal of the Royal Statistical Society. Series B (Methodological), JSTOR, v. 11, n. 1, p. 15–53, 1949. Citado 2 vezes nas p´aginas 19e 21.

BOLFARINE, H.; SANDOVAL, M. C. Introdu¸c˜ao `a inferˆencia estat´ıstica. [S.l.]: SBM, 2001. v. 2. Citado na p´agina 43.

CAI, C. et al. smcure: An r-package for estimating semiparametric mixture cure models. Computer methods and programs in biomedicine, Elsevier, v. 108, n. 3, p. 1255–1260, 2012.

Citado na p´agina 22.

CAI, C. et al. smcure: Fit Semiparametric Mixture Cure Models. [S.l.], 2013. R package version 2.0. Dispon´ıvel em:<http://CRAN.R-project.org/package=smcure>. Citado na

p´agina 22.

CARNEIRO, H. P. de A. Testes de hip´oteses em modelos de sobrevivˆencia com fra¸c˜ao de cura. 78 f. Disserta¸c˜ao (Mestrado em Matem´atica Aplicada e Estat´ıstica) — Universidade Federal do Rio Grande do Norte, Natal - RN, 2012. Citado 2 vezes nas p´aginas 83e 84.

Referˆencias 75

CASELLA, G.; BERGER, R. L. Statistical inference. [S.l.]: Duxbury Pacific Grove, CA, 2002. v. 2. Citado na p´agina 45.

CASTRO, M. D.; CANCHO, V. G.; RODRIGUES, J. A hands-on approach for fitting long-term survival models under the gamlss framework. Computer methods and programs in biomedicine, Elsevier, v. 97, n. 2, p. 168–177, 2010. Citado na p´agina 22.

CHEN, M. H.; IBRAHIM, J. G.; SINHA, D. A new bayesian model for survival data with a surviving fraction. Journal of the American Statistical Association, Taylor & Francis Group, v. 94, n. 447, p. 909–919, 1999. Citado 2 vezes nas p´aginas 19 e40.

CIAMPI, A.; HOGG, S. A.; KATES, L. Regression analysis of censored survival data with the generalized f family-an alternative to the proportional hazards model. Statistics in medicine, Wiley Online Library, v. 5, n. 1, p. 85–96, 1986. Citado 2 vezes nas p´aginas 33

e 35.

COLOSIMO, E. A.; GIOLO, S. R. An´alise de sobrevivˆencia aplicada. In: ABE-Projeto Fisher. [S.l.]: Edgard Bl¨ucher, 2006. Citado 2 vezes nas p´aginas 24e 27.

CORBI`ERE, F.; JOLY, P. A sas macro for parametric and semiparametric mixture cure models. Computer methods and programs in biomedicine, Elsevier, v. 85, n. 2, p. 173–180, 2007. Citado na p´agina 21.

CORDEIRO, G. M.; LEMONTE, A. J. On the marshall–olkin extended weibull distribution. Statistical Papers, Springer, v. 54, n. 2, p. 333–353, 2013. Citado 2 vezes nas p´aginas 27e 29.

COX, C. The generalized f distribution: an umbrella for parametric survival analysis. Statistics in medicine, Wiley Online Library, v. 27, n. 21, p. 4301–4312, 2008. Citado na p´agina 36.

DOORNIK, J. A. An object-oriented matrix programming language ox 6. Timberlake Consultants Ltd, 2009. Citado na p´agina 68.

EDDELBUETTEL, D. et al. Rcpp: Seamless r and c++ integration. Journal of Statistical Software, v. 40, n. 8, p. 1–18, 2011. Citado na p´agina 73.

FAREWELL, V. T.; PRENTICE, R. L. A study of distributional shape in life testing. Technometrics, JSTOR, p. 69–75, 1977. Citado na p´agina32.

FONSECA, R. S.; VALEN ¸CA, D. M.; BOLFARINE, H. Cure rate survival models with missing covariates: a simulation study. Journal of Statistical Computation and Simulation, Taylor & Francis, v. 83, n. 1, p. 97–113, 2013. Citado na p´agina 48.

GAMEL, J. W. et al. Parametric cure models of relative and cause-specific survival for grouped survival times. Computer methods and programs in biomedicine, Elsevier, v. 61, n. 2, p. 99–110, 2000. Citado na p´agina 21.

GUEDES, A. L. V. Modelo de tempo de falha acelerado com fra¸c˜ao de cura: uma abordagem unificada. 53 f. Disserta¸c˜ao (Mestrado em Matem´atica Aplicada e Estat´ıstica) — Universidade Federal do Rio Grande do Norte, Natal - RN, 2011. Citado 2 vezes nas

IBRAHIM, J. G.; CHEN, M.-H.; SINHA, D. Bayesian survival analysis. [S.l.]: Wiley Online Library, 2001. Citado 3 vezes nas p´aginas 16, 68e 69.

JACKSON, C. flexsurv: Flexible parametric survival models. [S.l.], 2014. R package version 0.3. Dispon´ıvel em: <http://CRAN.R-project.org/package=flexsurv>. Citado na p´agina 47.

JENKINS, S. P. SPSURV: Stata module to fit split population survival (’cure’) model. 2001. Statistical Software Components, Boston College Department of Economics, Boston College Department of Economics. Dispon´ıvel em: <http: //ideas.repec.org/c/boc/bocode/s418601.html>. Citado na p´agina 21.

KALBFLEISCH, J. D.; PRENTICE, R. L. The statistical analysis of failure time data. [S.l.]: John Wiley & Sons, 2002. Citado 6 vezes nas p´aginas 27, 29, 34,35, 42e 43. KAPLAN, E. L.; MEIER, P. Nonparametric estimation from incomplete observations. Journal of the American statistical association, Taylor & Francis, v. 53, n. 282, p. 457–481, 1958. Citado na p´agina26.

KHODABIN, M.; AHMADABADI, A. Some properties of generalized gamma distribution. Mathematical Sciences, v. 4, n. 1, p. 9–28, 2010. Citado na p´agina 31.

LAI, C. D. Constructions and applications of lifetime distributions. Applied Stochastic Models in Business and Industry, Wiley Online Library, v. 29, n. 2, p. 127–140, 2013. Citado na p´agina 27.

LAMBERT, P. C. Modeling of the cure fraction in survival studies. Stata Journal, STATA PRESS 4905 LAKEWAY PARKWAY, COLLEGE STATION, TX 77845 USA, v. 7, n. 3, p. 351, 2007. Citado na p´agina 21.

LAWLESS, J. F. Inference in the generalized gamma and log gamma distributions. Technometrics, Taylor & Francis, v. 22, n. 3, p. 409–419, 1980. Citado na p´agina 32.

LAWLESS, J. F. Statistical models and methods for lifetime data. [S.l.]: John Wiley & Sons, 2003. Citado 11 vezes nas p´aginas 26, 27, 28, 29,30, 32, 33, 42,65, 68e 88. LI, C.-S.; TAYLOR, J. M. A semi-parametric accelerated failure time cure model. Statistics in medicine, Wiley Online Library, v. 21, n. 21, p. 3235–3247, 2002. Citado na p´agina 22.

LOUZADA NETO, F.; GRANZOTTO, D. C. T.; PERDON ´A, G. d. S. C. Fideliza¸c˜ao e reten¸c˜ao de clientes: Uma aplica¸c˜ao de modelos de mistura com longa dura¸c˜ao. Tecnologia de Cr´edito, Serasa Experian, v. 74, p. 09–19, 2010. Citado na p´agina 20.

MACEDO, C. P. C.; VALEN ¸CA, D. M. Aplica¸c˜ao do modelo de cox para identificar fatores de risco em pacientes com cˆancer de mama. Revista Brasileira de Estatıstica, 2009. Citado na p´agina 37.

MALLER, R. A.; ZHOU, X. Survival analysis with long-term survivors. [S.l.]: Wiley New York, 1996. Citado 2 vezes nas p´aginas37 e41.

MARSHALL, A. W.; OLKIN, I. A new method for adding a parameter to a family of distributions with application to the exponential and weibull families. Biometrika, Biometrika Trust, v. 84, n. 3, p. 641–652, 1997. Citado 4 vezes nas p´aginas27,29,30 e31.

Referˆencias 77

MARSHALL, A. W.; OLKIN, I. Life distributions: Structure of Nonparametric, Semiparametric, and Parametric Families. [S.l.]: Springer, 2007. Citado na p´agina29. NOCEDAL, J.; WRIGHT, S. Numerical optimization. [S.l.]: Springer Science & Business Media, 2006. Citado na p´agina 47.

ORTEGA, E. M. M. et al. A new class of survival regression models with cure fraction. Journal of Data Science, v. 12, n. 1, p. 107–136, 2014. Citado na p´agina 22.

ORTEGA, E. M. M.; CANCHO, V. G.; PAULA, G. A. Generalized log-gamma regression models with cure fraction. Lifetime Data Analysis, Springer, v. 15, n. 1, p. 79–106, 2009. Citado 4 vezes nas p´aginas 17,65, 68e 69.

PENG, Y. Fitting semiparametric cure models. Computational statistics & data analysis, Elsevier, v. 41, n. 3, p. 481–490, 2003. Citado na p´agina 22.

PENG, Y.; DEAR, K. B. G. A nonparametric mixture model for cure rate estimation. Biometrics, Wiley Online Library, v. 56, n. 1, p. 237–243, 2000. Citado 2 vezes nas p´aginas 21e 22.

PENG, Y.; DEAR, K. B. G.; DENHAM, J. W. A generalized F mixture model for cure rate estimation. Statistics in medicine, v. 17, n. 8, p. 813–830, 1998. Citado 6 vezes nas p´aginas 20, 34,35, 48, 65e 67.

PRENTICE, R. L. A log gamma model and its maximum likelihood estimation. Biometrika, Biometrika Trust, v. 61, n. 3, p. 539–544, 1974. Citado 3 vezes nas p´aginas

32,33 e116.

PRENTICE, R. L. Discrimination among some parametric models. Biometrika, Biometrika Trust, v. 62, n. 3, p. 607–614, 1975. Citado 3 vezes nas p´aginas 33, 35 e36.

R Core Team. R: A Language and Environment for Statistical Computing. Vienna, Austria, 2015. Dispon´ıvel em: <http://www.R-project.org/>. Citado 3 vezes nas p´aginas 20,46 e73.

RODRIGUES, J. et al. On the unification of long-term survival models. Statistics & Probability Letters, Elsevier, v. 79, n. 6, p. 753–759, 2009a. Citado 4 vezes nas p´aginas 19,

26,37 e39.

RODRIGUES, J. et al. Com–poisson cure rate survival models and an application to a cutaneous melanoma data. Journal of Statistical Planning and Inference, Elsevier, v. 139, n. 10, p. 3605–3611, 2009b. Citado na p´agina 22.

SACCILOTTO, R. Tutorial: ggplot2. Basil´eia, 2010. Dispon´ıvel em: <http: //www.ceb-institute.org/bbs/wp-content/uploads/2011/09/handout ggplot2.pdf>. Citado na p´agina 90.

SANTOS NETO, M. et al. The marshall-olkin extended weibull family of distributions. Journal of Statistical Distributions and Applications, Springer, v. 1, n. 1, p. 9, 2014. Citado na p´agina 29.

SAS INSTITUTE INC. The NLMIXED Procedure. Carry, NC, 2000. 2419–2504 p. SAS/STAT User’s guide, Version 8. Citado na p´agina 21.

SCHWARZ, G. et al. Estimating the dimension of a model. The annals of statistics, Institute of Mathematical Statistics, v. 6, n. 2, p. 461–464, 1978. Citado na p´agina 44. SPOSTO, R. Cure model analysis in cancer: an application to data from the children’s cancer group. Statistics in medicine, Wiley Online Library, v. 21, n. 2, p. 293–312, 2002. Citado na p´agina 19.

STACY, E. W. A generalization of the gamma distribution. The Annals of Mathematical Statistics, JSTOR, p. 1187–1192, 1962. Citado 2 vezes nas p´aginas 30e 31.

STASINOPOULOS, D. M.; RIGBY, R. A. Generalized additive models for location scale and shape (gamlss) in r. Journal of Statistical Software, v. 23, n. 7, p. 1–46, 2007. Citado na p´agina 22.

SY, J. P.; TAYLOR, J. M. Estimation in a Cox proportional hazards cure model. Biometrics, Wiley Online Library, v. 56, n. 1, p. 227–236, 2000. Citado 2 vezes nas p´aginas 21e 22.

THERNEAU, T. M. A Package for Survival Analysis in S. [S.l.], 2015. 118 p. R package version 2.37-7. Dispon´ıvel em: <http://CRAN.R-project.org/package=survival>. Citado

na p´agina 20.

THERNEAU, T. M.; GRAMBSCH, P. M. Modeling Survival Data: Extending the Cox Model. New York: Springer, 2000. Citado na p´agina 20.

TOURNOUD, M.; ECOCHARD, R. Application of the promotion time cure model with time-changing exposure to the study of hiv/aids and other infectious diseases. Statistics in medicine, Wiley Online Library, v. 26, n. 5, p. 1008–1021, 2007. Citado na p´agina 19. VALEN ¸CA, D. M. O modelo de regress˜ao gama generalizada para discriminar entre modelos param´etricos de tempo de vida. 143 f. Disserta¸c˜ao (Mestrado em Estat´ıstica) — Universidade Estadual de Campinas, Campinas - SP, 1994. Citado 3 vezes nas p´aginas

31,32 e33.

WICKHAM, H. ggplot2: elegant graphics for data analysis. Springer New York, 2009. ISBN 978-0-387-98140-6. Dispon´ıvel em: <http://had.co.nz/ggplot2/book>. Citado na

p´agina 89.

WICKHAM, H.; FRANCOIS, R. dplyr: A Grammar of Data Manipulation. [S.l.], 2015. R package version 0.4.2. Dispon´ıvel em: <http://CRAN.R-project.org/package=dplyr>.

Citado na p´agina 89.

YAKOVLEV, A. Y.; TSODIKOV, A. D. Stochastic models of tumor latency and their biostatistical applications. Singapore: World Scientific, 1996. v. 1. Citado 2 vezes nas p´aginas 19e 40.

YAMAGUCHI, K. Accelerated failure-time regression models with a regression model of surviving fraction: an application to the analysis of ”permanent employment”in japan. Journal of the American Statistical Association, Taylor & Francis Group, v. 87, n. 418, p. 284–292, 1992. Citado 4 vezes nas p´aginas16, 17, 65e 67.

YIN, G.; IBRAHIM, J. G. Cure rate models: a unified approach. Canadian Journal of Statistics, Wiley Online Library, v. 33, n. 4, p. 559–570, 2005. Citado na p´agina 19.

Referˆencias 79

YU, B. et al. Cansurv: a windows program for population-based cancer survival analysis. Computer methods and programs in biomedicine, Elsevier, v. 80, n. 3, p. 195–203, 2005.

Citado na p´agina 20.

ZHANG, J.; PENG, Y. A new estimation method for the semiparametric accelerated failure time mixture cure model. Statistics in medicine, Wiley Online Library, v. 26, n. 16, p. 3157–3171, 2007. Citado na p´agina 22.

81

APˆENDICE A – Demonstra¸c˜ao da obten¸c˜ao

Documentos relacionados