• Nenhum resultado encontrado

7 Considerações nais

No documento Modelo de regressão beta modal (páginas 62-67)

Neste trabalho, foi estudada a reparametrização da distribuição beta proposta por Zhou e Huang (2019) (chamada neste trabalho de distribuição beta modal), considerando a moda da distribuição e um parâmetro de dispersão. Foram apresentadas algumas pro- priedades desta distribuição e foram considerados aspectos de estimação dos parâmetros através do método da máxima verossimilhança.

Assumindo que a variável resposta segue a distribuição beta modal, foi estudado o modelo de regressão para dados de taxa e proporção que inclui covariáveis na moda da distribuição, proposto por Zhou e Huang (2019) com o intuito de ser mais robusto à outliers.

Foram realizados estudos de simulação mais completos utilizando o método de Monte Carlo, com o auxílio do software R Core Team (2019), para avaliar numericamente as estimativas de máxima verossimilhança dos parâmetros do modelo. Desse estudo, foi con- cluído que os estimadores de máxima verossimilhança do modelo de regessão beta modal apresentam boas propriedades tanto em dados simétricos quanto assimétricos.

O desempenho em dados que possuem valores discrepantes foi avaliado através de um procedimento adaptado de (BAYES et al., 2012), em que foi considerado três padrões de

perturbação na variável resposta e avaliado o desempenho do modelo de regressão beta usual, proposto por Ferrari e Cribari-Neto (2004), e o modelo de regressão beta modal. Concluíu-se desse estudo, que o modelo de regressão beta modal, na maioria dos cenários, apresentou melhor desempenho que o modelo beta usual, principalmente quando avaliado o parâmetro associado à covariável do estudo.

Neste trabalho, três tipos diferentes de resíduos foram propostos para esta classe de modelos, bem como uma forma de construção de envelopes para os mesmos. O estudo de simulação mostrou que os três resíduos apresentam bom desempenho. Adicionalmente, concluíu-se que se os dados do estudo pertencem a beta usual e é ajustado o modelo de regressão beta modal, os resíduos detectam a má especicação quando os dados são

assimétricos à direita ou à esquerda. No entanto, quando os dados são simétricos, os modelos são equivalentes, logo não há caso de má-especicação.

Foram realizadas duas aplicações a dados reais. A primeira foi referente a dados re- tirados do censo 2010. O conjunto de dados era composto por 141 observações referentes aos municípios do estado do Mato Grosso. A variável resposta do estudo era a taxa de analfabetismo de indivíduos com idade entre 25 e 29 anos e a variável regressora era o índice de desenvolvimento humano por município do MT. Observou-se que os dados apre- sentavam característica de assimetria à direita e também possuía pontos discrepantes, sendo um conjunto de dados ideal para avaliar o modelo beta modal. Foram ajustados os modelos beta usual e beta modal e, considerando os critérios AIC e BIC e a análise dos resíduos quantílico aleatorizado, ponderado padronizado e de Cox-Snell como com- paração dos modelos, concluíu-se que o modelo proposto mostrou-se melhor ajustado ao conjunto de dados. A segunda aplicação foi referente a dados do ENEM 2017, em que considerou-se como variável resposta o índice de acertos na prova de linguagens, códigos e suas tecnologias de participantes concluintes do ensino médio e que foram aprovados na UFRN pelo SISU 2018. As covariáveis do estudo foram: sexo, cor/raça, escolaridade do pai, escolaridade da mãe e tipo de escola que cursou o ensino médio. O conjunto de dados possuía 2070 observações e apresentou característica de quase simetria. Foram ajus- tados os modelos de regessão beta usual e beta modal e, através da análise dos resíduos, concluíu-se que ambos os modelos estão bem ajustados. O AIC e o BIC para o modelo de regressão beta modal apresentou menor valor do que para o modelo de regressão beta usual. Como passo futuro deseja-se estender o modelo para considerar os casos de precisão variável, isto é, inclui covariáveis também no parâmetro de precisão.

Referências

ARISTODEMOU, K. New regression methods for measures of central tendency. Tese (Doutorado), 2014.

BAYES, C. L. et al. A new robust regression model for proportions. Bayesian Analysis, International Society for Bayesian Analysis, v. 7, n. 4, p. 841866, 2012.

BENJAMIN, M. A.; RIGBY, R. A.; STASINOPOULOS, D. M. Generalized

autoregressive moving average models. Journal of the American Statistical association, Taylor & Francis, v. 98, n. 461, p. 214223, 2003.

BOURGUIGNON, M.; LEÃO, J.; GALLARDO, D. I. Parametric modal regression with varying precision. Biometrical Journal, Wiley Online Library, 2019.

CHERNOFF, H. Estimation of the mode. Annals of the Institute of Satistical Mathematics, Springer, v. 16, n. 1, p. 3144, 1964.

COLLOMB, G.; HÄRDLE, W.; HASSANI, S. A note on prediction via estimation of the conditional mode function. Journal of Statistical Planning and Inference, Elsevier, v. 15, p. 227236, 1986.

COLOSIMO, E.; GIOLO, S. Análise de sobrevivência aplicada. 1a edição. São Paulo:

Editora Edgard Blücher, 2006.

COX, D. R.; SNELL, E. J. A general denition of residuals. Journal of the Royal Statistical Society: Series B (Methodological), Wiley Online Library, v. 30, n. 2, p. 248265, 1968.

DUNN, P. K.; SMYTH, G. K. Randomized quantile residuals. Journal of Computational and Graphical Statistics, Taylor & Francis, v. 5, n. 3, p. 236244, 1996.

EDDY, W. F. Optimum kernel estimators of the mode. The Annals of Statistics, Institute of Mathematical Statistics, v. 8, n. 4, p. 870882, 1980.

ESPINHEIRA, P. L.; FERRARI, S. L.; CRIBARI-NETO, F. Inuence diagnostics in beta regression. Computational Statistics & Data Analysis, Elsevier, v. 52, n. 9, p. 44174431, 2008.

ESPINHEIRA, P. L.; FERRARI, S. L.; CRIBARI-NETO, F. On beta regression residuals. Journal of Applied Statistics, Taylor & Francis, v. 35, n. 4, p. 407419, 2008. ESPINHEIRA, P. L.; SANTOS, E. G.; CRIBARI-NETO, F. On nonlinear beta regression residuals. Biometrical Journal, Wiley Online Library, v. 59, n. 3, p. 445461, 2017. FERRARI, S.; CRIBARI-NETO, F. Beta regression for modelling rates and proportions. Journal of applied statistics, Taylor & Francis, v. 31, n. 7, p. 799815, 2004.

GRENANDER, U. Some direct estimates of the mode. The Annals of Mathematical Statistics, JSTOR, p. 131138, 1965.

GUPTA, A. K.; NADARAJAH, S. Handbook of beta distribution and its applications. [S.l.]: CRC press, 2004.

HAHN, E. D. Mixture densities for project management activity times: A robust approach to pert. European Journal of operational research, Elsevier, v. 188, n. 2, p. 450459, 2008.

HEDGES, S. B.; SHAH, P. Comparison of mode estimation methods and application in molecular clock analysis. BMC bioinformatics, BioMed Central, v. 4, n. 1, p. 31, 2003. JOHNSON, N. L.; KOTZ, S.; BALAKRISHNAN, N. Continuous univariate distributions. [S.l.]: Houghton Miin Boston, 1970.

JØRGENSEN, B. Maximum likelihood estimation and large-sample inference for generalized linear and nonlinear regression models. Biometrika, Oxford University Press, v. 70, n. 1, p. 1928, 1983.

KARSTEN, J. G. O efeito de disposição: um estudo empírico no Brasil. Tese (Doutorado), 2006.

KIESCHNICK, R.; MCCULLOUGH, B. D. Regression analysis of variates observed on (0, 1): percentages, proportions and fractions. Statistical modelling, Sage Publications Sage CA: Thousand Oaks, CA, v. 3, n. 3, p. 193213, 2003.

KLEIN, J. P.; MOESCHBERGER, M. L. Semiparametric proportional hazards regression with xed covariates. Survival analysis: techniques for censored and truncated data, Springer, p. 243293, 2003.

KRISHNAMOORTHY, K. Handbook of statistical distributions with applications. [S.l.]: Chapman and Hall/CRC, 2016.

LEE, M.-j. Mode regression. Journal of Econometrics, Elsevier, v. 42, n. 3, p. 337349, 1989.

LEE, M.-J. Quadratic mode regression. Journal of Econometrics, Elsevier, v. 57, n. 1-3, p. 119, 1993.

LORENZO, C. O consentimento livre e esclarecido e a realidade do analfabetismo funcional no brasil: uma abordagem para a norma e para além da norma. Revista Bioética, Conselho Federal de Medicina, v. 15, n. 2, p. 268282, 2007.

OELKER, M.-R. et al. Semiparametric mode regression. 2015.

OSPINA, P. L. E. Regressão beta. Tese (Doutorado)  Universidade de São Paulo, 2007. OSPINA, R.; CRIBARI-NETO, F.; VASCONCELLOS, K. L. Improved point and interval estimation for a beta regression model. Computational Statistics & Data Analysis, Elsevier, v. 51, n. 2, p. 960981, 2006.

OSPINA, R.; FERRARI, S. L. Inated beta distributions. Statistical Papers, Springer, v. 51, n. 1, p. 111, 2010.

OSPINA, R.; FERRARI, S. L. A general class of zero-or-one inated beta regression models. Computational Statistics & Data Analysis, Elsevier, v. 56, n. 6, p. 16091623, 2012.

PAMMER, K.; KEVAN, A. The contribution of visual sensitivity, phonological processing, and nonverbal iq to children's reading. Scientic Studies of Reading, Taylor & Francis, v. 11, n. 1, p. 3353, 2007.

PARZEN, E. On estimation of a probability density function and mode. The annals of mathematical statistics, JSTOR, v. 33, n. 3, p. 10651076, 1962.

QUINTELA-DEL-RIO, A.; VIEU, P. A nonparametric conditional mode estimate. Journal of Nonparametric Statistics, Taylor & Francis, v. 8, n. 3, p. 253266, 1997. R Core Team. R: A Language and Environment for Statistical Computing. Vienna, Austria, 2019. Disponível em: <https://www.R-project.org/>.

RAO, C. R. Large sample tests of statistical hypotheses concerning several parameters with applications to problems of estimation. In: CAMBRIDGE UNIVERSITY PRESS. Mathematical Proceedings of the Cambridge Philosophical Society. [S.l.], 1948. v. 44, n. 1, p. 5057.

RIGBY, R. A.; STASINOPOULOS, D. M. Generalized additive models for location, scale and shape. Journal of the Royal Statistical Society: Series C (Applied Statistics), Wiley Online Library, v. 54, n. 3, p. 507554, 2005.

ROMANO, J. P. On week convergence and optimality of kernel density estimates of the mode. The Annals of Statistics, Institute of Mathematical Statistics, v. 16, n. 2, p. 629647, 1988.

SAGER, T. W.; THISTED, R. A. Maximum likelihood estimation of isotonic modal regression. The Annals of Statistics, JSTOR, p. 690707, 1982.

SAMANTA, M.; THAVANESWARAN, A. Non-parametric estimation of the conditional mode. Communications in Statistics-Theory and Methods, Taylor & Francis, v. 19, n. 12, p. 45154524, 1990.

SANTANA, I. et al. Epidemiologia da demência e da doença de alzheimer em portugal: Estimativas da prevalência e dos encargos nanceiros com a medicação. Acta Médica Portuguesa, Ordem dos Médicos, v. 28, n. 2, p. 182188, 2015.

SMITHSON, M.; VERKUILEN, J. A better lemon squeezer? maximum-likelihood regression with beta-distributed dependent variables. Psychological methods, American Psychological Association, v. 11, n. 1, p. 54, 2006.

TERRELL, G. R. The gradient statistic. Computing Science and Statistics, v. 34, n. 34, p. 206215, 2002.

WALD, A. Tests of statistical hypotheses concerning several parameters when the number of observations is large. Transactions of the American Mathematical society, JSTOR, v. 54, n. 3, p. 426482, 1943.

WILKS, S. S. The large-sample distribution of the likelihood ratio for testing composite hypotheses. The Annals of Mathematical Statistics, JSTOR, v. 9, n. 1, p. 6062, 1938. YAO, W.; LI, L. A new regression model: modal linear regression. Scandinavian Journal of Statistics, Wiley Online Library, v. 41, n. 3, p. 656671, 2014.

Zhou, H.; Huang, X. Parametric mode regression for bounded data. arXiv e-prints, p. arXiv:1912.05588, Dec 2019.

ZIEGLER, K. On the asymptotic normality of kernel regression estimators of the mode in the nonparametric random design model. Journal of Statistical Planning and Inference, Elsevier, v. 115, n. 1, p. 123144, 2003.

No documento Modelo de regressão beta modal (páginas 62-67)

Documentos relacionados