• Nenhum resultado encontrado

Este trabalho tem como objetivo principal apresentar os Modelos Inflacionados de Zeros, dentro da metodologia dos MLG’s, bem como uma análise de diagnóstico para os mo- delos em estudo com uma aplicação prática da metodologia utilizada. Embora seja bastante co- mum encontrarmos conjuntos de dados que apresentem uma alta quantidade de valores “zero”, e que uma quantidade razoável de material já tem sido publicado nessa área, a análise de diag- nóstico é pouca explorada. Nesse sentido, procurou-se explorar essa temática dando ênfase na análise de resíduos de Pearson e componentes do desvio. A restrição do trabalho a esses tipos de resíduos deu-se pela dificuldade encontrada de obter material relativo a temática explorada.

A questão computacional nesse caso é de suma importância, dada a complexidade dos algoritmos a serem utilizados. Um segundo objetivo, não menos importante, foi o de ajustar estes modelos com um algoritmo implementado em ambiente R, um software estatístico livre, como forma de divulgar o mesmo. A linguagem R, versátil, mostrou-se bastante útil com fun- cionalidades já desenvolvidas para os modelos inflacionados de zeros, facilitando sobremaneira o trabalho desenvolvido.

No exemplo abordado no Capítulo 4 observamos através das Tabelas (3), (4) e (5) que as estimativas dos parâmetros correspondente aos zeros amostrais nos modelos inflaciona- dos como na Poisson padrão são próximas, no entanto, quando verificamos o erro padrão das estimativas percebemos uma diferença bastante significativa, principalmente do modelo Pois- son padrão para o modelo Binomial Negativo Inflacionado de Zeros, onde temos o modelo mais pobre e o modelo mais adequado aos dados respectivamente. Sabemos que a superdispersão causa sérios problemas com a subestimação do erro padrão das estimativas, como podemos constatar neste caso.

Uma análise do envelope simulado do modelo Poisson padrão mostra um ajuste bem pobre dos dados em estudo, evidenciando a superdispersão dos dados devido ao excesso de zeros. Uma análise dos resíduos de Pearson estudentizados do modelo Poisson Inflacionado de Zeros mostra um comportamento aproximadamente normal com algumas obervações mere- cendo uma atenção especial. Já o modelo Binomial Negativo Inflacionado de Zeros apresenta os resíduos de Pearson estudentizados de forma mais homogênea, sem apresentar observações dis-

crepantes que mereçam atenção, indicando um ajuste mais adequado onde contempla de forma satisfatória a superdispersão presente nos dados.

Com a inclusão dos termos do segundo e terceiro graus, uma nova análise deve ser traçada e como podemos observar, o ajuste ZINB nos dois casos, também foi o mais ade- quado. Através das Figuras e Tabelas podemos verificar que o ajuste ZINB terceiro grau foi o mais adequado de todos os modelos considerados no trabalho, uma vez que ele melhor des- creveu os dados observados. Como já citado anteriormente, a instabilidade da função utilizada para descrever o ajuste ZINB prejudicou a análise de diagnóstico, dado a falta de consistência nas estimativas dos parâmetros do modelo, principalmente quando se aumentou o número de parâmetros no modelo.

Há muito a ser explorado na análise de diagnóstico dos modelos inflacionados de zeros. Diversos temas podem ser explorados nesse sentido, como por exemplo a análise de influência local para os modelos citados, inclusive esse tema já vem sendo estudado para publi- cação de trabalhos futuros, desta forma procuramos contribuir de alguma forma com uma área tão abrangente de problemas práticos.

46

REFERÊNCIAS

AKAIKE, H., A new look at the statistical model identification, Automatic Control, IEEE Transactions on, v. 19, p. 716-723, 1974.

BASSO, R.M., Misturas finitas de misturas de escala Skew-Normal. 96f. Dissertação (Mestrado em Estatística) - Instituto de Matemática, Estatística e Computação Científica, Universidade Estadual de Campinas, Campinas, 2009.

CAMERON, A.C.; TRIVEDI, P.K., Regression Analysis of Count Data, Cambridge: Cambridge University Press, 1998.

CELEUX, G.; SOROMENHO, G., An entropy criterion for assessing the number of clusters in a mixture model, Classification Journal, v.13, p. 195-212, 1996.

CORDEIRO, G.M., Modelos Lineares Generalizados, Campinas: VII SINAPE, 1986. CORDEIRO, G.M.; DEMÉTRIO, C.G.B., Modelos Lineares Generalizados. 52a reunião

Anual da RBRAS 12aSEAGRO, Piracicaba: ESALQ, Departamento de Ciências Exatas, 2007. COX, D.R.; SNEL, E.J., A general definition of residuals, Journal of the Royal Statistical Society B, v. 30, p. 248-275, 1968.

JORGENSEN, B., Exponential dispersion models (with discussion), Journal of the Royal Statistical Society B, v. 49, p. 127-162, 1987.

LAMBERT, D., Zero-inflated poisson regression, with an application to defects in manufacturing, Technometrics, v.34, p. 1-14, 1992.

LINDSEY, J.K., Construction and comparison of statistical models, Journal of the Royal Statistical Society B, v. 36, p. 418-425, 1974b.

MCCULLAGH, P.; NELDER, J.A., Generalized Linear Models, New York: Chapman and Hall, 1989.

MONTOYA, A.G.M., Inferência e diagnóstico em modelos para dados de contagem com excesso de zeros. 107f. Dissertação (Mestrado em Estatística) - Instituto de Matemática, Estatística e Computação Científica, Universidade Estadual de Campinas, Campinas, 2009. NAGAMINE, C.M.L.; CANDOLO, C.; MOURA, M.S.A., Uma aplicação de modelos para dados de contagem inflacionados de zeros na modelagem do número de ovos do mosquito Aedes aegypti, Revista Brasileira de Biometria , v. 26, p. 99-114, 2008.

NELDER, J.A.; WEDDERBURN, R.W.M., Generalized Linear Models, Journal of the Royal Statistical Society A, v. 135, p. 370-384, 1972.

PAULA, G.A., Modelos de Regressão com Apoio Computacional, São Paulo: IME-USP, Versão preliminar, 2004.

R DEVELOPMENT CORE TEAM. R: A language and environment for statistical computing, R Foundation for Statistical Computing, Vienna, Austria, 2008. ISBN 3-900051-07-0, Disponível em <http://www.R-project.org>. Acesso em:26/04/2009.

RIDOUT, M.; HINDE, J.P.; DEMÉTRIO, C.G.B, Models for count data with many zeros, International Biometric Conference, Cape Town, p. 1-13, 1998.

RIZZARDO, R.A.G., O Papel de Apis mellifera L. como polinizador da Mamoneira (Ricinus communis L.): Avaliação da eficiência de polinização das abelhas e incremento de produtividade da cultura. 80f. Dissertação (Mestrado em Zootecnia) - Faculdade de Zootecnia, Universidade Federal do Ceará, Fortaleza, 2007.

WEISBERG, S., Applied Linear Regression, New York: John Wiley, Terceira edição, 2005. WILLIAMS, D.A., Generalized linear model diagnostic using the deviance and single case deletion, Applied Statistics, v.36, p. 181-191, 1987.

YAU, K.K.W.; WANG, K.; LEE, A.H., Zero-inflated negative binomial mixed regression modeling of over-dispersed count data with extra zeros, Biometrical journal, v.45, p. 437-452, 2003.

YEE, T.W., VGAM: Vector Generalized Linear and Additive Models, R package version 0.7-8, 2009. Disponível em <http://www.stat.auckland.ac.nz/ yee/VGAM>. Acesso em:02/05/2009.

48

APÊNDICE

Apêndice A - Função para construção do envelope simulado

Documentos relacionados