• Nenhum resultado encontrado

Distribuição de valores extremos generalizada inflada de zeros

N/A
N/A
Protected

Academic year: 2021

Share "Distribuição de valores extremos generalizada inflada de zeros"

Copied!
102
0
0

Texto

(1)U NIVERSIDADE F EDERAL DO R IO G RANDE DO N ORTE C ENTRO DE C I Eˆ NCIAS E XATAS E DA T ERRA ´ -G RADUAC¸ AO ˜ EM M ATEM ATICA ´ P ROGRAMA DE P OS A PLICADA E E STAT´I STICA ´ M ESTRADO EM M ATEM ATICA A PLICADA E E STAT´I STICA. ˜ DE VALORES EXTREMOS DISTRIBUIC ¸ AO GENERALIZADA INFLADA DE ZEROS. Alexandre Henrique Quadros Gramosa. Natal-RN Maio / 2017.

(2) Alexandre Henrique Quadros Gramosa. ˜ DE VALORES EXTREMOS DISTRIBUIC ¸ AO GENERALIZADA INFLADA DE ZEROS. ´ Trabalho apresentado ao Programa de PosGraduac¸a˜ o em Matem´atica Aplicada e Estat´ıstica da Universidade Federal do Rio Grande do Norte, em cumprimento com as exigˆencias legais para obtenc¸a˜ o do t´ıtulo de Mestre. ´ Area de Concentrac¸a˜ o: Probabilidade e Estat´ıstica. Linha de Pesquisa: Valores Extremos.. Orientador. Prof. Phd. Fernando Ferraz do Nascimento Co-Orientador. Prof. Phd. Fidel Ernesto Castro Morales U NIVERSIDADE F EDERAL DO R IO G RANDE DO N ORTE – UFRN ´ -G RADUAC¸ AO ˜ EM M ATEM ATICA ´ P ROGRAMA DE P OS A PLICADA E E STAT´I STICA – PPGMAE. Natal-RN Maio / 2017.

(3) Gramosa, Alexandre Henrique Quadros ˜ DE VALORES EXTREMOS GENERALIZADOS INFLADISTRIBUIC ¸ AO DOS DE ZEROS - IGEV / Alexandre Henrique Quadros Gramosa - 2017. Biblioteca Central Zila Mamede. 102 fl Dissertac¸a˜ o - Universidade Federal do Rio Grande do Norte - UFRN. ´ Graduac¸a˜ o Centro de Ciˆencias Exatas e da Terra - CCET. Programa de Pos em Matem´atica Aplicada e Estat´ıstica - PPGMAE. 1. Eventos Extremos. 2. Inflacionados de Zeros. 3. Abordagem Bayesiana. Orientador: Fernando Ferraz do Nascimento Co-Orientador: Fidel Ernesto Castro Morales. 12300.

(4) ˜ DE VALORES EXTREMOS GEDissertac¸a˜ o de Mestrado sob o t´ıtulo DISTRIBUIC¸AO NERALIZADA INFLADA DE ZEROS apresentada por Alexandre Henrique Quadros ´ Gramosa e aceita pelo Programa de Pos-Graduac ¸ a˜ o em Matem´atica Aplicada e Estat´ıstica da Universidade Federal do Rio Grande do Norte, sendo aprovada por todos os membros da banca examinadora abaixo especificada:. Prof. Phd. Fernando Ferraz do Nascimento Orientador CCN UFPI / UFRN. Prof. Phd. Fidel Ernesto Castro Morales Co-Orientador CCET UFRN. Prof. Phd. Hedibert Freitas Lopes Externo INSPER. Prof. Dr. Marcelo Bourguignon Pereira CCET UFRN. Natal-RN, 05 de Maio de 2017..

(5) Agradecimentos Agradec¸o ao SENHOR nosso Deus por tudo o que tem feito por mim e por minha Fam´ılia, por esta grande Bˆenc¸a˜ o, por Sua direc¸a˜ o e protec¸a˜ o durante toda esta jornada, ´ pelas dificuldades e pelas vitorias que me fizeram cada vez mais dependente dEle, pois se n˜ao fosse o Seu poder e Sua luz, n˜ao tinha chegado at´e aqui. Obrigado SENHOR! Agradec¸o a minha Fam´ılia que me ajudou e incentivou em todos os momentos, principalmente os mais dif´ıceis, em especial aos meus pais Sr. Gramosa e D. Socorro, pela confianc¸a, pelo apoio moral e financeiro durante o pe´ıodo sem Bolsa, bem como a minha esposa, Eulenir, por toda compreens˜ao e dedicac¸a˜ o. ˜ especiais a meu Orientador e Co-Orientador, Prof. Phd. FerAgradec¸o com dedicac¸oes nando Ferraz do Nascimento e Prof. Phd. Fidel Ernesto Castro Morales, por terem aceitado a me orientar, pela paciˆencia e sabedoria no guia e no desbravo deste trabalho. Agradec¸o aos Professores da Universidade Federal do Rio Grande do Norte - UFRN, ´ bem como aos do Programa de Pos-Graduac ¸ a˜ o em Matem´atica Aplicada e Estat´ıstica - PPGMAE, pela oportunidade de participar do Curso de Mestrado em Matem´atica Aplicada e Estat´ıstica, e por todo o Apoio durante estes dois anos e dois meses. ˆ Agradec¸o aos meus amigos do mestrado, Colombia (”Menino do Ex´ercito”), Evandro, Tito, Felipe, Jhonata, mois´es, La´ıs, Isaac, Wanderson, Wyara que foram fundamentais nestes dois anos, por todo o companheirismo nas disciplinas. Agradec¸o aos amigos e irm˜aos da Igreja Adventista na cidade de Esperanc¸a, Natal/RN por terem me acolhido como Filho, e por toda torcida e orac¸a˜ o. Agradec¸o aos amigos e irm˜aos da Igreja Adventista em Naz´aria/PI, pelo incentivo, ˜ e pelo cuidado com a minha Fam´ılia que tanto precisou. pelas Orac¸oes Agradec¸o a todos que torceram e contribu´ıram para realizac¸a˜ o deste trabalho, em especial o Professor Batista Teles Presidente do Instituto Amostragem..

(6) ”Mas buscai primeiro o Seu reino e Sua justi¸ca, e todas as estas coisas vos ser˜ao acrescentadas”. Mateus 6:33.

(7) ˜ DE VALORES EXTREMOS DISTRIBUIC ¸ AO GENERALIZADA INFLADA DE ZEROS. Autor: Alexandre Henrique Quadros Gramosa Orientador: Prof. Phd. Fernando Ferraz do Nascimento Co-Orientador: Prof. Phd. Fidel Ernesto Castro Morales. R ESUMO Eventos Extremos geralmente s˜ao respons´aveis por produzirem grandes ganhos ou grandes perdas a` sociedade. J´a existe uma distribuic¸a˜ o espec´ıfica, conhecida como Distribuic¸a˜ o de Valores Extremos Generalizada (GEV), desenvolvida para predizer e ˜ com dados extremos, prevenir tais acontecimentos. Entretanto, em muitas situac¸oes existem a presenc¸a de zeros excessivos no banco de dados, dificultando a an´alise e a precis˜ao na estimac¸a˜ o. A Distribuic¸a˜ o Inflada de Zeros (ZID) e´ recomendada para fazer a modelagem desses dados que apresentam zeros inflacionados. E´ objetivo deste trabalho criar uma nova distribuic¸a˜ o para modelar dados de valores extremos e inflados de ˜ GEV e ZID, e tamb´em feito zeros. Portanto, foi realizado uma mistura das distribuic¸oes ˜ com dauma abordagem Bayesiana, na busca de obter um melhor ajuste em aplicac¸oes dos de m´aximos inflacionados de zeros. Foram escolhidas para an´alises, a precipitac¸a˜ o di´aria de chuvas na cidade de Natal do estado do Rio Grande do Norte e nas cidades de Paulistana, Picos, S˜ao Jo˜ao do Piau´ı e Teresina do estado do Piau´ı. Foi utilizado tamb´em a distribuic¸a˜ o GEV padr˜ao para modelar estes mesmos dados coletados, a ˜ feitas pelas duas t´ıtulo de comparac¸a˜ o, e assim, por meio de medidas e estimac¸oes ˜ distribuic¸oes, verificar a qualidade do ajuste encontrado pela nova distribuic¸a˜ o de Valores Extremos Inflados de Zeros (IGEV). Logo, verificou-se que o modelo foi bem desenvolvido, conseguindo estimar bem os dados de m´aximos, mesmo uma quantidade excessiva de zeros, sendo que a GEV padr˜ao n˜ao conseguiu encontrar a distribuic¸a˜ o de equil´ıbrio quando os dados dados possuem muitos zeros. Al´em disso, quando os dados de valores extremos n˜ao tem zeros inflacionados, o novo modelo converge para a GEV padr˜ao, identificando a ausˆencia dos zeros. Palavras-chave: Eventos Extremos, Inflacionados de Zeros, Abordagem Bayesiana..

(8) GENERALIZED EXTREMES VALUES DISTRIBUTION ZEROS INFLATED. Author: Alexandre Henrique Quadros Gramosa Advisor: Prof. Phd. Fernando Ferraz do Nascimento Co-Advisor: Prof. Phd. Fidel Ernesto Castro Morales. A BSTRACT Extreme events are usually responsible for producing big gains or big losses to society. There is already a specific distribution, known as Generalized Extreme Values Distribution (GEV), developed to predict and prevent such events. However, in many situations with extreme data, there are the presence of excessive zeros in the database, making analysis difficult and difficult to estimate. Influenced Zero Distribution (ZID) is recommended to model such data that has inflated zeros. It is the objective of this work to create a new distribution to model data of extreme and inflated values of zeros. Therefore, a mixture of the GEV and ZID distributions was made, as well as a Bayesian approach, in order to obtain a better fit in applications with data of inflated maximums of zeros. The daily precipitation of rainfall in the city of Natal in the state of Rio Grande do Norte and in the cities of Paulistana, Picos, S˜ao Jo˜ao do Piau´ı and Teresina in the state of Piau´ı were chosen for analysis. It was also used the standard GEV distribution to model the same data collected by way of comparison, and thus, through measurements and estimates made by the two distributions, to verify the quality of the adjustment found by the new distribution of Extremes Inflated Zeros Values (IGEV). Therefore, it was verified that the model was well developed, being able to estimate well the maximum data, even an excessive amount of zeros, and the standard GEV could not find the equilibrium distribution when the data given have many zeros. In addition, when the data of extreme values does not have inflated zeros, the new model converges to the standard GEV, identifying the absence of zeros. Keywords: Extreme Events, Inflated Zeros, Bayesian Approach..

(9) Lista de figuras 1. Natal/RN (Fonte: Jornal Tribuna do Norte/13.06.2014). . . . . . . . . .. p. 1. 2. Teresina/PI (Fonte: De Olho No Tempo da Meteorologia/09.04.2015). .. p. 2. 3. Washington DC/EUA (http://noticias.uol.com.br/internac...-nos-euaesvazia-prateleiras.htm?cmpid=tw-uol/22.01.2016). . . . . . . . . . . .. 4. p. 3. Exemplo de densidade e n´ıvel de retorno da distribuic¸a˜ o GEV com µ = 3 e σ = 1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 17. 5. ˆ da GEV para p=0,10 e n=300. . . . . p. 47 ˆ σˆ e ξ) Cadeias dos Estimadores (µ,. 6. ˆ da GEV para p=0,30 e n=1000. . . . p. 48 ˆ σˆ e ξ) Cadeias dos Estimadores (µ,. 7. ˆ da IGEV para p=0,10 e n=300. ˆ Sˆ µ, ˆ σˆ e ξ) Cadeias dos Estimadores (ω,. p. 49. 8. ˆ da IGEV para p=0,30 e n=300. ˆ Sˆ µ, ˆ σˆ e ξ) Cadeias dos Estimadores (ω,. p. 50. 9. ˆ da IGEV para p=0,50 e n=300. ˆ Sˆ µ, ˆ σˆ e ξ) Cadeias dos Estimadores (ω,. p. 51. 10. ˆ da IGEV para p=0,80 e n=300. ˆ Sˆ µ, ˆ σˆ e ξ) Cadeias dos Estimadores (ω,. p. 52. 11. Gr´aficos de Retornos da IGEV com n=300 e p=(0.10, 0.30, 0.50 e 0.80) . p. 56. 12. Gr´aficos de Retornos da IGEV com n=1000 e p=(0.10, 0.30, 0.50 e 0.80) . p. 57. 13. ˜ de Chuvas (mm) das Cidades. . . . . . . p. 60 Histograma das Precipitac¸oes. 14. ˜ de Chuvas (mm) das Cidades. . . . p. 61 Gr´afico de S´eries das Precipitac¸oes. 15. Cadeias MCMC dos Estimadores ωˆ e Sˆ da IGEV de Natal. . . . . . . . p. 64. 16. ˆ σˆ e ξˆ da IGEV de Natal. . . . . . . p. 65 Cadeias MCMC dos Estimadores µ,. 17. ˆ σˆ e ξˆ da GEV de Natal. . . . . . . . p. 66 Cadeias MCMC dos Estimadores µ,. 18. Cadeias MCMC dos Estimadores ωˆ e Sˆ da IGEV de Teresina. . . . . . . p. 67. 19. ˆ σˆ e ξˆ da IGEV de Teresina. . . . . . p. 68 Cadeias MCMC dos Estimadores µ,. 20. ˆ σˆ e ξˆ da GEV de Teresina. . . . . . p. 69 Cadeias MCMC dos Estimadores µ,.

(10) 21. Cadeias MCMC dos Estimadores ωˆ e Sˆ da IGEV de Picos. . . . . . . . . p. 70. 22. ˆ σˆ e ξˆ da IGEV de Picos. . . . . . . p. 71 Cadeias MCMC dos Estimadores µ,. 23. ˆ σˆ e ξˆ da GEV de Picos. . . . . . . . p. 72 Cadeias MCMC dos Estimadores µ,. 24. Cadeias MCMC dos Estimadores ωˆ e Sˆ da IGEV de Paulistana. . . . . p. 73. 25. ˆ σˆ e ξˆ da IGEV de Paulistana. . . . p. 74 Cadeias MCMC dos Estimadores µ,. 26. ˆ σˆ e ξˆ da GEV de Paulistana. . . . . p. 75 Cadeias MCMC dos Estimadores µ,. 27. Cadeias MCMC dos Estimadores ωˆ e Sˆ da IGEV de S˜ao Jo˜ao do Piau´ı.. 28. ˆ σˆ e ξˆ da IGEV de S˜ao Jo˜ao do Piau´ı. p. 77 Cadeias MCMC dos Estimadores µ,. 29. ˆ σˆ e ξˆ da GEV de S˜ao Jo˜ao do Piau´ı. p. 78 Cadeias MCMC dos Estimadores µ,. 30. N´ıvel de Retorno da GEV e da IGEV para Teresina. . . . . . . . . . . . p. 82. p. 76.

(11) Lista de tabelas 1. Tipos de Zeros em Conjuntos de Dados . . . . . . . . . . . . . . . . . . p. 21. 2. Cen´arios sobre a origem de zero nos dados e a modelagem recomendada. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 21. 3. ˜ Mistura de Distribuic¸oes . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 24. 4. ˜ GEV e IGEV, Estimac¸a˜ o dos parˆametros fixados pelas distribuic¸oes ˜ em todas as amostras com p=0,10 e p=0,30. . . . . . p. 43 para as simulac¸oes. 5. ˜ GEV e IGEV, Estimac¸a˜ o dos parˆametros fixados pelas distribuic¸oes ˜ em todas as amostras com p=0,50 e p=0,80. . . . . . p. 44 para as simulac¸oes. 6. Comparac¸a˜ o dos n´ıveis de retornos, respectivos aos quantis altos, nas ˜ com p=0,10 e n=300 e 1000. . . . . . . . . . . . . . . . . . . . p. 54 simulac¸oes. 7. Comparac¸a˜ o dos n´ıveis de retornos, respectivos aos quantis altos, nas ˜ com p=0,30 e n=300 e 1000. . . . . . . . . . . . . . . . . . . . p. 54 simulac¸oes. 8. Comparac¸a˜ o dos n´ıveis de retornos, respectivos aos quantis altos, nas ˜ com p=0,50 e n=300 e 1000. . . . . . . . . . . . . . . . . . . . p. 55 simulac¸oes. 9. Comparac¸a˜ o dos n´ıveis de retornos, respectivos aos quantis altos, nas ˜ com p=0,80 e n=300 e 1000. . . . . . . . . . . . . . . . . . . . p. 55 simulac¸oes. 10. Proporc¸a˜ o de Zeros dos Dados. . . . . . . . . . . . . . . . . . . . . . . . p. 62. 11. Estat´ıstica Descritiva nas cidades em estudo. . . . . . . . . . . . . . . . p. 63. 12. Estimativa dos Parˆametros para a M´edia a Posteriori. . . . . . . . . . . p. 79. 13. Comparac¸a˜ o dos N´ıveis de Retorno de Teresina . . . . . . . . . . . . . p. 80. 14. Comparac¸a˜ o dos N´ıveis de Retorno de Teresina. . . . . . . . . . . . . . p. 81.

(12) Sum´ario. 1. 2. Introdu¸ca˜ o. p. 1. 1.1. Valores Extremos e Excessos de Zeros . . . . . . . . . . . . . . . . . . .. p. 4. 1.2. Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. p. 5. 1.3. Descric¸a˜ o dos Cap´ıtulos . . . . . . . . . . . . . . . . . . . . . . . . . . .. p. 6. Distribui¸ca˜ o de Valores Extremos Generalizada (GEV). p. 7. 2.1. Teoria dos Valores Extremos (TVE) . . . . . . . . . . . . . . . . . . . . .. p. 7. 2.1.1. Distribuic¸a˜ o de M´aximos e M´ınimos . . . . . . . . . . . . . . . .. p. 8. 2.1.2. A Distribuic¸a˜ o GEV . . . . . . . . . . . . . . . . . . . . . . . . . p. 10. 2.1.3. Propriedades da GEV . . . . . . . . . . . . . . . . . . . . . . . . p. 12. 2.2. 3. Inferˆencia para Distribuic¸a˜ o GEV . . . . . . . . . . . . . . . . . . . . . . p. 14 2.2.1. Estimac¸a˜ o por M´axima Verossimilhanc¸a . . . . . . . . . . . . . . p. 15. 2.2.2. Inferˆencia para os N´ıveis de Retornos . . . . . . . . . . . . . . . p. 17. Distribui¸coes ˜ Infladas de Zeros (ZID) 3.1. ´ Numero Excessivo de Zeros . . . . . . . . . . . . . . . . . . . . . . . . . p. 20 3.1.1. 3.2. 4. Classificac¸a˜ o dos Zeros Inflacionados . . . . . . . . . . . . . . . p. 22. Distribuic¸a˜ o Inflada de Zeros (ZID) . . . . . . . . . . . . . . . . . . . . . p. 22 3.2.1. Propriedades da Distribuic¸a˜ o ZID . . . . . . . . . . . . . . . . . p. 23. 3.2.2. Verossimilhanc¸a para a Distribuic¸a˜ o ZID . . . . . . . . . . . . . p. 23. Inferˆencia Bayesiana 4.1. p. 19. p. 25. Estimadores Bayesianos (EB) . . . . . . . . . . . . . . . . . . . . . . . . p. 25.

(13) 4.2. ˜ ZID . . . . . . . . . . . . . . . p. 27 Inferˆencia Bayesiana para Distribuic¸oes. 4.3. ˜ GEV . . . . . . . . . . . . . . . p. 30 Inferˆencia Bayesiana para Distribuic¸oes. 4.4. T´ecnicas MCMC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 31. 4.5 5. 4.4.1. Cadeia de Markov . . . . . . . . . . . . . . . . . . . . . . . . . . p. 32. 4.4.2. Algoritmo de Metropolis - Hastings . . . . . . . . . . . . . . . . p. 33. MCMC4Extremes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 33. Distribui¸coes ˜ de Valores Extremos Generalizada Infladas de Zeros (IGEV) 5.1. Distribuic¸a˜ o IGEV . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 35 5.1.1. 6. Propriedades da IGEV . . . . . . . . . . . . . . . . . . . . . . . . p. 36. 5.2. Inferˆencia Bayesiana para Distribuic¸a˜ o IGEV . . . . . . . . . . . . . . . p. 38. 5.3. N´ıveis de Retornos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 41 p. 42. Simula¸ca˜ o 6.1. 7. p. 35. Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 43 6.1.1. Estimadores e Intervalos de Confianc¸a . . . . . . . . . . . . . . . p. 43. 6.1.2. N´ıveis de Retornos . . . . . . . . . . . . . . . . . . . . . . . . . . p. 53. Aplica¸ca˜ o em Dados de Chuvas. p. 59. 7.1. Conjunto de Dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 59. 7.2. Cidade de Natal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 64. 7.3. 7.4. 7.2.1. IGEV . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 64. 7.2.2. GEV . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 66. Cidade de Teresina . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 67 7.3.1. IGEV . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 67. 7.3.2. GEV . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 69. Cidade de Picos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 70 7.4.1. IGEV . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 70.

(14) 7.4.2 7.5. 7.6. 8. GEV . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 72. Cidade de Paulistana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 73 7.5.1. IGEV . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 73. 7.5.2. GEV . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 75. Cidade de S˜ao Jo˜ao do Piau´ı . . . . . . . . . . . . . . . . . . . . . . . . . p. 76 7.6.1. IGEV . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 76. 7.6.2. GEV . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 78. 7.7. Estimadores Propostos . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 79. 7.8. Medidas de Ajustes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 80. 7.9. Retornos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 81. Conclus˜ao. Referˆencias Bibliogr´aficas. p. 83 p. 86.

(15) 1. 1. Introdu¸ca˜ o. ´ Nos ultimos anos, o mundo vem enfrentando grandes mudanc¸as ambientais. Problemas como enchentes, intensos per´ıodos de seca, devidos a altos e baixos ´ındices de chuvas, preocupam o governo pela grande perda material e financeira que esses eventos trazem para a sociedade. Ter o conhecimento da frequˆencia com o qual esses eventos ocorrem e´ de suma importˆancia para o governo e para a populac¸a˜ o em geral, devido ao grande impacto que esses eventos acarretam na sociedade, para que assim possam ser feitos trabalhos preventivos para diminuir as perdas e potencializar ˆ os ganhos. Este pensamento tamb´em se aplica a outros fenomenos naturais, como por exemplo, em vaz˜ao de rios, velocidade do vento, temperaturas m´aximas e m´ınimas, entre outros, Nascimento (2012).. Figura 1: Natal/RN (Fonte: Jornal Tribuna do Norte/13.06.2014). A Figura 1 mostra a cidade de Natal - RN, no dia 13 de junho de 2014, onde milhares de pessoas sofreram com os alagamentos em alguns bairros da cidade, tendo suas casas invadidas pela a´ gua, perdendo bens e sofrendo com a lama nas ruas correndo o risco de doenc¸as. Os moradores do bairro M˜ae Lu´ıza tiveram suas casas arrastadas,.

(16) 2. centenas de pessoas ficaram desabrigadas e aguardavam pela ajuda dos governos e pela solidariedade da populac¸a˜ o. E at´e no estadio Arena das Dunas em plena Copa do Mundo foi sentido o impacto das chuvas, alagando o est´adio, durante o jogo M´exico ˜ (1 × 0), pela primeira rodada de jogos do Grupo A, causando um grande e Camaroes preju´ızo de R$ 1,3 bilh˜ao. ˆ A prefeitura de Natal informou que naquelas 36 horas os pluviometros da Emparn registraram uma precipitac¸a˜ o de 221 mil´ımetros na Zona Leste de Natal, enquanto a m´edia pluviom´etrica registrada na cidade para o mˆes de junho e´ de 284 mil´ımetros. O prefeito Carlos Eduardo determinou estado de alerta na cidade, deixando todas as secretarias com equipes, materiais e ve´ıculos de sobreaviso durante a noite e enquanto dura-se as chuvas (Fonte: Jornal Tribuna do Norte/13.06.2014).. Figura 2: Teresina/PI (Fonte: De Olho No Tempo da Meteorologia/09.04.2015). Em Teresina - PI, no dia 09 de abril de 2015, uma chuva de mais de 70 mm provocou ´ alagamentos e desmoronamentos. O escoamento do vento umido do leste em todos os n´ıveis de altitude da coluna troposf´erica formou nuvens carregadas na madrugada da quinta-feira (09) no oeste do Piau´ı, o que resultou em fortes pancadas de chuva. Na a´ rea da capital Teresina, ruas, avenidas e residˆencias ficaram completamente alagadas. Parte de um trecho da rodovia federal BR-343 cedeu e precisou ser interditado. No bairro Vila da Paz, uma casa desabou parcialmente, mas ningu´em ficou ferido. J´a na ´ Zona Leste, imoveis de um condom´ınio ficaram alagados e carros submersos conforme.

(17) 3. ´ mostra a Figura 2. A precipitac¸a˜ o registrada na estac¸a˜ o meteorologica autom´atica do Instituto Nacional de Meteorologia (Inmet) at´e a` s 11 horas chegou a 72 mil´ımetros (Fonte: De Olho No Tempo da Meteorologia/09.04.2015).. Figura 3: Washington DC/EUA (http://noticias.uol.com.br/internac...-nos-euaesvazia-prateleiras.htm?cmpid=tw-uol/22.01.2016).. J´a nos EUA, a cidade e regi˜ao metropolitana de Washington foi atingida, na sexta´ feira dia 22 de janeiro de 2016, por uma nevasca historica, que superou um recorde de 71 cent´ımetros registrados em 1922. A capital americana mal teve tempo de se recuperar de uma forte tempestade de neve que ocorreu na noite de quarta (20) e a madrugada de quinta (21). Centenas de pessoas que trabalham em Washington DC e vivem nos estados vizinhos, como Virg´ınia e Maryland, demoraram horas para voltar para casa. Outros tiveram que deixar seus ve´ıculos nas estradas conforme mostra a Figura ˜ apocal´ıpticas deixaram 2, algumas delas intransit´aveis por causa do gelo. As previsoes as prateleiras de alguns supermercados praticamente vazias. At´e a caravana que acompanhava o presidente dos EUA, Barack Obama, da base a´erea de Andrews (Maryland) at´e a Casa Branca tamb´em foi afetada pela neve. De acordo com jornalistas que acompanhavam a comitiva, os carros deslizaram e patinaram no gelo v´arias vezes durante o percurso. Muitas escolas de Washington e de alguns condados da Virg´ınia e Maryland iniciaram as aulas mais tarde do que o habi˜ tual ou at´e mesmo decidiram mandar as crianc¸as ficarem em casa. Mais de 80 milhoes.

(18) 4. de pessoas que vivem na regi˜ao, que abrange desde o sudeste de Nebraska a` cidade de Nova York, foram afetadas. O governador da Virg´ınia, Terry McAuliffe, declarou estado de emergˆencia e alertou a populac¸a˜ o que leve a tempestade a s´erio, assim como poss´ıveis problemas nas estradas e cortes de fornecimento de energia el´etrica (http: // noticias.uol.com.br / internac...-nos-eua-esvazia-prateleiras.htm? cmpid=twuol/22.01.2016).. 1.1. Valores Extremos e Excessos de Zeros. A distribuic¸a˜ o de Valores Extremos Generalizada (GEV) e´ conhecida por apresentar uma melhor performance na modelagem dos dados de eventos raros, pois, as ˜ desses eventos possuem a cauda pesada, e a distribuic¸a˜ o GEV possui distribuic¸oes ˜ com caudas pesadas, sendo recomendadas essa caracter´ıstica de modelar distribuic¸oes para a an´alise desses eventos extremos (FISHER, R. A. and TIPPETT, L. H. C. (1928)). ˜ usuais que n˜ao possuem a caracter´ıstica de modelar caudas pesaJ´a as distribuic¸oes das, como por exemplo a distribuic¸a˜ o Normal ou Gama, n˜ao conseguem extrair as ˜ nelas contidas, e portanto n˜ao conseguem estimar bem seus parˆametros. informac¸oes A distribuic¸a˜ o GEV (Generalized Extreme Value) teve in´ıcio com os trabalhos de von ˜ limite de Mises (1954) e Jenkinson (1955), nos quais mostraram que as distribuic¸oes m´aximos, apresentados no Teorema de Fisher Tippett (1928), cujos argumentos foram completados e formalizados por Gnedenko (1943), podem ser englobadas em apenas ´ uma unica, chamada distribuic¸a˜ o GEV. O avanc¸o de m´etodos computacionais proporcionou o uso de t´ecnicas mais sofisticadas para a estimac¸a˜ o de modelos espec´ıficos para dados de valores extremos, como o aperfeic¸oamento de t´ecnicas utilizando a abordagem Bayesiana de estimac¸a˜ o que utilizam m´etodos computacionais intensos, como MCMC (Markov Chain Monte Carlo), que podem ser vistos em Gamerman e Lopes (2006). ˜ pr´aticas, e´ comum encontrar uma grande quantiNo entanto, em muitas situac¸oes ˜ mais dade de zeros nos conjuntos de dados, como a precipitac¸a˜ o de chuvas em regioes a´ ridas e secas. Esse excesso dificulta a elaborac¸a˜ o de uma an´alise estat´ıstica precisa para o problema, j´a que os modelos usuais desenvolvidos tamb´em n˜ao ajustam bem tal situac¸a˜ o. Martin et al. (2005), ressalta que o valor zero pode acontecer de quatro maneiras diferentes: duas delas podem ser definidas como zeros verdadeiros e duas ´ como aleatorios ou falsos..

(19) 5. Os zeros que aparecem num conjunto de dados podem ser resultados de zeros verdadeiros, de um erro humano, ou ser um zero de amostragem. A distinc¸a˜ o destes ˜ de zeros, na maioria ds situac¸oes, e´ uma tarefa imposs´ıvel de ser realizada. Quando ˜ existe uma incerteza sobre a origem das observac¸oes, utiliza-se de um procedimento ˜ truncadas. comum de distribuic¸oes Uma metodologia eficaz na modelagem destes dados com zeros excessivos e´ a mis˜ Zero Inflacionadas (ZID). Estas requerem a tura de modelos, atrav´es das Distribuic¸oes definic¸a˜ o de uma distribuic¸a˜ o espec´ıfica para o modelo dos dados, caso n˜ao existisse zeros excessivos, e uma outra distribuic¸a˜ o degenerada no ponto zero. Rodrigues (2003) apresentou a abordagem Bayesiana para ZID utilizando um procedimento baseado em dados ampliados, com o objetivo de tornar a posteriori π (θ, w| D ) conhecida, facilitando o tratamento computacional.. 1.2. Objetivos. O objetivo deste trabalho e´ conseguir modelar dados de valores extremos que apresentam em seus conjuntos de dados uma quantidade excessiva de zeros, na busca por uma maior precis˜ao, na probabilidade de eventos raros. O que tornou-se necess´ario propor uma distribuic¸a˜ o que proporcione modelar esses dados extremos inflacionados de zeros. E, utilizando a mistura de distribuic¸a˜ o de valores extremos generalizada, referentes aos eventos extremos, e a distribuic¸a˜ o inflada de zeros, referente aos exces˜ e, sos de zeros, espera-se encontrar um novo modelo, espec´ıfico para estas situac¸oes ˜ que obtenha um melhor resultado em suas estimac¸oes, em comparac¸a˜ o com a GEV. Ajudando na prevenc¸a˜ o de grandes perdas e na aquisic¸a˜ o de grandes ganhos. ˜ pluviom´etricas Tamb´em e´ objetivo deste, calcular as estimativas das precipitac¸oes das cidades de Natal do estado do Rio Grande do Norte e de Paulistana, Picos, S˜ao Jo˜ao do Piau´ı e Teresina do estado do Piau´ı, modeladas por esta distribuic¸a˜ o proposta, e compar´a-las com as estimativas que foram feitas pela distribuic¸a˜ o GEV para estas mesmas cidades. Na expectativa de confirmar, um melhor ajuste pela distribuic¸a˜ o pro´ ˜ posta, quando existe numeros excessivos de zeros nas observac¸oes, do que quando ˜ usuais de extremos. modeladas pelas distribuic¸oes.

(20) 6. 1.3. Descri¸ca˜ o dos Cap´ıtulos. No Cap´ıtulo 2, comenta-se sucintamente conceitos fundamentais para a modela˜ infladas de zeros, o gem de extremos. No Cap´ıtulo 3, descreve-se sobre distribuic¸oes excesso de zeros nos conjuntos de dados, e as s´eries de potˆencias inflacionadas. No Cap´ıtulo 4, faz-se uma revis˜ao de an´alise Bayesiana, t´ecnicas MCMC, e sobre o novo pacote do MCMC4Extremes (Nascimento, 2012 e Nascimento e Silva, 2016). O Cap´ıtulo 5 apresenta o novo modelo de distribuic¸a˜ o para dados extremos quando os dados pos´ suem um numero excessivo de zeros, e sua aplicac¸a˜ o em dados de precipitac¸a˜ o de chuvas em algumas cidades do Nordeste. No Cap´ıtulo 6, apresentamos as principais ˜ conclusoes..

(21) 7. 2. Distribui¸ca˜ o de Valores Extremos Generalizada (GEV). 2.1. Teoria dos Valores Extremos (TVE). A Teoria de Valores Extremos (TVE) engloba v´arias t´ecnicas na an´alise de eventos raros ou extremos, possibilitando a descric¸a˜ o e a quantificac¸a˜ o do comportamento desses acontecimentos, procurando estimar uma poss´ıvel distribuic¸a˜ o limite para os ´ m´aximos (ou m´ınimos) da amostra, composta por vari´aveis aleatorias (v.a.’s) independentes e identicamente distribu´ıdas (i.i.d.). Assim, dados considerados como eventos raros n˜ao s˜ao tratados simplesmente como ”outliers”, mas, inseridos em uma modelagem de extremos, alcanc¸ando assim uma maior precis˜ao nos resultados, levando em ˜ usuconsiderac¸a˜ o que os valores extremos n˜ao s˜ao bem modelados pelas distribuic¸oes ais como, por exemplo, a distribuic¸a˜ o Normal e a Gama, Gamerman (2006). A an´alise de valores extremos tem um maior destaque nas a´ reas ambientais e ˆ ´ economicas, justamente por vir enfrentando principalmente nos ultimos anos grandes ˜ no numero ´ mudanc¸as clim´aticas e financeiras, que implicam em alterac¸oes de eventos extremos, sejam estas de m´aximos ou de m´ınimos. Parmesan (2000) comenta que eventos de temperaturas extremas s˜ao mais respons´aveis por mudanc¸as na natureza do que mudanc¸as na temperatura m´edia. Exemplos como enchentes, nevascas, devidos a altos ´ındices de chuvas, e altos ´ındices de neves, preocupam as autoridades e a sociedade em geral pela grande perda material e financeira que esses eventos trazem. Ter o conhecimento da frequˆencia com qual estes eventos ocorrem e´ de grande importˆancia, para que assim possam ser feitos trabalhos preventivos para diminuir as perdas e potencializar os ganhos, como vimos nos exemplos das cidades de Natal, Teresina e Washington citados no Cap´ıtulo 1. ˜ em daAtrav´es de modelos espec´ıficos utilizados para estimac¸a˜ o de aplicac¸oes dos de valores extremos e suas probabilidades, a TVE apresenta-se como sendo de.

(22) 8. suma importante para a predic¸a˜ o destes acontecimentos, prevenindo as autoridades e a populac¸a˜ o em geral para as grandes perdas e grandes ganhos.. 2.1.1. Distribui¸ca˜ o de M´aximos e M´ınimos. ´ Seja X1 , . . . , Xn uma sequˆencia de vari´aveis aleatorias independentes e identicamente distribu´ıdas com func¸a˜ o de distribuic¸a˜ o FX e Mn = max ( X1 , X2 , . . . , Xn), sendo ´ ˜ e Mn represente o m´aximo dentre as n unidades, que n e´ o numero de observac¸oes ent˜ao a distribuic¸a˜ o do m´aximo e´ encontrada por P( Mn ≤ x ) = P(max ( X1 , X2 , . . . , Xn ) ≤ x ) = P( X1 ≤ x, X2 ≤ x, . . . , Xn ≤ x ) n. = P ( X1 ≤ x ) × P ( X2 ≤ x ) × . . . × P ( X n ≤ x ) =. ∏ P ( Xi ≤ x ). n =1. = P( Xi ≤ x )n = FX ( x )n . Para M1 = min( X1, . . . , Xn), a distribuic¸a˜ o do m´ınimo e´ dada por P( M1 ≤ x ) = P(min( X1 , X2 , . . . , Xn ) ≤ x ) = 1 − P( X1 ≥ x, X2 ≥ x, . . . , Xn ≥ x )) n. n. = 1 − ∏ P( Xi > x ) = 1 − ∏ [1 − P( Xi ≤ x )] n =1. n =1. n. = 1 − [1 − FX ( x )] . Pode-se tamb´em para encontrar o m´ınimo, multiplicar os dados por (−1) e analisar os m´aximos destes. M1 = − max (− X1 , − X2 , · · · , − Xn). Assim, pode-se conhecer a distribuic¸a˜ o do m´aximo e do m´ınimo conhecendo apenas ´ a distribuic¸a˜ o acumulada FX . No entanto, foi necess´ario obter resultados assintoticos para a distribuic¸a˜ o dos m´aximos e dos m´ınimos, pois, em muitos casos n˜ao se encontra a distribuic¸a˜ o FX dos dados. Assumindo que FX e´ desconhecido e procurando por fam´ılias aproximadas de modelos para FXn , que posam ser estimadas baseando-se apenas nos dados de m´aximos. Similar a` pr´atica usual de aproximar a distribuic¸a˜ o das m´edias amostrais pela distribuic¸a˜ o normal, como justificado pelo Teorema Central do Limite. ´ As origens da caracterizac¸a˜ o assintotica de m´aximo amostral tem in´ıcio em Fisher e Tippet (1928), cujos argumentos foram completados e formalizados por Gnedenko.

(23) 9. (1943), atrav´es da normalizac¸a˜ o linear da vari´avel Mn :. Mn∗ =. Mn − bn . an. Escolhas apropriadas de an e bn estabilizam a posic¸a˜ o e a escala de Mn quando n cresce, evitando as dificuldades que aparecem com a vari´avel Mn . Procura-se, portanto, ˜ limite para Mn∗ , ao inv´es de Mn . distribuic¸oes Teorema 2.1.1 (Fisher-Tippet (1928) e Gnedenko (1943)) Se existem sequˆencias de constantes an > 0 e bn tais que  Pr. Mn − bn ≤z an. . → G (z) quando n → ∞,. em que G e´ uma fun¸ca˜ o de distribui¸ca˜ o n˜ao-degenerada, ent˜ao G pertence a uma das seguintes fam´ılias: . . Gumbel : G (z) = exp − exp −. . z−b a. .   0, h  i Frechet : G (z) =  exp exp[− z−b , α.  i h   exp exp[− z−b , α Weibull : G (z) =  1,. , −∞ < z < ∞; se z ≤ b, se z > b; se z ≤ b, se z > b,. para parˆametros a > 0, b, e no caso das fam´ılias Frechet e Weibull, α > 0. O Teorema 2.1.1 diz que os m´aximos amostrais padronizados ( Mn − bn )/an convergem em distribuic¸a˜ o para uma vari´avel com distribuic¸a˜ o igual a uma das trˆes fam´ılias, amplamente conhecidas como distribuic¸a˜ o de valores extremos, Gumbel, Fr´echet e Weibull. Cada fam´ılia tem parˆametro de posic¸a˜ o e escala, b e a, respectivamente; adicionalmente, as fam´ılias Fr´echet e Weibull tˆem parˆametro de forma α. Em outras palavras, quando Mn puder ser estabilizado utilizando sequˆencias adequadas { an } e {bn }, a vari´avel normalizada correspondente Mn∗ tem como distribuic¸a˜ o limite um dos trˆes tipos de distribuic¸a˜ o de valores extremos. Uma observac¸a˜ o muito interessante desse ´ resultado e´ que os trˆes tipos de distribuic¸a˜ o de valores extremos s˜ao os unicos limites ˜ de Mn∗ . E´ nesse sentido que o teorema fornece um resulposs´ıveis para as distribuic¸oes.

(24) 10. tado para valores extremos an´alogo ao Teorema Central do Limite.. 2.1.2. A Distribui¸ca˜ o GEV. A distribuic¸a˜ o GEV e´ conhecida por apresentar uma melhor performance na mo˜ desses eventos delagem dos dados de eventos raros, pois, as caudas das distribuic¸oes ˜ usuais, como por exemplo a possuem a cauda pesada, que no caso das distribuic¸oes ˜ nelas contidas. distribuic¸a˜ o Normal ou Gama, n˜ao conseguem extrair as informac¸oes A distribuic¸a˜ o GEV teve in´ıcio com os trabalhos de von Mises (1954) e Jenkinson (1955) ˜ limite de m´aximos apresentados no com a reformulac¸a˜ o dos modelos das distribuic¸oes Teorema 2.1.1. descritas por Fisher e Tippett (1928) e Gnedenko (1943). E´ simples ve´ rificar que as fam´ılias Gumbel, Fr´echet e Weibull podem ser combinadas numa unica fam´ılia de modelos, chamada distribuic¸a˜ o GEV e, que possui a seguinte func¸a˜ o de distribuic¸a˜ o. ( G (z|µ, σ, ξ ) = exp. . − 1+ξ. . z−µ σ. −1/ξ ) ,. (2.1). definida em {z : 1 − ξ (z − µ)/σ > 0}, em que −∞ < µ < ∞, σ > 0 e −∞ < ξ < ∞, com ξ 6= 0. A distribuic¸a˜ o GEV possui trˆes parˆametros: um parˆametro de posic¸a˜ o, µ; um de ˜ Fr´echet e Weibull de valoescala, σ; e um parˆametro de forma, ξ. As distribuic¸oes res extremos que correspondem, respectivamente, aos casos ξ > 0 e ξ < 0 na nova parametrizac¸a˜ o. O caso ξ = 0 e´ interpretado como o limite de (2.1) quando ξ → 0, conduzindo a` fam´ılia Gumbel. Por meio da inferˆencia em ξ os dados por si so´ determinam o tipo mais apropriado de comportamento de cauda, n˜ao havendo a necessidade de se fazer julgamentos subjetivos sobre qual tipo de fam´ılia de valores extremos adotar. Assim, por conveniˆencia, reformulamos o Teorema 2.1.1 para a forma generalizada.. Teorema 2.1.2 (Von Mises (1954) e Jenkinson (1955)) Se existem sequˆencias de constantes an > 0 e bn tais que.

(25) 11.  Pr. Mn − bn ≤z an. . → G (z) quando n → ∞,. para uma fun¸ca˜ o de distribui¸ca˜ o G n˜ao-degenerada, ent˜ao G e´ membro da fam´ılia GEV: ) (    z − µ −1/ξ , G (z|µ, σ, ξ ) = exp − 1 + ξ σ definida em {z : 1 + ξ (z − µ)/σ > 0}, em que −∞ < µ < ∞, σ > 0 e −∞ < ξ < ∞. O Teorema 2.1.2 nos diz que a distribuic¸a˜ o limite da fam´ılia GEV e´ uma alternativa para a modelagem da distribuic¸a˜ o de m´aximos de sequˆencias longas, pois, e´ a unificac¸a˜ o das trˆes fam´ılias originais de valores extremos (Teorema 2.1.1) e, e´ encontrada por meio de uma aproximac¸a˜ o para n suficientemente grande. ´ Seja Z uma vari´avel aleatoria com distribuic¸a˜ o GEV (µ, σ, ξ ). A func¸a˜ o densidade da distribuic¸a˜ o GEV, derivada da func¸a˜ o de distribuic¸a˜ o acumulada (2.1), e´. (    − 1 −1 − 1 ) ξ ξ 1 ξ ξ 1 + (z − µ) exp − 1 + (z − µ) , g(z|µ, σ, ξ ) = σ σ σ. (2.2). definida em: {z : 1 + ξ (z − µ)/σ > 0}, quando ξ 6= 0. ˜ independentes Logo, para a modelagem de extremos de uma s´erie de observac¸oes X1 , X2 , · · · , Xn , os dados s˜ao agrupados em blocos de sequˆencias de tamanho n, para algum valor de n suficientemente grande, e para cada sequˆencia e´ obtido o m´aximo, gerando uma s´erie de m´aximos de blocos, Mn , 1, · · · , Mn , m, para a qual e´ modelada de acordo com a distribuic¸a˜ o GEV. Geralmente, os dados originais s˜ao dados di´arios agrupados em blocos, em per´ıodos de meses ou de anos obtendo s´eries correspondes aos m´aximos mensais ou m´aximos anuais. Estimativas dos quantis extremos das ˜ de m´aximos mensais ou anuais s˜ao obtidas pela invers˜ao da equac¸a˜ o distribuic¸oes (2.1), fazendo z p = G −1 (1 − p),.  n o  µ − σ 1 − [− log (1 − p)]−ξ , ξ zp =  µ − σ log [− log (1 − p)] ,. se ξ 6= 0; se ξ = 0,. (2.3).

(26) 12. em que G (z p ) = 1 − p. Na terminologia usual, z p e´ o n´ıvel de retorno associado ao per´ıodo 1/p, visto que e´ esperado que o n´ıvel z p ultrapasse em m´edia uma vez a cada 1/p per´ıodos de tempo. A relac¸a˜ o do modelo GEV com seus parˆametros e´ mais facilmente interpretada em ˜ para os quantis (2.3), definido y p = − log(1 − p), tal que termos de expressoes.     µ − σ 1 − y−ξ , p ξ zp =  µ − σ log y p  ,. se ξ 6= 0;. (2.4). se ξ = 0.. Por exemplo, se p = 0.02 e analisamos m´aximos mensais, obter o retorno z0.02 = 100 nos diz que e´ esperado que seja excedido o valor 100 em m´edia uma vez a cada 1/0.02 = 50 meses. Esta grande ferramenta nos ajuda a prever a ocorrˆencia de ´ındices ˆ muito extremos para alguns fenomenos probabil´ısticos, em determinados per´ıodos mensais ou anuais.. 2.1.3. Propriedades da GEV. Apresentamos, nesta subsec¸a˜ o, algumas propriedades importantes para uma v.a X com distribuic¸a˜ o GEV (X ∼ GEV ( x |µ, σ, ξ )), como a m´edia, moda, mediana, varianc¸a, assimetria e curtose, e o r-´esimo momento central. Se ξ > 0, ent˜ao, x > (µ − σ/ξ ) e a esperanc¸a de X e´ E( X ) =. =. (    − 1 −1 − 1 ) ξ ξ 1 ξ ξ x 1 + (z − µ) exp − 1 + (z − µ) dx σ σ (µ−σ/ξ ) σ. Z ∞. Z ∞ 0. σ σy−ξ µ− + ξ ξ. considerando y = [1 + ξ (. x −µ −1/ξ σ )]. .  exp{−y}dy =. e. R∞ 0. σ µ− ξ. . σ + Γ (1 − ξ ), ξ. x v−1 exp(−µx )dx = 1/µv Γ(v) se µ > 0 e. v > 0 (Gradshteyn & Ryzhik, 2000, equac¸a˜ o 3.381.4). ˜ acima, encontramos o r-´esimo momento cenUtilizando as mesmas substituic¸oes tral E(( X − E( X ))r ).

(27) 13. (   − 1 −1 − 1 )  ξ ξ ξ ξ 1 dx = 1 + (z − µ) exp − 1 + (z − µ) E((z − E( X ))r ) σ σ σ (µ−σ/ξ )   r Z ∞ σ ( y − ξ − 1) σ σ = µ+ − µ− exp{−y}(−dy), + Γ (1 − ξ ) ξ ξ ξ 0 Z ∞ h i r σ −ξ = µ − Γ (1 − ξ ) exp{−y}dy. ξ 0 Z ∞. A partir deste resultado, obtemos a varianc¸a de X ∼ GEV, que e´ dada por E(( X −. E( X ))2 ). = Var ( X ) =. Z ∞ h σ 0. ξ. µ. −ξ. − Γ (1 − ξ ). i 2. exp{−y}dy.  2 Z ∞ h i σ y−2ξ − 2Γ(1 − ξ )y−ξ + Γ2 (1 − ξ ) = ξ 0  2 h i σ Γ(1 − 2ξ ) − Γ2 (1 − ξ ) . = ξ Assim, tamb´em encontramos os momentos centrais de terceira e de quarta ordem  3 h i σ E(( X − E( X )) ) = Γ(1 − 3ξ ) − 3Γ(1 − 2ξ )Γ(1 − ξ ) + 2Γ3 (1 − ξ ) ξ 3. E(( X − E( X ))4 )  4 h i σ = Γ(1 − 4ξ ) − 4Γ(1 − 3ξ )Γ(1 − ξ ) + 6Γ(1 − 2ξ )Γ2 (1 − ξ ) + 3Γ4 (1 − ξ ) ξ Logo, os coeficientes de assimetria e de curtose s˜ao obtidos, respectivamente, por. γ1,GEV =. E(( X − E( X ))3 ) [ E(( X − E( X ))2 )]3/2 . =.  Γ(1 − 3ξ ) − 3Γ(1 − 2ξ )Γ(1 − ξ ) + 2Γ3 (1 − ξ ) . [Γ(1 − 2ξ ) − Γ2 (1 − ξ )].

(28) 14. γ2,GEV =. E(( X − E( X ))4 ) [ E(( X − E( X ))2 )]2 . =.  Γ(1 − 4ξ ) − 4Γ(1 − 3ξ )Γ(1 − ξ ) + 6Γ(1 − 2ξ )Γ2 (1 − ξ ) + 3Γ4 (1 − ξ ) .  2 σ 2 [Γ(1 − 2ξ ) − Γ (1 − ξ )] ξ. A moda da distribuic¸a˜ o GEV e´ dada por, i σh −ξ (1 + ξ ) − 1 , argmax f ( x |µ, σ, ξ ) = µ + ξ em que 1 + ξ ( x − µ)/σ > 0. A partir do p-´esimo quantil da distribuic¸a˜ o GEV, apresentado na express˜ao (2.3), encontra-se a sua mediana calculando-se o quantil p = 0, 50 = 1/2. Logo, ( m=. 2.2. µ+. σ ξ. . [log(2)]−ξ − 1 ,. µ − σ log [log(2)] ,. se ξ 6= 0; se ξ = 0.. (2.5). Inferˆencia para Distribui¸ca˜ o GEV. De acordo com o Teorema 2.1.2, a distribuic¸a˜ o GEV propicia um modelo para a distribuic¸a˜ o dos m´aximos dos blocos. Sua aplicac¸a˜ o est´a baseada em encontrar os m´aximos de cada bloco, separando os blocos em igual comprimento e ajustando a GEV para o conjunto de m´aximos dos blocos. No entanto, ao implementar este modelo para um conjunto de dados, a escolha do tamanho do bloco deve ser feita com prudˆencia. A escolha e´ concernente a um trade-off entre v´ıcio e variˆancia: blocos muito ´ pequenos significam que a aproximac¸a˜ o assintotica pelo modelo limite do Teorema ˜ e extrapolac¸oes, ˜ tornando 2.1.2 e´ provavelmente ruim, levando a v´ıcios nas estimac¸oes a distribuic¸a˜ o GEV inadequada para estimar estes m´aximos. Blocos muito grandes, por sua vez, geram poucos m´aximos para se fazer a inferˆencia, conduzindo a uma maior variabilidade das estimativas dos parˆametros, o que acarreta uma imprecis˜ao nas estimativas. Considerando a notac¸a˜ o denotando os m´aximos dos blocos por Z1 , . . . , Zm , assu´ mimos que Zi s˜ao vari´aveis aleatorias independentes de uma distribuic¸a˜ o GEV cujos parˆametros ser˜ao estimados. Se os Xi s˜ao independentes, ent˜ao os Zi tamb´em o s˜ao. Contudo, a independˆencia dos Zi e´ geralmente uma aproximac¸a˜ o razo´avel, mesmo.

(29) 15. quando os Xi s˜ao dependentes, como por exemplo nos casos de dados ambientais ˜ di´arias s˜ao muitos dependentes dos dias proximos. ´ e financeiros que as observac¸oes Mesmo nesse caso, pode ser razo´avel a afirmac¸a˜ o de que Zi tem distribuic¸a˜ o GEV , pois, para n grande a dependˆencia do vetor Z1 , . . . , Zm se torna quase inexistente, Nascimento (2012). Muitas t´ecnicas tˆem sido propostas para a estimac¸a˜ o de parˆametros em modelos de valores extremos, dentre as quais est˜ao inclu´ıdas t´ecnicas baseadas em momentos, nas quais os momentos s˜ao equiparados aos seus equivalentes emp´ıricos (Reiss e Thomas, 1997), m´etodo dos L-momentos (Hosking e Wallis, 1997); procedimentos nos quais os ˜ espec´ıficas de estat´ısticas de ordem (Jansen e parˆametros s˜ao estimados como func¸oes de Vries, 1991), m´etodos baseados em verossimilhanc¸a (Embrechts, Kluppelberg e Mi˜ de kosch, 1997), e m´etodos robustos baseados em estimadores B-robustos, e em func¸oes ˜ (Dupuis e Field, 1998). Cada t´ecnica tem seus pesos usadas para validar as observac¸oes ´ e contras, mas o m´etodo mais convencional e´ m´etodo de m´axima verosimilhanc¸a, pros mesmo apresentando algumas dificuldades nas estimac¸a˜ o dos parˆametros, com res˜ de regularidade necess´arias para a validade das propriedades aspeito a` s condic¸oes ´ sintoticas usuais associadas ao estimador de m´axima verossimilhanc¸a. Smith (1984) estudou este problema detalhadamente e obteve os seguintes resultados: • quando ξ > −0, 5 os estimadores de m´axima verossimilhanc¸a s˜ao regulares, isto ´ e´ , s˜ao satisfeitas as propriedades assintoticas usuais; • quando −1 < ξ < −0, 5 os estimadores de m´axima verossimilhanc¸a podem ser ´ obtidos, mas n˜ao satisfazem as propriedades assintoticas usuais; e • quando ξ < −1 os estimadores de verossimilhanc¸a n˜ao existem. ˜ em ξ ≤ −0, 5, as distribuic¸oes ˜ possuem uma cauda muito leve, raAs situac¸oes ˜ de modelagem de valores extremos de acordo ramente s˜ao encontradas em aplicac¸oes ˜ teoricas ´ com Coles (2001). Assim, as limitac¸oes da abordagem de m´axima verossimilhanc¸a geralmente n˜ao s˜ao um obst´aculo na pr´atica.. 2.2.1. Estima¸ca˜ o por M´axima Verossimilhan¸ca. ´ Sob a suposic¸a˜ o de que Z1 , . . . , Zm s˜ao vari´aveis aleatorias i.i.d. com distribuic¸a˜ o GEV (Z ∼ GEV (µ, σ, ξ )), com func¸a˜ o densidade apresentada em (2.2). Obtemos a.

(30) 16. func¸a˜ o de verossimilhanc¸a, fazendo o produto de suas densidades. (. ". n. ξ −1 L(µ, σ, ξ ) = σ−n exp − ∑ (1 + (zi − µ)) ξ σ i =1   −(1+ 1ξ ) m ξ , ∏ 1 + σ ( zi − µ ) i =1 em que, 1 +. #). ×. ξ (z − µ) > 0, para i = 1, ..., m. σ i. E assim, aplicando o logaritmo na func¸a˜ o de verossimilhanc¸a, encontramos a logverossimilhanc¸a com a seguinte forma m. . l (µ, σ, ξ ) = −m log(σ ) − (1 + 1/ξ ) ∑ log 1 + ξ. . i =1. somente se 1 + ξ. . zi − µ σ. . zi − µ σ. . m. . −∑ 1+ξ. . i =1. zi − µ σ. −1/ξ. > 0, para i = 1, ..., m.. A log-verossimilhanc¸a em que ξ = 0 e´ estimado utilizando o limite Gumbel da distribuic¸a˜ o GEV, m. l (µ, σ, ξ ) = −m logσ − ∑. i =1. . zi − µ σ. . m. . − ∑ exp − i =1. . zi − µ σ.  .. ˜ (2.4) e (2.5), com respeito ao vetor de parˆametros A maximizac¸a˜ o das equac¸oes. (µ, σ, ξ ), conduz aos estimadores de m´axima verossimilhanc¸a da fam´ılia GEV. No entanto, n˜ao existe soluc¸a˜ o anal´ıtica, sendo necess´ario a utilizac¸a˜ o de algoritmos num´ericos ˜ de otimizac¸a˜ o para a maximizac¸a˜ o dos dados. Coles (2001) comenta a dicom padroes ficuldade num´erica que aparece em (2.4) quando os valores ξ pertencem a` vizinhanc¸a de zero. Neste caso, e´ facilmente solucionado, utilizando a express˜ao em (2.5) ao inv´es de (2.4) para estimac¸a˜ o dos parˆametros (µ, σ). ˆ σˆ , ξˆ) e´ a normal multivariada com m´edia (µ, σ, ξ ), ´ A distribuic¸a˜ o assintotica de (µ, Gamerman (2006). Intervalos de confianc¸a e outras formas de inferˆencia podem ser constru´ıdos para estes parˆametros..

(31) 17. 2.2.2. Inferˆencia para os N´ıveis de Retornos. Os n´ıveis de retornos (z p ) para 1/p per´ıodos, 0 < p < 1 s˜ao obtidos pelas estimativas de m´axima verossimilhanc¸a dos parˆametros da GEV em (2.3), baseado na estimac¸a˜ o dos p quantis da GEV. Quando a estimativa do parˆametro ξˆ < 0, a distribuic¸a˜ o e´ limitada superiormente, que e´ efetivamente o per´ıodo de retorno quando o valor observado e´ igual a infinito, correspondendo a z p com p = 0, permitindo encontrar a estimativa de m´axima verossimilhanc¸a dada por ˆ zˆ0 = µˆ − σˆ /ξ. E´ necess´ario uma atenc¸a˜ o especial para interpretac¸a˜ o das inferˆencias de n´ıveis de retornos, principalmente para per´ıodos longos, pois as estimativas e suas respectivas medidas de precis˜ao s˜ao baseadas na suposic¸a˜ o de que o modelo esteja correto.. Figura 4: Exemplo de densidade e n´ıvel de retorno da distribuic¸a˜ o GEV com µ = 3 e σ = 1. ` esquerda: densidade da GEV: linha cheia: ξ = 0, 5, tracejada: ξ = 0.1, pontilhada: A ` direita: n´ıveis de retorno em t per´ıodos: linha cheia: ξ = 0, 5, pontilhada: ξ = −0, 2. A ξ = −0, 2 A Figura 6, retirada do livro de Nascimento (2012), mostra a` esquerda o gr´afico da ˜ do parˆametro de forma ξ. Observe que a distribuic¸a˜ o GEV, em diferentes configurac¸oes medida em que ξ aumenta, a densidade passa a ter um comportamento de cauda mais ` direita, observamos o gr´afico da evoluc¸a˜ o do n´ıvel de retorno esperado em t pesada. A per´ıodos para as densidades da distribuic¸a˜ o GEV, baseado G (z p ) = 1 − 1/t. Suponha que este modelo fosse utilizado para ´ındices de retorno de um ativo de uma carteira de investimento, em que foram coletados os m´aximos mensais. Baseado no gr´afico a`.

(32) 18. direita, era esperado que, a cada 8 meses iria ocorrer uma vez um ganho igual ou maior do que 6, 47%, se o modelo para este investimento fosse o de cauda mais pesada, e de 4, 65%, se o modelo verdadeiro fosse o de cauda mais leve..

(33) 19. 3. Distribui¸coes ˜ Infladas de Zeros (ZID). ˜ pr´aticas, e´ comum encontrar uma grande quantidade de zeros Em v´arias situac¸oes nos conjuntos de dados. Esses zeros excessivos dificultam a elaborac¸a˜ o de uma an´alise estat´ıstica precisa para o problema, j´a que os modelos usuais desenvolvidos n˜ao ajustam bem tal situac¸a˜ o. E´ importante pesquisar quais s˜ao as origens desses zeros. Martin et al. (2005), ressalta que o valor zero pode acontecer de quatro maneiras diferentes: ´ duas delas podem ser definidas como zeros verdadeiros e duas como aleatorios ou falsos. Os zeros verdadeiros podem estar relacionados com a pouqu´ıssima frequˆencia de ocorrˆencia do evento. Outra situac¸a˜ o considerada como zero verdadeiro e´ quando re´ almente no local n˜ao havia nenhum indiv´ıduo presente. Os zeros aleatorios ou falsos podem ser resultado de erros de amostragem ou um v´ıcio visual, ou seja, no contexto de vari´aveis de contagens a pessoa existe, ocupa o local, mas n˜ao estava presente durante a realizac¸a˜ o da pesquisa ou o elemento ocupa o local, est´a presente, mas o pesquisador n˜ao conseguiu encontr´a-lo. Quando existe uma incerteza sobre a origem das ˜ ˜ truncadas. observac¸oes, uma alternativa bastante utilizada e´ a de distribuic¸oes A produc¸a˜ o dos zeros excessivos nas amostras podem ser classificadas de duas formas. Na primeira, o excesso de zeros e´ resultado da superdispers˜ao, ou seja, a variˆancia dos dados e´ maior que a assumida pelo modelo (Paula, 2004). Na segunda forma o ex˜ distintas que podem estar relacionadas a` cesso de zeros e´ formado por subpopulac¸oes alguma intervenc¸a˜ o natural ou truncamento nos dados. Uma metodologia eficaz na modelagem destes dados com zeros excessivos e´ a mis˜ Zero Inflacionadas (ZID). As distribuic¸oes ˜ tura de modelos, atrav´es das Distribuic¸oes infladas de zeros requerem a definic¸a˜ o de uma distribuic¸a˜ o espec´ıfica para o modelo dos dados, caso n˜ao existisse zeros excessivos, e uma outra distribuic¸a˜ o degenerada no ponto zero, Rodrigues (2003)..

(34) 20. 3.1. Numero ´ Excessivo de Zeros. Em muitos estudos, nas an´alises de dados, e´ comum encontrar uma grande quantidade de zero, dificultando assim na elaborac¸a˜ o de uma an´alise estat´ıstica precisa para o problema, j´a que os modelos usuais desenvolvidos n˜ao ajustam bem tal situac¸a˜ o. Segundo Martin et al. (2005) o valor zero acontece de quatro modos, dois podem ser ´ definidos como zeros verdadeiros e dois como falsos (aleatorios), sendo que o primeiro tipo de zero verdadeiro aparece de uma baixa frequˆencia de ocorrˆencia ou ser o resultado de um efeito que conduz para locais que n˜ao tem nenhum indiv´ıduo presente. ´ como por exemplo, o numero de faltas de funcion´arios em uma determinada empresa durante um per´ıodo de tempo, neste caso, o excesso de zeros significa que os empregados faltam pouco ao servic¸o. A segunda situac¸a˜ o considerada como zero verdadeiro e´ quando realmente no local ˜ que envolvem estudos n˜ao havia nenhum evento presente. Podemos citar as aplicac¸oes ˜ pluviom´etricas, pois, ao analisarmos as precipitac¸oes ˜ di´arias de chude precipitac¸oes ˜ com clima a´ rido, percebe-se o baixo registro de chuvas, vas, em determinadas regioes ´ ou seja, apresenta um grande numero de zeros, devido ao clima da regi˜ao. ´ O primeiro tipo de zeros falsos (ou aleatorios) e´ resultado de erros de amostragem, ou seja, o indiv´ıduo existe, ocupa o local, mas n˜ao estava presente durante a realizac¸a˜ o da pesquisa, por exemplo, se o objetivo e´ quantificar de forma r´apida a esp´ecie, e ela n˜ao se encontra temporariamente neste local, ent˜ao, sua ausˆencia temporal se tornar´a um zero falso, a esp´ecie existe no local, mas, n˜ao estava presente na hora da inspec¸a˜ o. Ou ent˜ao a esp´ecie estava presente no momento da inspec¸a˜ o, mas o pesquisador n˜ao conseguiu encontr´a-lo, configurando-se em um erro visual, neste ´ caso, a segunda situac¸a˜ o de zeros falsos (ou aleatorios), Rodrigues (2003).. ˜ A Tabela 1 apresenta um resumo sobre os tipos de zeros e suas respectivas definic¸oes. (Fonte: Martin et al. (2005)).. Pela Tabela 1 percebemos que, num banco de dados podem aparecer diversos tipos de zeros. Pode n˜ao ter zeros inflacionados, ou ter zeros inflacionados causados por zeros verdadeiros, ou causados por zeros falsos, ou at´e mesmo causados ao mesmo tempo por zeros verdadeiros e falsos..

(35) 21. Tipos de Zeros. Defini¸ca˜ o. Zeros Verdadeiros. 1. Baixa frequˆencia de ocorrˆencia; 2. Quando realmente n˜ao existe nenhum indiv´ıduo presente.. Zeros Falsos ´ (ou Aleatorios). 1. Apesar de existir, ocupar o local, n˜ao estava presente na hora da pesquisa; 2. Acontece quando ocupa o local e est´a presente na hora de amostrar, mas o pesquisador n˜ao encontra.. Tabela 1: Tipos de Zeros em Conjuntos de Dados. A Tabela 2 apresenta alguns cen´arios sobre a origem dos zeros nos dados e a modelagem recomendada para solucionar os excessos. (Fonte: Martin et al. (2005)).. Zeros Inflacionados. Modelagem Apropriada. Sem Inflac¸a˜ o de Zeros. Modelos Espec´ıficos aos Dados. Zeros Verdadeiros. Misturas de Modelos Distribuic¸a˜ o Zeros Inflacionadas. Zeros Falsos ´ (ou Aleatorios). Misturas de Modelos Distribuic¸a˜ o Zeros Inflacionadas. Combinac¸a˜ o de Ambos. ˜ Mistura de duas ou mais distribuic¸oes. Incerteza da Origem. ˜ Truncadas Distribuic¸oes. Tabela 2: Cen´arios sobre a origem de zero nos dados e a modelagem recomendada. De acordo com a Tabela 2, quando os dados n˜ao possuem zeros inflacionados, pode-se model´a-los somente pela distribuic¸a˜ o que melhor se adequar a eles. J´a quando ´ os dados possuem excessos de zeros, verdadeiros ou aleatorios, ou excesso de zeros verdadeiros e falsos, e´ recomend´avel o uso de mistura de modelos. O procedimento seria atribuir uma distribuic¸a˜ o degenerada no ponto zero e uma outra distribuic¸a˜ o es˜ Quando pec´ıfica para os dados, considerando uma m´edia ponderadas das distribuic¸oes. n˜ao e´ poss´ıvel distinguir a origem dos zeros dados, utiliza-se uma distribuic¸a˜ o trun-.

(36) 22. cada, uma alternativa comum que elimina os zeros e modela somente as ocorrˆencias, (Silva, Deise D., 2009).. 3.1.1. Classifica¸ca˜ o dos Zeros Inflacionados. O surgimento dos zeros inflacionados nos dados, tanto zeros verdadeiros como ´ ˜ distintas. zeros aleatorios s˜ao classificadas como superdispers˜ao ou subpopulac¸oes Segundo Echavarr´ıa (2004), dado uma suposic¸a˜ o de distribuic¸a˜ o para os dados temos superdispers˜ao se a variˆancia observada dos dados e´ maior que a variˆancia suposta pelo modelo. A superdispers˜ao pode ser causada por heterogeneidade ou por excesso de zeros na contagem. Na primeira situac¸a˜ o, a heterogeneidade pode ser devido a alguma covari´avel que n˜ao foi quantificada. Na segunda situac¸a˜ o, o excesso de zeros tamb´em produz a superdispers˜ao (Paula, 2004). O excesso de zeros em um conjunto de dados tamb´em podem estar relacionados a` alguma intervenc¸a˜ o natural ou truncamento dos dados, ou seja, podem ser produ˜ distintas, como por exemplo o numero ´ zidos por subpopulac¸oes de pec¸as defeituosas ´ encontradas na linha de produc¸a˜ o em que a industria possui um controle de qualidade. ´ Assim, e´ esperado o menor numero poss´ıvel de defeitos, criando uma inflac¸a˜ o de zeros nos dados. Levando em considerac¸a˜ o que s˜ao poss´ıveis os defeitos no processo de fabricac¸a˜ o, mas evit´aveis, tem-se duas origens diferentes de zeros, sendo recomendado uma modelagem de mistura de distribuic¸a˜ o para os dados, Rodrigues (2003).. 3.2. Distribui¸ca˜ o Inflada de Zeros (ZID). Para dados com zeros inflacionados, recomenda-se fortemente a utilizac¸a˜ o de mis˜ para as an´alises estat´ısticas. Murat e Szynal (1998) descreveram turas de distribuic¸oes a distribuic¸a˜ o para dados com zeros inflacionados da seguinte maneira     ω + (1 − ω ) f (y|θ ), se y = 0 P[Y = y|Θ = (θ, ω )] =    (1 − ω ) f ( y | θ ), se y 6= 0, ´ com 0 ≤ w ≤ 1, y ∈ N, em que N representa os numeros naturais.. (3.1).

(37) 23. 3.2.1. Propriedades da Distribui¸ca˜ o ZID. ˜ Apresentamos algumas propriedades importantes para estas distribuic¸oes, como, por exemplo, a sua m´edia E (Y ) =. Z ∞ y =0. y P [Y = y ] (3.2). = (1 − ω ) E ( X ). O momento de segunda ordem e´ obtido por E (Y 2 ). =. Z ∞ y =0. y 2 P [Y = y ] (3.3). = (1 − ω ) E ( X 2 ). Assim, encontramos o r-´esimo momento E (Y r ). =. Z ∞ y =0. y r P [Y = y ] (3.4). = (1 − ω ) E ( X r ). A variˆancia e´ expressa pelo resultado V (Y ) = E(Y 2 ) − [ E(Y )]2 (3.5) . = (1 − ω ) V ( X ) + ωE( X ). 2. .. O desenvolvimento destas propriedades nos mostram claramente, a relac¸a˜ o entre ˜ n˜ao degeneradas, e as distribuic¸oes ˜ inflacionadas. as distribuic¸oes. 3.2.2. Verossimilhan¸ca para a Distribui¸ca˜ o ZID. J´a vimos que para dados que possuem uma quantidade excessiva de zeros, e´ necess´ario utilizar misturas de modelos, pois, modelam bem os zeros inflacionados dos.

(38) 24. dados. (Rodrigues, 2003). Para tanto, temos ( p [Y = y | Θ = θ ] =. I{s} (y),. se y = 0. f ( y | θ ),. se y 6= 0,. (3.6). em que a func¸a˜ o indicadora I{s} (y) e´ uma distribuic¸a˜ o que est´a degenerada em zero e f (y|θ ) e´ uma func¸a˜ o de probabilidade condicional de Y dado θ. ˜ atribuiremos os seguintes pesos. Para a construc¸a˜ o da mistura de distribuic¸oes Y 0 y. Peso (P) ω (1-ω). ˜ Tabela 3: Mistura de Distribuic¸oes para 0 ≤ ω ≤ 1, conduzindo a seguinte distribuic¸a˜ o inflado de zero (ZID). p[Y = y|Θ = (θ, ω )] = ωI{0} (y) + (1 − ω ) f (y|θ ), y = 0, 1, 2, ..... (3.7). em que, f (y|θ ) e´ uma distribuic¸a˜ o adequadas aos dados caso n˜ao existisse inflado de zeros, e o parˆametro ω e´ a proporc¸a˜ o de zeros. Seja A o conjunto dos valores yi iguais a zero, Y = (Y1 , ..., Yn ) um vetor de n v.a.’s com uma distribuic¸a˜ o ZID, ou seja, A = {yi : yi = 0} e m a quantidade de zeros, isto e´ , m = n( A). Logo, a func¸a˜ o de verossimilhanc¸a e´ dada por n. L(θ, ω ) =. ∏ p(yi |θ, ω ) i =1. (3.8). = [ω + (1 − ω ) f (0|θ )]m (1 − ω )n−m. ∏. f ( y i | θ ),. yi ∈ A. ´ em que os elementos de A, tanto podem ser zeros verdadeiros como zeros aleatorios..

(39) 25. 4. Inferˆencia Bayesiana. ˜ x, cujos vaA inferˆencia Bayesiana e´ desenvolvida num conjunto de observac¸oes lores s˜ao expressos por uma densidade f ( x |θ ), em que θ representa o(s) parˆametro(s) ˜ em estudo. Por exemplo, no caso da distribuic¸a˜ o GEV temos que, θ = das distribuic¸oes. {µ, σ, ξ }. Esta an´alise considera que o conhecimento do pesquisador possa ser incorporado na an´alise, ajudando a explicar o comportamento da populac¸a˜ o. Esta informac¸a˜ o inicial pode ser incorporada em uma densidade p(θ ), que n˜ao necessariamente precisa ser uma informac¸a˜ o muito precisa. Com a func¸a˜ o de verossimilhanc¸a e a distribuic¸a˜ o a priori, podemos estimar o comportamento dos parˆametros atrav´es da distribuic¸a˜ o encontrada, conhecida como distribuic¸a˜ o a posteriori, dada por: π ( θ ) ∝ L ( θ ) p ( θ ), em que L(θ ) e´ a func¸a˜ o de verossimilhanc¸a e p(θ ) a distribuic¸a˜ o a posteriori.. 4.1. Estimadores Bayesianos (EB). Assim como na abordagem cl´assica ou frequentista de estimac¸a˜ o, a abordagem ˜ x, cujos Bayesiana tamb´em e´ desenvolvida na presenc¸a de um conjunto de observac¸oes valores s˜ao descritos por uma densidade ou func¸a˜ o de probabilidade f ( x |θ ), sendo θ ˜ o(s) parˆametro(s) em estudo das distribuic¸oes. Na inferˆencia Bayesiana considera-se que o pesquisador tenha conhecimento sobre o comportamento dos parˆametros em estudo, e este conhecimento possa ser incorporado na an´alise, com distribuic¸a˜ o a priori e func¸a˜ o densidade de probabilidade p(θ ), ajudando a explicar o comportamento da populac¸a˜ o (Nascimento, 2012)..

(40) 26. O estimador de Bayes e´ encontrado a partir do risco de Bayes do procedimento d( X) r ( p, d) =. Z Θ. R(θ − d( x )) p(θ )dθ.. Sendo que a func¸a˜ o de risco de um procedimento qualquer d( X ) e´ dada por R(θ, d( x )) =. Z. l (θ, d( x )) f ( x |θ )dx, χ. e considerando a func¸a˜ o da perda quadr´atica l (θ, d( x )) = (θ − d( x ))2 , temos que R(θ, d( x )) =. Z. (θ − d( x ))2 f ( x |θ )dx. χ. Ent˜ao, o risco de Bayes com relac¸a˜ o a perda quadr´atica e´ dado por r ( p, d) =. Z Z Θ. (d( x ) − θ )2 f ( x |θ ) p(θ )dxdθ. χ. Como f ( x |θ ) p(θ ) = f ( x; θ ) = p(θ | x ) f ( x ), logo, r ( p, d) =. Z Z χ. 2. Θ. . (d( x ) − θ ) p(θ | x )dθ f ( x )dx.. (4.1). Assim temos que, para cada x, o procedimento de Bayes e´ o procedimento que minimiza (4.1) Z Θ. (d( x ) − θ )2 p(θ | x )dθ = E[(d( X ) − θ )2 | X ].. Derivando a func¸a˜ o com relac¸a˜ o a d(X) e igualando a derivada a zero, encontramos o procedimento d B ( X ) = E [ θ | X ],. que e´ a forma geral do estimador de Bayes, para o parˆametro θ com relac¸a˜ o a perda ˜ de decisoes, ˜ ´ quadr´atica, na classe D de todas as func¸oes de uma amostra aleatoria.

(41) 27. ´ { x1 , . . . , xn } da distribuic¸a˜ o da vari´avel aleatoria { X1 , . . . , X N }, com func¸a˜ o de densidade de probabilidade f ( x |θ ), e com distribuic¸a˜ o a priori p(θ ) , sendo o valor da esperanc¸a de θ dado X, calculado na, combinac¸a˜ o da func¸a˜ o de verossimilhanc¸a com a distribuic¸a˜ o a priori que e´ a, distribuic¸a˜ o a posteriori de θ dada por. p(θ | x ) =. f (θ; x ) f (θ | x ) p(θ ) = . f (x) f (x). (4.2). em que f (θ; x ) e´ a densidade conjunta de X1 , . . . , Xn e θ obtida pela multiplicac¸a˜ o das duas densidades f (θ | x ) p(θ ). Note que 1/ f ( x ), n˜ao Zdepende de θ, funciona como uma constante normalizadora de p(θ | x ), em que f ( x ) =. Θ. f (θ | x ) p(θ )dθ, e´ a densidade (ou. func¸a˜ o de probabilidade) marginal de x, e tamb´em conhecida como distribuic¸a˜ o pren. ditiva, sendo que f ( x |θ ) = a amostra.. ∏ f (xi |θ ), e´ a func¸a˜ o de verossimilhanc¸a correspondente i =1. Uma maneira mais compacta de escrever a func¸a˜ o a posteriori e´ dada por p ( θ | x ) ∝ f ( θ | x ) p ( θ ), ´ pois, para encontrar a distribuic¸a˜ o a posteriori precisamos conhecer apenas o nucleo da distribuic¸a˜ o, que e´ representada pela parte que depende de θ na func¸a˜ o em (4.3). ´ A distribuic¸a˜ o a posteriori e´ uma distribuic¸a˜ o onde o parˆametro e´ a vari´avel aleatoria, onde o estimador pontual do parˆametro e´ a m´edia, ou a mediana e o intervalo de confianc¸a (1 − α) para o parˆametro s˜ao os quantis α/2 e (1 − α/2). ˜ a distribuic¸a˜ o a posteriori e´ uma distribuic¸a˜ o conhecida, em Em algumas situac¸oes outras, n˜ao e´ poss´ıvel obter uma distribuic¸a˜ o a posteriori conhecida, sendo necess´ario ˜ num´ericas, e nesses casos utiliza-se as t´ecnicas MCMC (Markov obter aproximac¸oes ˜ chain Monte Carlo) que gera pontos da distribuic¸a˜ o a posteriori baseado em distribuic¸oes condicionais conhecidas como cadeias de Markov.. 4.2. Inferˆencia Bayesiana para Distribui¸coes ˜ ZID. De acordo com o modelo (3.13), pode-se propor uma priori conjunta dada por π (θ, w) e a posteriori conjunta (θ, w), dado D e´ :.

(42) 28. π (θ, w| D ) ∝ L(θ, w| D )π (θ, w),. em que, π (θ, w) = π (w)π (θ ). Para melhorar modelagem se faz necess´ario formular o excesso de zeros apresen˜ tados pelos dados. Rodrigues (2003) menciona que existem muitas formulac¸oes, e sugeriu a seguinte,. Pr ( X = x |Θ = θ ) =.     I{0} ( x ), se x = 0    p( x |θ ), se x > 0. em que: • I{0} ( x ) e´ uma distribuic¸a˜ o degenerada no ponto zero, • p( x |θ ) e´ uma func¸a˜ o de probabilidade que se ajusta aos dados. ˜ Muitos autores utilizam mistura de distribuic¸oes, pois incorporam o excesso de zeros apresentados pelos dados. Para isto, considere peso w ao evento 0 e peso (1 − w) a θ, valores diferentes de zeros, sendo 0 ≤ w ≤ 1, resultando na seguinte Distribuic¸a˜ o de Inflados de Zero (ZID):. P( x |θ, w) = wI{0} ( x ) + (1 − w) p( x |θ ).. O parˆametro w e´ a proporc¸a˜ o de zeros que excede o que seria predito atrav´es de p ( x | θ ). ´ Seja X = ( X1 , ..., Xn ) um vetor de n vari´aveis aleatorias geradas pelo modelo ZID. Seja A = yi : yi = 0, i = 1, ..., n e m = n( A), ent˜ao a func¸a˜ o de verossimilhanc¸a e´ : L(θ, w) = [w + (1 − w) p(0|θ )]m (1 − w)n−m. ∏. p ( x i | θ ).. xi 6 ∈ A. Os elementos de A prov´em da distribuic¸a˜ o degenerada de zero..

Referências

Documentos relacionados

Os resultados são apresentados de acordo com as categorias que compõem cada um dos questionários utilizados para o estudo. Constatou-se que dos oito estudantes, seis

Num primeiro momento, as informações levantadas para a descrição do caso dizem respeito às práticas de gestão do trabalho pedagógico que têm logrado o

O “tempo necessário” para as atividades complementares foi definido no tópico “Objetivos e Metas”, no qual apresentou duas metas referentes ao eixo da jornada de

A agenda de atividades pode ser considerada um dos instrumentos que contribuem para o sucesso ou fracasso da proposta de disseminação dos resultados. Essa é

De acordo com o Consed (2011), o cursista deve ter em mente os pressupostos básicos que sustentam a formulação do Progestão, tanto do ponto de vista do gerenciamento

Esta ação consistirá em duas etapas. Este grupo deverá ser composto pela gestora, pelo pedagogo e ou coordenador pedagógico e um professor por disciplina

• Analisar como são implementadas as estratégias de marketing na Universidade Luterana do Brasil - Ulbra; • Verificar como é utilizado o esporte nas estratégias de marketing da

dois gestores, pelo fato deles serem os mais indicados para avaliarem administrativamente a articulação entre o ensino médio e a educação profissional, bem como a estruturação