Occurrence and quantity of precipitation
can be modelled simultaneously
Peter K. Dunn
Autor
Braga Junior e Eduardo Gomes
Apresentação
Introdução
Introdução
Estudos sobre modelagem da precipitação de chuvas são importantes, pois permitem um melhor entedimento sobre erosão e transporte de poluentes, por exemplo.
Podemos pensar na precipitação de duas formas: ⇒Quantidade de chuva que cai
⇒Número de dias com chuva
Introdução
Introdução
Estudos sobre modelagem da precipitação de chuvas são importantes, pois permitem um melhor entedimento sobre erosão e transporte de poluentes, por exemplo.
Podemos pensar na precipitação de duas formas: ⇒Quantidade de chuva que cai
Introdução
Introdução
Para algumas aplicações é necessário entender o número de eventos de chuva em um dado dia e a intensidade da precipitação em cada dia.
Uma diculdade com a modelagem da precipitação é que ela é contínua com zeros exatos.
Introdução
Introdução
Para algumas aplicações é necessário entender o número de eventos de chuva em um dado dia e a intensidade da precipitação em cada dia.
Uma diculdade com a modelagem da precipitação é que ela é contínua com zeros exatos.
Introdução
Enfoques correntes para modelagem da precipitação
MODELOS PARA DIAS DE CHUVA
A modelagem para os dias de chuva tem sido baseada em cadeias de Markov. O mais simples tem dois estados (chuva e não-chuva) e é de primeira ordem (a probabilidade de chuva depende somente do período anterior).
Para cadeias de Markov de primeira ordem, a duração dos períodos de seca e chuva tem sido modelado usando uma distribuição Geométrica.
Introdução
Enfoques correntes para modelagem da precipitação
MODELOS PARA DIAS DE CHUVA
A modelagem para os dias de chuva tem sido baseada em cadeias de Markov. O mais simples tem dois estados (chuva e não-chuva) e é de primeira ordem (a probabilidade de chuva depende somente do período anterior).
Para cadeias de Markov de primeira ordem, a duração dos períodos de seca e chuva tem sido modelado usando uma distribuição Geométrica.
Introdução
Enfoques correntes para modelagem da precipitação
MODELOS PARA DIAS DE CHUVA
Feuerverger(1979) usou um modelo de regressção logística para a probabilidade de precipitação.
Chandler e Wheater(2002) usou um modelo linear generalizado com base na binomial.
Introdução
Enfoques correntes para modelagem da precipitação
MODELOS PARA DIAS DE CHUVA
Feuerverger(1979) usou um modelo de regressção logística para a probabilidade de precipitação.
Chandler e Wheater(2002) usou um modelo linear generalizado com base na binomial.
Introdução
Enfoques correntes para modelagem da precipitação
MODELOS PARA QUANTIDADE DE CHUVA
Devido a precipitação ser geralmente bastante assimétrica à direita, distribuições como a Gama e Exponencial são utilizadas nessa modelagem.
Chapman(1998) comenta que a distribuição Normal
Assimétrica foi usada por Nicks e Lane(1989), e a distribuição Weibull usada por Zucchini e Adamson(1984).
A mais comumente usada, entretanto, é a distribuição Gama. Allan e Hoan(1975), por exemplo, usou um caso especial da distribuição Gama (a Exponencial) para modelar a
precipitação.
Introdução
Enfoques correntes para modelagem da precipitação
MODELOS PARA QUANTIDADE DE CHUVA
Devido a precipitação ser geralmente bastante assimétrica à direita, distribuições como a Gama e Exponencial são utilizadas nessa modelagem.
Chapman(1998) comenta que a distribuição Normal
Assimétrica foi usada por Nicks e Lane(1989), e a distribuição Weibull usada por Zucchini e Adamson(1984).
A mais comumente usada, entretanto, é a distribuição Gama. Allan e Hoan(1975), por exemplo, usou um caso especial da distribuição Gama (a Exponencial) para modelar a
Introdução
Enfoques correntes para modelagem da precipitação
MODELOS PARA QUANTIDADE DE CHUVA
A suposição de mesma distribuição pode ser relaxada. Alguns pesquisadores têm usado diferentes distribuições Gama, dependendo se choveu ou não no dia anterior. Outros pesquisadores têm usado 3 distribuições Gama diferentes:
(i) Um dia so com chuva;
(ii) Uma para o primeiro dia de dias com chuva;
(iii) Um para os dias subsequentes com chuva;
Introdução
Enfoques correntes para modelagem da precipitação
MODELOS PARA QUANTIDADE DE CHUVA
A suposição de mesma distribuição pode ser relaxada. Alguns pesquisadores têm usado diferentes distribuições Gama, dependendo se choveu ou não no dia anterior. Outros pesquisadores têm usado 3 distribuições Gama diferentes: (i) Um dia so com chuva;
(ii) Uma para o primeiro dia de dias com chuva; (iii) Um para os dias subsequentes com chuva;
Introdução
Enfoques correntes para modelagem da precipitação
MODELOS PARA QUANTIDADE DE CHUVA
A suposição de mesma distribuição pode ser relaxada. Alguns pesquisadores têm usado diferentes distribuições Gama, dependendo se choveu ou não no dia anterior. Outros pesquisadores têm usado 3 distribuições Gama diferentes: (i) Um dia so com chuva;
(ii) Uma para o primeiro dia de dias com chuva;
(iii) Um para os dias subsequentes com chuva;
Introdução
Enfoques correntes para modelagem da precipitação
MODELOS PARA QUANTIDADE DE CHUVA
A suposição de mesma distribuição pode ser relaxada. Alguns pesquisadores têm usado diferentes distribuições Gama, dependendo se choveu ou não no dia anterior. Outros pesquisadores têm usado 3 distribuições Gama diferentes: (i) Um dia so com chuva;
(ii) Uma para o primeiro dia de dias com chuva; (iii) Um para os dias subsequentes com chuva;
Introdução
Enfoques correntes para modelagem da precipitação
MODELOS PARA QUANTIDADE DE CHUVA
A suposição de mesma distribuição pode ser relaxada. Alguns pesquisadores têm usado diferentes distribuições Gama, dependendo se choveu ou não no dia anterior. Outros pesquisadores têm usado 3 distribuições Gama diferentes: (i) Um dia so com chuva;
(ii) Uma para o primeiro dia de dias com chuva; (iii) Um para os dias subsequentes com chuva;
Introdução
Enfoques correntes para modelagem da precipitação
MODELOS PARA QUANTIDADE DE CHUVA
Para todos esses modelos não é incomum que os parâmetros variem ao longo do ano. Isto pode ser modelado usando diferentes parâmetros para cada mês ou estação.
Modelo Tweedie
O Modelo de Tweedie
3- O MODELO DE TWEEDIE
Assuma que qualquer evento i de precipitação resulta em uma quantidade de precipitação Ri, e que cada Ri tem uma
distribuição Gama Gam(−α, γ). (Nessa parametrização a média é −αγ e a variância −αγ2).
Assuma que o número de eventos, N, de precipitação em um dia qualquer como tendo uma distribuição de Poisson. O total de precipitação diária Y pode ser encontrada como uma soma de Poisson das variáveis aleatórias Gama, tal que
Y = R1+R2+ · · · +RN
onde N tem uma distribuição de Poisson com média λ. Braga Junior e Eduardo Gomes Seminário
Modelo Tweedie
O Modelo de Tweedie
3- O MODELO DE TWEEDIE
Assuma que qualquer evento i de precipitação resulta em uma quantidade de precipitação Ri, e que cada Ri tem uma
distribuição Gama Gam(−α, γ). (Nessa parametrização a média é −αγ e a variância −αγ2).
Assuma que o número de eventos, N, de precipitação em um dia qualquer como tendo uma distribuição de Poisson. O total de precipitação diária Y pode ser encontrada como uma soma de Poisson das variáveis aleatórias Gama, tal que
Y = R1+R2+ · · · +RN
Modelo Tweedie
O Modelo de Tweedie
Um argumento idêntico pode ser aplicado para precipitação mensal, quando Ri poderia referir à precipitação registrada em
um dia qualquer e Y é o total de precipitação mensal.
A distribuição da precipitação total Y pode ser deduzida trabalhando com funções de cumulantes gerais e notando que Y dado N tem distribuição Gama, Gam(−Nα, γ).
A distribuição resultante tem sido chamada de Poisson Composta (Feller, 1968; Bar-lev and Stramer, 1987; Jorgensen and Paes de Souza, 1994; Smyth and Jorgensen, 1999), Gama Composta (Johnson and Kotz, 1970) ou Poisson-Gama (Smyth, 1996).
Modelo Tweedie
O Modelo de Tweedie
Um argumento idêntico pode ser aplicado para precipitação mensal, quando Ri poderia referir à precipitação registrada em
um dia qualquer e Y é o total de precipitação mensal. A distribuição da precipitação total Y pode ser deduzida trabalhando com funções de cumulantes gerais e notando que Y dado N tem distribuição Gama, Gam(−Nα, γ).
A distribuição resultante tem sido chamada de Poisson Composta (Feller, 1968; Bar-lev and Stramer, 1987; Jorgensen and Paes de Souza, 1994; Smyth and Jorgensen, 1999), Gama Composta (Johnson and Kotz, 1970) ou Poisson-Gama (Smyth, 1996).
Modelo Tweedie
O Modelo de Tweedie
Um argumento idêntico pode ser aplicado para precipitação mensal, quando Ri poderia referir à precipitação registrada em
um dia qualquer e Y é o total de precipitação mensal. A distribuição da precipitação total Y pode ser deduzida trabalhando com funções de cumulantes gerais e notando que Y dado N tem distribuição Gama, Gam(−Nα, γ).
A distribuição resultante tem sido chamada de Poisson Composta (Feller, 1968; Bar-lev and Stramer, 1987; Jorgensen and Paes de Souza, 1994; Smyth and Jorgensen, 1999), Gama Composta (Johnson and Kotz, 1970) ou Poisson-Gama (Smyth, 1996).
Modelo Tweedie
O Modelo de Tweedie
A função de probabilidade resultante é complicada e pode ser escrita como:
logfp(y; µ, φ) = −λ, para y = 0 = −y
γ − λ −logy + logW (y, φ, p), para y > 0 onde γ = φ(p − 1)µp−1, λ = µ2−p φ(2−p) e W (y, φ, p) = P∞ j=1 y −jα(p−1)αj φj(1−α)(2−p)jj!Γ(−jα) onde α = (2 − p)/(1 − p).
Modelo Tweedie
O Modelo de Tweedie
A função de probabilidade resultante é complicada e pode ser escrita como:
logfp(y; µ, φ) = −λ, para y = 0 = −y
γ − λ −logy + logW (y, φ, p), para y > 0 onde γ = φ(p − 1)µp−1, λ = µ2−p φ(2−p) e W (y, φ, p) = P∞ j=1 y −jα(p−1)αj φj(1−α)(2−p)jj!Γ(−jα) onde α = (2 − p)/(1 − p).
Modelo Tweedie
O Modelo de Tweedie
A média da distribuição é µ e a variância é φµp. Nessa
formula, 1 < p < 2 é o índice que determina qual distribuição Poisson-Gama é usada.
Importante: A probabilidade de não registrar uma precipitação é dada por
P(Y = 0) = exp(−λ) = exp "
− µ2−p φ(2 − p)
Modelo Tweedie
O Modelo de Tweedie
A média da distribuição é µ e a variância é φµp. Nessa
formula, 1 < p < 2 é o índice que determina qual distribuição Poisson-Gama é usada.
Importante: A probabilidade de não registrar uma precipitação é dada por
P(Y = 0) = exp(−λ) = exp "
− µ2−p φ(2 − p)
#
Modelo Tweedie
O Modelo de Tweedie
As distribuições Poisson-Gama fazem parte de uma classe de distribuições conhecida como família Tweedie de distribuições. Essas distribuições têm variância na forma Var(Y ) = φµp para
p /∈ (0, 1). Para 1 < p < 2, as distribuições têm suporte em números não-negativos e a distribuição é a Poisson-Gama ja apresentada. Quando p → 1, as probabilidades são dadas pela distribuição Poisson. Quando p → 2, a distribuição tende para a Gama.
Modelo Tweedie
O Modelo de Tweedie
A gura mostra a função de
den-sidade de algumas distribuições Tweedie para vários valores de p.
Modelo Tweedie
O Modelo de Tweedie
Matematicamente, as distribuições são melhores analisadas usando a parametrização (µ, φ, p). Contudo,
climatologicamente a parametrização em termos de (λ, γ, α) são mais úteis. Nessa parametrização, λ refere o número médio de eventos de precipitação por mês, γ refere a forma dos eventos de precipitação e −αγ refere a quantidade média de precipitação por evento.
Modelo Tweedie
O Modelo de Tweedie
Propriedades importantes que fazem dela atraente para utilização na modelagem de precipitação:
⇒Estas distribuições pertecem à família exponencial, sob a qual os modelos lineares generelizados estão baseados. Consequentemente, existem metodologias disponíveis para ajustar modelos baseados na distribuição Tweedie e para testes de diagnóstico. Além disso, covariáveis podem ser
incorporadas no procedimento de modelagem.
Modelo Tweedie
O Modelo de Tweedie
Propriedades importantes que fazem dela atraente para utilização na modelagem de precipitação:
⇒Estas distribuições pertecem à família exponencial, sob a qual os modelos lineares generelizados estão baseados. Consequentemente, existem metodologias disponíveis para ajustar modelos baseados na distribuição Tweedie e para testes de diagnóstico. Além disso, covariáveis podem ser
Estimação
Estimação
A família Tweedie tem 3 parâmetros. São eles µ (a média), φ (o parâmetro de dispersão) e p. No contexto dos modelos lineares generalizados, µ corresponde aos valores preditos e pode ser estimado usando algoritmos padrão. Como não estamos utilizando covariáveis, µ pode ser estimado pela média amostral.
Estimação
Estimação
A estimação de máxima verossimilhança de φ é mais difícil; algoritmos complicados estão disponíveis para a estimação de máxima verossimilhança de φ. No paper é utilizada a
Estimação
Estimação
A estimação de máxima verossimilhança de p é feita usando um gráco da log-verossimilhança perlada, no qual requer a computação da verossimilhança. Para um dado valor xo de p, estimativas de µ e φ podem ser computadas como falamos anteriormente e a log-verossimilhança computada. O valor de p em que a log-verossimilhança é máxima é escolhida como o valor de máxima verossimilhança.
Aplicação
Flexibilidade da familia Tweedie
Uma das principais características da Distribuição tweedie é sua exibilidade. Nas seguintes guras são apresentadas algumas das diferentes formas que sua função de densidade pode assumir:
Aplicação
Figura 2: Formas de densidades da família tweedie
Nos casos em que o parâmetro p está no intervalo (1, 2), note que no ponto y = 0 existe um ponto de massa representando uma probabilidade positiva de ocorrência de zero.
Aplicação
Exemplo 1
O primeiro exemplo trata de dados de precipitação mensal em Chaterville na Australia no periíodo de 1882 a 1994.
Considera-se que para um determinado mês, a precipitação total Y pode ser descrita por uma distribuição Poisson resultante da soma de variáveis aleatótias com distribuição gamma, tal que:
Y = R1+R2+ ... +RN
Aplicação
Neste caso distribuição Tweedie pode ser utilizada, considerando duas parametrizações de interesse:
(µ, φ,p) em que µ e φ são os parâmetros usuais das distribuições da família exponencial e p é o parâmetro especico da distribuição Tweedie,
(λ, γ, α)em que λ é o número médio de eventos de chuva, γ é parametro de forma dos eventos de chuva e −αγ é a quantidade média de chuva por evento.
Vale notar que as interpretações referentes à segunda
parametrização são válidas apenas nos casos em que 1 < p < 2, ou seja existe a ocorrência de zeros nos dados.
Aplicação
No conjunto de dados, para cada mês tem-se 113 observações de Y , sendo que existem diversos zeros, salvo para os meses de Novembro, Dezembro e Janeiro que apresentaram chuva em todos os anos observados.
Aplicação
Exemplo 2
Neste exemplo são considerados dados de precipitação diária dos meses de Abril em Melbourne, Australia, no período de 1981 a 1990.
O banco de dados consiste de 300 observações, sendo destas 197 iguais a zero, representando dias sem chuva.
O banco de dados está disponível na internet e o exemplo foi reproduzido utilizando os pacotes (tweedie) e (statmod).
Aplicação
Figura 3: Estimação do parâmetro p
O gráco apresenta o perl de verossimilhança do parâmetro p. Os parâmetros (µ, φ) são estimados pelo método de máxima
verossimilhança, e com as estimativas obtidas calcula-se o valor da função de verossimilhança para diversos valores de p, buscando um valor de p que maximize a função. No exemplo em questão, o valor
Aplicação
Uma análise de resíduos é utilizada para vericar o ajuste do modelo adotado aos dados. No exemplo são utilizados os resíduos quantis aleatorizados (Dunn e Smyth 1996).
Figura 4: QQ-plot dos resíduos quantis aleatorizados
Aplicação
Inclusão de covariáveis
No artigo apresentado os modelos ajustados não incorporam covariáveis. A utilização das mesmas é da forma convencional atravéz da função glm, em que para a família tweedie precisa de argumento adicional que xa o parâmetro p
Em (Smyth e Jorgensen 2002) é apresentado um exemplo da utilização da distribuição Tweedie em modelos lineares
generalizados com adição de covariáveis no modelo. Neste caso os autores utilizam um contexto que chamam de MLG duplos, em que tanto a média quanto a disperção são modeladas no enfoque de MLG.
Aplicação
Referências
Dunn PK, Smyth GK. 1996 Randomized quantile residuals. Journal of Computational and Graphical Statistics 5: 236-244.
Smyth GK, Jorgesen B. 1994. Fitting Tweedies compound Poisson model to insurance claims data: dispersion modeling. Proceedings of the 52nd Session of the International Statistical Institute. 68.
Dunn PK. 2004. Occurence and quantity of precipitation can be modelled simultaneously. International journal of climatology 24: 1231-1239. Smyth GK. 1996. Regression analysis of quantity data with exact zeros. In Proceedings of the Second AustraliaJapan Workshop on Stochastic Models in Engineering, Technology and Management,
Technology Management Centre, University of Queensland; 572580.