• Nenhum resultado encontrado

Occurrence and quantity of precipitation can be modelled simultaneously. Peter K. Dunn Autor Braga Junior e Eduardo Gomes Apresentação

N/A
N/A
Protected

Academic year: 2021

Share "Occurrence and quantity of precipitation can be modelled simultaneously. Peter K. Dunn Autor Braga Junior e Eduardo Gomes Apresentação"

Copied!
44
0
0

Texto

(1)

Occurrence and quantity of precipitation

can be modelled simultaneously

Peter K. Dunn

Autor

Braga Junior e Eduardo Gomes

Apresentação

(2)

Introdução

Introdução

Estudos sobre modelagem da precipitação de chuvas são importantes, pois permitem um melhor entedimento sobre erosão e transporte de poluentes, por exemplo.

Podemos pensar na precipitação de duas formas: ⇒Quantidade de chuva que cai

⇒Número de dias com chuva

(3)

Introdução

Introdução

Estudos sobre modelagem da precipitação de chuvas são importantes, pois permitem um melhor entedimento sobre erosão e transporte de poluentes, por exemplo.

Podemos pensar na precipitação de duas formas: ⇒Quantidade de chuva que cai

(4)

Introdução

Introdução

Para algumas aplicações é necessário entender o número de eventos de chuva em um dado dia e a intensidade da precipitação em cada dia.

Uma diculdade com a modelagem da precipitação é que ela é contínua com zeros exatos.

(5)

Introdução

Introdução

Para algumas aplicações é necessário entender o número de eventos de chuva em um dado dia e a intensidade da precipitação em cada dia.

Uma diculdade com a modelagem da precipitação é que ela é contínua com zeros exatos.

(6)

Introdução

Enfoques correntes para modelagem da precipitação

MODELOS PARA DIAS DE CHUVA

A modelagem para os dias de chuva tem sido baseada em cadeias de Markov. O mais simples tem dois estados (chuva e não-chuva) e é de primeira ordem (a probabilidade de chuva depende somente do período anterior).

Para cadeias de Markov de primeira ordem, a duração dos períodos de seca e chuva tem sido modelado usando uma distribuição Geométrica.

(7)

Introdução

Enfoques correntes para modelagem da precipitação

MODELOS PARA DIAS DE CHUVA

A modelagem para os dias de chuva tem sido baseada em cadeias de Markov. O mais simples tem dois estados (chuva e não-chuva) e é de primeira ordem (a probabilidade de chuva depende somente do período anterior).

Para cadeias de Markov de primeira ordem, a duração dos períodos de seca e chuva tem sido modelado usando uma distribuição Geométrica.

(8)

Introdução

Enfoques correntes para modelagem da precipitação

MODELOS PARA DIAS DE CHUVA

Feuerverger(1979) usou um modelo de regressção logística para a probabilidade de precipitação.

Chandler e Wheater(2002) usou um modelo linear generalizado com base na binomial.

(9)

Introdução

Enfoques correntes para modelagem da precipitação

MODELOS PARA DIAS DE CHUVA

Feuerverger(1979) usou um modelo de regressção logística para a probabilidade de precipitação.

Chandler e Wheater(2002) usou um modelo linear generalizado com base na binomial.

(10)

Introdução

Enfoques correntes para modelagem da precipitação

MODELOS PARA QUANTIDADE DE CHUVA

Devido a precipitação ser geralmente bastante assimétrica à direita, distribuições como a Gama e Exponencial são utilizadas nessa modelagem.

Chapman(1998) comenta que a distribuição Normal

Assimétrica foi usada por Nicks e Lane(1989), e a distribuição Weibull usada por Zucchini e Adamson(1984).

A mais comumente usada, entretanto, é a distribuição Gama. Allan e Hoan(1975), por exemplo, usou um caso especial da distribuição Gama (a Exponencial) para modelar a

precipitação.

(11)

Introdução

Enfoques correntes para modelagem da precipitação

MODELOS PARA QUANTIDADE DE CHUVA

Devido a precipitação ser geralmente bastante assimétrica à direita, distribuições como a Gama e Exponencial são utilizadas nessa modelagem.

Chapman(1998) comenta que a distribuição Normal

Assimétrica foi usada por Nicks e Lane(1989), e a distribuição Weibull usada por Zucchini e Adamson(1984).

A mais comumente usada, entretanto, é a distribuição Gama. Allan e Hoan(1975), por exemplo, usou um caso especial da distribuição Gama (a Exponencial) para modelar a

(12)

Introdução

Enfoques correntes para modelagem da precipitação

MODELOS PARA QUANTIDADE DE CHUVA

A suposição de mesma distribuição pode ser relaxada. Alguns pesquisadores têm usado diferentes distribuições Gama, dependendo se choveu ou não no dia anterior. Outros pesquisadores têm usado 3 distribuições Gama diferentes:

(i) Um dia so com chuva;

(ii) Uma para o primeiro dia de dias com chuva;

(iii) Um para os dias subsequentes com chuva;

(13)

Introdução

Enfoques correntes para modelagem da precipitação

MODELOS PARA QUANTIDADE DE CHUVA

A suposição de mesma distribuição pode ser relaxada. Alguns pesquisadores têm usado diferentes distribuições Gama, dependendo se choveu ou não no dia anterior. Outros pesquisadores têm usado 3 distribuições Gama diferentes: (i) Um dia so com chuva;

(ii) Uma para o primeiro dia de dias com chuva; (iii) Um para os dias subsequentes com chuva;

(14)

Introdução

Enfoques correntes para modelagem da precipitação

MODELOS PARA QUANTIDADE DE CHUVA

A suposição de mesma distribuição pode ser relaxada. Alguns pesquisadores têm usado diferentes distribuições Gama, dependendo se choveu ou não no dia anterior. Outros pesquisadores têm usado 3 distribuições Gama diferentes: (i) Um dia so com chuva;

(ii) Uma para o primeiro dia de dias com chuva;

(iii) Um para os dias subsequentes com chuva;

(15)

Introdução

Enfoques correntes para modelagem da precipitação

MODELOS PARA QUANTIDADE DE CHUVA

A suposição de mesma distribuição pode ser relaxada. Alguns pesquisadores têm usado diferentes distribuições Gama, dependendo se choveu ou não no dia anterior. Outros pesquisadores têm usado 3 distribuições Gama diferentes: (i) Um dia so com chuva;

(ii) Uma para o primeiro dia de dias com chuva; (iii) Um para os dias subsequentes com chuva;

(16)

Introdução

Enfoques correntes para modelagem da precipitação

MODELOS PARA QUANTIDADE DE CHUVA

A suposição de mesma distribuição pode ser relaxada. Alguns pesquisadores têm usado diferentes distribuições Gama, dependendo se choveu ou não no dia anterior. Outros pesquisadores têm usado 3 distribuições Gama diferentes: (i) Um dia so com chuva;

(ii) Uma para o primeiro dia de dias com chuva; (iii) Um para os dias subsequentes com chuva;

(17)

Introdução

Enfoques correntes para modelagem da precipitação

MODELOS PARA QUANTIDADE DE CHUVA

Para todos esses modelos não é incomum que os parâmetros variem ao longo do ano. Isto pode ser modelado usando diferentes parâmetros para cada mês ou estação.

(18)

Modelo Tweedie

O Modelo de Tweedie

3- O MODELO DE TWEEDIE

Assuma que qualquer evento i de precipitação resulta em uma quantidade de precipitação Ri, e que cada Ri tem uma

distribuição Gama Gam(−α, γ). (Nessa parametrização a média é −αγ e a variância −αγ2).

Assuma que o número de eventos, N, de precipitação em um dia qualquer como tendo uma distribuição de Poisson. O total de precipitação diária Y pode ser encontrada como uma soma de Poisson das variáveis aleatórias Gama, tal que

Y = R1+R2+ · · · +RN

onde N tem uma distribuição de Poisson com média λ. Braga Junior e Eduardo Gomes Seminário

(19)

Modelo Tweedie

O Modelo de Tweedie

3- O MODELO DE TWEEDIE

Assuma que qualquer evento i de precipitação resulta em uma quantidade de precipitação Ri, e que cada Ri tem uma

distribuição Gama Gam(−α, γ). (Nessa parametrização a média é −αγ e a variância −αγ2).

Assuma que o número de eventos, N, de precipitação em um dia qualquer como tendo uma distribuição de Poisson. O total de precipitação diária Y pode ser encontrada como uma soma de Poisson das variáveis aleatórias Gama, tal que

Y = R1+R2+ · · · +RN

(20)

Modelo Tweedie

O Modelo de Tweedie

Um argumento idêntico pode ser aplicado para precipitação mensal, quando Ri poderia referir à precipitação registrada em

um dia qualquer e Y é o total de precipitação mensal.

A distribuição da precipitação total Y pode ser deduzida trabalhando com funções de cumulantes gerais e notando que Y dado N tem distribuição Gama, Gam(−Nα, γ).

A distribuição resultante tem sido chamada de Poisson Composta (Feller, 1968; Bar-lev and Stramer, 1987; Jorgensen and Paes de Souza, 1994; Smyth and Jorgensen, 1999), Gama Composta (Johnson and Kotz, 1970) ou Poisson-Gama (Smyth, 1996).

(21)

Modelo Tweedie

O Modelo de Tweedie

Um argumento idêntico pode ser aplicado para precipitação mensal, quando Ri poderia referir à precipitação registrada em

um dia qualquer e Y é o total de precipitação mensal. A distribuição da precipitação total Y pode ser deduzida trabalhando com funções de cumulantes gerais e notando que Y dado N tem distribuição Gama, Gam(−Nα, γ).

A distribuição resultante tem sido chamada de Poisson Composta (Feller, 1968; Bar-lev and Stramer, 1987; Jorgensen and Paes de Souza, 1994; Smyth and Jorgensen, 1999), Gama Composta (Johnson and Kotz, 1970) ou Poisson-Gama (Smyth, 1996).

(22)

Modelo Tweedie

O Modelo de Tweedie

Um argumento idêntico pode ser aplicado para precipitação mensal, quando Ri poderia referir à precipitação registrada em

um dia qualquer e Y é o total de precipitação mensal. A distribuição da precipitação total Y pode ser deduzida trabalhando com funções de cumulantes gerais e notando que Y dado N tem distribuição Gama, Gam(−Nα, γ).

A distribuição resultante tem sido chamada de Poisson Composta (Feller, 1968; Bar-lev and Stramer, 1987; Jorgensen and Paes de Souza, 1994; Smyth and Jorgensen, 1999), Gama Composta (Johnson and Kotz, 1970) ou Poisson-Gama (Smyth, 1996).

(23)

Modelo Tweedie

O Modelo de Tweedie

A função de probabilidade resultante é complicada e pode ser escrita como:

logfp(y; µ, φ) = −λ, para y = 0 = −y

γ − λ −logy + logW (y, φ, p), para y > 0 onde γ = φ(p − 1)µp−1, λ = µ2−p φ(2−p) e W (y, φ, p) = P∞ j=1 y −(p−1)αj φj(1−α)(2−p)jj!Γ(−jα) onde α = (2 − p)/(1 − p).

(24)

Modelo Tweedie

O Modelo de Tweedie

A função de probabilidade resultante é complicada e pode ser escrita como:

logfp(y; µ, φ) = −λ, para y = 0 = −y

γ − λ −logy + logW (y, φ, p), para y > 0 onde γ = φ(p − 1)µp−1, λ = µ2−p φ(2−p) e W (y, φ, p) = P∞ j=1 y −(p−1)αj φj(1−α)(2−p)jj!Γ(−jα) onde α = (2 − p)/(1 − p).

(25)

Modelo Tweedie

O Modelo de Tweedie

A média da distribuição é µ e a variância é φµp. Nessa

formula, 1 < p < 2 é o índice que determina qual distribuição Poisson-Gama é usada.

Importante: A probabilidade de não registrar uma precipitação é dada por

P(Y = 0) = exp(−λ) = exp "

− µ2−p φ(2 − p)

(26)

Modelo Tweedie

O Modelo de Tweedie

A média da distribuição é µ e a variância é φµp. Nessa

formula, 1 < p < 2 é o índice que determina qual distribuição Poisson-Gama é usada.

Importante: A probabilidade de não registrar uma precipitação é dada por

P(Y = 0) = exp(−λ) = exp "

− µ2−p φ(2 − p)

#

(27)

Modelo Tweedie

O Modelo de Tweedie

As distribuições Poisson-Gama fazem parte de uma classe de distribuições conhecida como família Tweedie de distribuições. Essas distribuições têm variância na forma Var(Y ) = φµp para

p /∈ (0, 1). Para 1 < p < 2, as distribuições têm suporte em números não-negativos e a distribuição é a Poisson-Gama ja apresentada. Quando p → 1, as probabilidades são dadas pela distribuição Poisson. Quando p → 2, a distribuição tende para a Gama.

(28)

Modelo Tweedie

O Modelo de Tweedie

A gura mostra a função de

den-sidade de algumas distribuições Tweedie para vários valores de p.

(29)

Modelo Tweedie

O Modelo de Tweedie

Matematicamente, as distribuições são melhores analisadas usando a parametrização (µ, φ, p). Contudo,

climatologicamente a parametrização em termos de (λ, γ, α) são mais úteis. Nessa parametrização, λ refere o número médio de eventos de precipitação por mês, γ refere a forma dos eventos de precipitação e −αγ refere a quantidade média de precipitação por evento.

(30)

Modelo Tweedie

O Modelo de Tweedie

Propriedades importantes que fazem dela atraente para utilização na modelagem de precipitação:

⇒Estas distribuições pertecem à família exponencial, sob a qual os modelos lineares generelizados estão baseados. Consequentemente, existem metodologias disponíveis para ajustar modelos baseados na distribuição Tweedie e para testes de diagnóstico. Além disso, covariáveis podem ser

incorporadas no procedimento de modelagem.

(31)

Modelo Tweedie

O Modelo de Tweedie

Propriedades importantes que fazem dela atraente para utilização na modelagem de precipitação:

⇒Estas distribuições pertecem à família exponencial, sob a qual os modelos lineares generelizados estão baseados. Consequentemente, existem metodologias disponíveis para ajustar modelos baseados na distribuição Tweedie e para testes de diagnóstico. Além disso, covariáveis podem ser

(32)

Estimação

Estimação

A família Tweedie tem 3 parâmetros. São eles µ (a média), φ (o parâmetro de dispersão) e p. No contexto dos modelos lineares generalizados, µ corresponde aos valores preditos e pode ser estimado usando algoritmos padrão. Como não estamos utilizando covariáveis, µ pode ser estimado pela média amostral.

(33)

Estimação

Estimação

A estimação de máxima verossimilhança de φ é mais difícil; algoritmos complicados estão disponíveis para a estimação de máxima verossimilhança de φ. No paper é utilizada a

(34)

Estimação

Estimação

A estimação de máxima verossimilhança de p é feita usando um gráco da log-verossimilhança perlada, no qual requer a computação da verossimilhança. Para um dado valor xo de p, estimativas de µ e φ podem ser computadas como falamos anteriormente e a log-verossimilhança computada. O valor de p em que a log-verossimilhança é máxima é escolhida como o valor de máxima verossimilhança.

(35)

Aplicação

Flexibilidade da familia Tweedie

Uma das principais características da Distribuição tweedie é sua exibilidade. Nas seguintes guras são apresentadas algumas das diferentes formas que sua função de densidade pode assumir:

(36)

Aplicação

Figura 2: Formas de densidades da família tweedie

Nos casos em que o parâmetro p está no intervalo (1, 2), note que no ponto y = 0 existe um ponto de massa representando uma probabilidade positiva de ocorrência de zero.

(37)

Aplicação

Exemplo 1

O primeiro exemplo trata de dados de precipitação mensal em Chaterville na Australia no periíodo de 1882 a 1994.

Considera-se que para um determinado mês, a precipitação total Y pode ser descrita por uma distribuição Poisson resultante da soma de variáveis aleatótias com distribuição gamma, tal que:

Y = R1+R2+ ... +RN

(38)

Aplicação

Neste caso distribuição Tweedie pode ser utilizada, considerando duas parametrizações de interesse:

(µ, φ,p) em que µ e φ são os parâmetros usuais das distribuições da família exponencial e p é o parâmetro especico da distribuição Tweedie,

(λ, γ, α)em que λ é o número médio de eventos de chuva, γ é parametro de forma dos eventos de chuva e −αγ é a quantidade média de chuva por evento.

Vale notar que as interpretações referentes à segunda

parametrização são válidas apenas nos casos em que 1 < p < 2, ou seja existe a ocorrência de zeros nos dados.

(39)

Aplicação

No conjunto de dados, para cada mês tem-se 113 observações de Y , sendo que existem diversos zeros, salvo para os meses de Novembro, Dezembro e Janeiro que apresentaram chuva em todos os anos observados.

(40)

Aplicação

Exemplo 2

Neste exemplo são considerados dados de precipitação diária dos meses de Abril em Melbourne, Australia, no período de 1981 a 1990.

O banco de dados consiste de 300 observações, sendo destas 197 iguais a zero, representando dias sem chuva.

O banco de dados está disponível na internet e o exemplo foi reproduzido utilizando os pacotes (tweedie) e (statmod).

(41)

Aplicação

Figura 3: Estimação do parâmetro p

O gráco apresenta o perl de verossimilhança do parâmetro p. Os parâmetros (µ, φ) são estimados pelo método de máxima

verossimilhança, e com as estimativas obtidas calcula-se o valor da função de verossimilhança para diversos valores de p, buscando um valor de p que maximize a função. No exemplo em questão, o valor

(42)

Aplicação

Uma análise de resíduos é utilizada para vericar o ajuste do modelo adotado aos dados. No exemplo são utilizados os resíduos quantis aleatorizados (Dunn e Smyth 1996).

Figura 4: QQ-plot dos resíduos quantis aleatorizados

(43)

Aplicação

Inclusão de covariáveis

No artigo apresentado os modelos ajustados não incorporam covariáveis. A utilização das mesmas é da forma convencional atravéz da função glm, em que para a família tweedie precisa de argumento adicional que xa o parâmetro p

Em (Smyth e Jorgensen 2002) é apresentado um exemplo da utilização da distribuição Tweedie em modelos lineares

generalizados com adição de covariáveis no modelo. Neste caso os autores utilizam um contexto que chamam de MLG duplos, em que tanto a média quanto a disperção são modeladas no enfoque de MLG.

(44)

Aplicação

Referências

Dunn PK, Smyth GK. 1996 Randomized quantile residuals. Journal of Computational and Graphical Statistics 5: 236-244.

Smyth GK, Jorgesen B. 1994. Fitting Tweedies compound Poisson model to insurance claims data: dispersion modeling. Proceedings of the 52nd Session of the International Statistical Institute. 68.

Dunn PK. 2004. Occurence and quantity of precipitation can be modelled simultaneously. International journal of climatology 24: 1231-1239. Smyth GK. 1996. Regression analysis of quantity data with exact zeros. In Proceedings of the Second AustraliaJapan Workshop on Stochastic Models in Engineering, Technology and Management,

Technology Management Centre, University of Queensland; 572580.

Referências

Documentos relacionados

Até meus 15 anos eu era um cara normal , com minhas namoradinhas de escola , porem aos 15 cai numa forte depressão ao me apaixonar por uma garota que também gostava de mim , porem

Por vezes, o localizador necessita de alterar não só o texto como também possíveis imagens ou a forma como estas são apresentadas, sendo o exemplo mais óbvio o caso de

Local de realização da avaliação: Centro de Aperfeiçoamento dos Profissionais da Educação - EAPE , endereço : SGAS 907 - Brasília/DF. Estamos à disposição

Reconhecimento de face utilizando banco de imagens monocromáticas e coloridas através dos métodos da análise do componente principal (PCA) e da Rede Neural Artificial (RNA)

O modelo depois de seco fica muito mais claro e o facto de continuar a aplicar tapa poros não o escurece consegue-se sim uma dureza desejável que permite um bom polimento antes

Gridi-Papp (5), Foram calculadas as distâncias taxonõmicas, baseadas em sete caracteres de folha, bráctea e flor (5), entre as plantas de três populações constituídas por 8

Como eles não são caracteres que possam ser impressos normalmente com a função print(), então utilizamos alguns comandos simples para utilizá-los em modo texto 2.. Outros

São utilizados igualmente para a sistematização e socialização dos conteúdos, nos quais os estudantes têm oportunidades para trocar experiências e saberes,