AJUSTE DE UM MODELO DE POISSON GENERALIZADO A
DADOS METEOROLÓGICOS: ASPECTOS TEORICOS
AIRTON FONTENELE SAMPAIO XAVIER (*)
TERESINHA DE MARIA BEZERRA S. XAVIER (*)
RESUMO Discutimos, neste trabalho, aspectos teóricos li-gados ao problema do ajustamento de um modelo de Poisson generalizado a dados meteorológicos / climáticos. A uma famí lia de leis obedecendo a esse modelo, foi possível assQ ciar um processo pontual Quase-poissoniano. O estudo das especificações diferencial e axiomática de tal processo,
a-bre uma via para a obtenção de modelos mais gerais. 1. INTRODUÇÃO
Em trabalho anterior [ Xavier
&
Xavier (1990)] tivemos a o-portunidade de testar a aplicabilidade de uma lei de Poisson gene-ralizada [ Goralsk; (1977), Cammilleri (1981) ] para a modelagem de dados de contagem de interesse nas areas de Meteorologia e Cli-matologia, comparativamente ao desempenho de leis clássicas ( Pois son, binomial e binomial negativa ).Tal lei generalizada depende de dois parametros, À
>
O e C>
>
o.
Para C=
1, reduz-se ao modelo clássico de Poisson, com E[X]=
Var[X]=
À. Para C>
1 ,tem-se E[X]>
Var[X], caso em Que ela compete, vantajosamente, com a lei binomial negativa. Fi-nalmente, seO
<
C<
1 ,tem-se E[X]<
Var[X], caso em Que comp~te com a lei binomial.
Neste artigo, estudamos vários aspectos teóricos Que haviam sido negligenciados nos trabalhos de Goralski e de Cammilleri tais como: (i) para Quais valores dos parâmetros À e C a lei é bem definida? ; (ii) condições a respeito da média e variância a-mostrais, permitindo o ajuste do modelo. Por outro lado, mostra_ mos Que esta lei pode ser deduzida de um particular sistema infini to de equações diferenciais, o Qual constitui a "especificação di-ferencial" de um processo pontual "Quase-poissoniano".
(*) Pesquisadores Associados, CNPQ / Depto. de Ciências Atmosféricas - IAG - USP
2. DEFINIÇÃO ~ AJUSTE DO MODELO
A lei de Poisson generalizada considerada por Goralski (1977) e por Cammilleri (1981) possui, como densidade ( discreta)
[1] f(x) = Prob(X=x) = { 1 - (1-e-ÀC)/c x-1 \x -X.C/ I C I\.
e
x.
sex=o
se x=1,2, ... ; sua f.g.p. (função geradora de probabilidades) sendo dada por:[2] g(s) = E[SX] = 1 - {1 - eXP[-ÀC(1-S)]}C-1 a partir de onde calculamos:
[3] E[X]
=
g'(1)=
À ;[4] Var[X] = 9"(1)+9'(1)-[9'(1)]2 = À [1-À(1-C)] .
A
vantagem de seu uso é de se poder tratar, simultaneamente, o ajuste com respeito a qualquer uma das três alternativas possi-ve i s : 2 (i) m ~ v ; (i i) m>>
v ; ( i i i ) m<<
v ( onde m = x e v = S , isto é, média e variância amostrais). Observemos que, de ordinário, ensaia-se ajustar em cada uma dessas situações: (i) alei clássica de Poisson; (ii) a lei binomial B(n,p) (escolhendo n de sorte que todas as frequencias observadas sejam nulas para i
>
>
n); (i i i) a lei binomial negativa (ou outra "lei de contágio"). Faz-se necessário lembrar a existência de outras leis genera-lizadas encontradas na literatura que nos conduzem, contudo, a uma "modelização assimétrica", ou seja, no sentido de poderem ser tratados, em conjunto: ou as situações (i)+(ii) [ caso da lei de Dacey (1964)] ou (i)+(iii) [ caso do modelo generalizado propo§ to por Feller (1943) ].No decorrer de aplicações da lei de Goralski e Cammilleri [Xavier
&
Xavier (1990)] comparativamente ao desempenho de outras leis clássicas, fomos conduzidos à análise de algumas questões, tanto de ordem prática como teórica, as quais não haviam sido con-sideradas nem por Goralski (op. cit.) e tampouco por Cammilleri(op.
c
i t. ) .Em primeiro lugar é preciso assinalar que, de fato, essa lei acha-se mal definida para certos pares (À,C) dos parâmetros. Com efeito, se definirmos À = ~(C) = -ln(1-C)/C no plano (C,À),
se-gue-se, com respeito à densidade dada por [1]
[6] f(O)
<
O se e só seo
<
C<
1 e À>
~(C) •Portanto, [5] permite-nos observar que a lei acha-se "truncada na origem", se O
<
C<
1 e ~ = ~(C). Por outro lado, devido a [6], encontra-se mal definida quando O<
C<
1 e À>
~(C).k
Para uma amostra (x
1,x2, ••• ,xk) E IN , de média m = x e va-nancia v = S2, o "método dos momentos" nos fornece como primei-ras estimativas para os parâmetros À
>
O e C>
O[7]
1
= m [8]ê
= 1 - (11m) + (v/m2 )-1 2
Combinando [6],[7] e [8], e pondo v = ~(m) = m - [1-~ (m)]m - 2
no plano (m,v) = (x,S), pode-se concluir que na região:
[9] v
<
\jI(m)não se obtem um ajuste válido para a lei de Goralski e Cammilleri. Decerto, sabe-se que o método dos momentos pode conduzir a es-timadores não eficazes. Contudo, é o único método que se presta a considerações de ordem analitica, em particular, para obter a re-gião definida por [9] e que se relaciona com a condição [6]. Por outro lado, o "método da máxima-verossimilança" conduz a um siste-ma de equações lineares impossivel de ser resolvido analiticamen-te. Uma alternativa é, portanto, empregar as estimativas obtidas por intermédio do método dos momentos como coordenadas de um pon to inicial". Assim, a inicialização de um algoritmo a partir desse ponto conduzirá, por técnicas puramente numéricas, às estimativas de máxima verossimilhança (ou a outras estimativas, como as de mi-nimo-Chi2). Evidentemente, se o ponto inicial (m,v) = (X,S2) encontrar-se na região interdita definida por [9], pode-se usar o ponto (m ,v) mais próximo de (m,v) , satisfazendo v =~(m ),
o o o o
como o ponto de inicialização do algorítmo.
,
3. OUTROS ASPECTOS TEORICOS
Cammilleri (1981) havia pensado relacionar a lei de Poisson generalizada, cuja densidade é dada por [1], ao conhecido sistema de equações diferenciais definido por :
[10] {
p~(t)
=
p' (t)=
n - À P (t)o
Àp ( t ) - ) \ . p ( t )n-i
n
se n ~ 1Contudo, a partir dessas equações (com as condições iniclals p (0)=1 e p (0)=0, se n ~ 1) ele se limitou a obter a solução
o n
[ 11] p (t)
=
(Xt)n exp(-Àt) / n! n ~ Otrata-se de algo intei n n-:(
=
C f(n)=
p ( t ) , com t=
c , se ndo calculado por complementaridade. Porém, ramente artificial e não interpretável. como seria de esperar.
Que de [11] obter-se-ia Para, em seguida, [1], pondo: f(1) 1 imi tar-se
=
p (t) , 1 n>
1 ; e a observar com t=
f(O) senDe fato, conseguimos mostrar Que a fami lia de leis de Poisson generalizadas [12] P (t)
=
nf
1 - [1 - exp (-À-Ct)] / C n n-1l
(Xt) C exp(-ÀCt) / n! se n=
O se n ~ 1 asatisfaz ao sistema infinito de equações diferenciais de 1 ordem: - ÀC
P
(t) + À(C-1) o - ~C p (t) + X( C-1 ) 1 [13 ] p' (t)=
o p' (t)=
i p' (t)=
n À-C P (t) o ÀC P (t) - À-C P (t) n-l n se n ~ 2Tal sistema constitui a "especificação diferencial" de um pro-cesso "Quase-poissoniano" , não estacionário, Que possui proprieda-des interessantes. Em particular, se 0<C<1, o processo deve ser encarado em "horizonte finito" [O,t], onde t
=
-ln(1-C)/4C .o o
Por outro lado, deve-se também mencionar Que Goralski (1977) havia intentado deduzir sua lei generalizada a partir de um parti-cular modelo de provas consecutivas, porém desnecessariamente com plexo, para não se dizer ininteligível. Assim, construimos um mo-delo bastante simples ( com a intervenção de duas urnas) a partir do Qual se constata, facilmente, Que tal lei generalizada se reduz
à composição da lei clássica de Poisson com uma distribuição de probabilidades concentrada na origem.
4. CONCLUSÃO
Já haviamos mostrado [Xavier
&
Xavier (1990)] Que a lei de Poisson generalizada de Goralski (1977) e de Cammilleri (1981) presta-se à modelagem de eventos raros de interesse para aplica-ções em Meteorologia e Climatologia, competindo vantajosamente na maioria dos casos estudados, com as leis clássicas. Posteriormen te também comparamos seu desempenho, com respeito ao da lei de Dacey (1964), nos casos em Que O < C < 1 .Publ. Inst. No presente trabalho, tratamos de vários aspectos teóricos e também práticos, no que concerne ao ajuste do modelo.
Finalmente, os estudos por nós iniciados sobre as propriedades de um processo pontual "quase-poissoniano", não estacionário, assQ ciado à fami lia [12] de leis de Poisson generalizadas, em termos da sua "especificação diferencial" e da correspondente "especificª ção axiomática" (axiomas quase-Poisson) abrem uma via para a gera-ção e análise de outros modelos, mais gerais.
Esta última possibilidade é de grande interesse pois a lei generalizada de Goralski e de Cammilleri, conforme nos foi possí-vel mostrar, constitui ainda uma generalização de caráter particu lar, isto é, no sentido de resultar da composição de uma lei clás-sica de Poisson com uma distribuição de probabilidades concentrada na origem.
5. BIBLIOGRAFIA
Cammilleri,
º
(1981), Une Généralisation de la Courbe de Pois-son, Publ. Inst. Statist. Univ. Paris, Vol. XXVII, Fasc. 2,pp. 17-28 .
Dacey, M.F. (1964), Modified Poisson Probebility Law for Point Pattern more Regular than Random, Annals Assoc. American Geographers, Vol. 54, pp. 559-565 .
Feller,~. (1943), On a General Class of "Contagious"
Distri-butions, The Annals of Math. Stat., Vol. 14, pp. 384-400 . Goralski, A. (1977), Distribution Z-Poisson,
Statist. Univ. Paris, Vol. XXII, pp. 45-54 .
Xavier, T. de Ma.ª.ª.
&
Xavier, A.E.ª. (1990), Modelo de Pois-son Generalizado: Aplicações em Meteorologia, Anais doYl
Congr. Bras. Meteorol., Vol. 1, pp. 220-224 .
Xavier,
I.
de Ma.ª.S.&
Xavier, A.E.ª. (1991), Modelo de Pois-son Generalizado: Aplicações em Meteorologia e Climatologia[ versão estendida da comunicação precedente, 27 págs. submetida para publicação] .