• Nenhum resultado encontrado

DISTRIBUIÇÕES DE PROBABILIDADE

No documento Universidade Federal do Pará (páginas 53-59)

3 ÁREA DE ESTUDO

4.7 DISTRIBUIÇÕES DE PROBABILIDADE

As funções ou modelos de densidades de probabilidades são comumente usadas em engenharia para descrever sistemas físicos. Na área de hidrologia, esses modelos, buscam uma projeção do que ocorrerá no futuro, baseados na frequência de ocorrências passadas de chuvas e vazões. Assim, para se modelar a frequência de dados hidrológicos é preciso fazer um estudo de sua ocorrência, em que se estabelece um percentual que a variável hidrológica pode ser maior que um dado valor. Isso é chamado de frequência de excedência e pode ser obtida diretamente de uma série histórica de dados. Contudo pode- se trabalhar com a frequência de não excedência, a qual corresponde ao percentual da variável ser menor ou igual a um dado valor.

A forma mais usual de estimar as frequências observadas de uma variável é por meio da formula empírica de Weibull (Equação 4.30).

Em que i é a ordem que determinado dado ocupa; N refere-se ao tamanho da série histórica.

Com base nos estudos das frequências de ocorrência, ajusta-se uma distribuição de probabilidade, e aquela que obtiver o melhor ajuste deve ser adotada. Dentre os modelos ou funções de distribuição de probabilidade muito utilizadas em recursos hídricos, estão as distribuições: Gama, Gumbel, Normal, Weibull, Exponencial e Log- normal, as quais são apresentadas a seguir.

a) Gama

A distribuição Gama é utilizada para o ajuste de totais de chuva de períodos mensais ou menores (ASSIS et al. 1996; SILVA & ASSAD, 1998). Sua função de densidade de probabilidade (FDP) Gama, para 2 parâmetros, é dada pela Equação 4.31.

𝐹𝐷𝑃: 𝑓(𝑋) = 𝛤(𝑌)𝛽1 𝑦 𝑋𝑦−1 𝑒−𝑋𝛽 (4.31)

Em que β é dado pela Equação 4.32, e γ dado pela Equação 4.33, sendo β o parâmetro de escala, γ o parâmetro de forma, e Г(γ) a função gama do parâmetro.

𝛽 =

𝑠𝑥̅2

(4.32)

𝛾 =

𝑥̅𝑠22

(4.33)

Em que, s² a variância e 𝑥̅ a média dos valores observados. O valor de Γ pode ser encontrado em manuais de fórmulas e tabelas matemáticas.

b) Gumbel

A distribuição Gumbel é bastante aplicada a acontecimentos extremos, como por exemplo, vazões máximas anuais ou a distribuição das precipitações totais anuais (MELLO, 2013). Sua FCP de não excelência é dada pela Equação 4.34.

A qual apresenta como função de densidade de probabilidade a Equação 4.35.

𝐹𝐷𝑃: 𝑓(𝑦) = 𝛼. 𝑒{−𝛼.(𝑦−𝜇)−𝑒−𝛼(𝑦−𝜇)} (4.35)

Em que α (Equação 4.36) e µ (Equação 4.37) são os parâmetros de distribuição, sendo α, o parâmetro de escala e µ é o parâmetro de posição (localização).

𝛼 = 1,2826/𝑠 (4.36) 𝜇̅ = 𝑥̅ − 0,451. 𝑠 (4.37)

c) Normal

A distribuição Normal é utilizada para cálculo da propriedade acumulada de ocorrências totais de precipitação (HASTINGS e PEACOCK, 1975). A distribuição normal é uma distribuição de dois parâmetros. Sua função de probabilidade pode ser observada na Equação 4.38.

𝐹𝐷𝑃: 𝑓(𝑥) = 𝜎 √2𝜋1 𝑒−0,5(𝑥−𝜇𝜎 )2 (4.38)

Em que µ é a média dos valores das variáveis observadas e 𝜎 é o desvio padrão dos valores das variáveis observadas.

Definindo uma variável y = (x - µ)/σ pode ser verificado que ela tem média igual a 0 e desvio padrão igual a 1. Logo, ela distribui-se segundo a Normal (Equação 4.39).

𝐹𝐷𝑃: 𝑓(𝑌) = √2𝜋1 𝑒−0,5.𝑦² (4.39)

Essa é chamada de distribuição Normal padrão, sendo y a variável padronizada. A vantagem do estudo dessa distribuição é que qualquer distribuição normal pode ser reduzida a ela, se for efetuada a transformação de não-excedência relacionada com 𝑓(𝑥), sendo dada pela Equação 4.40.

𝐹𝐶𝑃: 𝐹(𝑌 ≤ 𝑦) = ∫𝑦√2𝜋1 𝑒−0,5.𝑦²

Em que a integração não tem solução analítica, então para seu cálculo pode ser utilizada uma aproximação numérica dada pela Equação 4.41 (TUCCI, 2012).

𝐹(𝑌 ≤ 𝑦) = 1 − 𝑓(𝑦). (𝑎1. 𝑞 + 𝑎2. 𝑞2 + 𝑎3. 𝑞³) (4.41)

Em que y corresponde aos valores da variável padronizada e os coeficientes assumem os seguintes valores 𝑎0 = 0,33267; 𝑎1 = 0,43618; 𝑎2 = 0,12017 𝑎3 = 0,93730 e 𝑞 = (1 + 𝑎0. 𝑌)−1.

d) Weibull

A distribuição de probabilidade Weibull pode ser utilizada em eventos extremos, principalmente para estudos hidrológicos, assim como a distribuição Gumbel (DUAN et al., 1998). Nesse caso, as funções cumulativas de probabilidade de não-excedência e excedência são dadas através das Equações 4.42 e 4.43 respectivamente.

𝐹𝐶𝑃: 𝑃(𝑍 ≤ 𝑧) = 1 − 𝑒−[𝑧−𝛾𝜇−𝛾]𝜆 (4.42)

𝐹𝐶𝑃: 𝑃(𝑍 ≥ 𝑧) = 𝑒−[𝜇−𝛾𝑧−𝛾]𝜆 (4.43)

Com sua função densidade de probabilidade dada pela Equação 4.44.

𝐹𝐷𝑃: 𝑓(𝑧) = [𝜇− 𝛾𝜆 ] . [𝑧− 𝛾𝜇−𝑦]𝜆−1𝑃(𝑍 ≤ 𝑧) (4.44) Os parâmetros λ, µ e γ, são obtidos pelas Equações 4.45, 4.46 e 4.47 que representam respectivamente esperança matemática, variância e assimetria populacional. 𝐸(𝑍) = 𝛾 + (µ − 𝛾) 𝛤(1 +1𝜆) (4.45) 𝑉𝐴𝑅(𝑍) = (𝜇 − 𝛾)2[𝛤 (1 +2 𝜆) − 𝛤2(1 + 1 𝜆)] (4.46) 𝐴(𝑍) = 𝛤(1+3/𝜆)−3 𝛤(1+2/𝜆)𝛤(1+1/𝜆)+2𝛤³(1+1/𝜆)[𝛤(1+2 𝜆)−𝛤2(1+1𝜆)]1,5 (4.47)

Verificando-se que a assimetria populacional depende apenas do parâmetro λ, pode-se obter uma estimativa de λ, conhecida como estimativa amostral (Equação 4.48).

1

𝜆= [ 𝐶0+ 𝐶1. 𝛼 + 𝐶2. 𝑎2+ 𝐶3. 𝑎3+ 𝐶4 . 𝑎4] (4.48)

Em que C0 = 0,2777757913, C1 = 0,3132617714, C2 = 0,057567091, C3 = -0,0013038566,

C4 = -0,0081523408; e α a estimativa amostral da assimetria, que deverá apresentar

valores entre -1,02 e 2 para validade da Equação 4.48 (TUCCI, 2012).

e) Exponencial

É uma função de distribuição que possui inúmeras aplicações, em diversas áreas do conhecimento humano e, em particular, em hidrologia. Segundo Tucci (2012), a importância da distribuição Exponencial vem de que ela, assim como outras, é definida para valores contínuos de tempo.

Sua função de Probabilidade é dada pela Equação 4.49.

𝐹𝐷𝑃: 𝑓(𝑥) = 𝑎. 𝑒−𝛼.𝑥 (4.49)

A sua FCP de não excedência pode ser calculada pela integração da Equação 4.49, resultando na Equação 4.50.

𝐹𝐶𝑃: 𝑃(𝑋 ≤ 𝑥) = ∫ 𝛼 . 𝑒𝑥 ǀ−𝛼.𝑡𝑑𝜏 = 1 − 𝑒−𝛼.𝑥

𝜏=0 (4.50)

Em que x é a variável aleatória e α o inverso da média aritmética dos valores de x observados em relação ao tempo t.

f) Log-Normal

Segundo Mello (2013), a distribuição Log-Normal com dois ou três parâmetros busca, por meio de transformação logarítmica dos dados da série histórica, aproximar os dados, que originalmente apresentam-se com distribuição de frequência assimétrica, a uma distribuição normal. A função densidade de probabilidade é dada pela Equação 4.51.

𝐹𝐷𝑃: 𝑃(𝑥) = 𝑥.𝜎1

𝑛√2𝜋 𝑒

−0,5(𝐿𝑛(𝑥)−𝜇𝑛𝜎𝑛 )2 (4.51)

Com x ≥ 0, µn , a média dos valores das variáveis observadas e σno desvio padrão dos valores das variáveis observadas, os quais podem ser calculados através das Equações 4.52 e 4.53.

𝜇𝑛 = 𝐸(𝑋𝑛) = 𝐸(𝐿𝑛(𝑋)) (4.52)

𝜎𝑛2 = 𝑉𝐴𝑅(𝑋𝑛) = 𝑉𝐴𝑅(𝐿𝑛(𝑋𝑛)) (4.53)

Em que ɳ é o coeficiente de variação dado pela Equação 4.54.

ɳ = 𝜎𝜇 = [𝑒𝜎𝑛2 − 1]1/2 (4.54)

Em que µ é a média dos logaritmos e σ é o desvio padrão dos logaritmos das variáveis observadas.

4.7.1 Teste de Aderência – Qui-quadrado

As distribuições de probabilidades foram aplicadas às séries anuais e mensais das estações pluviométricas, as quais já pertenciam a um determinada região homogênea. O Teste Qui-Quadrado é aplicado para auxiliar na seleção da melhor função de probabilidade. Neste teste é feito a comparação entre a soma do quadrado dos desvios entre as frequências observadas e simuladas e o valor obtido em tabelas.

O valor do teste Qui-Quadrado pode ser determinado através da Equação 4.55.

𝑋2 = ∑ [(𝑓0− 𝑓𝑒)2

𝑓𝑒 ] (4.55)

Em que:

fo - frequência observada (mm);

O teste do Qui-quadrado pode ser considerado como um teste de adequação, no qual, pretende-se determinar se uma dada distribuição teórica é razoável diante dos dados disponíveis. Assim pode-se realizar o teste de hipótese para verificar se:

1. Se H=0, e fo=fe, então não há associação entre os grupos; 2. Se H≠0, e fo≠fe, então há associação entre os grupos.

A tomada de decisão é dada comparando-se os valores de X² calculado e os valores de X² tabelado, assim tem-se as seguintes hipóteses:

1. Se X² calculado ≥ X² tabelado, então se rejeita a H=0, fo=fe; 2. Se X² calculado < X² tabelado, então se aceita a hipótese H=0.

A estatística deste teste é obtida por meio da tabela do Qui-quadrado (Anexo A), adotando-se o valor tabelado com base em graus de liberdade e nível de significância. Para que a distribuição de probabilidade seja considerada adequada (aceitação da hipótese nula H0), o valor X², calculado, deve ser menor que o de tabela.

4.7.2 Calibração dos Modelos de Probabilidade

Na calibração de funções de probabilidade foram feitas simulações, procurando estimar a probabilidade de ocorrência de alturas de precipitações médias anuais e mensais, das regiões homogêneas encontradas através da análise de agrupamento Fuzzy c-means. Nesta etapa, foram consideradas as séries históricas das estações de cada região homogênea e um código computacional denominado de FDP (Apêndice C), elaborado para geração das frequências de ocorrência de chuva. Assim, foram geradas as distribuições de frequência e a determinação do melhor ajuste através do teste Qui- quadrado.

4.7.3 Validação dos Modelos de Probabilidades

Nesta etapa, buscou-se avaliar o ajuste das funções de probabilidades selecionadas na calibração em estações alvo, previamente selecionadas, localizadas nas regiões homogêneas formadas, mas que não foram adotadas na etapa da calibração. Determinou- se a distribuição de frequência para as estações alvo e analisou-se o melhor ajuste, considerando o resultado gráfico e o teste do Qui-quadrado.

No documento Universidade Federal do Pará (páginas 53-59)

Documentos relacionados