• Nenhum resultado encontrado

Aplicação da regressão ponderada geograficamente para determinação

3 PROCEDIMENTOS METODOLÓGICOS PARA A AVALIAÇÃO DE

3.5 ESTUDOS DE REGIONALIZAÇÃO HIDROLÓGICA

3.5.3 Proposta de elaboração de mapa de dados distribuídos de Vazão Média

3.5.3.4 Aplicação da regressão ponderada geograficamente para determinação

A regressão ponderada geograficamente (Geographically Weighted Regression - GWR) proposta por Fotheringham et al. (2002) foi aplicada na regionalização de vazão média

de longo período no sentido de comparar os resultados obtidos com os resultados obtidos da equação empírica

̅

̅

A vantagem metodológica da utilização de um método robusto de regressão multivariada de dados para regionalização que utiliza um fator espacial (FOTHERINGHAM et al., 2002; CÂMARA et al., 2002; DRUCK et al. 2004) é aplicação do mesmo método por análises complexas com o conhecimento imediato dos resíduos para cada localidade da bacia hidrográfica, e não somente do rio estudado. Esse método pode ser aplicado a outras bacias hidrográficas brasileiras que possuam as variáveis estudadas nesse trabalho. O conhecimento das incertezas da predição das vazões em toda a bacia hidrográfica pode facilitar a tomada de decisão dos planejadores do setor elétrico e da comunidade interessada no sentido de avançar nos estudos para determinação mais acurada das vazões para viabilidade do potencial. Para avaliação da capacidade do método de regionalizar a variável dependente Qmlp foram utilizados somente os dados de entrada das localidades que simulam as estações fluviométricas da ANA. No caso em estudo foram utilizados 161 locais com Qmlp conhecidas.

Os dados das variáveis independentes estão distribuídos em toda a bacia hidrográfica em modelos matriciais. Foram simuladas várias composições para a adequada escolha das variáveis independentes na aplicação do método GWR. Inicialmente foram avaliadas por ajustes dos mínimos quadrados (Ordinary Least Squares – OLS) as maiores correlações entre as variáveis utilizadas. Confirmou-se a tendência das maiores correlações das variáveis apontarem para as indicadas por TUCCI (2002). Porém, verificou-se que a inserção de outras variáveis ao modelo, desde que cumprindo os requisitos verificação da colinearidade (MITCHELL, 2005), em algumas situações, aumentou levemente a correlação geral ajustada do modelo (R2 Ajustado), sem prejuízo relevante ao tempo de processamento do modelo. Porém, somente a elevação do coeficiente de ajuste do modelo pode indicar uma falsa impressão de melhoria do modelo. Os aumentos de desempenho dos modelos somente serão verificados com os resultados dos indicadores gerais do modelo GWR, orientados pelos parâmetros da Tabela 3.7.

No sentido de definir outras variáveis para aumento do desempenho do modelo de regressão, foram inseridas para as predições de vazões mínimas, as variáveis de comprimento do rio a montante e precipitação do trimestre mais seco. No modelo de predição da vazão máxima foi utilizada a variável de precipitação do trimestre mais chuvoso do AMBData.

Para melhor aplicação do modelo GWR verifica-se a relevância da densidade de informações conhecidas de Qmlp, a necessidade de ajuste dos métodos e parâmetros da largura de banda (“bandwidth”) em função da disposição espacial da variável dependente, a verificação de ocorrências de colinearidades que impedem o

processamento do modelo, os coeficientes de correlações locais e correlações gerais modelo e os desvios padrões dos resíduos.

Tabela 3.7: Nomenclatura adotada para o relatório de sumário estatístico do modelo GWR.

Modelo / Parâmetro Nomenclatura

Largura de Banda Número de vizinhanças utilizadas para cada local da estimativa. Controla o grau de suavização do modelo. Pode ser aplicada uma função Kernel fixa ou variável em função de um número específico de vizinhanças. Os métodos ACC corrigido e Validação Cruzada – CV (―Cross Validation‖), utilizados na largura de banda, aplicam uma ótima distância fixa ou um ótimo número de vizinhanças.

Resíduos ao Quadrado Soma dos quadrados das diferenças entre valores observados e valores estimados calculados pelo GWR.

Número Efetivo de Vizinhanças Reflete a troca da variância entre os valores ajustados e o desvio no coeficiente de estimativa. Está relacionada também à escolha da largura de banda. O número efetivo é utilizado para avaliar as mensurações em relação ao número de observações.

Sigma Raiz quadrada da soma dos quadrados dos resíduos

normalizados

AICc Medida de desempenho de um modelo usada para

comparar diferentes modelos de regressão. É um método para determinar o melhor ajuste dos dados observados. Comparando o valor de AICc do GWR com o ajuste do modelo de regressão global por dos mínimos quadrados – OLS, é possível verificar os benefícios da regressão local sobre a regressão global.

R2 É a medida de correlação ou do ajuste do modelo. O

denominador é a soma dos quadrados dos valores das variáveis dependentes enquanto o numerador é a soma dos quadrados dos resíduos, que calcula a parte que não é explicada pelo modelo. O valor varia de 0 a 1, de forma que quanto maior mais a variável dependente é explicada pelas variáveis independentes (regressores/preditoras)

R2 Ajustado É medida de ajustada do modelo considerando os valores os valores normalizados do numerador e denominador por seus graus de liberdade. Esse valor penaliza a inclusão de regressores pouco explicativos.

Variável Dependente Variável utilizada para regionalização Variável Independente (1 a n) Variáveis preditoras do modelo de regressão Fonte: Fotheringham et al. (2002) e Mitchell (2005).

Ao final um relatório do sumário estatístico do modelo é apresentado em conjunto com os parâmetros adotados. O mesmo procedimento foi utilizado para avaliação dos resultados da aplicação do modelo GWR para vazões extremas. A nomenclatura do resumo estatístico do modelo GWR está apresentada na Tabela 3.7.

Para todos os modelos foram utilizados o tipo de Kernel fixo. Para método da largura de banda foi utilizado o Akaike Information Criterion – AICc (AKAIKE, 1973; GASSER e MIILLER, 1979; HURVICH e TSAI, 1991) devido os melhores ajustes das combinações das variáveis com os resultados.

Foram definidas como variáveis independentes do modelo de regressão a área de drenagem da bacia a montante e a precipitação média anual, conforme orientações em Tucci (2002) descritos na Tabela 3.6.

A Figura 3.24 apresenta a localização geográfica da variável independente de precipitação média anual nas sub-bacias e a Figura 3.25 representa a área de drenagem a montante da bacia. A precipitação média anual para séries históricas superiores a 25 anos foi obtida do AMBData do INPE60.

Figura 3.24. Informações de Precipitação Média Anual. Fonte: AMBData/INPE.

Figura 3.25. Informações distribuídas de área de drenagem a montante.

3.5.4 Proposta de elaboração de mapa de dados distribuídos de vazão máxima