• Nenhum resultado encontrado

MÉTODOS DE MINERAÇÃO DE DADOS APLICADOS À ANÁLISE DE SISTEMAS CLIMÁTICOS

N/A
N/A
Protected

Academic year: 2021

Share "MÉTODOS DE MINERAÇÃO DE DADOS APLICADOS À ANÁLISE DE SISTEMAS CLIMÁTICOS"

Copied!
8
0
0

Texto

(1)

MÉTODOS DE MINERAÇÃO DE DADOS APLICADOS À ANÁLISE DE SISTEMAS CLIMÁTICOS

Maria Vitória Nava Silva do Carmo 1* & Carlos Henrique Ribeiro Lima 2

Resumo – A grande dependência que o Brasil tem da energia hidroelétrica cria a necessidade de se entender as condições climáticas que influenciam na disponibilidade hídrica em todo o território.

Neste trabalho busca-se relacionar algumas variáveis climáticas, como o contraste de temperatura entre o Oceano Atlântico e o continente e os padrões de circulação de vento com as afluências energéticas nas diferentes regiões. Foram obtidos índices climáticos, a partir de médias espaciais e da análise estatística MVU, e foi feita uma correlação cruzada entre eles e as afluências. As maiores correlações ocorreram entre a região Norte e a primeira componente do MVU para o índice de contraste de temperatura entre o continente e o oceano, para um atraso de um mês, e entre a Região Sudeste e a segunda componente do mesmo índice, para um atraso de quatro meses, indicando que esses são os índices mais representativos, informação que foi confirmada ao se verificar que as correlações obtidas para eles eram estatisticamente significantes. Quanto aos demais índices, gráficos de séries temporais mostraram que aqueles obtidos de forma diferente para as mesmas variáveis apresentaram valores distintos, mas comportamentos semelhantes.

Palavras-Chave – Índices climáticos, redução de dimensão, afluências energéticas.

ARTIFICIAL INTELLIGENCE METHODS APPLIED TO ANALYSIS OF CLIMATE SYSTEMS

Abstract – The great dependence of Brazil from the hydroelectric power creates the need to understand the climate conditions that influence the water availability in the whole territory. In this work we seek to relate some climatic variables, such as temperature contrast between the Atlantic Ocean and the continent and patterns of wind circulation with energy inflow in different regions.

Climate indexes were obtained from spatial averages and from the statistical analyses of MVU and a cross correlation between them and the inflows were made. The highest correlations occurred between the North and the first component of the MVU for the temperature contrast between the land and the ocean index, for a lag of one month, and between the Southeast and the second component of the same index, for a lag of four months, indicating that these indexes are the most representative, information that was confirmed when it was found that the correlations obtained for them were statistically significant. About the other indexes, times series charts showed that those obtained in different ways for the same variables had different values, but similar behaviors.

Keywords – Climate indexes, dimensionality reduction, energy inflow.

1 Engenheira Ambiental. E-mail: vitorianava@gmail.com.

2 Prof. Adjunto. Depto. de Eng. Civil e Ambiental. Universidade de Brasília. E-mail: chrlima@unb.br.

(2)

INTRODUÇÃO

As usinas hidrelétricas formam a maior parte da matriz energética do Brasil, sendo responsáveis por 80% da geração de energia elétrica, formando um sistema todo interconectado hidraulicamente ou por linhas de transmissão, para garantir que a energia chegue ao consumidor com segurança, de forma contínua e a preços acessíveis. Esse tipo de fonte de energia, porém, é muito dependente da variabilidade climática, já que a produção é vinculada ao volume presente nos reservatórios, o qual é ligado ao histórico de afluências, sendo que esta variável se relaciona com as variações das características climáticas no tempo e no espaço.

Devido à grande quantidade de dados climáticos disponível, eles devem ser avaliados por meio de uma análise estatística de sistemas multivariados, que envolve diversas técnicas que têm como objetivo a redução de sistemas de grandes dimensões para um número mínimo de coordenadas que sejam representativas da maior parte da variabilidade do sistema. Como sistemas climáticos geralmente não apresentam comportamento linear, faz-se necessária a utilização de métodos não lineares, dentre os quais se destacam os modelos que fazem uso de transformações não lineares e núcleos. Neste trabalho foi feito o uso de técnica MVU (Lima et al., 2009).

Foram utilizados dados climáticos mensais responsáveis pelos padrões de circulação atmosférica que afetam o Brasil para obter índices climáticos, por meio de uma média simples e com o uso da técnica MVU, visando avaliar o impacto do clima nas afluências energéticas do sistema brasileiro interconectado. Essa análise objetivou caracterizar o sistema e obter as bases empíricas para a construção de modelos de previsão de afluências futuras.

DADOS HIDROCLIMÁTICOS

Visando avaliar as afluências energéticas nas quatro regiões do Brasil definidas pelo Operador Nacional do Sistema (ONS) como os centros de geração, mostradas na Tabela 1, obteve-se, primeiramente, os dados de vazão média mensal naturalizada para cada um dos principais reservatórios integrantes do sistema hidroelétrico interconectado e pertencentes a essas regiões.

Esses dados foram fornecidos pelo ONS, para o período de janeiro de 1949 a dezembro de 2006. A partir dos mesmos foram obtidos os valores mensais de energia natural afluente média (Mwmed) para cada uma das regiões por meio da seguinte fórmula:

Ei(j) = ∑ δk ikγQk(j)hk (1)

Em que o j (j = 1, ..., 12) se relaciona ao mês, i (i = 1, ..., 4) à região em questão, Qk(j) é a afluência média, em m³/s, do reservatório k (k = 1,..., 64) no mês j, γ é o peso específico da água, hk

é a queda hidráulica média do reservatório k e δik vale 1 se o reservatório k estiver localizado na região i e 0 caso contrário.

Tabela 1 – Regiões brasileiras utilizadas

Região Nome Abreviação

1 Norte E1

2 Nordeste E2

3 Sul E3

4 Sudeste/Centro-Oeste E4

(3)

METODOLOGIA

Weinberger e Saul (2006) e Shaw e Jebara (2007) introduziram variações de métodos não lineares de redução de dimensão, como a técnica do MVU (Maximum Variance Unfolding). Ela tem como objetivo a maximização da variância dos dados ou a soma dos autovalores da matriz Kernel explicadas pelas componentes principais obtidas em espaços transformados. O método estabelece que, no espaço transformado, sejam preservados as distâncias e os ângulos entre pontos vizinhos do espaço original. O algoritmo tenta então aproximar o espaço ζ por transformações que preservem esses atributos para os k vizinhos mais próximos de cada vetor de observação do espaço original. A conectividade entre esses k vizinhos produz uma série de restrições que precisam ser satisfeitas para a otimização da escolha dos kernels (núcleos). Deve ser encontrada a maior quantidade possível de núcleos que maximizem Σi Kii (Lima et al., 2009), devendo-se, então, maximizar o traço de K:

K ≥ 0 (2)

∑ Kij ij= 0 (3)

Kii+ Kjj− Kij− Kji = Gii+ Gjj− Gij− Gji, ∀i, j → ηij > 0 (4)

Em que G = XXT é a matriz Gram N x N dos dados originais, Kij = Φ(xi), Φ(xj) é a matriz Kernel (K) N x N, N é o número de meses dos dados originais, Φ é a função de mapeamento não linear do espaço original para o espaço ζ e ηij vale 1 se i e j forem k vizinhos um do outro e 0 caso contrário. A equação (2) representa a limitação de que a matriz Kernel deva ser positiva semidefinida. Já a equação (3) define que os vetores no novo espaço sejam centralizados em torno da origem. Por fim, em (4) está mostrada a propriedade da isometria, ou seja, aquela que determina que as distâncias no espaço original devem ser mantidas após a transformação (Lima et al., 2009).

Para a obtenção de melhores resultados, escolheu-se um número de vizinhos k = 5.

Assim, a solução para otimizar o modelo proporciona uma matriz K que possui elementos Kij

que reflitam a variância dos dados originais. A função de transformação não linear Φ(xj) não precisa ser conhecida para que se determinem os principais modos de variabilidade Y dos dados originais X no novo espaço (Lima et al., 2009). Eles podem ser determinados por:

Y = ∑VT (5)

Tem-se que VT é a matriz N x L dos L mais altos autovalores de K, Σ é a matriz diagonal N x N das raízes quadradas dos L mais altos autovalores, L é o número de modos que se deseja manter no novo espaço e Y é a matriz N x L das componentes principais (Lima et al., 2009).

OBTENÇÃO DOS ÍNDICES CLIMÁTICOS

Para caracterizar os sistemas climáticos responsáveis pelos padrões de precipitação observados nas diferentes regiões do Brasil, foram obtidos índices climáticos a partir dos dados NCEP/NCAR de reanálise (Kalnay et al., 1996) para o período 01/01/1949 a 31/12/2006. Os dados são disponibilizados pelo International Research Institute for Climate Prediction (IRI) e podem ser obtidos em http://iridl.ldeo.columbia.edu/SOURCES/.NOAA/.NCEP-NCAR/.CDAS-1/.DAILY/.

O índice de contraste de temperatura (ICT) continente-oceano foi obtido pela diferença entre a temperatura média mensal sobre a superfície do território brasileiro e a TSM (Temperatura na

(4)

Superfície do Mar) média mensal sobre a região do Atlântico Sul. Os índices de monção, por sua vez, foram determinados a partir das definições descritas em Gan et al. (2006), que argumentam que índices para caracterizar sistemas de monção são melhores representados quando indicam mudanças nos padrões de circulação do vento. Dessa forma, foram analisados os ventos zonal e meridional para os níveis de pressão de 200 hPa e 850 hPa. Adicionalmente, foi considerado o índice NINO3 para avaliar a influência remota da TSM do Pacífico Tropical sobre as vazões ao longo dos reservatórios do sistema interconectado.

Para efeito de comparação, os campos de variáveis climáticas utilizados para obtenção dos índices descritos anteriormente foram novamente utilizados para obtenção de novos índices, mas dessa vez a partir da decomposição do campo em duas componentes principais por meio da técnica não linear MVU. A Tabela 2 apresenta um resumo dos índices climáticos utilizados neste estudo.

Tabela 2 – Índices climáticos utilizados

Índice Nome Abreviação Definição

1

Índice de Contraste de Temperatura (ICT) com MVU (1ª Componente)

I1

1ª componente do MVU da diferença entre a temperatura mensal média sobre o continente (área 0-35 ºS e 70 ºW-40 ºW) e a TSM mensal

média sobre o Atlântico Sul (área 0- 40 ºS e 40 ºW-10 ºE).

2

Índice de Contraste de Temperatura (ICT) com MVU (2ª Componente)

I2

2ª componente do MVU da diferença entre a temperatura mensal média sobre o continente (área 0-35 ºS e 70 ºW-40 ºW) e a TSM mensal

média sobre o Atlântico Sul (área 0- 40 ºS e 40 ºW-10 ºE).

3

Vento Meridional em 850 hPa (1ª Componente)

I3 1ª componente do vento meridional no nível 850 hPa sobre a área 0ºS-35ºS e 70ºW-30ºW 4

Vento Meridional em 850 hPa (2ª Componente)

I4 2ª componente do vento meridional no nível 850 hPa sobre a área 0ºS-35ºS e 70ºW-30ºW 5

Vento Meridional em 200 hPa (1ª Componente)

I5 1ª componente do vento meridional no nível 200 hPa sobre a área 0ºS-35ºS e 70ºW-30ºW 6

Vento Meridional em 200 hPa (2ª Componente)

I6 2ª componente do vento meridional no nível 200 hPa sobre a área 0ºS-35ºS e 70ºW-30ºW 7

Vento Zonal em 850 hPa

(1ª Componente)

I7 1ª componente do vento zonal no nível 850 hPa sobre a área 0ºS-35ºS e 70ºW-40ºW

8

Vento Zonal em 850 hPa (2ª Componente)

I8 2ª componente do vento zonal no nível 850 hPa sobre a área 0ºS-35ºS e 70ºW-40ºW 9

Vento Zonal em 200 hPa (1ª Componente)

I9 1ª componente do vento zonal no nível 200 hPa sobre a área 0ºS-35ºS e 70ºW-40ºW 10 Vento Zonal em

200 hPa I10 2ª componente do vento zonal no nível 200 hPa sobre a área 0ºS-35ºS e 70ºW-40ºW

(5)

(2ª Componente) 11

Meridional Wind Shear Index

(MWSI)

I11 Diferença entre o vento meridional nos níveis de 850 hPa e 200 hPa, na área 10 ºS-5 ºS e 40 ºW-30 ºW 12 Zonal Wind Shear

Index (ZWSI) I12 Diferença entre o vento zonal nos níveis de 850 e 200 hPa, na área 15 ºS-10 ºS e 60 ºW-50 ºW 13

850-hPa Zonal Wind Index

(850ZWI)

I13 Vento zonal no nível 850 hPa ao longo da longitude 60 ºW, delimitada pelas latitudes 10 ºS e 20 ºS 14

850-hPa Zonal and Meridional Index

(UVI)

I14

Soma do vento zonal médio no nível 850 hPa na área 15 ºS-10 ºS e 60 ºW-50 ºW e a do

vento meridional em 850 hPa na área 25 ºS-20 ºS e 65 ºW-60 ºW

15

Índice de Contraste de Temperatura

(ICT)

I15

Diferença entre a temperatura mensal média sobre o continente (área 0-35 ºS e 70 ºW-40 ºW) e a TSM mensal

média sobre o Atlântico Sul (área 0-40 ºS e 40 ºW-10 ºE).

16 NINO3 I16 Anomalia de temperatura na área 5 ºN-5 ºS e 150 ºW-90 ºW

RESULTADOS E DISCUSSÃO

Para avaliar a representatividade dos índices climáticos obtidos quanto à influência dos mesmos nos padrões de variabilidade das afluências energéticas, foi realizada uma análise da correlação cruzada entre as afluências em cada região e cada um dos índices climáticos com atrasos positivos e negativos. A partir desses valores buscou-se, entre os lags negativos, os valores máximos absolutos das correlações entre cada par região-índice, bem como o tempo de atraso na qual ocorriam, conforme mostrado na Tabela 3. O maior pico ocorreu entre a região 1 (Norte) e o índice 1, seguido pela relação entre a região 4 (Sudeste) e o índice 2. Portanto, as análises mais detalhadas foram feitas para essas duas combinações.

Tabela 3 – Matriz de valores máximos absolutos de correlação cruzada entre as regiões e os índices ÍNDICE

REGIÃO

1 2 3 4

Valor Lag Valor Lag Valor Lag Valor Lag 1 0.8086 -1 0.6946 -1 0.2430 -7 0.7248 0 2 0.7817 -5 0.6928 -4 0.2143 -4 0.7258 -4 3 0.1022 -6 0.1171 -5 0.1297 -4 0.1066 0 4 0.1544 -7 0.0978 -7 0.1131 -2 0.1705 -6 5 0.0766 -4 0.0652 -10 0.1235 -5 0.0863 -4 6 0.0984 -10 0.0957 -5 0.0977 -8 0.1112 -10 7 0.0516 -8 0.1342 -6 0.1245 0 0.0858 -7 8 0.2251 -7 0.1772 -7 0.1168 -1 0.2158 -7 9 0.0252 -2 0.1493 0 0.0661 -5 0.0360 -1 10 0.1385 -10 0.1458 -9 0.0421 -6 0.1906 -8 11 0.0842 0 0.1236 -2 0.0624 -5 0.1006 -10 12 0.0708 -3 0.1151 -7 0.0908 -9 0.1199 -9

(6)

14 0.1116 -4 0.1177 -3 0.0739 -10 0.1454 -2 15 0.0159 -4 0.0866 -7 0.1190 -4 0.0997 -1 16 0.0185 -5 0.0607 -3 0.3048 -5 0.1919 -2

As correlações cruzadas em função do tempo de atraso são mostradas na Figura 1. As barras vermelhas indicam as regiões críticas para um teste de hipótese para a correlação, valores acima ou abaixo delas são estatisticamente significantes ao nível de significância de 5 %. Observa-se que a maior parte dos valores ficou situada fora desses limites, indicando a existência de uma correlação representativa entre os dados avaliados, com um valor de pico de correlação absoluta nos tempos de atraso de um mês e quatro meses, respectivamente.

Figura 1 – Correlação cruzada entre E1 e I1 (a) e E4 e I2(b)

Para melhor avaliar a correlação entre os dados em questão, foi feito um gráfico de dispersão (Figura 2), relacionando as afluências com os respectivos índices, sendo que estes foram atrasados conforme o lag mostrado na Tabela 3. Observa-se que tantos valores positivos (continente mais aquecido) quanto negativos (oceano com temperaturas mais altas) estiveram presentes e influenciaram nas afluências obtidas.

Figura 2 – Gráfico de Dispersão entre E1 e I1 (a) e E4 e I2(b)

Visando comparar os índices de monção com aqueles obtidos via MVU, foram plotadas as séries temporais deles para cada uma das variáveis. Os índices obtidos para os ventos apresentaram, de forma geral, tendências semelhantes, diferentemente dos índices relativos ao ICT. Segundo a Tabela 3, todos os índices referentes ao vento meridional (Figura 3-b e 3-c) apresentaram valores máximos de correlação inferiores a 0,2, o que indica que eles contribuem pouco para a variabilidade

(7)

do sistema. O mesmo foi observado para o vento zonal (Figura 3-d e 3-e), cuja maior correlação, que foi observada para o índice I8 na Região I, continuou sendo estatisticamente pouco significante.

Quanto ao ICT (Figura 3-a), observa-se que a os valores de correlação obtidos conforme descrito em Gan et al. (2006) foram muitos baixos, indicando que a forma de obtenção do índice não foi adequada para representar o sistema. Por outro lado, os valores das correlações com as duas componentes obtidas pelo MVU foram altos, exceto para a Região III, demonstrando que a técnica de análise não linear foi mais eficiente quando comparada à obtenção via média simples. Esses valores também indicam que o contraste de temperatura parece ser a variável climática que mais influencia no comportamento das afluências mensais, uma vez que ela afeta o estabelecimento das condições de pressão que determinaram a magnitude da monção na América do Sul e consequentemente os padrões sazonais de chuva sobre a região.

Figura 3 – Série Temporais entre os Índices I1, I2 e I15 (a), I3, I4 e I11 (b), I5, I6 e I11 (c), I7, I8 e I12 (d), I9, I10 e I12 (e).

(8)

CONCLUSÃO E TRABALHOS FUTUROS

Concluiu-se inicialmente que a diferença de temperatura entre o continente e o oceano constitui o fator que mais influencia as afluências energéticas. Essa influência ocorre em maior grau a um mês de antecedência para a primeira componente do ICT obtida via MVU, enquanto a segunda componente tem esse pico quatro meses antes. A segunda conclusão foi obtida comparando os valores máximos de correlação dos índices obtidos a partir de uma média da variável sobre a região de interesse e utilizando-se a técnica MVU, observando-se que há um indicativo de que esta seja a mais adequada para representar a variabilidade do sistema, já que este não é linear.

Espera-se que os dados obtidos possam ser utilizados em trabalhos futuros para a construção de modelos probabilísticos não estacionários, de forma a antecipar e simular as afluências relativas a cada uma das regiões, sendo muito importante devido à interconexão existente entre os reservatórios. Os modelos poderiam ajudar na operação desses reservatórios, além de auxiliar na previsão de futuras cheias, evitando vários prejuízos para o País.

AGRADECIMENTOS

Os autores agradecem a ONS e o IRI pela disponibilização dos dados hidroclimáticos. O primeiro autor agradece ao CNPq e à Universidade de Brasília pelo suporte oferecido via bolsa de iniciação científica. Esse trabalho foi financiado pelo CNPq por meio do projeto Universal 480448/2011-6.

REFERÊNCIAS

GAN, M.A.; RAO, V.B.; MOSCATI, M.C.L. (2006). South American monsoon indices.

Atmospheric Science Letters v. 6, pp. 219-223.

KALNAY, E.; KANAMITSU, M.; KISLER, R.; COLLINS, W.; DEAVEN, D.; GANDIN, L.;

IREDELL, M.; SAHA, S.; WHITE, G.; WOOLLEN, J.; ZHU, Y.; CHELLIAH; M.; EBISUZAKI, W.; HIGGINS, W.; JANOWIAK, J.; MO, K.C.; ROPELEWSKI, C.; WANG, J.; LEETMAA, A.;

REYNOLDS, R.; JENNE, R.; JOSEPH, D. (1996). The NCEP/NCAR 40-year reanalysis project.

Bulletin of the American Meteorological Society, pp. 437 – 471.

LIMA, C.H.R., CARMO, M.V.N.S. (2012). Índices climáticos e a variabilidade das vazões aos reservatórios Três Marias e Sobradinho. In Anais do XI Simpósio de Recursos Hídricos do Nordeste, João Pessoa, Nov. 2012.

LIMA, C.H.R.; LALL, U.; JEBARA, T.; BARNSTON, A.G. (2009). Statistical prediction of ENSO from subsurface sea temperature using a nonlinear dimensionality reduction. Journal of Climate v.

22, pp. 4501-4519.

SHAW, B.; JEBARA, T. (2007). Minimum volume embedding. In: Proceedings of the 11th International Conference on Artificial Intelligence and Statistics, pp. 460-467.

WEINBERGER, K.Q.; SAUL, K.L. (2006). Unsupervised learning of image manifolds by semidefinite programming. Int. J. Compu, Vision, 70, pp. 77-79.

Referências

Documentos relacionados

(grifos nossos). b) Em observância ao princípio da impessoalidade, a Administração não pode atuar com vistas a prejudicar ou beneficiar pessoas determinadas, vez que é

nesta nossa modesta obra O sonho e os sonhos analisa- mos o sono e sua importância para o corpo e sobretudo para a alma que, nas horas de repouso da matéria, liberta-se parcialmente

Este trabalho buscou, através de pesquisa de campo, estudar o efeito de diferentes alternativas de adubações de cobertura, quanto ao tipo de adubo e época de

No entanto, maiores lucros com publicidade e um crescimento no uso da plataforma em smartphones e tablets não serão suficientes para o mercado se a maior rede social do mundo

O objetivo do curso foi oportunizar aos participantes, um contato direto com as plantas nativas do Cerrado para identificação de espécies com potencial

esta espécie foi encontrada em borda de mata ciliar, savana graminosa, savana parque e área de transição mata ciliar e savana.. Observações: Esta espécie ocorre

3.3 o Município tem caminhão da coleta seletiva, sendo orientado a providenciar a contratação direta da associação para o recolhimento dos resíduos recicláveis,

5 “A Teoria Pura do Direito é uma teoria do Direito positivo – do Direito positivo em geral, não de uma ordem jurídica especial” (KELSEN, Teoria pura do direito, p..