• Nenhum resultado encontrado

ANÁLISE DE DADOS E APRENDIZADO DE MÁQUINA APLICADOS NA PREVISÃO DE GERAÇÃO DE POTÊNCIA ELÉTRICA DE UMA

N/A
N/A
Protected

Academic year: 2023

Share "ANÁLISE DE DADOS E APRENDIZADO DE MÁQUINA APLICADOS NA PREVISÃO DE GERAÇÃO DE POTÊNCIA ELÉTRICA DE UMA"

Copied!
114
0
0

Texto

Palavras-chave: aprendizado de máquina, energia fotovoltaica, rede neural perceptron multicamadas, rede neural recorrente de memória de longo curto prazo, regressão linear, regressão polinomial. Ct Cópia de uma célula de memória de uma rede neural Ct Célula de memória de uma rede neural.

ORGANIZAÇÃO DO TRABALHO

OBJETIVO GERAL

OBJETIVOS ESPECÍFICOS

A atual crise energética e a preocupação global com o meio ambiente fazem com que as energias renováveis ​​se destaquem no contexto energético e neste contexto a energia solar é a protagonista. Portanto, sua apresentação poderá ampliar os horizontes dos alunos dessa área que possui inúmeras aplicações na engenharia elétrica.

ENERGIA SOLAR

PREVISÃO DE GERAÇÃO DA ENERGIA SOLAR

Além das seis redes neurais, o artigo também tenta prever a geração de energia elétrica com outros quatro algoritmos de aprendizado de máquina, a saber, os modelos de regressão K Nearest Neighbours (KNN), Extreme Learning Machine (ELM), Random Forest (RF) e Support Vector. Regressão (SVR). O LSTM pode considerar mudanças temporais, o que é de grande importância para um modelo de previsão da geração de energia elétrica de um sistema fotovoltaico (ABDEL-NASSER; MAHMOUD, 2019).

ANÁLISE EXPLORATÓRIA DE DADOS

DISTRIBUIÇÃO DE FREQUÊNCIA

Neste contexto, o coeficiente de assimetria de Pearson (As) pode ser utilizado como indicador para representar a distribuição de frequência dos dados. Este coeficiente pode ser expresso pela equação (1), onde x representa a média da distribuição dos dados, M representa a moda1 e σ representa o desvio padrão dos dados em relação à média.

CORRELAÇÃO

  • MULTICOLINEARIDADE

Verificar a distribuição de frequência em um conjunto de dados antes de aplicá-lo a um modelo de ML é extremamente útil para compreender a distribuição dos dados e detectar padrões para cada atributo na amostra.

QUARTIL

REGRESSÃO LINEAR

Dada uma função de custo J(w), pode-se calcular o valor ótimo no sentido de minimizar o erro quadrático médio (MSE) (entre o valor previstoˆcom o valor verdadeiro). Esta é uma função característica analítica que pode apresentar excelente desempenho para uma pequena quantidade de dados, uma vez que a inversão de matrizes na equação requer muito poder computacional.

REGRESSÃO POLINOMIAL

Matematicamente é conveniente considerar b= 0 e incluir um valor de entrada constante x0 = 1, desta forma os atributos de entrada podem ser representados como x(i) = [1 x1.

REDES NEURAIS

  • NEURÔNIO BIOLÓGICO
  • NEURÔNIO ARTIFICIAL
  • REDES NEURAIS ARTIFICIAIS - RNA
    • PERCEPTRON MULTICAMADAS - MLP
    • ALGORITMO DE RETROPROPAGAÇÃO
  • REDES NEURAIS RECORRENTES - RNN
    • MEMÓRIA LONGA DE CURTO PRAZO - LSTM

Em uma rede neural, os dados de treinamento normalmente fluem em uma direção, da camada de entrada para a camada de saída. A Figura 9 mostra o funcionamento de um LSTM padrão, diferente do RNN padrão que possui apenas uma única camada de neurônios (tanh) para cada um.

MÉTRICAS PARA AVALIAR UM MODELO

COEFICIENTE DE DETERMINAÇÃO - R 2

Em suma, informações previamente previstas e novos dados passarão pela porta do esquecimento, fazendo com que algumas das informações armazenadas na memória da rede sejam esquecidas por multiplicação (ft ·Ct−1). A porta de entrada irá lembrar as informações consideradas relevantes, ter essas informações reguladas e então adicioná-las à memória da rede por adição (Equação (18)). Por fim, as entradas da memória da rede são ponderadas e multiplicadas pelo vetor de entradas e predições anteriores, resultando na nova predição.

RAÍZ DO ERRO QUADRÁTICO MÉDIO - RMSE

Para atingir o objetivo de prever a produção de eletricidade de um sistema fotovoltaico, tentaremos prever um atributo de potência CA denominado “AC_POWER”. DC_POWER Energia elétrica CC gerada pelo inversor em intervalo de 15 minutos. AC_POWER A energia elétrica em corrente alternada gerada pelo inversor em um intervalo de 15 minutos.

ANÁLISE EXPLORATÓRIA

  • PREPARAÇÃO DOS DADOS
  • VISUALIZAÇÃO DOS DADOS
  • ANÁLISE DE ASSIMETRIA
  • DEFINIÇÃO DO ATRIBUTO ALVO
  • ANÁLISE DE MULTICOLINEARIDADE
  • ANÁLISE DE REGRESSÃO LINEAR
  • ANÁLISE DE QUARTIL

O gráfico da Figura 16 mostra que as perdas na conversão de energia foram mínimas, pois os atributos no gráfico quase se sobrepuseram. A Tabela 8 contém os valores obtidos para a amostra considerando todos os atributos como entrada (Exemplo 1), utilizando os atributos selecionados avaliando o índice do fator de inflação da variância (Exemplo 2) e os valores registrados considerando apenas o atributo “IRADIAÇÃO” como entrada (3.exemplo). Comparando os três casos, fica claro que o caso com todos os atributos (caso 1) apresenta melhor R².

MODELAGEM

DIVISÃO DA AMOSTRA

Antes do treinamento dos modelos, os dados foram normalizados em uma escala de 0 a 1. A normalização é importante dada a divergência no tamanho dos atributos; atributos com valores mais altos introduziriam viés no modelo. Tanto a amostra de teste quanto a amostra completa foram normalizadas com os dados de treinamento, pois normalizar o conjunto de teste com o conjunto de dados completo transferiria informações da amostra completa para o conjunto de teste, o que afetaria o resultado final. Para calcular a perda, por se tratar de um problema de regressão e não haver outliers em toda a amostra, foi aplicada a função MSE.

MODELOS LINEARES

  • MODELO REGRESSÃO LINEAR
  • MODELO REGRESSÃO LINEAR COM MULTIVARIÁVEIS 44

Sua raiz quadrada também foi calculada para obtenção do RMSE do modelo, o que auxilia na compreensão da variância do resultado obtido pelas previsões. Assim como foi feito na regressão linear, o modelo de regressão polinomial foi treinado considerando todas as seis características de entrada. Neste caso, para uma entrada de seis atributos, o modelo realiza uma transformação para doze atributos, dada a característica polinomial do modelo, e realiza uma combinação linear com todas as variáveis.

MODELOS DE REDE NEURAL

  • MÉTODO VANILLA
  • MÉTODO WINDOW
  • MODELO MLP
  • MODELO MLP COM MÉTODO WINDOW
  • MODELO LSTM
  • MODELO LSTM COM MÉTODO WINDOW

Os hiperparâmetros utilizados para a rede MLP com o método de janela foram os mesmos utilizados para o método padrão, conforme mostrado na Tabela 10. Para fins de comparação, os hiperparâmetros utilizados para o LSTM foram os mesmos utilizados na rede MLP (Tabela ) 11). A Figura 34 mostra o histórico de perdas ao longo da etapa de treinamento. Pode-se observar que ao atingir 19 épocas as perdas se estabilizam, por isso 19 épocas são suficientes para treinar o modelo com uma única variável.

PREVISÃO COM MODELOS LINEARES

PREVISÃO REGRESSÃO LINEAR

A Tabela 13 mostra a raiz do erro quadrático médio obtido com dados normalizados e o RMSE obtido com dados não normalizados. Com o RMSE foi possível verificar que o desvio padrão da potência CA para o modelo de regressão linear para novos dados é de 121,97 kW dos dados previstos em comparação com a média dos dados reais (considerando todo o conjunto de testes que constitui uma média de 419,78 kW gerados em corrente alternada, o erro RMSE de 121,97 kW corresponde a um spread de 29,05% sobre o conjunto total de testes). A Figura 37 apresenta uma visão geral da previsão feita para todos os 34 dias utilizando o modelo de regressão linear unidimensional, levando em consideração a soma da potência gerada em cada um dos 34 dias estudados.

PREVISÃO REGRESSÃO POLINOMIAL

A Tabela 14 apresenta a raiz do erro quadrático médio obtido com os dados normalizados e o RMSE obtido com os dados não normalizados. Representação da previsão de produção com desvio padrão de 119,34 kW em relação aos dados reais de produção. A Figura 39 apresenta a soma da potência produzida para cada um dos 34 dias, onde a predição foi feita através de um modelo de regressão polinomial com uma única variável de entrada.

PREVISÃO REGRESSÃO LINEAR COM MULTIVARIÁVEIS

A Tabela 15 reúne o erro quadrático médio obtido com os dados normalizados e o RMSE obtido com os dados não normalizados. Obtenção de um desvio padrão global dos testes de geração de energia com novos dados de 87,86 kW em relação à média dos dados reais. A Figura 41 mostra uma visão geral da previsão para todos os 34 dias utilizando o modelo de regressão linear multivariável, com a soma da potência gerada para cada um dos dias.

PREVISÃO REGRESSÃO POLINOMIAL COM MULTIVARIÁVEIS 57

Portanto, o modelo de regressão polinomial para novos dados apresenta um desvio padrão de 87,58 kW na previsão em relação à média dos dados reais. A Figura 43 apresenta a soma das potências geradas para cada um dos 34 dias, predição feita com o modelo de regressão polinomial multivariável. Os resultados do treinamento foram coletados com os dois casos estudados, com uma única variável e com múltiplas variáveis ​​de entrada. Para cada um dos casos foram aplicados os métodos Vanilla e Window, resultando em um total de quatro redes neurais modeladas.

PREVISÃO MLP

A seguir serão apresentados os resultados obtidos com as duas redes neurais treinadas, as redes neurais MLP e LSTM. Portanto, para os novos dados de entrada, foi obtido um desvio padrão de 121,65 kW dos resultados previstos para a média dos dados reais. A Figura 45 apresenta a soma da potência gerada para cada um dos 34 dias por todos os conversores considerados, comparada com a previsão resultante do modelo de rede neural MLP utilizando um único recurso de radiação na entrada.

PREVISÃO MLP MÉTODO WINDOW

Portanto, um desvio de par de 136,82 kW dos resultados previstos para os resultados reais foi obtido para os novos dados de entrada. A Figura 47 mostra a soma da potência gerada por todos os inversores considerados para cada um dos 34 dias em comparação com a previsão derivada do modelo de rede neural MLP com um único atributo de entrada.

PREVISÃO MLP COM MULTIVARIÁVEIS

A Tabela 19 mostra que a potência da amostra com os novos dados difere em média 88,06 kW dos resultados previstos para os resultados reais. A previsão da potência total produzida em cada um dos trinta e quatro dias para o respetivo modelo é apresentada na Figura 49.

PREVISÃO MLP MÉTODO WINDOW COM MULTIVARIÁVEIS . 64

A previsão de 34 dias do modelo pode ser comparada com os valores reais da Figura 53.

PREVISÃO LSTM MÉTODO WINDOW

O desempenho apresentado ao longo de todos os trinta e quatro dias do método da janela de treinamento LSTM, da soma da geração diária de AC, está na Figura 55.

PREVISÃO LSTM COM MULTIVARIÁVEIS

A Tabela 24 reúne o erro quadrático médio obtido com os dados normalizados, e o RMSE obtido com os dados não normalizados, resultando em um desvio padrão de 88,70 kW dos dados previstos em relação aos dados reais. A predição de energia elétrica utilizando o modelo de rede neural LSTM com múltiplas variáveis ​​de entrada é mostrada na Figura 57.

PREVISÃO LSTM MÉTODO WINDOW COM MULTIVARIÁVEIS 70

Por fim, a predição de energia elétrica utilizando o modelo de rede neural LSTM com o método de janela e múltiplos atributos de entrada é mostrada na Figura 59. O melhor desempenho foi com a rede neural LSTM utilizando o método de janela, que ganhou significativamente o mínimo erro quadrático médio para o dados do conjunto de teste. Todos os modelos de redes neurais foram treinados com algumas épocas, dada a sua rápida estabilização, o treinamento foi programado para parar se após 10 épocas não houvesse redução na raiz do erro quadrático médio para a amostra de validação.

TRABALHOS FUTUROS

Portanto, devido à natureza estocástica dos dados e à influência da sazonalidade na radiação solar, fazer uma previsão adequada da geração de energia elétrica de um sistema fotovoltaico para o longo prazo, por exemplo: um ano, na região em que o sistema fotovoltaico estiver localizado, será necessário um conjunto de dados significativamente maior em relação ao conjunto disponível neste trabalho. Assim, os atuais modelos AM criados a partir do referido arcabouço, em sua configuração atual, funcionarão satisfatoriamente quando “alimentados” com conjuntos de dados relativos ao período aqui investigado (entre maio e junho) e derivados estão entre as usinas solares que possuem sido estudado. . Porém, não houve sucesso na captura do banco de dados do sistema, pois os dados não estavam disponíveis para download.

CONSIDERAÇÕES FINAIS

Redes de memória de longo e curto prazo com Python: desenvolva modelos de previsão de sequência com aprendizado profundo. Avaliação do aprendizado de máquina na previsão de curto prazo de séries temporais de energia solar. Dados de produção solar: Dados de produção solar e dados de sensores para duas usinas de energia. Kaggle, 2020.

Referências

Documentos relacionados

Quantifica o relacionamento linear entre duas variáveis quantitativas Essa quantificação, denotada por ρ, assume valores entre -1 e 1, se:. ρ = 1, correlação linear perfeita