Análise de modelos para previsões de consumo de energia elétrica e seu uso na redu¸cão de custos

(1)

An´ alise de modelos para previs˜ oes de consumo de energia el´ etrica e seu uso na

redu¸ c˜ ao de custos

Leonardo Luiz do Nascimento Dantas Filho

CENTRO DE INFORM ´ATICA

UNIVERSIDADE FEDERAL DA PARA´IBA

Jo˜ao Pessoa, 2019

(2)

(3)

Leonardo Luiz do Nascimento Dantas Filho

An´ alise de modelos para previs˜ oes de consumo de energia el´etrica e seu uso na redu¸c˜ ao de custos

Monografia apresentada ao curso Ciência da Computa¸cão do Centro de Informática, da Universidade Federal da Para´ıba, como requisito para a obten¸cão do grau de Bacharel em Ciência da Computa¸cão Orientador: Prof. Dr. Clauirton de Albuquerque Siebra

Maio de 2019

(4)

F481a Filho, Leonardo Luiz do Nascimento Dantas.

Análise de modelos para previsões de consumo de energia elétrica e seu uso na redução de custos / Leonardo Luiz do Nascimento Dantas Filho. - João Pessoa, 2019.

35 f. : il.

Orientação: Clauirton de Albuquerque Siebra.

TCC (Especialização) - UFPB/CI.

1. Aprendizagem de Máquina. I. Siebra, Clauirton de Albuquerque. II. Título.

UFPB/CI

Catalogação na publicação Seção de Catalogação e Classificação

(5)

(6)

(7)

“Nunca deixe que lhe digam que não vale a pena acreditar no sonho que se tem ou que seus planos nunca vão dar certo ou que você nunca vai ser alguém.”

(Renato Russo)

(8)

(9)

DEDICAT ´ ORIA

Dedico este trabalho ao meu avô, Luiz Santa Rosa Dantas, e a minha avó Maria Clara de Sousa Lima, que foram duas pessoas que me espelho como ser humano, que amo imensamente e que estarão presentes em meu cora¸cão até resto de minha vida.

(10)

AGRADECIMENTOS

Agrade¸co a Deus pelas gra¸cas recebidas, pela saúde e prote¸cão a mim dedicada, e pelas pessoas colocadas em minha vida. Agrade¸co aos meus pais Leonardo Dantas e Suely Rejane Lima, minha avó Maria Clara Lima pela educa¸cão, suporte, e pelo grande amor recebido em todos os momentos da vida. À Sebastião Barbosa pelo apoio, pelos sermões e pela confian¸ca depositada em mim. À minha namorada, Sáskya Ayla, que fez uma enorme diferen¸ca, me aconselhando, me dando confian¸ca, for¸ca para seguir em frente, alguns puxões de orelha e sendo paciente com minha ausência devido às atividades relacionadas a esse trabalho e ao longo do curso. Ao meu orientador, Clauirton Siebra, que tanto me ajudou através de ideias e incentivos que resultaram no meu amadurecimento acadêmico e profissional. À UFPB e sua estrutura, em especial aos professores e funcionários do Centro de Informática, que me proporcionaram essa oportunidade.

Por fim, a todos os meus familiares, aos meus amigos, amigos do curso de Ciência da Computa¸cão da UFPB que indiretamente contribu´ıram para esse trabalho simplesmente por me apoiarem e ao Programa de Educa¸cão Tutorial Computa¸cão (PET Computa¸cão) pelo suporte na constru¸cão do meu lado acadêmico. E aos professores que se dedicaram a proporcionar os conhecimentos que levarei para a vida.

(11)

RESUMO

A aprendizagem de máquina tem sido bastante utilizada em vários âmbitos de pes- quisa e aplica¸cão, como mecanismos de busca, deteçcão de fraudes, processamento de lin- guagem natural, deteçcão de anomalia, previsão de demanda e ve´ıculos autônomos. Neste documento, nos concentramos a analisar os principais modelos de previsão, afim de escolher o que melhor se adapta aos dados de consumo de energia residencial. Além disso foi realizado uma análise nos dados, altera¸cões que foram necessárias para que os dados ficassem dentro dos requisitos escolhidos, foi apresentado também todos os resultados dos modelos escolhidos e explicado como cada modelo se adaptou aos dados. Também será mostrado todas as tecnologias para a realiza¸cão do respectivo trabalho.

Palavras-chave: Aprendizagem de Máquina, Modelo de Previsão,Consumo de Ener- gia e Análise de Dados.

(12)

ABSTRACT

Machine learning has been widely used in a number of research and application do- mains, such as search engines, fraud detection, natural language processing, anomaly detection, demand forecasting, and standalone vehicles. In this document, we focus on analyzing the major forecasting models in order to choose the one that best fits the residential energy consumption data. In addition, an analysis was performed on the data, changes that were necessary to keep the data within the chosen requirements, also presented all the results of the chosen models and explained how each model adapted to the data. Moreover, we also show all the technologies used to conduct the present work

Key-words: Machine Learning, Forecasting Model, Energy Consumption and Data Analysis.

(13)

LISTA DE FIGURAS

1 Processo de cria¸cão de um modelo de predi¸cão. Fonte: Adaptado de Déborah

Mesquita [7] . . . 20

2 C´alculo do consumo de energia. Fonte: https://industriahoje.com.br/como- calcular-o-consumo-de-energia-eletrica . . . 23

3 Previs˜ao de consumo AR ordenado . . . 27

4 Previs˜ao de consumo AR n˜ao ordenado . . . 28

5 Previs˜ao de consumo ARMA ordenado . . . 29

6 Previs˜ao de consumo ARMA n˜ao ordenado . . . 30

7 Previs˜ao de consumo Regress˜ao polinomial . . . 31

8 Probabilidade da Distribui¸c˜ao kernel gaussiano . . . 32

(14)

LISTA DE ABREVIATURAS

AI - Artificial intelligence ML - Machine learning

BSD - Berkeley Software Distribution SVR - Support vector regression NN - Neural networks

ARIMA - Autoregressive integrated moving average AR - Modelo Autorregressivo

MA - Modelo de M´edias M´oveis

ARMA - Modelo Autorregressivo e de M´edias M´oveis MISE - Mean integrated squared error

TF- TensorFlow

(15)

Conte´ udo

1 INTRODUC¸ ˜AO 17

1.1 OBJETIVOS . . . 17

1.1.1 Objetivo geral . . . 17

1.1.2 Objetivos espec´ıficos . . . 17

1.2 ESTRUTURA DA MONOGRAFIA . . . 18

2 FUNDAMENTAÇ ÃO TE ÓRICA 19 2.1 Aprendizagem de máquina . . . 19

2.2 TENSORFLOW . . . 19

2.3 NUMPY . . . 20

2.4 SCIPY . . . 21

2.5 SCIKIT-LEARN . . . 21

3 TRABALHOS RELACIONADOS 22 3.1 Aprendizagem de m´aquina com Big Data . . . 22

3.2 Previs˜ao no consumo de energia . . . 22

4 METODOLOGIA 23 4.1 DATASET . . . 23

4.2 MODELOS DE PREVIS ˜AO . . . 24

4.2.1 Modelo Autorregressivo . . . 24

4.2.2 Modelo Autorregressivo de m´edia m´ovel . . . 24

4.2.3 Modelo de regress˜ao polinomial . . . 25

4.2.4 Modelo Kernel Gaussiano . . . 25

5 APRESENTAÇ ÃO E AN ÁLISE DOS RESULTADOS 27 5.1 MODELO AUTOREGRESSIVO . . . 27

5.2 MODELO AUTORREGRESSIVO DE M´EDIA M ´OVEL . . . 28 15

(16)

5.3 MODELO DE REGRESS ˜AO POLINOMIAL . . . 30 5.4 MODELO KERNEL GAUSSIANO . . . 31 5.5 DISCUSS ˜AO DOS RESULTADOS . . . 32

6 CONCLUS ˜OES E TRABALHOS FUTUROS 33

REFERˆENCIAS 33

16

(17)

1 INTRODUC ¸ ˜ AO

A energia sempre foi uma parte fundamental para o funcionamento e evolu¸cão da sociedade. Na sociedade moderna, a eletricidade se destaca como um dos recursos energéticos essenciais para o desenvolvimento e na manuten¸cão de diversas atividades diárias. Nas metrópoles, devido a estarmos a maior parte do tempo conectados, a eletricidade se tornou importante para diferentes tarefas, como comunica¸cão, estudo, afazares domésticos, con- serva¸cão de alimentos, hospitais, dentre outros. As empresas utilizam a energia elétrica como um fator de produ¸cão, enquanto o bem-estar das fam´ılias depende, direta ou indiretamente, do consumo de eletricidade [6].

Compreender e mensurar de maneira correta a demanda de energia elétrica é vital para a sobrevivência das empresas que a produzem, tanto a entrega como a revenda, pois a eletricidade, em grandes quantidades, não pode ser armazenada de forma viável e eficiente e, consequentemente, a sua demanda deve ser quase que instantaneamente atendida [13].

Tanto a superestima¸cão quanto a subestima¸cão da gera¸cão de energia elétrica geram custos para os agentes desse mercado e devem ser evitadas. Um planejamento eficiente sobre o comportamento da demanda de energia elétrica é indispensável para que os agentes possam desenvolver estratégias voltadas para a maximiza¸cão de lucro e minimiza¸cão de riscos [12].

1.1 OBJETIVOS 1.1.1 Objetivo geral

O trabalho tem como objetivo geral explorar os métodos de predi¸cão e definir o mais eficiente para prever o consumo de energia de residências, que possibilite uma melhor estima¸cão de gastos por parte da empresa responsável por distribuir energia.

1.1.2 Objetivos espec´ıficos

No que diz respeito aos objetivos espec´ıficos, pretende-se:

• Apresentar um estudo investigativo dos diferentes modelos de predi¸c˜oes existentes e selecionar a que possuir melhores resultados;

• Manipular os dados utilizados para se adequar aos paramˆetros que ser˜ao analisados;

• Descrever os modelos utilizados para as predi¸c˜oes;

17

(18)

• Apresentar gr´aficos mostrando os resultados de cada modelo utilizado;

1.2 ESTRUTURA DA MONOGRAFIA

Este trabalho está estruturado da seguinte forma: na Se¸cão 1 são apresentadas a introdu¸cão, a relevância do tema e os objetivos gerais e espec´ıficos do trabalho. Na se¸cão 2 são apresentadas as bases teóricas do trabalho. Na se¸cão 3 são apresentados os trabalhos correlatos à ideia de predi¸cões de consumo de energia. Na se¸cão 4 é apresentado o banco que foi utilizados nesse trabalho e também os modelos utilizados para o mesmo. Na se¸cão 5

´

e apresentdo os resultados dos modelos de predi¸cões utilizados. Na se¸cão 6 são apresentadas as conclusões e propostas de trabalhos futuros.

18

(19)

2 FUNDAMENTAC ¸ ˜ AO TE ´ ORICA

2.1 Aprendizagem de m´aquina

Por anos os seres humanos mantinham o controle sobre as decisões que afetavam sua vida cotidiana, mas com a avan¸co a tecnologia cada vez mais os algoritmos de aprendizagem de máquina foram capazes de fazer tais decisões de forma mais precisa, sendo capazes de aprender a partir de instâncias de treinamento e com isso ser capaz de fazer a decisão

´

otima, levando em considera¸cão benef´ıcios e custos conhecidos parcialmente. Algoritmos de aprendizagem de máquina podem ser bastante complexos, porém o numero de vezes que ele é executado diariamente é grande. Isso, aliado a grande quantidade de informa¸cões faz com essa atividade seja praticamente imposs´ıvel para um ser humano, pois levaria bastante tempo para ser executado.

O aprendizado indutivo é a base do aprendizado de máquina e permite obter con- clusões sobre um conjunto de informa¸cões. Na indu¸cão, um conceito é aprendido efetuando-se inferência indutiva sobre os exemplos apresentados [8]. O aprendizado indutivo é divido em supervisionado enão supervisionado. No aprendizado supervisionado é dado um conjunto de dados rotulados onde sabemos qual a sa´ıda correta e que deve ser semelhante ao conjunto.

Já na aprendizagem de máquina não supervisionada, por outro lado, não se usa nenhum conjunto rotulado para o treinamento dos modelos, sendo assim ele não possui nenhuma idéia de como será o resultado final.

2.2 TENSORFLOW

Nos últimos anos, devido ao avan¸co da área de AI grande quantidade de investidores estão cada vez mais investindo dinheiro nessa área. As grandes empresas estão mudando suas áres de atua¸cão e se intitulando como ”empresas de AI”, a exemplos Google, Facebook e Microsoft.

Tensorflow é uma biblioteca de código aberto para computa¸cão númerica e aprendizagem de máquina desenvolvido pelo Google Brain Team em 2015. Devido a sua arquitetura flex´ıvel fornece uma implementa¸cão bastante simples em diversas plataformas como CPUs e GPUs, sendo usadas principalmente em diversas empresas do ramo tecnológico. Sua do- cumenta¸cão rica fez com que o TF se tornasse uma das principais bibliotecas usadas para aprendizagem de máquina. O nome da biblioteca ajuda a entender a forma de se trabalhar com ela: tensores são arrays multidimensionais, que vão fluindo pelos nós de um grafo [7].

19

(20)

Com o TF é poss´ıvel criar um modelo de predi¸cão, o qual é composto basicamente do algoritmo de aprendizagem de máquina com os dados fornecidos pelo usuário, como mostrado na figura 1.

Figura 1: Processo de cria¸cão de um modelo de predi¸cão. Fonte: Adaptado de Déborah Mesquita [7]

Note que ap´os os dados serem manipulados para se adequar a necessidade do problema

´

e adicionado o algoritmo de aprendizagem de máquina. O modelo de predi¸cão é composto pelo algoritmo de aprendizagem de máquina “treinado” com os dados foram fornecidos.

Embora o TF tenha diversas funcionalidades ele foi projetados principalmente para modelos de redes neurais profundas, onde possui mais funcionalidades. Redes neurais profundas é um subcampo da aprendizagem de máquina, onde seus algoritmos são desenvolvidos levando como inspira¸cão o funcionamento cerebral humano.

2.3 NUMPY

NumPy é um biblioteca para Python, a qual é responsável pela manipula¸cão de matrizes. O NumPy fornece uma gama de fun¸cões e opera¸cões que facilitam os programadores a executar alguns calculos númericos. Cálculos que são utilizados para executar tarefas como:

Modelos de aprendizagem de máquina, processamento de imagem e computa¸cão gráfica e tarefas matemáticas.

20

(21)

Na aprendizagem de máquina, o NumPy auxilia em vários calculos numéricos reali- zados em Array. Por exemplo, na multiplica¸cão, transposi¸cão e adi¸cão de Arrays. Os Arrays NumPy são usados para o armazenamento de dados de treinamento, usados para treinar modelos de aprendizagem de máquina, bem como os parâmetros usados no mesmo.

A estrutura de dados mais importante do NumPy é um tipo de array, intitulada ndarray. O objeto ndarray consiste em um segmento unidimensional cont´ıguo da memória do computador, combinado com um esquema de indexa¸cão que mapeia cada item para um local no bloco de memória [10]. Um numpy array é uma grade de valores, sendo todos do mesmo tipo e são indexados por uma tupla de inteiros não negativos.

2.4 SCIPY

SciPy é um conjunto de ferramentas cient´ıficas e numéricas de código aberto (BSD licenciado) para Python [9]. O SciPy contem fun¸cões para otimiza¸cão, álgebra linear, inte- gra¸cão, interpola¸cão, fun¸cões especiais, FFT, processamento digital de imagem e sinal. O Scipy usa como base o objeto da matriz NumPy e faz parte da NumPy stack, que incluem ferramentas como: Matplotlib, pandas e Sympy, além de outras bibliotecas que são constan- temente atualizadas e desenvolvidas pela comunidade. Essa pilha também é chamada pilha numpy

2.5 SCIKIT-LEARN

Scikit-Learn é uma biblioteca de aprendizado de máquina que possui uma vasta quantidade de algoritmos para treinamento de dados e previsões, incluindo algumas ferramentas importantes para classifica¸cão e regressão. O scikit-learn possui comunica¸cão com outras ferramentas, como SCIPY e NumPy.

21

(22)

3 TRABALHOS RELACIONADOS

3.1 Aprendizagem de m´aquina com Big Data

A aprendizagem de m´aquina vem atraindo bastante aten¸c˜ao desde o surgimento de Big Data como uma forma de extrair valor do dados. Algumas plataformas ML para Big Data come¸caram com abordagens que se baseiam em disco, como o Apache Mahout[1]. Devido o acesso ao disco ser lento, novas abordagens baseadas em memoria foram desenvolvidas.

Apache Spark e Oxdata H2O s˜ao exemplos de plataformas baseada em mem´oria.

Al-Jarrah et.al.[3] revisaram abordagens de aprendizagem de máquina eficientes em energia e novas abordagens com requisitos de memória reduzidos. Eles consideram a aprendizagem profunda como uma técnica que promete fornecer solu¸cões para problemas complexos.

Embora a aprendizagem profunda n˜ao seja algo novo, ela est´a passando por um renascimento devido aos avan¸cos e o crescimento em processamento.

3.2 Previs˜ao no consumo de energia

Devido aos avan¸cos tecnológicos, foram sendo produzidos sensores cada vez mais inteligentes. Com isso, previsões de consumo, que até então eram feitas cada ano passaram a serem feitos a cada 15 minutos. Abordagens com elevado grau de granularidade são normalmente atribu´ıdas a sensores, que por sua vez dependem de leituras históricas de energia e informa¸cões sobre o clima sem necessariamente entender da estrutura f´ısica do local.

Abordagens baseadas em sensores para previsão de eletricidade são diversas; alguns exemplos são regressão vetorial de suporte (SVR), redes neurais (NN), modelos auto regressivo de média móvel integrada (ARIMA) e previsão de cinza[11]. Suganthi e Samuel[11]

revisaram modelos de previs˜ao de demanda de eletricidade e perceberam que o NN tem sido bastante usado, devido a melhoria do processamento dos computadores fazendo o modelo ser acess´ıvel.

22

(23)

4 METODOLOGIA

4.1 DATASET

O Dataset utilizando é o AMPds2[2], que foi liberado com o intuito de ajudar o pesquisador a testar seus algoritmos, modelos, sistemas e protótipos. Este conjunto de dados contém um total de 1.051.200 leituras em dois anos de monitoramento (de abril/ 2012 a mar¸co/ 2014) devido a suas leituras serem feitas a cada 1 minuto e possuem 21 medidores de energia. Como os dados eram capturados a cada 1 minuto, foi necessário agrupar 1440, que é equivalente a quantidade de minutos que possue em um dia, para calcular o consumo diario. Os seguintes dados são lidos pelos medidores:

• Voltagem

• Corrente

• Frequˆencia

• Fator de potˆencia

• Poder ativo

• Poder reativo

• Poder aparente

• Energia

Porém, para calcular o consumo só precisaremos da potência, como mostrado na figura 2. Após o tratamento dos dados, o número resultante de leituras foram 754 já que cada consumo constava como um dia e não mais como o consumo do minuto.

Figura 2: C´alculo do consumo de energia. Fonte:

https://industriahoje.com.br/como-calcular-o-consumo-de-energia-eletrica 23

(24)

4.2 MODELOS DE PREVIS ˜AO

Afim de buscar os melhores resultados, quatro modelos foram investigados para se obtever o melhor resultado, incluindo auto regressivo (AR), auto regressivo de média móvel (ARMA), regressão polinomial e kernel gaussiano.

4.2.1 Modelo Autorregressivo

O modelo autorregressivo (AR) é amplamente utilizado na análise de séries temporais.

AR é um modelo de regressão, linear mas a variável de sa´ıda é regredida em seus próprios valores anteriores [4]. Com o modelo AR a previsão é feita levando em considera¸cão os dados anteriores. O modelo é definido como:

ondeϕ₁...ϕ_p são os parâmetros do modelo, c é uma constante e a variável aleatóriaε_t

´

e o erro aleatório. Um modelo autorregressivo de ordem ϕrecebe a nota¸cão AR(p). A série X_tpossui valores que são combina¸cões lineares dos p valores passados mais um termoε_tque

´

e o erro aleatório. Ou seja, a previsão é feita levando em considera¸cão os resultados antigos e é criado um modelo preditivo para realizar as predi¸cões.

4.2.2 Modelo Autorregressivo de m´edia m´ovel

Para uma melhor precisão do sistema, a média móvel(MA) é adicionada ao modelo autorregressivo. MA é uma regressão linear do valor atual de uma série temporal em rela¸cão aos termos de erro aleatório atuais e anteriores, e é comumente usada para suavizar flutua¸cões de curto prazo e destaca as tendências de longo prazo de uma série temporal [5]. O modelo MA é definido como:

ondeθ₁, ..., θ_q são os parâmetros, µé o valor esperadoX_te_t, t−1, ...é o erro aleatório.

24

(25)

O modelo autorregressivo de média móvel é a jun¸cão do AR e MA. O qual é baseado nas defini¸cões de AR e MA, sendo definido como:

4.2.3 Modelo de regress˜ao polinomial

A regressão linear é um modelo recomendado para fenômenos simples, quando as variáveis interagem de forma linear. O modelo de regressão polinomial surgiu para tratar de problemas não lineares. Possui a constru¸cão de polinomios que quanto maior o grau do polinômio maior será a capacidade da regressão. O modelo de regressão polinomial é definido como:

onde c é a constante, t é o erro aleatório em Xt, αi são os parâmetros do modelo e p é a ordem.

4.2.4 Modelo Kernel Gaussiano

O Kernel Gaussiano é uma abordagem não paramétrica para estima¸cão. Aestimativa da densidade do kernel gaussiano (KDE) é usado para estimar a fun¸cão de densidade de probabilidade dos dados [5]. O modelo Kernel Gaussiano é definido como:

onde K é o kernel e h > 0 é a largura de banda. O kernel é uma fun¸cão simétrica onde sua integral vale um.

25

(26)

4.2.4.1 Largura de banda

A largura de banda do kernel é um parametro de alisamento. A largura de banda inicial h é estimada minimizando a média do erro quadrado integrado (MISE) [5]. O MISE

´

e definido como:

a largura inicial ser´a ajustada automaticamente de acordo com o desempenho do modelo.

26

(27)

5 APRESENTAC ¸ ˜ AO E AN ´ ALISE DOS RESULTADOS

Para a avalia¸cão dos modelos foram usados 70% dos dados para treinamento do modelo de predi¸cão e 30% para os testes dos mesmo. Para medir a diferen¸ca são usados o erro absoluto médio (MAE) e o erro quadrático médio (MSE), foi usado também R squared (R²) como coeficiente de determina¸cão.

5.1 MODELO AUTOREGRESSIVO

Para a previsão do consumo de energia, esse modelo foi treinado com 70% dos dados totais, o equivalente a 527 dados. Devido a não linearidade dos dados esse modelo não obteve um resultado satisfatório, sendo assim o resultado do coeficiente de determina¸cão foi de 38%.

Como mostrado na figura abaixo:

Figura 3: Previs˜ao de consumo AR ordenado

onde a linha azul são os valores reais dos consumos de energia e a linha vermelha são os valores previstos pelo modelo. Percebe-se que os valores do Mean absolute error e do Mean squared error são distantes um do outro, isso de deve ao fato que o MAE não aumenta com a varia¸cão dos erros. O MSE aumenta com a variância da distribui¸cão de erro. A figura

27

(28)

3 é a previsão ordenada, para uma melhor visualiza¸cão, devido aos dados não serem lineares, a figura abaixo mostra os dados não ordenados.

Figura 4: Previs˜ao de consumo AR n˜ao ordenado

5.2 MODELO AUTORREGRESSIVO DE M´EDIA M ´OVEL

O modelo mesmo sendo acrescido da média móvel não obteve um resultado satis- fatório, isso se deve também pela não linearidade dos dados. O resultado do coeficiente de determina¸cão foi de 38%. Como mostrado na figura abaixo:

28

(29)

Figura 5: Previs˜ao de consumo ARMA ordenado

onde a linha azul são os valores reais dos consumos de energia e a linha vermelha são os valores previstos pelo modelo. Percebe-se que mesmo acrescido do modelo MA o modelo não conseguiu um resultado tão bom quanto o modelo AR. O modelo ARMA teve uma precisão muito baixa para prever os dados. A figura abaixo representa o resultado não ordenado.

29

(30)

Figura 6: Previs˜ao de consumo ARMA n˜ao ordenado

5.3 MODELO DE REGRESS ˜AO POLINOMIAL

O modelo de regressão polinomial é mais indicado para dados não lineares. De fato, devido aos dados não serem lineares fez com que o modelo de regressão polinomial tenha obtido o melhor resultado. O coeficiente de determina¸cão obteve o resultado de 71%, além do R squared foi usado a explained variance score, que mede a porpor¸cão em que um modelo matemático responde pela varia¸cão de um conjunto de dados. Mostrando na figura abaixo:

30

(31)

Figura 7: Previs˜ao de consumo Regress˜ao polinomial

onde a linha vermelha são os valores reais de consumo e a linha verde são os valores previstos pelo modelo. Observa-se que para consumos maiores que 30 kWh a precisão diminui drasticamente.

5.4 MODELO KERNEL GAUSSIANO

A probabilidade de cada dado ´e calculado e associado ao intervalo de tempo do mesmo.

Por ser um método de aprendizagem não supervisionada, o resultado não foi tão bom com- parado a regressão polinomial. A probabilidade da distribui¸cão kernel gaussiano é mostrado na figura abaixo:

31

(32)

Figura 8: Probabilidade da Distribui¸c˜ao kernel gaussiano

onde em preto ”+”são os dados de consumo de energia e a linha azul é a probabilidade do modelo de distribui¸cão kernel gaussiano dos dados.

5.5 DISCUSS ˜AO DOS RESULTADOS

Os resultados apresentados indicam que a regressão polinomial apresentou resultado satisfatório, acima dos demais modelos. Além disso, podemos concluir que devido a varia¸cão dos dados, modelos lineares, como AR e ARMA não são eficazes para realizar predi¸cões. O modelo kernel gaussiano apresentou alguns problemas em rela¸cão a sele¸cão do valor da largura de banda, que devido a inconstância dos dados não foi poss´ıvel obter um bom resultado. Para a obten¸cão dos resultados foi atribuida uma margem de erro para os resultados, foi usada no respectivo trabalho uma margem de erro de 10, para mais ou para menos.

32

(33)

6 CONCLUS ˜ OES E TRABALHOS FUTUROS

Neste trabalho, foram explorados quatro modelos para previsão de dados de consumo de energia. Durante todo o processo de manipula¸cão dos dados, os dados foram adaptados, come¸cando pelo calculo do consumo feito e depois para recolher os dados diários, pois os dados iniciais foram recolhidos de 1 em 1 minuto. Com base no que foi analisado foi conclu´ıdo que o modelo que melhor se adaptou a inconstância dos dados foi o modelo de regressão polinomial, já que obteve um resultado muito melhor dos demais.

Pesquisas futuras poderão ser concentradas em um modelo que poderia efetuar uma analise automatica em todo o dado e marcar pontos que possuem ou não um grau de constância e a partir dai seria selecionado o modelo que se adaptasse melhor a cada trecho dos dados. Os resultados poderiam ser melhores se o conjunto de dados fossem maiores(por exemplo, 10 anos), pois quanto maior os dados maior será a quantidade de dados treinados e melhor será o modelo de previsão.

33

(34)

REFERˆ ENCIAS

[1] Apache Mahout. Dispon´ıvel em: <http://mahout.apache.org>, Acesso em: 15 Set 2018.

http://mahout.apache.org.

[2] Dataverse Havard. Dispon´ıvel em: <https://dataverse.harvard.edu/dataset.xhtml?

persistentId=doi%3A10.7910/DVN/FIE0S4%20>, Acesso em: 15 Set 2018.

https://dataverse.harvard.edu/dataset.xhtml?persistentId=doi\%A10.7910/

DVN/FIE0S4\%20.

[3] Al-Jarrah, Omar Y, Paul D Yoo, Sami Muhaidat, George K Karagiannidis e Kamal Taha: Efficient machine learning for big data: A review. Big Data Research, 2(3):87–

93, 2015.

[4] Chatfield, Chris:The analysis of time series: an introduction. Chapman and Hall/CRC, 2016.

[5] Cui, Wenqiang e Hao Wang: A new anomaly detection system for school electricity consumption data. Information, 8(4):151, 2017.

[6] Kheirkhah, A., A. Azadeh, M. Saberi, A. Azaron e H. Shakouri: Improved Estimation of Electricity Demand Function by Using of Artificial Neural Network, Principal Com- ponent Analysis and Data Envelopment Analysis. Comput. Ind. Eng., 64(1):425–441, janeiro 2013, ISSN 0360-8352. http://dx.doi.org/10.1016/j.cie.2012.09.017.

[7] MESQUITA, D.: Classificando textos com Redes Neurais e Tensor- Flow. Dispon´ıvel em: <https://medium.com/@dehhmesquita/classificando- textos-com-redes-neurais-e-tensorflow-5063784a1b31>, Acesso

em: 15 Mar 2019. https://medium.com/@dehhmesquita/

classificando-textos-com-redes-neurais-e-tensorflow-5063784a1b31.

[8] Monard, Maria Carolina e José Augusto Baranauskas: Conceitos sobre aprendizado de máquina. Sistemas inteligentes-Fundamentos e aplica¸cões, 1(1):32, 2003.

[9] Oliphant, T., P. Peterson e E. Jones: SciPy. Dispon´ıvel em:

<https://www.scipy.org/scipylib/faq.html>, Acesso em: 12 Mar 2019. https:

//www.scipy.org/scipylib/faq.html.

[10] Santiago Jr, L.: Entendendo a biblioteca NumPy. Dispon´ıvel em:

<https://medium.com/ensina-ai/entendendo-a-biblioteca-numpy-4858fde63355>,

34

(35)

Acesso em: 14 Mar 2019. https://medium.com/ensina-ai/

entendendo-a-biblioteca-numpy-4858fde63355.

[11] Suganthi, L e Anand A Samuel: Energy models for demand forecasting—A review. Re- newable and sustainable energy reviews, 16(2):1223–1240, 2012.

[12] Unsihuay-Vila, C, AC Zambroni De Souza, JW Marangon-Lima e PP Balestrassi:Elec- tricity demand and spot price forecasting using evolutionary computation combined with chaotic nonlinear dynamic model. International journal of electrical power & energy systems, 32(2):108–116, 2010.

[13] Vilar, Juan M, Ricardo Cao e Germ´an Aneiros:Forecasting next-day electricity demand and price using nonparametric functional methods. International Journal of Electrical Power & Energy Systems, 39(1):48–55, 2012.

35