• Nenhum resultado encontrado

An´alise de modelos para previs˜oes de consumo de energia el´etrica e seu uso na redu¸c˜ao de custos

N/A
N/A
Protected

Academic year: 2021

Share "An´alise de modelos para previs˜oes de consumo de energia el´etrica e seu uso na redu¸c˜ao de custos"

Copied!
35
0
0

Texto

(1)

An´ alise de modelos para previs˜ oes de consumo de energia el´ etrica e seu uso na

redu¸ c˜ ao de custos

Leonardo Luiz do Nascimento Dantas Filho

CENTRO DE INFORM ´ATICA

UNIVERSIDADE FEDERAL DA PARA´IBA

Jo˜ao Pessoa, 2019

(2)
(3)

Leonardo Luiz do Nascimento Dantas Filho

An´ alise de modelos para previs˜ oes de consumo de energia el´etrica e seu uso na redu¸c˜ ao de custos

Monografia apresentada ao curso Ciˆencia da Computa¸c˜ao do Centro de Inform´atica, da Universidade Federal da Para´ıba, como requisito para a obten¸c˜ao do grau de Bacharel em Ciˆencia da Computa¸c˜ao Orientador: Prof. Dr. Clauirton de Albuquerque Siebra

Maio de 2019

(4)

F481a Filho, Leonardo Luiz do Nascimento Dantas.

Análise de modelos para previsões de consumo de energia elétrica e seu uso na redução de custos / Leonardo Luiz do Nascimento Dantas Filho. - João Pessoa, 2019.

35 f. : il.

Orientação: Clauirton de Albuquerque Siebra.

TCC (Especialização) - UFPB/CI.

1. Aprendizagem de Máquina. I. Siebra, Clauirton de Albuquerque. II. Título.

UFPB/CI

Catalogação na publicação Seção de Catalogação e Classificação

(5)
(6)
(7)

“Nunca deixe que lhe digam que n˜ao vale a pena acreditar no sonho que se tem ou que seus planos nunca v˜ao dar certo ou que vocˆe nunca vai ser algu´em.”

(Renato Russo)

(8)
(9)

DEDICAT ´ ORIA

Dedico este trabalho ao meu avˆo, Luiz Santa Rosa Dantas, e a minha av´o Maria Clara de Sousa Lima, que foram duas pessoas que me espelho como ser humano, que amo imensamente e que estar˜ao presentes em meu cora¸c˜ao at´e resto de minha vida.

(10)

AGRADECIMENTOS

Agrade¸co a Deus pelas gra¸cas recebidas, pela sa´ude e prote¸c˜ao a mim dedicada, e pelas pessoas colocadas em minha vida. Agrade¸co aos meus pais Leonardo Dantas e Suely Rejane Lima, minha av´o Maria Clara Lima pela educa¸c˜ao, suporte, e pelo grande amor recebido em todos os momentos da vida. `A Sebasti˜ao Barbosa pelo apoio, pelos serm˜oes e pela confian¸ca depositada em mim. `A minha namorada, S´askya Ayla, que fez uma enorme diferen¸ca, me aconselhando, me dando confian¸ca, for¸ca para seguir em frente, alguns pux˜oes de orelha e sendo paciente com minha ausˆencia devido `as atividades relacionadas a esse trabalho e ao longo do curso. Ao meu orientador, Clauirton Siebra, que tanto me ajudou atrav´es de ideias e incentivos que resultaram no meu amadurecimento acadˆemico e profissional. `A UFPB e sua estrutura, em especial aos professores e funcion´arios do Centro de Inform´atica, que me proporcionaram essa oportunidade.

Por fim, a todos os meus familiares, aos meus amigos, amigos do curso de Ciˆencia da Computa¸c˜ao da UFPB que indiretamente contribu´ıram para esse trabalho simplesmente por me apoiarem e ao Programa de Educa¸c˜ao Tutorial Computa¸c˜ao (PET Computa¸c˜ao) pelo suporte na constru¸c˜ao do meu lado acadˆemico. E aos professores que se dedicaram a proporcionar os conhecimentos que levarei para a vida.

(11)

RESUMO

A aprendizagem de m´aquina tem sido bastante utilizada em v´arios ˆambitos de pes- quisa e aplica¸c˜ao, como mecanismos de busca, detec¸c˜ao de fraudes, processamento de lin- guagem natural, detec¸c˜ao de anomalia, previs˜ao de demanda e ve´ıculos autˆonomos. Neste documento, nos concentramos a analisar os principais modelos de previs˜ao, afim de escolher o que melhor se adapta aos dados de consumo de energia residencial. Al´em disso foi realizado uma an´alise nos dados, altera¸c˜oes que foram necess´arias para que os dados ficassem dentro dos requisitos escolhidos, foi apresentado tamb´em todos os resultados dos modelos escolhi- dos e explicado como cada modelo se adaptou aos dados. Tamb´em ser´a mostrado todas as tecnologias para a realiza¸c˜ao do respectivo trabalho.

Palavras-chave: Aprendizagem de M´aquina, Modelo de Previs˜ao,Consumo de Ener- gia e An´alise de Dados.

(12)

ABSTRACT

Machine learning has been widely used in a number of research and application do- mains, such as search engines, fraud detection, natural language processing, anomaly detec- tion, demand forecasting, and standalone vehicles. In this document, we focus on analyzing the major forecasting models in order to choose the one that best fits the residential energy consumption data. In addition, an analysis was performed on the data, changes that were necessary to keep the data within the chosen requirements, also presented all the results of the chosen models and explained how each model adapted to the data. Moreover, we also show all the technologies used to conduct the present work

Key-words: Machine Learning, Forecasting Model, Energy Consumption and Data Analysis.

(13)

LISTA DE FIGURAS

1 Processo de cria¸c˜ao de um modelo de predi¸c˜ao. Fonte: Adaptado de D´eborah

Mesquita [7] . . . 20

2 C´alculo do consumo de energia. Fonte: https://industriahoje.com.br/como- calcular-o-consumo-de-energia-eletrica . . . 23

3 Previs˜ao de consumo AR ordenado . . . 27

4 Previs˜ao de consumo AR n˜ao ordenado . . . 28

5 Previs˜ao de consumo ARMA ordenado . . . 29

6 Previs˜ao de consumo ARMA n˜ao ordenado . . . 30

7 Previs˜ao de consumo Regress˜ao polinomial . . . 31

8 Probabilidade da Distribui¸c˜ao kernel gaussiano . . . 32

(14)

LISTA DE ABREVIATURAS

AI - Artificial intelligence ML - Machine learning

BSD - Berkeley Software Distribution SVR - Support vector regression NN - Neural networks

ARIMA - Autoregressive integrated moving average AR - Modelo Autorregressivo

MA - Modelo de M´edias M´oveis

ARMA - Modelo Autorregressivo e de M´edias M´oveis MISE - Mean integrated squared error

TF- TensorFlow

(15)

Conte´ udo

1 INTRODUC¸ ˜AO 17

1.1 OBJETIVOS . . . 17

1.1.1 Objetivo geral . . . 17

1.1.2 Objetivos espec´ıficos . . . 17

1.2 ESTRUTURA DA MONOGRAFIA . . . 18

2 FUNDAMENTAC¸ ˜AO TE ´ORICA 19 2.1 Aprendizagem de m´aquina . . . 19

2.2 TENSORFLOW . . . 19

2.3 NUMPY . . . 20

2.4 SCIPY . . . 21

2.5 SCIKIT-LEARN . . . 21

3 TRABALHOS RELACIONADOS 22 3.1 Aprendizagem de m´aquina com Big Data . . . 22

3.2 Previs˜ao no consumo de energia . . . 22

4 METODOLOGIA 23 4.1 DATASET . . . 23

4.2 MODELOS DE PREVIS ˜AO . . . 24

4.2.1 Modelo Autorregressivo . . . 24

4.2.2 Modelo Autorregressivo de m´edia m´ovel . . . 24

4.2.3 Modelo de regress˜ao polinomial . . . 25

4.2.4 Modelo Kernel Gaussiano . . . 25

5 APRESENTAC¸ ˜AO E AN ´ALISE DOS RESULTADOS 27 5.1 MODELO AUTOREGRESSIVO . . . 27

5.2 MODELO AUTORREGRESSIVO DE M´EDIA M ´OVEL . . . 28 15

(16)

5.3 MODELO DE REGRESS ˜AO POLINOMIAL . . . 30 5.4 MODELO KERNEL GAUSSIANO . . . 31 5.5 DISCUSS ˜AO DOS RESULTADOS . . . 32

6 CONCLUS ˜OES E TRABALHOS FUTUROS 33

REFERˆENCIAS 33

16

(17)

1 INTRODUC ¸ ˜ AO

A energia sempre foi uma parte fundamental para o funcionamento e evolu¸c˜ao da so- ciedade. Na sociedade moderna, a eletricidade se destaca como um dos recursos energ´eticos essenciais para o desenvolvimento e na manuten¸c˜ao de diversas atividades di´arias. Nas metr´opoles, devido a estarmos a maior parte do tempo conectados, a eletricidade se tornou importante para diferentes tarefas, como comunica¸c˜ao, estudo, afazares dom´esticos, con- serva¸c˜ao de alimentos, hospitais, dentre outros. As empresas utilizam a energia el´etrica como um fator de produ¸c˜ao, enquanto o bem-estar das fam´ılias depende, direta ou indiretamente, do consumo de eletricidade [6].

Compreender e mensurar de maneira correta a demanda de energia el´etrica ´e vital para a sobrevivˆencia das empresas que a produzem, tanto a entrega como a revenda, pois a eletricidade, em grandes quantidades, n˜ao pode ser armazenada de forma vi´avel e eficiente e, consequentemente, a sua demanda deve ser quase que instantaneamente atendida [13].

Tanto a superestima¸c˜ao quanto a subestima¸c˜ao da gera¸c˜ao de energia el´etrica geram custos para os agentes desse mercado e devem ser evitadas. Um planejamento eficiente sobre o comportamento da demanda de energia el´etrica ´e indispens´avel para que os agentes possam desenvolver estrat´egias voltadas para a maximiza¸c˜ao de lucro e minimiza¸c˜ao de riscos [12].

1.1 OBJETIVOS 1.1.1 Objetivo geral

O trabalho tem como objetivo geral explorar os m´etodos de predi¸c˜ao e definir o mais eficiente para prever o consumo de energia de residˆencias, que possibilite uma melhor estima¸c˜ao de gastos por parte da empresa respons´avel por distribuir energia.

1.1.2 Objetivos espec´ıficos

No que diz respeito aos objetivos espec´ıficos, pretende-se:

• Apresentar um estudo investigativo dos diferentes modelos de predi¸c˜oes existentes e selecionar a que possuir melhores resultados;

• Manipular os dados utilizados para se adequar aos paramˆetros que ser˜ao analisados;

• Descrever os modelos utilizados para as predi¸c˜oes;

17

(18)

• Apresentar gr´aficos mostrando os resultados de cada modelo utilizado;

1.2 ESTRUTURA DA MONOGRAFIA

Este trabalho est´a estruturado da seguinte forma: na Se¸c˜ao 1 s˜ao apresentadas a introdu¸c˜ao, a relevˆancia do tema e os objetivos gerais e espec´ıficos do trabalho. Na se¸c˜ao 2 s˜ao apresentadas as bases te´oricas do trabalho. Na se¸c˜ao 3 s˜ao apresentados os trabalhos correlatos `a ideia de predi¸c˜oes de consumo de energia. Na se¸c˜ao 4 ´e apresentado o banco que foi utilizados nesse trabalho e tamb´em os modelos utilizados para o mesmo. Na se¸c˜ao 5

´

e apresentdo os resultados dos modelos de predi¸c˜oes utilizados. Na se¸c˜ao 6 s˜ao apresentadas as conclus˜oes e propostas de trabalhos futuros.

18

(19)

2 FUNDAMENTAC ¸ ˜ AO TE ´ ORICA

2.1 Aprendizagem de m´aquina

Por anos os seres humanos mantinham o controle sobre as decis˜oes que afetavam sua vida cotidiana, mas com a avan¸co a tecnologia cada vez mais os algoritmos de aprendizagem de m´aquina foram capazes de fazer tais decis˜oes de forma mais precisa, sendo capazes de aprender a partir de instˆancias de treinamento e com isso ser capaz de fazer a decis˜ao

´

otima, levando em considera¸c˜ao benef´ıcios e custos conhecidos parcialmente. Algoritmos de aprendizagem de m´aquina podem ser bastante complexos, por´em o numero de vezes que ele ´e executado diariamente ´e grande. Isso, aliado a grande quantidade de informa¸c˜oes faz com essa atividade seja praticamente imposs´ıvel para um ser humano, pois levaria bastante tempo para ser executado.

O aprendizado indutivo ´e a base do aprendizado de m´aquina e permite obter con- clus˜oes sobre um conjunto de informa¸c˜oes. Na indu¸c˜ao, um conceito ´e aprendido efetuando-se inferˆencia indutiva sobre os exemplos apresentados [8]. O aprendizado indutivo ´e divido em supervisionado en˜ao supervisionado. No aprendizado supervisionado ´e dado um conjunto de dados rotulados onde sabemos qual a sa´ıda correta e que deve ser semelhante ao conjunto.

J´a na aprendizagem de m´aquina n˜ao supervisionada, por outro lado, n˜ao se usa nenhum conjunto rotulado para o treinamento dos modelos, sendo assim ele n˜ao possui nenhuma id´eia de como ser´a o resultado final.

2.2 TENSORFLOW

Nos ´ultimos anos, devido ao avan¸co da ´area de AI grande quantidade de investidores est˜ao cada vez mais investindo dinheiro nessa ´area. As grandes empresas est˜ao mudando suas ´ares de atua¸c˜ao e se intitulando como ”empresas de AI”, a exemplos Google, Facebook e Microsoft.

Tensorflow ´e uma biblioteca de c´odigo aberto para computa¸c˜ao n´umerica e aprendi- zagem de m´aquina desenvolvido pelo Google Brain Team em 2015. Devido a sua arquitetura flex´ıvel fornece uma implementa¸c˜ao bastante simples em diversas plataformas como CPUs e GPUs, sendo usadas principalmente em diversas empresas do ramo tecnol´ogico. Sua do- cumenta¸c˜ao rica fez com que o TF se tornasse uma das principais bibliotecas usadas para aprendizagem de m´aquina. O nome da biblioteca ajuda a entender a forma de se trabalhar com ela: tensores s˜ao arrays multidimensionais, que v˜ao fluindo pelos n´os de um grafo [7].

19

(20)

Com o TF ´e poss´ıvel criar um modelo de predi¸c˜ao, o qual ´e composto basicamente do algo- ritmo de aprendizagem de m´aquina com os dados fornecidos pelo usu´ario, como mostrado na figura 1.

Figura 1: Processo de cria¸c˜ao de um modelo de predi¸c˜ao. Fonte: Adaptado de D´eborah Mesquita [7]

Note que ap´os os dados serem manipulados para se adequar a necessidade do problema

´

e adicionado o algoritmo de aprendizagem de m´aquina. O modelo de predi¸c˜ao ´e composto pelo algoritmo de aprendizagem de m´aquina “treinado” com os dados foram fornecidos.

Embora o TF tenha diversas funcionalidades ele foi projetados principalmente para modelos de redes neurais profundas, onde possui mais funcionalidades. Redes neurais pro- fundas ´e um subcampo da aprendizagem de m´aquina, onde seus algoritmos s˜ao desenvolvidos levando como inspira¸c˜ao o funcionamento cerebral humano.

2.3 NUMPY

NumPy ´e um biblioteca para Python, a qual ´e respons´avel pela manipula¸c˜ao de matrizes. O NumPy fornece uma gama de fun¸c˜oes e opera¸c˜oes que facilitam os programadores a executar alguns calculos n´umericos. C´alculos que s˜ao utilizados para executar tarefas como:

Modelos de aprendizagem de m´aquina, processamento de imagem e computa¸c˜ao gr´afica e tarefas matem´aticas.

20

(21)

Na aprendizagem de m´aquina, o NumPy auxilia em v´arios calculos num´ericos reali- zados em Array. Por exemplo, na multiplica¸c˜ao, transposi¸c˜ao e adi¸c˜ao de Arrays. Os Arrays NumPy s˜ao usados para o armazenamento de dados de treinamento, usados para treinar modelos de aprendizagem de m´aquina, bem como os parˆametros usados no mesmo.

A estrutura de dados mais importante do NumPy ´e um tipo de array, intitulada ndarray. O objeto ndarray consiste em um segmento unidimensional cont´ıguo da mem´oria do computador, combinado com um esquema de indexa¸c˜ao que mapeia cada item para um local no bloco de mem´oria [10]. Um numpy array ´e uma grade de valores, sendo todos do mesmo tipo e s˜ao indexados por uma tupla de inteiros n˜ao negativos.

2.4 SCIPY

SciPy ´e um conjunto de ferramentas cient´ıficas e num´ericas de c´odigo aberto (BSD licenciado) para Python [9]. O SciPy contem fun¸c˜oes para otimiza¸c˜ao, ´algebra linear, inte- gra¸c˜ao, interpola¸c˜ao, fun¸c˜oes especiais, FFT, processamento digital de imagem e sinal. O Scipy usa como base o objeto da matriz NumPy e faz parte da NumPy stack, que incluem ferramentas como: Matplotlib, pandas e Sympy, al´em de outras bibliotecas que s˜ao constan- temente atualizadas e desenvolvidas pela comunidade. Essa pilha tamb´em ´e chamada pilha numpy

2.5 SCIKIT-LEARN

Scikit-Learn ´e uma biblioteca de aprendizado de m´aquina que possui uma vasta quan- tidade de algoritmos para treinamento de dados e previs˜oes, incluindo algumas ferramentas importantes para classifica¸c˜ao e regress˜ao. O scikit-learn possui comunica¸c˜ao com outras ferramentas, como SCIPY e NumPy.

21

(22)

3 TRABALHOS RELACIONADOS

3.1 Aprendizagem de m´aquina com Big Data

A aprendizagem de m´aquina vem atraindo bastante aten¸c˜ao desde o surgimento de Big Data como uma forma de extrair valor do dados. Algumas plataformas ML para Big Data come¸caram com abordagens que se baseiam em disco, como o Apache Mahout[1]. Devido o acesso ao disco ser lento, novas abordagens baseadas em memoria foram desenvolvidas.

Apache Spark e Oxdata H2O s˜ao exemplos de plataformas baseada em mem´oria.

Al-Jarrah et.al.[3] revisaram abordagens de aprendizagem de m´aquina eficientes em energia e novas abordagens com requisitos de mem´oria reduzidos. Eles consideram a aprendi- zagem profunda como uma t´ecnica que promete fornecer solu¸c˜oes para problemas complexos.

Embora a aprendizagem profunda n˜ao seja algo novo, ela est´a passando por um renascimento devido aos avan¸cos e o crescimento em processamento.

3.2 Previs˜ao no consumo de energia

Devido aos avan¸cos tecnol´ogicos, foram sendo produzidos sensores cada vez mais inteligentes. Com isso, previs˜oes de consumo, que at´e ent˜ao eram feitas cada ano passaram a serem feitos a cada 15 minutos. Abordagens com elevado grau de granularidade s˜ao normalmente atribu´ıdas a sensores, que por sua vez dependem de leituras hist´oricas de energia e informa¸c˜oes sobre o clima sem necessariamente entender da estrutura f´ısica do local.

Abordagens baseadas em sensores para previs˜ao de eletricidade s˜ao diversas; alguns exemplos s˜ao regress˜ao vetorial de suporte (SVR), redes neurais (NN), modelos auto regres- sivo de m´edia m´ovel integrada (ARIMA) e previs˜ao de cinza[11]. Suganthi e Samuel[11]

revisaram modelos de previs˜ao de demanda de eletricidade e perceberam que o NN tem sido bastante usado, devido a melhoria do processamento dos computadores fazendo o modelo ser acess´ıvel.

22

(23)

4 METODOLOGIA

4.1 DATASET

O Dataset utilizando ´e o AMPds2[2], que foi liberado com o intuito de ajudar o pesquisador a testar seus algoritmos, modelos, sistemas e prot´otipos. Este conjunto de dados cont´em um total de 1.051.200 leituras em dois anos de monitoramento (de abril/ 2012 a mar¸co/ 2014) devido a suas leituras serem feitas a cada 1 minuto e possuem 21 medidores de energia. Como os dados eram capturados a cada 1 minuto, foi necess´ario agrupar 1440, que ´e equivalente a quantidade de minutos que possue em um dia, para calcular o consumo diario. Os seguintes dados s˜ao lidos pelos medidores:

• Voltagem

• Corrente

• Frequˆencia

• Fator de potˆencia

• Poder ativo

• Poder reativo

• Poder aparente

• Energia

Por´em, para calcular o consumo s´o precisaremos da potˆencia, como mostrado na figura 2. Ap´os o tratamento dos dados, o n´umero resultante de leituras foram 754 j´a que cada consumo constava como um dia e n˜ao mais como o consumo do minuto.

Figura 2: C´alculo do consumo de energia. Fonte:

https://industriahoje.com.br/como-calcular-o-consumo-de-energia-eletrica 23

(24)

4.2 MODELOS DE PREVIS ˜AO

Afim de buscar os melhores resultados, quatro modelos foram investigados para se obtever o melhor resultado, incluindo auto regressivo (AR), auto regressivo de m´edia m´ovel (ARMA), regress˜ao polinomial e kernel gaussiano.

4.2.1 Modelo Autorregressivo

O modelo autorregressivo (AR) ´e amplamente utilizado na an´alise de s´eries temporais.

AR ´e um modelo de regress˜ao, linear mas a vari´avel de sa´ıda ´e regredida em seus pr´oprios valores anteriores [4]. Com o modelo AR a previs˜ao ´e feita levando em considera¸c˜ao os dados anteriores. O modelo ´e definido como:

ondeϕ1...ϕp s˜ao os parˆametros do modelo, c ´e uma constante e a vari´avel aleat´oriaεt

´

e o erro aleat´orio. Um modelo autorregressivo de ordem ϕrecebe a nota¸c˜ao AR(p). A s´erie Xtpossui valores que s˜ao combina¸c˜oes lineares dos p valores passados mais um termoεtque

´

e o erro aleat´orio. Ou seja, a previs˜ao ´e feita levando em considera¸c˜ao os resultados antigos e ´e criado um modelo preditivo para realizar as predi¸c˜oes.

4.2.2 Modelo Autorregressivo de m´edia m´ovel

Para uma melhor precis˜ao do sistema, a m´edia m´ovel(MA) ´e adicionada ao modelo autorregressivo. MA ´e uma regress˜ao linear do valor atual de uma s´erie temporal em rela¸c˜ao aos termos de erro aleat´orio atuais e anteriores, e ´e comumente usada para suavizar flutua¸c˜oes de curto prazo e destaca as tendˆencias de longo prazo de uma s´erie temporal [5]. O modelo MA ´e definido como:

ondeθ1, ..., θq s˜ao os parˆametros, µ´e o valor esperadoXtet, t−1, ...´e o erro aleat´orio.

24

(25)

O modelo autorregressivo de m´edia m´ovel ´e a jun¸c˜ao do AR e MA. O qual ´e baseado nas defini¸c˜oes de AR e MA, sendo definido como:

4.2.3 Modelo de regress˜ao polinomial

A regress˜ao linear ´e um modelo recomendado para fenˆomenos simples, quando as vari´aveis interagem de forma linear. O modelo de regress˜ao polinomial surgiu para tratar de problemas n˜ao lineares. Possui a constru¸c˜ao de polinomios que quanto maior o grau do polinˆomio maior ser´a a capacidade da regress˜ao. O modelo de regress˜ao polinomial ´e definido como:

onde c ´e a constante, t ´e o erro aleat´orio em Xt, αi s˜ao os parˆametros do modelo e p ´e a ordem.

4.2.4 Modelo Kernel Gaussiano

O Kernel Gaussiano ´e uma abordagem n˜ao param´etrica para estima¸c˜ao. Aestimativa da densidade do kernel gaussiano (KDE) ´e usado para estimar a fun¸c˜ao de densidade de probabilidade dos dados [5]. O modelo Kernel Gaussiano ´e definido como:

onde K ´e o kernel e h > 0 ´e a largura de banda. O kernel ´e uma fun¸c˜ao sim´etrica onde sua integral vale um.

25

(26)

4.2.4.1 Largura de banda

A largura de banda do kernel ´e um parametro de alisamento. A largura de banda inicial h ´e estimada minimizando a m´edia do erro quadrado integrado (MISE) [5]. O MISE

´

e definido como:

a largura inicial ser´a ajustada automaticamente de acordo com o desempenho do modelo.

26

(27)

5 APRESENTAC ¸ ˜ AO E AN ´ ALISE DOS RESULTADOS

Para a avalia¸c˜ao dos modelos foram usados 70% dos dados para treinamento do modelo de predi¸c˜ao e 30% para os testes dos mesmo. Para medir a diferen¸ca s˜ao usados o erro absoluto m´edio (MAE) e o erro quadr´atico m´edio (MSE), foi usado tamb´em R squared (R2) como coeficiente de determina¸c˜ao.

5.1 MODELO AUTOREGRESSIVO

Para a previs˜ao do consumo de energia, esse modelo foi treinado com 70% dos dados totais, o equivalente a 527 dados. Devido a n˜ao linearidade dos dados esse modelo n˜ao obteve um resultado satisfat´orio, sendo assim o resultado do coeficiente de determina¸c˜ao foi de 38%.

Como mostrado na figura abaixo:

Figura 3: Previs˜ao de consumo AR ordenado

onde a linha azul s˜ao os valores reais dos consumos de energia e a linha vermelha s˜ao os valores previstos pelo modelo. Percebe-se que os valores do Mean absolute error e do Mean squared error s˜ao distantes um do outro, isso de deve ao fato que o MAE n˜ao aumenta com a varia¸c˜ao dos erros. O MSE aumenta com a variˆancia da distribui¸c˜ao de erro. A figura

27

(28)

3 ´e a previs˜ao ordenada, para uma melhor visualiza¸c˜ao, devido aos dados n˜ao serem lineares, a figura abaixo mostra os dados n˜ao ordenados.

Figura 4: Previs˜ao de consumo AR n˜ao ordenado

5.2 MODELO AUTORREGRESSIVO DE M´EDIA M ´OVEL

O modelo mesmo sendo acrescido da m´edia m´ovel n˜ao obteve um resultado satis- fat´orio, isso se deve tamb´em pela n˜ao linearidade dos dados. O resultado do coeficiente de determina¸c˜ao foi de 38%. Como mostrado na figura abaixo:

28

(29)

Figura 5: Previs˜ao de consumo ARMA ordenado

onde a linha azul s˜ao os valores reais dos consumos de energia e a linha vermelha s˜ao os valores previstos pelo modelo. Percebe-se que mesmo acrescido do modelo MA o modelo n˜ao conseguiu um resultado t˜ao bom quanto o modelo AR. O modelo ARMA teve uma precis˜ao muito baixa para prever os dados. A figura abaixo representa o resultado n˜ao ordenado.

29

(30)

Figura 6: Previs˜ao de consumo ARMA n˜ao ordenado

5.3 MODELO DE REGRESS ˜AO POLINOMIAL

O modelo de regress˜ao polinomial ´e mais indicado para dados n˜ao lineares. De fato, devido aos dados n˜ao serem lineares fez com que o modelo de regress˜ao polinomial tenha obtido o melhor resultado. O coeficiente de determina¸c˜ao obteve o resultado de 71%, al´em do R squared foi usado a explained variance score, que mede a porpor¸c˜ao em que um modelo matem´atico responde pela varia¸c˜ao de um conjunto de dados. Mostrando na figura abaixo:

30

(31)

Figura 7: Previs˜ao de consumo Regress˜ao polinomial

onde a linha vermelha s˜ao os valores reais de consumo e a linha verde s˜ao os valores previstos pelo modelo. Observa-se que para consumos maiores que 30 kWh a precis˜ao diminui drasticamente.

5.4 MODELO KERNEL GAUSSIANO

A probabilidade de cada dado ´e calculado e associado ao intervalo de tempo do mesmo.

Por ser um m´etodo de aprendizagem n˜ao supervisionada, o resultado n˜ao foi t˜ao bom com- parado a regress˜ao polinomial. A probabilidade da distribui¸c˜ao kernel gaussiano ´e mostrado na figura abaixo:

31

(32)

Figura 8: Probabilidade da Distribui¸c˜ao kernel gaussiano

onde em preto ”+”s˜ao os dados de consumo de energia e a linha azul ´e a probabilidade do modelo de distribui¸c˜ao kernel gaussiano dos dados.

5.5 DISCUSS ˜AO DOS RESULTADOS

Os resultados apresentados indicam que a regress˜ao polinomial apresentou resultado satisfat´orio, acima dos demais modelos. Al´em disso, podemos concluir que devido a varia¸c˜ao dos dados, modelos lineares, como AR e ARMA n˜ao s˜ao eficazes para realizar predi¸c˜oes. O modelo kernel gaussiano apresentou alguns problemas em rela¸c˜ao a sele¸c˜ao do valor da largura de banda, que devido a inconstˆancia dos dados n˜ao foi poss´ıvel obter um bom resultado. Para a obten¸c˜ao dos resultados foi atribuida uma margem de erro para os resultados, foi usada no respectivo trabalho uma margem de erro de 10, para mais ou para menos.

32

(33)

6 CONCLUS ˜ OES E TRABALHOS FUTUROS

Neste trabalho, foram explorados quatro modelos para previs˜ao de dados de consumo de energia. Durante todo o processo de manipula¸c˜ao dos dados, os dados foram adaptados, come¸cando pelo calculo do consumo feito e depois para recolher os dados di´arios, pois os dados iniciais foram recolhidos de 1 em 1 minuto. Com base no que foi analisado foi conclu´ıdo que o modelo que melhor se adaptou a inconstˆancia dos dados foi o modelo de regress˜ao polinomial, j´a que obteve um resultado muito melhor dos demais.

Pesquisas futuras poder˜ao ser concentradas em um modelo que poderia efetuar uma analise automatica em todo o dado e marcar pontos que possuem ou n˜ao um grau de constˆancia e a partir dai seria selecionado o modelo que se adaptasse melhor a cada trecho dos dados. Os resultados poderiam ser melhores se o conjunto de dados fossem maiores(por exemplo, 10 anos), pois quanto maior os dados maior ser´a a quantidade de dados treinados e melhor ser´a o modelo de previs˜ao.

33

(34)

REFERˆ ENCIAS

[1] Apache Mahout. Dispon´ıvel em: <http://mahout.apache.org>, Acesso em: 15 Set 2018.

http://mahout.apache.org.

[2] Dataverse Havard. Dispon´ıvel em: <https://dataverse.harvard.edu/dataset.xhtml?

persistentId=doi%3A10.7910/DVN/FIE0S4%20>, Acesso em: 15 Set 2018.

https://dataverse.harvard.edu/dataset.xhtml?persistentId=doi\%A10.7910/

DVN/FIE0S4\%20.

[3] Al-Jarrah, Omar Y, Paul D Yoo, Sami Muhaidat, George K Karagiannidis e Kamal Taha: Efficient machine learning for big data: A review. Big Data Research, 2(3):87–

93, 2015.

[4] Chatfield, Chris:The analysis of time series: an introduction. Chapman and Hall/CRC, 2016.

[5] Cui, Wenqiang e Hao Wang: A new anomaly detection system for school electricity consumption data. Information, 8(4):151, 2017.

[6] Kheirkhah, A., A. Azadeh, M. Saberi, A. Azaron e H. Shakouri: Improved Estimation of Electricity Demand Function by Using of Artificial Neural Network, Principal Com- ponent Analysis and Data Envelopment Analysis. Comput. Ind. Eng., 64(1):425–441, janeiro 2013, ISSN 0360-8352. http://dx.doi.org/10.1016/j.cie.2012.09.017.

[7] MESQUITA, D.: Classificando textos com Redes Neurais e Tensor- Flow. Dispon´ıvel em: <https://medium.com/@dehhmesquita/classificando- textos-com-redes-neurais-e-tensorflow-5063784a1b31>, Acesso

em: 15 Mar 2019. https://medium.com/@dehhmesquita/

classificando-textos-com-redes-neurais-e-tensorflow-5063784a1b31.

[8] Monard, Maria Carolina e Jos´e Augusto Baranauskas: Conceitos sobre aprendizado de m´aquina. Sistemas inteligentes-Fundamentos e aplica¸c˜oes, 1(1):32, 2003.

[9] Oliphant, T., P. Peterson e E. Jones: SciPy. Dispon´ıvel em:

<https://www.scipy.org/scipylib/faq.html>, Acesso em: 12 Mar 2019. https:

//www.scipy.org/scipylib/faq.html.

[10] Santiago Jr, L.: Entendendo a biblioteca NumPy. Dispon´ıvel em:

<https://medium.com/ensina-ai/entendendo-a-biblioteca-numpy-4858fde63355>,

34

(35)

Acesso em: 14 Mar 2019. https://medium.com/ensina-ai/

entendendo-a-biblioteca-numpy-4858fde63355.

[11] Suganthi, L e Anand A Samuel: Energy models for demand forecasting—A review. Re- newable and sustainable energy reviews, 16(2):1223–1240, 2012.

[12] Unsihuay-Vila, C, AC Zambroni De Souza, JW Marangon-Lima e PP Balestrassi:Elec- tricity demand and spot price forecasting using evolutionary computation combined with chaotic nonlinear dynamic model. International journal of electrical power & energy systems, 32(2):108–116, 2010.

[13] Vilar, Juan M, Ricardo Cao e Germ´an Aneiros:Forecasting next-day electricity demand and price using nonparametric functional methods. International Journal of Electrical Power & Energy Systems, 39(1):48–55, 2012.

35

Referências

Documentos relacionados

forficata recém-colhidas foram tratadas com escarificação mecânica, imersão em ácido sulfúrico concentrado durante 5 e 10 minutos, sementes armazenadas na geladeira (3 ± 1

Eles (SEE) mandaram para a gente como que eles fizeram discussão das análises dos resultados, pensando na ideia de avaliação interna. São os quatro eixos que você vai ver na

v) por conseguinte, desenvolveu-se uma aproximação semi-paramétrica decompondo o problema de estimação em três partes: (1) a transformação das vazões anuais em cada lo-

Segundo Éric Laurent, a psicose ordinária se caracteriza pela não resposta aos significantes-mestres tradicionais, manifestando o fim do poder do Nome-do-Pai como

A assistência da equipe de enfermagem para a pessoa portadora de Diabetes Mellitus deve ser desenvolvida para um processo de educação em saúde que contribua para que a

Acredita-se que as pes- soas especiais devem estar presentes não só como ouvintes, mas como agentes que possam estar envolvidos nas discussões e decisões sobre uma

Se você vai para o mundo da fantasia e não está consciente de que está lá, você está se alienando da realidade (fugindo da realidade), você não está no aqui e

Envio de memorando ao Gabinete do Reitor para inclusão dos Calendários Letivos. e os respectivos pareceres na pauta