• Nenhum resultado encontrado

Como referido anteriormente, os dados dos consumos energ ´eticos estavam em bases de dados em SQL Server. O objetivo de definir crit ´erios de selec¸ ˜ao de instalac¸ ˜oes foi

eliminar da base de dados registos que n ˜ao eram adequados ao estudo. Assim, esta etapa foi realizada no SQL Server por ser mais simples e mais r ´apida a selec¸ ˜ao de regis-

tos. Em SQL Server existem comandos como SELECT ... FROM ..., DELETE ... FROM

..., que permitem a manipulac¸ ˜ao de registos de uma tabela.

Testaram-se os crit ´erios para o primeiro Lote de instalac¸ ˜oes que continham 98 empresas. Inicialmente testou-se a exist ˆencia de mais que um registo num mesmo per´ıodo mas, contudo, para este Lote tal n ˜ao acontece. A necessidade de criar esses crit ´erios surgiu quando se testaram metodologias nos Lotes 2 e 3.

Assim, nesta secc¸ ˜ao apresentam-se os resultados para os Lotes 1, 2 e 3. As observac¸ ˜oes das instalac¸ ˜oes dos Lotes 2 e 3 estavam na mesma tabela, deste modo foram tratadas como um s ´o Lote. Neste Lote, Lotes 2 e 3, existiam 199 instalac¸ ˜oes.

Os crit ´erios 3 e 4 foram executados ao mesmo tempo, depois eliminaram-se os dias que n ˜ao eram vi ´aveis (crit ´erio 5) e verificou-se se a quantidade de falhas era demasiada (crit ´erio 6). Uma vez que no crit ´erio 5 podiam ser eliminados registos recentes, aplicou-se nova- mente o crit ´erio 3. Por fim, selecionaram-se as instalac¸ ˜oes que continham 9 meses de observac¸ ˜oes consecutivas e recentes, crit ´erio 7.

Os resultados da aplicac¸ ˜ao destes crit ´erios nos Lotes 1, 2 e 3 podem ser visualizados na tabela 4.1. Os crit ´erios est ˜ao apresentados pela ordem que foram aplicados.

Observando os resultados para os Lotes 1, 2 e 3 verifica-se que, com estes crit ´erios, poucas instalac¸ ˜oes s ˜ao eliminadas.

No cap´ıtulo 4, como mencionado, o Lote 1 continha 97 instalac¸ ˜oes. Estas instalac¸ ˜oes foram sujeitas aos crit ´erios de 1 a 6, uma vez que o crit ´erio 7 apenas foi aplicado para a metodologia Clustering.

Crit ´erio Lote 1 Lotes 2 e 3

1 Sem alterac¸ ˜oes Elimina-se 0.6% dos registos

2 Sem alterac¸ ˜oes Soma-se 1.1% dos registos

obtendo 93 625 novos registos

3 e 4 Elimina-se 1 instalac¸ ˜ao Elimina-se 13 instalac¸ ˜oes

5 Eliminam-se 0.12% dos dias Eliminam-se 0.23% dos dias

6 Sem alterac¸ ˜oes Elimina-se 2 instalac¸ ˜oes

3 Sem alterac¸ ˜oes Sem alterac¸ ˜oes

7 Eliminam-se 11 instalac¸ ˜oes Eliminam-se 46 instalac¸ ˜oes

Total Selecionam-se 86

instalac¸ ˜oes de 98

Selecionam-se 138 instalac¸ ˜oes de 199

Tempo 4 minutos 20 minutos

Cap´ıtulo 5

Agrupamento (Clustering)

5.1

Introduc¸ ˜ao

Um problema que se coloca com alguma frequ ˆencia ´e o de, dado um conjunto de n objetos, agrup ´a-los em classes, ou subgrupos, de tal forma a que (i) cada subgrupo seja internamente homog ´eneo (isto ´e, constitu´ıdo por objetos “similares”), e a que (ii) os v ´arios subgrupos sejam heterog ´eneos entre si (isto ´e, os indiv´ıduos de subgrupos diferentes sejam “dissimilares”). A este processo d ´a-se o nome de Agrupamento (Clustering) (n ˜ao supervisionado).

Nos cap´ıtulos anteriores foi poss´ıvel perceber as vari ´aveis que explicavam parte do con- sumo energ ´etico de uma instalac¸ ˜ao. Claro que, para al ´em das vari ´aveis encontradas, foi necess ´ario acrescentar a vari ´avel Trabalho, que diz respeito `a energia consumida pela instalac¸ ˜ao para produzir.

O objetivo principal deste est ´agio foi agrupar as instalac¸ ˜oes segundo o seu trabalho, ou seja, colocar num mesmo grupo instalac¸ ˜oes que continham curvas de consumo energ ´etico semelhantes (os objetos foram as instalac¸ ˜oes). No entanto, foi necess ´ario ter atenc¸ ˜ao `as vari ´aveis externas, pois duas instalac¸ ˜oes podiam ter curvas semelhantes de energia gasta com a produc¸ ˜ao mas, devido `as condic¸ ˜oes externas, terem curvas do consumo energ ´etico diferentes. Por exemplo, uma instalac¸ ˜ao situada num local de clima quente e seco com certeza gastar ´a mais energia no ar condicionado do que uma instalac¸ ˜ao an ´aloga situada num local de clima temperado. Deste modo, foi necess ´ario comparar o consumo

relacionado com o trabalho de cada instalac¸ ˜ao.

Estimar o consumo energ ´etico relacionado com as vari ´aveis externas foi um dos objeti- vos principais do est ´agio Desagregac¸ ˜ao do consumo energ ´etico, desenvolvido pela aluna Elena Selaru, como j ´a foi referido na introduc¸ ˜ao. Assim, neste est ´agio n ˜ao se desenvolveu esse assunto, uma vez que seria necess ´ario utilizar os resultados do est ´agio anterior. De facto, como os est ´agios decorreram ao mesmo tempo, n ˜ao foi poss´ıvel obter os resultados a tempo de realizar o clustering baseado em consumo energ ´etico desagregado. Desta forma, foi usado o consumo energ ´etico completo (com o efeito das vari ´aveis externas) no clustering.

Nas pr ´oximas secc¸ ˜oes ser ˜ao descritos m ´etodos que tenham atenc¸ ˜ao `as situac¸ ˜oes anterio- res. Existem duas possibilidades:

• Aplicar um m ´etodo de clustering utilizando os consumos energ ´eticos di ´arios ou, quando for poss´ıvel utilizar as estimativas do consumo relacionado com as vari ´aveis externas, utilizar o consumo relacionado com o trabalho;

• Utilizar um m ´etodo de clustering de s ´eries temporais multivariadas, para se conside- rarem as observac¸ ˜oes das vari ´aveis externas significativas.

Ap ´os encontrar os m ´etodos de clustering mais adequados ao problema foi necess ´ario avali ´a-los e definir o n ´umero adequado de grupos, secc¸ ˜ao 5.4. Posteriormente apresentam- se os resultados.

Salienta-se que foram usados os dados agregados por dia atrav ´es da m ´edia e da soma.

Documentos relacionados