BANCOS DE DADOS PÚBLICOS PARA NILM

(AIAD; LEE, 2016) aplicaram para desagregação de carga um HSMM Fatorial (FHMM) que considerou interações mútuas de equipamentos e incorporou as informações sobre as interações em representações FHMM dos dados agregados. Os estados ocultos no FHMM foram inferidos por meio do algoritmo de Viterbi. O modelo foi testado com dados REDD e apresentou resultados aprimorados quando comparado com o FHMM padrão.

(ZHAO; STANKOVIC; STANKOVIC, 2016) aplicaram o Processamento Gráfico de sinal (GSP) para tratar a tarefa de desagregação de carga. Os autores fizeram uso de novos conceitos de GSP, aplicados tando em nível de sinal físico, por meio de filtragem baseada em gráfico, quanto em nível de dados, por meio de combinação eficaz de caracte- rísticas baseada em GSP semi-supervisionada. O estudo usou a potência consumida como assinatura do equipamento e foi avaliado no conjunto de dados REDD.

(MAKONIN; POPOWICH; BAJIĆ, 2016) apresentaram uma abordagem semi- supervisionada de desagregação que usa um HMM de super estados e uma variante do algoritmo de Viterbi que preserva as dependências entre as cargas e pode desagregar cargas multi-nível. Dados torulados foram utilizados para obtenção de informações prévias para a construção dos modelos. O estudo usou taxas de amostragem baixas e pode ser executado em tempo real. O desempenho de desagregação foi alto com CAE de 0,949 para teste com cinco equipamentos do conjunto de dados REDD considerando condições reais de ruído.

Grande parte dos estudos citados nas seções anteriores mostram que a maioria das técnicas NILM são baseadas em um paradigma de aprendizagem onde o estágio de treinamento é intrusivo, exigindo o uso de sensores de nível de plug para coleta de dados que são usados para aprender modelos de equipamentos específicos a serem usados para desagregação durante a fase operacional, quando os sensores de nível de plug são remo- vidos. Em contraste, alguns estudos baseados no paradigma de classificação multi-rótulo que não requerem dados de consumo reais de todos os equipamentos e que podem atuar sobre dados agregados têm surgido (LI; DICK, 2016; TABATABAEI; DICK; XU, 2017;

SINGH; MAJUMDAR, 2020;MASSIDDA; MARROCU; MANCA,2020).

Por fim, (PARSON,2014) propôs métodos não-supervisionados para identificação e extração de períodos da carga agregada, durante os quais apenas um único equipamento está mudando de estado, usando somente o modelo geral de equipamento. Esse processo de extração de assinaturas é feito através do cálculo de probabilidade de que um período dos dados agregados tenha sido gerado por uma instância do equipamento de um dado modelo geral. A abordagem utiliza janelas de dados agregados cujo tamanho é definido pelo maior comprimento de assinatura presente nos dados de treino, e considera um valor de tolerância que garanta que o modelo aceite janelas com variações de equipamento de mesmo tipo e rejeite os demais.

Outros estudos como (JIA; GAO; SPANOS, 2015; ZHAO; STANKOVIC; STAN- KOVIC,2016) aplicaram técnicas completamente não supervisionadas para desagregação de energia. Porém, os resultados obtidos com o uso de técnicas supervisionadas são signi- ficativamente mais precisos do que estes (GUPTA; MAJUMDAR, 2018).

central. Segundo (ZOHA et al., 2012) uma limitação dessa prática é que a identificação de equipamentos com potência variável e baixa na presença de cargas de potência alta nos dados do sinal agregado se torna bem mais difícil. Como forma de diminuir essa dificuldade, (MARCHIORI et al.,2011) sugere a utilização de medidas de potência em nível de circuito, de forma que os equipamentos de potência alta tenham circuitos dedicados nas residências, mas esse mecanismo acaba gerando instalações elétricas mais caras e complexas.

Pelo exposto, percebe-se a necessidade de se utilizar dados coletados de forma diferenciada dependendo do tipo de característica que se quer obter do sinal elétrico. Para algumas características é possível utilizar o sinal agregado, enquanto para outras existe a necessidade de dados em nível de circuito ou mesmo dados em nível de equipamento, pois sem dados nesses diversos níveis as tarefas principais do NILM que são a extração de características, a identificação dos equipamentos e a consequente desagregação das cargas não teriam a qualidade desejada. Estudos recentes como o de (PARSON,2014) têm utilizado dados desses três níveis para criar uma metodologia que possa ser generalizada para diversas residências, para isso, o autor utiliza na maior parte do estudo banco de dados públicos gratuitos.

Nos últimos anos cresceu a oferta de bases de dados direcionados aos estudos de NILM disponíveis publicamente, permitindo que sejam realizadas comparações de resultados entre estudos com técnicas e metodologias diferentes, dentre eles destacam-se o REDD, UK-DALE, BLUED, Tracebase e Smart.

Das bases de dados citadas, foram selecionados a REDD e a UK-DALE para realizar os testes do sistema proposto neste trabalho, a escolha foi motivada pelo fato de essas bases possuírem medidas de potência coletadas em baixa frequênica, por conter medições referentes a várias residências, por considerar diversos tipos de equipamentos e por serem utilizadas em diversos estudos atuais favorecendo a comparação de resultados.

A seguir são descritas as bases de dados citadas e com maior detalhamento as bases REDD e UK-DALE.

Reference Energy Disaggregation Data Set - REDD

O REDD é uma das maiores bases de dados publicamente disponíveis e, criada com a intenção de favorecer pesquisa na área de mineração de dados e aprendizado de dados, e especialmente estudos sobre NILM, que muitas vezes são dificultados devido a escassez de dados. O REDD é formado por dados coletados ao longo de dois meses em 6 residências, e contêm dados agregados de corrente e voltagem coletados na frequência de 15kHz, dados de 24 circuitos individuais coletados na freqüência de 0,5 Hz, além de dados provenientes de mais de 20 monitores de equipamentos coletados na frequência de 1HZ (KOLTER; JOHNSON, 2011). A coleta foi realizada por dois pesquisadores do Massachusetts Institute of Technology (MIT).

As categorias de equipamentos que fazem parte da base de dados REDD por residência são listadas no Quadro ??.

United Kingdom Domestic Appliance Level Electricity - UK-DALE

A base de de dados UK-DALE (KELLY; KNOTTENBELT,2015) possui registros de demanda de energia de 5 casas no Reino Unido, onde os dados agregados foram coletados na frequência de 16 Hz e os dados por dispositivo na frequência de 1/6 Hz . A coleta inicial ocorreu durante um período de 1 ano. Uma atualização para o conjunto de

Quadro 2.1 – Categorias de equipamentos da base de dados REDD

Casa Categorias de equipamentos

1 Forno, Luzes, Refrigerador, Lava-louças, Aquecedor, Secadora de roupas, A- larmes de incêndio, Equipamentos de banheiro (GFI), Utensílios de cozinha, Microondas, etc.

2 Luzes, Refrigerador, Lava-louças, Secadora, Equipamentos de banheiro (GFI), Utensílios de cozinha, Forno, Microondas, Aquecedor, Fogão, etc.

3 Luzes, Refrigerador, Lava-louças, Aquecedor, Lavadora/secadora, Equipamen- tos de banheiro (GFI), Utensílios de cozinha, Microondas, Aquecedor, Utensí- lios externos, etc.

4 Luzes, Lava-louças, Aquecedor, Lavadora/secadora, Alarmes de incêndio, Equi- pamentos de banheiro (GFI), Utensílios de cozinha, Fogão, Ar condicionado, etc.

5 Luzes, Refrigerador, Lava-louças, Lavadora/secadora, Utensílios de cozinha, Microondas, etc.

6 Utensílios de cozinha, Lavadora/secadora, Fogão, eletrônicos, Equipamentos de banheiro (GFI), refrigerador, Lava-louças, Ar condicionado, Aquecedor, Luzes, etc.

Fonte – Elaborado pela autora.

dados foi lançada em agosto de 2015, que expandiu os dados disponíveis para residências em 2,5 anos. Na Quadro ?? são listados os equipamentos que foram alvos de coleta do UK-DALE.

Quadro 2.2 – Categorias de equipamentos da base de dados UK-DALE

Casa Categorias de equipamentos

1 Caldeira, Painel solar, Laptop, Lavadora de roupas, Lava-louças, TV, Luzes, Chaleira elétrica, Torradeira, Geladeira, Microondas, Cafeteira etc.

2 Computador portátil, Monitor, Alto-falantes, Servidor, Roteador, Servidor- hdd, Chaleira, Rice-cooker, Esteira, Notebook, Lavadora de roupas, Lava- louças, Geladeira, Microondas, Torradeira, Playstation, Modem, Fogão, etc.

3 Chaleira, Aquecedor elétrico, Laptop, Projetor.

4 Luzes, Dvd, TV, Chaleira, Rádio, Caldeira a gás, Freezer, Lava-louças, Micro- ondas, etc.

5 Alto-falantes, Secador de cabelo, TV, Esteira, Storage, servidor, PS4, Ferro a vapor, Cafeteira, Computador, Torradeira, Amplificador, Chaleira, Geladeira, Freezer, Forno, Fogão, Lava-louças, Microondas, Lavadora/secadora, Aspira- dor, etc.

Fonte – Elaborado pela autora.

Building-Level fUlly labeled Energy Disaggregation dataset - BLUED

De acordo com (ANDERSON et al.,2012) o banco de dados BLUED, contém dados de uma residência da Pensilvânia coletados durante uma semana, sendo que as medições foram feitas em uma frequência de 12 KHz e referem-se a corrente e voltagem de cerca de 30 equipamentos. Diferente dos outros bancos como o REDD, o BLUED contém mais de

2400 eventos de referência identificados por rótulos e com etiquetas de tempo que indicam a atividade dos equipamentos. O monitoramento extensivo foi feito sobre os circuitos e equipamentos de forma individual.

Tracebase

O Tracebase é um banco de dados que contém informações de consumo de mais de 100 equipamentos coletados na frequência de 1Hz, mas diferente do REDD, não possui medições agregadas. Dessa forma, é geralmente utilizado na fase de identificação de dispositivos e não para desagregação (REINHARDT et al., 2012).

Smart

O Smart é uma base de dados aberta e composta por duas versões. A primeira ver- são contém dados em alta resolução de três residências e é identificado pelos autores como UMass Smart Home, enquanto a segunda contém dados em baixa resolução de quatrocen- tas residências e é nomeado pelos autores como UMass Smart Microgrid (BARKER et al., 2012). Segundo os autores o Smart apresenta 3 características que são heterogeneidade, escalabilidade e redundância. A heterogeneidade refere-se as diferentes fontes de dados, como uso de eletricidade no painel principal, circuitos, e cargas dos equipamentos individuais, proporcionando a possibilidade de realizar a correlação com os dados de diversos sensores associando informações de clima, temperatura, movimento, etc. A escalabilidade se refere a existência de vários tipos de dados em alta resolução em diversos níveis, sendo potência média Real, eventos on/off/dim, potência aparente, voltagem, frequência em duas fases; a redundância refere-se a coleta de dados das mesmas cargas em diferentes níveis, permitindo a avaliação da acurácia dos sensores, pela detecção de possíveis falhas nos sensores e também problemas em medidores, como falhas de comunicação que podem atrapalhar a desagregação.

Enfim, a existência de bases de dados de qualidade disponíveis publicamente para apoiar as pesquisas sobre NILM é importante para os pesquisadores da área, que dessa forma podem concentrar seus esforços no desenvolvimento de suas metodologias sem se preocupar com a criação de bases de dados próprias.

REDES NEURAIS ARTIFICIAIS

No documento O sistema proposto (páginas 44-48)