usando o método trapezoidal (BURDEN; FAIRES; BURDEN,2015). Integração numérica é o cálculo aproximado, usando técnicas numéricas, de uma integral de uma função com uma variável real definida no intervalo [a, b] (BURDEN; FAIRES; BURDEN,2015).
Figura 4.4 – Consumo de equipamento visto como um conjunto de trapézios
Fonte – Elaborado pela autora.
Como a quantidade de dados é alta, o banco de dados foi dividido usando a técnica de hold-out (KUHN; JOHNSON, 2018; RUSSELL; NORVIG, 2020) com estratificação para garantir que cada partição tenha a mesma proporção de observações com um dado valor categórico (JAMES et al., 2017) sendo 70% de dados para treinamento, 15% para validação e 15% para teste. Em cada um desses conjuntos, os dados têm complexidade semelhante e obedecem à mesma distribuição. A estratificação ajuda a tornar a validação mais estável e é especialmente útil para conjuntos de dados não balanceados e classificação multiclasse.
Foram usadas estatísticas descritivas (média, variância, desvio padrão) e testes não paramétricos para homogeineidade de variâncias (Siegel-Tukey, Ansari-Bradley and Mood two-sample) para confirmar que os conjuntos de treinamento, validação e teste possuem a mesma distribuição, ou seja, possuem a mesma variabilidade, o que permite a utilização da técnica hold-out sem que ocorram erros induzidos por bias. As definições dos testes estatísticos utilizados e o resultado da análise dos dados podem ser vistos no Apêndice A.
A Tabela ??mostra o número de padrões de dados para cada equipamento seleci- onado das bases de dados REDD e UK-DALE.
Tabela 4.1 – Quantidade de padrões das bases de dados REDD e UK-DALE
REDD UK-DALE
N◦ Equipam. Tipo Qtd. N◦ Equipam. Tipo Qtd.
1 Geladeira A,B 217 1 Geladeira A,B 232 2 Microondas C,D 206 2 Microondas C,D 255
3 Fogão C 183 3 Fogão C 160
4 Forno C 176 4 Forno C 260
5 Lava-louças C,D 256 5 Lava-louças C,D 250
6 Ar condic. C 194 6 Lavadora C,D 270
7 Lava/Seca C,D 250 7 Lava/Seca C,D 285
# Total 1482 # Total 1712
Nota – A- Sempre ligado, B - Liga/Desliga, C - Multi-nível, D - Continuamente variável Fonte – Elaborado pela autora.
4.2.2 Categorias de equipamentos
Sete categorias de equipamentos foram selecionadas dos bancos de dados para avaliar a precisão da identificação e desagregação do sistema proposto, incluindo aqueles que mais consomem energia nas residências. A tabela ??mostra esta seleção.
De acordo com (BATRA et al., 2014), as três razões para modelar apenas os equi- pamentos com maior consumo de energia em vez de todos os equipamentos são: primeiro, a desagregação de tais equipamentos fornece o valor de energia mais alto; em segundo lugar, tais equipamentoss contribuem com as características mais notáveis e, portanto, a contribuição dos equipamentos restantes pode ser considerada apenas como ruído; tercei- ro, cada dispositivo adicional modelado pode contribuir significativamente para aumentar a complexidade da tarefa.
A Figura 4.5 apresenta exemplos do perfil característico de consumo dos equi- pamentos usados neste estudo. Os equipamentos selecionados incluem vários modos de operação (ligado/desligado, sempre ligado, multi-nível, continuamente variável) (RUANO et al., 2019; KELLY, 2017), consumo semelhante em certos níveis de operação, e alguns
têm um comportamento mais complexo, como micro-ondas , lava-louças e lava/seca, que são multi-nível, mas podem apresentar momentos de consumo continuamente variável, o que aumenta a complexidade da tarefa de identificação
Figura 4.5 – Exemplos do comportamento operacional dos equipamentos usados neste estudo
Fonte – Elaborado pela autora.
4.2.3 Arquiteturas de redes neurais artificiais
Conforme discutido nas seções anteriores e mostrado na Figura 4.2, dois modelos de rede neural foram treinados e testados para avaliar o desempenho do sistema proposto.
Os parâmetros de configuração das arquiteturas do sistema foram escolhidos com base na experimentação. A RNAA e a MLP foram treinadas variando o número de neurô- nios na camada oculta (de 3 a 300) e o tipo de função de ativação (logístico sigmóide, tangente hiperbólica, linear). A função de perda foi o erro quadrático médio.
Diversos métodos de otimização foram testados (Levenberg-Marquardt, backpropa- gation resiliente, gradiente conjugado escalado - SCG) e o que gerou os melhores resultados foi o SCG (MOLLER, 1993). O valor do parâmetro do SCG que determina a mudança no peso para a aproximação da segunda derivada foi 5,0e-5, e o valor do parâmetro usado para regular a indefinição do Hessiano foi 5,0e-7. Os parâmetros taxa de aprendizagem e momento são calculados automaticamente a cada iteração usando informações de segunda ordem. O gradiente mínimo de desempenho foi 1e-6.
Para evitar que as redes perdessem sua capacidade de generalização, a técnica de parada antecipada (AGGARWAL, 2018; RUSSELL; NORVIG, 2020) foi usada para interromper o treinamento quando o erro de validação aumenta para um número específico
de iterações indicando sobreajuste de dados.
De acordo com os testes realizados, a configuração da rede com melhores resultados é descrita a seguir para MD1 e MD2.
4.2.3.1 MD1
RNAA - O número de entradas e saídas da RNAA para o MD1 que executa a extração de características esparsas é 7, consistindo nas pré-característiscas, 7 amostras consecutivas de potência obtidas após o processo de detecção de eventos. O modelo possui uma camada oculta, com 50 neurônios ocultos. As funções de ativação utilizadas foram a sigmóide logística para a camada oculta e linear para a camada de saída. A fase de treinamento foi definida para 2.000 épocas e os pesos foram inicializados com valores aleatórios amostrados a partir de uma distribuição uniforme no intervalo [0, 1].
MLP - Neste modelo, o número de entradas para a classificadora MLP é 50; essas entradas são as características esparsas extraídas com a RNAA, ou seja, as saídas da ca- mada oculta da RNAA. Esta MLP possui uma camada oculta com 101 nós, e a camada de saída possui 7 neurônios, igual ao número de equipamentos a serem identificados. As funções de ativação utilizadas foram a sigmóide logistica para a camada oculta e a Soft- max para a camada de saída. A fase de treinamento foi definida para 3000 épocas e os pesos foram inicializados com valores aleatórios amostrados a partir de uma distribuição uniforme no intervalo [−R,+R], onde R= 1/√
nin e nin é o número de entradas.
4.2.3.2 MD2
MLP - Neste modelo, a MLP classificadora possui sete entradas, as pré-características fornecidos pelo módulo de extração de características. O modelo tem uma camada oculta com 100 neurônios, e a camada de saída tem 7 neurônios. As funções de ativação usadas foram sigmóide logistica para a camada oculta e Softmax para a camada de saída. A fase de treinamento foi definida para 3000 épocas e os pesos foram inicializados com valores aleatórios amostrados a partir de uma distribuição uniforme no intervalo [−R,+R], onde R = 1/√
nin e nin é o número de entradas.
4.2.4 Métricas de avaliação
As métricas utilizadas para avaliação de desempenho do sistema proposto em rela- ção à tarefa de classificação são: Acurácia (Acc), Sensibilidade (Recall), Precisão (Prec), Especificidade (Specif), F-score e Energia Corretamente Atribuída (CAE). Essas métricas são comuns para avaliação de classificadores em NILM (KONG et al.,2016;FACELI et al., 2011) permitindo comparações com outros estudos.
Os seguintes termos são definidos para calcular as métricas: Verdadeiro positivo (TP), número de vezes que um equipamento é classificado corretamente como LIGADO;
Verdadeiro negativo (TN), número de vezes que um equipamento é classificado correta- mente como DESLIGADO; Falso positivo (FP), número de vezes que um equipamento foi classificado incorretamente como LIGADO e Falso negativo (FN), número de vezes que um equipamento foi classificado incorretamente como DESLIGADO.
Acurácia (Acc):porcentagem de amostras positivas e negativas classificadas corre- tamente em todas as amostras positivas e negativas.
Acc= T P +T N
T P +T N+F P +F N (4.8)
Sensibilidade (Recall): porcentagem de amostras positivas classificadas correta- mente em todas as amostras positivas.
Recall = T P
T P +F N (4.9)
Precisão (Prec): porcentagem de amostras preditas corretamente como positivas no total de amostras preditas como positivas.
P rec= T P
T P +F P (4.10)
Especificidade (Especif): porcentagem de amostras negativas corretamente identi- ficadas no total de amostras negativas.
Specif = T N
T N+F P (4.11)
F-score: é a média ponderada de Precisão e Recall. Leva em consideração tanto os falsos positivos quanto os falsos negativos. O F-score é geralmente mais útil do que a precisão, especialmente se a distribuição da classes for desigual.
F −score= 2∗P rec∗Recall
P rec+Recall (4.12)
Outras formas de visualizar os resultados da tarefa de classificação são a curva AUC-ROC e a matriz de confusão.
A curva AUC - ROC é uma medida usada para avaliar o desempenho dos clas- sificadores em várias configurações de limiar. A ROC é uma curva de probabilidade e a AUC representa o grau de separabilidade, indica o quanto o modelo pode distinguir entre as classes, uma AUC maior indica um modelo melhor. O gráfico ROC para problemas multiclasse mostra uma curva para cada classe na mesma área. Um modelo excelente com uma alta medida de separabilidade tem AUC próximo a 1. Um modelo com a pior medida de separabilidade tem AUC próximo a 0 (FACELI et al., 2011).
A matriz de confusão é uma tabela usada para visualizar o desempenho de um algoritmo para o problema de classificação estatística. As linhas da matriz representam as instâncias previstasem de uma classe e as colunas representam as instâncias reais de uma classe (ou vice-versa). A matriz facilita avaliar se o sistema está confundindo duas classes (FACELI et al., 2011).
Para avaliar o desempenho de desagregação, uma métrica para calcular a proporção da energia total corretamente atribuída a um equipamento (CAE) é usada, e é definida como:
CAE = 1−PTt=1PKk=1 |pb(t)k −p(t)k |
2PTt=1p(t) (4.13)
onde pb(t)k é o consumo estimado para o k-ésimo equipamento no tempo t, p(t)k é o consu- mo real de energia do equipamento e p(t) é a soma do consumo de energia de todos os equipamentos a cada momento.