CONFIGURAÇÃO EXPERIMENTAL - O sistema proposto

usando o método trapezoidal (BURDEN; FAIRES; BURDEN,2015). Integração numérica é o cálculo aproximado, usando técnicas numéricas, de uma integral de uma função com uma variável real definida no intervalo [a, b] (BURDEN; FAIRES; BURDEN,2015).

Figura 4.4 – Consumo de equipamento visto como um conjunto de trapézios

Fonte – Elaborado pela autora.

Como a quantidade de dados é alta, o banco de dados foi dividido usando a técnica de hold-out (KUHN; JOHNSON, 2018; RUSSELL; NORVIG, 2020) com estratificação para garantir que cada partição tenha a mesma proporção de observações com um dado valor categórico (JAMES et al., 2017) sendo 70% de dados para treinamento, 15% para validação e 15% para teste. Em cada um desses conjuntos, os dados têm complexidade semelhante e obedecem à mesma distribuição. A estratificação ajuda a tornar a validação mais estável e é especialmente útil para conjuntos de dados não balanceados e classificação multiclasse.

Foram usadas estatísticas descritivas (média, variância, desvio padrão) e testes não paramétricos para homogeineidade de variâncias (Siegel-Tukey, Ansari-Bradley and Mood two-sample) para confirmar que os conjuntos de treinamento, validação e teste possuem a mesma distribuição, ou seja, possuem a mesma variabilidade, o que permite a utilização da técnica hold-out sem que ocorram erros induzidos por bias. As definições dos testes estatísticos utilizados e o resultado da análise dos dados podem ser vistos no Apêndice A.

A Tabela ??mostra o número de padrões de dados para cada equipamento seleci- onado das bases de dados REDD e UK-DALE.

Tabela 4.1 – Quantidade de padrões das bases de dados REDD e UK-DALE

REDD UK-DALE

N^◦ Equipam. Tipo Qtd. N^◦ Equipam. Tipo Qtd.

1 Geladeira A,B 217 1 Geladeira A,B 232 2 Microondas C,D 206 2 Microondas C,D 255

3 Fogão C 183 3 Fogão C 160

4 Forno C 176 4 Forno C 260

5 Lava-louças C,D 256 5 Lava-louças C,D 250

6 Ar condic. C 194 6 Lavadora C,D 270

7 Lava/Seca C,D 250 7 Lava/Seca C,D 285

# Total 1482 # Total 1712

Nota – A- Sempre ligado, B - Liga/Desliga, C - Multi-nível, D - Continuamente variável Fonte – Elaborado pela autora.

4.2.2 Categorias de equipamentos

Sete categorias de equipamentos foram selecionadas dos bancos de dados para avaliar a precisão da identificação e desagregação do sistema proposto, incluindo aqueles que mais consomem energia nas residências. A tabela ??mostra esta seleção.

De acordo com (BATRA et al., 2014), as três razões para modelar apenas os equipamentos com maior consumo de energia em vez de todos os equipamentos são: primeiro, a desagregação de tais equipamentos fornece o valor de energia mais alto; em segundo lugar, tais equipamentoss contribuem com as características mais notáveis e, portanto, a contribuição dos equipamentos restantes pode ser considerada apenas como ruído; tercei- ro, cada dispositivo adicional modelado pode contribuir significativamente para aumentar a complexidade da tarefa.

A Figura 4.5 apresenta exemplos do perfil característico de consumo dos equipamentos usados neste estudo. Os equipamentos selecionados incluem vários modos de operação (ligado/desligado, sempre ligado, multi-nível, continuamente variável) (RUANO et al., 2019; KELLY, 2017), consumo semelhante em certos níveis de operação, e alguns

têm um comportamento mais complexo, como micro-ondas , lava-louças e lava/seca, que são multi-nível, mas podem apresentar momentos de consumo continuamente variável, o que aumenta a complexidade da tarefa de identificação

Figura 4.5 – Exemplos do comportamento operacional dos equipamentos usados neste estudo

Fonte – Elaborado pela autora.

4.2.3 Arquiteturas de redes neurais artificiais

Conforme discutido nas seções anteriores e mostrado na Figura 4.2, dois modelos de rede neural foram treinados e testados para avaliar o desempenho do sistema proposto.

Os parâmetros de configuração das arquiteturas do sistema foram escolhidos com base na experimentação. A RNAA e a MLP foram treinadas variando o número de neurô- nios na camada oculta (de 3 a 300) e o tipo de função de ativação (logístico sigmóide, tangente hiperbólica, linear). A função de perda foi o erro quadrático médio.

Diversos métodos de otimização foram testados (Levenberg-Marquardt, backpropa- gation resiliente, gradiente conjugado escalado - SCG) e o que gerou os melhores resultados foi o SCG (MOLLER, 1993). O valor do parâmetro do SCG que determina a mudança no peso para a aproximação da segunda derivada foi 5,0e-5, e o valor do parâmetro usado para regular a indefinição do Hessiano foi 5,0e-7. Os parâmetros taxa de aprendizagem e momento são calculados automaticamente a cada iteração usando informações de segunda ordem. O gradiente mínimo de desempenho foi 1e-6.

Para evitar que as redes perdessem sua capacidade de generalização, a técnica de parada antecipada (AGGARWAL, 2018; RUSSELL; NORVIG, 2020) foi usada para interromper o treinamento quando o erro de validação aumenta para um número específico

de iterações indicando sobreajuste de dados.

De acordo com os testes realizados, a configuração da rede com melhores resultados é descrita a seguir para MD1 e MD2.

4.2.3.1 MD1

RNAA - O número de entradas e saídas da RNAA para o MD1 que executa a extração de características esparsas é 7, consistindo nas pré-característiscas, 7 amostras consecutivas de potência obtidas após o processo de detecção de eventos. O modelo possui uma camada oculta, com 50 neurônios ocultos. As funções de ativação utilizadas foram a sigmóide logística para a camada oculta e linear para a camada de saída. A fase de treinamento foi definida para 2.000 épocas e os pesos foram inicializados com valores aleatórios amostrados a partir de uma distribuição uniforme no intervalo [0, 1].

MLP - Neste modelo, o número de entradas para a classificadora MLP é 50; essas entradas são as características esparsas extraídas com a RNAA, ou seja, as saídas da camada oculta da RNAA. Esta MLP possui uma camada oculta com 101 nós, e a camada de saída possui 7 neurônios, igual ao número de equipamentos a serem identificados. As funções de ativação utilizadas foram a sigmóide logistica para a camada oculta e a Soft- max para a camada de saída. A fase de treinamento foi definida para 3000 épocas e os pesos foram inicializados com valores aleatórios amostrados a partir de uma distribuição uniforme no intervalo [−R,+R], onde R= 1/√

n_in e n_in é o número de entradas.

4.2.3.2 MD2

MLP - Neste modelo, a MLP classificadora possui sete entradas, as pré-características fornecidos pelo módulo de extração de características. O modelo tem uma camada oculta com 100 neurônios, e a camada de saída tem 7 neurônios. As funções de ativação usadas foram sigmóide logistica para a camada oculta e Softmax para a camada de saída. A fase de treinamento foi definida para 3000 épocas e os pesos foram inicializados com valores aleatórios amostrados a partir de uma distribuição uniforme no intervalo [−R,+R], onde R = 1/√

n_in e n_in é o número de entradas.

4.2.4 Métricas de avaliação

As métricas utilizadas para avaliação de desempenho do sistema proposto em rela- ção à tarefa de classificação são: Acurácia (Acc), Sensibilidade (Recall), Precisão (Prec), Especificidade (Specif), F-score e Energia Corretamente Atribuída (CAE). Essas métricas são comuns para avaliação de classificadores em NILM (KONG et al.,2016;FACELI et al., 2011) permitindo comparações com outros estudos.

Os seguintes termos são definidos para calcular as métricas: Verdadeiro positivo (TP), número de vezes que um equipamento é classificado corretamente como LIGADO;

Verdadeiro negativo (TN), número de vezes que um equipamento é classificado corretamente como DESLIGADO; Falso positivo (FP), número de vezes que um equipamento foi classificado incorretamente como LIGADO e Falso negativo (FN), número de vezes que um equipamento foi classificado incorretamente como DESLIGADO.

Acurácia (Acc):porcentagem de amostras positivas e negativas classificadas corretamente em todas as amostras positivas e negativas.

Acc= T P +T N

T P +T N+F P +F N (4.8)

Sensibilidade (Recall): porcentagem de amostras positivas classificadas corretamente em todas as amostras positivas.

Recall = T P

T P +F N (4.9)

Precisão (Prec): porcentagem de amostras preditas corretamente como positivas no total de amostras preditas como positivas.

P rec= T P

T P +F P (4.10)

Especificidade (Especif): porcentagem de amostras negativas corretamente identi- ficadas no total de amostras negativas.

Specif = T N

T N+F P (4.11)

F-score: é a média ponderada de Precisão e Recall. Leva em consideração tanto os falsos positivos quanto os falsos negativos. O F-score é geralmente mais útil do que a precisão, especialmente se a distribuição da classes for desigual.

F −score= 2∗P rec∗Recall

P rec+Recall (4.12)

Outras formas de visualizar os resultados da tarefa de classificação são a curva AUC-ROC e a matriz de confusão.

A curva AUC - ROC é uma medida usada para avaliar o desempenho dos classificadores em várias configurações de limiar. A ROC é uma curva de probabilidade e a AUC representa o grau de separabilidade, indica o quanto o modelo pode distinguir entre as classes, uma AUC maior indica um modelo melhor. O gráfico ROC para problemas multiclasse mostra uma curva para cada classe na mesma área. Um modelo excelente com uma alta medida de separabilidade tem AUC próximo a 1. Um modelo com a pior medida de separabilidade tem AUC próximo a 0 (FACELI et al., 2011).

A matriz de confusão é uma tabela usada para visualizar o desempenho de um algoritmo para o problema de classificação estatística. As linhas da matriz representam as instâncias previstasem de uma classe e as colunas representam as instâncias reais de uma classe (ou vice-versa). A matriz facilita avaliar se o sistema está confundindo duas classes (FACELI et al., 2011).

Para avaliar o desempenho de desagregação, uma métrica para calcular a proporção da energia total corretamente atribuída a um equipamento (CAE) é usada, e é definida como:

CAE = 1−^P^T_t=1^P^K_k=1 |p_b^(t)_k −p^(t)_k |

2^P^T_t=1p^(t) (4.13)

onde pb^(t)_k é o consumo estimado para o k-ésimo equipamento no tempo t, p^(t)_k é o consumo real de energia do equipamento e p^(t) é a soma do consumo de energia de todos os equipamentos a cada momento.

No documento O sistema proposto (páginas 69-74)