• Nenhum resultado encontrado

Para detecção de falhas no sistema de arrefecimento são utilizados os sinais de velocidade do motor, pressão e temperatura da água recebidos pelo ECU. Como a velocidade da bomba d’água está diretamente ligada a velocidade do motor, a pressão também está relacionada a essas velocidades. Por esse motivo, nessa abordagem do trabalho define-se como ponto de operação as 5 velocidades do motor Diesel, e não os 9 notchs de potência da locomotiva.

As transições de velocidade do motor usado são rápidas quando comparadas ao tempo em que esse permanece nas velocidades pré-estabelecidas do motor pelo sistema de controle, que são: 335, 440, 580, 888 e 995 RPM. Nesses pontos de operação os sinais são considerados em regime permanente, e é nessas condições que se deseja detectar as falhas do sistema de arrefecimento.

Os diferentes pontos de operação apresentam diferentes momentos estatísticos. Por- tanto, o ponto de operação permite escolher os modelos com seus limiares correspondentes, ou então, realizar normalização que permita usar o mesmo limiar para todos os pontos de operação. Para detecção de falhas utilizando cartas de Shewhart e de soma cumulativa sem a necessidade da criação de algoritmos complexos de adaptação de limiares, faz viável a detecção do ponto de operação.

3.2.1

Detecção do ponto de operação

Dentre os muitos classificadores existentes, utilizou-se o tipo kNN, dada teoria madura, fácil interpretação e implementação. Definiu-se para seu treinamento 6 classes, 5 são as velocidades pré-estabelecidas e uma para a transição entre as velocidades. Os dados usados pelo classificador são a velocidade do motor e sua variação.

Capítulo 3. Metodologias propostas 38

Para rotular os dados, admite-se como pertencente a cada classe velocidades do motor com valores de ±10 RPM da velocidade nominal da classe. A variação da velocidade é calculada pela diferença da velocidade no instante menos a velocidade medida de 20 amostras antes (lembrando que a frequência de amostragem é 20Hz).

A rotina knnsearch do Matlab com método de procura kd-tree será utilizada pelo classificador, com 10 vizinhos mais próximos medidos por distância euclidiana.

O desempenho do classificador deve atender uma especificidade acima de 95% (fração dos dados não pertencentes à uma classe corretamente classificados, equação 3.1), e uma sensibilidade acima de 95% (fração dos dados pertencentes à uma classe corretamente classificados, equação 3.2). O classificador implementado deve detectar os pontos de operação da locomotiva e as transições durante as quais não são feitas as detecções.

Especif icidade = QVN QVN + QFP (3.1) Sensibilidade = QVP QVP + QFN (3.2) Onde: QVN é número de verdadeiros negativos, QVP número de verdadeiro positivos, QFN

número de falsos negativos e QFP número de falsos negativos

3.2.2

Modelos e geração de resíduos

As técnicas de modelagem acima serão utilizadas para obtenção de modelos únicos que representam todos os pontos de operação e modelos múltiplos, um por ponto de operação. No primeiro caso, as entradas do modelo são a velocidade e a temperatura e a saída é a pressão. O segundo caso, a saída é a mesma e a entrada é apenas a temperatura, pois a velocidade do ponto de operação é conhecida.

As técnicas de modelagem para determinar os modelos que representem um ou todos os pontos de operação testadas neste trabalho com seus respectivos parâmetros, são:

• Rede neural de regressão generalizada (GRNN ), com fator de suavização de 0.2. • Regressão por máquinas de vetores de suporte (SVR) usando função gaussiana. • Regressão Polinomial (POLY ) com polinômios de até quinto grau.

• Árvore de regressão (TREE ) com modelo de regressão particionado.

Para isso, são utilizadas as rotinas do Matlab: newgrnn, fitrsvm, fit e fitrtree, respectivamente. Os demais parâmetros foram os default dessas rotinas.

Capítulo 3. Metodologias propostas 39

Serão selecionados os modelos que obtiverem o maior coeficiente de Spearman entre a saída real e a saída estimada e com a condição de que o erro (RMSE) seja menor que o erro médio dentre os modelos gerados, Kuhn e Johnson(2013) sugerem essas métricas para medir o desempenho de modelos de regressão. Parâmetros como o critério de informação de Akaike (AIC) e de informação Bayesiana (BIC) não serão utilizados, pois o número de variáveis de entrada para cada modelo já foi pré-estabelecido.

A validação cruzada é feita aplicando o repeated K-fold que utiliza sucessivos conjuntos (folds) gerando uma maior massa para análise estatística, tornando a seleção do modelo mais confiável (KUHN; JOHNSON, 2013;REFAEILZADEH; TANG; LIU, 2009). Os dados para gerar cada fold são selecionados aleatoriamente a cada iteração do repeated

K-fold. São testadas todas as técnicas de determinação de modelos apresentadas.

Faz-se 50 repetições com 10 folds, resultando em 500 modelos a cada teste. Um maior número de repetições permite caracterizar melhor as estatísticas usadas para a escolha dos modelos. O número de repetições é escolhido assegurando um baixo esforço computacional. A rotina crossval do MATLAB é utilizada nessa etapa da modelagem.

Como o coeficiente de Spearman é calculado pelo posto dos dados estimados em relação ao posto dos dados reais, espera-se que o modelo assim selecionado apresente os menores erros de estimativas para novas entradas, mesmo não tendo necessariamente produzido o menor erro para o conjunto de dados usados.

3.2.3

Análise dos resíduos e detecção de falhas

Uma forma usual para detecção de falhas é o emprego de estatística univariada, onde o vetor dos resíduos será avaliado utilizando cartas de controle de Shewhart (BISWAS; MASUD; KABIR, 2015; KISIĆ et al., 2013). Se os resíduos gerados pelos modelos apre- sentarem diferentes médias e variâncias para cada ponto de operação, a normalização dos resíduos deve ser diferente em cada região, para que se possa utilizar um único limiar.

No caso de utilização de cartas de soma cumulativa, o vazamento é detectado no momento em que o limite inferior é atingido. Esse limite é calculado iterativamente no vetor de treinamento até que não sejam observados falsos positivos. A soma da carta é feita usando uma janela móvel. O tamanho da janela determina a sensibilidade da carta a desvios de médias, sendo de 3000 amostras neste trabalho.

Os modelos geram os resíduos durante a operação do motor. Caso o classificador indique que o motor esteja entre os pontos de operação (transição), deve-se atribuir ao resíduo valor zero.

Capítulo 3. Metodologias propostas 40

Tabela 2 – Vantagens e desvantagens dos classificadores utilizados.

Classificador Vantagens Limitações kNN 1. Teoria madura e fácil de implementar

2. Fácil entendimento.

1. Custo de computação alto 2. Exige muita memória

3. Valor de k exerce muita influência

ANN 1. Alta acurácia de classificação

2. Boa aproximação de funções não lineares complexas

1. Muitos parâmetros e fácil ocorrência de over-fitting 2. Sem significado físico

3. Processo de aprendizado não pode ser visto.

Fonte: (LIU et al., 2018)

Documentos relacionados