Indentificação da Vida Útil
Remanescente (RUL) e da Faixa de Operação do Ativo
O aprendizado de máquina, popularmente conhecido como machine learning (“ML”) é definido como um conjunto de práticas computacionais e estatísticas com a finalidade de auxiliar na tomada de decisões dos usuários das mais diversas áreas do mercado.
A COMPUTAÇÃO é dependente de linguagens de programação concretizadas no mercado que são moldadas para lidar com grandes bases de dados (coletadas internamente ou transportadas via nuvem), como Python e R.
A ESTATÍSTICA é o ponto central do ML. Assim como nós, seres humanos, tomamos decisões com base em experiências passadas e/ou com a utilização de ferramentas de gestão, a máquina também precisa de sua
“experiência”, mais conhecida como DADOS para aplicar suas ferramentas (estatística).
Avaliação de desempenho Pré-processamento
Características
Geração do modelo De ML
Deployment
Modelo ML
Dados
Modelo treinado
Modelo Escolhido
• Arquivos chegam em excel, xml, html, pdf, txt, de outras formatos...
.TXT Conversão
SFrame
• Os arquivos devem ser convertidos em formatos úteis para a linguagem escolhida
• Os dados desses arquivos devem ser filtrados e apropriadamente manipulados para que estejam nos padrões de utilização do algoritmo: Limpar dados incompletos, corrigir formatos, compatibilizar as informações.
Pré-processamento
Geração do modelo de ML
Modelo de
Machine Learning Inteligência
Características de uma casa:
- Preço;
- Área;
- # Banheiros;
- # Quartos;
- Bairro;
etc..
Dada uma combinação de características de uma casa, qual será o preço previsto/ melhor opção de preço?
$
xb
xa y
Modelo de Machine Learning
Predição de y’
x = características de entrada
Geração do modelo de ML
Separação de dados de treino e dados de teste
Treino
Teste
Modelo de Machine Learning
Modelo Ajustado
80% dos dados para dados de treino 20% dos dados para dados de teste
Desempenho
Avaliação de desempenho
Teste
Modelo Ajustado
x x1 x2 xn
y1 y2 yn
. . .
. . .
y
x1, x2, ..., xn
Predição
x x1 x2 xn
y’1 y’2 y’n
. . .
. . .
y’
RSS = (y’1 – y1)² + (y’2 – y2)² + ... + (y’1 – y1)²
RSS =
i=1 n
y′n − yn 2
Antes de aplicar o modelo, o objetivo é obter o menor RSS possível com os dados de teste.
Xx = Combinação de valores das características de entrada
Deployment
Modelo de ML
ajustado, testado e com alto desempenho
Predição
Dados de sensores
Dados de planilha
Dados de outros estudos
Revisão e atualização periódicas
Rever os dados de entrada, Rever os métodos do modelo, Rever as características,
etc...
Pré-processamento
Temperatura(ºC) Vibração (mm/s) RUL Faixa
49.45 0.57 367 1
43.37 0.79 332 1
0.81 326 1
46,91 0.68 mm/s 351 1
47.75 1,41 481 1
50.68 0.8 325 dias 1
49.34 1.04 303 1
43.76 483 1
48,73 ºC 1.37 392 1
45.76 1.24 500 1
Os dados, em muitos casos, não
são recebidos no formato correto pela equipe que irá
realizar os estudos de predição.
Temperatura(ºC) Vibração (mm/s) RUL Faixa
49.45 0.57 367 1
43.37 0.79 332 1
0.81 326 1
46,91 0.68 mm/s 351 1
47.75 1,41 481 1
50.68 0.8 325 dias 1
49.34 1.04 303 1
43.76 483 1
48,73 ºC 1.37 392 1
45.76 1.24 500 1
Pré-processamento
Valor faltante
Valor faltante
Pontuação
inadequada Presença de
unidades
Texto com valores
Preenchimento
incompleto Tratamento de dados
Temperatura(ºC) Vibração (mm/s) Dias para falhar Faixa
49.45 0.57 367 1
43.37 0.79 332 1
46.91 0.68 351 1
47.75 1.41 481 1
49.34 1.04 303 1
48.73 1.37 392 1
45.76 1.24 500 1
Pré-processamento
Características do estudo:
Temperatura(ºC) Vibração (mm/s) Dias para falhar Faixa
• Temperatura (ºc);
• Vibração (mm/s);
• Dias para falhar (RUL);
• Faixa (de operação)
Variáveis de entrada
Variáveis de saída Geração do modelo de ML
Características = features
xd xc yb
Modelo de Machine Learning
predição y’a
Predição de y’a
xb xa ya
Modelo de Machine Learning
predição y’b
Predição de y’b
Geração do modelo de ML
Separação de dados de treino e dados de teste
Treino
Teste
Modelo de Machine Learning
Modelo
Ajustado Desempenho
• Temperatura (ºC);
• Vibração (mm/s);
• Dias para falhar (RUL);
Exemplo: RUL
49.45 0.57 367
43.37 0.79 332
46.91 0.68 351
47.75 1.41 481
49.34 1.04 303
Temperatura(ºC) Vibração (mm/s) Dias para falhar
48.73 1.37 392
45.76 1.24 500
Avaliação de Desempenho
Teste
Modelo
Ajustado¹ Predição
RSS¹ = (400 – 392)² + (450 – 500)²
RSS =
i=1
y′n − yn 2
x = Combinação de valores das características de entrada
• Temperatura (ºc);
• Vibração (mm/s);
• Dias para falhar (RUL);
xa xb ya
48.73 1.37 392 45.76 1.24 500
xa xb y’a
48.73 1.37 400 45.76 1.24 450
= 2564
Modelo Ajustado 1
Fazendo com outro modelo...
Avaliação de Desempenho
Teste
Modelo
Ajustado² Predição
RSS² = (395 – 392)² + (515 – 500)²
RSS =
i=1
y′n − yn 2
x = Combinação de valores das características de entrada
xa xb ya
48.73 1.37 392 45.76 1.24 500
xa xb y’a
48.73 1.37 395 45.76 1.24 515
234
Modelo Ajustado 2
RSS² < RSS¹
Entre os modelos 1 e 2 para a previsão da RUL, o 2 possui um desempenho melhor
• Temperatura (ºc);
• Vibração (mm/s);
• Dias para falhar (RUL);
= Modelo selecionado
para RUL:
Modelo 2
Serviço disponível em nuvem
Deployment
Modelo de ML
ajustado, testado e com alto desempenho
Predição
Revisão e atualização periódicas
Rever os dados de entrada, Rever os métodos do modelo, Rever as características,
etc...
Dados coletados em campo diariamente por
sensores ou por meio de rotas de inspeção
Pré-processamento
Arquivo em Excel Conversão de .xls para .csv
Arquivo em CSV
Pré-vizualização
Temperatura(ºC) Vibração (mm/s) RUL Desempenho (m³/h) Faixa
40.01 1.34 419 1258 1
40.04 1.5 418 1252 1
40.06 0.96 419 1268 1
40.06 1.46 418 1253 1
40.07 1.21 419 1261 1
40.07 1.11 419 1264 1
40.08 1.3 418 1258 1
40.09 1.55 418 1250 1
40.11 1.44 418 1253 1
40.12 1.26 418 1259 1
Pré-processamento Pré-vizualização
Geração do modelo de ML
Separação de dados de treino e dados de teste
Treino
Teste
Modelo de Machine Learning
Modelo
Ajustado Desempenho
80% dos dados são para o treino
Geração do modelo de ML
Features
Targets
RUL
Faixa de operação (operacional; falha potencial; falha funcional)
Avaliação de Desempenho
RSS =
i=1
y′n − yn 2
Modelos Ajustados
Melhor modelo
Pior modelo
Deployment
Simulando a leitura de um sensor/ entrada nova de planilha
Deployment
Este resultado representa o tempo estimado para que haja a ocorrência de uma falha no ativo monitorado. Esse valor é calculado pelo modelo levando em conta dados históricos daquele mesmo ativo ou de ativos similares.
Há 3 faixas de operação para um ativo, segundo a curva P-F:
• Faixa Operacional;
• Faixa de Falha Potencial;
• Faixa de Falha Funcional.
O resultado do modelo descrito neste projeto pôde calcular que o ativo se encontra na Faixa Operacional, por conta de suas condições monitoradas (temperatura e vibração).
Eng. Felipe Ramos Braidotti (11) 984 299 333
felipe@jwb.com.br
Site: www.jwb.com.br
Eng. José Wagner Braidotti Jr.
(11) 984 114 444 wagner@jwb.com.br