Utilização do aprendizado de máquina (machine learning) para a manutenção preditiva

(1)

Indentificação da Vida Útil

Remanescente (RUL) e da Faixa de Operação do Ativo

(2)

O aprendizado de máquina, popularmente conhecido como machine learning (“ML”) é definido como um conjunto de práticas computacionais e estatísticas com a finalidade de auxiliar na tomada de decisões dos usuários das mais diversas áreas do mercado.

A COMPUTAÇÃO é dependente de linguagens de programação concretizadas no mercado que são moldadas para lidar com grandes bases de dados (coletadas internamente ou transportadas via nuvem), como Python e R.

A ESTATÍSTICA é o ponto central do ML. Assim como nós, seres humanos, tomamos decisões com base em experiências passadas e/ou com a utilização de ferramentas de gestão, a máquina também precisa de sua

“experiência”, mais conhecida como DADOS para aplicar suas ferramentas (estatística).

(3)

Avaliação de desempenho Pré-processamento

Características

Geração do modelo De ML

Deployment

Modelo ML

Dados

Modelo treinado

Modelo Escolhido

(4)

• Arquivos chegam em excel, xml, html, pdf, txt, de outras formatos...

.TXT ^Conversão

SFrame

• Os arquivos devem ser convertidos em formatos úteis para a linguagem escolhida

• Os dados desses arquivos devem ser filtrados e apropriadamente manipulados para que estejam nos padrões de utilização do algoritmo: Limpar dados incompletos, corrigir formatos, compatibilizar as informações.

Pré-processamento

(5)

Geração do modelo de ML

Modelo de

Machine Learning Inteligência

Características de uma casa:

- Preço;

- Área;

- # Banheiros;

- # Quartos;

- Bairro;

etc..

Dada uma combinação de características de uma casa, qual será o preço previsto/ melhor opção de preço?

$

xb

xa y

Modelo de Machine Learning

Predição de y’

x = características de entrada

(6)

Separação de dados de treino e dados de teste

Treino

Teste

Modelo Ajustado

80% dos dados para dados de treino 20% dos dados para dados de teste

Desempenho

(7)

Avaliação de desempenho

Teste

Modelo Ajustado

x x1 x2 xn

y1 y2 yn

. . .

y

x1, x2, ..., xn

Predição

x x1 x2 xn

y’1 y’2 y’n

. . .

y’

RSS = (y’1 – y1)² + (y’2 – y2)² + ... + (y’1 – y1)²

RSS = ෍

i=1 n

y^′_n − y_n ²

Antes de aplicar o modelo, o objetivo é obter o menor RSS possível com os dados de teste.

Xx = Combinação de valores das características de entrada

(8)

Deployment

Modelo de ML

ajustado, testado e com alto desempenho

Predição

Dados de sensores

Dados de planilha

Dados de outros estudos

Revisão e atualização periódicas

Rever os dados de entrada, Rever os métodos do modelo, Rever as características,

etc...

(9)

Pré-processamento

Temperatura(ºC) Vibração (mm/s) RUL Faixa

49.45 0.57 367 1

43.37 0.79 332 1

0.81 326 1

46,91 0.68 mm/s 351 1

47.75 1,41 481 1

50.68 0.8 325 dias 1

49.34 1.04 303 1

43.76 483 1

48,73 ºC 1.37 392 1

45.76 1.24 500 1

Os dados, em muitos casos, não

são recebidos no formato correto pela equipe que irá

realizar os estudos de predição.

(10)

Temperatura(ºC) Vibração (mm/s) RUL Faixa

49.45 0.57 367 1

43.37 0.79 332 1

0.81 326 1

46,91 0.68 mm/s 351 1

47.75 1,41 481 1

50.68 0.8 325 dias 1

49.34 1.04 303 1

43.76 483 1

48,73 ºC 1.37 392 1

45.76 1.24 500 1

Pré-processamento

Valor faltante

Pontuação

inadequada Presença de

unidades

Texto com valores

Preenchimento

incompleto Tratamento de dados

(11)

Temperatura(ºC) Vibração (mm/s) Dias para falhar Faixa

49.45 0.57 367 1

43.37 0.79 332 1

46.91 0.68 351 1

47.75 1.41 481 1

49.34 1.04 303 1

48.73 1.37 392 1

45.76 1.24 500 1

Pré-processamento

(12)

Características do estudo:

Temperatura(ºC) Vibração (mm/s) Dias para falhar Faixa

• Temperatura (ºc);

• Vibração (mm/s);

• Dias para falhar (RUL);

• Faixa (de operação)

Variáveis de entrada

Variáveis de saída Geração do modelo de ML

Características = features

xd xc yb

predição y’a

Predição de y’a

xb xa ya

predição y’b

Predição de y’b

(13)

Treino

Teste

Modelo

Ajustado Desempenho

• Temperatura (ºC);

Exemplo: RUL

49.45 0.57 367

43.37 0.79 332

46.91 0.68 351

47.75 1.41 481

49.34 1.04 303

Temperatura(ºC) Vibração (mm/s) Dias para falhar

48.73 1.37 392

45.76 1.24 500

(14)

Avaliação de Desempenho

Teste

Modelo

Ajustado¹ Predição

RSS¹ = (400 – 392)² + (450 – 500)²

RSS = ෍

i=1

y^′_n − y_n ²

x = Combinação de valores das características de entrada

xa xb ya

48.73 1.37 392 45.76 1.24 500

xa xb y’a

48.73 1.37 400 45.76 1.24 450

= ²⁵⁶⁴

Modelo Ajustado 1

Fazendo com outro modelo...

(15)

Teste

Modelo

Ajustado² Predição

RSS² = (395 – 392)² + (515 – 500)²

RSS = ෍

i=1

y^′_n − y_n ²

x = Combinação de valores das características de entrada

xa xb ya

48.73 1.37 392 45.76 1.24 500

xa xb y’a

48.73 1.37 395 45.76 1.24 515

234

Modelo Ajustado 2

RSS² < RSS¹

Entre os modelos 1 e 2 para a previsão da RUL, o 2 possui um desempenho melhor

= Modelo selecionado

para RUL:

Modelo 2

(16)

Serviço disponível em nuvem

Deployment

Modelo de ML

ajustado, testado e com alto desempenho

Predição

Revisão e atualização periódicas

Rever os dados de entrada, Rever os métodos do modelo, Rever as características,

etc...

Dados coletados em campo diariamente por

sensores ou por meio de rotas de inspeção

(17)

Pré-processamento

Arquivo em Excel Conversão de .xls para .csv

Arquivo em CSV

Pré-vizualização

Temperatura(ºC) Vibração (mm/s) RUL Desempenho (m³/h) Faixa

40.01 1.34 419 1258 1

40.04 1.5 418 1252 1

40.06 0.96 419 1268 1

40.06 1.46 418 1253 1

40.07 1.21 419 1261 1

40.07 1.11 419 1264 1

40.08 1.3 418 1258 1

40.09 1.55 418 1250 1

40.11 1.44 418 1253 1

40.12 1.26 418 1259 1

(18)

Pré-processamento Pré-vizualização

(19)

Treino

Teste

Modelo

Ajustado Desempenho

80% dos dados são para o treino

(20)

Features

Targets

RUL

Faixa de operação (operacional; falha potencial; falha funcional)

(21)

RSS = ෍

i=1

y^′_n − y_n ²

Modelos Ajustados

Melhor modelo

Pior modelo

(22)

Deployment

Simulando a leitura de um sensor/ entrada nova de planilha

(23)

Deployment

Este resultado representa o tempo estimado para que haja a ocorrência de uma falha no ativo monitorado. Esse valor é calculado pelo modelo levando em conta dados históricos daquele mesmo ativo ou de ativos similares.

Há 3 faixas de operação para um ativo, segundo a curva P-F:

• Faixa Operacional;

• Faixa de Falha Potencial;

• Faixa de Falha Funcional.

O resultado do modelo descrito neste projeto pôde calcular que o ativo se encontra na Faixa Operacional, por conta de suas condições monitoradas (temperatura e vibração).

(24)

Eng. Felipe Ramos Braidotti (11) 984 299 333

felipe@jwb.com.br

Site: www.jwb.com.br

Eng. José Wagner Braidotti Jr.

(11) 984 114 444 wagner@jwb.com.br

(25)