7.3 Workflow de um projeto de Machine Learning
7.3.1 Formulação do problema e definição dos objetivos
Um projeto deMachine Learningtem de começar, sempre, pelo estabelecimento rigoroso e claro dos objetivos (nesta fase admite-se que já foi identificado o problema e que se considera que as ferramentas deMachine Learningsão as que têm mais potencial para o resolver). É necessário entender que um sistema deMachine Learningcumpre uma tarefa muito específica e a definição de objetivos muito vagos pode conduzir a que, após vários meses de trabalho e, eventualmente, elevadas quantias de dinheiro investidas, se conclua que o que o modelo deMachine Learningdesenvolvido prevê não é exatamente o que se pretende.
Exemplifica-se, de seguida, o que se pretende transmitir com o parágrafo anterior com o que podia ter sido o processo de definição do objetivo do presente projeto.
Imagine-se que como objetivo inicial se estabelecia: prever falhas. Embora seja um ponto de partida interessante (de facto, já permite olhar para os modelos deMachine Learning do ponto de vista da manutenção preditiva), é ainda muito vago. Uma forma de o co-meçar a especificar é, por exemplo, responder às perguntas: 1) pretende-se identificar modos de falha ou prever o tempo até à falha? 2) Pretende-se prever as falhas de todos os equipamentos do complexo industrial, de grupos de equipamentos ou de equipamentos específicos? 3) Faz sentido procurar prever todos os tipos de falha ou será mais sensato procurar prever as falhas associadas aos modos de falha mais relevantes (seja a relevância medida pela frequência de falhas, criticidade, ou custo)?
A resposta às três perguntas formuladas permitiu estabelecer, para o presente projeto, o objetivo: prever o tempo até à falha dos empanques mecânicos de duas bombas centrífugas responsáveis pelo bombeamento de resíduo de vácuo da coluna de destilação a vácuo para a unidade de visbreaking.
FEUP|2018|Luís F. Pereira
7.3.Workflowde um projeto deMachine Learning 73
Figura7.3:DivisãoalternativadosalgoritmosdeMachineLearning[57].
FEUP|2018|Luís F. Pereira
74 7.Machine Learning
Figura 7.4:Workflowde um projeto deMachine Learning[46].
Assim, à primeira pergunta respondeu-se: prever o tempo de falha. Entende-se que num contexto industrial há mais potencial na utilização de modelos que procuram prever ins-tantes de falha do que na de modelos que pretendem identificar modos de falha. Isto porque, tipicamente, mais do que se compreendercomovai falhar um dado equipamento, pretende determinar-sequandoeste vai falhar, de modo a que a produção seja adaptada em função da possível indisponibilidade do equipamento. Num contexto académico e em situações em que o objetivo principal é compreender o fenómeno de falha de um dado componente, então a abordagem de identificação de modos de falha poderá revelar-se muito interessante porque pode permitir perceber como determinadas variáveis se com-binam para originar um dado modo de falha. Ainda assim, a procura de modelos que, de alguma forma, combinem ambas as abordagens poderá fornecer uma solução com maior potencial e com a possibilidade de um uso mais generalizado.
À segunda pergunta respondeu-se: equipamentos específicos. No futuro, após as técnicas deMachine Learningatingirem uma maior maturidade e, sobretudo, se compreender me-lhor como estas podem ser aplicadas na manutenção, poderá almejar prever-se todas as falhas dos equipamentos de um dado complexo industrial (provavelmente nessa altura o projeto, mais do que desenvolver um modelo deMachine Learningespecífico, passará pela integração de vários modelos, cada um deles com o objetivo de prever falhas muito específicas). Para já, e até tendo em conta que ainda são poucos os casos de sucesso de aplicação destes sistemas em manutenção, faz mais sentido procurar prever falhas de equipamentos específicos. Também se entende que ainda não é o momento de procurar prever falhas em grupos de equipamentos (e.g. bombas centrífugas). Em primeiro lu-gar, porque embora os equipamentos de um dado grupo tenham funções idênticas (e.g.
bombear um fluido), as condições de operação são, tipicamente, muito diferentes para cada equipamento (e.g. bombear água é muito diferente de bombear petróleo). Além disso, porque a frequência e tipo de falhas em equipamentos idênticos e que cumprem exatamente a mesma função não é a mesma (basta atentar nas conclusões do Capítulo3).
Ainda assim, se os equipamentos forem idênticos (mesma tecnologia) entende-se que é possível encontrar um modelo deMachine Learningque faça previsões para as falhas de todos os equipamentos em simultâneo, desde que se use a identificação do equipamento comofeature(para que o modelo seja capaz de identificar as diferenças entre equipamen-tos).
À terceira pergunta respondeu-se:prever as falhas associada ao modo de falha mais relevante.
No Capítulo3demonstrou-se que o modo de falhafuga empanqueé claramente o modo FEUP|2018|Luís F. Pereira
7.3.Workflowde um projeto deMachine Learning 75 de falha mais crítico. Além disso, os dados disponíveis2 são úteis para a previsão deste modo de falha. Assim, o mais sensato é começar por procurar um modelo para prever os instantes de falha a ele associados. A previsão de falhas associadas a outros modos de falha poderá requerer a instalação de outro tipo de sensores (e.g. a medição da vibra-ção em locais de interesse poderá permitir a previsão de falhas de rolamentos, além de, possivelmente, melhorar a qualidade dos modelos de previsão de falhas de empanques mecânicos).
Antes ainda de se pensar nas especificidades do projeto deMachine Learning, é necessário verificar se já existe alguma ferramenta no complexo industrial que procure cumprir o objetivo que foi estabelecido. Se existir, é necessário perceber porque é que não funci-ona (se funcifunci-onasse não seria necessário começar um projetoMachine Learning) e tentar incorporar esse conhecimento no novo projeto. Deve ainda verificar-se se já existem em funcionamento sistemas deMachine Learninge, eventualmente, pensar o novo sistema de forma a que, no futuro, possa ser integrado com os sistemas já existentes. Dado que o presente projeto é pioneiro quer na tentativa de prever instantes de falha de empanques mecânicos, quer na utilização de sistemas deMachine Learning, avançou-se esta etapa.
Posteriormente, e tendo em conta que já se estabeleceu um objetivo particular e claro, pode começar a fazer-se perguntas mais específicas quanto aoMachine Learning propri-amente dito: 1) deve optar-se por modelos desupervised, unsupervised,reinforcement lear-ningou, eventualmente, por combinações de modos de aprendizagem? 2) sesupervised learning, classificação ou regressão? 3) pretende-se que os modelos treinem imediata-mente à medida que novos dados são obtidos (batch learning ouonline learning)? 4) há limitações computacionais (e.g. capacidade de armazenamento)?
Após análise do problema, e tendo presente o objetivo proposto, optou-se por supervi-sed learninge, em particular, classificação. Para previsão de tempos de falha é evidente que os modelos de regressão são os mais adequados, já que, idealmente, se pretende um tempo de falha, não uma categoria/estado. Ainda assim, a simplicidade dos mode-los de classificação justifica a sua utilização numa primeira abordagem. A simplicidade justifica também que se tenha optado por classificação binária (divide-se o estado de fun-cionamento em duas categorias: funfun-cionamento estável e funfun-cionamento “pré-instável").
Relativamente ao treinoon the fly do sistema, considera-se que não é prioritário que se faça a atualização constante do modelo, visto que não é expectável que a natureza dos dados se altere a uma taxa tão elevada que conduza a uma rápida degradação do modelo (é suficiente voltar a treinar, avaliar e implementar um novo modelo, por exemplo, a cada seis meses - fazível se o processo for automático ou necessitar de intervenção humana mí-nima). As limitações computacionais não se consideram, numa primeira fase, relevantes, mas entende-se que alguns aspetos têm de ser melhorados antes da implementação efe-tiva do modelo desenvolvido, nomeadamente a facilidade e rapidez de acesso aos sinais medidos.
Note-se que parte da tomada de decisão efetuada ao longo da presente subsecção pode ser baseada na Figura7.5. A árvore de decisão apresentada permite ainda avaliar se se deve optar pelo uso de ferramentasMachine Learninge, caso não, quais são as alternativas disponíveis.
Nesta fase, se todas as etapas apresentadas tiverem sido efetuadas, os objetivos e as li-nhas guiadoras de um projeto de Machine Learning estão definidos e pode começar a
2Ver Capítulo2.
FEUP|2018|Luís F. Pereira
76 7.Machine Learning
Figura 7.5: Árvore de decisão de apoio à seleção de uma ferramenta de manutenção preditiva [5].
dispensar-se atenção ao cumprimento das restantes etapas que conduzem à implementa-ção do sistema.