PREVISÃO DE PROBABILIDADE DE FALHAS E ESTIMAÇÃO DE SINISTROS EM ESTRUTURAS, EQUIPAMENTOS E CIRCUITOS DAS REDES DE DISTRIBUIÇÃO SUBTERRÂNEAS

(1)

PREVISÃO DE PROBABILIDADE DE FALHAS E ESTIMAÇÃO DE SINISTROS EM ESTRUTURAS, EQUIPAMENTOS E CIRCUITOS DAS REDES DE

DISTRIBUIÇÃO SUBTERRÂNEAS

Vinicius Silvestrin Pantoja1 Rafael Martins de Souza2

Joisa Campanher Dutra3 João Augusto Batista4 Camila Silva Lobo5 Edmilson Varejão6 Pedro Medeiros7 André Carneiro8 Luiz Vaz9

Resumo

O uso de inteligência artificial (AI) na operação das empresas é cada vez mais comum, e isso não é diferente no setor de distribuição de energia. O alto poder preditivo apresentado por tais algoritmos o qualifica a ser um grande candidato a integrar o processo de manutenção preventiva das empresas. Este trabalho foca na estruturação das bases de dados, desenvolvimento de algoritmos de

aprendizado de máquinas, e na sua adoção no dia a dia da empresa aplicado ao caso da distribuição de energia subterrânea no Rio de Janeiro.

1_{Mestre em Econometria, Chefe de Inovação da AI Consult.}

2_{Doutor em Economia, Professor da Universidade Estadual do Rio de Janeiro e Pesquisador no Centro de} Regulação da Fundação Getulio Vargas.

3_{Doutora em Economia, Diretora do Centro de Regulação da Fundação Getulio Vargas.} 4_{Economista, Cientista de Dados na Fundação Getulio Vargas.}

5_{Engenheira e Pesquisadora no Centro de Regulação da Fundação Getulio Vargas.} 6_{Mestre em Economia, Pesquisador no Centro de Regulação da Fundação Getulio Vargas} 7_{Mestrando em Matemática Aplicada na Fundação Getulio Vargas}

8_{Engenheiro, Gerente na Light S.A.}

(2)

1. Introdução

A operação e manutenção de equipamentos elétricos é um desafio para todas as indústrias. Uma rápida busca por trabalhos acadêmicos no ano de 2019 sobre manutenção preventiva na indústria mostra que quase sete mil trabalhos foram publicados nesse ano. Ao adicionar o termo "machine learning" (ML), mais de cinco mil resultados são apresentados, ou seja, esses métodos são responsáveis por mais de setenta porcento das pesquisas na área. Isso mostra a potência inovadora que as técnicas de inteligência artificial (AI) têm no problema de manutenção preventiva.

Esse trabalho apresenta os resultados da aplicação de algoritmos de ML para o caso de distribuição de energia elétrica. Esse setor possui uma característica que o diferencia das demais indústrias, a avançada idade da infraestrutura implementada. No caso do Rio de Janeiro (foco do estudo), a rede de alimentação subterrânea possui redes novas e antigas (com mais de 100 anos). Essa mistura de épocas de implementação se apresenta como um desafio adicional à modelagem de falhas e defeitos.

A solução moderna para problemas de previsão está em uma adoção estratégica de IA. Adoção estratégica significa não apenas encontrar alguma modelo capaz de fazer previsões com alta acurácia, mas também implementá-lo no dia a dia da empresa. De acordo com Fitzgerald et al. (2014) as empresas acreditam que a tecnologia terá mudanças substanciais nos seus negócios, porém a implementação dessas tecnologias é extremamente complexa. Esse mesmo trabalho mostra que uma das razões da lenta adoção de novas tecnologias é a falta de urgência, ou seja, aliar a operação do dia a dia com os requisitos necessários para a adoção de novas tecnologias é complexo. Nesse contexto, o real valor das inovações tecnológicas não só advém de métodos mais eficientes, como também de uma implementação eficiente no dia a dia da empresa.

O presente trabalho está dividido em 6 etapas: Introdução, Revisão de Literatura; Base de Dados; Modelos; Implementação do Sistema e Conclusão.

(3)

2. Revisão de Literatura

A literatura de predição de falhas no sistema elétrico é extensa e está em constante evolução. Cada área do sistema elétrico possui importantes avanços nas metodologias de previsão. El-Sharkh e El-Keib (2003) e Beehler (1996) apresentam estratégias de previsão para falhas na transmissão; Gross et. al (2006) e Alves et al (2013) possuem foco na previsão de falhas na distribuição, utilizando modelagem estatística em dados existentes, sendo que o segundo utiliza dados capturados por sensores. Finalmente, Rudin et al. (2014), Rudin et al.(2012), Rudin et al. (2010) dão atenção para problemas na área de distribuição.

Também é característica desse campo o surgimento de novos métodos de análise. A modelagem estatística baseada em distribuições de probabilidade (como Poisson ou Gamma) é usada em Sim (1988) e Van Noortwijk (2009). Já Chan e Asgarpoor (2006) utiliza processos de Markov para fazer avaliações do sistema.

Nos últimos anos, métodos como aprendizado de máquinas e redes neurais se tornaram as ferramentas de referência nesse campo. Haseltine e El-Sheikh (2017) estudam o sistema elétrico de potência (SEP) desde a geração até a distribuição de energia para responder à pergunta: “A performance do sistema elétrico será confiável no ano que vem?”.

Esse trabalho evidencia como o uso de Redes Neurais Artificiais (RNA) podem ser úteis em análise de “pré-eventos” para determinar as áreas de maior vulnerabilidade da rede de distribuição a problemas futuros. A manutenção preditiva reside na criação de um modelo preditivo que mensure a probabilidade de falha de algum equipamento e com isso indique a necessidade proeminente de manutenção.

Em Gross et. al (2006) é possível ver a aplicação do modelo de Machine Learning chamado ROAMS (Ranker for Open-Auto Maintenance Scheduling). Falhas chamadas Open-Auto são falhas apresentadas no alimentador de energia e são um dos principais problemas desta área.

(4)

No caso de Nova Iorque, as redes são em grande parte eletricamente isoladas uma das outras para limitar a ocorrência de falhas em cascata. De acordo com o trabalho, os alimentadores da rede primária têm uma taxa de falha significativa e, portanto, grande parte do trabalho diário da Con Edison (empresa distribuidora de eletricidade) envolve o monitoramento e a manutenção dos alimentadores primários, bem como sua velocidade no reparo da falha. A distribuidora atende as cidades de Nova Iorque, New Jersey e Long Island.

O modelo previu 75% dos casos que apresentaram problemas dentro do primeiro quartil de chance de falhas. Isso significa que ¾ dos casos problemáticos estavam ranqueados no ¼ de nível de risco. Os 100 primeiros alimentadores ranqueados (com maior chance de falha) foram responsáveis por 40% das falhas diárias. Outro resultado importante foi que dos 500 alimentadores ranqueados como mais seguros, nenhum apresentou falhas, ou seja, o algoritmo gerou rankings de prioridade de manutenção que efetivamente conseguiram indicar quais alimentadores deveriam ser atendidos com maior prioridade.

Olhando para a distribuição secundária, ou seja, a distribuição de energia para consumidores (a quarta área do Sistema Elétrico), Rudin, Cynthia, et al. (2014) apresenta uma solução para a previsão de problemas que ocorram nesta etapa em Nova Iorque. Os objetivos desse trabalho consistiram em:

• Tornar o programa de inspeções mais eficiente, ao fazer uma pré-lista de prioridades;

• Otimizar o programa de trocas de estrutura com ventilação.

Para o primeiro objetivo, o resultado foi o seguinte:

• É possível prever possíveis eventos utilizando dados históricos;

• As intervenções nas caixas de inspeção acarretaram em uma grande redução dos níveis de vulnerabilidade. Também foram identificados grandes consertos necessários

(5)

• Os modelos estatísticos podem estimar o efeito de diferentes decisões políticas para o programa de inspeção, analisando o custo/benefício de cada um.

O modelo de solução completo pode ser dividido em módulos, de acordo com a figura abaixo. Inicialmente existe a ingestão dos dados crus. Geocoding, e Metadata Extraction são responsáveis por estruturar esses dados não estruturados, espacializando a informação e dando estrutura a dados em texto, utilizando técnicas como Processamento de Linguagem Natural.

FIGURA 1. PROCESSAMENTO DE INFORMACOES E MODELO DE PREVISAO

Fonte: Rudin, Cynthia, et al. (2014), Elaboração: Rudin, Cynthia, et al. (2014)

Após a base de dados estar estruturada, entra a camada de AM. Os dados a serem previstos se dividiam em três categorias: i) Evento Sério; ii) Evento menos sério,

(6)

porém precursor potencial; iii) não evento. Para separar nessas categorias, utiliza-se um modelo chamado Support Vector Machine.

Uma segunda subcamada de ML é aplicada para o aprendizado de como montar um ranking risco de falhas. A avaliação do algoritmo levará em conta as seguintes métricas:

• Número de componentes que apresentaram erro na previsão (número de vezes que um evento ocorreu em um componente apresentado como de baixo risco);

• Número de componentes no top 10% que apresentaram falhas.

Esse último trabalho serviu como inspiração para o presente exercício pois as redes de distribuição de Nova Iorque e do Rio de Janeiro possuem estruturas semelhantes.

3. Base de Dados

Modelos de ML são algoritmos que aprendem padrões em grandes bases de dados e os reproduzem ao fazer suas previsões. Dessa forma, uma base de dados bem estruturada é fundamental para o sucesso dos algoritmos, porém, normalmente essa não é a realidade encontrada nas empresas. As informações, por muitas vezes, são preenchidas manualmente, sujeitas a erros de ortografia e de informação não correta.

Para estruturar bases não estruturadas, há inicialmente a necessidade de uma camada de limpeza e estruturação das bases normalmente chamada de camada ETL (Extract, Transform and Load). No caso das bases de dados de energia não foi diferente.

3.1. Base de Cadastro

(7)

cada caixa de transformação (CT). A base possui duas planilhas, CT1 e CT2. A planilha CT1 possui informações apresentadas na tabela 2:

Tabela 2. Informações de Cadastro de Equipamentos

Variável Descrição

Código Código da CT

Código Externo Código externo da CT

Tipo de Câmara

Tipo da câmara (subterrânea, cabine, cabine de manobra, barra volt ou mini-câmara)

Tipo De Ventilação

Tipo de ventilação (natural, exaustor boia, exaustor nicho ou exaustor poste)

Tipo De Tampa Material do qual é feita a tampa da câmara

Tipo De Abertura Tipo de abertura da câmara

Grau De Vulnerabilidade De

Furto Grau de vulnerabilidade de furto da CT

Ocorrência De Furto Houve ou não furto na CT Reposição De Furto

Houve ou não reposição de material pós-furto (não há preenchimento)

Comprimento (M) Comprimento da CT em metros

Proprietário Proprietário da CT (Light ou particular)

Largura (M) Largura da CT em metros

Altura (M) Altura da CT em metros

Capacidade Projetada (Kva) Capacidade de projeto da CT (capacidade total da CT) Quantidade De Ventiladores Número de ventiladores que há nas CTs

Potência Dos Ventiladores

Potência dos ventiladores em HP (horse power) A cada 1MVA se tem um exaustor

Cordoalha Há ou não cordoalha

Código Do Logradouro No Sistema SLG

Logradouro no software Smallworld. Desconsiderar este item.

Código Do Segmento Do Logradouro

Logradouro no software Smallworld. Desconsiderar este item.

Data De Construção Apresenta a data de construção da CT Data De Entrada Em

Operação Apresenta a data de entrada em operação da CT

Localização CT é urbana ou não

Logradouro Rua onde fica a CT

Número Do Imóvel Mais

Próximo Número do imóvel mais próximo

Distrito Distrito em que fica a CT

Dado Confiável Dado é confiável ou não

Data De Criação Do Registro Data e hora da criação do registro

Data Da Última Modificação Data e hora da última modificação do registro Usuário SW

Código do usuário no software Smallworld. Desconsiderar este item.

(8)

Usuário Do Sistema Operacional

Número do usuário que fez o preenchimento

(aparentemente é o mesmo número do dado anterior)

Transformadores Quantidade de transformadores

Interruptores Quantidade de chaves

Indicadores De Defeito

IDL Identificador de defeito luminoso. Serve para

direcionar a turma de localização de defeito (emergência)

Chaves A Óleo 3d Quantidade de chaves a óleo

Barramento Triplex Quantidade de barramentos tríplex Interruptores N Vias Quantidade de interruptores N vias

Protetores Network Número de protetores

Estações Consumidoras Coluna não preenchida

Fusíveis Quantidade de fusíveis

Barramentos Bts Desconsiderar

Dtacs Chave de transferência automática (sistema radial)

Caixas Seccionadoras Quantidade de caixas seccionadoras

Medidores Quantidade de medidores

Barramentos Subterrâneos Quantidade de barramentos subterrâneos (PF) Caixa Junção 4ps Juntion Box Não existe mais

(PF) Caixa Junção 2ps Juntion Box Não existe mais

Tipo De Sensores Quantidade de sensores das CT´s automatizadas

Noy Coordenada de localização da CT

Long Longitude de localização da CT

Lat Latitude de localização da CT

Município Município em que fica a CT

Localidade Localidade em que fica a CT

Bairro Bairro em que fica a CT

Sub-bairro Sub-bairro em que fica a CT

PTACs Painel de transferência automática de carga

(PF) CDM

Quantidade de CDMs (caixas de derivação modular de BT) vinculadas a CT

NOX Coordenada de localização da CT

Fonte: Rudin, Cynthia, et al. (2014), Elaboração: Rudin, Cynthia, et al. (2014)

Na planilha CT_2 houve alteração nos dados, pois foram retiradas algumas colunas: tipo de ventilação, tipo de tampa, tipo de abertura, comprimento, largura, altura, capacidade projetada, quantidade de ventiladores, potência dos ventiladores e cordoalha. Os demais dados tiveram a posição alterada, o que não causaria nenhum problema com algoritmo de identificação do nome da variável e não só da posição do dado.

Os dados apresentaram padrão homogêneo ao longo dos anos e sem dados faltantes e indícios de anormalidade.

(9)

3.2. Base de Anormalidade

A base de anormalidades é gerada pela área de inspeção de Câmara Transformadora (CT) e, dessa forma, contém todas as irregularidades verificadas pela equipe de inspeção. Esses dados, portanto, não estão diretamente relacionados a falhas e interrupções no sistema elétrico, mas sim, as inspeções realizadas pela equipe de campo.

As CTs são inspecionadas periodicamente, a depender das suas condições operativas, da rota a qual ela pertence e da sua posição estratégica para o sistema elétrico.

Uma forma encontrada para medir a eficiência dos serviços de manutenção é a análise da “taxa de sucesso”, que consiste na razão entre número de incidência de anormalidades e o número de anormalidades que foram corrigidas na hora em uma determinada hora.

A figura 3 e as tabelas 3 e 4 consequentes mostram as vinte rotas com maior e menor taxa de sucesso. É possível verificar que a correção na hora não está relacionada com a área, uma vez que as rotas do Centro estão concentradas nos dois grupos. Esse resultado mostra que existem fatores inerentes a determinadas rotas que aumentam a probabilidade de falhas, e que apenas a alocação de equipe de manutenção não é capaz de solucionar. Os modelos de Inteligência Artificial são fundamentais para capturar padrões não triviais, conforme mostrado nas próximas sessões.

(10)

FIGURA 3. ÍNDICE TAXA DE SUCESSO

Fonte: Light. Elaboração: FGV CERI.

TABELA 3. ROTAS COM A MENOR TAXA DE SUCESSO

Rotas com menor taxa de sucesso

ROTA TOTAL SUCESSO TAXA_SUCESSO

RSU-D-059 151 19 0.125828 RCE-D-023 117 14 0.119658 RCE-D-039 113 13 0.115044 RCE-D-030 109 7 0.064220 RPE-D-001 96 12 0.125000 RSU-D-008 90 11 0.122222 RPE-D-003 86 11 0.127907 RBA-D-014 86 9 0.104651 RCE-D-040 81 7 0.086420 RSU-D-061 79 5 0.063291

TABELA 4. ROTAS COM A MAIOR TAXA DE SUCESSO

Rotas com maior taxa de sucesso

ROTA TOTAL SUCESSO TAXA_SUCESSO

RCE-N-017 250 86 0.344000 RCE-N-004 220 75 0.340909 RCE-D-008 192 64 0.333333 RCE-D-002 215 71 0.330233 RCE-N-018 192 63 0.328125 RSU-D-029 156 50 0.320513 RCE-N-015 197 61 0.309645 RCE-D-007 151 46 0.304636 RCE-N-010 181 53 0.292818 RSU-N-006 227 65 0.286344

(11)

A partir da base Anormalidade criou-se a variável target (Y). Atribui-se o valor 1 a toda observação dessa planilha. Também foram padronizados os valores para

sub_classificacao das anormalidades, agrupando os valores, principalmente

aqueles referentes a atividades de reparo em infraestrutura. Além disso, para que ela possa ser unida a outras bases, foi necessário remover qualquer símbolo não numérico do código CT

Nesta mesma base também há registros que não devem ser considerados como defeitos, como os casos: limpeza realizada, CT necessita pintura, motor substituído, dentre outros. Portanto, foi realizada uma limpeza na base e uma reclassificação do que de fato deverá ser considerado como defeito, como um possível alerta e o que será descartado.

Na base Anormalidade, há cadastrados 149 tipos diferentes de anormalidade, dos quais uma parcela significativa não pode ser considerada como defeito ou alerta.

3.3. Inspeção

A base Inspeção registra todas as CTs que sofreram inspeção pelas equipes de campo, e para o modelo ela representa o conjunto universo das CTs inspecionadas. Originalmente essa base possui 32448 observações de inspeções em um horizonte temporal de 2016 a 2018, sendo desconsideradas as inspeções externas, pois essas se referem a limpezas e não avaliam as condições dos equipamentos. Na figura 4 foi analisada o número de inspeções por mês em CTs diferentes, contabilizando cada CT apenas uma única vez ao mês. As CTs que foram inspecionadas mais de uma vez foram excluídas dessa análise, restando após a limpeza 29.420 observações.

(12)

FIGURA 4 SÉRIE TEMPORAL DAS INSPEÇÕES EM CTS

Na série temporal das inspeções é possível observar que, embora contenha alguns

outliers, o número de inspeções por mês é estável em torno da média - 817 CTs

inspecionadas por mês. Nesse gráfico são consideradas as CTs que pertencem tanto ao arranjo radial como reticulado, embora este artigo esteja contemplando apenas o arranjo reticulado.

3.4. Fatores Externos

Para o modelo foram consideradas sete estações de coleta que fornecem os dados de pluviometria, temperatura e umidade, sendo elas: Irajá, Jardim Botânico, Barra, Rio Centro, Guaratiba, Santa Cruz, Alto da Boa Vista e São Cristóvão. Os dados pelo Alerta Rio são medidos em intervalos de quinze minutos.

Os dados para cada variável (umidade, temperatura e pluviometria) foram agrupados para a frequência em três formas: média mensal das médias diárias,

(13)

média mensal das máximas diárias, máxima mensal das máximas diárias. Todos os formatos foram considerados. Os dados de cada estação foram associados a CT mais próxima e, assim, adicionou-se novas features para cada observação..

4. Modelo

A escolha de construção da base segue o raciocínio de que o algoritmo está modelando uma probabilidade condicional, isto é, não é possível encontrar defeitos em CTs que não foram inspecionadas. Portanto a probabilidade modelada é:

Prob(CT apresentar defeito|CT foi inspecionada)

Essa alteração na modelagem permite a criação de um ranking de CTs que tenham uma maior probabilidade de apresentar defeitos, diminuindo consideravelmente o desbalanceamento dos dados que podem afetar o resultado preditivo do modelo. Uma vez definido o conjunto universo, é fundamental construir o subconjunto a ser considerado como classe de interesse. Como a base Anormalidade registra defeitos e não falhas elétricas, a classe de interesse para este conjunto será defeitos.

O conjunto universo agora considerado são as CTs inspecionadas. A variável que buscamos prever – Y – é construída a partir da base de Anormalidades. . Se na CT inspecionada foi encontrado algum defeito, ou seja, se a CT aparece na planilha Anormalidade em determinado mês, atribui-se o valor 1 a variável Y, caso contrário atribui-se 0. Para tanto, foi desconsiderado anormalidades relacionadas a furtos, pois esse tipo de evento ocorre por motivos não técnicos. Além disso, outros defeitos de gravidade pequena foram desconsiderados como explicitado acima Em Machine Learning, geraente há um conflito entre complexidade do modelo e capacidade de interpretação dos resultados gerados por esse modelo. Quanto mais complexo, mais difícil a conclusão além das previsões.

As medidas de feature importance variam muito de acordo com o método a se considerar, levando a resultados diferentes e, portanto, traz ambiguidade para a

(14)

interpretação. Recentemente, houve um esforço para unificar essas medidas e, portanto, é possível atribuir qual a importância de cada variável no poder preditivo sem que haja essa ambiguidade. O SHAP value foi essa medida proposta em (LUNDBERG, 2017) para facilitar a interpretação de modelos muito complexos.

Originalmente concebidos em teoria dos jogos, os valores SHAP podem ser explicados como a variação média da previsão quando aquela variável explicativa é considerada. Os modelos são estimados utilizando todas as combinações de variáveis possíveis de maneira incremental, ou seja, partindo de uma variável e adicionando as demais. Esse processo é feito diversas vezes e a ordem das variáveis adicionadas é aleatória. Os valores SHAP de uma variável explicativa é o quanto a previsão varia quando aquela variável é adicionada nesse processo de adição de variáveis. É a maneira mais rigorosa até então de medir a importância ou contribuição daquela variável no poder preditivo do modelo.

Na Figura 5 é possível verificar que as variáveis defasadas exercem muita influência nos resultados, o que a princípio indica que há uma certa recorrência nos defeitos. No entanto, como o modelo lida com uma série temporal, era natural que houvesse esse tipo de resultado. Basicamente, ter apresentado defeitos no passado é um indicativo muito forte para que haja defeito no futuro.

(15)

FIGURA 5 MODELO COM AS VARIÁVEIS DEFASADAS

Na figura 6, a cor rosa está associada aos maiores valores daquela variável, já o azul para os menores. Em relação ao eixo x (Valores SHAP) as observações positivas estão associadas a defeitos e as negativas a não defeitos. Logo, se a uma bola rosa tem um valor SHAP positivo, significa que quanto maior valor daquela variável, mais está contribuindo para que o modelo preveja defeito. É o que acontece de maneira clara com max_max_temp, a temperatura máxima entre as máximas diárias. Quanto maior a temperatura (um dos componentes do X) daquela observação, maior a probabilidade de o modelo prever como defeito (no Y predito).

É interessante observar que o efeito da proxy de idade é disseminado entre as observações. Em relação as características da CT conclui-se que:

• Quanto mais transformadores em uma determinada CT, maior a chance de apresentar defeito;

• Quanto mais interruptores, menor a chance daquela CT apresentar defeito;

(16)

• Quanto mais interruptores de N Vias, menor a chance de apresentar defeitos;

• Quanto mais chaves a óleo, maior a chance de apresentar defeitos; • Em relação a quantidade de fusíveis e barramentos BT, os resultados

não são claros.

Em relação aos fatores externos:

• Quanto maior a temperatura, maior a probabilidade de apresentar defeitos;

• Quanto menor a umidade, maior a probabilidade de apresentar defeitos; • Os resultados para chuva são ambíguos.

Nesse trabalho foi escolhido um algoritmo chamado Extreme Gradient Boosting. Além de possuir um maior poder preditivo, o algoritmo funciona bem com os dados desbalanceados. Esse tipo de modelo é uma extensão dos modelos de Random

Forest, mas com uma diferente forma de otimização sobre a função de custo.

FIGURA 6 MODELO SEM VARIÁVEIS DEFASADAS - ANÁLISE DESAGREGADA

(17)

A métrica que o modelo deve maximizar é o recall, ou seja, o poder do modelo em identificar as observações da classe de interesse (defeitos em CT). Matematicamente, o recall responde à pergunta:

De todos os defeitos, quantos % o modelo identifica?

Já a precisão responde à pergunta:

Dos casos que o modelo identificou como defeito, quantos % realmente o são?

Conclui-se que é necessário maximizar uma combinação das duas variáveis, tanto precisão como recall. A Tabela 16 apresenta o resultado do modelo preditivo para defeitos em CTs no arranjo reticulado.

TABELA 5 RESULTADO DO MODELO

5. Sistema de previsão

Os resultados apresentados pelo modelo acima, de precisao de 80% sao muito superiores aos resultados apresentados pela metodologia utilizada hoje pela empresa, de 42%. Porém, para a implementação desse algoritmo no dia a dia da empresa nao basta apenas a criação do algoritmo, e necessário um resultado palpável, que possa ser utilizado por todos na empresa.

Para solucionar esse problema foi criado um sistema de otimização de rotas de manutencao. O estabelecimento de uma rota não leva em conta apenas a probabilidade de falhas de um determinado equipamento, mas também outras variáveis como proximidade, quao movimentado e o local da falha (pois o conserto causara bloqueio de vias), entre outros. Dessa forma foram utilizadas as rotas já estabelecidas e criou-se uma variável de rota amis problemática.

(18)

Assim o algoritmo de falhas, combinado com a otimização de rotas gera o insumo para alimentar o sistema final que e apresentado para os técnicos da light, para que utilizem as rotas indicadas como priorização para manutenção preventiva.

A figura 8 apresenta um mapa com as priorizações de manutenção preventiva georreferenciadas. Esse mapa e fundamental para a elaboração das rotas, dimensionamento de equipe e coordenação entre as equipes para a otimização do resultado.

FIGURA 9 DASHBOARD - APRESENTACAO DAS CTS COM MAIOR URGENCIA

A figura 10 apresenta o ranking de priorização. Esse ranking não e necessariamente equivalente a sequencia de CTs vistoriada, visto que a rota possui outras variáveis de otimização como transito/horário , e localização.

FIGURA 10 DASHBOARD -RANKING DE PRIORIZACAO PARA MANUTENCAO PREVENTIVA

(19)

6. Conclusão

Esse trabalho mostrou como e possível, hoje, utilizar modelos de Machine Learning para fazer a previsão de equipamentos mais sujeitos a falhas. O foco aqui não foi apenas a construção de tal modelo, que melhorou a previsão de 42% para 80%, mas também como implementar a solução, efetivamente na empresa.

Os próximos passos do trabalho consistem na implementação da mesma tecnologia para outras áreas da empresa, como a distribuição aérea e relação com o consumidor. Existe uma extensa literatura que aborda esses temas e os métodos são semelhantes ao implementado nesse trabalho, diferindo apenas na forma de limpeza e estruturação da base de dados.

7. Referências

Fitzgerald, Michael, et al. "Embracing digital technology: A new strategic imperative." MIT sloan management review 55.2 (2014): 1.

EL-SHARKH, M. Y., El-KEIB, A. A. Maintenance scheduling of generation and transmission systems using fuzzy evolutionary programming, IEEE Transactions on Power Systems, v. 18, Issue 2, p. 862-866, 2003.

(20)

BEEHLER, M. E. Reliability centered maintenance for transmission systems, Transmission and Distribution Conference, 1996. Proceedings., 1996 IEEE. IEEE, 1996.

GROSS, P. et al. Predicting electricity distribution feeder failures using machine learning susceptibility analysis, IAAI'06 Proceedings of the 18th conference on Innovative applications of artificial intelligence, v. 2, p. 1705-1711, 2006.

ALVES, J. Smart Grids: Asset management in primary distribution substations, with smart sensor networks, 22nd International Conference and Exhibition on Electricity Distribution (CIRED 2013), Stockholm, pp. 1-4, 2013.

RUDIN, C. et al. A process for predicting manhole events in Manhattan, Machine Learning, v. 80 n. 1, p. 1-31, 2010.

RUDIN, C. et al. Machine learning for the New York City power grid, IEEE transactions on pattern analysis and machine intelligence, v. 34, n.2, p. 328-345, 2012.

RUDIN et al. Analytics for power grid distribution reliability in New York City, Interfaces, v. 44, n. 4, p. 364-383, 2014.

SIM, S. ENDRENVI, J. Optimal preventive maintenance with repair, IEEE Transactions on Reliability, v. 37, n. 1, p. 92-96, 1988

VAN NOORTWIJK, J. M. A survey of the application of gamma processes in maintenance, Reliability Engineering & System Safety, v. 94, Issue 1, p. 2-21, 2009. CHAN, G. K., ASGARPOOR, S. Optimum maintenance policy with Markov processes, Electric power systems research, v. 76, n. 6-7, p. 542-456, 2006.

Lundberg, Scott M., and Su-In Lee. "A unified approach to interpreting model predictions." Advances in Neural Information Processing Systems. 2017.