• Nenhum resultado encontrado

ANÁLISES DE MÉTRICAS DE SIMILARIDADES EM SÉRIES TEMPORAIS PARA RECONHECIMENTO DE PADRÕES

N/A
N/A
Protected

Academic year: 2022

Share "ANÁLISES DE MÉTRICAS DE SIMILARIDADES EM SÉRIES TEMPORAIS PARA RECONHECIMENTO DE PADRÕES"

Copied!
12
0
0

Texto

(1)

ANÁLISES DE MÉTRICAS DE SIMILARIDADES EM SÉRIES TEMPORAIS PARA RECONHECIMENTO DE PADRÕES

Joao Francisco Monteiro Barragan (UFBA) j074@hotmail.com CRISTIANO HORA DE OLIVEIRA FONTES (UFBA) cfontes@ufba.br Otacilio Jose Pereira (UFBA) otaciliojpereira@gmail.com Sergio Torres Sa Barretto (PETROBRAS) sabart@gmail.com Luciana de Almeida Pacheco (PETROBRAS) luciana.pacheco@gmail.com

Este artigo apresenta uma metodologia para reconhecimento de padrões de operação de uma turbina a gás da unidade termelétrica (UTE) Rômulo Almeida, integrante do parque da Petrobrás. A distinção de diferentes padrões de operação, mais especcificamente, partidas sem falha e com falha devido a desarme (trip) por dispersão de temperatura foi possível devido à um vasto banco de dados obtidos a partir de um Sistema de Gerenciamento de Informações de Plantas Industriais, ou Process Information Management System (PIMS), disponível na UTE. Os padrões identificados foram analisados utilizando métricas de similaridade univariáveis (distância euclidiana entre os coeficientes de autocorrelação, visando prever distinções entre as partidas sem e com trip por dispersão de temperatura. A possibilidade de gerar uma ferramenta que possa apontar para uma possível falha no equipamento com antecedência é um resultado potencial para a implementação de um sistema de controle inteligente.

Palavras-chaves: Predição de Falhas, Turbinas a Gás, Mineração de Dados, Agrupamento, Autocorrelação

(2)

2 1. Introdução

Cada vez mais com o avanço da tecnologia da informação (TI), as empresas de diversos setores passaram a coletar e armazenar de forma sistemática os dados provenientes de suas atividades diárias. O desafio, entretanto, consiste em transformar estes dados em informações úteis que possam gerar melhorias no processo produtivo (AMORIM, 2006). Métodos

associados à geração de conhecimento (Knowledge Discovery on data - KDD) e mineração (Data Mining – DM) são métodos que utilizam dados para a geração de conhecimento útil de forma a apontar possíveis melhorias nos processos (FAYYAD et al., 1996). No caso de empresas de infraestrutura, ligadas ao fornecimento de energia elétrica, estas técnicas podem auxiliar na gestão da planta, potencializando os seus rendimentos e lucratividade, evitando inclusive pesadas penalidades contratuais em eventuais ocorrências de cessão do

fornecimento (CCEE, 2009).

Este artigo apresenta um estudo sobre o cálculo de similaridade entre séries temporais monovariáveis em uma metodologia para reconhecimento de padrões de operação de uma turbina a gás de escala comercial, com capacidade de geração de energia de 27MW, que representa o principal equipamento da unidade termelétrica (UTE) Rômulo Almeida, integrante do parque da Petrobrás. A aquisição de conhecimento e a mineração de dados foram realizadas a partir de um Sistema de Gerenciamento de Informações de Plantas Industriais, ou Process Information Management System (PIMS), disponível na UTE. Os padrões identificados foram analisados utilizando métricas de similaridade univariáveis (distância euclidiana entre os coeficientes de autocorrelação), visando reconhecer dissimilaridades ou características das partidas sem e com ocorrência de falha.

Na seção 2 é apresentado o cenário de aplicação, o sistema de estudo e aspectos envolvidos à predição de falhas em plantas industriais. Na seção 3 é demonstrada a metodologia para o reconhecimento de padrões e predição de falhas em que o estudo sobre a medida de similaridade entre séries monovariáveis foi realizado. A seção 4 apresenta as medidas de similaridade que são usualmente utilizadas, destacando os coeficientes de autocorrelação. A seção 5 apresenta a realização do experimento e seus resultados, desde a coleta dos dados, passando pelo processamento de dados e análise estatística.

2. Cenário de aplicação

A pesquisa em questão possui como campo de aplicação a Unidade Termelétrica Rômulo Almeida (UTE-RA), situada no município de Camaçari (Bahia). A UTE-RA (Figura 1) é uma unidade integrante do parque industrial da Petrobrás, o qual possui três turbinas a gás (TG) com capacidade de geração de 27MW e uma caldeira de recuperação (Heat Recovery Steam Generator – HRSG). A unidade ainda possui uma Caldeira Auxiliar (CA) e uma turbina a vapor, com capacidade de geração de até 56MW. A unidade opera em ciclo combinado e tem como principal insumo o gás natural e produz 260,3 t/h de vapores de alta e baixa pressão e até 137MW de energia elétrica (SÁ BARRETO, 2009).

(3)

3

Figura 1 – Visão panorâmica da Unidade Termelétrica Rômulo Almeida (SÁ BARRETTO, 2010)

A energia gerada pela UTE é fornecida ao Sistema Interligado Nacional (SIN), no qual o Operador Nacional do Sistema Elétrico (ONS) coordena e controla a operação e transmissão de energia elétrica. Conforme acordado com o ONS, havendo qualquer ocorrência que impeça o fornecimento de energia por parte da UTE-RA, a Unidade estará sujeita a penalidades significativas, que terão impacto direto no desempenho financeiro da Unidade.

Os vapores de alta e baixa pressão produzidos pela UTE são fornecidos para indústrias do pólo petroquímico de Camaçari. Também neste caso, o fornecimento é regido por regras previstas em contratos. Assim, o não cumprimento de certas cláusulas implicará na aplicação de severas multas contratuais.

A decisão em concentrar os esforços do estudo sobre as turbinas a gás se deu devido à maior quantidade de energia elétrica da unidade ser gerada pelas turbinas a gás (81MW são gerados pela TG e 56MW pela TV). Na planta, o modelo da turbina a gás instalada é o RB211-G62 DF, do fabricante Rolls-Royce (ROLLS-ROYCE, 2010).

Uma TG, cuja configuração típica é mostrada na Figura 2, é uma turbomáquina que tem como insumos o ar e um combustível. No caso da UTE-RA, o combustível utilizado é o gás natural.

A TG produz vapor e energia mecânica e, quando acoplada a um gerador elétrico, possibilita a geração de energia elétrica (SARAVANAMUTTOO, 1996).

Figura 2 – Turbina a Gás RB211 24G DLE (Cedido pela ROLLS-ROYCE)

A composição básica de uma turbina a gás é composta pelo compressor, câmara de combustão e expansor. O ar necessário à queima é admitido e comprimido pelo compressor, seguindo para a câmara de combustão, onde se mistura com o gás natural. Uma chama piloto é utilizada para dar início à combustão. Os gases formados na reação passam com altas velocidades e

(4)

4 temperaturas pelo expansor da turbina, o qual é acoplado a um gerador de energia,

transformando energia mecânica em energia elétrica. Este conjunto opera em um ciclo aberto, ou seja, o fluido de trabalho (ar) é admitido na pressão atmosférica e os gases de escape, após passarem pela turbina, são descarregados de volta na atmosfera sem que retornem à admissão.

As TG de modelo RB211 Rolls-Royce dispõem de nove combustores. O sistema de controle da RB211 foi projetado para desarmar o equipamento caso a temperatura de operação de alguma das câmaras se distancie em 150ºC da média de temperatura de todas as câmaras, de forma a proteger o equipamento de danos por dilatação diferencial. Quando este desarme ocorre, caracteriza-se um trip por dispersão de temperatura. As causas que provocam a

ocorrência de trip da turbina são desconhecidas e, neste sentido, a análise ou busca de padrões em variáveis de processo tais como a temperatura dos gases de exaustão pode ser bastante útil para predizer a ocorrência de falha ou a tendência à falha.

3. Metodologia

O estudo a respeito do cálculo da medida de similaridade é parte de um projeto cuja finalidade é desenvolver uma metodologia para a construção de sistemas inteligentes para predição de falhas baseada em reconhecimento de padrões em séries temporais e em sistemas fuzzy (PEREIRA, 2011).

A metodologia em questão compreende três etapas principais. A geração de amostras e classificação de padrões de processo, a análise de similaridade inter e intra grupos e o agrupamento e reconhecimento de padrões. O cálculo da medida de similaridade é um procedimento chave para a segunda etapa, que visa medir, a partir de técnicas estatísticas, similaridades dentre os grupos observados para o reconhecimento nos padrões de operação.

Na primeira etapa do projeto, através dos relatórios de operação e da base de dados

proveniente do PIMS, todas as ocorrências de partidas normais e com trip por dispersão de temperatura das três turbinas a gás da unidade foram levantadas e classificadas. O algoritmo de varredura linear possibilitou a captura de cada evento de partida da turbina, contemplando várias variáveis importantes do processo, como temperatura de entrada do ar, vazão de gás natural, pressão na saída do compressor, temperatura dos gases de exaustão, potência bruta total gerada, dentre outros. Mais especificamente, os dados foram extraídos durante os anos de 2009 e 2010 (com período de amostragem de 1 minuto), sendo observado que a duração média de desarme da turbina devido a problemas de dispersão de temperatura após a partida é de 20 minutos.

Em uma segunda etapa, os dados foram pré-processados, passando por um “enjanelamento” e normalização, sendo posteriormente aplicadas técnicas de medidas métricas de similaridade entre os grupos de partidas normais e partidas com trip, buscando evidenciar diferenças nas variáveis do processo das partidas que ocasionaram a ocorrência na parada de operação da turbina. As métricas de similaridade foram aplicadas mais especificamente a quatro variáveis medidas e obtidas do banco de dados: temperatura de entrada dos gases, vazão de gás natural, pressão na saída do compressor e temperatura dos gases de exaustão. Esta é a atividade em que são empregadas as medidas discutidas neste trabalho e que serão apresentadas no próximo tópico.

(5)

5 A terceira etapa do projeto consistiu no agrupamento e reconhecimento de padrões. Estes serão úteis na construção de um modelo preditivo de probabilidade de ocorrência de falha durante a operação da turbina.

A figura 3 a seguir apresenta um resumo de todo o trabalho, destacando pelo círculo vermelho as atividades em que o escopo deste artigo é aplicado.

Figura 3. Visão Geral da Metodologia

4. Medidas de similaridade

A predição de valores está diretamente associada a uma busca no passado por padrões de informações similares aos encontrados no momento atual (H. WU et al., 2005). Uma forma de se obter a predição de valores é a partir de técnicas de regressão numérica. Elas são capazes de gerar parâmetros que caracterizam curvas definidas pelos dados que pertencem à série de dados em análise (RAFIEI e MENDEL, 1997; B YI et al., 2000). Uma destas técnicas aplicadas a dados univariáveis é a utilização da autocorrelação de uma série temporal. Na estatística, a medida da autocorrelação pode indicar a influência de uma variável aleatória sobre seus vizinhos. Para uma variável aleatória Xt estacionária, dependente do tempo, com média μ, sua autocorelação R(k) é definida como:

onde E[] é o valor médio, esperança matemática ou expectativa da expressão, k é o deslocamento no tempo e é a variância.

A determinação da autocorrelação para vários intervalos de tempo gera um vetor com os coeficientes de autocorrelação característicos para cada curva, representando uma extração de características da série original. Espera-se que haja uma diferenciação entre esta característica nas curvas que apresentam partidas normais das partidas com trip por dispersão de

temperatura. Pode-se avaliar o valor desta diferenciação a partir da utilização de funções distância. Algumas das funções distância mais utilizadas são a Distância Euclidiana e a Distância Manhattan (MINKOWSKI, H., 1896).

A distância Euclidiana entre os objetos P = (p1,p2,...,pn) e Q = (q1,q2,...,qn) é definida como:

(6)

6 A figura 4 a seguir ilustra a aplicação da Distância Euclidiana como métrica de similaridade entre séries temporais. Vale destacar que no caso da figura a medida de distância euclidiana é feita entre as séries temporais em si apenas como ilustração. Este estudo usa a distância euclidiana aplicada aos coeficientes de autocorrelação das séries.

Figura 4 – Medida de similaridade por distância euclidiana (adaptado de VLACHOS, 2005)

5. Resultados e discussão

Primeiramente, a partir dos relatórios técnicos e do banco de dados do PIMS, foi possível identificar 80 eventos de partida da turbina no período de 2008 a 2010. A figura 5 ilustra dois exemplos de medições de vazão (azul) e temperatura de exaustão (vermelho) em partidas da turbina, sendo uma delas classificada como partida normal e a outra como partida com trip por dispersão de temperatura. O início da partida da turbina está representado

aproximadamente no instante de 60 minutos e a parada da turbina, no caso de falha, ocorre aproximadamente após 20 minutos da sua partida. Os valores das vazões e de temperatura foram omitidos e apresentados em uma escala normalizada, por questão de confidencialidade dos dados.

(7)

7

Figura 5. Dados de vazão e temperatura de partida normal e com trip por dispersão de temperatura

Antes de aplicar as técnicas de extração de características, fez-se necessário a realização de um pré-tratamento das séries temporais demonstradas acima. Cada evento foi “enjanelado”, ou seja, fez-se o estudo da evolução das variáveis da turbina, desde o seu momento de partida até os 5, 8, 11 e 20 minutos posteriores, gerando “retratos” de partida para diferentes

intervalos. Cada janela representando eventos de partida de turbina sem e com trip por

dispersão de temperatura foram então normalizados. O resultado deste pré-processamento está exemplificado nas figuras 6 e 7 para intervalos de tempo de 11 e 20 min.

Figura 6. Dados após pré-processamento para janela de 11 minutos

(8)

8

Figura 7. Dados após pré-processamento para janela de 20 minutos

Para cada variável de partida da turbina, o cálculo dos coeficientes de autocorrelação foi realizado, tendo como produto, duas matrizes. Uma das matrizes representa os coeficientes de autocorrelação das partidas normais e a outra os coeficientes das curvas que apresentaram trip. Estes coeficientes exprimem uma característica das curvas que o geraram, podendo ser comparadas a partir de funções distância, no caso utilizado, a distância euclidiana entre estes coeficientes. É esperado que as curvas normais apresentem entre si, baixas distâncias

euclidianas de seus coeficientes de autocorrelação, apresentando uma tendência comum entre elas. Da mesma forma, espera-se uma baixa distância entre as partidas com trip por dispersão de temperatura e uma distância euclidiana resultante maior quando comparada as partidas entre os grupos de partidas com e sem trip. Este procedimento foi repetido para as quatro variáveis (temperatura de entrada, vazão, pressão e temperatura de exaustão), utilizando

“janelas” de observação do evento de 5, 8, 11 e 20 minutos. A figura 8 a seguir sintetiza os resultados obtidos para a variável temperatura de exaustão dos gases:

(9)

9

Figura 8. Gráfico Boxplot resultante das distâncias euclidianas inter e intra grupos

A partir deste resultado, verifica-se uma segregação nas características das curvas com trip e normais, apresentando diferentes medianas entre as distâncias euclidianas. Entretanto, observa-se uma grande quantidade de pontos aberrantes (outliers) dentro do grupo normal, isto é, pontos que se distanciaram muito da mediana. Isto motivou um estudo mais

aprofundado para a verificação de dois grupamentos (clusters) dentro do grupo de partidas normais. O método Fuzzy C-means (Hoppner et al., 1999) foi adotado buscando-se gerar dois grupos distintos dentre as partidas normais da turbina. Os dois grupos resultantes se

distinguiram basicamente pela temperatura inicial no momento da partida da planta. As partidas que foram realizadas logo após uma trip ainda possuíam altas temperaturas de

exaustão. O outro grupo apresentou partidas com temperaturas de exaustão iniciais na faixa da temperatura ambiente. Todo o procedimento de cálculo dos coeficientes de autocorrelação e suas respectivas distâncias euclidianas foi novamente realizado, utilizando agora dois grupos de partida normal distintos. Os resultados obtidos são apresentados na figura 9.

(10)

10

Figura 9. Boxplot resultante das distâncias euclidianas com dois grupos de partida normal

A Figura 10 mostra que o comportamento desejado para a partida da turbina é o padrão de partida normal N2, pois este comportamento é mais distante dos eventos de trip. Além disso, a quantidade de pontos aberrantes ou de exceção (outliers) foi significantemente diminuída com a inclusão de dois grupos, o que reforça a teoria da existência de dois “clusters”.

Comparando a distância entre as curvas de partida normais tipo N1 e N2 em relação ao padrão de trip (média entre as curvas de trip) (Figura 10), atesta-se que o padrão de partida N2 possui menor semelhança (maior distância) do que aquelas partidas normais do tipo 1. A Figura 10 apresenta também o padrão de curva de temperatura de exaustão para os casos de partida dos tipos N1 e do N2.

Figura 10. Boxplot resultante das distâncias euclidianas inter e intra grupos

(11)

11 A análise destes dois últimos resultados são de significativa relevância para a metodologia de reconhecimento de padrões de falha em turbinas a gás, objeto em que este estudo de medida de similaridade será inserido. Os resultados na análise inicial pelo gráfico de box-plot sugeriram a existência de dois padrões de partidas normais e um de partida com trip. A segunda análise, das distâncias dos padrões de partidas normais ao padrão de trip aponta a existência de um padrão N2 de partida mais segura com menos tendência a falha uma vez que apresenta maiores distâncias em relação ao padrão de trip. Daí conclui-se que ao monitorar a operação da turbina deve-se observar e conduzir a partida de forma que sua série temporal e seus coeficientes de autocorrelação se assemelhem com este padrão de partida normal segura N2. Caso contrário, existe uma maior probabilidade de falha na turbina.

6. Conclusão

Este trabalho apresentou um estudo sobre medida de similaridade entre séries temporais monovariáveis que servirá para o desenvolvimento de uma metodologia e resultados de reconhecimento de padrões de operação em uma turbina a gás visando a caracterização e predição de parada por trip por dispersão de temperatura.

Os resultados permitiram extrair duas conclusões principais: i) foi identificada a existência de dois padrões de partidas dentro do grupo de partidas normais e ii) um dos padrões de partidas normais tinha maior distância do padrão de partida com trip, sendo então caracterizado como um padrão de partida mais seguro para a turbina. Principalmente este último resultado permite distinguir partidas seguras de partidas com potencial de trip e isso demonstra a utilidade do estudo e sua colaboração para a construção da metodologia para implementação de sistemas inteligentes de predição de falhas.

Referências:

AMORIM, T. Conceitos, técnicas, ferramentas e aplicações de Mineração de Dados para gerar conhecimento a partir de base de dados. Trabalho de Graduação (Ciências da Computação) – Universidade Federal de Pernambuco, 2006.

B. YI, N. D. SIDIROPOULOS, T. JOHNSON, H. V. JAGADISH, C. FALOUTSOS, and A. BILIRIS.

Online data mining for co-evolving time sequence. Data Engineering, 16th international conference, 2000.

CCEE, Câmara Comercializadora de Energia Elétrica. Determinação de Geração e Consumo.Brasília, 2009.

37p.

D. RAFIEI and A. MENDELZON. Similarity-based queries for time series data. Proceedings of the 1997 ACM SIGMOD international conference on Management of data. New York, 1997.

FAYYAD, U. M. PIATETSKY, G. SMYTH, P. UTHURUSAMY, R. Advances in Knowledge Discovery and Data Mining. American Association for Artificial Intelligence e MIT Press. California, 1996.

HOPPNNER, F., KLAWONN, F., KRUSE, R., RUNKLER, T., “Fuzzy Cluster Analysis - Methods for Classification, Data Abalysis and Image Recognition”, John Wiley & Sons, 1999.

H. WU, B. SALZBERG; G. C. SHARP; S. B. JIANG, H. SHIRATO; D. KAELI. Subsequence matching on structured time series data, 2005

MINKOWSKI, H.. Geometrie der Zahlen. Leipzig: Teubner, 1896.

(12)

12

PEREIRA, O. J., PACHECO, L. A., SA BARRETO, S. T., FONTES, C. H. O., CAVALCANTE, C. A. M.

T. Identificação de padrões de operação em turbinas a gás para predição de falhas e suporte à decisão gerencial. XXXI Encontro Nacional de Engenharia de Produção. Belo Horizonte, 2011..

ROLLS-ROYCE. Material de Treinamento do Conjunto RB 211-G62 DF, 2010.

SÁ BARRETO, S. T. Desenvolvimento de Metodologia pata Atualização em Tempo Real de Modelos

Matemáticos de Processos Decisórios. Dissertação (Mestrado em Mecatrônica) – PPGM, Universidade Federal da Bahia, 2009.

SARAVANAMUTTOO, H. I. H.; ROGERS, G. F. C.; COHEN, H. Gas Turbine Theory. 5.ed.Dorchester:

Prentice Hall, 1996.`

Referências

Documentos relacionados

Objetivo: Garantir estimativas mais realistas e precisas para o projeto, ao considerar nesta estimativa o esforço necessário (em horas ou percentual do projeto) para

O estudo múltiplo de casos foi aplicado para identificar as semelhanças e dissemelhanças na forma como as empresas relacionam seus modelos de negócios e suas

Assim, além de suas cinco dimensões não poderem ser mensuradas simultaneamente, já que fazem mais ou menos sentido dependendo do momento da mensuração, seu nível de

1- A partir de observações e avaliações realizadas no segmento de transportes verificou-se a dificuldade de apropriação dos custos efetivos aos serviços

(grifos nossos). b) Em observância ao princípio da impessoalidade, a Administração não pode atuar com vistas a prejudicar ou beneficiar pessoas determinadas, vez que é

O DIRIGENTE DE EFPC DEVE DESENVOLVER ATITUDES PAUTADAS PELAS DIRETRIZES FIXADAS PELO CMN ATRAVÉS DE OBSERVÂNCIA DE PRINCÍPIOS DE SEGURANÇA, RENTABILIDADE, SOLVÊNCIA, LIQUIDEZ

Cientista, eu? Como cidadãos comuns também podem fazer ciência. As formigas estão entre os animais com organização social mais complexa da natureza. Em suas colônias, cada inseto tem

Os valores de energia de ativação se apresentaram superiores para as amostras com incorporação da fibra de sisal, enquanto que a incorporação da fibra de vidro demonstrou