• Nenhum resultado encontrado

3.2 Detecção e Diagnóstico de Falhas com Métodos Baseados em Dados

3.3.2 Índices de Detecção e Limites de Controle

A identificação de falhas está baseada na trajetória de determinadas variáveis ao longo do tempo, em que a avaliação de resíduos desempenha papel essencial na detecção e diagnóstico de falhas. Essa avaliação, e a correspondente definição dos índices de detecção e seus limites, deve considerar o compromisso entre uma detecção rápida e confiável. Na maioria dos trabalhos que utilizam observadores, limites sim- ples são utilizados para a avaliação de resíduos. Classificadores estatísticos também podem ser usados nessa avaliação, como por exemplo uma rede neuronial (KÖPPEN- SELIGER et al., 1995). Não obstante, a análise do comportamento das variáveis de entrada também é importante, sendo bastante útil para fins de diagnóstico da falha. No contexto da modelagem descrita anteriormente, em que um modelo e uma lista das variáveis medidas mais relevantes estão disponíveis, foram definidos índices de detecção para o erro de predição (z = y − ˆy), para a variável de interesse (y) e para as variáveis independentes selecionadas (xl). Essas variáveis foram incluídas no monitoramento com o objetivo de melhorar a assertividade na distinção entre eventos que alteram o estado do processo, acompanhado ou não da degradação do desempenho do modelo, de flutuações aleatórias presentes no sistema. Além disso, também visou a distinguir eventos ligados à aquisição dos dados, como perda de

calibração dos instrumentos e falhas em sensores, daqueles associados a falhas de processo.

A definição dos índices de detecção esteve associada ao objetivo de auxiliar as seguintes atividades: i) avaliar a qualidade dos dados e apoiar a identificação de problemas associados com a aquisição dos sinais, como valores espúrios; ii) avaliar a pertinência dos dados e apoiar a identificação de mudanças na morfologia dos sinais; iii) avaliar a qualidade do modelo; e iv) avaliar o estado do processo e apoiar a identificação e detecção de falhas. Nesse contexto, a definição dos índices foi baseada na identificação de valores espúrios (ou outliers), desvios sistemáticos e tendências no conjunto de dados.

Índice de detecção de valores espúrios (Io): esse índice tem como objetivo identificar se o sinal é muito distinto da média observada no conjunto de dados usado na construção do modelo, ou seja, avaliar se os sinais do processo tem correspon- dência com o conjunto de dados normal. O índice é calculado em cada instante de amostragem k, sendo definido de acordo com testes estatísticos aplicados a cada um dos grupos de variáveis monitoradas como segue:

1. Índice para o erro de predição da variável de interesse, mede o desempenho do modelo para representar os dados:

Io,z=|z| < co,z (3.3) 2. Índice para a variável de interesse, mede a pertinência da variável resposta

frente ao dados de construção do modelo:

Io,y =|y − ¯y| < co,y (3.4) 3. Índice das variáveis de entrada, mede a pertinência das variáveis de entrada

selecionadas frente aos dados de construção do modelo:

Io,xi =|xi− ¯xi| < co,xi (3.5)

O valor ¯y é o valor médio para as observações da variável de interesse no conjunto de treino, enquanto z é a diferença entre o valor da variável de interesse e sua predição no tempo mais recente; ¯xi é a média da variável selecionada i no conjunto de treino. Os limites de controle co,z, co,xi e co,y são limites de confiança para cada índice,

geralmente determinados por meio de propriedades estatísticas dos dados históricos usados na construção do modelo. Por exemplo, co,xi = 3 σxi representa um intervalo

de confiança de três vezes o desvio padrão de xi observado no conjunto de treino e corresponde ao nível de confiança de 99,56% da distribuição normal.

No caso em que um dos índices viola o limite de tolerância, i.e., quando alguma das desigualdades não é satisfeita, há indícios de um valor espúrio na variável mo- nitorada pelo índice, que pode estar associado a flutuações aleatórias do sistema de medição. Os índices são calculados de maneira independente, de modo que várias variáveis podem violar os respectivos limites de controle ao mesmo tempo.

Índice de detecção de desvio sistemático (Ib): o segundo índice tem como objetivo detectar a existência de desvio sistemático ao longo de uma janela de tempo pré-definida. O índice é calculado para uma janela de dados contendo N pontos, como segue:

1. Índice para desvio sistemático do erro de predição da variável de interesse, indica o nível de degradação do ajuste do modelo para os dados da janela:

Ib,z =|¯zN| < cb,z (3.6) 2. Índice para desvio sistemático da variável de interesse, indica a mudança de

comportamento da variável resposta para os dados da janela:

Ib,y =|¯yN − ¯y| < cb,y (3.7) 3. Índice para desvio sistemático das variáveis selecionadas, indica a mudança de

comportamento das variáveis de entrada para os dados da janela:

Ib,xi =|¯xi,N − ¯xi| < cb,xi (3.8)

em que ¯yN e ¯zN correspondem à média dos valores da variável de interesse e dos erros de predição, respectivamente, na janela contendo os últimos N pontos; e ¯xi,N é a média da i-ésima variável selecionada na construção do modelo na janela contendo os últimos N pontos.

Como descrito para o índice anterior, cb,z, cb,y e cb,xi são limites de confiança para

cada variável monitorada, geralmente determinados por meio de propriedades esta- tísticas. Para o caso da janela de dados com N pontos, cb,xi = 3 σxi/

N representa um intervalo de confiança de três vezes o desvio padrão de xi observado na janela de dados e corresponde ao nível de confiança de 99,56% da distribuição normal.

O tamanho da janela de dados, N, é um parâmetro de sintonia, que tem relação com a dinâmica do processo. Assim, o valor de N deve ser avaliado para cada sistema. Para fins de avaliação, foram testadas janelas de tamanho 10 e 60 minutos.

Nesse cenário, quando um índice viola o limite de tolerância, existe evidência de desvio sistemático na variável monitorada para a janela de tempo considerada, que pode estar associado a uma falha de medição, falha de processo ou degradação do desempenho do modelo. Novamente, os índices são independentes e podem violar os respectivos limites de controle simultaneamente.

Índice de detecção de tendência (Id): o terceiro índice tem como objetivo detectar tendência para as medidas de uma variável monitorada em um intervalo de tempo. A tendência avaliada pelo índice é apontada pela significância estatística do coeficiente angular obtido para uma regressão linear dos dados normalizados no interior de uma janela de N pontos, conforme ilustrado na Figura 3.2.

−4 −2 2 4 −1 1 2 u− ¯u y− ¯y (y− ¯y) = 0.2256967· (u − ¯u)

Figura 3.2: Tendência em uma série temporal com janela de tamanho N = 10.

Para a variável de interesse (y), a regressão linear com os dados normalizados pode ser representada pela seguinte equação linear:

(yu− ¯y) = a (u − ¯u) ,

em que u = 0, · · · , N − 1 é o instante de tempo correspondente a yu no interior da janela e ¯u é o valor médio de u. Assim, com base em uma regressão de mí- nimos quadrados, o coeficiente a da regressão linear pode ser determinado como (HIMMELBLAU, 1970):

ˆ a =

PN−1

u=0 (yu− ¯y) (u − ¯u) PN−1

u=0 (u− ¯u)

2 . (3.9)

Assim, o índice consiste em avaliar o grau de significância do valor estimado do coeficiente linear de acordo com limites de controle:

1. Índice para tendência do erro de predição da variável de interesse, indica ten- dência na qualidade do ajuste do modelo aos dados da janela:

Id,z =|ˆaz| < cd,z (3.10) 2. Índice para tendência da variável de interesse, indica o comportamento dinâ-

mico da variável resposta para os dados da janela:

Id,y =|ˆay| < cd,y (3.11)

3. Índice para tendência das variáveis selecionadas, indica o comportamento di- nâmico nas variáveis de entrada para os dados da janela:

Id,xi=|ˆax,i| < cd,xi (3.12)

em que ˆaz, ˆay e ˆax,i são coeficientes estimados com dados para o erro de predição, para a variável de interesse e para a variável selecionada i, respectivamente.

Os limites cd,xi, cd,y e cd,z podem ser definidos em termos da variância do coefi-

ciente angular estimado (σ2

a), de acordo com a equação: σa2 = σ 2 PN−1 u=0 (u− ¯u) 2 , (3.13) em que σ2 = N−1 X u=0 [(yu− ¯y) − a u]2 N − 1 .

Se o valor absoluto do coeficiente linear viola os limites de tolerância, existe evidên- cia de tendência no conjunto de dados para a janela considerada, que pode estar associada a uma falha de processo ou degradação do desempenho do modelo.

De modo similar ao caso do índice anterior, o tamanho da janela de dados, N, é um parâmetro de sintonia que tem relação com a dinâmica do processo e deve ser avaliado. Para fins de avaliação, foram testadas janelas de tamanho 10 e 60 minutos.