• Nenhum resultado encontrado

No contexto de teoria da informação, o grau de informação de uma mensagem é in- versamente proporcional a probabilidade de ocorrência daquela mensagem (Sucar 2015). Logo, uma mensagem com alta probabilidade de ocorrência possui um grau de informa- ção menor do que outra mensagem que ocorra com probabilidade inferior. Aplicando este conceito em alarmes industriais, um alarme que possui alta probabilidade de ocorrência sob determinadas condições se torna menos importante, em termos de informação, do que outro alarme que ocorra com menor probabilidade. Isto se dá devido ao fato que este último representa uma condição mais improvável, logo, a atenção para esta informação será maior.

Conforme informado, a eficiência de sistemas de alarmes que, corriqueiramente são mal configurados, afeta diretamente o desempenho do operador do processo industrial. Entre os diversos aspectos que degradam a eficiência de um sistema de alarmes, temos os alarmes causais. Estes alarmes se caracterizam pelo padrão de causa e consequência nas ocorrências dos alarmes envolvidos.

Os alarmes causais são considerados problemáticos, pois a informação do alarme con- sequente (ou o efeito) se torna previsível a partir da ocorrência do alarmes causador. Neste aspecto, o alarme consequente irá ocorrer com alta probabilidade, dado que houve a ocor- rência da causa. Isto implica, nestas condições, em informação com alta probabilidade de ocorrência que, por sua vez, se torna menos importante. Sendo assim, mediante este cenário, o operador eventualmente ignorará o alarme com menor importância devido ao padrão causal, logo o risco da segurança industrial cresce.

A EEMUA 191 lista um conjunto de técnicas que identificam aspectos negativos em sistemas de alarmes, estas são utilizadas no estágio de monitoramento do ciclo de vida do sistema de alarmes. Entre as técnicas listadas, é contemplada a técnica para identificação de alarmes causais, onde a norma aconselha o uso de correlação cruzada como meio para localização dos padrões causais.

Desta forma, mediante a contextualização associada à prática de gestão de alarmes in- dustriais e ao problemático cenário de alarmes causais, é possível notar a real necessidade

2.4. ALARMES CAUSAIS 15

em otimizar os sistemas de alarmes industriais. Entre os possíveis aspectos para otimiza- ção, a identificação de alarmes causais se torna necessária para a etapa de monitoramento do ciclo de vida de um sistema de alarmes.

Capítulo 3

Fundamentação Matemática

Devido ao âmbito complexo, e até filosófico, da definição de causalidade, diversas téc- nicas matemáticas surgem na literatura com a proposta de identificar causalidade. Cada uma com suas estratégias e, consequentes, limitações associadas. A dificuldade da iden- tificação de relações de causa e efeito se agrava mediante o quão mais complexo for o sistema de causalidade a ser analisado (Fan Yang 2012).

Desta forma, este capítulo apresenta a fundamentação teórica associada às técnicas de indicação de causalidade em estudo, a saber: Correlação Cruzada e Teste de Causalidade de Granger.

3.1

Correlação Cruzada

Conforme a norma EEMUA 191, a técnica indicada para identificar possíveis rela- ções causais entre alarmes industriais é a correlação cruzada. Sendo assim, esta seção demonstra os aspectos matemáticos envolvidos na técnica de correlação cruzada.

Correlação

Amplamente estudada por Francis Galton e Karl Pearson nos anos 1885 e 1895, res- pectivamente, a correlação, no estudo estatístico, é denominada como a relação entre duas ou mais variáveis. Esta propriedade estatística teve papel fundamental no pro- grama de pesquisa de Pearson descrito como "contribuições matemáticas para a teoria da evolução"(Aldrich 1995, Joseph Lee Rodgers 1988).

Através desta propriedade, torna-se possível identificar se alterações em uma das va- riáveis produz alterações relacionadas nas outras, possibilitando a identificação de pa- drões entre as variáveis. Por exemplo, a correlação permite identificar relações diretas entre variáveis nas áreas de medicina (Mukaka 2012), política (Taylor 1972), etc.

A correlação entre variáveis utiliza-se do diagrama de dispersão. Este é um gráfico cartesiano onde cada eixo corresponde a uma das variáveis em análise (Correa 2003). Desta forma, dado um conjunto de dados das variáveis em estudo, os pares ordenados formam uma nuvem de pontos no diagrama de dispersão, de acordo com o exemplo na Figura 3.1.

18 CAPÍTULO 3. FUNDAMENTAÇÃO MATEMÁTICA

Figura 3.1: Exemplo de formação de nuvem de pontos no diagrama de dispersão Fonte: Autoria própria

O formato da nuvem de pontos geradas no diagrama de dispersão determina o grau de correlação entre as variáveis. A Figura 3.2 demonstra alguns exemplo de nuvens e seus respectivos graus de correlação associados.

Figura 3.2: Exemplos de graus de correlação baseados em formato da nuvem de pontos Fonte: Autoria própria

Por se tratar de uma análise visual e, consequentemente, passível de interpretação pes- soal, surgiram alguns coeficientes que têm por finalidade padronizar e quantificar a cor- relação de acordo com a nuvem de pontos formada, cada um com um propósito diferente para análise. Atualmente, na literatura, alguns coeficientes são amplamente requisitados, a saber: Spearman, Kendall Tau, Gamma e Pearson (Sorana Daniela Bolboaca n.d.). Este último, sendo o posto em uso no atual trabalho.

Embora a correlação tenha por objetivo identificar possíveis relações de dependência entre variáveis, a associação de correlação com causalidade não é uma comparação válida (Yang et al. 2012), logo correlação não implica causalidade. Esta observação se justifica, pois a relação de causa pode não ser fundamentada, exclusivamente, pelas variáveis em análise, isto é, pode existir uma terceira causa em comum que afete ambas as variáveis de tal forma que, consequentemente, resulte em alta correlação.

3.1. CORRELAÇÃO CRUZADA 19

Entretanto, quando utilizado alarmes industriais como variáveis da correlação, pode- mos aplicar a técnica como forma de validação de causalidade (Fan Yang 2012). Isto se dá, pois os alarmes industriais, em sua maioria, estão vinculados a variáveis de pro- cesso que, por sua vez, possuem dependência uma das outras através de relações físicas herdadas, naturalmente, do processo industrial.

Coeficiente de Correlação de Pearson

O Coeficiente de Correlação de Pearson (CCP), ou coeficiente de correlação produto- momento, foi a primeira formalização de mensuração de correlação e é a mais popular na literatura atualmente (Haomiao Zhou 2016). Se caracteriza por identificar a intensidade e sentido da relação linear entre duas variáveis em análise.

O CCP de duas variáveis X e Y é formalmente definido como a covariância das duas variáveis dividido pelo produto dos seus desvios padrões, representada na Equação 3.1 (Huihui Gao 2016). ρx,y= cov(X ,Y ) σXσY = E((xi− µX)(yi− µY)) σXσY =q E(xiyi) − E(xi)E(yi) E(x2i) − E(xi)2 q E(y2i) − E(yi)2 (3.1)

No caso, ρx,y é o valor do CCP para a relação entre as variáveis X e Y , cov(x, y) é a

covariância entre X e Y , σxe σysão os desvios padrões das variáveis X e Y , µxe µysão as

médias das variáveis X e Y .

O CCP fornece um indicador quantitativo da relação linear entre as duas variáveis X e Y , podendo variar no intervalo [−1, +1]. Um valor positivo do coeficiente indica que as variáveis são diretamente relacionadas. Por outro lado, um valor negativo indica que as variáveis são inversamente relacionadas. Valores próximos de zero, indicam ausência de relação linear. Valores próximos de 1, em magnitude, indicam forte relação linear. A Tabela 3.1 exemplifica algumas classificações de acordo com o valor do CCP (Huihui Gao 2016).

Tabela 3.1: Classificação de relação entre variáveis de acordo com valor do coeficiente de correlação de Pearson.

Intevalo do CCP Relação Correspondente 0 < |ρxy| < 0.1 Sem relacionamento

0.1 ≤ |ρxy| < 0.3 Correlação Baixa

0.3 ≤ |ρxy| < 0.5 Correlação Média

0.5 ≤ |ρxy| < 0.8 Correlação Forte

0.8 ≤ |ρxy| < 1 Correlação Máxima

20 CAPÍTULO 3. FUNDAMENTAÇÃO MATEMÁTICA

Correlação Cruzada

A correlação cruzada é útil para mensurar a intensidade e direção de correlação entre duas variáveis (Wei 2006). O método é definido como aplicação iterativa da correlação, onde em cada iteração uma das variáveis recebe aplicação de atraso no sinal (Fan Yang 2012). Como resultado da aplicação, obtem-se a função de correlação cruzada, ou Cross- correlation function (CCF), uma série de correlação em função do atraso de tamanho 2N, onde N + L é o tamanho das variáveis em análise (Bourke 1996). A Equação 3.2, demonstra como a CCF é obtida.

ρx,y(k) = ρx,y[−k]=

cov(X ,Y[i−k]) σXσY[i−k]

, −N ≤ k ≤ N (3.2)

No caso, Y[i−k]representa a variável Y com um atraso de magnitude k aplicado. Sendo

assim, a CCF é, resumidamente, a aplicação da Equação 3.1 para cada combinação da variável X com Y atrasado em k unidades, onde |k| ≤ N. N determina o máximo de deslocamento aplicado na variável Y . A Figura 3.3 exemplifica a CCF resultante.

Figura 3.3: Exemplo de correlação cruzada entre variáveis Fonte: Autoria própria

De acordo com a Figura 3.3, pode ser observado o perfil de um sinal com certa oscila- ção na maior parte do domínio e com presença de picos, normalmente não mais que um, em específicos pontos de deslocamento. Cada pico representa um momento em que a cor- relação foi alta para aquela específica combinação das variáveis X e Y[i−k]. Sendo assim, para este deslocamento k, cujo valor foi alto, designamos que X tem alta correlação com Y com um atraso entre as variáveis de k unidades de tempo (Jia Wang 2015).

Mediante a demonstração do funcionamento da técnica de correlação cruzada, pode- mos viabilizar sua aplicação em dados de alarmes industriais com o objetivo de identificar possíveis alarmes com relação de causa/efeito e, adicionalmente, seus respectivos atrasos associados. Diante da técnica mencionada, os dados de alarmes industriais passaram por uma etapa de pré-processamento com o objetivo de melhorar a qualidade dos dados de entrada e, consequentemente, potencializar o resultados a serem obtidos. Tais detalhes de pré-processamento serão demonstrados no Capítulo 5.

Documentos relacionados