• Nenhum resultado encontrado

CARTAS DE CONTROLE MULTIVARIADAS BASEADAS NO MÉTODO KERNEL-STATIS PARA MONITORAMENTO DE PROCESSOS NÃO-LINEARES

N/A
N/A
Protected

Academic year: 2021

Share "CARTAS DE CONTROLE MULTIVARIADAS BASEADAS NO MÉTODO KERNEL-STATIS PARA MONITORAMENTO DE PROCESSOS NÃO-LINEARES"

Copied!
13
0
0

Texto

(1)

CARTAS DE CONTROLE

MULTIVARIADAS BASEADAS NO

MÉTODO KERNEL-STATIS PARA

MONITORAMENTO DE PROCESSOS

NÃO-LINEARES

DANILO MARCONDES FILHO (UFRGS)

danilomf@ufrgs.br

Flávio Sanson Fogliatto (UFRGS)

ffogliatto@producao.ufrgs.br

luiz paulo luna de oliveira (UNISINOS)

lpluna@unisinos.br

Processos industriais que ocorrem em bateladas são empregados com freqüência na produção de alguns itens. Tais processos disponibilizam uma estrutura de dados bastante peculiar e, diante disso, existe um crescente interesse no desenvolvimennto de cartas de controle multivariadas mais apropriadas para seu monitoramento. Destaca-se aqui uma abordagem recente que utiliza cartas de controle baseadas no método Statis. O Statis constitui-se numa técnica exploratória que permite avaliar similaridade entre matrizes de dados. Entretanto, essa técnica avalia a similaridade no contexto linear, isto é, investiga estruturas lineares de correlação nos dados. Neste artigo, propõe-se a utilização de cartas de controle baseadas no Statis em conjunto com um kernel para monitoramento de processos com presença de não-linearidades. Através dos kernels, definem-se funções não-lineares dos dados para melhor representação da estrutura a ser caracterizada pelo método Statis. Esta nova abordagem, denominada Kernel-Statis, é desenvolvida e avaliada utilizando dados de um processo simulado.

Palavras-chaves: Cartas de controle multivariadas, Kernels, Método Statis, Processos em bateladas

(2)

2

1. Introdução

Processos industriais automatizados disponibilizam uma grande quantidade de informações sobre seu desempenho. Em tais processos são geradas medições simultâneas e em tempo real de diversas variáveis de processo. Obtêm-se então dados em quantidade suficiente para habilitar um monitoramento preciso do desempenho de operações industriais. Parte dessas indústrias conduz seus processos em bateladas.

Processos em bateladas apresentam uma série de operações e eventos complexos que provocam efeitos não-lineares significativos nos dados, isto é, correlações não-lineares costumam estar presentes entre as variáveis de processo. Frente a essa evidência, cartas de controle (CCs) multivariadas mais apropriadas para seu monitoramento foram propostas na literatura.

As principais abordagens não-lineares de controle de processos em bateladas baseiam-se em extensões não-lineares da MPCA (Multiway Principal Components Analisys – Análise de Componentes Principais Multidirecionais), denominadas Non-Linear PCA (NLPCA – PCA não-linear). As CCs baseadas em NLPCA são obtidas a partir do uso da PCA em conjunto com modelos de redes neurais, algoritmo de curvas principais ou kernels. Martin & Morris (1996) e Lee et al. (2004a;b) apresentam uma discussão comparativa de CCs baseadas em NLPCA. Uma abordagem alternativa, denominada Statis, proposta por Lavit et al. (1994), utiliza um arranjo de dados distinto em relação à MPCA. O Statis constitui-se em uma técnica exploratória que oferece uma representação sumária do grau de similaridade entre matrizes de dados através da utilização da ACP (Análise de Componentes Principais). As CCs baseadas no método Statis foram propostas originalmente por Scepi (2002) e expandidas para o monitoramento on-line e

off-line de processos em bateladas por Fogliatto & Niang (2008). A caracterização dos dados

oferecida pelo Statis traz um acréscimo em relação ao arranjo usado na ACPM, pois permite a construção de CCs para avaliar o desempenho do processo explicitamente a cada instante. Entretanto, assim como as demais abordagens lineares, a técnica avalia a similaridade no contexto linear, isto é, investiga apenas estruturas de correlação lineares nos dados.

Propõe-se aqui o desenvolvimento de CCs baseadas em uma modificação do Statis que incorpore também não-linearidades presentes nos dados: o Kernel-Statis. Através dos kernels, definem-se funções não-lineares dos dados para melhor representação da estrutura a ser caracterizada pelo método Statis. A proposta apresenta duas importantes contribuições ao estado da arte sobre monitoramento de processos não-lineares. Primeiro, as CCs baseadas no Kernel-Statis são de natureza não-paramétrica, ao contrário de outras propostas disponíveis na literatura; tal característica aumenta suas possibilidades de utilização. Segundo, a utilização do Statis como base teórica para o desenvolvimento das CCs permite extensões para contemplar situações especiais, tais como o controle de processos em bateladas com durações distintas e a utilização do Statis Dual, uma análise alternativa pertencente ao ferramental do método Statis, como ferramenta de diagnóstico de causas especiais. Tais desenvolvimentos encontram-se disponíveis na literatura para o caso de processos lineares.

(3)

3 A presente seção divide-se em duas partes. Inicialmente, revisa-se o estado da arte sobre Controle Estatístico Multivariado de Processos (CEMP) não-lineares. Na sequência são apresentados os fundamentos analíticos do método Statis.

2.1. Estado-da-arte sobre CEMP para processos não-lineares

Gráficos univariados de controle de processos, tais como os gráficos de Shewhart e CUSUM (de somas acumuladas), vêm sendo utilizados com êxito no monitoramento e melhoria da qualidade de processos industriais (MONTGOMERY, 2001). Entretanto, gráficos univariados de controle apresentam um desempenho deficiente quando aplicados a processos multivariados. Para contornar essa deficiência, diversas estratégias de controle de processos foram desenvolvidas utilizando métodos estatísticos multivariados como a análise de componentes principais (ACP) e mínimos quadrados parciais. Os trabalhos de Nomikos & McGregor (1995) e Kourti et al. (1996) exemplificam esses desenvolvimentos.

A ACP é a técnica de análise multivariada de dados mais utilizada no monitoramento de processos (WISE & GALLAGHER, 1996), devido a sua capacidade de projetar, sem grande perda de informação, bancos de dados de grandes dimensões, compostos por variáveis altamente correlacionadas, em espaços de representação de menores dimensões, nos quais técnicas de controle da qualidade são implementadas (mais especificamente, gráficos T2 e Q na fase de detecção, e gráficos de contribuição na fase de diagnóstico). Entretanto, o CEMP baseado em ACP apresenta um desempenho inadequado se aplicado no controle de processos não-lineares, conforme demonstrado por Xu et al., 1992.

Para contornar o problema imposto por processos não-lineares, diversas abordagens foram propostas na literatura. Kramer (1992) desenvolveu um método baseado em ACP não-linear e redes neurais auto-associativas. A arquitetura da rede neural utilizada apresenta cinco camadas: (i) de entrada, (ii) de mapeamento, (iii) camada gargalo, (iv) de mapeamento reverso, e (v) de saída. Os nodos das camadas (ii) e (iv) são não-lineares, ao passo que as demais camadas são lineares. Um algoritmo de gradiente conjugado é utilizado para treinar a rede. Como a dimensão da camada (iii) é menor do que a dimensão de (i) e (v), a rede é forçada a desenvolver uma representação compacta dos dados de entrada. O autor atinge esse objetivo introduzindo funções não-lineares nos nodos das camadas de mapeamento e mapeamento reverso, em uma extensão da ACP não-linear. Entretanto, a rede proposta é de difícil treino já que contém cinco camadas. Além disso, a determinação do número de nodos a ser usado em cada camada não é tarefa trivial. Dong & McAvoy (1996) também propuseram uma versão não-linear da ACP, combinando curvas principais e redes neurais, para o controle de processos não-lineares contínuos e em bateladas. Os escores e pontos amostrais corrigidos para as amostras de treinamento são obtidos pelo método da curva principal; o modelo de rede neural é utilizado para mapear os dados originais em seus respectivos escores, os quais são então mapeados para obter os pontos amostrais corrigidos. Construindo a rede neural, uma estratégia de adaptação on-line pode ser desenvolvida. A abordagem de Dong & McAvoy (1996) apresenta duas limitações: (i) o algoritmo da curva principal pressupõe que a função não-linear possa ser aproximada por uma combinação linear de diversas funções univariadas (isto é, a função não-linear pode ser decomposta como uma soma de funções das variáveis individuais), o que limita a aplicação do

(4)

4 algoritmo a estruturas que apresentem comportamento do tipo aditivo; e (ii) deve-se resolver um problema de otimização não-linear para calcular as curvas principais e treinar a rede neural e, para tanto, o número de componentes principais deve ser especificado antes de treinar a rede; assim, sempre que o número de componentes for alterado, o procedimento de modelagem deverá ser rodado novamente.

Versões alternativas para a ACP não-linear foram também propostas por Hiden et al. (1999) e Jia

et al. (2001). Na abordagem em Hiden et al. (1999), as não-linearidades presentes no sistema são

explicitamente representadas em uma forma funcional, cuja natureza é otimizada usando um processo evolutivo baseado em programação genética. Jia et al. (2001) propõem uma abordagem combinando ACP e uma rede neural de entrada e treinamento (ITNN – input-training neural

network), de forma a considerar separadamente correlações lineares e não-lineares presentes nos

dados. Geng & Zhu (2005) reportam uma aplicação prática do método em Jia et al. (2001) no monitoramento de um processo químico.

Os trabalhos a seguir utilizam a Kernel-ACP como técnica de ACP não-linear. A Kernel-ACP, originalmente proposta por Scholkopf & Smola (2002), é capaz de calcular componentes principais de forma eficiente em espaços característicos (feature spaces) de grandes dimensões através de operadores integrais e funções kernel não-lineares. Em sua essência, a Kernel-ACP consiste de duas operações: (i) o espaço de entrada (input space) é mapeado, através de funções não-lineares, em um espaço característico, e (ii) uma ACP linear é aplicada no espaço característico para obter componentes principais. Comparada a outros métodos não-lineares, a Kernel-ACP apresenta a vantagem de não demandar um procedimento de otimização não-linear; sua utilização envolve somente operações de álgebra linear, sendo de aplicação tão simples quanto a ACP padrão. A Kernel-ACP demanda a extração de autopares (autovalores e autovetores) do espaço característico e não requer que o número de componentes principais a ser extraído seja conhecido a priori. Como pode ser operacionalizada usando diferentes kernels, a Kernel-ACP pode ser eficiente na representação de diferentes tipos de não-linearidades.

Lee et al. (2004) apresentam um procedimento para o monitoramento de processos contínuos no espaço característico obtido aplicando funções kernel sobre os dados de processo. Os autores ilustram o procedimento em um processo de tratamento de resíduos líquidos onde os dados de processo são mapeados no espaço característico através de uma função kernel de base radial. Uma vez disponível a representação dos dados de entrada no espaço característico, o procedimento proposto é essencialmente o mesmo proposto por Nomikos & McGregor (1995), utilizando ACP linear. Mais especificamente, a estatística de Hotelling é usada para medir a variação dentro do modelo Kernel-ACP, e a estatística , dada pelo quadrado do erro de predição, provê uma medida de ajuste entre uma amostra qualquer e o modelo Kernel-ACP. O monitoramento proposto pelos autores somente permite o controle on-line de processos contínuos, já que sua operacionalização demanda, como amostra de entrada, a matriz completa de dados do processo de interesse, não disponível, no caso de processos em bateladas, antes de seu término.

Lee, Yoo & Lee (2004) estendem o procedimento em Lee et al. (2004) para o monitoramento

on-line e off-on-line de processos em bateladas. O esquema proposto para o monitoramento off-on-line

replica os desenvolvimentos propostos por Lee et al. (2004), já que o monitoramento on-line de processos contínuos e off-line de processos em bateladas se equivalem em termos metodológicos.

(5)

5 Com relação ao monitoramento on-line de processos em bateladas, Lee, Yoo & Lee (2004) propõem completar a matriz de dados de processo proveniente da batelada em curso utilizando uma metodologia onde valores futuros são antecipados como uma média ponderada dos escores disponíveis até o tempo atual da batelada e dos escores previamente calculados na distribuição de referência. O procedimento é ilustrado em um processo de fermentação para produção de penicilina.

Cho et al. (2005) propõem um método para o diagnóstico de pontos fora-de-controle sinalizados nos gráficos e desenvolvidos por Lee et al. (2004). A contribuição em Lee et al. (2004) limitou-se à fase de detecção do controle da qualidade, não trazendo propostas para o diagnóstico de eventuais pontos fora-de-controle. O método de diagnóstico em Cho et al. (2005) está baseado no cálculo do gradiente da função kernel utilizando no mapeamento dos dados de processo no espaço característico, sendo aplicável no diagnóstico de sinais registrados nos gráficos e . O método é ilustrado usando dados simulados de dois processos contínuos.

Cui et al. (2008) também abordam o problema do diagnóstico de pontos fora-de-controle em gráficos baseados em Kernel-ACP, além de analisar estratégias para reduzir a dimensão da matriz

kernel durante a fase de treinamento da Kernel-ACP. Com relação ao problema do diagnóstico,

os autores propõem o uso conjunto da Kernel-ACP e da análise discriminante de Fisher (método para extração de características e redução dimensional de grandes amostras. Para reduzir a dimensão da matriz kernel, os autores propõem identificar subconjuntos de dados no banco completo de dados de processo suficientes para expressar todos os dados no espaço característico como uma combinação linear dos dados nos subconjuntos reduzidos. Os desenvolvimentos no artigo são ilustrados utilizando dados simulados de processos previamente analisados por Lee, Yoo & Lee (2004) e Cho et al. (2005).

Finalmente, Choi et al. (2008) combinam as proposições em Lee et al. (2004) e Cho et al. (2005) para propor um novo esquema de monitoramento de processos não-lineares. O artigo enfatiza o problema da detecção de eventos anormais ocorridos em escalas muito distintas. Em sua essência, os autores propõem substituir o método de padronização de dados, prévio à Kernel-ACP, proposto por Scholkopf & Smola (2002), pela utilização da transformação Wavelet. Na etapa de diagnóstico, os autores propõem a utilização da transformação Wavelet inversa para mapear dados do espaço característico no espaço de entrada.

2.2. Fundamentos do método Statis

O método Statis permite a análise de estruturas tridimensionais de dados, avaliando a similaridade entre matrizes bidimensionais em um plano de dimensões reduzidas. Cada matriz

Xb, para b=1,...,B, de dimensão (T × P), contém vetores linha padronizados (isto é, cada variável em Xb tem os valores subtraídos da média e divididos pelo desvio padrão da sua coluna)

que representam medições de P variáveis de processo durante T instantes de tempo. Tem-se então uma estrutura com P variáveis × T instantes de tempo × B bateladas.

O método Statis foi proposto inicialmente por Lavit et al. (1994), e sua aplicação em controle de processos em bateladas foi proposta por Scepi (2002) e aprimorada por Fogliatto & Niang (2008). A estruturação de dados apresentada acima cumpre dois objetivos: (i) representar em um espaço de dimensões reduzidas a correlação entre as P variáveis das matrizes e no conjunto dos T instantes. Está análise permite verificar o comportamento global das variáveis de uma nova

(6)

6 batelada em relação à estrutura de referência capturada entre as B bateladas. Este objetivo é alcançado através da análise da inter-estrutura; (ii) representar em um espaço reduzido a correlação média (ou de compromisso) entre os T instantes, dois a dois, considerando todas as P variáveis de processo. Esta análise busca identificar, a cada instante de tempo transcorrido na nova batelada, possíveis desvios significativos em relação ao comportamento temporal de compromisso do conjunto das variáveis. Este objetivo é alcançado através da análise da

intra-estrutura.

Os parágrafos que se seguem apresentam um resumo da análise da inter-estrutura. Considere uma matriz WbXbXb, de dimensão (T × T), ondeXb indica a transposta da matriz X . b

Genericamente, pode-se escrever essa matriz da seguinte forma:

               b t b t b x x W , , para t,t= 1,...,T e b=1,...,B, (1)

onde x e bt x representam vetores linha, de dimensão (1 × P), representando medições das P bt

variáveis de processo no tésimo instante da bésima batelada. Calcula-se agora uma medida de similaridade entre pares de matrizes Wb, através do produto interno canônico de Hilbert-Schmidt dado por: ) ( b b HS b b b b   W W Tr DWDWS , (2) onde Tr (·) representa o operador de traço matricial, e D é uma matriz diagonal, de dimensão (T ×

T), contendo os pesos de importância para os instantes de tempo. Para simplificar, consideram-se

pesos iguais e com soma unitária; assim, D=I/T.

O valor de Sbb indica o grau de similaridade entre as P variáveis nas matrizes Wb e W . Essa b

medida de similaridade entre matrizes é semelhante à medida de similaridade entre vetores, pois a eq. (2) é uma extensão do produto interno entre vetores no caso de matrizes quadradas.

As correlações lineares vetoriais entre Wb e Wb estão descritas na matriz:

                b b BS 1 , onde

  B b B 1 1 1 (3)

Para obter uma caracterização resumida da estrutura de correlação entre as B bateladas, aplica-se a ACP na matriz . Isto é feito através da sua diagonalização para seleção dos maiores autovalores λi e respectivos autovetores ui (com i=1,...,B), que representam a localização das

matrizesWb nas principais direções ortogonais de variabilidade comum em .

A representação das B bateladas nos novos eixos ortogonais é realizada utilizando os autovetores

ui. Assim, cada elemento ui,b de ui ponderado pelo desvio padrão do CP correspondente (dado

pela raiz quadrada do i-ésimo autovalor) representa a posição da b-ésima batelada no i-ésimo eixo ortogonal. Considerando dois CPs na análise, tem-se então:

(7)

7 b i i b i u a,   , , para i=1,2 (4) onde ai,b é a coordenada que representa essa posição.

Os parágrafos que se seguem apresentam um resumo da análise da intra-estrutura. Considerando novamente a matriz WbXbXb explicitada na eq. (1), obtém-se agora a matriz de compromisso

W, que representa a estrutura de correlação média, aos pares (considerando as B bateladas de

referência), entre os T instantes de tempo. Mais explicitamente,

  B b b b 1 W W  .

Lavit et al. (1994) demonstram que a combinação linear que melhor relaciona as matrizes Wb

com W está associada ao maior autovalor (λ1) da matriz e ao seu autovetor correspondente (u1). Assim, têm-se os pesos b u b

B 1, 1

1 1

  , onde ub,1 representa o b-ésimo elemento do vetor

u1 referente à b-ésimabatelada.

Para obter uma caracterização resumida da estrutura de correlação de compromisso das P variáveis nos T instantes de tempo, a exemplo do que foi feito na análise da inter-estrutura, aplica-se uma ACP na matriz WD. Isto é feito através da sua diagonalização para seleção dos maiores autovalores δi e respectivos autovetores εi (com i=1,...,T), que descrevem a posição das

observações xbt médias, isto é, da matriz Xb ideal, em um número reduzido de eixos, derivados das principais direções ortogonais de variabilidade comum em WD.

Para comparar, em cada instante, o comportamento do conjunto das P variáveis da bésima batelada

Wb, em relação à batelada de compromisso W, obtém-se a representação de cada matriz Wb nos

novos eixos ortogonais. Utilizando dois CPs, tem-se: i b t i b t i T z,  1 1w ε  , para i=1,2, (5)

onde εi é o vetor transposto do vetor linha εi, b t

w representa a t-ésimalinha de Wb e zib,t é o valor que representa a posição no i-ésimo eixo ortogonal da b-ésima batelada no t-ésimo instante de tempo.

3. Kernel-Statis

Considere novamente os dados referentes à B bateladas contidos nas matrizes Xb. Define-se o

seguinte mapa não-linear:

Φ: IRP → F

xbtΦ(xbt).

O vetor Φ(xbt), de dimensão (1 × NF), onde NF =

d N 1 !

d N!( 1)!, representa o vetor

b t

x

ampliado, com elementos dados por todos os monômios de ordem d dos elementos do vetor xbt. Decorre disso que a matriz Xb passa a ter dimensão (T × NF), contendo assim T vetores linha

) (xbt

Φ . Entretanto, os produtos internos entre os Φ(xbt), obtidos substituindo xtb por Φ(xbt) na eq. (1) podem ser realizados em função das observações originais, através do produto interno

(8)

8 modificado entre as observações xbt . Neste caso, o produto equivalente é dado pelo Kernel Polinomial de ordem d, definido como (SCHOLKOPF; SMOLA, 2002):

b d t b t b t b t k x ,xx ,x (6) Dessa forma, tem-se a matriz kernelWb (designada por kWbXbXb) obtida a partir das matrizes

Xb no espaço original das observações xbt [isto é, Xb possui dimensão (T × P)]. A matriz

apresentada na eq. (1) é então reescrita como:

                  d b t b t b t b t b k kW (x ,x ) x ,x , para t,t=1,...,T e b=1,...,B. (7)

Utilizando a eq. (7), procede-se então uma modificação não-linear nas estatísticas resultantes da análise da inter-estrutura e da intra-estrutura, sumarizadas nas equações (4) e (5), respectivamente. Esta nova abordagem é aqui denominada Kernel-Statis.

4. CCs IS e COt via Statis e Kernel-Statis

A viabilização do controle de bateladas novas através da análise Statis é operacionalizada através da CC IS (derivada da análise da inter-estrutura) e das CCs COt (derivadas da análise da intra-estrutura), conforme proposto por Fogliatto & Niang (2008).

A CC IS permite verificar se a estrutura de correlação linear entre as P variáveis da batelada nova segue a estrutura de correlação linear padrão, capturada nas B bateladas de referência. A CC kIS (derivada do Kernel-Statis) realiza a mesma comparação em um contexto não-linear, isto é, levando em conta as correlações “não-lineares” (quadráticas, dado o Kernel Polinomial).

As CCs COt permitem verificar o comportamento temporal do conjunto das P variáveis de uma batelada nova em relação ao comportamento temporal esperado em função das B bateladas de referência. Analogamente a CC kIS, as CCs kCOt realizam esse monitoramento temporal

considerando uma estrutura não-linear nos dados. Como as CCs COt oferecem uma representação explícita das variáveis em cada instante, prioriza-se a sua utilização no controle

on-line do processo.

O passo seguinte consiste em obter uma região de controle para as CCs.Diferentemente do que usualmente é feito nas CCs multivariadas tradicionais, a região de controle será determinada através de um procedimento não-paramétrico. O procedimento que será apresentado constitui-se numa adaptação proposta por Fogliatto & Niang (2008), para o contexto de CCs, do procedimento em Zani et al. (1998).

Considerando a eq. (5) com dois CPs, tem-se B vetores (z1b,t,z2b,t). Inicialmente, calcula-se o ponto que representa o vetor de média (z1b,t,z2b,t). A seguir, obtém-se a distância de Mahalanobis entre os vetores zbt (z1b,t,z2b,t) e zt (z1b,t,z2b,t). Tem-se então Db (ztbzt)R1(ztbzt),

(9)

9 para b=1,...,B , onde (ztbzt) representa o vetor linha de diferenças entre os vetores z e bt z , t

cujo vetor transposto é dado por (zbtzt)e 1

R é a matriz inversa da matriz R de covariâncias dos vetores.

A seguir, as B distânciasDb são ordenadas em ordem crescente e as 50% menores distâncias são retidas. Os vetores zbt correspondentes formarão o convex hull (polígono) de abrangência 50% no primeiro plano fatorial. Neste momento, obtém-se a expansão da região formada pelo convex

hull a partir de um fator de escala. Para tanto, define-se um múltiplo l da distância Db entre o centróide (representado pelo vetor z , obtido a partir dos vetores representados pelos pontos t

internos do polígono) e os pontos limítrofes do polígono de abrangência 50%. O valor de l é determinado a partir da probabilidade de alarme falso α (ou erro do tipo I) desejada para a CC, com a suposição de que os dados z do interior do polígono (isto é, apenas os 50% de menor bt

valor Db) sigam uma distribuição normal bivariada. Detalhes podem ser encontrados em Fogliatto & Niang (2008).

5. Exemplo numérico

Considere um processo industrial em bateladas simuladas, cujo desempenho pode ser avaliado através de duas variáveis correlacionadas X1 e X2. Suponha que as leis físicas que regem esse processo são descritas pelo seguinte sistema de equações diferenciais:

              ) ( ) ( ) ( ) ( ) ( ) ( 2 2 1 1 2 2 1 1 2 2 2 1 1 1 c x c x nl c x a c x b x c x b c x a x   , (8)

onde a, b e nl são constantes reais e os pontos sobre as variáveis denotam derivadas temporais de

2 1 Xe

X . Note que o sistema da eq. (8) é uma perturbação não-linear do sistema linear abaixo:

           ). ( ) ( ) ( ) ( 2 2 1 1 2 2 2 1 1 1 c x a c x b x c x b c x a x   (9) O sistema na eq. (9) tem o ponto (c1,c2) como ponto de equilíbrio. Os dois autovalores associados são números complexos; i.e., 1,2  a ib. Assim, tem-se um comportamento oscilatório em torno do ponto de equilíbrio (c1,c2), que é estável se a0 e instável se a0. O coeficiente nl define o grau de perturbação na não-linearidade.

Para transformar a eq. (9) numa forma iterativa, adotou-se o esquema de Euler (PATEL, 1993), o que as transforma em:

                    . )] )( ( ) ( ) [( )] ( ) ( [ 2 2 1 1 2 2 1 1 2 1 2 2 2t 1 1 1 1 1 t c x c x nl c ax c bx x x t c x b c x a x x t t t t t t t t t (10) Para as simulações das bateladas de referência, foram adotados os seguintes valores para os coeficientes da eq. (9): a1, b2, c1=10, c2=20 e nl=0. Neste trabalho, Δt é suficientemente pequeno, tal que a eq. (10) seja uma aproximação do sistema contínuo na eq. (8). Esta

(10)

10 configuração gerou duas variáveis de processo com trajetórias similares a trajetórias de variáveis observadas em processos industriais.

As trajetórias das duas variáveis envolvidas foram amostradas em T=20 instantes, igualmente espaçados, em bateladas distintas a partir do sistema descrito na eq. (10). Pequenas variações foram impostas nas condições iniciais, de batelada para batelada, obtendo-se assim bateladas representativas do processo sob controle estatístico. A Figura 1 apresenta as séries temporais trazendo as trajetórias das duas variáveis de processo em 100 bateladas simuladas (B=100), para

nl=0.

Figura 1 - Trajetórias das duas variáveis de processo amostradas em 100 bateladas de referência

Utilizou-se então a abordagem Statis e Kernel-Statis via kernel polinomial de ordem d [eq. (6) com d = 2] para análise dos dados gerados. A partir das 100 bateladas de referência mostradas na Fig. 1, determinou-se as regiões de controle utilizando splines para as CCs COt [com pontos

dados pelas projeções na eq. (5)] e CCs kCOt [com pontos dados elas projeções na eq. (5),

utilizando, entretanto, a matriz kWb apresentada na eq. (7)], utilizando α=0,01.

Em seguida, 10 bateladas foram simuladas com perturbações impostas na não-linearidade a partir do instante 10 até o instante 14. Durante esses instantes, o valor de nl=0 foi substituído por nl=3. As bateladas foram projetadas de maneira on-line nas CCs kCOt e COt através da eq. (5) nas matrizes WNEW e kWNEW [esta última gerada a partir da eq. (6)].

(11)

11

Figura 2 - (a) Esquerda – CCs COte (b) Direita – CCs kCOt

As CCs COt [Fig. 2 (a)] e kCOt [Fig. 2 (b)] apresentam a projeção das bateladas novas em ordem cronológica, ao longo das linhas, representadas por pontos em vermelho e lilás, respectivamente. Observa-se que, em ambas as abordagens, o descontrole é acusado corretamente a partir do instante 10. Entretanto, observa-se a pouca acurácia nas CCs COt para detectar que o

processo retornou ao estado sob controle no instante 15, visto que as bateladas aparecem em sua maioria fora da região de controle após esse instante. Diferentemente, as CCs kCOt identificam que o processo está sob controle a partir do instante 15 em todas as bateladas verificadas (quando, de fato, cessaram as perturbações), exceto no último instante quando gerou um alarme falso (isto é, uma batelada mal classificada). Estes resultados evidenciam um ganho na caracterização do sistema com a utilização do kernel polinomial quando o termo nlx1tx2t se faz presente em algum grau (neste caso, com nl=3).

6. Conclusão

Neste artigo, foram propostas CCs multivariadas baseadas no Kernel-Statis para monitoramento de processos em bateladas, com variáveis apresentando correlações não-lineares do tipo quadráticas. Inicialmente foi descrito o método Statis usual em estruturas de dados oriundas de processos em bateladas. O Statis avalia, no contexto linear, a similaridade entre matrizes bidimencionais Xb, utilizando produtos internos canônicos entre vetores de observações x , bt

(12)

12 completa. Através da análise da inter-estrutura, captura-se resumidamente a estrutura de correlação linear entre as P variáveis, em todos os instantes, nas diferentes bateladas, par a par; através da análise da intra-estrutura, captura-se a estrutura de correlação linear temporal em T instantes de tempo, das variáveis.

Em seguida, foi proposta uma abordagem para o Statis no contexto não-linear através da utilização de kernels. Através dos kernels, definiram-se funções não-lineares de segunda ordem dos dados a partir de um mapa polinomial não-linear de segunda ordem Φ. Dessa forma, utilizaram-se funções Φ(xtb)([xtb]1,[xtb]2,[xtb]12,[xbt ]22,[xtb]1[xtb]2) das observações x e, bt

através da teoria de kernels, trabalhou-se com produtos internos modificados dos dados originais

b t

x sem a utilização direta dos vetoresΦ(xbt).

No passo seguinte, construiu-se uma versão não-linear do Statis, denominada Kernel-Statis. Foram redefinidas as estatísticas utilizadas na análise da inter-estrutura e da intra-estrutura para caracterizar correlações lineares quadráticas dos dados. Foram apresentadas as CCs não-lineares derivadas do Kernel-Statis, denominadas CCs kIS e kCOt.

A partir de um processo com dados simulados de um sistema não-linear de duas variáveis, validou-se o Kernel-Statis e verificou-se o ganho de acurácia de tal procedimento em relação ao Statis usual no monitoramento de bateladas futuras. Verificou-se que as CCs kIS e kCOt

ofereceram uma caracterização do processo superior as CCs IS e COt (derivadas do Statis usual),

na medida que as não-linearidades quadráticas foram pronunciadas com mais intensidade no sistema proposto.

Referências

CHO, J.-H.; LEE, J.-M.; CHOI, S.W.; LEE, D.; LEE, I.-B. Fault identification for process monitoring using

kernel principal component analysis. Chemical Engineering Science, p. 279-288, 2005.

CHOI, S.W.; MORRIS, J.; LEE, I.-B. Nonlinear multiscale modelling for fault detection and identification.

Chemical Engineering Science, no prelo, doi: 10.1016/j.ces.2008.01.022, 2008.

CUI, P.; LI, J.; WANG, G. Improved kernel principal component analysis for fault detection. Expert Systems with

Applications, Vol. 34, p. 1210-1219, 2008.

DONG, D.; MCAVOY, T.J. Nonlinear principal components analysis based on principal curves and neural

networks. Computers and Chemical Engineering, Vol. 20, p.65-78, 1996.

FOGLIATTO, F. S. & NIANG, N. Controle multivariado de processos em batelada com duração variada.

Produção, Vol. 18, p. 240-259, 2008.

GENG, Z.Q.; ZHU, Q.X. Multiscale nonlinear principal component analysis (NLPCA) and its application for

chemical process monitoring. Industrial and Engineering Chemistry Research, Vol. 44, 3585-3593, 2005.

HIDEN, H.G.; WILLIS, M.J.; THAM, M.T.; MONTAGUE, G.A. Nonlinear principal components analysis

using genetic programming. Computers and Chemical Engineering, Vol. 23, p.413-425, 1999.

JIA, F.; MARTIN, E.B.; MORRIS, A.J. Non-linear principal components analysis with application to process

fault detection. International Journal of Systems Science, Vol. 31, p.1473–1487, 2001.

KOURTI, T.; LEE, J.; MACGREGOR, J.F. Experiences with industrial applications of projection methods for

(13)

13 KRAMER, M.A. Autoassociative neural networks. Computers and Chemical Engineering, Vol. 16, p. 313-328,

1992.

LAVIT, C.; ESCOUFIER, Y.; SABATIER, R. & TRAISSAC, P. The ACT (STATIS method). Computational

Statistics & Data Analysis, Vol. 19, p. 97-119, 1994.

LEE, J-M.; YOO, C.; CHOI, S.W.; VANROLLEGHEM, P.A.; LEE, I-B. Nonlinear process monitoring using

kernel principal components analysis. Chemical Engineering Science, Vol. 59, p.223-234, 2004.

LEE, J.; YOO, C. K., & LEE, I.-B. Nonlinear process monitoring using kernel principal component analysis,

Chemical Engineering Science, Vol. 59, p. 223-234, 2004.

MARTIN, E. B. & MORRIS, A. J. An overview of multivariate statistical process control in continuous and batch

process performance monitoring. Trans. Inst. MC, Vol. 18, p. 51-60, 1996.

MONTGOMERY, D.C. Introduction to Statistical Quality Control, 4ª Ed. Wiley: New York, 2001.

NOMIKOS, P.; MCGREGOR, J.F. Multivariate SPC charts for monitoring batch processes. Technometrics, Vol.

37, p.41-59, 1995.

PATEL, V. A. A. Numerical Analysis. New York: Saunders College Publishing, 1993.

SCEPI, G. Parametric and non parametric multivariate quality control charts. In Multivariate Total Quality

Control, Physica-Verlang, Lauro C. et al. (eds.), 163-189, 2002.

SCHOLKOPF, B.; SMOLA, A. Learning with Kernels: Support Vector Machines, Regularization, Optimization, and Beyond. MIT Press: Cambridge (MA), 2002.

WISE, B.M.; GALLAGHER, N.B. The process chemometrics approach to process monitoring and fault detection.

Journal of Process Control, Vol. 6, p. 329-348, 1996.

XU, L.; OJA, E.; SUEN, C.Y. Modified hebbian learning for curve and surface fitting. Neural Networks, Vol. 5, p.

441-457, 1992.

ZANI, S.; RIANI, M. & CORBELLINI, A. Robust bivariate boxplots and multiple outlier detection.

Referências

Documentos relacionados

Atualmente os currículos em ensino de ciências sinalizam que os conteúdos difundidos em sala de aula devem proporcionar ao educando o desenvolvimento de competências e habilidades

O objetivo do curso foi oportunizar aos participantes, um contato direto com as plantas nativas do Cerrado para identificação de espécies com potencial

O valor da reputação dos pseudônimos é igual a 0,8 devido aos fal- sos positivos do mecanismo auxiliar, que acabam por fazer com que a reputação mesmo dos usuários que enviam

- Se o estagiário, ou alguém com contacto direto, tiver sintomas sugestivos de infeção respiratória (febre, tosse, expetoração e/ou falta de ar) NÃO DEVE frequentar

Se você vai para o mundo da fantasia e não está consciente de que está lá, você está se alienando da realidade (fugindo da realidade), você não está no aqui e

Local de realização da avaliação: Centro de Aperfeiçoamento dos Profissionais da Educação - EAPE , endereço : SGAS 907 - Brasília/DF. Estamos à disposição

c.4) Não ocorrerá o cancelamento do contrato de seguro cujo prêmio tenha sido pago a vista, mediante financiamento obtido junto a instituições financeiras, no

Os autores relatam a primeira ocorrência de Lymnaea columella (Say, 1817) no Estado de Goiás, ressaltando a importância da espécie como hospedeiro intermediário de vários parasitos