Agrupamento Fuzzy - PROPOSTA DE METODOLOGIA RECURSIVA-ITERATIVA PARA IDENTIFICAÇÃO FUZZY DE SIS

A análise de agrupamento (cluster analysis) tem como objetivo formar grupos de objetos com certo grau de similaridade entre seu componentes. Esse processo de agrupamento possibilita particionar um problema complexo em grupos onde a modelagem ou otimização consiste em uma atividade menos difícil e menos dispendiosa computacio- nalmente. Na literatura, essa abordagem é conhecida como MMF (do inglês, Multimodel

Framework) (ADENIRAN; FERIK, 2016). Nesta abordagem, um modelo é formado por um conjunto de submodelos locais integrados com diferentes graus de validade. Cada submodelo representa a dinâmica do sistema em uma região especíĄca do espaço operacional do sistema. Os graus de validade responsáveis por ponderar a parcela de cada submodelo no modelo global é obtido por meio de uma partição do espaço operacional do sistema realizada por um algoritmo de agrupamento. Essa partição pode ser rígida ou fuzzy. Na partição rígida, cada objeto pertence exclusivamente a um grupo do espaço operacional do sistema. Na partição fuzzy, cada objeto pertence a cada grupo da partição do espaço operacional com um certo grau de pertinência.

Os algoritmos de agrupamento podem ser aplicados a conjunto de dados quantitativos (numéricos), qualitativos (categórico) ou híbridos. Na presente dissertação, serão considerados dados quantitativos representando observações típicas de variáveis de proces- sos físicos. Dessa forma, considere � variáveis medidas. Um objeto z� ✒�1�, �2�,✆, ��✘

�

é um vetor formado pela observação de � variáveis no �-ésimo instante de tempo, com

z� ✧ R �

. Um conjunto de dados formado por � observações dos objetos z�é representado

por: Z ❩❫❫ ❫❫❫❫ ❫❫❫❫ ❫❫❫❫ ❫❫❭ �11 �12 ✆ �1� �21 �22 ✆ �2� ✝ ✝ ✝ ✝ ��1 ��2 ✆ �� ❬❴❴ ❴❴❴❴ ❴❴❴❴ ❴❴❴❴ ❴❴❪ (3.10)

3.3.1 Partição Rígida

Um algoritmo de agrupamento particiona o conjunto de dados Z em � clusters, onde � é assumido conhecido a priori. Uma partição rígida de Z pode ser deĄnida pelos subconjuntos r��➯1 ✫ � ✫ �① com as seguintes propriedades:

� ✗ � 1 �� Z, (3.11) ��❂ �� ♦, 1 ✫ � ❥ � ✫ �, (3.12) ♦ ▲ �� ▲ Z, 1 ✫ � ✫ �. (3.13)

Capítulo 3. Sistema de Inferência Fuzzy Takagi-Sugeno 49 se: � ✞ � 1 Û�i 1, (3.14) Û�i ✵ Û�j 0, 1✫ � ❥ � ✫ �, (3.15) 0✩ Û�i ✩ 1, 1 ✫ � ✫ �. (3.16)

A matriz de partição � ✒Û��✘ representa a partição rígida se e somente se seu

elementos satisfaz as condições:

Û�� ✧ r0, 1① , 1 ✫ � ✫ �, 1 ✫ � ✫ �, (3.17) � ❂ � 1 Û�� 1, 1✫ � ✫ �, (3.18) 0✫ � ❂ � 1 Û�� ✫ �, 1 ✫ � ✫ �. (3.19)

onde na partição rígida Û�� representa se um objeto z� pertence ou não a um cluster.

Assim, o espaço de partição rígida pode ser representado conforme a seguinte deĄnição:

Definição 3.3.1 Seja Z rz1,z2,✆, z�① é um conjunto Ąnito e 2 ✫ � ✩ �.

�ℎ� ✇� ✧ R �✒� ➯Û�� ✧ r0, 1① , ➽�, �; � ❂ � 1 Û�� 1,➽�; 0 ✩ � ❂ � 1 Û�� ✫ �, ➽�⑥ (3.20)

onde �ℎ� representa como o conjunto de dados Z pode ser particiona em � grupos com

os elementos dos mesmos exclusivos a cada grupo.

3.3.2 Partição Fuzzy

A generalização da partição rígida para o caso fuzzy é dada por:

Û�� ✧ ✒0, 1✘ , 1 ✫ � ✫ �, 1 ✫ � ✫ �, (3.21) � ❂ � 1 Û�� 1, 1 ✫ � ✫ �, (3.22) 0✫ � ❂ � 1 Û�� ✫ �, 1 ✫ � ✫ �. (3.23)

onde na partição fuzzy Û�� representa a pertinência do objeto z� a um cluster. Assim, o

Definição 3.3.2 (Espaço de Partição Fuzzy) Seja o conjunto de dados Ąnitos Z

rz1,z2,✆, z�① e seja C ✂ s� ✧ Z➌_✑➯2 ✫ � ✩ �② o conjunto do número de clusters possíveis

para Z. O espaço de partição fuzzy para Z é dado por:

��  ✇U ✧ R �✒� ➯Û�� ✧ ✒0, 1✘ , ➽�, �; � ❂ � 1 Û�� 1,➽�; 0 ✩ � ❂ � 1 Û�� ✫ �, ➽�, � ✧ C⑥ (3.24)

onde ��  representa como o conjunto de dados Z pode ser particiona em � grupos com

os elementos podem pertencer a mais de um grupo.

A �-ésima linha da matriz de partição U contem a i-ésima função de pertinência Û�

da partição ��, ou seja, contem os valores de pertinência (Û�� ✧ ✒0, 1✘) para cada objeto

z� (1✫ � ✫ �) em relação a partição �� de Z.

A forma do cluster pode ser determinada de acordo com a escolha da matriz A. Essa matriz é geralmente escolhida como a matriz identidade (A I), portanto a medida

de distância é representada pela norma Euclidiana:

�2�� z�✍ v�✝ �

z�✍ v�✝ (3.25)

que representa a distância do objeto z� ao centro da partição (cluster) �� representado

por v�, logo essa medida representa o grau de similaridade do objeto z�aos demais objetos

pertencentes à partição ��.

Alternativamente a essa representação, a matriz A pode ser igual a inversa da matriz de covariância de Z (A R✍1) dada por:

� 1 � � ❂ � 1 z�✍ ¯z✝ z�✍ ¯z✝ (3.26)

onde ¯z representa o valor médio dos dados. Com essa representação da matriz A, a medida de distância �2

�� tonrna-se a norma Mahalanobis (BEZDEK,1981apudBABUSKA,1998,

p. 58).

3.3.3 Algoritmo Gustafson-Kessel

O algoritmo Gustafson-Kessel (GUSTAFSON; KESSEL,1978) possui uma norma de distância adaptativa que detecta clusters de diferente estruturas geométricas. A norma de distância adaptativa desse algoritmo é dada por:

�2_��A_i z�✍ v�✝ �

Capítulo 3. Sistema de Inferência Fuzzy Takagi-Sugeno 51

onde a matriz A� é uma variável de otimização. Seja A A1,A2, . . . ,A�✝ uma �-tupla

das matrizes indutoras de norma. A função objetivo do algoritmo GK é deĄnida por:

� Z; U, V, A✝ � ❂ � 1 � ❂ � 1 Û��✝ � �_��A2 _i (3.28) onde U ✧ �� , V✧ R �✒� _{e �}

✪ 1. A solução é dada por

Z; U, V, A✝ arg min

�f c✒Rn✒c✒� �n

� Z; U, V, A✝ (3.29) onde � ��_{✧ R}�✒� _{representa uma matriz deĄnida positiva. Usando o método multiplica-}

dor de Lagrange, pode-se obter a seguinte expressão para A�:

A� ✒��det F�✘

1 nF✍1

� (3.30)

onde F� é a matriz de covariância fuzzy do �-ésimo cluster dado por:

F� ❁� � 1 Û �✍1✝ �� ✝ � z�✍ v �✝ � ✝ z�✍ v �✝ � ✝ � ❁� � 1 Û �✍1✝ �� ✝� (3.31) onde o parâmetro de ponderação exponencial �✪ 1 inĆuência signiĄcativamente o algo- ritmo de partição, usualmente, � 2. Essa equação representa a ponderação da matriz de convariância (3.26) com os valores de pertinência contidos na matriz de partição U. A es- colha do número de clusters � é uma das etapas mais importantes, pois esse parâmetro de entrada do algoritmo inĆuencia diretamente a matriz de partição U (BABUSKA, 1998). A autoestrutura da matriz de covariância fornece informações sobre a forma e orientação dos clusters.

A matriz de convariância fuzzy pode fornecer algumas informações sobre as ca- racterísticas geométricas dos clusters como, por exemplo, a autoestrutura da matriz F�

fornece a forma e orientação do cluster; a raiz dos autovalores de F� fornece os raios das

hiperelipsoides dos clusters, conforme ilustrado na Figura 8.

O algoritmo (1) apresenta o algoritmo GK. Na entrada do algoritmo, é fornecido o conjunto de dados Z e especiĄca-se os valores do parâmetro de ponderação exponencial (� ✪ 1), o número de clusters � e o critério de parada � ✪ 0. Na inicialização, a matriz de partição U é preenchida aleatoriamente obedecendo a condição expressa em (3.21). Em termos práticos de implementação, aconselha-se implementar os passos de forma vetori- zada evitando, se possível, a utilização de laço que aumentam o tempo computacional do algoritmo. Detalhadamente, o algoritmo de agrupamento fuzzy GK consiste dos seguintes passos:

1. No primeiro passo, o protótipo de cada cluster é calculado, ou seja, o valor médio de todos objetos pertencente a uma determinada partição �� é calculado por meio

Figura 8: Hiperelipsoide deĄnida por z✍ v✝�

F✍1 z✍ v✝ 1. O comprimento do �-ésimo eixo desta hiperelipsoide é dado por ÔÚ� e sua direções deĄnida por ϒ�, onde

Ú� e ϒ� são os �-ésimo autovalor e autovetor da matriz de covariância fuzzy F,

respectivamente (Adaptada: Babuska (1998, p. 63)).

de uma média ponderada onde os pesos são os valores de pertinência Û�� de cada

objeto a um cluster ��. Esse valor é calculado os � clusters a cada iteração � até a

convergência do algoritmo.

2. No segundo passo, o calculo da matriz de covariância F�é realizado para cada cluster

�, ou seja, o grau de interdependência numérica entre cada objeto z� e o protótipo

de cada cluster é calculado.

3. No terceiro passo, o quadrado da distância �2

��Ai ✧ R

�✒�

de cada objeto em relação a cada protótipo de cada cluster é calculado utilizando o calculo de A� e da matriz

de covariância ��.

4. Finalmente, no quarto passo, ocorre a atualização da matriz de partição U. Nesse passo, o algoritmo GK exige que �_��A ✪ 0 para todo � ✧ r1, 2, . . . , �① e � ✧ r1, 2, . . . , �①, ou seja, o protótipo v�

�é distinto de qualquer objeto z�(v �

� ❥ z�,➽�, �, �).

Caso contrário, se o protótipo v�

� para � ✧ � ◆ r1, 2, . . . , �① está sobreposto a um

objeto z�, então Û �✝

�� 0 para �❾ I e ❁�✧IÛ �✝

�� 1, ou seja, se um ou mais protótipos

v� coincidir com o mesmo objeto z�, então a pertinência desse objeto aos demais

clusters deve ser nula e a soma das pertinência cujo os protótipos coincide com ele

deve ser unitária.

Em Vendramin (2012), é apresentada uma análise de complexidade do algoritmo GK que pode ser representado conforme nas Tabelas 4 e5.

O algoritmo de agrupamento fuzzy GK será utilizado para particionar o conjunto de dados Z em clusters que representam regiões de operação. Com esse clusters e utilizando um método de projeção descrito no próximo capítulo, será possível obter os conjuntos fuzzy do antecedente de cada regra fuzzy (3.9). No próximo capítulo, serão descritos tanto

Capítulo 3. Sistema de Inferência Fuzzy Takagi-Sugeno 53

Algoritmo 1 Agrupamento Fuzzy GK

1: Enquanto Ó ✪ � Faça 2: Para i ✂ 1 até c Faça

3: Passo 1 - Calculo dos centros dos clusters:

v�� ❁� � 1 Û �✍1✝ �� ✝ � z� ❁� � 1 Û �✍1✝ �� ✝� (3.32)

4: Passo 2 - Calculo da Matriz de Covariância dos clusters:

F� ❁� � 1 Û �✍1✝ �� ✝ � z�✍ v �✝ � ✝ z�✍ v �✝ � ✝ � ❁� � 1 Û �✍1✝ �� ✝�

5: Passo 3 - Calculo das distâncias:

�2_��A_i z�✍ v�✝ � ✕� det F�✝ 1 nF✍1 � ✛ z�✍ v�✝ (3.33)

6: Passo 4 - Atualização da Matriz de Partição: 7: Se �_��A_i ✪ 0 Então Û_��✝ 1 ❁� � 1 �ikAi �jkAi✝ 2 m✍1 (3.34) 8: Senão Û_��✝ 0 (3.35) 9: Fim Se 10: � �, �✝ Û_��✝ 11: Fim Para 12: Ó ➶➶➶➶_➶U�✝✍ U �✍1✝➶➶➶➶_➶ 13: Fim Enquanto

Tabela 4: Análise de complexidade (tempo) referente ao algoritmo de agrumpamento fuzzy Gustafson-Kessel.

Operação Análise de Complexidade (Tempo)

Calculo dos Protótipos (3.32) O �� ✝

Calculo A� O ��

✝ Calculo da Matriz de Covariância (3.31) O �� 2✝

Calculo da Distância (3.30) O �� 2✝

Atualização das Pertinências O ��✝

Complexidade Total O ��3✝

Para � suĄcientemente grande O ��3✝

o procedimento de estimativa dos parâmetros do antecedente das regras fuzzy, bem como a metodologia para estimativa dos parâmetros do consequente de cada regra.

Tabela 5: Análise de complexidade (espaço) referente ao algoritmo de agrupamento fuzzy Gustafson-Kessel.

Operação Análise de Complexidade (espaço)

Conjunto de dados Z O � �✝

Matriz de Partição U O ��✝

Protótipos dos Clusters O ��✝

Matriz de Covariância O ��2✝ Distância O ��✝ Armazenar A� e F� O �� 2 ✝ Complexidade Total O ��2✝

4 Metodologia Proposta

Neste capítulo, uma metodologia para identiĄcação de sistemas dinâmicos não line- ares estocásticos em malha fechada, utilizando sistema de inferência fuzzy Takagi-Sugeno e variável instrumental reĄnada fuzzy, é proposta. Para essa Ąnalidade, a metodologia pro- posta utilizou abordagem multimodel framework que possibilita representar um sistema global complexo, não linear e estocástico em modelos locais com estrutura matemática mais simples, na presente metodologia, estrutura Box-Jenkins. Essa estrutura é comumente utilizada nos métodos de identiĄcação de sistemas lineares em malha fechada. Esse fato possibilita a extensão, por meio de adaptações, de métodos padrões de identiĄcação de sistemas lineares em malha fechada para o contexto não linear.

Na Seção 4.1, a abordagem multimodel framework utilizada para identiĄcação de sistemas não lineares estocástico é discutida. Essa abordagem foi aplicada utilizando o sistema de inferência fuzzy Takagi-Sugeno. Na Seção 4.2, a metodologia para obtenção das funções de pertinência do antecedente das regras fuzzy é exposta. Na Seção 4.3, os algoritmos para estimativa paramétrica dos modelos locais Box-Jenkis do consequente de cada regra fuzzy são mostrados. Ainda nessa seção, na Subseção 4.3.1, utiliza-se o algo- ritmo RIV (ReĄned Instrumental Variable) fuzzy para obter estimativas dos parâmetros da planta e, na Subseção 4.3.2, o algoritmo IVARMA (Instrumental Variable ARMA)

fuzzy é utilizado para obter os parâmetros da função de transferência do ruído. Por Ąm,

uma visão geral da metodologia proposta é apresentada na Seção 4.4.

4.1 Estrutura do Modelo

Na prática, a maioria dos sistemas dinâmicos são não lineares. Em algumas situa- ções, esses sistemas podem ser representados de forma linear utilizando-se aproximações e/ou restrições para a região de validade. Essa classe possui estruturas mais simples, que possibilitam a estimativa de seus parâmetros e implementação de forma mais fácil em re- lação a estruturas não lineares. Além do mais, a teoria de algoritmos de controle baseados nesse tipo de estrutura está mais consolidada com métodos de análise de estabilidade e de desempenho bem conhecidos e fundamentados (CAMPELLO; OLIVEIRA,2007, p. 104). Entretanto, em muitos casos, eles não serão adequados, devido a complexidade das di- nâmicas envolvidas ou pela necessidade de uma eĄciência do modelo para toda faixa de operação do sistema. Nestes casos, estruturas não lineares deverão ser utilizadas. Porem, a escolha de uma estrutura não linear deve ser feita com cuidado, uma vez que o aumento na complexidade nos algoritmos é inevitável (AGUIRRE,2015, p. 385). Esse cuidado deve ser ainda maior no contexto de identiĄcação em malha fechada, pois os procedimentos

utilizados para descorrelacionar a entrada da planta (ação de controle) do ruído (pertur- bações, incertezas e ruído de medição) e para estimar os parâmetros da planta em malha aberta são procedimentos mais dispendiosos computacionalmente do que procedimentos padrões de identiĄcação em malha aberta. Considerando isso, nesta dissertação, o método proposto de identiĄcação de sistemas não linear estocásticos em malha fechada utiliza a abordagem Multimodel framework (MMF) (ADENIRAN; FERIK, 2016).

A MMF consiste em uma abordagem de identiĄcação de sistemas complexos, não lineares e com características estocásticas amplamente reconhecida por sua simplicidade, tratabilidade matemática e por sua conexão com outras estratégias de identiĄcação. Essa abordagem, decompõem o problema complexo de identiĄcação de sistemas não lineares em problemas menos difíceis. Em outras palavras, considere o sistema não linear S modelado por M� � que pode ser decomposto da seguinte forma:

M_{� �} ✂ rM1, M2, . . . , M�① (4.1)

onde M� (� ✧ r1, 2, . . . , �①) possuem características matemáticas mais simples que fa-

cilitam o procedimento de identiĄcação, por exemplo, estruturas como ARX, ARMAX e Box-Jenkins com algoritmos estimativa paramétrica e procedimentos de identiĄcação em malha fechada amplamente conhecido na literatura. Cada um desses modelos locais M_� representam o comportamento do sistema dinâmico não linear S em uma região de operação. Nesta dissertação, eles serão representados por meio da estrutura Box-Jenkins ilustrada na Figura 9 e representada matematicamente por:

M_� t �_� �, ρ�✝, �� �, η�✝✝ ➯θ� ✒ρ� η�✘ �

, θ� ✧ R �

③ (4.2)

onde �� e �� são funções de transferência da planta e do ruído de M� parametrizadas por

ρ� e η�, respectivamente. JustiĄca-se a escolha dessa estrutura pela sua representatividade

das condições em que um sistema em malha fechada opera, por isso essa estrutura é amplamente utilizada em métodos de identiĄcação em malha fechada (GEVERS; LJUNG; HOF, 2001a; GILSON; HOF, 2005; GILSON et al., 2006; LAURAIN; GILSON; GAR- NIER, 2009;HAN; CALLAFON, 2011; LI; LI; CAO, 2015).

+

Figura 9: Estrutura Box-Jenkis do modelo local M�.

No contexto de identiĄcação de sistema não lineares estocásticos em malha fechada, a abordagem MMF possibilita, mediante a adaptações, utilização de metodologias padrões

Capítulo 4. Metodologia Proposta 57

de identiĄcação de sistemas com dados coletados em malha fechada, pois é possível que os modelos locais possuem estruturas comumente utilizadas por estes métodos. A agregação destes é realizada por uma função de validade (ou em sistemas de inferência fuzzy, grau de ativação) da seguinte forma:

^�

�

❂

� 1

γ� x✝M� (4.3)

Nesta dissertação, a metodologia desenvolvida utiliza uma estratégia de partição sem conhecimento a priori baseado em dados experimentais. Nesse procedimento, as re- giões de operação do sistema são obtidas sem conhecimento a priori por meio da partição do conjunto de dados. De forma geral, as estratégias de partição são categorizadas em incremental, agrupamento e partição aprendida Id., 2016, p. 5. A segunda estratégia é utilizada no presente trabalho, em particular, um agrupamento fuzzy é utilizado para particionar os dados em regiões de operação e obter a função de validade γ� x✝ respon-

sável por realizar a agregação dos modelos locais M�. Vários algoritmos de agrupamento

fuzzy têm sido utilizados para identiĄcação utilizando a abordagem MMF, por exemplo, fuzzy c-means (RONEN et al.,2002), fuzzy k-mean (ELFELLY et al.,2010), K-mean (EL- FELLY et al.,2008), GK (TESLIC et al.,2011),Gath-Geva (GG) (ABONYI; BABUSKA; SZEIFERT, 2002), entre outros. Neste trabalho, utiliza-se o algoritmo de agrupamento

fuzzy GK. Conforme discutido em Babuska (1998), justiĄca-se a escolha do algoritmo GK como mecanismo de auxílio para identiĄcação de sistemas pelos seguintes motivos: o algoritmo GK é relativamente insensível a inicialização da matriz de partição e é capaz de detectar clusters de diferentes formas e orientações.

A metodologia de identiĄcação de sistemas dinâmicos não lineares com dados coletados em malha fechada proposta nesta dissertação considera a estrutura de modelo não linear representado pelo sistema de inferência fuzzy Takagi-Sugeno em (4.4) e ilustrado por meio da Figura 10, conforme apresentado também no trabalhoVelozo e Serra (2016). Como pode ser observado nessa Ągura, o sistema de inferência TS possui � regras

fuzzy que constituem-se de duas partes: antecedente e consequente. Cada uma dessas

partes possuem parâmetros a serem identiĄcados. Dessa forma, para realizar a construção deste sistema de inferência e consequentemente realizar a modelagem do sistema não linear é necessário estimar os parâmetros do antecedente e do consequente. A estimativa dos parâmetros do antecedente consiste em obter as funções de pertinências ÛFi

j ��✝ de forma automática com base em um procedimento de agrupamento. Já para a estimativa dos parâmetros do consequente, é necessário construir o modelo do sistema �� e o modelo

do ruído �� por meio da estimativa dos seus respectivos parâmetros, ^ρ� e ^η�, para cada

regra R� _{com �}

✧ r1, 2, . . . , �①. Nas próximas seções, serão discutidos os métodos utilizados e propostos para estimar os parâmetros dessas partes constituintes das regras fuzzy do

Antecedente 1 Antecedente

l

Consequente 1 Consequente

l

...

Agregação

+

Regra Regra

Figura 10: Representação gráĄca da estrutura do modelo. sistema de inferência TS.

No documento PROPOSTA DE METODOLOGIA RECURSIVA-ITERATIVA PARA IDENTIFICAÇÃO FUZZY DE SISTEMAS NÃO LINEARES ESTOCÁSTICOS EM MALHA FECHADA (páginas 49-59)