Erros de Predição e Simulação - Computação evolucionária e máquinas de comitê na identificaçãod

Este trabalho irá utilizar como teste modelos Não-lineares Autoregressivos com Média Móvel e com entradas Exógenas (NARMAX) (Leontaritis e Billings, 1985b). No entanto, acredita-se que os conceitos são aplicáveis a uma classe de representações de modelo muito mais ampla. Para mostrar essa caracterís- tica de maneira clara, o problema vai ser apresentado em uma forma mais geral, e de certa forma mais abstrata, como se segue.

Assuma que dados _Z de um sistema _S estão disponíveis. O problema de construção de um modelo caixa-preta consiste na construção de um modelo matemático M a partir dos dados Z eM deve aproximar o sistema S em algum sentido.

4.2.1 Identificação de sistemas como um problema de otimiza-

ção

O problema de construção de um modelo_Mque aproxime o sistema_S pode ser expresso como um problema de otimização. Por uma questão de argumento, assuma que há uma função custo J(_S,_M) que deve ser minimizada em relação às características do modeloMcomo a estrutura e parâmetros do modelo. Por- tanto, o modelo que minimiza a referida função custo seria equivalente, no sentido definido por J, ao sistema, isto é,_{M ≡}_J _S. A pergunta é: será que_{M ≡}_J _S

garante que_{M ≡ S}? Outra maneira de pensar o problema é perguntar: quais os tipos de função custo J(_M,_S) podem ser utilizadas de forma que_{M ≡}J S implique _{M ≡ S} na maioria das vezes? Normalmente _S só é conhecida por meio dos dados disponíveis_Z. Portanto, é natural redefinir a função custo como J(_M,_Z), como discutido a seguir.

Em princípio, faz sentido lidar com_Me_S na mesma função custo, uma vez que tais entidades são do mesmo tipo, ou seja, ambas são sistemas dinâmicos (embora S seja “abstrata” e M matemática). Tendo substituído S pelos dados

Z na função custo (um sistema dinâmico foi substituído por um conjunto de dados), também vai exigir a substituição de _M por algum modelo dos dados Z_M a fim de comparar entidades da mesma natureza. Isto é feito por meio de uma função custo.

Para ser mais específico, suponha que um subconjunto Z _∈ RN×r de dados

é tomado de_Z, Z _{⊂ Z}. Z é assumido como sendo composto por pelo menos uma série temporal y(k), k =1, . . . , N, chamada saída, e, possivelmente, outras séries temporais exógenas u1(k), . . . , ur−1(k), k = 1, . . . , N, chamadas entradas. Se apenas uma série temporal está disponível, ela é interpretada como a saída y(k) e em tal caso Z = [y(1). . . y(N)]T_{. Se r} ₌ _{2, então só existe uma entrada}

exógena e este caso é conhecido como o caso SISO (single-input, single-output). Uma função custo prática para modelagem caixa-preta seria então J(Z, Z_M),

em que Z =       zT 1 zT 2 ... zT N      = [ y u₁ . . . u_r₋₁] = =       y(1) u1(1) . . . ur−1(1) y(2) u1(2) . . . ur−1(2) ... ... . . . ... y(N) u1(N) . . . ur−1(N)       , (4.1)

Z_M =      ˆzT 1 ˆzT 2 ... ˆzT N      = [ˆy u1 . . . ur−1] = =       ˆy(1) u1(1) . . . ur−1(1) ˆy(2) u1(2) . . . ur−1(2) ... ... . . . ... ˆy(N) u1(N) . . . ur−1(N)       , (4.2)

sendo que ˆy(k) = f(z_k₋₁) é o modelo predito. Assim, finalmente, muitas téc- nicas de identificação de modelos resolvem o seguinte problema de otimização irrestrito

ˆθ=min

θ J(Z, ZM) (4.3)

onde J(Z, Z_M) é escolhido como o produto internohξ, ξ_i, sendo ξ = y− ˆy, θ é o vetor de parâmetros de_M.

4.2.2 Validação do Modelo

No contexto de identificação de sistemas, normalmente é assumido que há um conjunto separado de dados Zv, similar a Z, disponível para validação do modelo.

Para muitos modelos, os parâmetros são estimados resolvendo o problema apresentado em (4.3), para Z_M obtido pela predição um passo à frente, neste caso Z_M₁ será usado. Um fato bem reconhecido é que as características dinâmi- cas do modelo _M são difíceis de obter analisando Z_M₁ (Aguirre et al., 2006; Piroddi e Spinelli, 2003). Uma consequência disto é que resolvendo (4.3) possivelmente não garante_{M ≡ S}, embora seja esperado que se chegue perto da desejável equivalência.

Como salientado na Seção 4.2.1, a idéia base é que mesmo se o modelo aproximar o sistema em termos de escolha de um determinado J, ou seja _{M ≡}_J _S, isso não implica que_{M ≡ S}. No entanto, existem informações importantes na predição um passo à frente (resíduos) que podem ser usadas na identificação de sistemas (Zhu et al., 2007).

que pode ser garantido é simplesmente que um conjunto de dados produzidos pelo modelo é consistente – em termos de J – para dados medidos do sistema, isto é, Z_M _≡J Z, onde ZM deveria ser o mais representativo da dinâmica do

sistema possível. Normalmente, apenas alguns (por vezes apenas um) conjuntos de dados do sistema estão disponíveis para a validação do modelo (Zv) e tudo que pode ser verificado é se Z_M ≡J Zv. Caso Z, Zv ou ZM não representem

a dinâmica de S ouM de forma adequada, muito pouco pode ser dito sobre a qualidade do modelo. Este problema não trivial é o cerne da validação de modelos.

Com a discussão acima em mente, no intuito de aumentar a robustez, sob um ponto de vista dinâmico, seria conveniente que, durante a etapa de otimiza- ção, a função custo J(Z, Z_M) utilizasse um conjunto de dados do modelo Z_M dinamicamente mais representativo do modelo do que as predições um passo à frente. Esta parece ser a motivação do uso de dados de simulação livre em alguns trabalhos recentes (Piroddi e Spinelli, 2003; Connally et al., 2007; Piroddi, 2008b).

O uso de dados de simulação livre como Z_Mno problema de otimização (4.3) se torna computacionalmente muito exigente e provavelmente não seria facil- mente aplicável a sistemas com expoentes de Lyapunov positivos nem modelos de séries temporais para os quais a parte determinística da saída irá normalmente estabelecer-se em um ponto fixo na ausência de uma entrada.

4.2.3 O Problema

Assume-se que um determinado conjunto de dados Z de um sistema dinâmico_S está disponível. É também assumido que uma determinada estrutura de modelo

M, parametrizada por um vetor de parâmetros desconhecido θ_∈ Rn, tenha sido

previamente definida.

Neste trabalho, o objetivo é investigar o problema de otimização (4.3) no contexto de identificação de sistemas não-lineares . Para esse fim, dois diferentes tipos de conjuntos de dados de modelos Z_M serão considerados: predição um passo à frente, Z_M₁, e dados de simulação livre, Z_M_s.

Uma forma de avaliar o papel desempenhado por Z_M₁ e Z_M_s é definindo o seguinte problema de otimização bi-objetivo (que é um caso especial de problemas multi-objetivo (MOP))

   ˆθ= arg min θ J(θ) sujeito a: θ∈ Rn, (4.4)

com J = [J₁ Js ], sendoJ1 = MSE(Z, ZM1), Js = MSE(Z, ZMs) e MSE é o erro

médio quadrático. Se as funções-objetivo são conflitantes, ao invés de se chegar a uma solução, um conjunto de soluções, soluções Pareto ótimas, é obtido:

Θ₌_{ˆθ_∈ Rn : 6∃θ_∈ Rn|J(θ)≤J(ˆθ), J(θ) 6=J(ˆθ)}. (4.5) Nessa formulação do problema, um extremo do conjunto Pareto é representado pela solução MQ – que minimiza J₁ =MSE(Z, Z_M₁)– e o outro extremo é repre-

sentado pela solução obtida usando dados de simulação livre, ou seja, a solução que minimiza Js =MSE(Z, ZMS).

Portanto, o objetivo é entender os papéis de Z_M₁ e Z_M_s em problemas de estimação de parâmetros baseados ou em conjuntos Pareto ou em solução mono- objetivo, ambos obtidos por meio da computação evolucionária.

4.2.4 Metodologia

Os resultados a serem apresentados neste capítulo são obtidos por meio de algoritmos evolucionários. Esta abordagem encontra resultados que são basica- mente independentes do conhecido estimador MQ. Este é um ponto importante que deve ser notado. Como algumas das estruturas de modelo que serão utilizadas são lineares-nos-parâmetros (polinômios NARX) ou pseudo-linear nos parâmetros (polinômios NARMAX ), é natural que o estimador clássico de MQ passa a ser utilizado na primeira, e o estimador de mínimos quadrados esten- dido (MQE) (Billings e Voon, 1984) passa a ser utilizado na segunda. Isto é o que se espera que acontecerá na prática de identificação de sistemas utilizando tais representações de modelo. No entanto, a fim de obter resultados que deverão ser de âmbito mais geral decidiu-se usar algoritmos evolucionários.

Além disso, o uso de AE é justificado pelo tratamento geral visado, porque eles podem ser usados para estimar parâmetros de modelos cujas estruturas não são lineares-nos-parâmetros. Além disso, embora haja inúmeras abordagens disponíveis na literatura para resolver problemas multi-objetivo, os AE parecem ser uma escolha apropriada como descrito no capítulo anterior.

Uma grande variedade de implementações de algoritmos evolucionários tem sido proposta para resolver MOPs. Neste trabalho, o algoritmo Nondominated Sorting Genetic Algorithm melhorado (NSGA-II, Alg. 8) (Deb et al., 2002) será usado para resolver o problema (4.4). Este algoritmo tem apresentado resultados satisfatórios em diversos problemas na literatura (Coello-Coello, 2006).

Para criar uma população inicial aleatória, algumas amostras são aleatoria- mente selecionadas do conjunto de dados disponível Z e o algoritmo de MQ é aplicado para encontrar os parâmetros de uma estrutura definida em um número de vezes igual ao tamanho da população.

O procedimento de seleção é implementado por meio do torneio estocás- tico. Considerando que o algoritmo foi implementado baseando-se nos AGs com código real, foi implementado o operador de cruzamento real polarizado (Takahashi et al., 2003). O operador de mutação adiciona um número aleatório com uma distribuição gaussiana de média zero e desvio padrão igual a σ às variáveis do indivíduo.

Para resolver problemas mono-objetivo, os AGs são implementados usando o procedimento de seleção estocástico universal, o cruzamento heurístico e mu- tação gaussiana.

Com o propósito de evitar modelos instáveis em simulação livre, o método de barreira foi empregado na avaliação da função custo, de forma que, ao se constatar a instabilidade de um modelo especificado por um determinado indi- víduo, este recebe uma avaliação muito ruim, fazendo com que a probabilidade de escolha desse indivíduo para a próxima geração seja muito baixa.

No documento Computação evolucionária e máquinas de comitê na identificaçãode sistemas não-lineares (páginas 100-105)