Otimização bi-objetivo aplicada à estimação de parâmetros de modelos não-lineares: caracterização e tomada de decisão

(1)

Otimização Bi-Objetivo Apliada à

Estimação de Parâmetros de Modelos

Não-Lineares: Caraterização e Tomada

de Deisão.

Tese submetida à banaexaminadora designada pelo Colegiado do

Programade Pós-Graduaçãoem Engenharia Elétriada Universidade

Federal de Minas Gerais, omo parte dos requisitos neessários àobtenção

do grau de Doutor em Engenharia Elétria.

Programa de Pós-Graduação em Engenharia Elétria

Centro de Pesquisa e Desenvolvimento em Engenharia Elétria

(2)

(3)

ser diferente e ter os mesmos direitos"

(4)

(5)

A identiaçãode sistemas ompreende um onjunto de ténias para a

modelagemde sistemas dinâmios. Essas ténias, normalmente, são

lassi-adasde aordo oma utilizaçãoounão de informaçõesontidas emdados

medidos. De maneirageral,a identiaçãode sistemaspode ser divididaem

ino partes, destaando-se: (i) esolha de representação, (ii) deteção de

estrutura, (iii)estimação de parâmetros e (iv) validação do modelo. A

teo-riabásiaenontra-semuitobemfundamentadaeomumgrandenúmerode

trabalhosqueautilizaomobaseparaodesenvolvimentodeferramentas

ma-temátiaseomputaionais. Adeteçãodeestrutura,lassiamente,utilizaa

análisederesíduos, ouseja,errodeumpasso àfrente, omoíndiede

desem-penho. Emboraaindasejamlargamenteutilizados,algunstrabalhossugerem

que tais ferramentas apresentem ompensaçãoa prováveis erros estruturais,

ou seja, a erro na esolha dos regressores. É sugerido, a partir disso, que

sejamutilizadosíndiesbaseados noerro desimulaçãoenãoresidual. O

pre-sente trabalho pretende abstrair tais sugestões para o aso da estimação de

parâmetros,utilizandoum estimador bi-objetivo,emque aetapa de deisão

utilize análise do erro de simulação do modelo omo índie de desempenho.

A estrutura será onsiderada onheida. Este trabalhotem porobjetivo

ar-gumentar, om base em simulações e análise matemátia, que estimadores

bi-objetivo,omertasaraterístiasestruturais,taisomo,linearidadenos

parâmetrose onvexidade,são apazes de retornarum onjuntode modelos,

que apresente distribuição estatístia semelhanteaestimadores tradiionais.

Apartirdisso, serádemonstradotambémqueépossíveldeterminarqualdos

modelos apresentavaloresde parâmetros mais próximodos valores reais, ou

seja, não-polarizados. Essa deisão éfeita através de ténias de orrelação.

Váriosexemplos no deorrer dotexto serão utilizados para validar as

téni-as desenvolvidas. A araterização e a tomada de deisão de estimadores

(6)

(7)

The system identiation onsists of a group of tehniques for dynami

system modeling. Usually, these tehniques are lassied aording to the

use or not of information presented in measured data. Generally, the

sys-tem identiationis omposed by four parts: (i)seletion of representation,

(ii) struture detetion, (iii) parameters estimation and (iv) model

valida-tion. Thebasitheory iswellstruturedandthere isonsiderablenumberof

worksthatuse thistheorytodevelopmathematialandomputationaltools.

Normally, the analysis of residues, that is the one step ahead error, is used

forstruture detetion asperformaneindex. Although thisapproahisstill

used,someworkssuggestthatthispresentsaninlinationtostruturalerror.

Inthis work,itissuggested, thatthese indexesare usedbasedonsimulation

error and not residual. The present work intends to use a bi-objetive

ap-proah to parameter estimation. The analysis of the simulationerror of the

modelisused asperformane index inthe deisionstage. The struturewill

beonsideredknown andequaltothesystem. Thisworkaimstoplead,with

base insimulationsand mathematialanalysis, that bi-objetive estimators,

with ertain strutural harateristis, suh as, linearity in the parameters

and onvexity, are able toyielda set of models, whihare statially similar.

Itisalsopossibletoestimatethelosestparameterstorealvaluesofthe

mo-dels. These estimated parameters are unbiased. The deision stage is taken

intoaountbymeansoforrelationtehniques. Severalexamplesinthetext

are used tovalidatethe developed tehniques. The haraterization and the

deision stage of bi-objetive unbiased estimatorare the main ontributions

(8)

(9)

Em Assim falou Zaratustra, Nietzshe esreve: Retribui-se mal a um

mestre, quando se permanee sempre um disípulo. Esse trabalho então é

uma retribuiçãoaos meu amadosmestres, que sempreestiveram dispostos a

metransformaem alguémomapaidaderítianeessáriaparaandarom

as própriaspernas. Osmeus mestres são:

Meus pais MariaAliee IvanBarroso, minha irmã MariaAída.

Minha querida esposa Marinês e meus adoráveis unhados Kim, Roney,

Robson, Ranieri. Minha sogra, Inêz.

Meuquerido,amadoerazãomaiordemeuresimento,Murilo,meulho.

Meus Professores: Eduardo Mendes (Zeus), Rodney Saldanha, Riardo

Takahashi e LuisAguirre, fundamentais.

Osgrandesseres: EriveltonNepomueno,GleisonAmaral,Alex(Shmoo),

Ânderson Barbosa, Dair, Mara, Alides Volpato, Tia Maria do Carmo, Tio

Mauro, o asal MariaCláudiae Maro Antnio.

Meus irmãos dooração RafaelLopes(Torinha)e RudimarPatroínio.

Retribuo ainda aoProfessor Carlos Martinez,aos membros doMACSIN

e do CPH, aos funionários e professores do CPDEE, CPH e aos membros

daBana designada peloColegiado do PPGEE.

Aosque não menionei, espero que meperdoem...

Agradeço a toda força que, inexpliavelmente, me orientou, reeba ela o

(10)

(11)

Resumo v

Abstrat vii

Agradeimentos ix

Nomenlatura xxi

Abreviações xxiii

1 Introdução 1

1.1 OBom Modelo . . . 2

1.2 Motivação eObjetivos . . . 3

1.3 Estrutura daTese . . . 4

I Base Teória 7 2 Identiação de Sistemas Não-Lineares 9 2.1 Introdução . . . 9

2.2 Identiaçãode Sistemas . . . 9

2.3 Experimentação doSistema . . . 10

2.4 Deteçãode Não-Linearidades . . . 11

2.5 Esolhade Representação ede Estrutura . . . 11

2.5.1 Deteção de estrutura . . . 13

2.5.2 Deteção de estrutura utilizandoERR . . . 13

2.5.3 Critériode informaçãode Akaike . . . 14

2.6 Agrupamentos de Termos e Coeientes de Agrupamentos . . 15

2.6.1 Agrupamentoespúrio emmodelos polinomiais . . . 16

2.7 PontosFixos emSistemasAutnomos. . . 16

2.7.1 Pontos xosem sistemasnão autnomos . . . 17

(12)

2.9 Estimação de Parâmetros. . . 19

2.9.1 Propriedades Estatístias do Estimador de Mínimos Quadrados . . . 21

2.9.2 Mínimosquadrados estendidos . . . 22

2.9.3 Regularização . . . 23

2.10 Validaçãodo Modelo . . . 24

2.11 Comentários Finais . . . 25

3 Identiação Multi-objetivo 27 3.1 O ProblemaMultiobjetivo . . . 27

3.2 Formulação doProblemaMultiobjetivo . . . 28

3.2.1 Determinaçãodas Soluções Eientes . . . 28

3.2.2 Etapa de Deisão . . . 29

3.3 Estado da Arte . . . 30

3.3.1 ComparaçãoEntre os Tiposde Modelagem . . . 31

3.3.2 Retrospetiva História . . . 32

3.4 Comentários Finais . . . 38

II Contribuições Propostas 39 4 Tomada de Deisão 41 4.1 Motivação . . . 41

4.2 Robustez aoruído . . . 43

4.2.1 EsolhaNão-Polarizada . . . 47

4.3 Deisor de Correlação . . . 52

4.4 Comentários . . . 55

5 CaraterizaçãodoEstimadorMultiobjetivo: oParetoÓtimo 57 5.1 Preliminares . . . 57

5.1.1 GeraçãodoConjuntoPareto-Ótimo . . . 59

5.1.2 Esolhados Funionais . . . 60

5.2 PolarizaçãoemEstimadores Bi-Objetivo . . . 61

5.2.1 Modelos de erro na equação de regressão . . . 61

5.2.2 Resultados Simulados. . . 65

5.2.3 Modelos de erro na saída . . . 69

5.2.4 Resultados Simulados. . . 73

(13)

III Apliações 83

6 Identiação de Dois Sistemas Piloto 85

6.1 Identiaçãode um Conversor Estátio . . . 85

6.1.1 Introdução . . . 85

6.1.2 Osistema . . . 86

6.1.3 Teste Dinâmio . . . 86

6.1.4 Caraterístiaestátia . . . 88

6.1.5 Identiaçãodo Conversor . . . 89

6.2 Identiaçãode um Aqueedor . . . 92

6.2.1 Desrição doSistema . . . 93

6.2.2 Teste Dinâmio . . . 93

6.2.3 Teste Estátio . . . 95

6.2.4 Resultados . . . 96

6.3 Conlusões. . . 101

7 Identiação de um Sistemade Bombeamento mais Turbina103 7.1 Desrição doProesso . . . 103

7.1.1 Ensaios dinâmios. . . 106

7.1.2 Ensaios estátios . . . 108

7.1.3 Identiaçãodo Sistema . . . 108

7.1.4 Conlusões. . . 116

8 Comentários Finais e Proposta para Trabalhos Futuros 117 8.1 Quanto aoDeisor . . . 117

8.1.1 Trabalhosfuturos . . . 118

8.2 Quanto aoPareto-Ótimo . . . 118

8.2.1 Trabalhosfuturos . . . 119

8.3 Apliaçãoem Controle . . . 119

(14)

(15)

4.1 Comparaçãoentreosvaloresdaequação(4.8)paraosmodelos

1,2, 3e 4. . . 51

5.1 Resumo dos índies estatístios das esolhas do deisor para

as200 realizaçõesdoerro e(k). . . 66

5.2 Média e Desvio padrão dos parâmetros estimados pelo

esti-madorbi-objetivo. Calulando amédia das 20000realizações

om 1% doruído e(k). . . 78

5.3 Média mais desvio-padrão dos parâmetros estimados pelo

es-timador bi-objetivo (EBO), Mínimos Quadrados Estendidos

(MQE) eVariáveisInstrumentais (VI). . . 79

6.1 Parâmetrosdomodelo(6.3)estimadospeloestimadorbi-objetivo. 91

6.2 Desempenho do modelo (6.3) peloíndie RMSE. . . 91

6.3 Desempenho domodelo (6.3) peloíndie RMSEe número de

parâmetros(NP) emomparação aoutros modelos. . . 92

6.4 Comparaçãoentre modelosujosparâmetrosforamestimados

utilizandoinorporaçãode onheimentoauxiliarnaetapa de

estimação de parâmetros, segundo o ritérioRMSE. . . 100

7.1 Tabela de omparação de valores de MAPE para os modelos

identiados. . . 110

7.2 Tabela de omparação de valores de MAPE para os modelos

identiados. . . 113

7.3 Tabela de omparação de valores de MAPE e número de

(16)

(17)

4.1 Índie RMSEpara várias realizaçõesde ruído. . . 44

4.2 Correlaçãoentre erro de prediçãoe simulaçãolivredomodelo

para as100 primeiras realizaçõesde ruído. . . 47

4.3 Saídasimuladado Modelo 1emomparaçãoaos dados de

va-lidação do sistema, sendo que o traço ontínuo é usado para

representarosdadosde validaçãoeospontos()asaída

simu-lada domodelo. . . 49

representar osdadosde validaçãoeospontos()asaída

representarosdadosde validaçãoeospontos()asaída

representar osdadosde validaçãoeospontos()asaída

4.7 Histograma de um estimador polarizado tomadas 2000

reali-zações, om

1

= 0;7, tendo média-1,60 e variânia 2. . . 53

4.8 Histograma de um estimador polarizado tomadas 2000

reali-zações, om

2

=0;5, tendo média0,50 e variânia 1. . . 54

4.9 Comparação entre a simulação do modelo ujos parâmetros

foram esolhidos pelo deisor () e os dados gerados pela

re-presentação (4.20) (). . . 54

5.1 Valor de jj 1

N P

e

2

jj emrelação aonúmero de experimentosN. 62

5.2 Histogramadosmodelosesolhidos pelodeisoremada uma

(18)

5.3 Histograma para o parâmetro

1

estimado, para as 200

reali-zações doerro e(k),ujo valorreal é

1

=0;1. . . 67

2

= 0;01. . . 67

3

= 0;03. . . 68

4

= 0;50. . . 68

5

=1;00. . . 69

5.8 ConjuntoParetodos modelosque foramestimados utilizando

assériestemporais,om desviopadrãodoerro desaída de2%

até 5%.. . . 74

5.9 As guras mostram a orrelação entre (equação 4.4) e y^

(saída em simulação livre), alulado usando a equação (4.5)

para modelo que é representado na Figura5.8. O número de

ada modelo no onjunto Pareto ontado da esquerda para a

direita para ada nívelde ruído: (a)2%, (b) 3%, () 4%, and

(d) 5%.. . . 75

5.10 Histograma de 20000 valores estimados doprimeiro elemento

em . (MQ) india valores alulados pela minimização de

J

MQ

. As soluções de J

ES

são indiados por (ES). Finalmente,

osparâmetros seleionadosusandoodeisorde mínima

orre-laçãosãoindiadospor(DC).Overdadeirovalordoparâmetro

é

1

=1;1031. . . 76

5.11 Histograma de 20000 valores estimados do segundo elemento

em . O verdadeiro valordoparâmetro é

2

=0;0160. . . 77

5.12 Histograma de 20000 valores estimados do tereiro elemento

em . Overdadeiro valordoparâmetro é

3

=0;0404: . . . . 77

5.13 Histograma de 20000 valores estimados do segundo elemento

em . Overdadeiro valordoparâmetro é

4

= 0:2057: . . . 78

5.14 Histograma de 500 valores estimados pelo Estimador de

Mí-nimos Quadrados Estendidos do parâmetro

1

. O verdadeiro

valordoparâmetro é

1

=1;1031: . . . 80

5.15 Histograma de 500 valores estimados pelo Estimador de

Va-riáveis Instrumentaisdo parâmetro

1

. O verdadeiro valordo

parâmetro é

1

=1;1031: . . . 81

6.1 Conversor buk . . . 86

(19)

6.4 Dadosestátios- Buk . . . 89

6.5 Conjunto Pareto-Ótimo para a estrutura (6.3), sendo que o modelo esolhido foi odéimo de ima para baixo. . . 90

6.6 Diagramaem bloos funionaisdo sistema(aqueedor). . . 93

6.7 Dadosde identiação -Aqueedor . . . 94

6.8 Dadosde validação- Aqueedor . . . 95

6.9 Dadosestátios- Aqueedor . . . 96

6.10 Conjunto Pareto-ótimo para omodelo (6.4). . . 98

6.11 Validação Dinâmia- Aqueedor. . . 99

6.12 Validação Estátia- Aqueedor . . . 100

7.1 Sistemade bombeamento de água. . . 104

7.2 Conjunto turbinamais gerador. . . 105

7.3 Sinalde entrada utilizadonaidentiaçãodo sistema. . . 107

7.4 Sinalde saída utilizadona identiaçãodo sistema. . . 107

7.5 Curva araterístiaemestado estaionário dosistema. . . 108

7.6 Conjunto Pareto-Ótimo para a estrutura (7.1). O deisor es-olheuo quarto modelo, de ima para baixo noPareto. . . 111

7.7 Saída simulada do modelo (7.1), ujos parâmetros foram ob-tidos via estimador bi-objetivo, sendo que o traço ontínuo é asaída do sistemareal e o ()é asaída simulada domodelo. . 112

7.8 Curva araterístia do modelo ujos parâmetros foram obti-dos via estimador bi-objetivo, sendo que o traço ontínuoé a urva dosistema real e o() é aurvado modelo. . . 112

7.9 Conjunto Pareto-Ótimo para a estrutura (7.4). O deisor es-olheuo tereiromodelo, de ima para baixo noPareto.. . . . 114

7.10 Saídasimulada domodelo(7.4), sendo queo traçoontínuoé asaída do sistemareal e o ()é asaída simulada domodelo. . 114

(20)

(21)

yy

Funçãode autoorrelaçãolinear

y 2

y

2 Funçãode autoorrelaçãonão-linear

E [:℄ Operadoresperança matemátia

m

Atraso da função de autoorrelação

T

s

Tempode amostragem

F `

Funçãogenéria om grau de não-linearidade`

y(k i) Regressor de saída

u(k j) Regressor de entrada

e(k) Inerteza matemátia

n

y

Máximoatraso doregressor de saída

n

u

Máximoatraso doregressor de entrada

n

e

Máximoatraso doregressor de ruído

d Atraso puro de tempo

k Tempodisreto

i

Parâmetro do modelo NARX polinomial

Vetor de parâmetros

Var: Variânia matemátia

(k) Erro de modelagem

J Funçãousto genéria

y p

u m p

Agrupamentode termos

y p

u

m p Coeientede agrupamento etermos

Matriz de regressores

(22)

Matriz de regressores estendida

Vetor de parâmetros estendido

S Mapeamento linear

z Domíniodafreqüênia omplexo

(23)

NARX Modelos não-lineares auto-regressivos

om entradasexógenas

MQ Mínimosquadrados onvenionais

MQE Mínimosquadrados estendidos

RMSE Raízdoerro médio quadrátio

MQR Mínimosquadrados restritos

(24)

(25)

Introdução

A neessidade de se entender e até mesmo de se reproduzir fenmenos

físiosfoi um grandeimpulso para o desenvolvimento daiênia e da

teno-logia.

Amodelagemmatemátia,omoferramentaparareproduçãodo

ompor-tamento aproximado de fenmenos físios, vem se destaando nas últimas

déadas, sejaparaanalisarasrelaçõesde ausaeefeitoemdadosobservados

(Weyer et al., 2000; Miyano et al., 2000), seja para o desenvolvimento de

ontroladores(Gu,1994;SmithandDoyle,1992;Makilaetal.,1995;Simutis

etal.,1997;Agarwal,1997;Demiranetal.,1999;Lee,2000). Justiadopela

omplexidade dos modelosnão-lineares, os modelos lineares são muito

utili-zados para representar o omportamento de sistemas emuma faixa restrita

de operação. Osmodeloslinearesforamimportantesparaodesenvolvimento

damodelagempoispermitiramo entendimentoloaldos fenmenos.

Com odesenvolvimentotenológio,prinipalmentenaárea

omputaio-nal, foi possível o desenvolvimento de ténias de modelagemnão-lineares.

Outras representaçõesforamsurgindoom opassardos anos. Nadéada

de oitenta, destaa-se o apareimento dos modelos NARMAX polinomiais

(Leontaritisand Billings,1985a)e raionais(Billingsand Chen, 1989).

Um dos problemas mais itadosnaliteraturaéa diuldadena etapade

esolhadeestrutura. Comointuitodepesquisaresseproblema,vários

traba-lhos forampubliados (Haber and Unbehauen, 1990; Breeden and Pakard,

1994;MaoandBillings,1997;Abonyietal.,2000). Em(AguirreandBillings,

1995),porexemplo, osautoresdisutem oproblema de sobreparametrização

emmodelos não-lineares utilizandorepresentações polinomiais.

Outra maneirade seontornaresse problema éainorporaçãode

onhe-imentoauxiliaraomodelonasetapasdeesolhade estruturaeestimaçãode

parâmetrosdomodelo. Talonheimentopermiteaesolhadeumaestrutura

(26)

rela-ções físias, limites operaionais, entre outros. O que se tem onheimento

naliteratura, no entanto, éa imposição de onheimento emuma estrutura

genéria, sem a preoupação de detetar nessa a maneira na qual o

onhe-imento auxiliaré representado (Herbert and Tulleken, 1993; Sjöberg et al.,

1995;Bohlin and Graebe,1995).

1.1 O Bom Modelo

Otrabalhode Duong and Landau(1994)omeçafazendo aseguinte

ar-mação: A proposta da validação de modelo é veriar se o modelo obtido

por identiaçãoé bom, isto é, veriar se os parâmetrosdo modelopodem

ser onsiderados omo oinidentes om os parâmetros reais do sistema.

Essa armação é importante do ponto de vista losóo pois o bom

modelo requer o onheimento do próprio sistema. O que não é totalmente

fatível por vários aspetos, por exemplo, nem sempre é possível onheer

maisdoqueosdadosdeentradaesaídadosistema. Muitasvezesosproessos

sãotãoomplexosqueautilizaçãodasleisfísiasqueregemoproesso

torna-sepouoatraente(Pottmann and Pearson, 1998).

Entãoobommodelopartedeumproblemainiial,queéadeterminação

de sua estrutura. Para os parâmetrosserem oinidentes om os parâmetros

reais, signia que exista uma oinidênia entre a estrutura do modelo e

a do sistema. Pode-se dizer então que problemas na estrutura do modelo

sejam tão importantes quanto o problema da estimação dos parâmetros e

sua validação.

No aso de modelos obtidos a partir da físia do proesso, o problema

estruturalestá amarrado àssimpliaçõesneessárias aada apliação,uma

vez que nem sempre é possível se obter todas as variáveis do sistema. No

aso de modelos obtidos por ténias aixa-preta, ou seja, baseadas apenas

nos dados medidos de entrada e saída, o problema reside na qualidade e

na quantidade dos dados. Essas onsiderações também são pertinentes no

que dizrespeito à estimação dos parâmetros (Pottmann and Pearson,1998;

Lindskogand Ljung, 1995b;Garia, 1997).

Em uma esala evoluionária pode-se onsiderar que naturalmente os

trabalhos mais reentes se preoupam em utilizar todas as informações

dis-poníveis, sejamelas obtidasnos dados de entrada e saída dosistema, sejam

elas obtidasnafísia doproesso. Essa abordagemreebe onome de

identi-açãoaixa-inza(Herbert and Tulleken, 1993; Sjöberg etal.,1995; Bohlin

and Graebe, 1995; Garia, 1997; Jorgensen and Hangos, 1995). Vários

(27)

1993; Eskinat et al., 1993; Lorito, 1998; Wang and Sheu, 2000; Johansen,

2000; Aguirre etal.,2000; Piroddi and Spinelli,2003).

Emmuitos problemas,asinformaçõesauxiliaresutilizadas, sob formade

restriçãoe/oupenalidade,geramproblemasdesobreparametrização(Aguirre

et al., 2000) ou estruturalmente apresenta problema de polarização nos

es-timadores de parâmetros utilizados (Barroso, 2001; Barroso et al., 2002;

Aguirre etal., 2004).

A esolha da informaçãoauxiliar a ser utilizada já é um problema, uma

vez quedepende daapliaçãodomodelo. Porexemplo, muitas vezes

deseja-se queo modelo não apenas reupere aspetos dadinâmia dosistema,mas

também seja apaz de reuperar araterístias emestado estaionário, tais

omo ponto xo, ganho e urva estátia (Grebliki, 1996; Pottmann and

Pearson, 1998; Hippe and Wurmthaler, 1999; Pearson and Pottmann, 2000;

Aguirre et al., 2000; Nepomueno et al., 2003, 2004; Aguirre et al., 2004).

De maneira geral, a reuperação das araterístias dinâmias e estátias

paree onitante. Alguns trabalhos sugerem a apliaçãode métodos

multi-objetivo (Nepomueno, 2002; Nepomueno et al., 2003; Ruano et al., 2003;

Nepomueno etal.,2004; Maertens et al.,2004; Andersonet al.,2005).

1.2 Motivação e Objetivos

Uma grande diuldade na identiação aixa-preta é garantir que os

dados utilizadosna esolha de estrutura eestimação de parâmetros tenham

todas as informações neessárias para que as ferramentas utilizadas sejam

eientes (Tulleken, 1993; Herbert and Tulleken, 1993).

Na prátia,testes para obtenção de dadosde identiaçãoestão

amarra-dos aos limitesoperaionais do sistemaa ser modelado. Emsistemas

indus-triais,porexemplo,nãoédesejávelqueaproduçãosejainterrompidaparase

efetuartestesparaoletade dados. Namaioriadasvezesosinaldeexitação

do sistema é variado em uma pequena faixa de amplitude e freqüênia.

Es-truturas eparâmetros estimados apartir de dados om essas araterístias

sóserãoapazes derepresentar, emgeral,osistemanafaixade operaçãodos

dados (Aguirre,2000).

Nointuitode seontornarafaltadedadosqueabranjamtodosospontos

deinteressedosistema,váriasténiastêmsidoapliadas. Oonjuntodestas

ténias,denominadasdeIdentiaçãoCaixa-Cinza,temomoaraterístia

inorporar onheimento,quenão seenontramdabasede dadosdinâmios,

para ompensar a limitação de informação. Um resumo geral do estado da

(28)

zaminformaçãoauxiliarnaestapadeestrimaçãodosparâmetrosomo

restri-çõese/oupenalidades,éadualidadeajusteestátiodinâmio. Observa-se

que a melhoriana apaidade de reuperação estátia do modelo tem omo

usto a piora da apaidade dinâmia e vie-versa, o que não é um aspeto

atrativonestasténias,umavezqueessasaraterístiasdevemoexistirno

sistemareal. Seessadualidadefortratadaomoumproblemamulti-objetivo

(Johansen,2000), aredita-sepoder utilizaressa formulaçãopara amelhoria

dosresultados(Takahashietal.,1997,2000),umavez queháumtratamento

losoamente diferente, em relação às ténias que utilizam restrições,

se-jam elas na estimação dos parâmetros ou na esolha de estrutura (Barroso

etal.,2002).

As ténias multiobjetivo têm mostrado resultados que, em omparação

om análogos mono-objetivo, são animadores. Sobre dois aspetos as

téni-as multiobjetivo ainda apresentam problemas que mereem a atenção: (i)

métodoparageraçãodosmodelosandidatos,ouonjuntoPareto-ótimo. (ii)

ritério de deisão para esolha do bom modelo, entre os possíveis do

Pa-reto. Em identiação de sistemas, prinipalmente, não se tem ainda ao

ertoumestudosobre ageraçãodos modelosandidatos,noquedizrespeito

àpolarizaçãoeàvariânia. Geralmenteosritériosde deisãobaseiam-seem

alguma medida dos resíduos de identiação (Nepomueno, 2002;

Nepomu-eno et al., 2003; Ruano et al., 2003; Nepomueno et al., 2004; Arroyo and

Armentano, 2005; Lagaros etal., 2005).

Opresentetrabalhotemporobjetivoestudar,pormeiodeexemplos

simu-ladosereais,algunsaspetosdoestimadorbi-objetivotaisomo: polarização,

robustez a ruídoe ritério de deisão.

AsontribuiçõespropostassãoaaraterizaçãodoonjuntoPareto-ótimo

eum ritériode deisão que sejaapaz de esolher o bom modelo.

1.3 Estrutura da Tese

Este trabalhoestá dividido em três partes, a primeiraque diz respeito à

revisão teória e bibliográa sobre identiação de sistemas aixa preta e

do estado da arte emidentiação aixa-inza mono e multiobjetivo. Esses

assuntosestãodivididosem doisapítulos: oapítulo2refere-seà

identia-çãode sistemasaixa-pretapara modelospolinomiaisdisretos. Oapítulo3

apresentadenições preliminares em identiaçãomultiobjetivo e apresenta

oestado daarte emidentiação aixa-inzamono emultiobjetivo.

A segunda parte deste trabalho é dediada às ontribuições propostas.

(29)

desenvolvido e a implementação do deisor. O apítulo 5 apresenta a

a-raterizaçãodoestimadorbi-objetivoproposto eum estudosobreestimativa

não-polarizada.

A tereiraparteéompostade apliaçõesemsistemasreais. Noapítulo

6émostrada aapliaçãoemdois sistemasreais,um sistemade aqueimento

om temperaturavariáveleum onversorDCDC dotipoBuk. Noaso do

onversor Buk, osdados dinâmiosestão limitadosa uma pequenafaixa de

operação, quando omparados aos possíveis pontosde operação do sistema.

Esse exemploreal, éimportantepoisavaliao desempenhodoestimador

pro-posto em asos em que a informação auxiliar agrega informações que não

estão ontidas namassa de dados dinâmios. No apítulo7 será mostrada a

apliaçãoemum sistemade bombeamento mais turbinahidráulia.

Finalmenteno apítulo8 serão feitas as onsiderações nais sobre o

(30)

(31)

(32)

(33)

Identiação de Sistemas

Não-Lineares

2.1 Introdução

Emseuprinípio,aidentiaçãodesistemaserafeitaassumindoa

lineari-dadedossistemasaseremestudados. Essaaproximaçãoeraonsideradaboa

umavezquehaviasigniativasrestriçõesteóriaseomputaionais. Muitos

regimes dinâmios, entretanto, não podem ser araterizados por

aproxima-çõeslineares. Dentre estes regimes dinâmiospodem-se itar asbifurações,

bilinearidades,os ilos limites,aos entre outros.

Muitos trabalhos durante as últimas déadas foram publiados om a

esperançadesoluionaroumesmodisutirosproblemasdeidentiação

não-linear (Billings and Fadzil, 1985; Aström and Eykho, 1971; Akaike, 1974;

Billingsand Voon, 1984).

Oobjetivodesteapítuloéfazerumabreverevisãodaliteraturaarespeito

de identiaçãoaixa-pretade sistemasnão-lineares.

2.2 Identiação de Sistemas

Oproblemadeidentiaçãodesistemaspodeserdivididonasinoetapas

prinipaisdesritas a seguir (Ljung, 1987):

obtençãodedadosdeexperimentaçãodosistemaquesedesejamodelar;

apliaçãodetestesaosdadosobtidosparadeteçãodenão-linearidades;

(34)

estimação dos parâmetros domodelo;

validaçãodomodelo obtido.

Essas etapas são omuns tanto para sistemas lineares quanto para

sis-temas não-lineares. Nas seções seguintes será feito um breve omentário a

respeito dessas etapasom indiaçõesdabibliograa reomendada.

2.3 Experimentação do Sistema

Nestaprimeiraetapadeve-seonsiderarosistemaaserestudadoe

submetê-loa entradas predeterminadas,observando-se assaídas orrespondentes. Os

dados medidos de saída do sistema, onheidos omo dados de

identia-ção, deverão ser usados na deteção da não-linearidade e na estimação de

parâmetros domodelo esolhido.

É desejável que os sinais de exitação do sistema tenham um espetro

de freqüênias que venha a exitar persistentementea dinâmiade interesse

dosistema. Noaso de sistemasnão-lineares, issorequer que osefeitos

não-linearessejamexitadosporesses sinaiseassim estejampresentes nos dados

de identiação (Aguirre, 2000). Em sistemas não-lineares, uma pequena

variaçãonaamplitude do sinalde entradapode provoar mudanças

qualita-tivasnoomportamentodinâmiodos mesmos. Outroaspeto importanteé

aesolha dotempode amostragemdos dados de identiação.

Um proedimento muito utilizado para a esolha do melhor tempo de

amostragem dos dados de identiação é a análise da autoorrelação linear

y 0

(2.1) e não-linear (2.2)

y 2 0 y 2 0

do sinal desejado (Aguirre and Billings,

1995) y 0 y 0

()=E [(y(k) y(k))(y(k ) y(k))℄; (2.1)

y 2 0 y 2 0

()=E[(y 2

(k) y 2

(k))(y 2

(k ) y 2

(k))℄; (2.2)

em que y(k) e y 2

(k) representam os valores médios e o apóstrofe ( 0

), neste

aso, india que a média foi extraída dos sinais. Com base nas funções de

autoorrelaçãodesritas aimapode-se hegar àseguinteonstante:

m =minf y 0 ; y 2 0 g; (2.3) emque y 0

éo instante doprimeiromínimo de

y 0

() e

y 2

0

é oinstantedo

primeiromínimode

y 2 0 y 2 0 ().

(35)

m

25

s

m

5

: (2.4)

Então, se o sinal om amostragem estiverdentro dafaixa estabeleida

aima, o sinal pode ser utilizado. Caso ontrário, se o sinal estiver violando

o limite superior de (2.4), então faz-se neessário deimar os sinais até que

estes se enontrem dentro da faixa. Caso o sinal viole a restrição inferior,

será neessário repetir o teste usando-se uma maior taxa de amostragem na

aquisição dos dados.

2.4 Deteção de Não-Linearidades

Os dados de identiação devem passar por proessos de deteção de

não-linearidades. Esses testes veriam, dentro de um limite de onança

pré-determinado, se o sistema possui algumas araterístias próprias dos

sistemaslineares. Casonãosejamveriadasessaspropriedades,éneessário

então a utilizaçãode modelos não-lineares para aproximarasaraterístias

domesmo.

Porexemplo, a relaçãoabaixo (Billingsand Voon, 1983,1986)

y 2

0

y 2

0

()=E[(y 2

(k) y 2

(k))(y 2

(k ) y 2

(k))℄=0 8 (2.5)

é válida se o sistema for linear. Um intervalo delimitaa região de onança

dentrodaqual afunção de orrelaçãopode ser onsideradanula. Oslimites

deste intervalo em 95% são dados por: 1;96= p

N, em que N é o

ompri-mento do registro de dados disponível. É reomendável que o sistema que

gerou taisdados de identiaçãoseja representado pormodelos não-lineares

sea função de orrelação aimaestiver fora dareferida regiãode onança.

2.5 Esolha de Representação e de Estrutura

Na modelagem de sistemas não-lineares um dos passos importantes é a

esolha dos modelos que irãorepresentar osistema em estudo,uma vez que

existe umagrande diversidade de não-linearidadesdistintas. Omodelo

eso-lhidodevesersuientementerioparapoderrepresentarasnão-linearidades

mas, aomesmo tempo,simples.

Neste trabalho, foramutilizadososmodelos não-linearesauto-regressivas

omentradaexógenaonheidospelasiglaeminglêsNARX(non-linear

auto-regressive with exogenous inputs), que são estruturas paramétrias do tipo

(36)

siste-Um modelo NARX om período de amostragem normalizadoé

(Leonta-ritisand Billings,1985a,b;Billings and Chen,1989):

y(k) = F `

[y(k 1);y(k 2);:::;y(k n

y

);u(k d 1);:::

(2.6)

:::;u(k d n

u

)℄+e(k);

sendo k = 1;:::;N. F `

é uma função não-linear qualquer, y(k) e u(k) são,

respetivamente, saída e entrada dosistema, que têm seus atrasos

represen-tados por n

y e n

u

, respetivamente. d representa o tempo de retardo do

sistemaee(k)representainertezas. Ostermosy(k i),om (i=1; ;n

y )

eu(k d j), om (j =1;;n

u)

são hamados de regressores de proesso

domodelo.

Nestetrabalho,F `

seráumafunçãopolinomialomgraudenão-linearidade

`, omo denida a seguir:

y(k) = o + n X i1 i1 x i1 + n X i1 n X i2 i1 i2 x i1 (k)x i2

(k)+:::+

(2.7) + n X i 1 ::: n X i 1 =i ` 1 i 1 :::i l

x(k):::+x

i

l

(t)+e(t);

sendo

x

1

(k)=y(k 1); x

2

(k)=y(k 2); ;x

ny+1

=u(k d 1); ;

x

n

(k)=u(k d n

e

): n=n

y +n u : Os 0

s são osparâmetros quedeverão ser estimados para queaestrutura

esolhida para o modelo possa se ajustar à janela de dados utilizada na

estimação. É esperado também que o modelo não só se ajuste aos dados,

mas prinipalmentequeelepossa reproduziradinâmiaoriginaldosistema.

Apesar deserimpossíveldeniramelhorrepresentaçãoemtermosgerais,

podem-se destaar algumasvantagensdos modelos polinomiaissobre outras

representações. ÉpossívelobtermodelosNARXpolinomiaisqueajustemaos

dados de identiação om boa exatidão, ontanto que não haja uma

varia-ção muitobrusa, evitandouma taxade variaçãomuito elevada. Alémdisso

o modelo NARX polinomial pode ser transformado em uma representação

linear xando-se o ponto de operação do sistema, ou seja, obtendo-se uma

linearização domodelo. Outravantagem é afailidade de se obter

(37)

As funções não-lineares polinomiais são lineares nos parâmetros, o que

permiteautilizaçãode algoritmosdeestimaçãode parâmetrosparasistemas

lineares (Billings and Voon, 1984; Chen et al., 1989). Esses algoritmos de

estimaçãosãofáeisdeimplementar,onvergemrapidamenteejáforam

estu-dadosemum vasto númerodetrabalhos (Davisand Vinter,1985;Korenberg

etal., 1988; Chenet al.,1989; Aström and Witternmark, 1990).

2.5.1 Deteção de estrutura

O grau de não-linearidade é um dos fatores que vai denir o número de

termos andidatos, ou seja, termos possíveis nos modelos polinomiais. O

aumento no grau de não-linearidade` e dos máximos atrasos n

y e n

u ,

pro-voamum aumentosigniativononúmerode termosandidatosnomodelo

polinomial.

O número de termos rapidamentese torna demasiadamentegrande para

modelos polinomiais. Mas o problema não é tão rítio omo em outras

representações. Nas séries de Volterra, por exemplo, o número de termos

pode failmentehegar a 10 10

para sistemas relativamentesimples (Billings,

1980). Embora o número de termos andidatos do modelo polinomial seja

muito grande, em muitos asos, apenas um pequeno número desses termos

é suiente para aproximara dinâmia doproesso. É desejável a obtenção

de uma representação parimoniosa, garantindo que os termos importantes

sejamlevadosemontaedesartandosóostermosquenãoontribuampara

a dinâmia do sistema. O proedimento para a esolha dos termos a serem

inluídos no modelo é hamado de deteção de estrutura. Neste apítulo

serão apresentados os ritérios lássios para deteção de estrutura. Em

(Corrêa, 2001; Barroso, 2001)os autoresapresentam duas ténias baseadas

emonheimentos auxiliares aos dadosde identiação, sendoestas ténias

não estatístias.

2.5.2 Deteção de estrutura utilizando ERR

A taxa de redução de erro (error redution ratio) ou ERR (Billings and

Chen, 1989) assoia a ada termo andidato um índie orrespondente à

ontribuiçãodeste naexpliação davariânia dos dados de saída.

Paraverissodeformamatemátia,primeirodene-se avariâniadoerro

de modelagem (k)omo sendo:

Varf(k)g= lim

N!1 1

n "

y T

y n

X

g 2

i w

T

i w

i #

(38)

emqueg

i

indiaoselementosdovetordeparâmetrosgew

i

indiaregressores

ortogonais ey é ovetor ontendo osdados de saída. 1

Supondoquenenhum termofossearesentadoaomodelo,avariâniade

(k)seriaigualaoerroquadrátiodasaíday(k). Aadatermoaresentado,

avariâniade (k)deresede umfatoriguala 1 N (g 2 i w t i w i

),emquew

i

india

o termo inluído e g

i

o seu respetivo parâmetro. A redução no valor da

variânia pode ser normalizada om relação ao erro quadrátio médio do

sinal de saída. Assim, o ERRde ada termo édenido omosendo:

[ER R ℄= (g 2 i w T i w i ) y T y : (2.9)

O ERR pode ser utilizado na deteção de estrutura de modelos

polino-miais. Esolhe-se o número de termos desejado, através de uma ferramenta

auxiliar,oritério de Akaike, porexemplo,e onsideram-seaquelesque

pos-suíremos maioresvaloresde ERR.

2.5.3 Critério de informação de Akaike

Um proedimentopara adeterminação donúmero de termos de um

mo-delo é o ritério de informação. O método utilizado neste trabalho para

estimaro número de termos que deve ser inluído nomodelo éo ritério de

Akaike(AIC).Deaordoomestemétodo,onúmerodetermosdeummodelo

deve minimizarafunção usto J,que se apresenta da seguintemaneira:

J =Nlog(Varf(k)g)+2n

p

; (2.10)

sendo N o omprimento do registro de dados e n

p

o número de parâmetros

no modelo. Esse ritério estabelee um ompromisso entre a qualidade dos

ajustes de identiação, ontida no primeiro termo da equação e a proura

porrepresentações parimoniosas,revelada pelo segundo termo.

O número de termos determinado a partir do AIC minimiza a variânia

dosresíduosdeidentiaçãopartindodeumaestruturapreviamenteajustada

por um ritério de seleção de estrutura. Contudo, não se pode armar que

o número de termos seleionados torne o modelo apaz de reproduzir as

propriedades dinâmias do sistema original (Aguirre, 1994). O resultado

obtido através do AIC pode ser visto omo um indiativo na proura do

número ideal de termos domodelo.

1

EmAguirre(2004),oautordesreveumalgoritmobaseadonatransformaçãode

(39)

2.6 Agrupamentos de Termos e Coeientes de

Agrupamentos

O modelo NARX (2.6) denido na seção (2.5) pode ser reesrito omo:

y(k)= ` X m=0 m X p=0 n y ;n u X n 1 ;n m p;m p i=1 Y P y(k n i ) i=p+1 Y m u(k n i ); (2.11) sendo ny;nu X n1;nm ny X n ` =1 ny X nm : (2.12)

Osmonmiosdaequação(2.11)são agrupados deaordo omsua ordem

m (0 m `), sendo ` o grau de não-linearidade do modelo. Cada termo

de ordem m ontém fatores multipliativos em y(k i) e (m p) fatores

multipliativosemu(k j). Osparâmetrosdestes termos são representados

por

p;m p (n

` ;:::;n

m

),nosquais(n

` ;:::;n

m

)indiamosatrasosde adafator

onstituintedo monmioonsiderado.

O primeiro somatórioda equação (2.11) faz referênia aos monmiosda

equação(2.6),separando-osde aordoomsua ordem. Osegundo somatório

fazreferêniaaonúmerodefatoresemy(k i)notermoonsiderado. Dentro

do onjunto de termos de ordem m, um termo qualquer pode ser aessado

através do ajuste do valor de p adequado. Por m, o último somatório

permite queseja feitaadistinçãoentre ostermosde (2.6),atravésdoajuste

dos atrasos de ada um dos fatores onstituintes do termo.

Analisando-seomodeloemestadoestaionárioparaentradasonstantes,

tem-se

y(k 1) = y(k 2)==y(k n

y )

(2.13)

u(k 1) = u(k 2)==u(k n

u );

apliando (2.13) naequação (2.11),hega-sea

y(k)= ny;nu X n;n m p;m p (n ` ;:::;n

(40)

Oonjuntode termosdaformay(k i) p

u(k j) m p

édenominado

agru-pamento de termos (Aguirre and Billings, 1995). Esses serão representados

por

y p

u

m p. A onstante

n y ;n u X n ` ;nm p;m p (n ` ;:::;n

m )

éooeientedoagrupamentode termosy(k 1) p

u(k 1) m p

e será

repre-sentadopor P y p u m p

. Todosostermospertenentesaumdadoagrupamento

de termos expliamo mesmo tipode não-linearidadenomodelo.

2.6.1 Agrupamento espúrio em modelos polinomiais

Os modelos NARX polinomiais são bastantesensíveis à

sobreparametri-zação de sua estrutura (Mendes and Billings, 1998; Aguirre and Billings,

1995). Assim, um modelo que ontenha termos que não estejam dentro dos

agrupamentos efetivos pode apresentar regimes dinâmiosespúrios, ou seja,

regimesdinâmiosque não sejamexibidos pelosistema real.

A importâniade um agrupamento de termos pode ser quantiada

pe-losseus oeientes (Aguirre, 1995). Agrupamentosde termos quepossuem

oeientes nulos podem indiar que aqueles agrupamentos não ontribuem

em nada para o modelo. Ou, se o oeiente de algum agrupamento tiver

o seu valor muito menor quedos agrupamentos efetivos, esse provavelmente

pode ser desartado. Osagrupamentosnão efetivos ouapresentam variação

de sinal dos seus oeientes em relação ao número de termos inluídos no

modelo ou sua amplitude é insigniante omparada a outros

agrupamen-tos. Embora essas análisessejamrelevantes, nem sempreseus resultadossão

determinantes parasedesartarum agrupamentode termos. Omodelo

poli-nomial,identiadoapartirdaanálisedos agrupamentosde termosefetivos,

tem melhores hanesde reproduzir asdinâmiasdos sistemasque sedeseja

estudar.

2.7 Pontos Fixos em Sistemas Autnomos

Pontos xos deum sistemadisretoautnomo são ospontosde operação

queapresentam aseguintearaterístia:

y(k)=y(k+i); 8i 2Z +

: (2.15)

Sistemasdinâmioslinearesapresentamapenasumpontoxotrivial. Em

(41)

não-úbia emy (variável de saída), esse deve apresentar 3 pontos de equilíbrio,

ouseja, três pontos de operação nasaída do sistema.

OspontosxospodemserobtidosapartirdemodelosNARXpolinomiais

atravésdooneito deagrupamentosde termoseoeientes de

agrupamen-tos(Aguirre, 1996) resolvendo aseguinteequação polinomial:

y ` y(k) ` ++ y 2 y(k) 2 +( y

1)y(k)+

0

=0; (2.16)

sendoque

0

éotermoonstantedomodelo. Omodeloapresentará `pontos

de operação nasaída se o termo

y

` 6=0. Os pontos xos domodelo são os

valores que zerama equação (2.16).

2.7.1 Pontos xos em sistemas não autnomos

Um modeloNARX não autnomo analisadoemestadoestaionário para

entrada onstantepode ser esritoomo segue:

y(k)= ny;nu X n1;n m` p;m` p (n `

; ;n

m` ) ` X m`=0 m` X p=0 y(k) p u(k) m` p ; (2.17)

sendoquem`orrespondeaograudenãolinearidadedeadatermoeestána

faixa 1m``. Cada termo de grau m` pode onter um fator dos termos

y(k) de ordem p, um fator em u(k) de ordem (m` p) e um oeiente

p;m` p (n

`

; ;n

m` ).

Para melhorompreensão, aequação (2.17) pode ser reesrita omo:

y `y ` + P ` m`=` 1 [ u

m` (` 1)

y ` 1

u

m` (` 1)

℄y ` 1 + + P ` m`=p [ u m` p y pu m` p ℄y p + + P ` m`=1 [ u m` 1 y u m` 1 1℄y + + P ` m`=1 u m`u m` + 0 =0: (2.18)

Pode-se notar que asloalizaçõesdos pontosxos dependem dos valores

de entrada (onstante) do sistema, ou seja, essas variam om o patamardo

sinaldeexitação. Essasequaçõespassamaterafunção deummapeamento

que leva u a um valor determinado para y. Os valores gerados por estes

mapeamentosaraterizamuma urva estátiapara osistema. Então, dessa

forma, a função estátia de sistemas não autnomos pode ser estimada a

partir de modelos dinâmios. Nesse aso os oneitos de agrupamentos de

(42)

quandoemestadopermanente, emoutraspalavras,desreve aaraterístia

estátiado sistema.

Osoeientes de agrupamentospodemser esritosemfunção dos

parâ-metrosdo modelo daseguinte forma:

S =

x

; (2.19)

sendo que a matriz S mapeia para

x

. é o vetor dos parâmetros do

modelo NARX polinomiale

x

é ovetor dos oeientes dos agrupamentos

de termos domodelo.

Ainda, pode-se esrever a função estátia y = f(u;y) (2.17), de forma

matriialdaseguintemaneira:

y=[y

0 u 0 y 1 u 0 y p u m p ℄(S): (2.20)

Chamandoa matriz [y 0 u 0 y 1 u 0 y p u m p

℄ de E, tem-se que

y=E(S): (2.21)

Aapresentaçãomatriialapresentadaatravésdaequação(2.21)serámuito

importanteparaodesenvolvimentodotrabalho,prinipalmentepara a

ons-truçãometodológiado trabalho.

2.8 O Ganho Estátio

Nesta seçãoseráutilizadoooneitode agrupamentode termosede

oe-ientede agrupamentoparadeterminarumaequaçãoparaoganhoestátio.

Esta aproximaçãoé equivalenteà utilizaçãodoteoremadovalornalpara a

resposta ao degrauom amplitude nal u. Conformevisto na seção (2.7.1),

omodelo NARX polinomialpode ser esrito daseguinteforma:

y= 0 + y y+ u u+ l 1 X m=1 ` m X p=1 y p u m y p u m + ` X p=2 y p y p + ` X m=2 u m u m ; (2.22)

sendo que os termos de proesso e seus respetivos parâmetros foram

agru-pados daseguinte forma:

termo onstante :

0

termos lineares emy :

y y

(43)

termosruzados : P ` 1 m=1 P ` m p=1 y p u m y p u m

termosnão-lineares emy : P ` i=1 y iy i

termosnão-lineares emu : P l i=1 u i u i .

Dessa maneirao ganho estátiopode ser alulado por:

^

K(y;u)= y u = 0 u + u + P ` m=2 u m u m 1 1 y P ` 1 m=1 P ` m p=1 y p u m y (p 1) u m P ` p=2 y p y (p 1) : (2.23)

2.9 Estimação de Parâmetros

Uma vez esolhida aestrutura de um modelo, deve-se estimar seus

parâ-metrosparaqueomodelopossaseaproximardoomportamentodinâmiodo

sistemaoriginal. Issoénormalmentefeitoemmodelospolinomiais

apliando-seténias de mínimos quadrados (MQ) aos dadosde identiação.

Considere uma estrutura polinomialomo:

y(k)= n X i=l p i (k) i

+e(k); (2.24)

os regressores do modelo, p

i

(k), orrespondem aos diferentes termos no

po-linmioe os 0

i

s são os respetivosparâmetros.

Esrevendo a equação (2.24)na formade erro de predição, tem-se:

y(k)= n X i=l p i ^ i +(k; ^ ); (2.25) sendo n X i=l p i ^ i

=y(k;^ ^

); (2.26)

sendoqueosímbolo(^)sobreasvariáveisfazreferêniaavalores estimados.

Oresíduo de identiação(k; ^

) édenido omo:

(44)

O vetor de resíduos f(k), k = 1; ;Ng representa os erros de

mode-lagem, ruído do sistema e/ou qualquer inerteza. A equação (2.26) é

deno-minada preditor de um passo à frente e y(k;^ ^

) é a predição de um passo à

frentede y(k).

Os parâmetros são estimados de modo a minimizar um índie de

de-sempenho estabeleido previamente. Considere a função usto (Aström and

Witternmark, 1990): J N ()= 1 N N X k=1 f(); (2.28)

sendo f() uma função matemátiagenéria.

Os parâmetros estimados serão diferentes para ada f() onsiderado.

Utilizando-se f = 2

, tem-se o hamado método de mínimos quadrados.

Nesse aso o índie de desempenho (ou função usto) passa a ser:

J N ()= 1 N N X k=1 (k;) 2 ; (2.29)

que deverá ser minimizado para determinar o onjunto de parâmetros

or-respondente.

Representando aequação (2.25) emnotação matriial:

y= ^ + ~ ; (2.30) sendo

y = [y(1) y(2) y(N)℄ T

~

= [(1) (2) (N)℄ T ; (2.31) = 2 6 6 6 4 p 1 (1) p 2

(1) p

n (1) p 1 (2) p 2

(2) p

n (2) . . . . . . . . . . . . p 1

(N) p

2

(N) p

n (N) 3 7 7 7 5 ; (2.32) = [ 1 2 n ℄ T : (2.33)

(45)

2.9.1 Propriedades Estatístias do Estimador de

Míni-mos Quadrados

Partindo da propriedade de onvexidade da função usto (2.29), sua

so-lução ótima,pode ser obtidada seguinte forma:

J

N ()

=0: (2.34)

Resolvendo o lado direitoda equação(2.34) tem-se:

T T

y=0: (2.35)

Ovetor de parâmetros quesatisfaz a relação(2.35) é

^ MQ =( T ) 1 T y; (2.36)

que tem soluçãoúnia, se esomentese, T

fornão-singular.

Édesejadoqueasolução(2.36)sejanãopolarizada,ouseja,Ef ^

MQ g=,

sendoovetordeparâmetrosreais dosistemaeEfgooperadoresperança

matemátia.

Observa-se que Ef ^

MQ

g = Ef( T

) 1 T

yg. Se y for esrito omo

y= +e, pode-se reesrever aequação anterior omo:

E f ^

MQ

g=Ef( T

) 1 T

( +e)g: (2.37)

Pelapropriedadeassoiativadooperadoresperançamatemátia Efg,

pode-sereesrever aequação (2.37) omo:

Ef ^

MQ

g=Ef( T

) 1 T

g+Ef( T

) 1

eg: (2.38)

Para que E f ^

MQ

g= seja respeitado, observa-se daequação (2.38) que

Ef( T

) 1

eg =0. Se o erro e for ruído brano, o vetor ^

estimado por

MQ representa a melhor estimativa não-polarizada de sendo y^ T

e =0, ou

seja, taisvetores são ortogonais.

Para ompreender apropriedade de ortogonalidade dos MQ éneessário

onsiderar primeiramenteas seguintes relações: y^ = ^

e =(y y )^ ^e. 2

Com isso, tem-se que:

^ y T = ^ T T (y ^ ) = y T ( [ T ℄ 1 T

y [

T ℄ 1 T y) = y T ( [ T ℄ 1 T [ T ℄ 1 T )y = 0: 2

(46)

mo-Como dois vetores ujo produto interno é zero são ortogonais, diz-se que o

vetor de saídaestimadoeovetorde resíduosdomodelo sãotambém

ortogo-nais. Existemmétodosdeestimaçãodeparâmetrosquegarantemaobtenção

de estimativasnão-polarizadasmesmo quando o vetor de resíduose o vetor

de saída domodelosejam não ortogonais (Aguirre,2004).

2.9.2 Mínimos quadrados estendidos

Como dito na seção anterior, a polarização no estimador MQ surge do

fatodeexistirorrelaçãonovetorderesíduoseexistiremregressoresdaforma

y(k i)nomodelo. Esse fatolevaàorrelação damatrizde regressoresom

e(k). Se no modelo só existirem regressores da entrada (termos do tipo

u(k i)), o fatode não haver orrelação emk 6=0não induz polarizaçãono

estimador.

Se os resíduos de identiação forem modelados omo um proesso de

médiamóvel,da seguinte maneira,

e(k)=

i

(k i)+(k); (2.39)

sendo(k)ruídobrano,ostermos(k i)podemser inorporadosàmatriz

de regressores e os seus respetivos parâmetros ao vetor de parâmetros do

modelo daseguinte forma:

y = +e ; (2.40)

sendo quey

=y,e

=[(k)(k+N 1)℄ T , = 2 6 6 6 6 6 6 6 4 . .

. (k 1)

.

. (k)

.

. (k+1)

. . . . . . . .

. (k+N 2) 3 7 7 7 7 7 7 7 5 (2.41) e =[ . . . i ℄ T

. Aparteparametrizadapor

i

daequação (2.39)foi

inorpo-rada à matriz de regressores. Por este motivo,pode-se notar que e

éruído

brano, de forma que em (2.40) o termo e

é não-orrelaionado om

.

Logo a estimativapor (MQ)

(47)

Um uidado deve ser tomado om os termos de ruído no modelo: de

maneira prátia, o ruído é modelado apenas om o intuito de se evitar a

polarizaçãodomodeloNARXpolinomial. Omodelonaldeveonterapenas

termos de proesso e aparte estoástia deveser desprezada.

Modelos om termos de ruído estimados por MQE reebem o nome de

modelosNARMAX,dasiglaeminglês(nonlinearautoregressive withmoving

average and exogenous input).

Evidentemente, (2.42) não pode ser alulado omo mostrado, pois

inlui regressores do tipo (k i), que não são medidos. A m de resolver

este problema, taisregressores preisamser estimados. Quando issoé feito,

o resultado é um proesso iterativo que é equivalente a resolver (2.42). Em

Aguirre (2004) oautor desreve um algoritmoiterativopara a estimação de

(k) daseguinteforma:

1. apartirdaequaçãode regressãoy(k)= T

(k 1)+e(k)edos dados

disponíveis, monte a equação matriialy = +e, omo no método

de mínimos quadrados, e determine ^ MQ =[ T ℄ 1 T y;

2. aluleo vetor de resíduos

i =y ^ MQ ;

3. façai=2 (iindia o númerode iterações);

4. om

i 1

,monteamatrizestendidaderegressores,

i

,eestime ^ MQE = ( i T i ) 1 i T y;

5. determine ovetor de resíduos

i =y i ^ MQE i ;

6. façai=i+1e volte aopasso 4. Repita até onvergir.

Para veriar a onvergênia, pode-se veriar a variânia dos resíduos

oudos parâmetrosestimados em ada iteração.

Lembrando-se que, para a simulação do modelo, deve-se desprezar os

termos de ruído domodelo.

2.9.3 Regularização

Quando a estrutura do modelo não é adequada para representar o

sis-tema ou o onjunto disponível de dados não é suientemente informativo,

o problema de identiação de parâmetro pode ser mal-ondiionado. Se

métodos de minimizaçãode erro de predição foremusados para a estimação

dos parâmetros,os resultados nãoserão apropriados,poispodemapresentar

(48)

pro-prediçãonãoérobustoemtaisasos. Existempelomenosduasaproximações

gerais para soluionar oproblema:

o desenvolvimento de uma estrutura alternativa para o modelo om

menos graus de liberdade e assim obter uma parameterização mais

adequadaaos dados;

regularizar o algoritmo de identiação introduzindo restrições e/ou

penalidades para atrair os graus exessivos de liberdade para valores

razoáveis(Tikhonov and Arsenin, 1977;Johansen, 1996, 1997).

Noque dizrespeito ao primeiroitem aima,neste trabalhoserá onsiderado

queoproblemadaestruturajáestáresolvidoenãoseráalvodedisussões. O

problemadesobre-parametrizaçãojáfoidisutidoemmuitostrabalhos,omo

referêniapode-seitar(BillingsandVoon,1983;Aguirre,1994;Aguirreand

Billings, 1995; Mao and Billings, 1997; Mendes and Billings, 1998; Piroddi

and Spinelli,2003).

No que diz respeito ao segundo ítem, o problema pode ser esrito omo

(Hastie etal.,2001):

min

f2H "

N

X

i=1 L(y

i ;f(x

i

))+J(f) #

(2.43)

sendo que L(y

i ;f(x

i

)) é uma função usto, J(f) é uma penalidade imposta

àL() eH é o espaçoem queJ(f)é denido.

Demaneirageral,aesolhadeJ(f)eadeterminaçãoótimadoparâmetro

deregularizaçãosãoosprinipaisalvosde estudosemregularização. Entre

osmétodosde regularizaçãopode-se destaar osmétodos de GaussNewton,

Tikhonov, Fourier, Lagrangiana e Bayesiana. Como referênia pode-se

i-tar os reentes trabalhos a seguir: (Li and Yang, 2000; Roths et al., 2001;

Sugiyama and Ogawa, 2002; Hagiwara, 2002; kumar et al.,2004; Merbouha

and Mkhadri, 2004; Pan and Li, 2004; Hilgers and Bertram, 2004; Fu etal.,

2005a,b;BoyadjievandDimitrova,2005;Chen,2006). Essesartigos

apresen-tam novos resultados e uma revisão bibliográae teória abrangentesobre

regularização. Apenasparadeixarlaro,oestudodaregularizaçãonãoéalvo

de estudos deste trabalho, no entanto, será útilpara algumas disussões no

apítulo5.

2.10 Validação do Modelo

(49)

polari-domodelo. Por essa razão,faz-se neessária a utilizaçãode um ritério para

determinar seo modelo responde àsaraterístias quelhe são exigidas. No

ontexto deste trabalho, são onsideradosdois ritérios:

1. predição innitospassos à frente (simulaçãolivre);

2. apaidade de representar o omportamentoestátiodosistema.

Outramaneirade veriaravalidadedinâmiadomodeloéousode funções

de orrelação. Essas funções podem ser apliadas aos resíduos para a

veri-ação de orrelação linear e não-linear. Se os resíduos possuírem alguma

orrelação, o modelo será onsiderado polarizado, uma vez que existem

evi-dêniasde dinâmiasnãomodeladasontidasnosresíduos. Outrostestessão

as orrelaçõesruzadas, lineares e não-lineares, entre os resíduos e os dados

de entrada e saída dosistema (Box and Jenkins, 1976; Ljung,1987; Billings

and Voon, 1983, 1986).

2.11 Comentários Finais

Esse apítulotemomo prinipalobjetivofamiliarizaroleitorom

téni-as gerais emidentiaçãode sistemasnão-lineares.

Essas ténias são a base de todo um onjunto de novas ténias que

foram e estão sendo desenvolvidas para tornarem osmodelos ada vez mais

(50)

(51)

Identiação Multi-objetivo

Este apítulo tem omo objetivo denir o Problema Multiobjetivo, suas

etapas,esuasimpliaçõesnaidentiaçãode sistemas,atravésdeum revisão

teóriabásiaeatravésde um estudodoestadodaarte. Seráfeitauma

revi-são bibliográa a respeito de identiação aixa-inza envolvendo ténias

mono-objetivoe multiobjetivo.

3.1 O Problema Multiobjetivo

Se em um problema de otimização qualquer estiverem disponíveis mais

de um objetivo que sedeseja alançar, haverá, de formageral, dois tiposde

solução:

1. Haverá soluções que, sob todos os objetivos simultaneamente

onside-rados, serão suplantadas poroutras soluções;

2. Haverá soluções que,omparadas om outras soluções, serão melhores

emalgumoualgunsobjetivos,maspioresemoutroououtrosobjetivos.

No segundo aso, as soluções são denominadasSoluções eientesou

so-luções Pareto-ótimas. A determinação desse onjunto é uma das prinipais

etapasdoProblemaMultiobjetivo. Aprinípionão existeumasoluçãoúnia

que simultaneamente minimize todas as diferentes funções-objetivo. Esse

tipo de problema tende a possuir um onjunto limitado om innitas

solu-ções. No entanto, de alguma forma, deve-se esolher um únia solução. O

onjunto Pareto-Ótimo é onstituído de soluções andidatas a se tornarem

essa solução únia.

A esolha de uma solução únia éuma etapaimportante, naqual o

on-juntodesoluções-andidatasdeveserreduzidoatéadeterminaçãodessa

(52)

de busa da melhor solução, supondo a existênia de uma função utilidade,

queexibeum padrão de preferênias oerente eordenado.

OProblemamultiobjetivopode então ser formuladoomouma

ombina-ção dessas etapasde obtenção doPareto-ótimo edaesolha dasoluçãonal

(ou etapa de deisão) através daapliaçãodafunção utilidade.

3.2 Formulação do Problema Multiobjetivo

Nasduasseçõesseguintesapresenta-seaformulaçãodasetapasenvolvidas

noProblemade OtimizaçãoMultiobjetivo.

3.2.1 Determinação das Soluções Eientes

Considere o vetor de funções-objetivo:

J()= 2 6 6 6 4 J 1 ( ^ ) J 2 ( ^ ) . . . J m ( ^ ) 3 7 7 7 5 T ; (3.1)

De maneira geral, não existe uma solução únia que minimize

simultanea-menteasmfunções-objetivo. Comisso, um grandenúmerodesoluçõespode

ser enontrado, araterizando assim o onjunto Pareto-ótimo (Chankong

and Haimes, 1983):

^ 2 ^ ,f ^ : J( ^

)J( ^

) eJ( ^

)6=J( ^ )g; (3.2) em que ^

é o onjunto de parâmetros estimados e ^

é o espaço de

parâ-metros. As relaçõesde omparação entre os vetores são denidas omo:

x z , x

i z

i

;8i21;:::;n

x 6=z , 9 i21;:::;n j x

i 6=z

i ;

(3.3)

sendo que x

i e z

i

são omponentes dos vetores x;z 2 R n

. A solução será

eiente se e somente se não existir uma outra solução que melhore um

dos objetivos sem a degradação de pelo menos outro objetivo. Em outras

(53)

3.2.2 Etapa de Deisão

Nessa etapaproura-seumaúniasoluçãoquesatisfaçauma função

utili-dade quedeve ser denida partindode uma sistemátia de apresentação das

alternativasque garanta que:

1. Onúmerodeonsultasaodeisor(humanoouautomátio)seráomenor

possível;

2. Apresentação de um número de alternativasao deisorseja inteligível;

3. A melhor soluçãonão será perdida. O enadeamentodessas etapas de

deisãoonduz a diferentes estruturas para omeanismo de deisão.

Emumaso,em queháintervençãode umdeisorhumano,basiamente,

pode-seseguir uma das seguintes possibilidades:

Apresentação de preferênias aposteriori.

Neste aso, será determinado um onjunto de soluções que seja

re-presentativo de todo o onjunto de soluções eientes antes de iniiar

qualquer interaçãoom odeisorhumano. Aestrutura das onsultas é

formuladapartindodapremissadequeaspossíveissoluçõesjátiveram

suas funções objetivopreviamente avaliadas;

Apresentação de preferênias progressivas.

Agora,aonsultaaodeisoréfeitaonomitantementeom oproesso

de determinação de soluções eientes. Cada onsulta ao deisor é

utilizada para determinar os parâmetros de uma nova busa de um

ponto pertenente ao onjunto de soluçõeseientes;

Apresentação de preferênias apriori.

Neste esquema, o deisor é previamente onsultado, e formula uma

erta estrutura de preferênias que não depende do onheimento das

alternativasonretasquevieremaseoloar. Estasituaçãonão

ara-terizapropriamenteumproblemamultiobjetivo,podendoserentendida

omo um aso de otimização mono-objetivo. No entanto, esta é uma

formade agregar múltiplos objetivosem um problema de otimização.

No aso deste trabalho, pretende-se desenvolver um deisor automátio,

sem intervenção de um deisorhumano. Assim, pretende-se queesse deisor

automátioseja apazde esolher omelhormodelo (épreisodeniro queé

(54)

3.3 Estado da Arte

Devidoaofatodequemuitossistemasapresentamalgumtipode

ompor-tamento não-linear, faz-se neessário o desenvolvimento de ténias

identi-açãode sistemas,proessamento de sinais, ténias de ontrole e análisede

sistemas que sejamapliáveis a essas situações(Billings, 1980). Estudos

in-luemredesneuraisapliadosaestesproblemas(Bragaetal.,2000). Embora

redes neurais tenham exelentes propriedades, a obtenção de informação a

partir de sua estrutura é difíil, devido à sua omplexidade (Corrêa, 2001).

Isso pode não ser relevante em apliações omo predição de séries

tempo-raise reonheimento de padrões, mas é uma onsiderável desvantagem em

engenharia e apliações ientías, em que é importante entender, analisar

e simular os meanismos que produzem a relação entre ausa e efeito das

entradas esaídas do sistema(Eykho, 1981).

Os modelos NARMAX polinomiais eraionais (Leontaritis and Billings,

1985a,b;Chen etal., 1989) são uma alternativa às representações porredes

neurais. Empartiular,modelosNARMAXpolinomiaispermitemfailmente

a obtenção de informaçõesanalítias sobre a dinâmiado sistema (Jáome,

1996).

Nas últimas duas déadas houve um grande volume de trabalhos a

res-peito de identiação não-linear (Aguirre, 2004). Apesar de grandes

on-quistas,aidentiaçãonão-linearainda possuigrandesdiuldades. Umdos

grandes desaos é a esolha de uma estrutura adequada e ompata para o

modelo (Chen et al., 1989; Lindskog, 1996; Aguirre, 2004). Várias

aborda-gens foram elaboradas para ataar esse problema (Aguirre, 1994; Mao and

Billings,1997; Corrêa, 2001). Para o aso espeío de modelos NARMAX

polinomiais,um importantetrabalho é o estudo de agrupamento de termos

(Aguirre and Billings, 1995). No iníio da déada de noventa, alguns

tra-balhos omeçarama utilizar informaçõesauxiliares (não ontidas nos dados

dinâmios de identiação) (Bohlin, 1991; Tulleken, 1993; Eskinat et al.,

1993). Aguirreetal.(2000)sugerequeouso deinformaçãoauxiliarpodeser

usado naesolha daestrutura do modelo.

Com isso, alguns autores sugerem lassiar os métodos de modelagem,

em função da utilização de informação auxiliar da seguinte forma (Herbert

and Tulleken, 1993; Sjöberg etal.,1995; Bohlin and Graebe, 1995):

Modelagem aixa-brana: onsiste emproedimentosem quea

es-truturadomodelo sejatotalmenteonheida, geralmentedeterminada

pelasequaçõesfísiasouquímiasqueregemoomportamentoestátio

(55)

sistema. Os parâmetrosdo modelo, geralmente, não possuem nenhum

signiadofísio. Oproessode modelagem,hamadode identiação,

sebaseia úniae exlusivamenteemdados de entrada e saídamedidos

do sistema. A estrutura do modelo pertene a famílias de modelos

que apresentam exibilidadee um histório de suesso (Sjöberg etal.,

1995);

Modelagemaixa-inza: éaonstruçãode modelosqueinorporam

onheimento a priori do sistema, om um erto grau de inerteza na

seleção de estrutura da representação (Jorgensen and Hangos, 1995).

Sjöberg e outros 1995 subdividem a modelagem aixa-inza em dois

subgrupos:

a) Modelagem físia: toda a estrutura é determinada por

onhei-mentos físios do sistema, e apenas os parâmetros, ou um erto

númerodesses são estimados apartir dos dados;

b) Modelagem semi-físia: informações do sistema são usadas para

sugerir ombinações não-lineares entre os sinais medidos,

utili-zando tais informações da estrutura do modelo (Lindskog and

Ljung, 1995b).

3.3.1 Comparação Entre os Tipos de Modelagem

Nessa seção é apresentada uma breve omparação entre os três tipos de

modelagemapresentados na seção 3.3. As vantagens edesvantagens da

mo-delagemaixa-preta, aixa-brana e aixa-inzasão ressaltadas.

A vantagem da modelagem aixa-brana é o fato de que os parâmetros

domodelopossuamsigniadofísioesão determinadosapartirde

onhei-mentosapriori dosistema(Corrêa, 2001)ouportestesemestado

estaioná-rio. Aguirre (2004) utiliza essa ténia para estimara resistênia hidráulia

de um sistema real de bombeamento de água. Em (Pottmann and

Pear-son, 1998) são apresentadas duas desvantagens da abordagemaixa-brana.

A primeira refere-se à maior omplexidade que em geral se tem na

estru-turadas equações, normalmenteenvolvendo equaçõesdifereniaisalgébrias,

equações difereniais pariais e/ou integrais. A segunda é que os modelos

são geralmente onstituídos por equações ontínuas no tempo, enquanto os

proessos de mediçãoe ontrole são em geraldisretos.

Jáamodelagemaixa-pretapossuiaexibilidadedaesolhadeestrutura,

failitando a formulação e a resolução de problemas de ontrole (Pottmann