Lei adaptativa do gradiente com normaliza¸c˜ao

3.3 Controle por Aloca¸c˜ao de P´olos Adaptativo Indireto

3.3.1 Modelo Param´etrico e Lei Adaptativa

3.3.1.1 Lei adaptativa do gradiente com normaliza¸c˜ao

Algumas leis adaptativas são projetadas sob a hipótese que o vetor de estados completo da planta é dispon´ıvel para medi¸cão, a planta é estável, e a entrada da planta é limitada. Nesta se¸cão, desenvolve-se a lei adaptativa do gradiente com normaliza¸cão do erro, que não requer que a planta seja estável ou que a entrada da planta seja limitada a priori.

Alguns trabalhos em controle adaptativo na década de 60 (Landau 1979)(Narendra & L.E.McBride 1964) abordaram o uso de técnicas de otimiza¸cão simples tais como o método do gradiente para minimizar um determinado custo de desempenho com respeito a alguns parâmetros ajustáveis. Apesar de seu sucesso em várias aplica¸cões, estes enfoques perderam seu popularidade devido à falta de estabilidade no sentido global. Por causa disso, estes esquemas foram substitu´ıdos por novos esquemas baseados na teoria de Lyapunov. Contudo, o método gradiente, manteve sua popularidade como uma ferramenta para o projeto de leis adaptativas e é muito utilizado em sistemas adaptativos tanto em tempo discreto (Goodwin & Sin 1984) como continuo. Técnicas utilizadas nas décadas de 70 e 80 que são baseadas nos métodos do gradiente já de- monstram ter propriedades de estabilidade global. A diferen¸ca com rela¸cão aos novos métodos foram novas formula¸cões do problema de estima¸cão paramétrica e a sele¸cão de diferentes fun¸cões de custo para minimizar.

Nesta se¸cão, utiliza-se o método do gradiente e uma fun¸cão de custo instantâneo para desenvolver leis adaptativas que permitam estimar o vetor dos parâmetros da planta θ∗ _{no modelo paramétrico da equa¸cão (3.20)}

z = W (s)θ∗>_ψ

O uso do método do gradiente envolve o desenvolvimento de uma equa¸cão de erro de estima¸cão algébrico que motiva a sele¸cão de uma fun¸cão de custo apropriada J(θ) que é convexa sobre o espa¸co de θ(t), a mesma que representa a estimativa de θ∗ _{no instante}

de tempo t. Então, a fun¸cão J(θ) é minimizada com respeito a θ para cada instante de tempo t usando o método do gradiente. A equa¸cão de erro algébrico é desenvolvida a seguir:

Como θ∗ _{é constante, o modelo paramétrico da equa¸cão (3.20) pode ser escrito na}

forma

z = θ∗>_φ _(3.21)

onde φ = W (s)ψ.

O modelo paramétrico da equa¸cão (3.21) tem sido bastante utilizada em controle adaptativo em tempo discreto. Em cada instante de tempo t, (3.21) é uma equa¸cão algébrica onde θ∗ _{desconhecido aparece linearmente. A partir da simplicidade da}

equa¸c˜ao (3.21), uma ampla classe de leis adaptativas recursivas podem ser desenvolvi- das.

Usando a equa¸c˜ao (3.21), a estimativa ˆz de z no tempo t ´e gerada como

z = θT_φ

onde θ(t) é a estimativa de θ∗ _{no tempo t. O erro de estima¸cão normalizado ² é então}

calculado como ² = z − ˆz m2 = z − θT_φ m2 (3.22) onde m2 _{= 1 + n}2

s e ns ´e o sinal normalizante projetado de modo que

m ∈ L∞(A1) Uma escolha t´ıpica para ns ´e n2s = φTφ.

Figura 3.11: Diagramas de blocos equivalentes para gerar o erro de estima¸c˜ao nor- malizado quando W (s)L(s) = 1.

Para propósito de análise expressa-se ² como uma fun¸cão do erro paramétrico ˜θ , θ − θ∗_{. Assim, substituindo por z na equa¸cão (3.22) obtém-se}

² = −θ˜

T_φ

m2 (3.23)

Claramente o sinal ²m = −˜θT φ

m é uma medi¸cão razoável do erro paramétrico ˜θ desde

que para qualquer vetor de sinal continua por partes φ (não necessariamente limitado), um valor de ²m grande implica um valor grande do erro paramétrico ˜θ. Várias leis

adaptativas para θ podem ser geradas usando o m´etodo de gradiente para minimizar uma ampla classe de fun¸c˜oes de custo do erro ² com respeito a θ.

Existem duas fun¸cões de custo que despertam o interesse dentro da comunidade de controle adaptativo: fun¸cão de custo instantâneo e fun¸cão de custo integral. Neste trabalho foi considerada a primeira fun¸cão, que será apresentada a seguir.

Fun¸cão de custo instantâneo Considera-se a fun¸cão de custo quadrático simples

J(θ) = ²

2_m2

2 =

(z − θT_φ)2

2m2 (3.24)

determinada a partir das equa¸cões (3.22) e (3.23), a mesma que deseja-se minimizar com respeito a θ. Devido à propriedade (A1) de m, J(θ) é convexa sobre o espa¸co de θ em cada instante de tempo t; desta forma, o problema de minimiza¸cão é apropriadamente proposto. Aplicando o método do gradiente, a trajetória de minimiza¸cão θ(t) é gerada pela equa¸cão diferencial (3.25)

˙θ = −ΓOJ(θ) (3.25)

onde Γ = ΓT _{> 0 ´e uma matriz de pondera¸c˜ao a qual refere-se como ganho adaptativo.}

Da equa¸c˜ao (3.24) obt´em-se

OJ(θ) = −(z − θ

T_φ)φ

m2 = ²φ

e, desta forma, a lei adaptativa para gerar θ(t) ´e dado por

˙θ = Γ²φ (3.26)

A equa¸c˜ao (3.26) ´e referida como algoritmo do gradiente.

Observa¸c˜ao 1 A lei adaptativa da equa¸cão (3.26) apresenta a mesma forma que a desenvolvida usando a aproxima¸cão de projeto Lyapunov-SPR. Como é mostrado na literatura de controle adaptativo, a lei adaptativa da equa¸cão (3.26) resulta diretamente do método de projeto por Lyapunov considerando L(s) = W−1_(s).

Observa¸c˜ao 2 A convexidade de J(θ) garante a existˆencia de um m´ınimo global sim- ples definido por OJ(θ) = 0. Resolvendo OJ(θ) = −²φ = −z−θ_mT2φφ = 0, ou seja,

Figura 3.12: Diagrama de blocos para implementar a lei adaptativa (3.26) com erro de estima¸c˜ao normalizado.

φz = φφT_{θ, para θ resultar´a no algoritmo do gradiente n˜ao recursivo}

θ(t) = (φφT₎−1_φz

desde que φφT _{é não singular. Para φ ∈ R}nx1 _{e n > 1, φφ}T _{é sempre singular, a}

seguinte expressão não recursiva baseada em N medi¸cões de dados pode ser usada:

θ(t) = Ã _N X i=1 φ(ti)φT(ti) !_{−1 N} X i=1 φ(ti)z(ti)

onde ti ≤ t, i = 1, ..., N são os instantes de tempo onde as medi¸cões de φ e z são

obtidas.

Observa¸c˜ao 3 O m´ınimo da fun¸cão J(θ) corresponde a ² = 0, que implica ˙θ = 0 e o final da adapta¸cão. A prova que θ(t) convergirá a uma trajetória que corresponde a ² pequeno em algum sentido não é diretamente garantida pelo método do gradiente. Uma análise do tipo Lyapunov é usada para estabelecer este resultado como é mostrado a seguir, na prova do teorema 3.2.

Teorema 3.2 (Ioannou & Sun 1996) A lei adaptativa da equa¸c˜ao (3.26) garante que (i) ², ²ns, θ, ˙θ ∈ L∞

em forma independente da limita¸c˜ao do vetor sinal φ e

(iii) se ns, φ ∈ L∞ e φ possui a propriedade de excita¸c˜ao persistente, ent˜ao θ(t) con-

verge exponencialmente a θ∗_.

Prova: Sabendo que θ∗ _{é constante, ˙˜}_{θ = ˙θ e a partir da equa¸cão (3.26) obtém-se:}

˙˜θ = Γ²φ (3.27)

Escolhe-se a fun¸c˜ao de Lyapunov

V (˜θ) = θ˜TΓ−1θ˜ 2

Diferenciando V com respeito ao tempo e a partir da equa¸c˜ao (3.27), obt´em-se

V = ˜θT_{φ² = −²}2_m2 _{≤ 0} _(3.28)

onde a segunda desigualdade ´e obtida substituindo ˜θT_{φ = −²m}2 _{da equa¸c˜ao (3.23).}

Daqui, V, ˜θ ∈ L∞, este resultado junto com a equa¸c˜ao (3.23), implica que ², ²m ∈ L∞.

A partir da equa¸c˜ao (3.27) obt´em-se:

| ˙˜θ| = | ˙θ| ≤ kΓk|²m|φ

m (3.29)

que junto com _mφ ∈ L∞ e ²m ∈ L2

L∞ implica que ˙θ ∈ L2

L∞ e a prova para (i) e

(ii) ´e completada.

Observa¸c˜ao 4 A propriedade V (˜θ) ≥ 0 e ˙V ≤ 0 da fun¸c˜ao de Lyapunov implica que limt→∞V (˜θ(t)) = V∞. Contudo, isto n˜ao implica que, ˙V (t) tende a zero para

t → ∞. Conseqüentemente, não é poss´ıvel concluir que ² ou ²m tende a zero para t → ∞, ou seja, que o decaimento do gradiente alcan¸ca o m´ınimo global que corresponde a ∇J(θ) = −²φ = 0. Se de qualquer modo, _mφ˙,m˙

m ∈ L∞, pode se estabelecer que d

dt(²m) ∈ L∞, que, junto com ²m ∈ L2, implica que ²(t)m(t) → 0 para t → ∞. Devido

a que m2 _{= 1 + n}2

s obtém-se que ²(t) → 0 para t → ∞ e da equa¸cão (3.29) obtém-

|∇J(θ(t))| → 0 para t → ∞, ou seja, θ(t) converge a uma trajet´oria que corresponde a um m´ınimo global de J(θ) assintoticamente com o tempo desde que φ˙

m, ˙ m

m ∈ L∞.

Observa¸c˜ao 5 Apesar do algoritmo do gradiente descrito pela equa¸cão (3.26), apre- sentar a mesma forma que a lei adaptativa baseada na metodologia de Lyapunov-SPR, suas propriedades são diferentes. Por exemplo, a lei adaptativa da equa¸cão (3.26) ga- rante que ˙θ ∈ L∞enquanto que tal propriedade não é demonstrada para a lei adaptativa

baseada na aproxima¸c˜ao de projeto por Lyapunov-SPR.

A velocidade de convergência dos parâmetros estimados a seus verdadeiros valores, quando ns, φ ∈ L∞ e φ possui a propriedade de excita¸cão persistente, e caracterizado

na prova do teorema 3.2 (iii). Demonstra-se que:

θT_(t)Γ−1_{θ(t) ≤ γ}_˜ n_θ_˜T_(0)Γ−1_θ(0)_˜ _(3.30)

onde 0 ≤ t ≤ nT0, n ´e um inteiro e

γ = 1 − γ1, γ1 =

2α0T0λmin(Γ)

2m0+ β4T02λ2max(Γ)

onde α0 é o n´ıvel de excita¸cão de φ, T0 > 0 é o tamanho do intervalo de tempo na

defini¸c˜ao de excita¸c˜ao persistente de φ, m0 = supt≥0m2(t) e β = supt≥0|φ(t)|. Foi

estabelecido que 0 < γ < 1. Quanto menor é o valor de γ, ou seja, quando maior é o valor de γ1, o erro paramétrico converge a zero mais rápido. As constantes α0, T0,

β e possivelmente m0 s˜ao todas independentes uma vez que todas elas dependem de

φ(t). Portanto, o critério para escolher φ(t) não é definido em forma clara, se é poss´ıvel incrementar o tamanho de γ1.

No documento Controle adaptativo aplicado ao amortecimento de oscilações de baixa freqüência em sistemas de potência (páginas 87-93)