• Nenhum resultado encontrado

CONTROLE EXTREMAL VIA FUNÇÃO DE MONITORAÇÃO E ESCALONAMENTO TEMPORAL PARA GRAU RELATIVO ARBITRÁRIO

N/A
N/A
Protected

Academic year: 2021

Share "CONTROLE EXTREMAL VIA FUNÇÃO DE MONITORAÇÃO E ESCALONAMENTO TEMPORAL PARA GRAU RELATIVO ARBITRÁRIO"

Copied!
8
0
0

Texto

(1)

CONTROLE EXTREMAL VIA FUN ¸C ˜AO DE MONITORA ¸C ˜AO E

ESCALONAMENTO TEMPORAL PARA GRAU RELATIVO ARBITR ´ARIO

Tiago Roux Oliveira∗, Liu Hsu, Jos´e Paulo V. S. Cunha, Victor Hugo Pereira Rodrigues∗

Departamento de Engenharia Eletrˆonica e Telecomunica¸c˜oes — Faculdade de Engenharia

Universidade do Estado do Rio de Janeiro — 20559-900

Programa de P´os-Gradua¸c˜ao em Engenharia El´etrica — COPPE-UFRJ

Universidade Federal do Rio de Janeiro — 21941-972

Emails: tiagoroux@uerj.br, liu@coep.ufrj.br, jpaulo@ieee.org, rodrigues.vhp@gmail.com

Abstract— An output-feedback variable-structure based extremum seeking controller was recently introduced for nonlinear uncertain systems by using a monitoring function. The class of systems considered was restricted to the relative degree one case. In this paper, generalization is achieved to include more general dynamics with arbitrary and uncertain relative degree. Global stability properties of the closed-loop system and exponential convergence to a neighborhood of the desired extremum are proved. The main contribution of this paper is to develop a time-scaling procedure in order to reduce the order of the system dynamics, and consequently, to allow the analysis and control design. Simulation results illustrate the performance of the proposed extremum seeking control algorithm in different time scales.

Keywords— Extremum seeking, Variable-structure control, Output-feedback, Arbitrary relative degree, Un-certain systems, Time-scaling.

Resumo— Um controlador extremal baseado em estrutura vari´avel e realimenta¸c˜ao de sa´ıda foi recentemente introduzido para sistemas incertos usando fun¸c˜oes de monitora¸c˜ao. A classe de sistemas considerada era restrita ao caso de grau relativo unit´ario. Neste artigo, uma generaliza¸c˜ao ´e alcan¸cada para incluir dinˆamicas com grau relativo arbitr´ario e desconhecido. As propriedades de estabilidade global do sistema em malha fechada e sua convergˆencia exponencial para uma vizinhan¸ca do extremo desejado s˜ao apresentadas. A principal contribui¸c˜ao deste artigo ´e o desenvolvimento de uma t´ecnica de escalonamento temporal no sentido de reduzir a ordem do sistema dinˆamico, e consequentemente, permitir a an´alise e o projeto do controlador. Os resultados de simula¸c˜ao ilustram o desempenho do algoritmo de controle extremal proposto em diferentes escalas de tempo.

Palavras-chave— Controle extremal, Controle por estrutura vari´avel, Realimenta¸c˜ao de sa´ıda, Grau relativo arbitr´ario, Sistemas incertos, Escalonamento temporal.

1 Introdu¸c˜ao

O controle por busca extremal ou controle extre-mal, do inglˆes extremum seeking control (ESC), ´e uma t´ecnica de controle adaptativo independente do modelo para o ajuste de parˆametros com o in-tuito de otimizar em tempo real um mapeamento n˜ao-linear desconhecido. A abordagem mais po-pular de busca extremal baseia-se na persistˆen-cia de excita¸c˜ao, geralmente senoidal, que per-turba o parˆametro que est´a sendo ajustado (Krsti´c and Wang, 2000; Ariyur and Krsti´c, 2003; Tan et al., 2006; Tan et al., 2009; Tan et al., 2010). Esta abordagem quantifica os efeitos dos parˆame-tros na sa´ıda do mapeamento n˜ao-linear, e ent˜ao usa essa informa¸c˜ao para gerar estimativas dos va-lores ´otimos dos parˆametros.

Como uma alternativa, um novo controle por busca extremal via modo deslizante e reali-menta¸c˜ao de sa´ıda foi introduzida em (Oliveira et al., 2011) para uma classe de sistemas linea-res com grau relativo um e fun¸c˜ao de sa´ıda n˜ao-linear. No lugar da metodologia de perturba¸c˜ao senoidal (Krsti´c and Wang, 2000; Ariyur and Krs-ti´c, 2003; Tan et al., 2006; Tan et al., 2009; Tan et al., 2010), o problema de otimiza¸c˜ao em tempo real foi resolvido atrav´es de uma fun¸c˜ao de

chave-amento peri´odica (Pan et al., 2003; Fu and ¨Ozg¨ u-ner, 2009).

Resultados relacionados a dinˆamicas mais ge-rais incluindo n˜ao-linearidades descasadas e de-pendentes do estado n˜ao-medido que podem pro-vocar escape em tempo finito foram obtidos em (Oliveira et al., 2012) e (Aminde et al., 2013), esse ´ultimo utilizando uma outra ferramenta, cha-mada fun¸c˜ao de monitora¸c˜ao. Nas duas aborda-gens, apenas sistemas com grau relativo unit´ario foram considerados.

Em compara¸c˜ao com o ESC baseado em perturba¸c˜oes senoidais (Krsti´c and Wang, 2000; Ariyur and Krsti´c, 2003; Tan et al., 2006; Tan et al., 2009; Tan et al., 2010), a fun¸c˜ao de mo-nitora¸c˜ao introduzida em (Aminde et al., 2013) pode garantir propriedades de estabilidade global, sem afetar a taxa de convergˆencia do algoritmo de busca pelo extremo. Al´em disso, o algoritmo pro-posto pode ser modificado para atingir o ponto de extremo global mesmo na presen¸ca de extremos locais como em (Tan et al., 2009).

Neste artigo, a generaliza¸c˜ao para o caso de grau relativo arbitr´ario ´e obtido para o ESC base-ado em fun¸c˜oes de monitora¸c˜ao. A mitiga¸c˜ao do grau relativo e a busca extremal s˜ao alcan¸cados por meio de uma t´ecnica de escalonamento

(2)

tempo-ral. Por uma quest˜ao de simplicidade, restringe-se aqui ao caso de plantas dinˆamicas lineares e est´ a-veis (Zhang et al., 2007). Utilizando-se o m´etodo de perturba¸c˜ao singular, ´e mostrado que na nova escala de tempo o sistema considerado ´e reduzido a um simples integrador perturbado por uma di-nˆamica r´apida de sensor, que por sua vez converge a um pequeno conjunto residual. Deste modo, explorando-se esta estrutura particular, reprojeta-se a lei de controle original (Aminde et al., 2013) com amplitude de controle reduzida para mostrar sua robustez com respeito a dinˆamicas de grau re-lativo arbitr´ario, `as custas de uma dilata¸c˜ao tem-poral que desacelera a resposta do sistema.

A estabilidade global com respeito a um con-junto residual compacto ´e demonstrada. A abor-dagem resultante garante a convergˆencia da sa´ıda do sistema a uma pequena vizinhan¸ca do extremo usando apenas realimenta¸c˜ao de sa´ıda. Simu-la¸c˜oes ilustram a efetividade do controlador por busca extremal proposto.

1.1 Nota¸c˜oes e Defini¸c˜oes

Em todo o artigo, a norma Euclidiana de um ve-tor x e a correspondente norma induzida de uma matriz A s˜ao denotadas por kxk e kAk, respec-tivamente. O termo πi(t) significa qualquer fun-¸c˜ao com decaimento exponencial, tal que |πi(t)| ≤ Re−βt,∀t, sendo R e β escalares positivos. Do ponto de vista t´ecnico, os resultados te´oricos aqui obtidos s˜ao baseados na defini¸c˜ao de Filippov para solu¸c˜ao de equa¸c˜oes diferenciais com lado direito descont´ınuo (Filippov, 1964).

2 Formula¸c˜ao do Problema

Considere o seguinte subsistema linear de grau re-lativo arbitr´ario n∗:

˙v = u , (1)

˙x = Ax+ Bv , (2)

z = C x , (3)

em cascata com um subsistema est´atico

y= Φ(z) , (4)

onde u ∈ R ´e a entrada de controle, x ∈ Rn ´e o vetor de estado, z ∈ R ´e uma sa´ıda n˜ao mensurada do subsistema linear (1)–(3) e y ∈ R ´e uma sa´ıda mensurada do subsistema est´atico (4), respectiva-mente.

O integrador em (1) ´e usado para obter um si-nal virtual de controle v ∈ R, que aumenta o grau relativo do sistema (Levant, 2003), i.e., n ≥ n

− 1 em vez de n ≥ n∗. O aumento do grau relativo faz com que o chaveamento em alta frequˆencia fi-que retido apenas no sinal de controle u, enquanto que o controle virtual v que aciona a planta dire-tamente seja cont´ınuo. Desta maneira, espera-se

uma melhora quanto a atenua¸c˜ao dos efeitos de

chattering(Utkin et al., 1999) no sistema em ma-lha fechada.

As matrizes A ∈ Rn×n, B ∈ Rn, CT ∈ Rn s˜ao incertas, a ordem n do subsistema (2) e, con-sequentemente, o grau relativo s˜ao desconhecidos. A fun¸c˜ao n˜ao-linear incerta Φ : R → R a ser ma-ximizada (ou minimizada) ´e localmente Lipschitz cont´ınua e suficientemente suave. Assume-se que o tempo inicial ´e t = 0 s. Para cada solu¸c˜ao de (1)–(4), existe um intervalo de tempo m´aximo de defini¸c˜ao dado por [0, tM), onde tM pode ser finito ou infinito.

2.1 Objetivo do Controle

O objetivo do controle por busca extremal ´e a otimiza¸c˜ao em “tempo real”, e n˜ao a “estabili-za¸c˜ao” ou o “rastreamento” (Tan et al., 2009). No entanto, o problema de ESC pode ser refor-mulado com um problema de rastreamento em que a dire¸c˜ao de controle ´e desconhecida (Oliveira et al., 2011; Oliveira et al., 2012). Deseja-se en-contrar uma lei de controle u por realimenta¸c˜ao de sa´ıda tal que, para qualquer condi¸c˜ao inicial, o sistema ´e guiado a alcan¸car o ponto extremo y∗ = Φ(z∗) de (4) e depois disso ´e mantido t˜ao perto quanto poss´ıvel de tal ponto. Sem perda de generalidade, aborda-se aqui o problema de busca pelo m´aximo. O problema de busca pelo m´ınimo pode ser tratado aplicando-se o mesmo algoritmo redefinindo o mapeamento est´atico em (4) por y = −Φ(z).

2.2 An´alise por Perturba¸c˜ao Singular

Em (Aminde et al., 2013), foi mostrado que uma classe de controladores por busca extremal basea-dos em fun¸c˜oes de monitora¸c˜ao podem ser proje-tados para o problema acima se n∗= 1.

Aqui, pretende-se mostrar que o ESC pro-posto em (Aminde et al., 2013) pode tamb´em ser estendido para o caso de grau relativo arbitr´ario. No sentido de apresentar tal generaliza¸c˜ao, consi-dere abaixo o caso mais simples de um integrador com um mapeamento de sa´ıda n˜ao-linear:

˙v = u , (5)

y = Φ(v) , (6)

que pode ser controlado efetivamente pelo m´etodo das fun¸c˜oes de monitora¸c˜ao.

Usando a abordagem da perturba¸c˜ao singu-lar (Kokotovi´c et al., 1999), pode-se mostrar que o m´etodo da fun¸c˜ao de monitora¸c˜ao para o ESC (Aminde et al., 2013) ´e robusto a dinˆamicas n˜ao-modeladas r´apidas tal que o sistema pertur-bado (5)–(6) ´e reescrito na forma de bloco sensor

(3)

(Kokotovi´c et al., 1999, p.50): ˙v = u , (7) µ˙x = Ax+ Bv , (8) y = Φ(Cx) , (9) e satisfaz a inequa¸c˜ao |y − y∗| ≤ O(√µ) , (10) ap´os um transit´orio r´apido, onde µ > 0 ´e uma constante suficientemente pequena. A demons-tra¸c˜ao completa de (10) segue os mesmos passos apresentados em (Costa and Hsu, 1991; Costa and Hsu, 1992) considerando y∗como um setpoint em um problema de regula¸c˜ao.

2.3 Escalonamento Temporal para o Reprojeto do Controlador

Aplicando-se um escalonamento temporal linear apropriado (Moya et al., 2002)

dt

dτ = µ , (11)

o sistema (7)–(9) pode ser reescrito como

v′ = µu (12) x′ = Ax+ Bv , (13) z = C x , (14) y = Φ(z) , (15) onde v′:= dv dτ e x ′:= dx

dτ. Isto significa que ∃µ ∗> 0 tal que o sinal de entrada u pode ser escalonado (12) para controlar o sistema original (2)–(4) em uma diferente escala de tempo dilatada dada por t= µτ , ∀µ ∈ (0, µ∗].

O significado f´ısico ´e de que como o ESC base-ado em fun¸c˜ao de monitora¸c˜ao originalmente pro-posto para sistemas de grau relativo um ´e robusto `as dinˆamicas n˜ao-modeladas est´aveis e r´apidas `a medida que µ → 0, ent˜ao ele tamb´em ser´a ade-quado para controlar dinˆamicas de grau relativo arbitr´ario, se este estiver corretamente escalonado. Como esperado, o pre¸co a ser pago ´e que a resposta do sistema em malha fechada desacelera quando µ→ 0.

2.4 Principais Hip´oteses

Como mencionado anteriormente, apenas a sa´ıda y´e assumida mensur´avel, j´a a sa´ıda linear do sub-sistema z e o estado x n˜ao est˜ao dispon´ıveis para a realimenta¸c˜ao. Com respeito `a planta controlada (1)–(4), ou equivalentemente (12)–(15), as seguin-tes hip´oteses s˜ao admitidas:

(H1) (Sobre as incertezas): todas as incerte-zas param´etricas da planta pertencem a um con-junto compacto Ω.

(H2) (Sobre o subsistema linear ): a matriz A em (2) deve ser Hurwitz.

Estas suposi¸c˜oes s˜ao necess´arias para que se-jam obtidos limitantes das incertezas para o pro-jeto do controlador. Em particular (H2) exibe que a dinˆamica do sistema seja est´avel, que ´e algo usual em controle extremal (Krsti´c and Wang, 2000). Usando a nota¸c˜ao Φ′(z) := dΦ(z) dz e Φ ′′(z) := d2 Φ(z)

dz2 , considera-se que (em Ω):

(H3) (Sobre a fun¸c˜ao objetivo): Existe um ´

unico ponto z∗

∈ R tal que y∗= Φ(z∗) ´e o extremo (m´aximo) de Φ: R → R, satisfazendo

Φ′(z) = 0, Φ′′(z) < 0 Φ(z∗) > Φ(z), ∀z ∈ R, z 6= z

e para qualquer ∆ > 0 dado, existe uma constante LΦ(∆) > 0 tal que

LΦ(∆) ≤ |Φ′(z)|, ∀z /∈ D∆:= {z : |z − z∗| < ∆/2}, onde D∆ ´e chamada de ∆-vizinhan¸ca de z∗. A constante ∆ pode ser feita arbitrariamente pe-quena permitindo-se um menor LΦ.

Note que a Hip´otese (H3) n˜ao ´e restritiva uma vez que Φ ´e assumida ser suave.

3 Controle Extremal via Realimenta¸c˜ao de Sa´ıda e Fun¸c˜ao de Monitora¸c˜ao Esta se¸c˜ao resume alguns resultados obtidos em (Aminde et al., 2013) para o sistema (7)–(9) na ausˆencia de dinˆamicas n˜ao-modeladas (µ = 0).

3.1 O Caso Singular µ= 0

Neste caso, a equa¸c˜ao diferencial (8) ´e substitu´ıda pela equa¸c˜ao alg´ebrica x = −A−1B ve, a partir de (7) e (9), a primeira derivada em rela¸c˜ao ao tempo do sinal de sa´ıda y ´e dada por

˙y = kp(z)u , (16)

onde o ganho em alta frequˆencia, do inglˆes high

frequency gain (HFG), denotado por kp, ´e o co-eficiente de u que aparece na primeira derivada temporal da sa´ıda y, sendo dado por

kp(z) = −Φ′(z)CA−1B . (17) Assim como em (Oliveira et al., 2011; Oliveira et al., 2012), o sgn(kp) ´e tamb´em chamado de

di-re¸c˜ao de controle. A Hip´otese (H3) nos leva a considerar um sistema de controle n˜ao-linear com HFG dependente do estado, que muda de sinal ao redor do ponto extremo de interesse de modo cont´ınuo.

A partir de (17) e (H3), kp(z) satisfaz |kp(z)| ≥ kp>0 , ∀z /∈ D∆, (18) sendo kp ≤ LΦ|CA−1B| um limitante infe-rior constante conhecido para o HFG, obtido

(4)

considerando-se todas as incertezas admiss´ıveis em Φ(·), A, B, e C.

Neste caso, a lei de controle para a planta com HFG desconhecido proposto por (Aminde et al., 2013) ´e:

u= 

u+ = −ρ(t) sgn(e) , t∈ T+, u− = +ρ(t) sgn(e) , t∈ T−, (19) no qual a fun¸c˜ao de monitora¸c˜ao ´e usada para de-cidir quando u deve ser chaveado de u+ para ue vice versa. Em (19), ρ(t) > 0 ´e uma fun¸c˜ao de modula¸c˜ao cont´ınua a ser projetada adiante e os conjuntos T+ e Tsatisfazem T+

∩ T− = ∅ e T+ ∪ T−= [0, tM).

O sinal de erro e(t) ´e dado por

e(t) = y(t) − ym(t) , (20) onde ym ∈ R ´e uma simples rampa gerada pelo modelo de referˆencia

˙ym= rm, (21)

onde rm>0 ´e uma constante de projeto. No sen-tido de se evitar um sinal de referˆencia ilimitado ym(t) no sistema de controle, pode-se saturar a sa´ıda do modelo em um limitante superior gros-seiro conhecido de y∗, sem comprometer o desem-penho do controlador. Desta maneira, y ´e for¸cado a alcan¸car a vizinhan¸ca do m´aximo y∗ = Φ(z) e se manter perto do valor ´otimo y∗. Para este fim, deve-se propor ρ tal que o rastreamento do erro de sa´ıda e tenda a zero em tempo finito, pelo menos do lado de fora da ∆-vizinhan¸ca, que est´a na vizinhan¸ca de z∗.

Assim sendo, conclui-se que y = Φ(z) tenta rastrear ym e, consequentemente, y deve se apro-ximar do m´aximo y∗ desde que y permane¸ca afas-tado de uma pequena vizinhan¸ca de y∗, onde o HFG n˜ao ´e zero. Em contraste, uma vez que y alcan¸ca a vizinhan¸ca de y∗, o HFG ir´a se apro-ximar de zero e ent˜ao sua observabilidade ´e per-dida. Consequentemente, o rastreamento de ym ir´a cessar. Contudo, a vizinhan¸ca do ponto ´otimo j´a ter´a sido alcan¸cada como desejado. A estrat´e-gia de controle foi desenvolvida para garantir que ypossa se manter perto de y∗depois disso. ´E evi-dente que a taxa de convergˆencia de z para a ∆-vizinhan¸ca D∆definida em (H3) ´e uma fun¸c˜ao de ρ. Embora D∆ n˜ao seja positivamente invariante, depois de alcan¸carmos D∆, foi mostrado que z se mant´em perto de z∗ onde o m´aximo ocorre. Isto n˜ao implica que z(t) permanece em D∆, ∀t. No entanto, como mostrado em (Aminde et al., 2013, Teorema 1), pode-se garantir que y se mant´em perto do valor ´otimo y∗.

3.2 Limitante Superior do Erro para µ= 0 A partir de (16), (20) e (21), adicionando-se e subtraindo-se λme `a derivada temporal do erro

e(t) tem-se

˙e = kpu− rm+ λme− λme , (22) ˙e = −λe + kp(u + de) , (23) onde λm>0 ´e uma constante arbitr´aria e

de:= 1

kp[−rm+ λm

e] . (24) Em (Aminde et al., 2013), mostrou-se que se a lei de controle

u= − sgn(kp)ρ sgn(e) (25) fosse usada com uma fun¸c˜ao de modula¸c˜ao n˜ao-negativa ρ satisfazendo

ρ≥ |de| + δ, (26)

e δ > 0 sendo uma constante arbitrariamente pequena, ent˜ao usando o lema da compara¸c˜ao (Filippov, 1964), teria-se que, ∀t ∈ [ti, tM):

|e(t)| ≤ |e(ti)|e−λm(t−ti), (27) onde ti∈ [0, tM).

3.3 Limitante Superior do Erro para µ 6= 0

Quando µ 6= 0 em (8), o escalonamento tempo-ral (11) permite que se considere a planta origi-nal (2)–(4), em uma diferente escala de tempo, sendo controlada pelo controlador (19) devida-mente escalonado por µu, vide (12). No sentido de incorpor´a-lo, a fun¸c˜ao de modula¸c˜ao deve ser reprojetada para satisfazer

ρ≥ µ[|de| + δ], (28) em vez de (26).

Da an´alise da perturba¸c˜ao singular esbo¸cada na Se¸c˜ao 2.2, se (25) fosse usada novamente, um li-mitante superior para o rastreamento do erro e(t) poderia ser obtido diretamente, para µ suficiente-mente pequeno, adicionando-se os termos de re-gime permanente e transit´orio em (10) e (27), res-pectivamente:

|e(t)| ≤ ζ(t) , ζ(t) := |e(ti)|e−λm(t−ti)+πe+O(√µ), (29) sendo πe um termo com decaimento exponencial r´apido que envolve os efeitos da dinˆamica est´avel n˜ao-modelada (8).

O maior problema ´e que o sgn(kp) ´e desconhe-cido, ent˜ao n˜ao se pode implementar a lei de con-trole (25). A seguir, o esquema de chaveamento baseado em fun¸c˜ao de monitora¸c˜ao ´e projetado para lidar com a falta de conhecimento da dire-¸c˜ao de controle fora da ∆-vizinhan¸ca. Note que, o termo πepode ser desconsiderado no projeto da fun¸c˜ao de monitora¸c˜ao uma vez que ele apenas representa modos r´apidos e est´aveis pelos quais o controlador j´a provou ser robusto na Se¸c˜ao 2.2.

(5)

3.4 Projeto da Fun¸c˜ao de Monitora¸c˜ao

A descri¸c˜ao detalhada da fun¸c˜ao de monitora¸c˜ao pode ser encontrada em (Yan et al., 2008; Oliveira et al., 2010). Aqui, apenas uma breve descri¸c˜ao ´e dada. Lembrando-se que a desigualdade (29) ´e ve-rificada quando a dire¸c˜ao de controle est´a correta, parece natural utilizarmos ζ como uma referˆen-cia para decidir se um chaveamento no sinal de controle u em (19) de u+ para u(ou upara u+) ´e necess´ario, i.e., o chaveamento ocorre ape-nas quando (29) ´e violada.

Assim sendo, considere a seguinte fun¸c˜ao ϕk(t) = |e(tk)|e−λm(t−tk)+ r, (30) onde tk´e o instante de chaveamento e r > 0 ´e qual-quer constante arbitrariamente pequena de ordem O(√µ). A fun¸c˜ao de monitora¸c˜ao ϕmpode ser de-finida como

ϕm(t) := ϕk(t), ∀t ∈ [tk, tk+1) ⊂ [0, tM). (31) Note que de (30) e (31), tem-se |e(t)| < |ϕk(t)| em t = tk. Por isso, tk ´e definido como o instante de tempo quando a fun¸c˜ao de monitora¸c˜ao ϕm(t) encontra |e(t)|, i.e.,

tk+1:= (

min{t > tk : |e(t)| = ϕk(t)}, se existir ,

tM, caso contr´ario ,

(32) onde k ∈ {1, 2, . . .} e t0:= 0 s.

Por constru¸c˜ao, a seguinte desigualdade ´e ob-tida diretamente de (31)

|e(t)| ≤ ϕm(t), ∀t ∈ [0, tM) . (33) Nesta aplica¸c˜ao de ESC, o conjunto residual final do algoritmo proposto ao redor do m´aximo y∗ ´e dependente dos valores para o qual a fun¸c˜ao de monitora¸c˜ao converge. De acordo com a defini¸c˜ao em (30), o conjunto residual final ser´a de ordem O(√µ).

3.5 Parˆametros Escalonados do Controlador

De acordo com (12), o controlador (19) deve ser escalonado para ser aplicado `a planta original (1)– (4). Neste caso, a fun¸c˜ao de modula¸c˜ao ρ deve satisfazer a inequa¸c˜ao (28).

Lembre-se que a derivada da fun¸c˜ao objetivo n˜ao desaparece ∀z fora da ∆-vizinhan¸ca. Deste modo, o limitante inferior da norma kp para kp dado em (18) ´e v´alido.

Portanto, pode-se obter o seguinte limitante da norma para dedefinido em (24):

|de(t)| ≤ ¯de, d¯e:= (rm+ λm|e|)/kp. (34) No esquema desenvolvido, a seguinte proposi-¸c˜ao apresenta uma poss´ıvel implementaproposi-¸c˜ao para a fun¸c˜ao de modula¸c˜ao de modo que (26) seja v´ a-lida.

Proposi¸c˜ao 1. Considere o sistema (1)–(4), o modelo de referˆencia (21) e a lei de controle (19). Fora da∆-vizinhan¸ca D∆, se ρ em (19) ´e proje-tada como

ρ:= µ

kp[rm+ λm|e|] + µδ , (35)

para µ suficientemente pequeno, ent˜ao, enquanto

z /∈ D∆, tem-se que: (a) o chaveamento da fun¸c˜ao

de monitora¸c˜ao p´ara, (b) n˜ao ocorre escape em tempo finito em nenhum dos sinais do sistema, o que implica que tM → +∞, e (c) o erro e(t) tende

a zero em tempo finito. O termo δ >0 ´e qualquer

constante arbitr´aria.

Prova: Considerando o argumento da pertur-ba¸c˜ao singular e o escalonamento temporal (11), que mostra que os sistemas (7)–(9) e (12)–(15) s˜ao equivalentes para µ suficientemente pequeno, ent˜ao, a demonstra¸c˜ao para a planta original (1)– (4) segue os mesmos passos que os apresentados na prova da (Aminde et al., 2013, Proposi¸c˜ao 1) para o caso de grau relativo um.  Observa¸c˜ao 1. Uma vez que o projeto de controle ´e desenvolvido pensando-se na escala de tempo lenta µt, ´e natural que os parˆametros rm e λm

do modelo de referˆencia (21) e fun¸c˜ao de monito-ra¸c˜ao (30)–(31) sejam reescalonados apropriada-mente, ou seja: µrm e µλm.

3.6 Resultado de Convergˆencia Global

O Teorema 1 afirma que o controlador proposto por realimenta¸c˜ao de sa´ıda baseado em fun¸c˜ao de monitora¸c˜ao conduz z a uma ∆-vizinhan¸ca defi-nida em (H3) do maximizante z∗ desconhecido. Isto n˜ao implica que z(t) se mant´em em D∆, ∀t. Contudo, a amplitude de oscila¸c˜ao do sinal em torno de y∗ pode ser feita de O(µ).

Teorema 1. Considere o sistema (2)–(3), com sa´ıda ou fun¸c˜ao objetivo em (4), lei de controle (1) e (19), fun¸c˜ao de modula¸c˜ao (35), fun¸c˜ao de mo-nitora¸c˜ao (30)–(31) e modelo de referˆencia (21). Assume-se que (H1)–(H3) s˜ao v´alidas, ent˜ao:

(i) a ∆-vizinhan¸ca D∆ em (H3) ´e globalmente

atrativa sendo alcan¸cada em tempo finito e (ii)

para LΦ(µ) em (H3) suficientemente pequeno, as

oscila¸c˜oes de y(t)em torno do valor m´aximo y

podem ser feitas de ordem O(õ), com r definido

em (30) sendo tamb´em uma constante de ordem

O(õ). Uma vez que o sinal ym em (21) pode

ser saturado, todos os sinais do sistema em malha fechada se mant´em uniformemente limitados.

Prova: Assim como na prova da Proposi-¸c˜ao 1, a demonstraProposi-¸c˜ao ´e baseada nos argumen-tos de perturba¸c˜ao singular/escalonamento tem-poral e seguem os passos apresentados na prova do (Aminde et al., 2013, Teorema 1), para µ

(6)

4 Resultado das Simula¸c˜oes

Considere neste exemplo dois sistemas dinˆamicos com fun¸c˜oes objetivo desconhecidas e grau relativo trˆes.

O primeiro deles ´e descrito por ˙ v1= u1 (36) ˙x =  0 1 −10000 −40  x+  0 10000  v1 (37) z1= 1 0 x , (38)

com fun¸c˜ao de transferˆencia de u1 para z1 dada por

G1(s) = 10000 s(s2+ 40s + 10000) e fun¸c˜ao de sa´ıda

y1= Φ(z1) = 10 − (z1− 3)2. O segundo sistema ´e descrito por

˙v2= u2 (39) ˙x =  0 1 −1 −0.4  x+  0 1  v2 (40) z2= 1 0 x , (41)

com fun¸c˜ao de transferˆencia de u2 para z2 dada por

G2(s) = 1

s(s2+ 0.4s + 1) e a mesma fun¸c˜ao de sa´ıda

y2= Φ(z2) = 10 − (z2− 3)2.

A fun¸c˜ao objetivo tem um m´aximo y∗ = 10 em z∗= 3, como pode ser visto na Figura 1.

0 10 −4 −2 2 4 6 8 −5 −3 −1 1 3 5 7 9 0 −40 −20 −50 −30 −10 10 −55 −45 −35 −25 −15 −5 5 15 z y

Figura 1: Fun¸c˜ao objetivo y = Φ(z). Devido a diferen¸ca das escalas de tempo dos dois sistemas, dois valores de µ foram escolhidos: µ= 1 para (36)–(38) e µ = 0.01 para (39)–(41).

O sinal de referˆencia ym´e escolhido como em (21) com rm= µ. O sinal ym´e saturado em 20, tal

que e(t) ´e mantido uniformemente limitado. Os parˆametros da fun¸c˜ao de monitora¸c˜ao s˜ao λm= µ e r = 0.5.

A lei de controle (19) pode ser aplicada com a fun¸c˜ao de modula¸c˜ao (35) satisfazendo (28). Con-tudo, para simplificar seu projeto, usou-se uma fun¸c˜ao de modula¸c˜ao constante dada por ρ = 2µ, que era adequada para alcan¸car o objetivo de con-trole nas simula¸c˜oes.

Como mostrado na Figura 2 e 3, depois de um transit´orio inicial, y cresce para rastrear ym at´e z alcan¸car a vizinhan¸ca do maximizador z∗= 3, e y alcan¸car y∗ = 10. Em seguida, o rastreamento exato n˜ao ´e mais obtido, contudo y permanece preso em alguma√µ–vizinhan¸ca de y∗= 10 e ym cresce at´e o valor de satura¸c˜ao especificado igual a 20 (n˜ao mostrado nos gr´aficos).

0 2 4 6 8 10 12 14 16 18 20 0 10 2 4 6 8 12 t (s) y 0 2 4 6 8 10 12 14 16 18 20 0 2 4 −1 1 3 t (s) z

Figura 2: Sinais y e z obedecendo a escala de tempo t = τ . A sa´ıda y tende ao valor m´aximo y∗

1 = 10, com maximizador em z1∗= 3.

As Figuras 4 e 5 ilustram o comportamento da fun¸c˜ao de monitora¸c˜ao e o chaveamento da dire¸c˜ao de controle para os sistemas considerados em suas respectivas escalas de tempo. Pode-se notar que depois de alcan¸car o m´aximo, o erro ir´a aumentar devido a escolha da rampa como a trajet´oria de referˆencia e depois tender´a a um valor constante (n˜ao ilustrado nas figuras), que depende do n´ıvel de satura¸c˜ao escolhido.

Nas Figuras 2, 3, 4 e 5, as duas escalas de tempo que individualmente governam cada sis-tema est˜ao bem claras. Os dois sistemas apresen-tam respostas similares mas a constante de tempo do primeiro ´e 100 vezes mais r´apida do que a do segundo, j´a que t = µτ .

(7)

0 500 1 000 1 500 2 000 0 10 2 4 6 8 12 t (s) y 0 500 1 000 1 500 2 000 0 2 4 −1 1 3 t (s) z

Figura 3: Sinais y e z obedecendo a escala de tempo t = µτ com µ = 0.01. A sa´ıda y tende ao valor m´aximo y∗ 2 = 10, com maximizador em z∗ 2 = 3. 0 2 4 6 8 10 12 14 16 18 20 0 10 2 4 6 8 12 t (s)

Monitoring function, |e|

0 2 4 6 8 10 12 14 16 18 20 0 −1 1 −1.5 −0.5 0.5 1.5 t (s) Control direction

Figura 4: Fun¸c˜ao de monitora¸c˜ao ϕm(tracejada), norma do erro |e| (cont´ınua) e chaveamento da dire¸c˜ao de controle para o sistema (36)–(38).

5 Conclus˜oes

Um controlador por busca extremal baseado em estrutura vari´avel e realimenta¸c˜ao de sa´ıda foi de-senvolvido para sistemas com incertezas param´e-tricas, ordem e grau relativo arbitr´arios e tamb´em desconhecidos. A combina¸c˜ao da fun¸c˜ao de moni-tora¸c˜ao com a t´ecnica de escalonamento no tempo levaram `a estabilidade global assint´otica do sis-tema em malha fechada e `a convergˆencia da sa´ıda do sistema a uma pequena vizinhan¸ca arbitr´aria do ponto de extremo. A estrat´egia de controle pro-posta foi testada com sucesso atrav´es de exemplos de simula¸c˜ao num´erica. 0 500 1 000 1 500 2 000 0 10 2 4 6 8 12 t (s)

Monitoring function, |e|

0 500 1 000 1 500 2 000 0 −1 1 −1.5 −0.5 0.5 1.5 t (s) Control direction

Figura 5: Fun¸c˜ao de monitora¸c˜ao ϕm(tracejada), norma do erro |e| (cont´ınua) e chaveamento da dire¸c˜ao de controle para o sistema (39)–(41).

A aplica¸c˜ao da presente abordagem para re-solver o obst´aculo do grau relativo arbitr´ario em controladores por busca extremal baseados em fun¸c˜oes de chaveamento peri´odica (Oliveira et al., 2011; Oliveira et al., 2012) parece ser um t´opico interessante para pesquisas futuras.

A extens˜ao dos resultados te´oricos para siste-mas multivari´aveis bem como a inclus˜ao de dinˆ a-micas mais gerais (e.g, duplos integradores e p´olos inst´aveis) est˜ao sob desenvolvimento.

Referˆencias

Aminde, N. O., Oliveira, T. R. and Hsu, L. (2013). Global output-feedback extremum se-eking control via monitoring functions, 52nd

IEEE Conference on Decision and Control

pp. 1031–1036.

Ariyur, K. B. and Krsti´c, M. (2003). Real-Time

Optimization by Extremum-Seeking Control, John Wiley & Sons.

Costa, R. R. and Hsu, L. (1991). Unmodeled dy-namics in adaptive control systems revisited,

Systems & Control Letters 16: 341–348. Costa, R. R. and Hsu, L. (1992). Robustness

of vs-mrac with respect to unmodeled dyna-mics and external disturbances, International

Journal of Adaptive Control and Signal Pro-cessing 6: 19–33.

Filippov, A. F. (1964). Differential equations with discontinuous right-hand side, Amer. Soc.

Translations 42: 199–231.

Fu, L. and ¨Ozg¨uner, U. (2009). Extremum-seeking control in constrained source tracing with

(8)

no-nholonomic vehicles, IEEE Trans. on Ind.

Electronics 56: 3602–3608.

Kokotovi´c, P., Khalil, H. K. and O’Reilly, J. (1999). Singular perturbation methods in control: analysis and design, SIAM .

Krsti´c, M. and Wang, H. H. (2000). Stability of extremum seeking feedback for general nonli-near dynamic systems, Automatica pp. 595– 601.

Levant, A. (2003). Higher-order sliding modes, differentiation and output-feedback control,

Int. J. Contr. 76: 924–941.

Moya, P., Ortega, R., Netto, M. S., Praly, L. and Pic´o, J. (2002). Application of nonli-near time-scaling for robust controller design of reaction systems, International Journal of

Robust and Nonlinear Control 12: 57–69. Oliveira, T. R., Hsu, L. and Peixoto, A. J.

(2011). Output-feedback global tracking for unknown control direction plants with appli-cation to extremum-seeking control,

Automa-tica 47: 2029–2038.

Oliveira, T. R., Peixoto, A. J. and Hsu, L. (2010). Sliding mode control of uncertain multivariable nonlinear systems with unk-nown control direction via switching and monitoring function, IEEE Trans. Automat.

Contr. 55(4): 1028–1034.

Oliveira, T. R., Peixoto, A. J. and Hsu, L. (2012). Global real-time optimization by output-feedback extremum-seeking control with sli-ding modes, Journal of The Franklin

Insti-tute 349: 1397–1415.

Pan, Y., ¨Ozg¨uner, U. and Acarman, T. (2003). Stability and performance improvement of extremum seeking control with sliding mode,

International Journal of Control 76: 968– 985.

Tan, Y., Moase, W., Manzie, C., Nesi´c, D. and Mareels, I. (2010). Extremum seeking from 1922 to 2010, 29th Chinese Control

Confe-rencepp. 14–26.

Tan, Y., Nesi´c, D. and Mareels, I. (2006). On non-local stability properties of extremum seeking control, Automatica 42: 889–90.

Tan, Y., Nesi´c, D., Mareels, I. M. Y. and As-tolfi, A. (2009). On global extremum seeking in the presence of local extrema, Automatica 45: 245–251.

Utkin, V., Guldner, J. and Shi, J. (1999).

Sli-ding mode control in electromechanical sys-tems, Taylor & Francis Ltd.

Yan, L., Hsu, L., Costa, R. R. and Lizarralde, F. (2008). A variable structure model re-ference robust control without a prior kno-wledge of high frequency gain sign,

Automa-tica 44: 1036– 1044.

Zhang, C., Siranosian, A. and Krsti´c, M. (2007). Extremum seeking for moderately unstable systems and for autonomous vehicle target tracking without position measurements,

Referências

Documentos relacionados

Os testes de desequilíbrio de resistência DC dentro de um par e de desequilíbrio de resistência DC entre pares se tornarão uma preocupação ainda maior à medida que mais

• Não há inflação de alimentos, há inflação, causada por choques cambiais, auxílio emergencial, problemas fiscais e má gestão de estoques públicos;. • O Brasil precisa

(grifos nossos). b) Em observância ao princípio da impessoalidade, a Administração não pode atuar com vistas a prejudicar ou beneficiar pessoas determinadas, vez que é

Este trabalho buscou, através de pesquisa de campo, estudar o efeito de diferentes alternativas de adubações de cobertura, quanto ao tipo de adubo e época de

17 CORTE IDH. Caso Castañeda Gutman vs.. restrição ao lançamento de uma candidatura a cargo político pode demandar o enfrentamento de temas de ordem histórica, social e política

3259 21 Animação e dinamização de actividades lúdico-expressivas - expressão musical 50 3260 22 Animação e dinamização de actividades lúdico-expressivas -

Santo Antônio, Brejinho e Região representando como titular o senhor Josué Oliveira Silva e como suplente o senhor Naevi Novais Silva; Associação de Desenvolvimento Comunitário

Escola da Tebra (Voce na néboa, 1957), escribiu poesia social baixo o heteronimo de Heriberto Bens (sempre formalmente mais coidada que o socialrealismo do momento) pero o seu