AJUSTE DE CONTROLADORES PI E PID PARA PLANTAS EST ´AVEIS E INST ´AVEIS
Jo˜ao C. Basilio, Victor N. Nogueira Universidade Federal do Rio de Janeiro COPPE - Programa de Engenharia El´etrica
Cidade Universit´aria - Ilha do Fund˜ao 21.945-970 - Rio de Janeiro - R. J.
E-mails: basilio@dee.ufrj.br, vicnn@uol.com.br
Resumo— Uma maneira sistem´atica de se obter a regi˜ao de estabilidade para os controladores P, PI e PID para uma dada planta modelada por uma fun¸c˜ao de transferˆencia racional, isto ´e, um conjunto de pontos kp, (kp, ki) e (kp, ki, kd) que tornam o sistema realimentado est´avel foi recentemente apresentada. Contudo, nos trabalhos que se seguiram n˜ao foi feito uso dessa regi˜ao para se projetar controladores PI e PID que atendam outros objetivos de projeto, tais como melhoria dos regimes transit´orios da resposta a sinais de referˆencias e da rejei¸c˜ao de perturba¸c˜ao de sinais do tipo degrau. Neste artigo ser´a proposto um m´etodo de ajuste dos controladores PID, supondo conhecida a fun¸c˜ao de transferˆencia da planta. Ser´a utilizado um crit´erio de otimiza¸c˜ao quadr´atico em que fazem parte desta fun¸c˜ao a norma quadr´atica do sinal do erro e da componente do sinal de perturba¸c˜ao no sinal de sa´ıda. Para minimizar este custo, que ´e fun¸c˜ao dos parˆametros do controlador PID, ser´a utilizado algoritmo Gen´etico, onde o espa¸co da busca ser´a a regi˜ao na qual o sistema em malha fechada ´e est´avel. Uma vez que a varredura ser´a feita sobre a regi˜ao de estabilidade, os controladores PI e PID obtidos garantem a estabilidade do sistema realimentado para plantas est´aveis ou inst´aveis.
Abstract— A systematic way to obtain the stability region for PI and PID controllers for a plant modeled by a rational transfer function, i.e., the set of points kp, (kp, ki) and (kp, ki, kd) that make the closed-loop system stable has been recently presented. However, in the works that followed this result, use has not been made of this parametrization to design PI and PID controllers that address other design objectives, such as, transient performance with respect to reference step signal and disturbance rejection to step signal, as well. In this paper, a new method for tuning PI and PID controllers is proposed, assuming that the plant transfer function is known. A quadratic optimization criterion formed by the l2-norms of the error signal and of the output component of
the disturbance signal will be used. In order to search for the controller parameter which minimizes this cost function, genetic algorithm is used, where the feasibility region is given by the PI and PID stability region. Since the search is carried out over the stability region, the PI and PID controllers obtained ensure closed-loop stability for both stable and unstable plants.
Key Words— PID controller design, optimal control, genetic algorithm.
1 Introdu¸c˜ao
Os controladores PID tˆem sido muito utilizados em sistemas de controles industriais h´a d´ecadas, mais precisamente, desde que, Ziegler e Nichols propuseram o primeiro m´etodo de ajuste de con-troladores PID (Ziegler e Nichols, 1942), tendo a capacidade de estabilizar e controlar cerca de 90% dos processos industriais existentes Oviedo et al. (2006). Com o objetivo de comparar as diversas t´ecnicas de projeto, Cominos e Munro (2002) de-senvolveram um trabalho, resumindo alguns dos m´etodos recentes de projetos de controladores PID, tais como: o m´etodo de Ziegler-Nichols, de re-aloca¸c˜ao de p´olos, projetos baseados em especi-fica¸c˜oes em ganhos de fase e de margem, t´ecnicas de polinˆomios de intervalos, projetos baseados no teorema da estabilidade de Nyquist, Algoritmo Gen´eticos para ajustes de PID, ajustes de PID uti-lizando a teoria da intera¸c˜ao adaptativa, m´etodos baseados em cancelamento, m´etodos de integra¸c˜ao de magnitude m´ultipla ´otima, entre outras, vi-sando apresentar vantagens e desvantagens destes m´etodos.
Mais recentemente, outros m´etodos de ajuste
de parˆametros de controladores PID foram desen-volvidos visando melhorar o desempenho de sis-temas realimentados com este controlador. Ge et al. (2001) propuseram um m´etodo de pro-jeto de controladores PID robustos em que uti-lizam t´ecnicas padr˜oes como reguladores lineares quadr´aticos (LQR) e H∞e solucionam o problema
con-tudo caracterizar as condi¸c˜oes necess´arias para a estabiliza¸c˜ao das plantas inst´aveis pelos controla-dores PID.
O problema da estabiliza¸c˜ao de plantas est´aveis e inst´aveis utilizando controladores P, PI e PID foi considerado em Datta et al. (2000) e Silva et al. (2004); esse ´ultimo para sistemas com atraso. Nesses trabalhos, diferentemente da abor-dagem apresentada por (Shafiei e Shenton, 1994), foi apresentada uma caracteriza¸c˜ao dos controla-dores PI e PID estabilizantes, isto ´e, conjuntos de pontos kp, (kp, ki) e (kp, ki, kd) cujos
contro-ladores PI e PID tornam o sistema realimentado est´avel. Contudo, uso n˜ao foi feito dessa regi˜ao para considerar outros objetivos de projeto, tais como resposta transit´oria e rejei¸c˜ao de sinais ex-ternos de perturba¸c˜ao.
Nesse artigo ser´a proposto um m´etodo de ajuste dos controladores PID, supondo conhecida a fun¸c˜ao de transferˆencia da planta. Ser´a utili-zado um crit´erio de otimiza¸c˜ao quadr´atico em que fazem parte desta fun¸c˜ao a norma quadr´atica do sinal do erro e da componente do sinal de per-turba¸c˜ao no sinal de sa´ıda. Para minimizar este custo, que ´e fun¸c˜ao dos parˆametros do contro-lador PID, ser´a utilizado o Algoritmo Gen´etico, onde o espa¸co da busca ser´a a regi˜ao na qual o sistema de malha fechada ´e est´avel, ou seja, os pontos (kp, ki, kd) que tornam o sistema
compen-sado est´avel. Uma vez que a varredura ´e feita sobre a regi˜ao de estabilidade, os controladores PI e PID obtidos garantem a estabilidade do sistema realimentado para plantas est´aveis ou inst´aveis.
Esse artigo est´a estruturado da seguinte forma. A Se¸c˜ao 2 apresenta uma breve revis˜ao do problema da estabiliza¸c˜ao de sistemas realimenta-dos utilizando controladores P, PI e PID resolvido em Datta et al. (2000). Na Se¸c˜ao 3 ´e proposto um funcional de custo quadr´atico para o ajuste dos parˆametros de controladores PI e PID que leve em conta os objetivos de rastreamento do sinal de referˆencia, a rejei¸c˜ao de sinais externos de per-turba¸c˜ao e a satura¸c˜ao do sinal de controle. A utiliza¸c˜ao de algoritmos gen´eticos na solu¸c˜ao do problema de otimiza¸c˜ao proposto ´e considerada na Se¸c˜ao 4. Na Se¸c˜ao 5 ´e apresentado um exem-plo ilustrativo e s˜ao feitas algumas considera¸c˜oes sobre a existˆencia de solu¸c˜oes. Finalmente, as con-clus˜oes s˜ao apresentadas na Se¸c˜ao 6.
2 Estabiliza¸c˜ao de sistemas realimentados utilizando controladores P, PI e PID Considere o diagrama de blocos da figura 1 em que G(s) e K(s) denotam, respectivamente, a planta a ser controlada e o controlador a ser projetado, u(t) ´e o sinal de controle, e(t) ´e o sinal do erro, que ´e a diferen¸ca entre o sinal de referˆencia r(t) e o sinal de sa´ıda medido y(t), d(t) representa um sinal externo de perturba¸c˜ao, N (s) ´e o ruido de
- - - -6 ? ?
Figura 1. Diagrama de blocos de um sistema realimentado com controlador.
medi¸c˜ao e x(t) ´e o sinal de sa´ıda. O controlador a ser considerado neste trabalho ´e o do tipo PID cuja forma geral ´e:
u(t) = kpe(t) + ki
Z t
0
e(λ)dλ + kdd
dte(t) (1) sendo kp, kie kd, respectivamente, os ganhos
pro-porcional, integral derivativo. Suponha que G(s) seja descrita por uma fun¸c˜ao de transferˆencia ra-cional, isto ´e,
G(s) = B(s)
A(s) (2)
sendo B(s) e A(s) coprimos e gr[B(s)] = m e gr[A(s)] = n (m ≤ n), com gr(.) denotando o grau de um polinˆomio e considere as seguintes fa-tora¸c˜oes de B(s) e A(s):
B(s) = Be(s2) + sBo(s2) e A(s) = Ae(s2) + sAo(s2).
(3)
2.1 Caracteriza¸c˜ao de todos os controladores proporcionais estabilizantes
Seja, inicialmente, K(s) = kp. ´E f´acil verificar
que o polinˆomio caracter´ıstico de malha fechada δ(s, k) ´e dado por:
δ(s, k) = A(s) + kB(s). (4) Usando as Eqs. (3) e (4) e substituindo-se s = jω, pode-se escrever: δ(jω, k)B∗(jω) = p(ω, k) + jq(ω) (5) sendo B∗(s) = B(−s) e p(ω, k) = p1(ω) + kp2(ω), p1(ω) = [Ae(−ω2)Be(−ω2) +ω2Ao(−ω2)Bo(−ω2)], (6) p2(ω) = [Be(−ω2)Be(−ω2) +ω2B o(−ω2)Bo(−ω2)], q(ω) = ω[Be(−ω2)Ao(−ω2) −Ae(−ω2)Bo(−ω2). Defina pf(ω, k) = p(ω, k) (1 + ω2)m+n2 e qf(ω) = q(ω) (1 + ω2)m+n2 . (7) e suponha que 0 = ω0 < ω1 < ω2 < . . . < ωl−1
e finitos de qf(ω) com multiplicidade ´ımpara.
Forme um conjunto A de todas as poss´ıveis seq¨uˆencias de n´umeros i0, i1, i2, ..., il que podem
ser geradas satisfazendo as seguintes condi¸c˜oes: (i) Se B∗(jω
t) = 0 para algum t = 1, 2, . . . , l − 1,
ent˜ao define-se it= 0; caso contr´ario it∈ {−1, 1};
(ii) Se B∗(jω
t) tem um zero de multiplicidade p
na origem, ent˜ao define-se i0 = sgn[p(p)1f(0)]; caso
contr´ario i0∈ {−1, 1}, sendo p1f(ω) := p1(ω) (1 + ω2)(m+n)2 e sgn(x) = ½ 1, x ≥ 0 0, x < 0 .
(iii) il = 0 se m + n ´e ´ımpar; il ∈ {−1, 1}
se m + n ´e par. Para cada um dos elementos I = {i0, i1, . . . , il} do conjunto A obtido acima,
calcule a sua assinatura imagin´aria γ(I) da se-guinte forma: suponha que 0 = ω0 < ω1 < ω2 <
. . . < ωl−1 denotem os zeros reais, n˜ao-negativos,
distintos e finitos de qf(ω) com multiplicidade
´ımpar e defina ωl= ∞. Ent˜ao:
γ(I) := {i0− 2i1+ 2i2+ . . . + (−1)l−12il−1+ (−1)li l}(−1)l−1sgn[q(∞)], m + n par {i0− 2i1+ 2i2+ · · · + (−1)l−12il−1} (−1)l−1sgn[q(∞)], m + n ´ımpar (8)
Forme agora o conjunto F∗ com os elementos
do conjunto A cujas assinaturas s˜ao iguais a n − {l[B(s)] − r[B(s)], isto ´e:
F∗= {I ∈ A : γ(I) = n − {l[B(s)] − r[B(s)]},
sendo l(.) e r(.) os n´umeros de ra´ızes de B(s) nos semi-planos esquerdo e direito do plano s, respec-tivamente. A estabiliza¸c˜ao de sistemas realimen-tados com controladores proporcionais ´e regida pelo seguinte teorema.
Teorema 1 (Datta et al., 2000) O problema da estabiliza¸c˜ao de sistemas realimentados compensa-dos com controladores proporcionais realimentado tem solu¸c˜ao para uma dada planta com fun¸c˜ao de transferˆencia G(s) se e somente se as seguintes condi¸c˜oes s˜ao asseguradas:
(i) F∗ ´e n˜ao vazio e
(ii) Existe uma seq¨uencia I = {i0, i1, . . . , il} ∈ F∗
tal que max it∈I,it>0 · − 1 G(jωt) ¸ < min it∈I,it<0 · − 1 G(jωt) ¸ . Al´em disso, se a condi¸c˜ao acima ´e satisfeita pe-las seq¨uencias vi´aveis I1, I2, . . . , Is ∈ F∗, ent˜ao
o conjunto de todos os ganhos que estabilizam o sistema ´e dado por K = ∪s
r=1Kr, sendo Kr = ( max it∈I,it>0 [− 1 G(jωt) ], min it∈I,it<0 [− 1 G(jωt) ]), r = 1, 2, . . . , s. (9) ¤
aNote que estes zeros s˜ao independentes de kp.
2.2 Caracteriza¸c˜ao de todos os controladores PI estabilizantes
Sendo, agora, o controlador do tipo PI, K(s), ter´a a seguinte fun¸c˜ao de transferˆencia:
K(s) = kp+ki
s =
ki+ kps
s .
Conseq¨uentemente o polinˆomio caracter´ıstico de malha fechada ser´a
δ(s, kp, ki) = sA(s) + (ki+ kps)B(s). (10)
Fatorando B(s) e A(s) de acordo com a Eq. (3), calculando δ(s, kp, ki)B∗(s) e, substituindo s =
jω, obt´em-se: Substituindo s = jω, obt´em-se: δ(jω, kp, ki)B∗(jω) = p(ω, ki) + jq(ω, kp) (11) sendo p(ω, ki) = p1(ω) + kip2(ω) q(ω, kp) = q1(ω) + kpq2(ω) p1(ω) = −ω2(Be(−ω2)Ao(−ω2) −Ae(−ω2)Bo(−ω2)) p2(ω) = Be(−ω2)Be(−ω2) +ω2B o(−ω2)Bo(−ω2)) q1(ω) = ω(Ae(−ω2)Be(−ω2) +ω2A o(−ω2)Bo(−ω2)) q2(ω) = ω(Be(−ω2)Be(−ω2) +ω2B o(−ω2)Bo(−ω2)) (12)
De forma an´aloga `a Se¸c˜ao 2.1, definindo
pf(ω, ki) = p(ω, ki)
(1 + ω2)m+n2 , qf(ω, kp) =
q(ω, kp)
(1 + ω2)m+n2 ,
(13)
tem-se que kie kpaparecem somente em pf(ω, ki)
e qf(ω, kp), respectivamente. Al´em disso, para
todo kp fixo, os zeros de q(ω, kp) n˜ao dependem
de ki e, portanto, os resultados apresentados na
Se¸c˜ao 2.1 podem ser aplicados para encontrar (se existir) os intervalos de ki que tornam o sistema
realimentado est´avel para um dado valor de kp.
Assim variando-se o valor de kp e resolvendo-se o
problema de estabiliza¸c˜ao para o controlador pro-porcional, expresso agora para ki, encontra-se os
intervalos desejados para ki. Deve ser ressaltado
que o intervalo da “varredura” de kp n˜ao precisa
ser (−∞, ∞). Em muitos casos pode-se reduzir este intervalo fazendo-se uso de conceitos utili-zados na constru¸c˜ao do lugar das ra´ızes. Para tanto, escreva q(ω, kp) = ω[U (ω) + kpV (ω)], como
U (ω) = Ae(−ω2)Be(−ω2)+ω2Ao(−ω2)Bo(−ω2) e
V (ω) = Be(−ω2)Be(−ω2) + ω2Bo(−ω2)Bo(−ω2).
´
E f´acil verificar que q(ω, kp) tem pelo menos uma
ra´ız real, n˜ao-negativa na origem e, assim, para se determinar os zeros reais 0 = ω0 < ω1 <
ω2 < . . . < ωl−1 n˜ao-negativos, distintos e
fini-tos de qf(ω) com multiplicidade ´ımpar para
dife-rentes intervalos de kp basta achar os valores de
kpcorrespondentes aos pontos de partida/chegada
no eixo real. Definindo-se kp0 = −∞ e kpz+1 =
m´ultiplas de U (ω) + kpV (ω) = 0 que
correspon-dem aos valores de kpi,i = 1, 2, . . . , z + 1. Note
ainda que para kp∈ (kpi, kpi+1), as ra´ızes reais de
U (ω) + kpV (ω) = 0 s˜ao simples e o n´umero de
ra´ızes reais de U (ω) + kpV (ω) = 0 ´e invariante.
2.3 Caracteriza¸c˜ao dos controladores PID esta-bilizantes
Nesse caso o controlador ter´a a seguinte fun¸c˜ao de transferˆencia:
K(s) = kp+ki
s + ks=
ki+ kps + kds2
s . (14)
Nessa Se¸c˜ao, ser´a mostrado como o resultado da Se¸c˜ao 2.2, pode ser estendido para resolver o pro-blema de se determinar os ganhos kp, ki, e kd,
para que o sistema realimentado da figura 1 seja est´avel. Procedendo-se como nas se¸c˜oes 2.1 e 2.2, obt´em-se inicialmente as decomposi¸c˜oes de B(s) e A(s) em suas partes par e ´ımpar. Em seguida, multiplicando-se o polinˆomio caracter´ıstico de ma-lha fechada δ(s, kp, ki, kd) por B∗(s) e, finalmente,
fazendo a substitui¸c˜ao s = jω, obt´em-se:
δ(jω, kp, ki, kd)B∗(jω) = p(ω, ki, kd) + jq(ω, kp), sendo p(ω, ki, kd) = p1(ω) + (ki− kdω2)p2(ω); q(ω, kp) = q1(ω) + kpq2(ω); p1(ω) = −ω2(Be(−ω2)Ao(−ω2) −Ae(−ω2)Bo(−ω2)); p2(ω) = Be(−ω2)Be(−ω2) (15) +ω2Bo(−ω2)Bo(−ω2)); q1(ω) = ω(Ae(−ω2)Be(−ω2) +ω2A o(−ω2)Bo(−ω2)); q2(ω) = ω(Be(−ω2)Be(−ω2) +ω2B o(−ω2)Bo(−ω2)). Definindo pf(ω, ki, kd) = p(ω, ki) (1 + ω2)m+n2 , qf(ω, kp) = q(ω, kp) (1 + ω2)m+n2 , (16)
vˆe-se, mais uma vez, que ki e kd aparecem
so-mente em p(ω, ki, kd) e que kp aparece somente
em q(ω, kp). Assim para todo kp fixo, os zeros de
q(ω, kp) n˜ao dependem de ki ou de kd e, ent˜ao,
pode-se usar o resultado encontrado na Se¸c˜ao 2.1 para determinar os valores de ki e kd que tornam
o sistema realimentado est´avel. Contudo, como para cada valor de kp, duas vari´aveis devem ser
determinadas, utiliza-se programa¸c˜ao linear para encontrar os intervalos de kie kdassociados a cada
kp.
Seja gr[δ(s, kp, ki, kd)] = nδ e considere a
fun¸c˜ao qf(w) definida pela Eq. (16). Suponha
que 0 = ω0 < ω1 < ω2 < . . . < ωl−1 denotem
os zeros reais, n˜ao-negativos, distintos e finitos de qf(ω) com multiplicidade ´ımpar. Crie seq¨uencias
de n´umeros i0, i1, i2, . . . , ilda seguinte forma:
(i) Se B∗(jω
t) = 0 para algum t = 1, 2, . . . , l − 1,
ent˜ao it= 0 e caso contr´ario it∈ {−1, 1}
(ii) Se B∗(jω
t) tem uma zero de multiplicidade kn
na origem, fa¸ca i0= sgn[pk1fn(0)] e caso contr´ario
i0∈ {−1, 1},
sendo
p1f(ω) :=
p1(ω)
(1 + ω2)(m+n)2 ;
(iii) Para todos os outros t = 0, 1, 2, . . . , l, se it ∈ {−1, 1}. Al´em disso, e nδ + m ´e par,
il ∈ {−1, 1} e se nδ+ m ´e ´ımpar, il = 0. Forme
o seguinte conjunto Akp = {I = {i0, i1, . . . , il} :
Isatisfa¸ca as condi¸c˜oes (i) e (iii)}. Para cada I ∈ Akp, calcule a sua assinatura imagin´aria:
γ(I) := {i0− 2i1+ 2i2+ . . . + (−1)l−12il−1+ (−1)lil} (−1)l−1sgn[q(∞, k p)] para m + nδpar {i0− 2i1+ 2i2+ . . . + (−1)l−12il−1} (−1)l−1sgn[q(∞, k p)] para m + nδ´ımpar , e forme o conjunto Fk∗p= {I ∈ Akp: γ(I) = n − [l(B(s)) − r(B(s))].}
A estabiliza¸c˜ao de sistemas realimentados utilizando controladores PID ´e regida pelo seguinte teorema. Teorema 2 (Datta et al., 2000) O problema da es-tabiliza¸c˜ao de controladores PID, com um kp fixo, ´e
resolvido para uma dada planta com fun¸c˜ao de trans-ferˆencia G(s) se e somente se as seguintes condi¸c˜oes s˜ao satisfeitas:
(i) F∗
kp n˜ao ´e vazio e,
(ii) Existe uma seq¨uencia I = {i0, i1, . . . il} ∈ Fk∗p e
valores de ki e kd tais que ∀t = 0, 1, 2, . . . , l para os
quais, B∗(jω t) 6= 0,
p(ωt, ki, kd)it> 0, (17)
sendo p(ωt, ki, kd)it definido de acordo com a Eq.
(15). Al´em disso, se existirem valores de ki e kd
que satisfa¸cam a condi¸c˜ao acima para as seq¨uencias vi´aveis I1, I2, . . . , Is ∈ Fk∗p, ent˜ao o conjunto de
valores de (ki, kd) que levam a controladores PID
que estabilizam o sistema realimentado, correspon-dente a um kp fixo, ´e a uni˜ao dos valores de (ki, kd)
que satisfazem a desigualdade (17) para I1, I2, . . . , Is.
¤
3 Funcionais de custo quadr´aticos para
ajuste dos parˆametros de controladores PI
e PID
Uma maneira de se considerar o objetivo de desempe-nho transit´orio no projeto de controladores ´e atrav´es da formula¸c˜ao de um problema de otimiza¸c˜ao definido em termos de uma fun¸c˜ao de custo quadr´atica J, de-finida da seguinte forma:
sendo e(t) o sinal do erro, yd(t) a componente do sinal
de perturba¸c˜ao no sinal de sa´ıda y(t) e α ∈ R∗´e
uti-lizado para estabelecer uma pondera¸c˜ao entre os ob-jetivos de rastreamento e de rejei¸c˜ao de perturba¸c˜ao. Utilizando o teorema de Parseval (Lathi, 1968), tem-se que a Eq. (18) ´e equivalente a:
J = kEk2
2+ αkYdk22, (19)
send E(s) e Yd(s), respectivamente, as transformadas
de Laplace dos sinais e(t) e yd(t). O funcional de custo
(19) pode ser modificado com o objetivo de limitar o sinal de controle (Basilio, 1989), da seguinte forma:
J = kEwk22+ αkYdk22, (20)
sendo
Ew(s) = W (s)E(s), (21)
com W (s) descrito pela seguinte fun¸c˜ao racional W (s) = s + γ
s + β, (22)
em que γ, β ∈ R+. Note que o termo W (s) funciona
como uma fun¸c˜ao de pondera¸c˜ao, que produz o efeito
de bloquear sinais de alta ou de baixa freq¨uˆencia,
de-pendendo dos valores de γ e β; quando γ ´e maior que β os sinais de baixa freq¨uˆencia presentes em e(t) s˜ao atenuados e quando o contr´ario ocorre (isto ´e γ < β),
os sinais de alta freq¨uˆencia presentes em e(t) s˜ao
ate-nuados. Dessa forma, os parˆametros γ e β represen-tam novos parˆametros de projeto a serem arbitrados pelo projetista. Sendo G(s) descrita pela Eq. (2), R(s) = R/s, D(s) = D/s (R, D ∈ R e notando que K(s) pode ser escrito como
K(s) = C(s) s ,
em que C(s) = kps+kipara controladores PI e C(s) =
kds2+ kps + ki para controladores PID, n˜ao ´e dif´ıcil
verificar que Ew(s) e Yd(s) podem ser escritos como:
Ew(s) = (s + γ)A(s)R
(s + β)(sA(s) + B(s)C(s)),
Yd(s) = B(s)D
sA(s) + B(s)C(s).
Observa¸c˜ao 1 O uso de normas quadr´aticas, al´em
de permitir considerar os objetivos de projetos aqui perseguidos, possui ainda a vantagem adicional de que seu computo pode ser feito diretamente de uma repre-senta¸c˜ao em espa¸co de estados associada `a fun¸c˜ao ra-cional e do c´alculo do gramiano de controlabilidade. Isso representa uma vantagem significativa, uma vez que as vari´aveis a serem determinadas aparecem nos coeficientes dos polinˆomios das fun¸c˜oes racionais cu-jas normas devem ser calculadas. Assim, o problema de otimiza¸c˜ao definido para o custo definido pela Eq. (20) n˜ao possui solu¸c˜ao fechada, exigindo ent˜ao uma busca no espa¸co de parˆametros (kp, ki, kd). ¤
4 Uso de algoritmos gen´eticos no ajuste dos
parˆametros de controladores PI e PID
´
otimos quadr´aticos
Os algoritmos gen´eticos (AG) s˜ao uma fam´ılia de mo-delos computacionais, que ´e inspirada na teoria da evolu¸c˜ao de Charles Darwin (sobrevivˆencia do mais
apto). S˜ao m´etodos de busca estoc´asticos baseados no mecanismo de sele¸c˜ao natural e gen´etica natural (Dasgupta e Michalewicz, 2001) e tentam “imitar ” a teoria de a adapta¸c˜ao do indiv´ıduo que ´e mais forte no meio onde ele se encontra, por isso tem mais chance de sobrevivˆencia. Assim o algoritmo gera popula¸c˜oes de indiv´ıduos que ser˜ao mais ou menos aptos a de-terminados meios (fun¸c˜ao que se quer otimizar). A partir da´ı, os melhores indiv´ıduos v˜ao gerar novos (e melhores)indiv´ıduos at´e que se chegue a solu¸c˜ao do problema. A popularidade dos AGs se deve, principal-mente, a dois fatos: s˜ao robustos e aplic´aveis a uma grande variedade de problemas e s˜ao eficazes e efici-entes, j´a que acham solu¸c˜oes boas e, inclusive, ´otimas para o problema, em um tempo razo´avel. A estrutura b´asica do AG pode ser descrita pelo seguinte algo-ritmo.
Algoritmo 1
Passo 1: Iniciar o n´umero da gera¸c˜ao, i=1.
Passo 2: Gerar uma popula¸c˜ao aleat´oria de
cromos-somos Pi.
Passo 3: Calcular a Fun¸c˜ao Objetivo de cada
cromos-somo e a sua probabilidade de sobrevivˆencia.
Passo 4: Se for alcan¸cado o n´umero m´aximo de
gera¸c˜oes, terminar o processo.
Passo 5: Baseado na probabilidade de sobrevivˆencia, realizar a sele¸c˜ao e reprodu¸c˜ao dos melhores in-div´ıduos gerando a popula¸c˜ao Pi1.
Passo 6: Aplicar o operador de Cruzamento `a po-pula¸c˜ao Pi1, gerando a popula¸c˜ao Pi2.
Passo 7: Aplicar o operador de Muta¸c˜ao `a popula¸c˜ao
Pi2 gerando a popula¸c˜ao Pi+1.
Passo 8: Incrementar i e voltar ao passo 3. ¤
De acordo com o algoritmo 1, para a obten¸c˜ao do controlador PID ´otimo utilizando o algoritmo gen´etico, o primeiro passo ´e a gera¸c˜ao da popula¸c˜ao inicial. Nesse artigo, foi utilizada uma popula¸c˜ao com 50 indiv´ıduos (N=50). A partir desta popula¸c˜ao, ´e feita a avalia¸c˜ao da probabilidade de sobrevivˆencia da mesma. Nesta etapa deve-se calcular os valores da fun¸c˜ao custo descrita pela Eq. (20) para cada in-div´ıduo da popula¸c˜ao inicial, sendo importante veri-ficar se o indiv´ıduo (ponto) est´a dentro da regi˜ao de estabilidade, uma vez que se o sistema n˜ao for est´avel, n˜ao ´e poss´ıvel calcular o gramiano de controlabilidade utilizando-se a equa¸c˜ao de Lyapunov. Uma maneira de se contornar esse problema ´e utilizar, para os in-div´ıduos fora da regi˜ao de estabilidade, uma outra fun¸c˜ao uma fun¸c˜ao constante com um valor relativa-mente alto, para que o valor m´ınimo esteja sempre dentro da regi˜ao de estabilidade. Calculada a pro-babilidade de sobrevivˆencia de cada indiv´ıduo da po-pula¸c˜ao inicial, faz-se ent˜ao a sele¸c˜ao dos indiv´ıduos que tem as melhores probabilidades de adapta¸c˜ao. Para esta etapa, foi utilizado o m´etodo de sele¸c˜ao “Stochastic Universal Sampling” (Baker, 1987). A partir dos indiv´ıduos selecionados, faz-se ent˜ao o cru-zamento destes. Neste artigo utilizou-se a
probabili-dade de cruzamento Px= 0, 7. Ap´os esta etapa,
tem-se que utilizar o operador muta¸c˜ao nestes indiv´ıduos. Neste caso a probabilidade de muta¸c˜ao utilizada foi
Pm = 0, 01. Com os indiv´ıduos criados depois de
−100 −5 0 5 0.5 1 1.5 2 2.5 3 3.5 4 kp ki (a) 0 5 10 −8 −6 −4 −2 0 2 4 6 8 −10 −8 −6 −4 −2 0 2 4 kd ki kp (b)
Figura 2. Conjunto de pontos (kp, ki) (a) e (kp, ki, kd) (b) que estabilizam a planta do exemplo 1.
que o n´umero m´aximo de gera¸c˜oes seja alcan¸cado. O
n´umero m´aximo de gera¸c˜oes aqui adotado ´e 60. Ap´os
alcan¸car este n´umero de gera¸c˜oes, o melhor indiv´ıduo
da ´ultima gera¸c˜ao ´e o resultado final do processo de
otimiza¸c˜ao.
5 Exemplos
Ser´a agora apresentado um exemplo num´erico para ilustrar a metodologia proposta nesse artigo. Para a obten¸c˜ao dos controladores PI e PID ´otimos, foi utili-zada a biblioteca de fun¸c˜oes Matlab desenvolvida por Chipperfield et al. (1994). Em todos os exemplos foi feito α = 1, isto ´e, mesma ˆenfase foi dada `a rejei¸c˜ao da perturba¸c˜ao e ao rastreamento do sinal de referˆencia, R(s) = 1/s e D(s) = 1/s.
Considere uma planta com a seguinte fun¸c˜ao de transferˆencia (Datta et al., 2000):
G(s) = s
3− 4s2+ s + 2
s5+ 8s4+ 32s3+ 46s2+ 46s + 17. (23)
A dificuldade dessa planta reside no fato de ser inst´avel, fase n˜ao-m´ınima e ter grau relativo igual a 2. As regi˜oes de estabilidade para controladores PI e PID est˜ao mostradas nas Figs. 2(a) e (b). Deve ser salientando que no tra¸cado dessas regi˜oes, o mais importante ´e encontrar os pontos extremos, uma vez que esses definir˜ao uma caixa onde ser˜ao geradas as popula¸c˜oes.
Utilizando algoritmo gen´etico, tem que, ap´os al-gumas itera¸c˜oes, chega-se aos valores de γ = 0, 6 e β = 2 e, conforme descrito na Se¸c˜ao 4, obt´em-se os seguintes controladores: KP I(s) = 1, 1721 + 1, 6715 s , KP ID(s) = 1, 5642 + 2, 4249 s + 1, 8878s. (24) Os desempenhos dos sistemas compensados com os controladores acima est˜ao mostrados nas Figs. 3(a) e (b) (azul/verde para a resposta do sistema realimen-tado ao controlador PI/PID); a Fig. 3(a) mostra as respostas ao degrau e a Fig. 3(b) mostra os correspon-dentes sinais de controle. Note que a introdu¸c˜ao da a¸c˜ao derivativa melhorou a resposta transit´oria ao si-nal de referˆencia, por´em houve uma leve degenera¸c˜ao da rejei¸c˜ao do sinal de perturba¸c˜ao. Os ´ındices de desempenho dos sistemas compensados com os con-troladores PI e PID acima est˜ao mostrados na Tab.
1. Na Tab. 1, tr, ts, tp e tspert denotam,
respec-tivamente, os tempos de subida, acomoda¸c˜ao, pico e o intervalo de tempo decorrido desde a aplica¸c˜ao do sinal de perturba¸c˜ao at´e o instante a partir do qual a resposta permanece em um intervalo de ±2% do
valor de regime permanente, yinf denota o valor de
regime permanente da resposta, P O(%) e E(%) de-notam, respectivamente, os percentuais de ultrapassa-gem das respostas ao degrau e ao sinal de perturba¸c˜ao, respectivamente.
Observa¸c˜ao 2
1. Deve ser destacado que a implementa¸c˜ao do contro-lador PID foi feita modificando-se o termo derivativo de forma a atuar sobre o sinal de sa´ıda e introduzindo-se um p´olo em N/kd. Assim, o sinal de sa´ıda do
con-trolador UK(s) ser´a, para efeitos de implementa¸c˜ao,
escrito como: UD(s) = (kp+ki s)E(s) − kds τds + 1 Y (s), sendo τd= kp/N no lugar da transformada de Laplace
da equa¸c˜ao (1).
2. Embora tenham sido obtidos controladores PI e PID para a planta descrita pela fun¸c˜ao de trans-ferˆencia (23), nem sempre ´e poss´ıvel estabilizar plan-tas inst´aveis com controladores PI ou PID. Por exem-plo, para a planta com fun¸c˜ao de transferˆencia
G(s) = s
2+ 8, 5s + 17, 5
s4− 15s2+ 10s + 24,
a regi˜ao de estabilidade para controladores PI e PID ´e vazia. Nesse caso, o m´etodo proposto neste artigo n˜ao poder´a ser usado. Isso n˜ao representa uma de-ficiˆencia do m´etodo e, sim, da estrutura do controla-dor adotada; nem toda planta inst´avel pode ser esta-bilizada utilizando-se controladores PI ou PID (Datta
et al., 2000). ¤
6 Conclus˜ao
Uma maneira sistem´atica de se utilizar a regi˜ao de es-tabilidade para controladores PI e PID proposta por Datta et al. (2000) no projeto de controladores PI e PID ´otimo para plantas inst´aveis e tamb´em est´aveis foi proposta nesse artigo. O algoritmo ´e de f´acil im-plementa¸c˜ao, o que d´a a ele um grande potencial de
Tabela 1. ´Indices de desempenho relativos ao sistema rea-limentado do exemplo 1
M´etodo/ Controlador Controlador
´ındices PI PID tr 7,7141 4,6856 ts 16,9232 6,4027 yinf 1,0000 1,0000 tp – 5,4400 PO(%) 0,0000 4,8159 umax 9,6087 9,7471 tspert 12,2182 5,9297 E(%) 18,7717 19,6717 0 10 20 30 40 50 60 70 80 90 100 −0.2 0 0.2 0.4 0.6 0.8 1 1.2 1.4 Tempo − t Resposta − y(t) (a) 0 10 20 30 40 50 60 70 80 90 100 1 2 3 4 5 6 7 8 9 10 Tempo − t
Sinal de controle − u(t)
(b)
Figura 3. Resposta ao degrau e ao sinal de perturba¸c˜ao (a) e sinal de controle (b) para o sistema compensado com os controladores PI (linha azul) e PID (linha verde) dados na Eq. (24).
Agradecimentos
Os autores gostariam de agradecer ao CNPq pelo apoio financeiro, `a Profa. Vilma Alves de Oliveira, pelas discuss˜oes extremamente construtivas e ao Prof. Bhattacharyya pelo encorajamento para submiss˜ao desse artigo para publica¸c˜ao.
Referˆencias
Astrom, K. J. e Hagglund, T. (2004). Revisiting the ziegler-nichols step response method for PID con-trol, Journal of Process Control 14: 635–650. Baker, J. E. (1987). Reducing bias and inefficiency in
the selection algorithm, Proceedings of the Second International Conference on Genetic Algorithms and their Application, Hillsdale, pp. 14–21. Basilio, J. C. (1989). Controle ´otimo quadr´atico no
dom´ınio da freq¨uˆencia com objetivos de rastrea-mento de sinais limitados e margem de estabili-dade, Tese de Mestrado, Instituto Militar de En-genharia.
Chipperfield, A., Fleming, P., Pohleim, H. e Fonseca, C. (1994). Genetic Algorithm Toolbox, version 1.2, Department of Automatic Control and Sys-tems Engineering, University of Sheffield. Cominos, P. e Munro, N. (2002). PID controllers:
re-cent tuning methods and design to specification, IEE Proceedings 149(1): 46–53.
Dasgupta, D. e Michalewicz, Z. (2001). Evolutionary Algorithms in Engineering Applications, Sprin-ger.
Datta, A., Ho, M. T. e Bhattacharyya, S. P. (2000). Structure and Synthesis od PID Controllers, Springer.
Ge, M., Chiu, M. S. e Wang, Q. G. (2001). Robust PID controller design via LMI approach, Journal of Process Control 12: 3–13.
Ho, M. T., Datta, A. e Bhattacharyya, S. (2001). Ro-bust and non-fragile PID controller design, Inter-national Journal of Robust and Nonlinear Con-trol 11(7): 681–708.
Lathi, B. (1968). Communication Systems, John Wi-ley & Sons Inc.
Oviedo, J. J. E., Oelen, T. e Overshee, P. V. (2006). Robust advanced PID control (RaPID)- PID tu-ning based o engineering specifications, IEEE Control Systems Magazine 26(1): 15–19. Shafiei, Z. e Shenton, A. T. (1994). Tuning of
PID-type controllers for stable and unstable systems with time delay, Automatica 30: 1609–1615. Silva, G. J., Datta, A. e Bhattacharyya, S. P.
(2004). PID Controllers for Time Delay Systems, Birkh¨auser.
Toscano, R. (2004). A simple robust PI/PID controller design via numerical optimation approach, Jour-nal og Process Control 15: 81–88.