João C. Basilio, Victor N. Nogueira

(1)

AJUSTE DE CONTROLADORES PI E PID PARA PLANTAS EST ´AVEIS E INST ´AVEIS

Jo˜ao C. Basilio, Victor N. Nogueira Universidade Federal do Rio de Janeiro COPPE - Programa de Engenharia El´etrica

Cidade Universit´aria - Ilha do Fund˜ao 21.945-970 - Rio de Janeiro - R. J.

E-mails: basilio@dee.ufrj.br, vicnn@uol.com.br

Resumo— Uma maneira sistemática de se obter a região de estabilidade para os controladores P, PI e PID para uma dada planta modelada por uma fun¸c˜ao de transferência racional, isto é, um conjunto de pontos kp, (kp, ki) e (kp, ki, kd) que tornam o sistema realimentado estável foi recentemente apresentada. Contudo, nos trabalhos que se seguiram não foi feito uso dessa região para se projetar controladores PI e PID que atendam outros objetivos de projeto, tais como melhoria dos regimes transitórios da resposta a sinais de referências e da rejei¸cão de perturba¸cão de sinais do tipo degrau. Neste artigo será proposto um método de ajuste dos controladores PID, supondo conhecida a fun¸cão de transferência da planta. Será utilizado um critério de otimiza¸cão quadrático em que fazem parte desta fun¸cão a norma quadrática do sinal do erro e da componente do sinal de perturba¸cão no sinal de sa´ıda. Para minimizar este custo, que é fun¸cão dos parâmetros do controlador PID, será utilizado algoritmo Genético, onde o espa¸co da busca será a região na qual o sistema em malha fechada é estável. Uma vez que a varredura será feita sobre a região de estabilidade, os controladores PI e PID obtidos garantem a estabilidade do sistema realimentado para plantas estáveis ou instáveis.

Abstract— A systematic way to obtain the stability region for PI and PID controllers for a plant modeled by a rational transfer function, i.e., the set of points kp, (kp, ki) and (kp, ki, kd) that make the closed-loop system stable has been recently presented. However, in the works that followed this result, use has not been made of this parametrization to design PI and PID controllers that address other design objectives, such as, transient performance with respect to reference step signal and disturbance rejection to step signal, as well. In this paper, a new method for tuning PI and PID controllers is proposed, assuming that the plant transfer function is known. A quadratic optimization criterion formed by the l2-norms of the error signal and of the output component of

the disturbance signal will be used. In order to search for the controller parameter which minimizes this cost function, genetic algorithm is used, where the feasibility region is given by the PI and PID stability region. Since the search is carried out over the stability region, the PI and PID controllers obtained ensure closed-loop stability for both stable and unstable plants.

Key Words— PID controller design, optimal control, genetic algorithm.

1 Introdu¸c˜ao

Os controladores PID têm sido muito utilizados em sistemas de controles industriais há décadas, mais precisamente, desde que, Ziegler e Nichols propuseram o primeiro método de ajuste de con-troladores PID (Ziegler e Nichols, 1942), tendo a capacidade de estabilizar e controlar cerca de 90% dos processos industriais existentes Oviedo et al. (2006). Com o objetivo de comparar as diversas técnicas de projeto, Cominos e Munro (2002) de-senvolveram um trabalho, resumindo alguns dos métodos recentes de projetos de controladores PID, tais como: o método de Ziegler-Nichols, de re-aloca¸cão de pólos, projetos baseados em especi-fica¸cões em ganhos de fase e de margem, técnicas de polinômios de intervalos, projetos baseados no teorema da estabilidade de Nyquist, Algoritmo Genéticos para ajustes de PID, ajustes de PID uti-lizando a teoria da intera¸cão adaptativa, métodos baseados em cancelamento, métodos de integra¸cão de magnitude múltipla ótima, entre outras, vi-sando apresentar vantagens e desvantagens destes métodos.

Mais recentemente, outros m´etodos de ajuste

de parâmetros de controladores PID foram desen-volvidos visando melhorar o desempenho de sis-temas realimentados com este controlador. Ge et al. (2001) propuseram um método de pro-jeto de controladores PID robustos em que uti-lizam técnicas padrões como reguladores lineares quadráticos (LQR) e H∞e solucionam o problema

(2)

con-tudo caracterizar as condi¸cões necessárias para a estabiliza¸cão das plantas instáveis pelos controla-dores PID.

O problema da estabiliza¸cão de plantas estáveis e instáveis utilizando controladores P, PI e PID foi considerado em Datta et al. (2000) e Silva et al. (2004); esse último para sistemas com atraso. Nesses trabalhos, diferentemente da abor-dagem apresentada por (Shafiei e Shenton, 1994), foi apresentada uma caracteriza¸cão dos controla-dores PI e PID estabilizantes, isto é, conjuntos de pontos kp, (kp, ki) e (kp, ki, kd) cujos

contro-ladores PI e PID tornam o sistema realimentado estável. Contudo, uso não foi feito dessa região para considerar outros objetivos de projeto, tais como resposta transitória e rejei¸cão de sinais ex-ternos de perturba¸cão.

Nesse artigo será proposto um método de ajuste dos controladores PID, supondo conhecida a fun¸cão de transferência da planta. Será utili-zado um critério de otimiza¸cão quadrático em que fazem parte desta fun¸cão a norma quadrática do sinal do erro e da componente do sinal de per-turba¸cão no sinal de sa´ıda. Para minimizar este custo, que é fun¸cão dos parâmetros do contro-lador PID, será utilizado o Algoritmo Genético, onde o espa¸co da busca será a região na qual o sistema de malha fechada é estável, ou seja, os pontos (kp, ki, kd) que tornam o sistema

compen-sado estável. Uma vez que a varredura é feita sobre a região de estabilidade, os controladores PI e PID obtidos garantem a estabilidade do sistema realimentado para plantas estáveis ou instáveis.

Esse artigo está estruturado da seguinte forma. A Se¸cão 2 apresenta uma breve revisão do problema da estabiliza¸cão de sistemas realimenta-dos utilizando controladores P, PI e PID resolvido em Datta et al. (2000). Na Se¸cão 3 é proposto um funcional de custo quadrático para o ajuste dos parâmetros de controladores PI e PID que leve em conta os objetivos de rastreamento do sinal de referência, a rejei¸cão de sinais externos de per-turba¸cão e a satura¸cão do sinal de controle. A utiliza¸cão de algoritmos genéticos na solu¸cão do problema de otimiza¸cão proposto é considerada na Se¸cão 4. Na Se¸cão 5 é apresentado um exem-plo ilustrativo e são feitas algumas considera¸cões sobre a existência de solu¸cões. Finalmente, as con-clusões são apresentadas na Se¸cão 6.

2 Estabiliza¸cão de sistemas realimentados utilizando controladores P, PI e PID Considere o diagrama de blocos da figura 1 em que G(s) e K(s) denotam, respectivamente, a planta a ser controlada e o controlador a ser projetado, u(t) é o sinal de controle, e(t) é o sinal do erro, que é a diferen¸ca entre o sinal de referência r(t) e o sinal de sa´ıda medido y(t), d(t) representa um sinal externo de perturba¸cão, N (s) é o ruido de

- - - -6 ? ?

Figura 1. Diagrama de blocos de um sistema realimentado com controlador.

medi¸cão e x(t) é o sinal de sa´ıda. O controlador a ser considerado neste trabalho é o do tipo PID cuja forma geral é:

u(t) = kpe(t) + ki

Z t

0

e(λ)dλ + kdd

dte(t) (1) sendo kp, kie kd, respectivamente, os ganhos

pro-porcional, integral derivativo. Suponha que G(s) seja descrita por uma fun¸cão de transferência ra-cional, isto é,

G(s) = B(s)

A(s) (2)

sendo B(s) e A(s) coprimos e gr[B(s)] = m e gr[A(s)] = n (m ≤ n), com gr(.) denotando o grau de um polinˆomio e considere as seguintes fa-tora¸c˜oes de B(s) e A(s):

B(s) = Be(s2) + sBo(s2) e A(s) = Ae(s2) + sAo(s2).

(3)

2.1 Caracteriza¸c˜ao de todos os controladores proporcionais estabilizantes

Seja, inicialmente, K(s) = kp. ´E f´acil verificar

que o polinˆomio caracter´ıstico de malha fechada δ(s, k) ´e dado por:

δ(s, k) = A(s) + kB(s). (4) Usando as Eqs. (3) e (4) e substituindo-se s = jω, pode-se escrever: δ(jω, k)B∗_{(jω) = p(ω, k) + jq(ω)} ₍₅₎ sendo B∗_{(s) = B(−s) e} p(ω, k) = p1(ω) + kp2(ω), p1(ω) = [Ae(−ω2)Be(−ω2) +ω2Ao(−ω2)Bo(−ω2)], (6) p2(ω) = [Be(−ω2)Be(−ω2) +ω2_B o(−ω2)Bo(−ω2)], q(ω) = ω[Be(−ω2)Ao(−ω2) −Ae(−ω2)Bo(−ω2). Defina pf(ω, k) = p(ω, k) (1 + ω2₎m+n₂ e qf(ω) = q(ω) (1 + ω2₎m+n₂ . (7) e suponha que 0 = ω0 < ω1 < ω2 < . . . < ωl−1

(3)

e finitos de qf(ω) com multiplicidade ´ımpara.

Forme um conjunto A de todas as poss´ıveis seq¨uˆencias de n´umeros i0, i1, i2, ..., il que podem

ser geradas satisfazendo as seguintes condi¸c˜oes: (i) Se B∗_(jω

t) = 0 para algum t = 1, 2, . . . , l − 1,

ent˜ao define-se it= 0; caso contr´ario it∈ {−1, 1};

(ii) Se B∗_(jω

t) tem um zero de multiplicidade p

na origem, ent˜ao define-se i0 = sgn[p(p)1f(0)]; caso

contr´ario i0∈ {−1, 1}, sendo p1f(ω) := p1(ω) (1 + ω2₎(m+n)2 e sgn(x) = ½ 1, x ≥ 0 0, x < 0 .

(iii) il = 0 se m + n ´e ´ımpar; il ∈ {−1, 1}

se m + n ´e par. Para cada um dos elementos I = {i0, i1, . . . , il} do conjunto A obtido acima,

calcule a sua assinatura imagin´aria γ(I) da se-guinte forma: suponha que 0 = ω0 < ω1 < ω2 <

. . . < ωl−1 denotem os zeros reais, n˜ao-negativos,

distintos e finitos de qf(ω) com multiplicidade

´ımpar e defina ωl= ∞. Ent˜ao:

γ(I) :=        {i0− 2i1+ 2i2+ . . . + (−1)l−12il−1+ (−1)l_i l}(−1)l−1sgn[q(∞)], m + n par {i0− 2i1+ 2i2+ · · · + (−1)l−12il−1} (−1)l−1_{sgn[q(∞)], m + n ´ımpar} (8)

Forme agora o conjunto F∗ _{com os elementos}

do conjunto A cujas assinaturas s˜ao iguais a n − {l[B(s)] − r[B(s)], isto ´e:

F∗_{= {I ∈ A : γ(I) = n − {l[B(s)] − r[B(s)]},}

sendo l(.) e r(.) os números de ra´ızes de B(s) nos semi-planos esquerdo e direito do plano s, respec-tivamente. A estabiliza¸cão de sistemas realimen-tados com controladores proporcionais é regida pelo seguinte teorema.

Teorema 1 (Datta et al., 2000) O problema da estabiliza¸cão de sistemas realimentados compensa-dos com controladores proporcionais realimentado tem solu¸cão para uma dada planta com fun¸cão de transferência G(s) se e somente se as seguintes condi¸cões são asseguradas:

(i) F∗ _{´e n˜ao vazio e}

(ii) Existe uma seq¨uencia I = {i0, i1, . . . , il} ∈ F∗

tal que max it∈I,it>0 · − 1 G(jωt) ¸ < min it∈I,it<0 · − 1 G(jωt) ¸ . Além disso, se a condi¸cão acima é satisfeita pe-las seqüencias viáveis I1, I2, . . . , Is ∈ F∗, então

o conjunto de todos os ganhos que estabilizam o sistema ´e dado por K = ∪s

r=1Kr, sendo Kr = ( max it∈I,it>0 [− 1 G(jωt) ], min it∈I,it<0 [− 1 G(jωt) ]), r = 1, 2, . . . , s. (9) ¤

a_{Note que estes zeros s˜}_{ao independentes de k}_p_.

2.2 Caracteriza¸c˜ao de todos os controladores PI estabilizantes

Sendo, agora, o controlador do tipo PI, K(s), terá a seguinte fun¸cão de transferência:

K(s) = kp+ki

s =

ki+ kps

s .

Conseqüentemente o polinômio caracter´ıstico de malha fechada será

δ(s, kp, ki) = sA(s) + (ki+ kps)B(s). (10)

Fatorando B(s) e A(s) de acordo com a Eq. (3), calculando δ(s, kp, ki)B∗(s) e, substituindo s =

jω, obt´em-se: Substituindo s = jω, obt´em-se: δ(jω, kp, ki)B∗(jω) = p(ω, ki) + jq(ω, kp) (11) sendo p(ω, ki) = p1(ω) + kip2(ω) q(ω, kp) = q1(ω) + kpq2(ω) p1(ω) = −ω2(Be(−ω2)Ao(−ω2) −Ae(−ω2)Bo(−ω2)) p2(ω) = Be(−ω2)Be(−ω2) +ω2_B o(−ω2)Bo(−ω2)) q1(ω) = ω(Ae(−ω2)Be(−ω2) +ω2_A o(−ω2)Bo(−ω2)) q2(ω) = ω(Be(−ω2)Be(−ω2) +ω2_B o(−ω2)Bo(−ω2)) (12)

De forma análoga à Se¸cão 2.1, definindo

pf(ω, ki) = p(ω, ki)

(1 + ω2₎m+n₂ , qf(ω, kp) =

q(ω, kp)

(1 + ω2₎m+n₂ ,

(13)

tem-se que kie kpaparecem somente em pf(ω, ki)

e qf(ω, kp), respectivamente. Al´em disso, para

todo kp fixo, os zeros de q(ω, kp) n˜ao dependem

de ki e, portanto, os resultados apresentados na

Se¸c˜ao 2.1 podem ser aplicados para encontrar (se existir) os intervalos de ki que tornam o sistema

realimentado est´avel para um dado valor de kp.

Assim variando-se o valor de kp e resolvendo-se o

problema de estabiliza¸c˜ao para o controlador pro-porcional, expresso agora para ki, encontra-se os

intervalos desejados para ki. Deve ser ressaltado

que o intervalo da “varredura” de kp n˜ao precisa

ser (−∞, ∞). Em muitos casos pode-se reduzir este intervalo fazendo-se uso de conceitos utili-zados na constru¸c˜ao do lugar das ra´ızes. Para tanto, escreva q(ω, kp) = ω[U (ω) + kpV (ω)], como

U (ω) = Ae(−ω2)Be(−ω2)+ω2Ao(−ω2)Bo(−ω2) e

V (ω) = Be(−ω2)Be(−ω2) + ω2Bo(−ω2)Bo(−ω2).

´

E f´acil verificar que q(ω, kp) tem pelo menos uma

ra´ız real, n˜ao-negativa na origem e, assim, para se determinar os zeros reais 0 = ω0 < ω1 <

ω2 < . . . < ωl−1 n˜ao-negativos, distintos e

fini-tos de qf(ω) com multiplicidade ´ımpar para

dife-rentes intervalos de kp basta achar os valores de

kpcorrespondentes aos pontos de partida/chegada

no eixo real. Definindo-se kp0 = −∞ e kpz+1 =

(4)

m´ultiplas de U (ω) + kpV (ω) = 0 que

correspon-dem aos valores de kpi,i = 1, 2, . . . , z + 1. Note

ainda que para kp∈ (kpi, kpi+1), as ra´ızes reais de

U (ω) + kpV (ω) = 0 s˜ao simples e o n´umero de

ra´ızes reais de U (ω) + kpV (ω) = 0 ´e invariante.

2.3 Caracteriza¸c˜ao dos controladores PID esta-bilizantes

Nesse caso o controlador terá a seguinte fun¸cão de transferência:

K(s) = kp+ki

s + ks=

ki+ kps + kds2

s . (14)

Nessa Se¸cão, será mostrado como o resultado da Se¸cão 2.2, pode ser estendido para resolver o pro-blema de se determinar os ganhos kp, ki, e kd,

para que o sistema realimentado da figura 1 seja estável. Procedendo-se como nas se¸cões 2.1 e 2.2, obtém-se inicialmente as decomposi¸cões de B(s) e A(s) em suas partes par e ´ımpar. Em seguida, multiplicando-se o polinômio caracter´ıstico de ma-lha fechada δ(s, kp, ki, kd) por B∗(s) e, finalmente,

fazendo a substitui¸c˜ao s = jω, obt´em-se:

δ(jω, kp, ki, kd)B∗(jω) = p(ω, ki, kd) + jq(ω, kp), sendo p(ω, ki, kd) = p1(ω) + (ki− kdω2)p2(ω); q(ω, kp) = q1(ω) + kpq2(ω); p1(ω) = −ω2(Be(−ω2)Ao(−ω2) −Ae(−ω2)Bo(−ω2)); p2(ω) = Be(−ω2)Be(−ω2) (15) +ω2Bo(−ω2)Bo(−ω2)); q1(ω) = ω(Ae(−ω2)Be(−ω2) +ω2_A o(−ω2)Bo(−ω2)); q2(ω) = ω(Be(−ω2)Be(−ω2) +ω2_B o(−ω2)Bo(−ω2)). Definindo pf(ω, ki, kd) = p(ω, ki) (1 + ω2₎m+n2 , qf(ω, kp) = q(ω, kp) (1 + ω2₎m+n₂ , (16)

vˆe-se, mais uma vez, que ki e kd aparecem

so-mente em p(ω, ki, kd) e que kp aparece somente

em q(ω, kp). Assim para todo kp fixo, os zeros de

q(ω, kp) n˜ao dependem de ki ou de kd e, ent˜ao,

pode-se usar o resultado encontrado na Se¸c˜ao 2.1 para determinar os valores de ki e kd que tornam

o sistema realimentado est´avel. Contudo, como para cada valor de kp, duas vari´aveis devem ser

determinadas, utiliza-se programa¸c˜ao linear para encontrar os intervalos de kie kdassociados a cada

kp.

Seja gr[δ(s, kp, ki, kd)] = nδ e considere a

fun¸c˜ao qf(w) definida pela Eq. (16). Suponha

que 0 = ω0 < ω1 < ω2 < . . . < ωl−1 denotem

os zeros reais, n˜ao-negativos, distintos e finitos de qf(ω) com multiplicidade ´ımpar. Crie seq¨uencias

de n´umeros i0, i1, i2, . . . , ilda seguinte forma:

(i) Se B∗_(jω

t) = 0 para algum t = 1, 2, . . . , l − 1,

ent˜ao it= 0 e caso contr´ario it∈ {−1, 1}

(ii) Se B∗_(jω

t) tem uma zero de multiplicidade kn

na origem, fa¸ca i0= sgn[pk1fn(0)] e caso contr´ario

i0∈ {−1, 1},

sendo

p1f(ω) :=

p1(ω)

(1 + ω2₎(m+n)₂ ;

(iii) Para todos os outros t = 0, 1, 2, . . . , l, se it ∈ {−1, 1}. Al´em disso, e nδ + m ´e par,

il ∈ {−1, 1} e se nδ+ m ´e ´ımpar, il = 0. Forme

o seguinte conjunto Akp = {I = {i0, i1, . . . , il} :

Isatisfa¸ca as condi¸c˜oes (i) e (iii)}. Para cada I ∈ Akp, calcule a sua assinatura imagin´aria:

γ(I) :=        {i0− 2i1+ 2i2+ . . . + (−1)l−12il−1+ (−1)lil} (−1)l−1_{sgn[q(∞, k} p)] para m + nδpar {i0− 2i1+ 2i2+ . . . + (−1)l−12il−1} (−1)l−1_{sgn[q(∞, k} p)] para m + nδ´ımpar , e forme o conjunto Fk∗p= {I ∈ Akp: γ(I) = n − [l(B(s)) − r(B(s))].}

A estabiliza¸cão de sistemas realimentados utilizando controladores PID é regida pelo seguinte teorema. Teorema 2 (Datta et al., 2000) O problema da es-tabiliza¸cão de controladores PID, com um kp fixo, é

resolvido para uma dada planta com fun¸cão de trans-ferência G(s) se e somente se as seguintes condi¸cões são satisfeitas:

(i) F∗

kp n˜ao ´e vazio e,

(ii) Existe uma seq¨uencia I = {i0, i1, . . . il} ∈ Fk∗p e

valores de ki e kd tais que ∀t = 0, 1, 2, . . . , l para os

quais, B∗_(jω t) 6= 0,

p(ωt, ki, kd)it> 0, (17)

sendo p(ωt, ki, kd)it definido de acordo com a Eq.

(15). Al´em disso, se existirem valores de ki e kd

que satisfa¸cam a condi¸cão acima para as seqüencias viáveis I1, I2, . . . , Is ∈ Fk∗p, então o conjunto de

valores de (ki, kd) que levam a controladores PID

que estabilizam o sistema realimentado, correspon-dente a um kp fixo, ´e a uni˜ao dos valores de (ki, kd)

que satisfazem a desigualdade (17) para I1, I2, . . . , Is.

¤

3 Funcionais de custo quadr´aticos para

ajuste dos parˆametros de controladores PI

e PID

Uma maneira de se considerar o objetivo de desempe-nho transitório no projeto de controladores é através da formula¸cão de um problema de otimiza¸cão definido em termos de uma fun¸cão de custo quadrática J, de-finida da seguinte forma:

(5)

sendo e(t) o sinal do erro, yd(t) a componente do sinal

de perturba¸c˜ao no sinal de sa´ıda y(t) e α ∈ R∗_´e

uti-lizado para estabelecer uma pondera¸cão entre os ob-jetivos de rastreamento e de rejei¸cão de perturba¸cão. Utilizando o teorema de Parseval (Lathi, 1968), tem-se que a Eq. (18) é equivalente a:

J = kEk2

2+ αkYdk22, (19)

send E(s) e Yd(s), respectivamente, as transformadas

de Laplace dos sinais e(t) e yd(t). O funcional de custo

(19) pode ser modificado com o objetivo de limitar o sinal de controle (Basilio, 1989), da seguinte forma:

J = kEwk22+ αkYdk22, (20)

sendo

Ew(s) = W (s)E(s), (21)

com W (s) descrito pela seguinte fun¸c˜ao racional W (s) = s + γ

s + β, (22)

em que γ, β ∈ R+_{. Note que o termo W (s) funciona}

como uma fun¸c˜ao de pondera¸c˜ao, que produz o efeito

de bloquear sinais de alta ou de baixa freq¨uˆencia,

de-pendendo dos valores de γ e β; quando γ é maior que β os sinais de baixa freqüência presentes em e(t) são atenuados e quando o contrário ocorre (isto é γ < β),

os sinais de alta freq¨uˆencia presentes em e(t) s˜ao

ate-nuados. Dessa forma, os parˆametros γ e β represen-tam novos parˆametros de projeto a serem arbitrados pelo projetista. Sendo G(s) descrita pela Eq. (2), R(s) = R/s, D(s) = D/s (R, D ∈ R e notando que K(s) pode ser escrito como

K(s) = C(s) s ,

em que C(s) = kps+kipara controladores PI e C(s) =

kds2+ kps + ki para controladores PID, n˜ao ´e dif´ıcil

verificar que Ew(s) e Yd(s) podem ser escritos como:

Ew(s) = (s + γ)A(s)R

(s + β)(sA(s) + B(s)C(s)),

Yd(s) = B(s)D

sA(s) + B(s)C(s).

Observa¸c˜ao 1 O uso de normas quadr´aticas, al´em

de permitir considerar os objetivos de projetos aqui perseguidos, possui ainda a vantagem adicional de que seu computo pode ser feito diretamente de uma repre-senta¸cão em espa¸co de estados associada à fun¸cão ra-cional e do cálculo do gramiano de controlabilidade. Isso representa uma vantagem significativa, uma vez que as variáveis a serem determinadas aparecem nos coeficientes dos polinômios das fun¸cões racionais cu-jas normas devem ser calculadas. Assim, o problema de otimiza¸cão definido para o custo definido pela Eq. (20) não possui solu¸cão fechada, exigindo então uma busca no espa¸co de parâmetros (kp, ki, kd). ¤

4 Uso de algoritmos gen´eticos no ajuste dos

parˆametros de controladores PI e PID

´

otimos quadr´aticos

Os algoritmos genéticos (AG) são uma fam´ılia de mo-delos computacionais, que é inspirada na teoria da evolu¸cão de Charles Darwin (sobrevivência do mais

apto). São métodos de busca estocásticos baseados no mecanismo de sele¸cão natural e genética natural (Dasgupta e Michalewicz, 2001) e tentam “imitar ” a teoria de a adapta¸cão do indiv´ıduo que é mais forte no meio onde ele se encontra, por isso tem mais chance de sobrevivência. Assim o algoritmo gera popula¸cões de indiv´ıduos que serão mais ou menos aptos a de-terminados meios (fun¸cão que se quer otimizar). A partir da´ı, os melhores indiv´ıduos vão gerar novos (e melhores)indiv´ıduos até que se chegue a solu¸cão do problema. A popularidade dos AGs se deve, principal-mente, a dois fatos: são robustos e aplicáveis a uma grande variedade de problemas e são eficazes e efici-entes, já que acham solu¸cões boas e, inclusive, ótimas para o problema, em um tempo razoável. A estrutura básica do AG pode ser descrita pelo seguinte algo-ritmo.

Algoritmo 1

Passo 1: Iniciar o n´umero da gera¸c˜ao, i=1.

Passo 2: Gerar uma popula¸c˜ao aleat´oria de

cromos-somos Pi.

Passo 3: Calcular a Fun¸c˜ao Objetivo de cada

cromos-somo e a sua probabilidade de sobrevivˆencia.

Passo 4: Se for alcan¸cado o n´umero m´aximo de

gera¸c˜oes, terminar o processo.

Passo 5: Baseado na probabilidade de sobrevivência, realizar a sele¸cão e reprodu¸cão dos melhores in-div´ıduos gerando a popula¸cão Pi1.

Passo 6: Aplicar o operador de Cruzamento à po-pula¸cão Pi1, gerando a popula¸cão Pi2.

Passo 7: Aplicar o operador de Muta¸cão à popula¸cão

Pi2 gerando a popula¸c˜ao Pi+1.

Passo 8: Incrementar i e voltar ao passo 3. ¤

De acordo com o algoritmo 1, para a obten¸cão do controlador PID ótimo utilizando o algoritmo genético, o primeiro passo é a gera¸cão da popula¸cão inicial. Nesse artigo, foi utilizada uma popula¸cão com 50 indiv´ıduos (N=50). A partir desta popula¸cão, é feita a avalia¸cão da probabilidade de sobrevivência da mesma. Nesta etapa deve-se calcular os valores da fun¸cão custo descrita pela Eq. (20) para cada in-div´ıduo da popula¸cão inicial, sendo importante veri-ficar se o indiv´ıduo (ponto) está dentro da região de estabilidade, uma vez que se o sistema não for estável, não é poss´ıvel calcular o gramiano de controlabilidade utilizando-se a equa¸cão de Lyapunov. Uma maneira de se contornar esse problema é utilizar, para os in-div´ıduos fora da região de estabilidade, uma outra fun¸cão uma fun¸cão constante com um valor relativa-mente alto, para que o valor m´ınimo esteja sempre dentro da região de estabilidade. Calculada a pro-babilidade de sobrevivência de cada indiv´ıduo da po-pula¸cão inicial, faz-se então a sele¸cão dos indiv´ıduos que tem as melhores probabilidades de adapta¸cão. Para esta etapa, foi utilizado o método de sele¸cão “Stochastic Universal Sampling” (Baker, 1987). A partir dos indiv´ıduos selecionados, faz-se então o cru-zamento destes. Neste artigo utilizou-se a

probabili-dade de cruzamento Px= 0, 7. Ap´os esta etapa,

tem-se que utilizar o operador muta¸c˜ao nestes indiv´ıduos. Neste caso a probabilidade de muta¸c˜ao utilizada foi

Pm = 0, 01. Com os indiv´ıduos criados depois de

(6)

−100 −5 0 5 0.5 1 1.5 2 2.5 3 3.5 4 kp ki (a) 0 5 10 −8 −6 −4 −2 0 2 4 6 8 −10 −8 −6 −4 −2 0 2 4 kd ki kp (b)

Figura 2. Conjunto de pontos (kp, ki) (a) e (kp, ki, kd) (b) que estabilizam a planta do exemplo 1.

que o número máximo de gera¸cões seja alcan¸cado. O

número máximo de gera¸cões aqui adotado é 60. Após

alcan¸car este n´umero de gera¸c˜oes, o melhor indiv´ıduo

da última gera¸cão é o resultado final do processo de

otimiza¸c˜ao.

5 Exemplos

Será agora apresentado um exemplo numérico para ilustrar a metodologia proposta nesse artigo. Para a obten¸cão dos controladores PI e PID ótimos, foi utili-zada a biblioteca de fun¸cões Matlab desenvolvida por Chipperfield et al. (1994). Em todos os exemplos foi feito α = 1, isto é, mesma ênfase foi dada à rejei¸cão da perturba¸cão e ao rastreamento do sinal de referência, R(s) = 1/s e D(s) = 1/s.

Considere uma planta com a seguinte fun¸c˜ao de transferˆencia (Datta et al., 2000):

G(s) = s

3_{− 4s}2_{+ s + 2}

s5_{+ 8s}4_{+ 32s}3_{+ 46s}2_{+ 46s + 17}. (23)

A dificuldade dessa planta reside no fato de ser instável, fase não-m´ınima e ter grau relativo igual a 2. As regiões de estabilidade para controladores PI e PID estão mostradas nas Figs. 2(a) e (b). Deve ser salientando que no tra¸cado dessas regiões, o mais importante é encontrar os pontos extremos, uma vez que esses definirão uma caixa onde serão geradas as popula¸cões.

Utilizando algoritmo genético, tem que, após al-gumas itera¸cões, chega-se aos valores de γ = 0, 6 e β = 2 e, conforme descrito na Se¸cão 4, obtém-se os seguintes controladores: KP I(s) = 1, 1721 + 1, 6715 s , KP ID(s) = 1, 5642 + 2, 4249 s + 1, 8878s. (24) Os desempenhos dos sistemas compensados com os controladores acima estão mostrados nas Figs. 3(a) e (b) (azul/verde para a resposta do sistema realimen-tado ao controlador PI/PID); a Fig. 3(a) mostra as respostas ao degrau e a Fig. 3(b) mostra os correspon-dentes sinais de controle. Note que a introdu¸cão da a¸cão derivativa melhorou a resposta transitória ao si-nal de referência, porém houve uma leve degenera¸cão da rejei¸cão do sinal de perturba¸cão. Os ´ındices de desempenho dos sistemas compensados com os con-troladores PI e PID acima estão mostrados na Tab.

1. Na Tab. 1, tr, ts, tp e tspert denotam,

respec-tivamente, os tempos de subida, acomoda¸cão, pico e o intervalo de tempo decorrido desde a aplica¸cão do sinal de perturba¸cão até o instante a partir do qual a resposta permanece em um intervalo de ±2% do

valor de regime permanente, yinf denota o valor de

regime permanente da resposta, P O(%) e E(%) de-notam, respectivamente, os percentuais de ultrapassa-gem das respostas ao degrau e ao sinal de perturba¸c˜ao, respectivamente.

Observa¸c˜ao 2

1. Deve ser destacado que a implementa¸c˜ao do contro-lador PID foi feita modificando-se o termo derivativo de forma a atuar sobre o sinal de sa´ıda e introduzindo-se um p´olo em N/kd. Assim, o sinal de sa´ıda do

con-trolador UK(s) ser´a, para efeitos de implementa¸c˜ao,

escrito como: UD(s) = (kp+ki s)E(s) − kds τds + 1 Y (s), sendo τd= kp/N no lugar da transformada de Laplace

da equa¸c˜ao (1).

2. Embora tenham sido obtidos controladores PI e PID para a planta descrita pela fun¸cão de trans-ferência (23), nem sempre é poss´ıvel estabilizar plan-tas instáveis com controladores PI ou PID. Por exem-plo, para a planta com fun¸cão de transferência

G(s) = s

2_{+ 8, 5s + 17, 5}

s4_{− 15s}2_{+ 10s + 24},

a região de estabilidade para controladores PI e PID é vazia. Nesse caso, o método proposto neste artigo não poderá ser usado. Isso não representa uma de-ficiência do método e, sim, da estrutura do controla-dor adotada; nem toda planta instável pode ser esta-bilizada utilizando-se controladores PI ou PID (Datta

et al., 2000). ¤

6 Conclus˜ao

Uma maneira sistemática de se utilizar a região de es-tabilidade para controladores PI e PID proposta por Datta et al. (2000) no projeto de controladores PI e PID ótimo para plantas instáveis e também estáveis foi proposta nesse artigo. O algoritmo é de fácil im-plementa¸cão, o que dá a ele um grande potencial de

(7)

Tabela 1. ´Indices de desempenho relativos ao sistema rea-limentado do exemplo 1

M´etodo/ Controlador Controlador

´ındices PI PID tr 7,7141 4,6856 ts 16,9232 6,4027 yinf 1,0000 1,0000 tp – 5,4400 PO(%) 0,0000 4,8159 umax 9,6087 9,7471 tspert 12,2182 5,9297 E(%) 18,7717 19,6717 0 10 20 30 40 50 60 70 80 90 100 −0.2 0 0.2 0.4 0.6 0.8 1 1.2 1.4 Tempo − t Resposta − y(t) (a) 0 10 20 30 40 50 60 70 80 90 100 1 2 3 4 5 6 7 8 9 10 Tempo − t

Sinal de controle − u(t)

(b)

Figura 3. Resposta ao degrau e ao sinal de perturba¸c˜ao (a) e sinal de controle (b) para o sistema compensado com os controladores PI (linha azul) e PID (linha verde) dados na Eq. (24).

Agradecimentos

Os autores gostariam de agradecer ao CNPq pelo apoio financeiro, à Profa. Vilma Alves de Oliveira, pelas discussões extremamente construtivas e ao Prof. Bhattacharyya pelo encorajamento para submissão desse artigo para publica¸cão.

Referˆencias

Astrom, K. J. e Hagglund, T. (2004). Revisiting the ziegler-nichols step response method for PID con-trol, Journal of Process Control 14: 635–650. Baker, J. E. (1987). Reducing bias and inefficiency in

the selection algorithm, Proceedings of the Second International Conference on Genetic Algorithms and their Application, Hillsdale, pp. 14–21. Basilio, J. C. (1989). Controle ´otimo quadr´atico no

dom´ınio da freq¨uˆencia com objetivos de rastrea-mento de sinais limitados e margem de estabili-dade, Tese de Mestrado, Instituto Militar de En-genharia.

Chipperfield, A., Fleming, P., Pohleim, H. e Fonseca, C. (1994). Genetic Algorithm Toolbox, version 1.2, Department of Automatic Control and Sys-tems Engineering, University of Sheffield. Cominos, P. e Munro, N. (2002). PID controllers:

re-cent tuning methods and design to specification, IEE Proceedings 149(1): 46–53.

Dasgupta, D. e Michalewicz, Z. (2001). Evolutionary Algorithms in Engineering Applications, Sprin-ger.

Datta, A., Ho, M. T. e Bhattacharyya, S. P. (2000). Structure and Synthesis od PID Controllers, Springer.

Ge, M., Chiu, M. S. e Wang, Q. G. (2001). Robust PID controller design via LMI approach, Journal of Process Control 12: 3–13.

Ho, M. T., Datta, A. e Bhattacharyya, S. (2001). Ro-bust and non-fragile PID controller design, Inter-national Journal of Robust and Nonlinear Con-trol 11(7): 681–708.

Lathi, B. (1968). Communication Systems, John Wi-ley & Sons Inc.

Oviedo, J. J. E., Oelen, T. e Overshee, P. V. (2006). Robust advanced PID control (RaPID)- PID tu-ning based o engineering specifications, IEEE Control Systems Magazine 26(1): 15–19. Shafiei, Z. e Shenton, A. T. (1994). Tuning of

PID-type controllers for stable and unstable systems with time delay, Automatica 30: 1609–1615. Silva, G. J., Datta, A. e Bhattacharyya, S. P.

(2004). PID Controllers for Time Delay Systems, Birkh¨auser.

Toscano, R. (2004). A simple robust PI/PID controller design via numerical optimation approach, Jour-nal og Process Control 15: 81–88.