Pontificia Universidade Católica do Rio Grande do Sul Faculdade de Engenharia
Engenharia de Controle e Automação
Gabriel Perini Werner
Pêndulo Acionado com Roda de Reação
Trabalho de Conclusão de Curso
Porto Alegre 2017
Gabriel Perini Werner
Pêndulo Acionado com Roda de Reação
Trabalho de Conclusão de Curso apresen-tado como parte dos requisitos necessários à obtenção do título de Engenheiro de Con-trole e Automação pela Pontifícia Universi-dade Católica do Rio Grande do Sul.
Orientador: Aurélio Tergolina Salton
Porto Alegre 2017
À todos aqueles que de alguma forma estiveram e estão próximos de mim, fazendo com que tudo valha a pena.
Agradecimentos
À minha família, pelo amor, incentivo e apoio incondicional. À minha namorada, por me aguentar falando sobre o trabalho de conclusão de curso todos os dias e me ajudar na elaboração e estruturação da parte escrita, mesmo sem entender ao que o texto se referia. Ao meu orientador, por todos os ensinamentos não só durante a elaboração desta atividade, mas também durante as disciplinas que ministrou.
Resumo
A análise de sistemas subatuados como o pêndulo invertido é muito eficiente no estudo e desenvolvimento de estratégias de controle avançadas, aplicadas à sistemas não lineares, e vem sendo objeto de pesquisa por mais de uma década. Além de oferecer características únicas inerentes à esse tipo de sistemas, eles apresentam como uma de suas maiores vantagens a dinâmica simplificada. Nesse trabalho, será descrito o estudo de um pêndulo invertido acionado com uma roda de reação. O problema de controle foi dividido em duas etapas, primeiro a haste deveria se encontrar na posição elevada, o que pode ser denominado de swing up - ato de balançar até o topo - do pêndulo, essa tarefa foi realizada através do método de Lyapunov, que considera a energia do sistema. Depois, o mesmo deveria ser capaz de se manter nessa posição, mesmo que distúrbios fossem aplicados, o que foi feito utilizando um controle por realimentação de estados.
Abstract
The analysis of underactuated systems as the inverted pendulum is very effective in the study and development of advanced control techniques applied to non-linear systems, and has been on focus of researchers for over a decade. Besides offering inherent characteristics of this type of assemblies, they present as one of their greatest advantages, its simplified dynamics. In this academic work, the inverted pendulum actuaded by a reaction wheel was studied. The control problem was divided in two stages. Firstly, the pendulum swing up would be applied based on the Lyapunov’s energy theory. Moreover, the system would have to keep its upright position, even when disturbances were applied, which was accomplished with state feedback control.
Lista de ilustrações
Figura 1 – Pêndulo de Furuta . . . 13
Figura 2 – BMW 15 . . . 14
Figura 3 – Componentes elétricos do projeto . . . 16
Figura 4 – Esquema elétrico . . . 18
Figura 5 – Partes mecânicas feitas no PTC Creo Parametric 3.0 . . . 19
Figura 6 – Montagem final do sistema . . . 20
Figura 7 – Resposta ao degrau . . . 21
Figura 8 – Pendulo acionado com roda de reação . . . 22
Figura 9 – Resposta da velocidade da roda de reação em relação à um degrau de entrada . . . 28
Figura 10 – Comportamento desejado do sistema . . . 33
Figura 11 – Comparação entre a resposta real e aproximada do pêndulo . . . . 35
Figura 12 – Comparação entre a resposta real e aproximada da roda de reação 35 Figura 13 – Comparação entre o modelo linear e não linear . . . 36
Figura 14 – Diagrama de blocos do sistema proposto . . . 36
Figura 15 – Resultado final da posição do pêndulo com ambas estratégias de controle implementadas . . . 37
Figura 16 – Resultado final da velocidade do pêndulo com ambas estratégias de controle implementadas . . . 38
Figura 17 – Controle por realimentação de estados . . . 38
Figura 18 – Controle em torno de π rad . . . 40
Lista de tabelas
Tabela 1 – Especificações técnicas do motor sem carga . . . 17 Tabela 2 – Especificações adicionais do motor . . . 17
Lista de abreviaturas e siglas
LTDA Limitada
MMQ Método dos Mínimos Quadrados
PRR Pêndulo Acionado com Roda de Reação
PUCRS Pontifícia Universidade Católica do Rio Grande do Sul PWM Modulação por Largura de Pulso
Lista de símbolos
A Ampere
b Ganho de Lyapunov
cm Centímetro
E Energia do Pêndulo Simples
g Gravidade
I Matriz Identidade
J Inércia do Pêndulo Simples
kfg Quilograma-força
k Ganho genérico
L Momento angular
mA Miliampere
rpm Rotação por minuto
¯
E
Constante de atrito do Pêndulo¯
F
Constante de atrito da Roda de Reação¯
τ
Constante de tempo¨
q
1 Aceleração angular da Haste¨
q
2 Aceleração angular da Roda de Reação˙
q
1 Velocidade angular da Haste˙
q
2∞ Velocidade angular da Roda de Reação em regime permanente˙
q
2 Velocidade angular da Roda de ReaçãoE
0 Energia do Pêndulo Simples na posição de topoE
c1 Energia cinética do PênduloEc2
Energia cinética da Roda de ReaçãoEp
Energia potencialE
t Energia totalI
1 Inércia do PênduloI2
Inércia da Roda de ReaçãoK
Ganhos do Controladorl
1 Comprimento do PênduloLa
Equação de Lagrangel
c1 Distância ao centro de gravidade do Pêndulol
c2 Distância ao centro de gravidade da Roda de Reaçãom1
Massa do Pêndulom
2 Massa da Roda de Reaçãoq
1 Ângulo da Hasteq2
Ângulo da Roda de Reaçãoq
i Coordenadas generalizadas do Sistemaτ
TorqueuP W M
Entrada do Motorv
2 Velocidade tangencial da Roda de ReaçãoV (q
1, ˙
q
1)
Função candidata de Lyapunovxe
Ângulo de equilíbrio do PênduloT Período de amostragem
V Volt
Sumário 1 Introdução . . . . 12 1.1 Tema de Pesquisa . . . . 14 1.2 Justificativa do Tema . . . . 14 1.3 Objetivo do Trabalho . . . . 15 1.4 Delimitações do Trabalho . . . . 15 2 Metodologia . . . . 16 2.1 Prototipagem . . . . 16 2.1.1 Testes . . . 20
2.2 Modelagem Matemática do Sistema . . . 21
2.3 Identificação dos Parâmetros do Sistema . . . . 26
2.3.1 Identificação dos Parâmetros da Roda de Reação . . . 27
2.3.2 Identificação dos Parâmetros do Pêndulo . . . 29
2.4 Linearização e Representação em Espaço de Estados . . . . 30
2.5 Controle do Sistema . . . . 31
2.5.1 Controle Baseado em Energia . . . 31
2.5.2 Controle Através da Realimentação de Estados . . . 33
3 Aplicação da Metodologia . . . . 35
3.1 Resultados da Identificação do Sistema . . . . 35
3.2 Resultado da Linearização do Modelo . . . . 35
3.3 Resultados das Simulações . . . . 36
3.4 Resultados dos Experimentos . . . . 39
4 Conclusão . . . . 41
12
1 Introdução
A Engenharia de controle é um campo rico em oportunidades e novas direções (MURRAY et al., 2003) que lida com disciplinas e métodos capazes de implementar decisões automáticas em diversos processos de maneira a aumentar seu desempenho, eficiência e rapidez. O avanço nesse campo de estudo é diretamente relacionado com o avanço nas pesquisas relacionadas à tecnologias, teoria de desenvolvimento de estratégias de controle e suas implementações em tempo real (BARS et al., 2006). Além disso, pode-se considerar que o constante desenvolvimento de novas tecnologias é diretamente relacionado com o desenvolvimento da educação (KHEIR et al., 1996).
Atualmente, os maiores campos de aplicação desses temas é na robótica (WEIN-BERG et al., 2001) e na mecatrônica (TOMIZUKA, 2002), que são também áreas de muita atratividade entre os estudantes, devido à alta tecnologia envolvida em tais assuntos e também a sua curva de desenvolvimento nos últimos anos, fazendo as-sim com que os jovens observem uma grande perspectiva de crescimento nesses campos de estudo. O pêndulo invertido, dentre outras coisas, é considerado uma das maiores referências no estudo da robótica e da mecatrônica. Existem diversas con-figurações disponíveis, cada uma com suas peculiaridades, dentre as mais comuns, encontram-se o Acrobot (SPONG, 1995), o Pêndulo de Furuta (TORRE, 2004; ACOSTA, 2010) e a Bicicleta (ASTROM; KLEIN; LENNARTSSON, 2005). Na figura 1, tem-se uma demonstração esquemática do Pêndulo de Furuta.
Capítulo 1. Introdução 13
Figura 1 – Pêndulo de Furuta
Fonte: (TORRE, 2004).
Devido à sua alta instabilidade em malha aberta e características não lineares, esses sistemas tem sido usado extensivamente na educação e implementação de técnicas de controle avançadas (BLOCK; ASTROM; SPONG, 2007; ASTROM; FURUTA, 2000) . A configuração básica de um pêndulo invertido consiste de uma haste móvel, com diferentes tipos de acionamentos, sejam eles indiretos, como no caso de uma roda de reação, ou diretos, como no caso de um Segway (YOUNIS; ABDELATI, 2009).
O objeto de estudo desse trabalho é especificamente o pêndulo invertido acio-nado com uma roda de reação, também conhecido como PRR. Uma das aplicações mais interessantes desse princípio é no controle do Telescópio Hubble (CARRÉ; BER-TRAND, 1999), onde rodas de reação são utilizadas para direcioná-lo no espaço. O princípio de aplicação de uma roda de reação é baseado na conservação do momento angular (SRINIVAS; LAXMIDHAR, 2008), por exemplo, para acelerar uma roda através de um motor acoplado, o objeto no qual o motor está preso terá que rotacionar no outro sentido, como a roda de reação normalmente é uma fração do peso total de uma espaçonave, é fácil aplicar pequenas alterações na direção da mesma. Esse conceito vem sendo utilizado no desenvolvimento de bicicletas e motocicletas que se auto-equilibram, como se pode observar na figura 2.
Capítulo 1. Introdução 14
Figura 2 – BMW 15
Fonte: Página da Gazeta do Povo1.
1.1 Tema de Pesquisa
Ao longo desse documento, serão traçadas técnicas de modelagem e identifi-cação de sistemas, bem como a implementação de um controle por realimentação de estados e também a aplicação da teoria de energia de Lyapunov.
1.2 Justificativa do Tema
Considerando a utilização de rodas de reação em sistemas que se comportam como pêndulos por exemplo, motocicletas capazes de se equilibrar automaticamente -e no dir-ecionam-ento d-e obj-etos na indústria a-ero-espacial - como posicionam-ento d-e satélites -, faz-se necessário o estudo desse conceito.
1 ¹ Disponível em
Capítulo 1. Introdução 15
1.3 Objetivo do Trabalho
O Objetivo do trabalho foi a implementação de uma estratégia de controle aplicada a um pêndulo acionado com roda de reação. O pêndulo deveria começar na posição vertical inferior e atingir a posição vertical superior através da aplicação de conceitos de energia. Uma vez que o mesmo se encontrasse no topo, ele deveria manter essa posição.
1.4 Delimitações do Trabalho
O trabalho se delimitou ao estudo e implementação de uma estratégia de controle aplicada à um pêndulo acionado com roda de reação. A maioria das aplicações reais desse conceito são implementadas em sistemas que possuem mais do que dois graus de liberdade, mas nesse trabalho foi analisado um sistema com apenas dois graus, de modo a simplificar o desenvolvimento do protótipo e diminuir a complexidade da modelagem matemática.
16
2 Metodologia
Inicialmente, foi feita a prototipagem do PRR, de acordo com a determinação do processador, driver, atuador e sensores presentes no sistema. A segunda etapa se baseou na identificação matemática, de modo a encontrar equações que descre-vessem o movimento do sistema. Com isso, se estabeleceu a estratégia de controle para o pêndulo. Primeiro, foi desenvolvida uma estratégia de controle para equilibrar o objeto no topo e depois uma estratégia baseada em conceitos de energia para tirá-lo da posição inicial e levá-lo até a posição vertical superior.
2.1 Prototipagem
Após a definição de quais seriam os componentes e a estrutura para o pên-dulo, um desafio encontrado foi a montagem de um dispositivo capaz de realizar movimentos de grande amplitude, sendo esse um fator importante no controle do sistema. Tal amplitude, seria determinada pelo peso total da estrutura e pelo torque gerado pelo motor. Na figura 3 estão os componentes elétricos básicos utilizados.
Figura 3 – Componentes elétricos do projeto
Fonte: Autoria Própria.
O processador utilizado - ARDUINO MEGA 2560 - foi escolhido com base na sua simplicidade para a implementação de projetos com baixos níveis de processamento. Além disso, dois encoders incrementais do tipo A38S6-400-2-2-24, com uma resolução
Capítulo 2. Metodologia 17
de 400 pulsos por volta, foram utilizados como sensores para determinar as posições do pêndulo e da roda de reação. O motor Akiyama AK555/11.1PF12R83CE-V2, utilizado na roda, tem suas especificações técnicas descritas nas tabelas 1 e 2.
Tabela 1 – Especificações técnicas do motor sem carga
Tensão Operação Tensão Nominal Rotação Corrente
6V ∼ 24V 12 V 83 rpm 430 mA
Fonte: Página do Fabricante1.
Tabela 2 – Especificações adicionais do motor
Maximo rendimento Partida
Rotação Corrente Torque Potência Corrente Torque
65,4 rpm 1.6 A 11 kfg.cm 5 W 6 A 53 kgf.cm
Fonte: Página do Fabricante1.
O motor utilizado possuia uma caixa de redução com o objetivo de diminuir a rotação e aumentar o torque do mesmo. O seu acionamento é feito através do driver BTS7960b, capaz de operar com correntes de até 45 A, sendo essa capacidade impres-cindível devido à alta corrente que o motor necessitaria para a aplicação de torques elevados.
O esquema elétrico de ligação do sistema, figura 4, foi realizado com auxílio do software Proteus. O principal componente é o processador. Foram utilizadas duas fontes de alimentação, uma de 12 V para o motor e encoders e uma de 5 V para o Arduino. Além disso, alguns resistores foram implementados para limitar a corrente de entrada nas portas do processador. É importante observar que os sinais de saída dos encoders foram conectados nas portas 18, 19, 20 e 21, que são portas de interrupção do processador.
Capítulo 2. Metodologia 18
Figura 4 – Esquema elétrico
Fonte: Autoria Própria
Além dos componentes elétricos, desenvolveu-se partes mecânicas acopláveis, de modo a completar a montagem do PRR. O projeto desses componentes foi feito com o auxílio do software PTC Creo Parametric e posteriormente fabricados em chapa preta pela Implemis - Indústria de Máquinas e Implementos Agrícolas LTDA. Na figura 5, estão as peças modeladas no software mencionado, que correspondem à base de sustentação do pêndulo, à haste e à roda de reação.
Capítulo 2. Metodologia 19
Figura 5 – Partes mecânicas feitas no PTC Creo Parametric 3.0
Fonte: Autoria Própria.
No resultado da montagem, figura 6, pode-se observar, que a medição de rotação na roda é feita através de um esquema de engrenagens 1:1, sendo que o encoder serve como sensor tanto da roda como da haste. A única diferença é que no sensoriamento da haste, a medição é feita sem o auxílio de engrenagens, ou seja, enquanto a haste está fixada em um eixo preso a um rolamento presente na base de sustentação, o encoder capta a movimentação desse eixo.
Capítulo 2. Metodologia 20
Figura 6 – Montagem final do sistema
Fonte: Autoria Própria 2.1.1 Testes
A maior dificuldade da prototipagem foi encontrar um motor que apresentasse uma resposta satisfatória ao sistema. Foram testados três modelos até que se esco-lhesse o motor da figura 3. Na figura 7, observa-se a resposta do sistema à aplicaçao de um degrau de entrada. O software utilizado na programação do processador foi o Arduino Nightly, enquanto no processamento dos dados de posição, velocidade e aceleração tanto da roda de reação quanto do pêndulo, foi o MATLAB.
Capítulo 2. Metodologia 21
Figura 7 – Resposta ao degrau
Fonte: Autoria Própria.
A imagem acima não possui tratamento de dados. Enquanto a entrada, refere-se ao sinal de Pulse Width Modulation - PWM aplicado ao motor, a posição da roda de reação e da haste são referentes aos sinais lidos pelos encoders. Considerando que uma volta completa é equivalente à 1600 pulsos, pode-se dizer que a amplitude máxima do sinal é aproximadamente 0,015 π.
2.2 Modelagem Matemática do Sistema
A montagem em questão tem dois graus de liberdade, sendo o pêndulo o primeiro ponto de fixação e a roda de reação o segundo. Um esquemático do pêndulo acionado com roda de reação pode ser observado na figura 8.
Capítulo 2. Metodologia 22
Figura 8 – Pendulo acionado com roda de reação
Fonte: (FONTANI; LOZANO, 2002).
A movimentação de um pêndulo invertido pode ser descrita em termos de energia (BLOCK; ASTROM; SPONG, 2007) , o que será demonstrado a seguir:
Considerando
q
1 como sendo a posição do pêndulo,q
2 como sendo a posiçãoda roda de reação,
m
1 como sendo a massa do pêndulo,m
2 sendo a massa da rodade reação. Além disso, tem-se que
l
c1 é a distância do eixo de rotação ao centro degravidade do pêndulo e
l
c2 é a distância do eixo de rotação da roda de reação aoseu centro de gravidade. Com isso, foi definido o parâmetro
m
, que seria utilizado posteriormente.¯
m = m1lc1+ m2lc2 (2.1)
Tendo em vista que
I
1 é a inércia do pêndulo eI
2 é a inércia da roda dereação, a segunda etapa foi encontrar as energias envolvidas no sistema, que podem ser dividídas em energia cinética
Ec
e energia potêncialEp
. A energia cinética do pênduloEc1
é descrita na equação 2.2 e a energia cinética da roda de reaçãoEc2
é descrita na equação 2.3 Ec1 = 1 2(m1l 2 c1+ I1) ˙q1 (2.2) Ec2= 1 2m2l 2 1q˙12+ 1 2I2( ˙q1+ ˙q2) 2 (2.3)Capítulo 2. Metodologia 23
Considerando que a energia cinética total do sistema
E
c é a soma de todas energias,tem-se que Ec= 1 2(m1l 2 c1+ m2l12+ I1+ I2) ˙q1+ I2q˙1q˙2 + 1 2I2q˙2 (2.4) A energia potencial do sistema
E
p é descrita na equação 2.5.Ep = (m1lc1+ m2l1)(gcos(q1− 1)) (2.5)
Substituindo a equação 2.1 em 2.5 se tem a equação simplificada 2.6
Ep = ¯mg(cos(q1− 1)) (2.6)
A partir das equações 2.5 e 2.4, obteve-se a equação de Lagrange
L
a= E
c− E
p,que é a função que descreve o sistema através de suas coordenadas generalizadas
q
i.La = 1 2(m1l 2 c1+ m2l12+ I1+ I2) ˙q12+ I2q˙1q˙2+ 1 2I2q˙2− ¯mg(cos(q1) − 1) (2.7) Utilizando a equação de Euler-Lagrange em 2.8 e considerando que
τ
é o torque do sistema, foi possível obter a dinâmica do sistema.d dt ∂La ∂ ˙q (q, ˙q) − ∂La ∂q (q, ˙q) = τ (2.8)
Expressando as derivadas parciais separadamente, tem-se ∂La ∂ ˙q1 = (m1l2c1+ m2l21+ I1+ I2) ˙q1+ I2q˙2 (2.9) ∂La ∂q1 = ¯mgsin(q1) (2.10) ∂La ∂ ˙q2 = I2q˙1+ I2q˙2 (2.11)
Capítulo 2. Metodologia 24
∂La
∂q2
= 0 (2.12)
Substituindo os resultados de 2.9, 2.10, 2.11 e 2.12 em 2.8, tem-se as equações dinâmicas do sistema 2.13 e 2.14
(m1l2c1+ m2l21+ I1+ I2)¨q1+ I2q¨2− ¯mgsin(q1) = 0 (2.13)
I2q¨1+ I2q¨2 = τ (2.14)
Isolando o termo
q2
¨
em 2.14, foi possível se obter¨ q2 =
τ I2
− ¨q1 (2.15)
Substituindo a equação 2.15 em 2.13, encontra-se a equação 2.16
¨ q1 =
−τ + ¯mgsin(q1)
m2l2c1+ m2l12+ I1
(2.16)
Reescrevendo a equação 2.14 com a substituição de
q
¨
1 pela equação 2.16¨ q2 = τ I2 + τ − ¯mgsin(q1) m2l2c1+ m2l21+ I1 (2.17)
Reorganizando 2.17, foi possivel obter a equação 2.18
¨ q2 = τ I2(m2lc12 + m2l12+ I1) − mgsin(q¯ 1) m2lc12 + m2l12+ I1 (2.18)
Nesse momento, foram introduzidas algumas constantes para facilitar a obtenção dos parâmetros do sistema. ¯ A = −1 m2l2c1+ m2l21+ I1 (2.19) ¯ B = mg¯ m2lc12 + m2l12+ I1 (2.20) ¯ C = 1 I2(m2lc12 + m2l12+ I1) (2.21)
Capítulo 2. Metodologia 25
¯
D = − ¯mg m2l2c1+ m2l21+ I1
(2.22)
Substituindo as novas constantes em 2.19, 2.20, 2.21 e 2.22 nas equações 2.16 e 2.18, obteve-se
¨
q1 = ¯Aτ + ¯Bsin(q1) (2.23)
¨
q2 = ¯Cτ + ¯Dsin(q1) (2.24)
Considerando que o amortecimento de um sistema genérico é dado pelo produto do coeficiente de amortecimento e da velocidade do mesmo, adicionou-se esse termo tanto em 2.23 quanto em 2.24, o que resultou nas equações 2.25 e 2.26. Nota-se que
F
¯
se refere ao coeficiente de atrito da roda de reação eE
¯
ao do pêndulo¨
q1 = ¯Aτ + ¯Bsin(q1) + ¯E ˙q1 (2.25)
¨
q2 = ¯Cτ + ¯Dsin(q1) + ¯F ˙q2 (2.26)
Analisando a equação 2.26, percebeu-se que a posição do pêndulo
q
1 podeser desprezada, pois pouco influência na equação de movimento da roda de reação, sendo esse termo eliminado:
¨
q2 = ¯Cτ + ¯F ˙q2 (2.27)
O torque
τ
é gerado através de um sinal de entradau
P W M, que varia de 0 a255, sendo necessário introduzir uma nova equação intermediária
τ = kP W M ∗ uP W M (2.28)
Substituindo a equação 2.28 na equação 2.27, tem-se
¨
q2 = ¯CkP W MuP W M + ¯F ˙q2 (2.29)
Pode-se definir que a aplicação de um sinal de entrada
u
P W M no motor seráresponsável pela aceleração equivalente da roda de reação
q
¨
2, entretanto para definircomo esse sinal influenciará na aceleração do pêndulo
q
¨
1, é preciso entender algunsCapítulo 2. Metodologia 26
definido pelo produto entre a massa, velocidade tangencial e distância dessa velocidade ao centro de rotação do sistema, podendo-se dizer que o momento angular da roda de reação é definido por
L = m2v2l2 (2.30)
Considerando que
v
2 é a velocidade tangencial da roda de reação, tem-se quev2 = ˙q2l2 (2.31)
Assim, pode-se substituir 2.31 em 2.30:
L = m2q˙2l22 (2.32)
Sabe-se que o torque gerado por um corpo é definido pela variação do seu momento angular em relação ao tempo. Sendo possível definir a equação do
τ
aplicado emq1
¨
, que é gerado através da roda de reação do sistemaτ = dL dt (2.33) substituindo 2.32 em 2.33 τ = m2l22 d ˙q2 dt (2.34) Sabendo que d ˙q2 dt
= ¨
q
2 e considerando quem
2l
22
= k
τ, foi possível definir queo torque aplicado ao pêndulo pode ser descrito como
τ = kτq¨2 (2.35)
Substituindo 2.35 em 2.25, chegou-se à equação final do pêndulo em 2.36.
¨
q1 = ¯Akτq¨2+ ¯Bsin(q1) + ¯E ˙q1 (2.36)
2.3 Identificação dos Parâmetros do Sistema
Com posse das equações 2.29 e 2.36, a próxima etapa foi encontrar os pa-râmetros do sistema para obter uma boa aproximação do modelo matemático em
Capítulo 2. Metodologia 27
relação ao sistema real. Na equação da roda de reação
q1
¨
, utilizou-se a aproximação de primeira ordem através da aplicação de um degrau ao sistema. Já na equação do pênduloq
¨
2, utilizou-se o método dos mínimos quadrados, que usa os dados disponíveispara obter os parâmetros desejados.
2.3.1 Identificação dos Parâmetros da Roda de Reação
Considerando a equação 2.29, a transformada de Laplace é dada pela equação 2.37 G2(s) = Q2(s) U (s) = ¯ CkP W M s(s − ¯F ) (2.37)
Com base nisso, tem-se que
s ˙Q2(s)
U (s) = ¯ CkP W M
s − ¯F (2.38)
Considerando um modelo genérico de uma equação de primeira ordem
G(s) = k ¯
τ s + 1 (2.39)
pode-se igualar a equação 2.38 à 2.39, de modo que os parâmetros se equivalham para obter a aproximação das constantes de acordo com a resposta do sistema ao degrau. Foram necessárias algumas alterações para que as equações se tornassem equivalen-tes. s ˙Q2(s) U (s) = − ¯CkP W M/ ¯F ¯ τ s + 1 (2.40)
Com base nisso, foi possível obter os parâmetros da roda de reação utilizando a sua curva de resposta da velocidade
q
˙
2 em função do sinal de entradau
P W MCapítulo 2. Metodologia 28
Figura 9 – Resposta da velocidade da roda de reação em relação à um degrau de entrada
Fonte: Autoria Própria.
Através da análise dos gráficos presentes na figura 9 e da equivalência das equações 2.39 e 2.40, foi obtida a velocidade angular da roda de reação em regime permanente
q
˙
2∞, que é aproximadamente 8.639 rad/s com uma entradau
P W M de255, logo k = − ¯CkP W M ¯ F = ˙ q2∞ uP W M = 8.639 255 = 0.0339 (2.41)
Para obter a constante de tempo
τ
¯
, foi necessário identificar o tempo que o sistema levou para atingir aproximadamente 63,2% de sua velocidadeq
˙
2∞, ou seja,˙
q2¯τ = 0, 632 ˙q2∞ = 5.46rad/s (2.42)
Considerando que a constante
τ
¯
é definida pelo tempo que o sistema leva para chegar na velocidadeq
˙
2¯τ, o que acontece em aproximadamente 15 amostras de tempo e queo período de amostragem T é de 0,005 segundos, tem-se que
¯
Capítulo 2. Metodologia 29
Com base nisso, foi possível obter a equação final 2.44 da roda de reação e seus parâmetros
¨
q2 = φ1uP W M+ φ2q˙2
φ =h0, 450 −13, 330
i (2.44)
2.3.2 Identificação dos Parâmetros do Pêndulo
Para obter os parâmetros da equação 2.36, utilizou-se o Método dos Mínimos Quadrados, conhecido como MMQ (SALTON, 2017) . Essa metodologia utiliza dados de um experimento para que se possa obter uma aproximação dos parâmetros da equação em questão.
Tendo em vista que no sistema tem-se
q
¨
1,q
¨
2,q
˙
1 eq
1, pois foram implementadossensores medindo a posição do pêndulo e da roda de reação e o restante dos dados podem ser obtidos através de uma simples derivação desses parâmetros. É possível definir que as constantes obtidas através do MMQ foram
Akτ
¯
,B
¯
eE
¯
.Para que tal análise fosse possível, foi preciso inserir os dados em matrizes. ¨ q1(1) ¨ q1(2) ¨ q1(3) ¨ q1(4) ¨ q1(5) .. . = ¨ q2(1) sen(q1)(1) q˙1(1) ¨ q2(2) sen(q1)(2) q˙1(2) ¨ q2(3) sen(q1)(3) q˙1(3) ¨ q2(4) sen(q1)(4) q˙1(4) ¨ q2(5) sen(q1)(5) q˙1(5) .. . ... ... h ¯ Akτ B¯ E¯ i (2.45)
Considerando 2.45, as variaveis
Ψ
,θ
eα
em 2.46, 2.47 e 2.48, respectivamente, foram introduzidas para facilitar a manipulação matemática da equação.Ψ = ¨ q2(1) sen(q1)(1) q˙1(1) ¨ q2(2) sen(q1)(2) q˙1(2) ¨ q2(3) sen(q1)(3) q˙1(3) ¨ q2(4) sen(q1)(4) q˙1(4) ¨ q2(5) sen(q1)(5) q˙1(5) .. . ... ... (2.46) θ = h ¯ Akτ B¯ E¯ i (2.47)
Capítulo 2. Metodologia 30 α = ¨ q1(1) ¨ q1(2) ¨ q1(3) ¨ q1(4) ¨ q1(5) .. . (2.48)
Então, com essas equações tem-se a simplificação
α = Ψθ (2.49)
utilizando alguns conceitos de álgebra matricial, foi possível isolar a matriz desejada
θ
.θ = (ΨTΨ)−1ΨTα (2.50)
Alterando a notação de 2.36 em função da matriz
θ
, obteve-se 2.51, que é a equação final do pêndulo.¨
q1 = θ1q¨2+ θ2sin(q1) + θ3q˙1
θ =h0, 050 −13, 150 −0, 049
i (2.51)
2.4 Linearização e Representação em Espaço de Estados
Tendo em vista que o controle do pêndulo na posição de topo será feita com base em uma representação do sistema em espaço de estados, fez-se necessário a linearização das equações obtidas em 2.44 e 2.51 para que posteriormente o controle por realimentação de estados pudesse ser projetado.
Considerando a representação em espaço de estados
˙x = Ax + Bu (2.52) tem-se que x1 = q1 x2 = ˙q1 x3 = q2 x4 = ˙q2 u = uP W M (2.53)
Capítulo 2. Metodologia 31
Substituindo 2.44 em 2.51 e utilizando as variáveis descritas em 2.53, é possível se obter
˙x2 = θ1φ1u + θ1φ2x4+ θ2sen(x1) + θ3x2
˙x4 = φ1u + φ2x4
(2.54)
Considerando
f1
= x2
,f2
= ˙x2
,f3
= x4
ef4
= ˙x4
, pode-se definir a linearização -em torno da posição de equilíbrioxe
- deA
eB
em 2.52A = ∂f1 ∂x1 ∂f1 ∂x2 ∂f1 ∂x3 ∂f1 ∂x4 ∂f2 ∂x1 ∂f2 ∂x2 ∂f2 ∂x3 ∂f2 ∂x4 ∂f3 ∂x1 ∂f3 ∂x2 ∂f3 ∂x3 ∂f3 ∂x4 ∂f4 ∂x1 ∂f4 ∂x2 ∂f4 ∂x3 ∂f4 ∂x4 = 0 1 0 0 θ2cos(xe) θ3 0 θ1φ2 0 0 0 1 0 0 0 φ2 (2.55) B = ∂f1 ∂u ∂f2 ∂u ∂f3 ∂u ∂f4 ∂u = 0 θ1φ1 0 φ1 (2.56)
O ângulo de equilíbrio do pêndulo
x
epode ser 0 ouπ
rad
.Como o projeto decontrole do pêndulo será feito para mantê-lo na posição de topo, pode-se considerar que
xe
= π
rad
. Com os parâmetros obtidos na seção 2.3, tem-se a representação final em espaço de estados:˙x = 0 1 0 0 θ2cos(xe) θ3 0 θ1φ2 0 0 0 1 0 0 0 φ2 x1 x2 x3 x4 + 0 θ1φ1 0 φ1 u (2.57) 2.5 Controle do Sistema
Após obter todos os parâmetros necessários para o controle do sistema, chegou-se a etapa final e objetivo do trabalho (elevar o pêndulo para a posição vertical superior através da teoria de energia de Lyapunov e controlá-lo em π rad utilizando a técnica de realimentação de estados).
Capítulo 2. Metodologia 32
Para elevar o sistema à posição de topo, foi introduzida uma equação simplifi-cada da movimentação de um pêndulo simples.
J ¨q1+ mglsen(q1) − kP W MuP W M = 0 (2.58)
A energia total do sistema foi definida como
E = 1 2J ˙q
2
1+ mgl(1 − cos(q1)) (2.59)
logo, como o objetivo era atingir a posição π com velocidade de
0
rad/s
, tem-se queE0 = 2mgl (2.60)
.
Nesse momento, foi necessário introduzir a chamada função candidata de Lyapunov
V (q1, ˙q1) =
(E − E0)2
2 (2.61)
para encontrar uma lei de controle que fizesse com que a taxa de variação dessa função fosse negativa, independente das circunstâncias. Logo,
˙
V (q1, ˙q1) = (E − E0) ˙E (2.62)
Fazendo as devidas substituições na equação 2.62 e trabalhando a equação algebrica-mente, foi possível obter que
˙
V (q1, ˙q1) = (E − E0)(kP W MuP W M) ˙q1 (2.63)
Assim a lei de controle capaz de elevar o pêndulo para a posição de topo foi definida por
u = −bsgn(E − E0) ˙q1 (2.64)
sendo que b é um ganho genérico determinado experimentalmente. A equação 2.64 faz com que a equação 2.63 seja negativamente definida, o que faz com que a energia do sistema tenda a
E0
.Capítulo 2. Metodologia 33
2.5.2 Controle Através da Realimentação de Estados
Considerando a representação em espaço de estados em 2.57, pode-se intro-duzir a lei de controle
u = −Kx
, de modo a alterar a dinâmica do sistema, resultando em˙x = (A − BK)x (2.65)
O objetivo principal da utilização dessa estratégia de controle foi alocar pólos para que o sistema se comportasse da maneira desejada. Na figura 10 é possível se observar esse comportamento.
Figura 10 – Comportamento desejado do sistema
Fonte: Autoria Própria.
Para que o sistema se comportasse como na figura 10, adicionou-se os seguin-tes pólos: p1 = 15 p2 = 15 p3 = 0, 6 + 1, 9i p4 = 0, 6 − 1, 9i (2.66)
Capítulo 2. Metodologia 34
Com isso, a equação característica desejada obtida é
Q(λ) = λ4+ 31.2λ3+ 265λ2+ 390λ + 900 (2.67) A partir de 2.67, tem-se a igualdade
det(λI − (A − BK)) = Q(λ) (2.68)
de onde foi possível se obter que
35
3 Aplicação da Metodologia
Nesse capítulo do trabalho, são apresentados os resultados obtidos através da aplicação da metodologia em 2.
3.1 Resultados da Identificação do Sistema
Na figura 11 e 12 tem-se um comparativo entre a resposta real e a aproximada para a posição do pêndulo e da roda de reação. Ambas as respostas foram obtidas através da aplicação de um degrau de entrada.
Figura 11 – Comparação entre a resposta real e aproximada do pêndulo
Fonte: Autoria Própria.
Figura 12 – Comparação entre a resposta real e aproximada da roda de reação
Fonte: Autoria Própria.
A identificação cumpriu o seu objetivo, como ficou comprovado através da aplicação de diversas entradas ao sistema.
3.2 Resultado da Linearização do Modelo
Na figura 13, pode-se observar a comparação entre o modelo linear e o não linear. A importância de uma boa linearização reflete na estratégia de controle em 2.5.2, que foi feita com base na linearização e na representação do sistema em espaço
Capítulo 3. Aplicação da Metodologia 36
de estados. Como pode-se observar, a diferença entre os modelos é praticamente imperceptível.
Figura 13 – Comparação entre o modelo linear e não linear
Fonte: Autoria Própria.
3.3 Resultados das Simulações
O diagrama de blocos para a simulação através do software SIMULINK está presente na figura 14
Figura 14 – Diagrama de blocos do sistema proposto
Fonte: Autoria Própria.
O sistema é composto de duas estratégias de controle, a primeira, baseada em energia, é a primeira a ser acionada. Quando o pêndulo chega ao topo, há uma troca
Capítulo 3. Aplicação da Metodologia 37
de controle, através do switch implementado na simulação em 14, e então o controle por realimentação de estados entra em ação. A figura 15 demonstra o resultado obtido com ambas as estratégias de controle. O pêndulo começou na posição de descanso e atingiu o topo em aproximadamente 32,5 segundos.
Figura 15 – Resultado final da posição do pêndulo com ambas estratégias de controle implementadas
Fonte: Autoria Própria.
Um ponto importante para cumprir o objetivo do controle baseado em energia foi que o pêndulo chegasse no topo com velocidade nula, conforme representado na figura 16, para que assim o controle por realimentação de estados não saturasse.
Capítulo 3. Aplicação da Metodologia 38
Figura 16 – Resultado final da velocidade do pêndulo com ambas estratégias de controle implementadas
Fonte: Autoria Própria.
A resposta do sistema para o controle por realimentação de estados está presente na figura 17. Considerando o comportamento desejado na figura 10, pode-se dizer que o controle dimensionado cumpriu com o seu objetivo na simulação.
Figura 17 – Controle por realimentação de estados
Capítulo 3. Aplicação da Metodologia 39
3.4 Resultados dos Experimentos
Depois dos resultados de todas as simulações e de validar tudo o que foi desen-volvido, aplicou-se o controle no sistema real. Como o processador é um dispositivo que trabalha em tempo discreto, foi necessário discretizar algumas equações de modo à implementar o controle por realimentação de estados no pêndulo real.
Para transformar a equação 2.57 para o tempo discreto, utilizou-se as seguintes substituições:
Ad= AT − I
Bd= BT
Cd = C
(3.1)
Além disso, discretizou-se a equação desejada 2.67 utilizando a técnica de equivalência de pólos com auxílio do MATLAB, o que resultou em
det(λI − (Ad− BdKd)) = Qd(λ) (3.2)
Fazendo as devidas substituições, foi possível obter o novo ganho
K
d na equação 3.3através do método de equivalência de polinômios.
Kd=
h
14482 2714 −152 96 i
(3.3)
resultando assim na estratégia de controle
u = −Kdx
.O sistema controlado em torno de π rad está presente na figura 18. A estratégia desenvolvida foi capaz de manter o pêndulo na posição desejada por aproximadamente 1000 amostras de tempo em média, o que equivale a 5 segundos.
Capítulo 3. Aplicação da Metodologia 40
Figura 18 – Controle em torno de π rad
Fonte: Autoria Própria.
O resultado da aplicação do controle responsável por elevar o pêndulo até π rad é demostrado na figura 19. Quando a posição do pêndulo é igual a 1600, pode-se definir que o mesmo se encontra em π rad.
Figura 19 – Controle para elevar o pêndulo para a posição π rad
41
4 Conclusão
Considerando os objetivos iniciais do trabalho, pode-se dizer que eles foram majoritariamente atingidos. Através de alguns testes demonstrados na seção 3, foi possível concluir que a modelagem do sistema foi realizada adequadamente. Além disso, o objetivo de elevar o pêndulo até π rad e mantê-lo nessa posição alternando entre duas estratégias de controle diferentes também foi alcançado na simulação do sistema.
No que diz respeito à implementação das estratégias de controle no sistema real, encontrou-se uma limitação. Apesar de conseguir aplicá-las individualmente, elas não foram capazes de atuar em sincronia. A justificativa para tal acontecimento provavelmente se encontra no fato de que para o dimensionamento do controle baseado em energia, foram feitas algumas simplificações na definição da energia total do pêndulo, o que resultou em um controle imperfeito, fazendo assim com que a velocidade da haste ao chegar no topo fosse diferente de 0 rad/s. Isso fez com que o acionamento do controle por realimentação de estados saturasse e a queda não conseguisse ser revertida. Para efeito de comparação, na simulação do sistema, foi possível obter que o ângulo máximo para que essa estratégia fosse capaz de controlar a haste no topo era de aproximadamente
π ± 0.08π
rad
, o que demonstra a facilidade para que o sistema saturasse e a baixa amplitude de operação do mesmo.O controle por realimentação de estados atuou de forma satisfatória no sistema, considerando as limitações do protótipo. O tempo médio em que a haste se mantinha no topo era de aproximadamente 5 segundos, o que poderia ter sido ampliado caso a montagem do pêndulo tivesse sido melhor dimensionada na seção 2.1 deste trabalho acadêmico.
Apesar das circunstâncias, os resultados obtidos foram satisfatórios, pois trouxe-ram um grande aprendizado acadêmico em algumas das principais áreas da Engenharia de Controle e Automação, que são o controle e a identificação matemática de sistemas.
42
Referências
ACOSTA, J. A. Furuta’s pendulum: A conservative nonlinear model for theory and practice. Mathematical Problems in Engineering, 2010.
ASTROM, K. J.; FURUTA, K. Swinging up a pendulum by energy control. Automatica, v. 36, p. 278 – 285, 2000.
ASTROM, K. J. et al. Bycicle dynamics and control. IEEE Control Systems Magazine, v. 25, p. 26 – 47, 2005.
BARS, R. et al. Theory, algorithms and technology in the design of control systems. Annual Reviews in Control, v. 30, p. 19 – 30, 2006.
BLOCK, D. J. et al. The reaction wheel pendulum. San Rafael: Morgan & Claypool Publishers, 2007. v. 1.
CARRÉ, D. J.; BERTRAND, P. A. Analysis of Hubble Space Telescope Reaction Wheel Lubricant. Journal of Spacecraft and Rockets, v. 36, n. 1, p. 109 – 113, 1999.
FONTANI, I.; LOZANO, R. Non-linear Control for Underactuated Mechanical Systems. 1. ed. Compiegne: Springer London, 2002. 89 – 106 p.
KHEIR, N. A. et al. Control systems engineering education. Automatica, v. 32, p. 147 – 166, 1996.
MURRAY, R. M. et al. Future directions in control in an information-rich world. IEEE Control Systems Magazine, v. 23, p. 20 – 33, 2003.
SALTON, A. T. Notas de Aula. Faculdade de Engenharia, Pontifícia Universidade Católica do Rio Grande do Sul. 2017.
SPONG, M. W. The swing up control problem for the acrobot. IEEE Control Systems Magazine, v. 15, p. 72 – 79, 1995.
SRINIVAS, K. N.; LAXMIDHAR. Swing-up control strategies for a reaction wheel pendulum. International Journal of Systems Science, v. 39, n. 12, p. 1165 – 1177, 2008. TOMIZUKA, M. Mechatronics: From the 20th to 21st century. Control Engineering Practice, v. 22, p. 877 – 886, 2002.
TORRE, D. la. Control del péndulo de furuta. 2004. Dissertação (Mestrado) — Centro de Investigación Científica y de Educación Superior de Ensenada, Ensenada.
WEINBERG, J. B. et al. A multidisciplinary model for using robotics in engineering education. Proceedings of Annual Conference & Exposition of the American Society for Engineering Education, Albuquerque, p. 693 – 701, 2001.
YOUNIS, W.; ABDELATI, M. Design and implementaton of experimental segway model. AIP Conference Proceedings, v. 1107, p. 350 – 354, 2009.