Pontificia Universidade Católica do Rio Grande do Sul Faculdade de Engenharia Engenharia de Controle e Automação. Gabriel Perini Werner

(1)

Pontificia Universidade Católica do Rio Grande do Sul Faculdade de Engenharia

Engenharia de Controle e Automação

Gabriel Perini Werner

Pêndulo Acionado com Roda de Reação

Trabalho de Conclusão de Curso

Porto Alegre 2017

(2)

Gabriel Perini Werner

Pêndulo Acionado com Roda de Reação

Trabalho de Conclusão de Curso apresen-tado como parte dos requisitos necessários à obtenção do título de Engenheiro de Con-trole e Automação pela Pontifícia Universi-dade Católica do Rio Grande do Sul.

Orientador: Aurélio Tergolina Salton

Porto Alegre 2017

(3)

À todos aqueles que de alguma forma estiveram e estão próximos de mim, fazendo com que tudo valha a pena.

(4)

Agradecimentos

À minha família, pelo amor, incentivo e apoio incondicional. À minha namorada, por me aguentar falando sobre o trabalho de conclusão de curso todos os dias e me ajudar na elaboração e estruturação da parte escrita, mesmo sem entender ao que o texto se referia. Ao meu orientador, por todos os ensinamentos não só durante a elaboração desta atividade, mas também durante as disciplinas que ministrou.

(5)

Resumo

A análise de sistemas subatuados como o pêndulo invertido é muito eficiente no estudo e desenvolvimento de estratégias de controle avançadas, aplicadas à sistemas não lineares, e vem sendo objeto de pesquisa por mais de uma década. Além de oferecer características únicas inerentes à esse tipo de sistemas, eles apresentam como uma de suas maiores vantagens a dinâmica simplificada. Nesse trabalho, será descrito o estudo de um pêndulo invertido acionado com uma roda de reação. O problema de controle foi dividido em duas etapas, primeiro a haste deveria se encontrar na posição elevada, o que pode ser denominado de swing up - ato de balançar até o topo - do pêndulo, essa tarefa foi realizada através do método de Lyapunov, que considera a energia do sistema. Depois, o mesmo deveria ser capaz de se manter nessa posição, mesmo que distúrbios fossem aplicados, o que foi feito utilizando um controle por realimentação de estados.

(6)

Abstract

The analysis of underactuated systems as the inverted pendulum is very effective in the study and development of advanced control techniques applied to non-linear systems, and has been on focus of researchers for over a decade. Besides offering inherent characteristics of this type of assemblies, they present as one of their greatest advantages, its simplified dynamics. In this academic work, the inverted pendulum actuaded by a reaction wheel was studied. The control problem was divided in two stages. Firstly, the pendulum swing up would be applied based on the Lyapunov’s energy theory. Moreover, the system would have to keep its upright position, even when disturbances were applied, which was accomplished with state feedback control.

(7)

Lista de ilustrações

Figura 1 – Pêndulo de Furuta . . . 13

Figura 2 – BMW 15 . . . 14

Figura 3 – Componentes elétricos do projeto . . . 16

Figura 4 – Esquema elétrico . . . 18

Figura 5 – Partes mecânicas feitas no PTC Creo Parametric 3.0 . . . 19

Figura 6 – Montagem final do sistema . . . 20

Figura 7 – Resposta ao degrau . . . 21

Figura 8 – Pendulo acionado com roda de reação . . . 22

Figura 9 – Resposta da velocidade da roda de reação em relação à um degrau de entrada . . . 28

Figura 10 – Comportamento desejado do sistema . . . 33

Figura 11 – Comparação entre a resposta real e aproximada do pêndulo . . . . 35

Figura 12 – Comparação entre a resposta real e aproximada da roda de reação 35 Figura 13 – Comparação entre o modelo linear e não linear . . . 36

Figura 14 – Diagrama de blocos do sistema proposto . . . 36

Figura 15 – Resultado final da posição do pêndulo com ambas estratégias de controle implementadas . . . 37

Figura 16 – Resultado final da velocidade do pêndulo com ambas estratégias de controle implementadas . . . 38

Figura 17 – Controle por realimentação de estados . . . 38

Figura 18 – Controle em torno de π rad . . . 40

(8)

Lista de tabelas

Tabela 1 – Especificações técnicas do motor sem carga . . . 17 Tabela 2 – Especificações adicionais do motor . . . 17

(9)

Lista de abreviaturas e siglas

LTDA Limitada

MMQ Método dos Mínimos Quadrados

PRR Pêndulo Acionado com Roda de Reação

PUCRS Pontifícia Universidade Católica do Rio Grande do Sul PWM Modulação por Largura de Pulso

(10)

Lista de símbolos

A Ampere

b Ganho de Lyapunov

cm Centímetro

E Energia do Pêndulo Simples

g Gravidade

I Matriz Identidade

J Inércia do Pêndulo Simples

kfg Quilograma-força

k Ganho genérico

L Momento angular

mA Miliampere

rpm Rotação por minuto

¯

E

Constante de atrito do Pêndulo

¯

F

Constante de atrito da Roda de Reação

¯

τ

Constante de tempo

¨

q

1 Aceleração angular da Haste

¨

q

2 Aceleração angular da Roda de Reação

˙

q

1 Velocidade angular da Haste

˙

q

2∞ Velocidade angular da Roda de Reação em regime permanente

˙

q

2 Velocidade angular da Roda de Reação

E

0 Energia do Pêndulo Simples na posição de topo

E

c1 Energia cinética do Pêndulo

Ec2

Energia cinética da Roda de Reação

(11)

Ep

Energia potencial

E

t Energia total

I

1 Inércia do Pêndulo

I2

Inércia da Roda de Reação

K

Ganhos do Controlador

l

1 Comprimento do Pêndulo

La

Equação de Lagrange

l

c1 Distância ao centro de gravidade do Pêndulo

l

c2 Distância ao centro de gravidade da Roda de Reação

m1

Massa do Pêndulo

m

2 Massa da Roda de Reação

q

1 Ângulo da Haste

q2

Ângulo da Roda de Reação

q

i Coordenadas generalizadas do Sistema

τ

Torque

uP W M

Entrada do Motor

v

2 Velocidade tangencial da Roda de Reação

V (q

1

, ˙

q

1

)

Função candidata de Lyapunov

xe

Ângulo de equilíbrio do Pêndulo

T Período de amostragem

V Volt

(12)

Sumário 1 Introdução . . . . 12 1.1 Tema de Pesquisa . . . . 14 1.2 Justificativa do Tema . . . . 14 1.3 Objetivo do Trabalho . . . . 15 1.4 Delimitações do Trabalho . . . . 15 2 Metodologia . . . . 16 2.1 Prototipagem . . . . 16 2.1.1 Testes . . . 20

2.2 Modelagem Matemática do Sistema . . . 21

2.3 Identificação dos Parâmetros do Sistema . . . . 26

2.3.1 Identificação dos Parâmetros da Roda de Reação . . . 27

2.3.2 Identificação dos Parâmetros do Pêndulo . . . 29

2.4 Linearização e Representação em Espaço de Estados . . . . 30

2.5 Controle do Sistema . . . . 31

2.5.1 Controle Baseado em Energia . . . 31

2.5.2 Controle Através da Realimentação de Estados . . . 33

3 Aplicação da Metodologia . . . . 35

3.1 Resultados da Identificação do Sistema . . . . 35

3.2 Resultado da Linearização do Modelo . . . . 35

3.3 Resultados das Simulações . . . . 36

3.4 Resultados dos Experimentos . . . . 39

4 Conclusão . . . . 41

(13)

12

1 Introdução

A Engenharia de controle é um campo rico em oportunidades e novas direções (MURRAY et al., 2003) que lida com disciplinas e métodos capazes de implementar decisões automáticas em diversos processos de maneira a aumentar seu desempenho, eficiência e rapidez. O avanço nesse campo de estudo é diretamente relacionado com o avanço nas pesquisas relacionadas à tecnologias, teoria de desenvolvimento de estratégias de controle e suas implementações em tempo real (BARS et al., 2006). Além disso, pode-se considerar que o constante desenvolvimento de novas tecnologias é diretamente relacionado com o desenvolvimento da educação (KHEIR et al., 1996).

Atualmente, os maiores campos de aplicação desses temas é na robótica (WEIN-BERG et al., 2001) e na mecatrônica (TOMIZUKA, 2002), que são também áreas de muita atratividade entre os estudantes, devido à alta tecnologia envolvida em tais assuntos e também a sua curva de desenvolvimento nos últimos anos, fazendo as-sim com que os jovens observem uma grande perspectiva de crescimento nesses campos de estudo. O pêndulo invertido, dentre outras coisas, é considerado uma das maiores referências no estudo da robótica e da mecatrônica. Existem diversas con-figurações disponíveis, cada uma com suas peculiaridades, dentre as mais comuns, encontram-se o Acrobot (SPONG, 1995), o Pêndulo de Furuta (TORRE, 2004; ACOSTA, 2010) e a Bicicleta (ASTROM; KLEIN; LENNARTSSON, 2005). Na figura 1, tem-se uma demonstração esquemática do Pêndulo de Furuta.

(14)

Capítulo 1. Introdução 13

Figura 1 – Pêndulo de Furuta

Fonte: (TORRE, 2004).

Devido à sua alta instabilidade em malha aberta e características não lineares, esses sistemas tem sido usado extensivamente na educação e implementação de técnicas de controle avançadas (BLOCK; ASTROM; SPONG, 2007; ASTROM; FURUTA, 2000) . A configuração básica de um pêndulo invertido consiste de uma haste móvel, com diferentes tipos de acionamentos, sejam eles indiretos, como no caso de uma roda de reação, ou diretos, como no caso de um Segway (YOUNIS; ABDELATI, 2009).

O objeto de estudo desse trabalho é especificamente o pêndulo invertido acio-nado com uma roda de reação, também conhecido como PRR. Uma das aplicações mais interessantes desse princípio é no controle do Telescópio Hubble (CARRÉ; BER-TRAND, 1999), onde rodas de reação são utilizadas para direcioná-lo no espaço. O princípio de aplicação de uma roda de reação é baseado na conservação do momento angular (SRINIVAS; LAXMIDHAR, 2008), por exemplo, para acelerar uma roda através de um motor acoplado, o objeto no qual o motor está preso terá que rotacionar no outro sentido, como a roda de reação normalmente é uma fração do peso total de uma espaçonave, é fácil aplicar pequenas alterações na direção da mesma. Esse conceito vem sendo utilizado no desenvolvimento de bicicletas e motocicletas que se auto-equilibram, como se pode observar na figura 2.

(15)

Figura 2 – BMW 15

Fonte: Página da Gazeta do Povo1_.

1.1 Tema de Pesquisa

Ao longo desse documento, serão traçadas técnicas de modelagem e identifi-cação de sistemas, bem como a implementação de um controle por realimentação de estados e também a aplicação da teoria de energia de Lyapunov.

1.2 Justificativa do Tema

Considerando a utilização de rodas de reação em sistemas que se comportam como pêndulos por exemplo, motocicletas capazes de se equilibrar automaticamente -e no dir-ecionam-ento d-e obj-etos na indústria a-ero-espacial - como posicionam-ento d-e satélites -, faz-se necessário o estudo desse conceito.

1 _{¹ Disponível em}

(16)

1.3 Objetivo do Trabalho

O Objetivo do trabalho foi a implementação de uma estratégia de controle aplicada a um pêndulo acionado com roda de reação. O pêndulo deveria começar na posição vertical inferior e atingir a posição vertical superior através da aplicação de conceitos de energia. Uma vez que o mesmo se encontrasse no topo, ele deveria manter essa posição.

1.4 Delimitações do Trabalho

O trabalho se delimitou ao estudo e implementação de uma estratégia de controle aplicada à um pêndulo acionado com roda de reação. A maioria das aplicações reais desse conceito são implementadas em sistemas que possuem mais do que dois graus de liberdade, mas nesse trabalho foi analisado um sistema com apenas dois graus, de modo a simplificar o desenvolvimento do protótipo e diminuir a complexidade da modelagem matemática.

(17)

16

2 Metodologia

Inicialmente, foi feita a prototipagem do PRR, de acordo com a determinação do processador, driver, atuador e sensores presentes no sistema. A segunda etapa se baseou na identificação matemática, de modo a encontrar equações que descre-vessem o movimento do sistema. Com isso, se estabeleceu a estratégia de controle para o pêndulo. Primeiro, foi desenvolvida uma estratégia de controle para equilibrar o objeto no topo e depois uma estratégia baseada em conceitos de energia para tirá-lo da posição inicial e levá-lo até a posição vertical superior.

2.1 Prototipagem

Após a definição de quais seriam os componentes e a estrutura para o pên-dulo, um desafio encontrado foi a montagem de um dispositivo capaz de realizar movimentos de grande amplitude, sendo esse um fator importante no controle do sistema. Tal amplitude, seria determinada pelo peso total da estrutura e pelo torque gerado pelo motor. Na figura 3 estão os componentes elétricos básicos utilizados.

Figura 3 – Componentes elétricos do projeto

Fonte: Autoria Própria.

O processador utilizado - ARDUINO MEGA 2560 - foi escolhido com base na sua simplicidade para a implementação de projetos com baixos níveis de processamento. Além disso, dois encoders incrementais do tipo A38S6-400-2-2-24, com uma resolução

(18)

Capítulo 2. Metodologia 17

de 400 pulsos por volta, foram utilizados como sensores para determinar as posições do pêndulo e da roda de reação. O motor Akiyama AK555/11.1PF12R83CE-V2, utilizado na roda, tem suas especificações técnicas descritas nas tabelas 1 e 2.

Tabela 1 – Especificações técnicas do motor sem carga

Tensão Operação Tensão Nominal Rotação Corrente

6V ∼ 24V 12 V 83 rpm 430 mA

Fonte: Página do Fabricante1_.

Tabela 2 – Especificações adicionais do motor

Maximo rendimento Partida

Rotação Corrente Torque Potência Corrente Torque

65,4 rpm 1.6 A 11 kfg.cm 5 W 6 A 53 kgf.cm

Fonte: Página do Fabricante1_.

O motor utilizado possuia uma caixa de redução com o objetivo de diminuir a rotação e aumentar o torque do mesmo. O seu acionamento é feito através do driver BTS7960b, capaz de operar com correntes de até 45 A, sendo essa capacidade impres-cindível devido à alta corrente que o motor necessitaria para a aplicação de torques elevados.

O esquema elétrico de ligação do sistema, figura 4, foi realizado com auxílio do software Proteus. O principal componente é o processador. Foram utilizadas duas fontes de alimentação, uma de 12 V para o motor e encoders e uma de 5 V para o Arduino. Além disso, alguns resistores foram implementados para limitar a corrente de entrada nas portas do processador. É importante observar que os sinais de saída dos encoders foram conectados nas portas 18, 19, 20 e 21, que são portas de interrupção do processador.

(19)

Figura 4 – Esquema elétrico

Fonte: Autoria Própria

Além dos componentes elétricos, desenvolveu-se partes mecânicas acopláveis, de modo a completar a montagem do PRR. O projeto desses componentes foi feito com o auxílio do software PTC Creo Parametric e posteriormente fabricados em chapa preta pela Implemis - Indústria de Máquinas e Implementos Agrícolas LTDA. Na figura 5, estão as peças modeladas no software mencionado, que correspondem à base de sustentação do pêndulo, à haste e à roda de reação.

(20)

Figura 5 – Partes mecânicas feitas no PTC Creo Parametric 3.0

No resultado da montagem, figura 6, pode-se observar, que a medição de rotação na roda é feita através de um esquema de engrenagens 1:1, sendo que o encoder serve como sensor tanto da roda como da haste. A única diferença é que no sensoriamento da haste, a medição é feita sem o auxílio de engrenagens, ou seja, enquanto a haste está fixada em um eixo preso a um rolamento presente na base de sustentação, o encoder capta a movimentação desse eixo.

(21)

Figura 6 – Montagem final do sistema

Fonte: Autoria Própria 2.1.1 Testes

A maior dificuldade da prototipagem foi encontrar um motor que apresentasse uma resposta satisfatória ao sistema. Foram testados três modelos até que se esco-lhesse o motor da figura 3. Na figura 7, observa-se a resposta do sistema à aplicaçao de um degrau de entrada. O software utilizado na programação do processador foi o Arduino Nightly, enquanto no processamento dos dados de posição, velocidade e aceleração tanto da roda de reação quanto do pêndulo, foi o MATLAB.

(22)

Figura 7 – Resposta ao degrau

A imagem acima não possui tratamento de dados. Enquanto a entrada, refere-se ao sinal de Pulse Width Modulation - PWM aplicado ao motor, a posição da roda de reação e da haste são referentes aos sinais lidos pelos encoders. Considerando que uma volta completa é equivalente à 1600 pulsos, pode-se dizer que a amplitude máxima do sinal é aproximadamente 0,015 π.

2.2 Modelagem Matemática do Sistema

A montagem em questão tem dois graus de liberdade, sendo o pêndulo o primeiro ponto de fixação e a roda de reação o segundo. Um esquemático do pêndulo acionado com roda de reação pode ser observado na figura 8.

(23)

Figura 8 – Pendulo acionado com roda de reação

Fonte: (FONTANI; LOZANO, 2002).

A movimentação de um pêndulo invertido pode ser descrita em termos de energia (BLOCK; ASTROM; SPONG, 2007) , o que será demonstrado a seguir:

Considerando

q

1 como sendo a posição do pêndulo,

q

2 como sendo a posição

da roda de reação,

m

1 como sendo a massa do pêndulo,

m

2 sendo a massa da roda

de reação. Além disso, tem-se que

l

c1 é a distância do eixo de rotação ao centro de

gravidade do pêndulo e

l

c2 é a distância do eixo de rotação da roda de reação ao

seu centro de gravidade. Com isso, foi definido o parâmetro

m

, que seria utilizado posteriormente.

¯

m = m1lc1+ m2lc2 (2.1)

Tendo em vista que

I

1 é a inércia do pêndulo e

I

2 é a inércia da roda de

reação, a segunda etapa foi encontrar as energias envolvidas no sistema, que podem ser dividídas em energia cinética

Ec

e energia potêncial

Ep

. A energia cinética do pêndulo

Ec1

é descrita na equação 2.2 e a energia cinética da roda de reação

Ec2

é descrita na equação 2.3 Ec1 = 1 2(m1l 2 c1+ I1) ˙q1 (2.2) Ec2= 1 2m2l 2 1q˙12+ 1 2I2( ˙q1+ ˙q2) 2 _(2.3)

(24)

Considerando que a energia cinética total do sistema

E

c é a soma de todas energias,

tem-se que Ec= 1 2(m1l 2 c1+ m2l12+ I1+ I2) ˙q1+ I2q˙1q˙2 + 1 2I2q˙2 (2.4) A energia potencial do sistema

E

p é descrita na equação 2.5.

Ep = (m1lc1+ m2l1)(gcos(q1− 1)) (2.5)

Substituindo a equação 2.1 em 2.5 se tem a equação simplificada 2.6

Ep = ¯mg(cos(q1− 1)) (2.6)

A partir das equações 2.5 e 2.4, obteve-se a equação de Lagrange

L

a

= E

c

− E

p,

que é a função que descreve o sistema através de suas coordenadas generalizadas

q

i.

La = 1 2(m1l 2 c1+ m2l12+ I1+ I2) ˙q12+ I2q˙1q˙2+ 1 2I2q˙2− ¯mg(cos(q1) − 1) (2.7) Utilizando a equação de Euler-Lagrange em 2.8 e considerando que

τ

é o torque do sistema, foi possível obter a dinâmica do sistema.

d dt ∂La ∂ ˙q (q, ˙q) − ∂La ∂q (q, ˙q) = τ (2.8)

Expressando as derivadas parciais separadamente, tem-se ∂La ∂ ˙q1 = (m1l2c1+ m2l21+ I1+ I2) ˙q1+ I2q˙2 (2.9) ∂La ∂q1 = ¯mgsin(q1) (2.10) ∂La ∂ ˙q2 = I2q˙1+ I2q˙2 (2.11)

(25)

∂La

∂q2

= 0 (2.12)

Substituindo os resultados de 2.9, 2.10, 2.11 e 2.12 em 2.8, tem-se as equações dinâmicas do sistema 2.13 e 2.14

(m1l2c1+ m2l21+ I1+ I2)¨q1+ I2q¨2− ¯mgsin(q1) = 0 (2.13)

I2q¨1+ I2q¨2 = τ (2.14)

Isolando o termo

q2

¨

em 2.14, foi possível se obter

¨ q2 =

τ I2

− ¨q1 (2.15)

Substituindo a equação 2.15 em 2.13, encontra-se a equação 2.16

¨ q1 =

−τ + ¯mgsin(q1)

m2l2c1+ m2l12+ I1

(2.16)

Reescrevendo a equação 2.14 com a substituição de

q

¨

1 pela equação 2.16

¨ q2 = τ I2 + τ − ¯mgsin(q1) m2l2c1+ m2l21+ I1 (2.17)

Reorganizando 2.17, foi possivel obter a equação 2.18

¨ q2 = τ I2(m2lc12 + m2l12+ I1) − mgsin(q¯ 1) m2lc12 + m2l12+ I1 (2.18)

Nesse momento, foram introduzidas algumas constantes para facilitar a obtenção dos parâmetros do sistema. ¯ A = −1 m2l2c1+ m2l21+ I1 (2.19) ¯ B = mg¯ m2lc12 + m2l12+ I1 (2.20) ¯ C = 1 I2(m2lc12 + m2l12+ I1) (2.21)

(26)

¯

D = − ¯mg m2l2c1+ m2l21+ I1

(2.22)

Substituindo as novas constantes em 2.19, 2.20, 2.21 e 2.22 nas equações 2.16 e 2.18, obteve-se

¨

q1 = ¯Aτ + ¯Bsin(q1) (2.23)

¨

q2 = ¯Cτ + ¯Dsin(q1) (2.24)

Considerando que o amortecimento de um sistema genérico é dado pelo produto do coeficiente de amortecimento e da velocidade do mesmo, adicionou-se esse termo tanto em 2.23 quanto em 2.24, o que resultou nas equações 2.25 e 2.26. Nota-se que

F

¯

se refere ao coeficiente de atrito da roda de reação e

E

¯

ao do pêndulo

¨

q1 = ¯Aτ + ¯Bsin(q1) + ¯E ˙q1 (2.25)

¨

q2 = ¯Cτ + ¯Dsin(q1) + ¯F ˙q2 (2.26)

Analisando a equação 2.26, percebeu-se que a posição do pêndulo

q

1 pode

ser desprezada, pois pouco influência na equação de movimento da roda de reação, sendo esse termo eliminado:

¨

q2 = ¯Cτ + ¯F ˙q2 (2.27)

O torque

τ

é gerado através de um sinal de entrada

u

P W M, que varia de 0 a

255, sendo necessário introduzir uma nova equação intermediária

τ = kP W M ∗ uP W M (2.28)

Substituindo a equação 2.28 na equação 2.27, tem-se

¨

q2 = ¯CkP W MuP W M + ¯F ˙q2 (2.29)

Pode-se definir que a aplicação de um sinal de entrada

u

P W M no motor será

responsável pela aceleração equivalente da roda de reação

q

¨

2, entretanto para definir

como esse sinal influenciará na aceleração do pêndulo

q

¨

1, é preciso entender alguns

(27)

definido pelo produto entre a massa, velocidade tangencial e distância dessa velocidade ao centro de rotação do sistema, podendo-se dizer que o momento angular da roda de reação é definido por

L = m2v2l2 (2.30)

Considerando que

v

2 é a velocidade tangencial da roda de reação, tem-se que

v2 = ˙q2l2 (2.31)

Assim, pode-se substituir 2.31 em 2.30:

L = m2q˙2l22 (2.32)

Sabe-se que o torque gerado por um corpo é definido pela variação do seu momento angular em relação ao tempo. Sendo possível definir a equação do

τ

aplicado em

q1

¨

, que é gerado através da roda de reação do sistema

τ = dL dt (2.33) substituindo 2.32 em 2.33 τ = m2l22 d ˙q2 dt (2.34) Sabendo que d ˙q2 dt

= ¨

q

2 e considerando que

m

2

l

2

= k

τ, foi possível definir que

o torque aplicado ao pêndulo pode ser descrito como

τ = kτq¨2 (2.35)

Substituindo 2.35 em 2.25, chegou-se à equação final do pêndulo em 2.36.

¨

q1 = ¯Akτq¨2+ ¯Bsin(q1) + ¯E ˙q1 (2.36)

2.3 Identificação dos Parâmetros do Sistema

Com posse das equações 2.29 e 2.36, a próxima etapa foi encontrar os pa-râmetros do sistema para obter uma boa aproximação do modelo matemático em

(28)

relação ao sistema real. Na equação da roda de reação

q1

¨

, utilizou-se a aproximação de primeira ordem através da aplicação de um degrau ao sistema. Já na equação do pêndulo

q

¨

2, utilizou-se o método dos mínimos quadrados, que usa os dados disponíveis

para obter os parâmetros desejados.

2.3.1 Identificação dos Parâmetros da Roda de Reação

Considerando a equação 2.29, a transformada de Laplace é dada pela equação 2.37 G2(s) = Q2(s) U (s) = ¯ CkP W M s(s − ¯F ) (2.37)

Com base nisso, tem-se que

s ˙Q2(s)

U (s) = ¯ CkP W M

s − ¯F (2.38)

Considerando um modelo genérico de uma equação de primeira ordem

G(s) = k ¯

τ s + 1 (2.39)

pode-se igualar a equação 2.38 à 2.39, de modo que os parâmetros se equivalham para obter a aproximação das constantes de acordo com a resposta do sistema ao degrau. Foram necessárias algumas alterações para que as equações se tornassem equivalen-tes. s ˙Q2(s) U (s) = − ¯CkP W M/ ¯F ¯ τ s + 1 (2.40)

Com base nisso, foi possível obter os parâmetros da roda de reação utilizando a sua curva de resposta da velocidade

q

˙

2 em função do sinal de entrada

u

P W M

(29)

Figura 9 – Resposta da velocidade da roda de reação em relação à um degrau de entrada

Através da análise dos gráficos presentes na figura 9 e da equivalência das equações 2.39 e 2.40, foi obtida a velocidade angular da roda de reação em regime permanente

q

˙

2∞, que é aproximadamente 8.639 rad/s com uma entrada

u

P W M de

255, logo k = − ¯CkP W M ¯ F = ˙ q2∞ uP W M = 8.639 255 = 0.0339 (2.41)

Para obter a constante de tempo

τ

¯

, foi necessário identificar o tempo que o sistema levou para atingir aproximadamente 63,2% de sua velocidade

q

˙

2∞, ou seja,

˙

q2¯τ = 0, 632 ˙q2∞ = 5.46rad/s (2.42)

Considerando que a constante

τ

¯

é definida pelo tempo que o sistema leva para chegar na velocidade

q

˙

2¯τ, o que acontece em aproximadamente 15 amostras de tempo e que

o período de amostragem T é de 0,005 segundos, tem-se que

¯

(30)

Com base nisso, foi possível obter a equação final 2.44 da roda de reação e seus parâmetros

¨

q2 = φ1uP W M+ φ2q˙2

φ =h0, 450 −13, 330

i (2.44)

2.3.2 Identificação dos Parâmetros do Pêndulo

Para obter os parâmetros da equação 2.36, utilizou-se o Método dos Mínimos Quadrados, conhecido como MMQ (SALTON, 2017) . Essa metodologia utiliza dados de um experimento para que se possa obter uma aproximação dos parâmetros da equação em questão.

Tendo em vista que no sistema tem-se

q

¨

1,

q

¨

2,

q

˙

1 e

q

1, pois foram implementados

sensores medindo a posição do pêndulo e da roda de reação e o restante dos dados podem ser obtidos através de uma simples derivação desses parâmetros. É possível definir que as constantes obtidas através do MMQ foram

Akτ

¯

,

B

¯

e

E

¯

.

Para que tal análise fosse possível, foi preciso inserir os dados em matrizes.            ¨ q1(1) ¨ q1(2) ¨ q1(3) ¨ q1(4) ¨ q1(5) .. .            =            ¨ q2(1) sen(q1)(1) q˙1(1) ¨ q2(2) sen(q1)(2) q˙1(2) ¨ q2(3) sen(q1)(3) q˙1(3) ¨ q2(4) sen(q1)(4) q˙1(4) ¨ q2(5) sen(q1)(5) q˙1(5) .. . ... ...            h ¯ Akτ B¯ E¯ i (2.45)

Considerando 2.45, as variaveis

Ψ

,

θ

e

α

em 2.46, 2.47 e 2.48, respectivamente, foram introduzidas para facilitar a manipulação matemática da equação.

Ψ =            ¨ q2(1) sen(q1)(1) q˙1(1) ¨ q2(2) sen(q1)(2) q˙1(2) ¨ q2(3) sen(q1)(3) q˙1(3) ¨ q2(4) sen(q1)(4) q˙1(4) ¨ q2(5) sen(q1)(5) q˙1(5) .. . ... ...            (2.46) θ = h ¯ Akτ B¯ E¯ i (2.47)

(31)

Capítulo 2. Metodologia 30 α =            ¨ q1(1) ¨ q1(2) ¨ q1(3) ¨ q1(4) ¨ q1(5) .. .            (2.48)

Então, com essas equações tem-se a simplificação

α = Ψθ (2.49)

utilizando alguns conceitos de álgebra matricial, foi possível isolar a matriz desejada

θ

.

θ = (ΨTΨ)−1ΨTα (2.50)

Alterando a notação de 2.36 em função da matriz

θ

, obteve-se 2.51, que é a equação final do pêndulo.

¨

q1 = θ1q¨2+ θ2sin(q1) + θ3q˙1

θ =h0, 050 −13, 150 −0, 049

i (2.51)

2.4 Linearização e Representação em Espaço de Estados

Tendo em vista que o controle do pêndulo na posição de topo será feita com base em uma representação do sistema em espaço de estados, fez-se necessário a linearização das equações obtidas em 2.44 e 2.51 para que posteriormente o controle por realimentação de estados pudesse ser projetado.

Considerando a representação em espaço de estados

˙x = Ax + Bu (2.52) tem-se que x1 = q1 x2 = ˙q1 x3 = q2 x4 = ˙q2 u = uP W M (2.53)

(32)

Substituindo 2.44 em 2.51 e utilizando as variáveis descritas em 2.53, é possível se obter

˙x2 = θ1φ1u + θ1φ2x4+ θ2sen(x1) + θ3x2

˙x4 = φ1u + φ2x4

(2.54)

Considerando

f1

= x2

,

f2

= ˙x2

,

f3

= x4

e

f4

= ˙x4

, pode-se definir a linearização -em torno da posição de equilíbrio

xe

- de

A

e

B

em 2.52

A =       ∂f1 ∂x1 ∂f1 ∂x2 ∂f1 ∂x3 ∂f1 ∂x4 ∂f2 ∂x1 ∂f2 ∂x2 ∂f2 ∂x3 ∂f2 ∂x4 ∂f3 ∂x1 ∂f3 ∂x2 ∂f3 ∂x3 ∂f3 ∂x4 ∂f4 ∂x1 ∂f4 ∂x2 ∂f4 ∂x3 ∂f4 ∂x4       =       0 1 0 0 θ2cos(xe) θ3 0 θ1φ2 0 0 0 1 0 0 0 φ2       (2.55) B =       ∂f1 ∂u ∂f2 ∂u ∂f3 ∂u ∂f4 ∂u       =       0 θ1φ1 0 φ1       (2.56)

O ângulo de equilíbrio do pêndulo

x

epode ser 0 ou

π

rad

.Como o projeto de

controle do pêndulo será feito para mantê-lo na posição de topo, pode-se considerar que

xe

= π

rad

. Com os parâmetros obtidos na seção 2.3, tem-se a representação final em espaço de estados:

˙x =       0 1 0 0 θ2cos(xe) θ3 0 θ1φ2 0 0 0 1 0 0 0 φ2             x1 x2 x3 x4       +       0 θ1φ1 0 φ1       u (2.57) 2.5 Controle do Sistema

Após obter todos os parâmetros necessários para o controle do sistema, chegou-se a etapa final e objetivo do trabalho (elevar o pêndulo para a posição vertical superior através da teoria de energia de Lyapunov e controlá-lo em π rad utilizando a técnica de realimentação de estados).

(33)

Para elevar o sistema à posição de topo, foi introduzida uma equação simplifi-cada da movimentação de um pêndulo simples.

J ¨q1+ mglsen(q1) − kP W MuP W M = 0 (2.58)

A energia total do sistema foi definida como

E = 1 2J ˙q

2

1+ mgl(1 − cos(q1)) (2.59)

logo, como o objetivo era atingir a posição π com velocidade de

0 rad/s

, tem-se que

E0 = 2mgl (2.60)

.

Nesse momento, foi necessário introduzir a chamada função candidata de Lyapunov

V (q1, ˙q1) =

(E − E0)2

2 (2.61)

para encontrar uma lei de controle que fizesse com que a taxa de variação dessa função fosse negativa, independente das circunstâncias. Logo,

˙

V (q1, ˙q1) = (E − E0) ˙E (2.62)

Fazendo as devidas substituições na equação 2.62 e trabalhando a equação algebrica-mente, foi possível obter que

˙

V (q1, ˙q1) = (E − E0)(kP W MuP W M) ˙q1 (2.63)

Assim a lei de controle capaz de elevar o pêndulo para a posição de topo foi definida por

u = −bsgn(E − E0) ˙q1 (2.64)

sendo que b é um ganho genérico determinado experimentalmente. A equação 2.64 faz com que a equação 2.63 seja negativamente definida, o que faz com que a energia do sistema tenda a

E0

.

(34)

2.5.2 Controle Através da Realimentação de Estados

Considerando a representação em espaço de estados em 2.57, pode-se intro-duzir a lei de controle

u = −Kx

, de modo a alterar a dinâmica do sistema, resultando em

˙x = (A − BK)x (2.65)

O objetivo principal da utilização dessa estratégia de controle foi alocar pólos para que o sistema se comportasse da maneira desejada. Na figura 10 é possível se observar esse comportamento.

Figura 10 – Comportamento desejado do sistema

Para que o sistema se comportasse como na figura 10, adicionou-se os seguin-tes pólos: p1 = 15 p2 = 15 p3 = 0, 6 + 1, 9i p4 = 0, 6 − 1, 9i (2.66)

(35)

Com isso, a equação característica desejada obtida é

Q(λ) = λ4+ 31.2λ3+ 265λ2+ 390λ + 900 (2.67) A partir de 2.67, tem-se a igualdade

det(λI − (A − BK)) = Q(λ) (2.68)

de onde foi possível se obter que

(36)

35

3 Aplicação da Metodologia

Nesse capítulo do trabalho, são apresentados os resultados obtidos através da aplicação da metodologia em 2.

3.1 Resultados da Identificação do Sistema

Na figura 11 e 12 tem-se um comparativo entre a resposta real e a aproximada para a posição do pêndulo e da roda de reação. Ambas as respostas foram obtidas através da aplicação de um degrau de entrada.

Figura 11 – Comparação entre a resposta real e aproximada do pêndulo

Figura 12 – Comparação entre a resposta real e aproximada da roda de reação

A identificação cumpriu o seu objetivo, como ficou comprovado através da aplicação de diversas entradas ao sistema.

3.2 Resultado da Linearização do Modelo

Na figura 13, pode-se observar a comparação entre o modelo linear e o não linear. A importância de uma boa linearização reflete na estratégia de controle em 2.5.2, que foi feita com base na linearização e na representação do sistema em espaço

(37)

Capítulo 3. Aplicação da Metodologia 36

de estados. Como pode-se observar, a diferença entre os modelos é praticamente imperceptível.

Figura 13 – Comparação entre o modelo linear e não linear

3.3 Resultados das Simulações

O diagrama de blocos para a simulação através do software SIMULINK está presente na figura 14

Figura 14 – Diagrama de blocos do sistema proposto

O sistema é composto de duas estratégias de controle, a primeira, baseada em energia, é a primeira a ser acionada. Quando o pêndulo chega ao topo, há uma troca

(38)

de controle, através do switch implementado na simulação em 14, e então o controle por realimentação de estados entra em ação. A figura 15 demonstra o resultado obtido com ambas as estratégias de controle. O pêndulo começou na posição de descanso e atingiu o topo em aproximadamente 32,5 segundos.

Figura 15 – Resultado final da posição do pêndulo com ambas estratégias de controle implementadas

Um ponto importante para cumprir o objetivo do controle baseado em energia foi que o pêndulo chegasse no topo com velocidade nula, conforme representado na figura 16, para que assim o controle por realimentação de estados não saturasse.

(39)

Figura 16 – Resultado final da velocidade do pêndulo com ambas estratégias de controle implementadas

A resposta do sistema para o controle por realimentação de estados está presente na figura 17. Considerando o comportamento desejado na figura 10, pode-se dizer que o controle dimensionado cumpriu com o seu objetivo na simulação.

Figura 17 – Controle por realimentação de estados

(40)

3.4 Resultados dos Experimentos

Depois dos resultados de todas as simulações e de validar tudo o que foi desen-volvido, aplicou-se o controle no sistema real. Como o processador é um dispositivo que trabalha em tempo discreto, foi necessário discretizar algumas equações de modo à implementar o controle por realimentação de estados no pêndulo real.

Para transformar a equação 2.57 para o tempo discreto, utilizou-se as seguintes substituições:

Ad= AT − I

Bd= BT

Cd = C

(3.1)

Além disso, discretizou-se a equação desejada 2.67 utilizando a técnica de equivalência de pólos com auxílio do MATLAB, o que resultou em

det(λI − (Ad− BdKd)) = Qd(λ) (3.2)

Fazendo as devidas substituições, foi possível obter o novo ganho

K

d na equação 3.3

através do método de equivalência de polinômios.

Kd=

h

14482 2714 −152 96 i

(3.3)

resultando assim na estratégia de controle

u = −Kdx

.

O sistema controlado em torno de π rad está presente na figura 18. A estratégia desenvolvida foi capaz de manter o pêndulo na posição desejada por aproximadamente 1000 amostras de tempo em média, o que equivale a 5 segundos.

(41)

Figura 18 – Controle em torno de π rad

O resultado da aplicação do controle responsável por elevar o pêndulo até π rad é demostrado na figura 19. Quando a posição do pêndulo é igual a 1600, pode-se definir que o mesmo se encontra em π rad.

Figura 19 – Controle para elevar o pêndulo para a posição π rad

(42)

41

4 Conclusão

Considerando os objetivos iniciais do trabalho, pode-se dizer que eles foram majoritariamente atingidos. Através de alguns testes demonstrados na seção 3, foi possível concluir que a modelagem do sistema foi realizada adequadamente. Além disso, o objetivo de elevar o pêndulo até π rad e mantê-lo nessa posição alternando entre duas estratégias de controle diferentes também foi alcançado na simulação do sistema.

No que diz respeito à implementação das estratégias de controle no sistema real, encontrou-se uma limitação. Apesar de conseguir aplicá-las individualmente, elas não foram capazes de atuar em sincronia. A justificativa para tal acontecimento provavelmente se encontra no fato de que para o dimensionamento do controle baseado em energia, foram feitas algumas simplificações na definição da energia total do pêndulo, o que resultou em um controle imperfeito, fazendo assim com que a velocidade da haste ao chegar no topo fosse diferente de 0 rad/s. Isso fez com que o acionamento do controle por realimentação de estados saturasse e a queda não conseguisse ser revertida. Para efeito de comparação, na simulação do sistema, foi possível obter que o ângulo máximo para que essa estratégia fosse capaz de controlar a haste no topo era de aproximadamente

π ± 0.08π

rad

, o que demonstra a facilidade para que o sistema saturasse e a baixa amplitude de operação do mesmo.

O controle por realimentação de estados atuou de forma satisfatória no sistema, considerando as limitações do protótipo. O tempo médio em que a haste se mantinha no topo era de aproximadamente 5 segundos, o que poderia ter sido ampliado caso a montagem do pêndulo tivesse sido melhor dimensionada na seção 2.1 deste trabalho acadêmico.

Apesar das circunstâncias, os resultados obtidos foram satisfatórios, pois trouxe-ram um grande aprendizado acadêmico em algumas das principais áreas da Engenharia de Controle e Automação, que são o controle e a identificação matemática de sistemas.

(43)

42

Referências

ACOSTA, J. A. Furuta’s pendulum: A conservative nonlinear model for theory and practice. Mathematical Problems in Engineering, 2010.

ASTROM, K. J.; FURUTA, K. Swinging up a pendulum by energy control. Automatica, v. 36, p. 278 – 285, 2000.

ASTROM, K. J. et al. Bycicle dynamics and control. IEEE Control Systems Magazine, v. 25, p. 26 – 47, 2005.

BARS, R. et al. Theory, algorithms and technology in the design of control systems. Annual Reviews in Control, v. 30, p. 19 – 30, 2006.

BLOCK, D. J. et al. The reaction wheel pendulum. San Rafael: Morgan & Claypool Publishers, 2007. v. 1.

CARRÉ, D. J.; BERTRAND, P. A. Analysis of Hubble Space Telescope Reaction Wheel Lubricant. Journal of Spacecraft and Rockets, v. 36, n. 1, p. 109 – 113, 1999.

FONTANI, I.; LOZANO, R. Non-linear Control for Underactuated Mechanical Systems. 1. ed. Compiegne: Springer London, 2002. 89 – 106 p.

KHEIR, N. A. et al. Control systems engineering education. Automatica, v. 32, p. 147 – 166, 1996.

MURRAY, R. M. et al. Future directions in control in an information-rich world. IEEE Control Systems Magazine, v. 23, p. 20 – 33, 2003.

SALTON, A. T. Notas de Aula. Faculdade de Engenharia, Pontifícia Universidade Católica do Rio Grande do Sul. 2017.

SPONG, M. W. The swing up control problem for the acrobot. IEEE Control Systems Magazine, v. 15, p. 72 – 79, 1995.

SRINIVAS, K. N.; LAXMIDHAR. Swing-up control strategies for a reaction wheel pendulum. International Journal of Systems Science, v. 39, n. 12, p. 1165 – 1177, 2008. TOMIZUKA, M. Mechatronics: From the 20th to 21st century. Control Engineering Practice, v. 22, p. 877 – 886, 2002.

TORRE, D. la. Control del péndulo de furuta. 2004. Dissertação (Mestrado) — Centro de Investigación Científica y de Educación Superior de Ensenada, Ensenada.

WEINBERG, J. B. et al. A multidisciplinary model for using robotics in engineering education. Proceedings of Annual Conference & Exposition of the American Society for Engineering Education, Albuquerque, p. 693 – 701, 2001.

YOUNIS, W.; ABDELATI, M. Design and implementaton of experimental segway model. AIP Conference Proceedings, v. 1107, p. 350 – 354, 2009.