ESTRATÉGIAS DE NAVEGAÇÃO COOPERATIVA APLICADAS AO FUTEBOL DE ROBÔS AUTÔNOMOS DA EQUIPE BDP/UFV

(1)

ESTRAT´

EGIAS DE NAVEGA¸

C˜

AO COOPERATIVA APLICADAS AO

FUTEBOL DE ROB ˆ

OS AUT ˆ

ONOMOS DA EQUIPE BDP/UFV

Alexandre Santos Brand˜

ao

∗ alexandre.brandao@ufv.br

Carlos Roberto Castelano Junior

∗ carloscastelano@gmail.com

Rafael Rosado Cruz

∗ rafael.cruz@ufv.br

Andr´

e Sales Sasaki

∗ andre.ssasaki@gmail.com

Talles Barbosa Portilho

∗ tallesportilho@gmail.com

Mauro de Oliveira Prates

∗ mauroprates@ufv.br

∗_{Departamento de Engenharia El´etrica, Universidade Federal de Vi¸cosa, Vi¸cosa, Minas Gerais, Brasil}

ABSTRACT

This paper aims to explain the techniques used by BDP team - Belive, Do n’ Play - of the Federal University of Vi¸cosa to perform the cooperative control of five robots in robot soccer competition during the Small Size League F-180. In order to validate the proposed algo-rithms, a computer simulation platform was developed to accurately represent the real game conditions, consid-ering systematic errors caused by sensors, visual system delay and other factors not considered in the mathemati-cal modeling of the robot navigation. This work involves the analysis of the kinematic model of robots, trajectory planning, position prediction, classification of game sit-uations through decision trees and suitable strategies for each situation.

KEYWORDS: Mobile Robotics, Control Systems, Kine-matic Model, Decision Tree, Simulation Platform.

RESUMO

Este trabalho tem por objetivo explanar as técnicas uti-lizadas pela equipe BDP - Belive, Do n’ Play da Uni-versidade Federal de Vi¸cosa para realizar o controle co-operativo de cinco robôs, na competi¸cão de futebol de robôs da categoria Small Size F-180. Para valida¸cão dos algoritmos propostos, foi desenvolvida uma plataforma de simula¸cão computacional, que pudesse representar condi¸cões reais de jogo, considerando erros sistem´ ati-cos causados pelos sensores, atrasos do sistema de visão e outros fatores não abrangidos durante a modelagem matemática da navega¸cão dos robôs. Este trabalho leva em considera¸cão análise do modelo cinemático dos robôs, técnicas de escolha de trajetória com evasão de colisões, módulo de predi¸cão de posi¸cão, classifica¸cão de situa¸cões de jogo por meio de árvore de decisão e es-tratégias condizentes com cada situa¸cão de jogo.

KEYWORDS: Robótica Móvel, Sistemas de Controle, Modelo Cinemático, Árvore de Decisão, Plataforma de Simula¸cão.

(2)

1 INTRODU ¸

C˜

AO

A BDP - Believe, Do n’ Play - equipe de futebol de robôs da Universidade Federal de Vi¸cosa foi criada em 2005 (na época, denominada BDP - Bonde dos Pato-las) através da iniciativa própria de um grupo de alunos do curso de Engenharia Elétrica. No decorrer dos anos, a equipe BDP/UFV alcan¸cou grandes êxitos tanto em n´ıvel acadêmico quanto em n´ıvel pessoal, pois o que antes era uma diversão tornou-se uma plataforma de desenvolvimento e aplica¸cão de conhecimentos teóricos e práticos.

Inicialmente, a equipe BDP/UFV se dedicava ao pro-jeto de robôs rádio controlado guiados pelos próprios integrantes da equipes através de joysticks. Depois de desbravar tal tecnologia aplicada a este tipo de problema e de obter resultados relevantes e dignos de orgulho em competi¸cões regionais de robótica, a Equipe BDP/UFV decidiu avan¸car mais um passo e se dedicar ao futebol de robôs autônomos, onde não há interven¸cão humana durante o controle das entidades robóticas no campo de jogo.

Neste contexto, com o intuito de participar em com-peti¸cões de futebol de robôs da categoria F-180 Small Size, a equipe BDP/UFV adquiriu um kit de robôs autônomos junto à empresa Xbot e se dedicou ao de-senvolvimento de um sistema computacional capaz de controlá-los através dos módulos (ou fun¸cões) de decisão. A Figura 1 ilustra o sistema desenvolvido, seus compo-nentes principais e as interconexões entre cada compo-nente.

Figura 1: Estrutura de controle para navega¸c˜ao dos robˆos da Equipe BDP/UFV.

2 DESCRI ¸

C˜

AO DO SISTEMA

2.1 Servidor de Entrada e Suas

Alimen-ta¸c˜

oes

O topo do sistema consiste em um servidor de entrada, que em um dado instante da partida, é alimentado pelo sistema de Visão Global SSL-Vision (Small Size League Vision). Este sistema é comum a todos as equipes e disponibiliza os resultados do processamento de imagem das câmeras através da rede ethernet na forma de pa-cotes encapsulados, contendo os parâmetros do jogo, tais como, postura dos jogadores, posi¸cão da bola, dimensões do campo, latência do sistema de visão, dentre outros. Para finalidade de teste, o SSL-Vision pode ser substi-tu´ıdo por um simulador, permitindo que a equipe estude a resposta do sistema quando sujeito a diversas situa¸cões de jogo, sem de fato necessitar realizar a partida. No entanto, para que o simulador possa servir de referência para o estudo da eficiência dos algoritmos desenvolvi-dos, este deve contemplar um grau de incerteza similar ao SSL-Vision, aproximando, portanto, de uma situa¸cão real de jogo.

2.2 M´

odulo de Predi¸c˜

ao

Tendo em vista a latência do sistema de visão respon-sável pela realimenta¸cão sensorial a n´ıvel global, fez-se necessário a implementa¸cão de um Módulo de Predi¸cão intermediário ao Servidor de Entrada e o Módulo de Es-tratégia, com o intuito de reduzir erros de navega¸cão durante a partida.

2.3 M´

odulo de Estrat´

egia

Este módulo é responsável pelas defini¸cão das jogadas, sendo necessário portanto usufruir das informa¸cões de jogo fornecidas pelo servidor. Nesta etapa é realizada uma busca nas informa¸cões por padrões que auxiliem na tomada de decisão. Uma vez com os padrões identi-ficados, cabe ao módulo de estratégia determinar a a¸cão a ser enviada a cada jogador.

Para isto, foi elaborada uma árvore de decisão subjetiva, dado que os parâmetros avaliados são qualitativos. Uma exemplo deste tipo de árvore é representando na Figura 2. Vale mencionar que a arvore inicial não serve para im-plementa¸cão direta, porém auxilia na identifica¸cão dos parâmetros mais importantes para uma análise qualita-tiva.

Após análise, verificou-se que as posi¸cões horizontais e verticais dos robôs e da bola, assim como as veloci-dades horizontais e verticais dos robôs e da bola são os parâmetro mais importantes para elabora¸cão de uma es-tratégia de jogo. Desta forma, a ordem de complexidade

(3)

Figura 2: Exemplo de Árvore de Decisão. do sistema pode ser estimada com a seguinte equa¸cão

C(n) = 4(n + 1)

Onde C(n) é a ordem de complexidade e n é o número de robôs.

A fim de reduzir a ordem de complexidade do sistema, considerou-se que a bola está estática a cada instante de análise, e os parâmetros dos robôs são recalculados considerando a bola como referência. Sendo assim, o número de objetos passa de (n+1) para n. Uma vez que a bola é sempre considerada estática, as informa¸cões de posi¸cão (P x, P y) e velocidade (V x, V y) em rela¸cão aos demais objetos são essenciais para o cálculo do instante de colisão (ou predi¸cão de colisão), dado por

tn = pP x2 n+ P y 2 n pV x2 n+ V yn2 .

Após estas considera¸cões, o número de parâmetros por objeto foram reduzidos de 4 para 1, e portanto a equa¸cão de complexidade do sistema pode ser reescrita como

C(n) = n

Onde C(n) é a ordem de complexidade e n é o número de robôs.

De posse das classes e dos parâmetros, aplicou-se um algoritmo para constru¸cão de árvore de decisão que se

baseia em observa¸cões emp´ıricas de exemplos cuja classe é conhecida. Desta forma, é constru´ıda uma árvore de decisão objetiva, que analisa quantitativamente parˆ ame-tros do jogo e determina as a¸cões dos jogadores. O algoritmo é aplicado previamente e durante a partida, permitindo que a árvore se adeque segundo as condi¸cões de jogo.

2.4 M´

odulo de Desvio

A décima segunda regra de jogo para futebol de robôs autônomos discorre sobre falta e má conduta, a qual resulta em uma falta com chute direto à baliza, se o robô de uma equipe realiza um contato substancial ao robô adversário. Dado que tal penalidade incita perigo de gol iminente, há uma necessidade de navega¸cão com desvio de obstáculos (onde estes são referenciados como os robôs adversários).

Sabendo que os robôs irão navegar em um ambiente semi-estruturado de forma h´ıbrida, ou seja, com movi-mentos realizados de forma deliberativa e reativa simul-taneamente, aplicou-se uma estratégia que determina a distância entre os robôs no campo de jogo e uma distˆ an-cia m´ınima de rea¸cão à colisão. Desse modo, ao ingressar na zona de rea¸cão de outro robô, são geradas for¸cas fic-t´ıcias de repulsão que modificam a rota de colisão entre robôs opentes. Vale comentar que a intensidade de tais for¸cas é inversamente proporcional à distância entre os robôs poss´ıveis de colisão. Em outras palavras, quanto menor a distância entre dois robôs, maior a for¸ca de repulsão entre eles, desde que sejam de equipes adver-sárias.

A estratégia proposta pode ser vista na Figura 3, a qual demonstra a evolu¸cão de uma tarefa de desvio de ob-stáculo. Pode-se notar que quando o robô adentra à zona de rea¸cão, ocorre o surgimento de uma for¸ca de re-pulsão, demonstrada pelo vetor ~A (que aumenta à me-dida que a distância entre os robôs diminuem), com o intuito de manter a orienta¸cão definida pelo vetor ~B, até que o alvo (neste caso, a bolda de jogo) seja alcan¸cado.

2.5 M´

odulo de Sa´ıda

Como última etapa do processo, as a¸cões definidas para cada um dos robôs são encaminhadas para o módulo de sa´ıda, de onde são transmitidas via rádio frequência para todos os robôs em campo. No caso da utiliza¸cão do Simulador, uma integra¸cão numérica determina as novas condi¸cões de jogo, após a execu¸cão de uma determinada a¸cão.

(4)

(a) A B A B (b)

Figura 3: Caminho percorrido ao executar uma tarefa de desvio do oponente.

3 ESTRAT´

EGIAS B´

ASICAS DE JOGO

3.1 Ataque

3.1.1 Pontap

x

Tendo em vista que a configura¸cão uniciclo foi adotada para os robôs da Equipe BDP/UFV, utilizou-se a ger-a¸cão de uma trajetória em forma de cardioide entre a posi¸cão do jogador e a posi¸cão da bola, sendo sua ori-enta¸cão final apontada diretamente à baliza adversária, conforme apresentado na Figura 4.

ψd

P x , y

(

d d

)

r

Q

C’

y x

Qψ

Figura 4: Situa¸c˜ao de Ataque.

Ao mesmo tempo em que o jogador selecionado se move

em dire¸cão à bola, o restante dos jogadores aos quais se tenha associado um caráter ofensivo se posiciona em locais estratégicos para receber um poss´ıvel passe, que pode resultar em outro passe, ou em um chute a gol. No entanto, caso o jogador selecionado tenha uma linha de visão livre para o gol ao chegar no ponto desejado, o sistema de chute é ativado.

3.1.2 L´ıberol

x

O l´ıbero consiste em um jogador que auxilia tanto as estratégias ofensivas quanto defensivas, dependendo da distribui¸cão dos jogadores de ambas as equipes e da es-tratégia estabelecida pela árvore de decisão. Seu posi-cionamento deve facilitar a recep¸cão de passes vindos do ponta, bem como esperar poss´ıveis situa¸cões de rebote em jogadas ofensivas.

Quando o time adversário está com a maior parte de seus robôs no campo de ataque, o l´ıbero se posiciona no intuito de auxiliar a marca¸cão. Para isto, faz-se

l x= 1 n − 2 n X i=1 yi− min x y+ maxx y , (1)

onde n representa o número de jogadores da equipe ad-versária y. Em outras palavras, ele se posiciona no centroide dos robôs adversários, excluindo aqueles robôs com menor e maior valor no eixo das abscissas.

Entretanto, quando o l´ıbero apresenta o mesmo sinal das ordenadas do ponta, sua posi¸c˜ao ´e deslocada para o lado oposto ao do atacante em uma curva cossenoide parametrizadal_x,_{conforme mostrado na Figura 5.}

3.2 Defesa

A forma¸cão de defesa é constitu´ıda por dois zagueiros e pelo goleiro. Essa forma¸cão tem como objetivo mar-car o ataque adversário, impedindo que sejam criadas condi¸cões de disparo ao arco. Para isso, a Equipe BDP/UFV propôs a cria¸cão de uma linha imaginária entre a bola e o centro da baliza. Através desta linha e da posi¸cão das traves, é poss´ıvel posicionar os zagueiros (que estarão sobre a linha que une a bola e uma das traves) e o goleiro (que estará alinhado sobre bissetriz do ângulo formado entre a bola e as traves).

Para uma maior eficiência da estratégia, foram definidas três situa¸cões de jogo: bola no ataque, bola à direta da defesa e bola à esquerda da defesa. Dadas essas situa¸cões de jogo, o arranjo dos jogadores da defesa é modificado, a fim de minimizar ao máximo o ângulo de visão do atacante adversário em rela¸cão à baliza. A Figura 6 ilustra essas situa¸cões.

(5)

(a)

(b)

Figura 5: Comportamento do l´ıbero no campo de jogo.

Figura 6: Situa¸c˜oes de defesa pelos zagueiros.

3.2.1 Goleiro g

x

A estratégia proposta para o goleiro se resume na ex-ecu¸cão de movimentos circulares frente à baliza defen-dida, orientado sempre de forma a bloquear a passagem da bola para dentro do gol. A Figura 7 ilustra tal es-tratégia, destacando o avan¸co do goleiro em rela¸cão à baliza no eixo x, dado por

d= (Amax_{− A}min) b x − b_x max b_x_max − bxmin n + Amin, (2)

onde Amin e Amax determinam o avan¸co m´ınimo (igual

ao diâmetro do robô) e máximo (igual à metade da largura da baliza), e b_x

min e bxmax indicam a distˆ

an-cia m´ınima (meio de campo) e máxima (posi¸cão da bal-iza defendida) em rela¸cão à bola durante o jogo. Em seguida, determina-se o raio da circunferência de movi-menta¸cão, dado por

r=A 2 min 2d + d 2. (3)

Uma vez definido o raio de movimenta¸cão, torna-se pos-s´ıvel a determina¸cão da postura desejada do goleiro no campo de jogo. Para isto, a equa¸cão da reta que une a bola ao centro da baliza defendida é igualada à equa¸cão da circunferência de raio r e centro em xc0 = (r − d, 0)..

Em outras palavras, tem-se (g xd− xc0) 2 + (g yd− yc0) 2 = r2 (4) g yd= b_y d − ay b_{x −} a_x( g xd − a x). (5)

Tendo em vista que o sistema de equa¸cões formado por (4) e (5) produzem duas respostas, por questões da configura¸cão do campo de jogo, assume-se aquela com menor valor em módulo da abscissa.

Por fim, a orienta¸c˜ao do goleiro g_ψ _{´e dada pelo}

coefi-ciente angular da reta expressa em (5).

(6)

3.2.2 Zagueiros Direito d

x e Esquerdoex

Os zagueiros direito e esquerdo têm como principal obje-tivo agir conjuntamente com o goleiro, de modo a fechar qualquer ângulo que possibilite um chute do atacante do time adversário à baliza defendida. A Figura 6 ilustra tal situa¸cão.

A posi¸c˜ao desejada no campo de jogo para o zagueiro direito ´e dada por

d

x= κ(bx − ax) +ax, (6) onde κ ´e um fator que depende da posi¸c˜ao da bola no campo de jogo dada por

κ=1 2 − 1 6 b_y ymax .

Vale dizer que ymaxrepresenta a cota m´axima das

orde-nadas no campo e que a orienta¸c˜ao do jogador ´e dada por

d

ψ= tan−1 b_yy b_xx.

Por sua vez, a posi¸c˜ao deseja do zagueiro esquerdo ´e dada por

d

x= κ(bx − ax) + ax, (7) onde κ ´e um fator que depende da posi¸c˜ao da bola no campo de jogo dada por

κ=1 2 + 1 6 b_y ymax .

Sua orienta¸cão é calculada de forma análoga a do zagueiro direito.

4 CONCLUS ˜

OES

A equipe de futebol de Robôs BDP/UFV, apesar de já existir há alguns anos, é uma equipe que iniciou os trabalhos com robôs autônomos recentemente, só tendo participado, até o presente momento, de uma com-peti¸cão nesta categoria. Apesar do pouco tempo de pesquisa e desenvolvimento nessa área, foi poss´ıvel obter algum sucesso durante a última edi¸cão do LARC (Latin American Robocup), motivando a equipe a investir nesse segmento.

Como etapas futuras pretendem-se agregar uma série de considera¸cões, até então não tratadas para fins de simpli-fica¸cões. Um exemplo disso seria tratar o robô não mais como um ponto no espa¸co, mas sim como um corpo, com um volume definido, e observar o comportamento desse novo sistema ao se aplicar os métodos para desvio de obstáculo, posicionamento em campo, arranjo para re-du¸cão dos ângulos de defesa, movimenta¸cão do goleiro, dentre outros já implementados. Por fim, o sistema de

modifica¸cão de estratégias por meio da árvore de de-cisão descrita na Se¸cão 2.3 será constru´ıdo, auxiliando na determina¸cão dos parâmetros mais significativos para impor a¸cões a um grupo de robôs durante a partida, por meio da identifica¸cão de padrões em campo.

AGRADECIMENTOS

A equipe gostaria de aproveitar para manifes-tar agradecimentos à FUNARBE (Funda¸cão Arthur Bernardes), que é a principal responsável pela realiza¸cão deste trabalho, visto que o patroc´ınio e apoio foram im-prescind´ıveis para os passos iniciais do projeto. Ao N´ u-cleo de Especializa¸cão em Robótico do Departamento de Engenharia Elétrica da Universidade Federal de Vi¸cosa, por prover ambiente e equipamentos adequado de tra-balho. Ao CNPq (Conselho Nacional de Desenvolvi-mento Cient´ıfico e Tecnológico), pelo reconheciDesenvolvi-mento do mérito do projeto, agraciando um dos alunos com bolsa de fomento em pesquisa.