Métodos de mapeamento e exploração

(1)

Universidade de Aveiro Departamento deElectrónica, Telecomunica¸cões e Informática, 2012

Carina Sofia

Pinto Moura

(2)

(3)

Universidade de Aveiro Departamento deElectrónica, Telecomunica¸cões e Informática, 2012

Carina Sofia

Pinto Moura

M´

etodos de Mapeamento e Explora¸

c˜

ao

Disserta¸cão apresentada à Universidade de Aveiro para cumprimento dos requisitos necessários à obten¸cão do grau de Mestre em Engenharia de Eletrónica e Telecomunica¸cões, realizada sob a orienta¸cão cient´ıfica de António Neves e Nuno Lau, Professores do Departamento de Eletrónica, Telecomunica¸cões e Informática da Universidade de Aveiro

(4)

(5)

o j´uri / the jury

presidente / president Prof. Doutor Luis Filipe de Seabra Lopes professor associado da Universidade de Aveiro

vogais / examiners committee Prof. Doutor Armando Jos´e Miranda de Sousa

professor auxiliar da Faculdade de Engenharia da Universidade do Porto

Prof. Doutor Ant´onio Jos´e Ribeiro Neves professor auxiliar da Universidade de Aveiro (orientador)

Prof. Doutor Jos´e Nuno Panelas Nunes Lau professor auxiliar da Universidade de Aveiro (coorientador)

(6)

(7)

agradecimentos Os meus agradecimentos vão em primeiro lugar para os meus pais. Foram eles que proporcionaram as condi¸cões necessárias para que eu pudesse ter o conhecimento que tenho hoje e, por isso, desenvolver este trabalho. Gostaria de agradecer também aos meus orientadores, por toda a ajuda que me deram e paciência que tiveram.

O meu ´ultimo agradecimento vai para os meus amigos que me apoiaram sempre no desenvolvimento deste trabalho.

(8)

(9)

Resumo Este documento trata do estudo e implementa¸cão de algoritmos de mapea-mento e explora¸cão robótica. O mapeamento abordado encontra-se orien-tado para ambientes domésticos. É pretendida a recolha de informa¸cão do mundo para a cria¸cão de um mapa do mesmo.

A explora¸cão pretende complementar o mapeamento no ato de mapear um local por completo. Isto porque o mapeamento, por si só, não dispões de técnicas de planeamento.

Os algoritmos desenvolvidos s˜ao testados na plataforma do Ciber-rato, sendo apresentados os devidos resultados.

(10)

(11)

Abstract This paper deals with the study and implementation of mapping and ex-ploration algorithms. The addressed mapping is oriented to home environ-ments. It is desired to collect information from the world in order to create it’s map.

The exploration aims to complement the mapping in the act of complete coverage mapping. This is because the mapping itself, does not have any planning technic.

The developed algorithms are tested on Ciber-rato’s platform, and the re-sults are presented.

(12)

(13)

(14)

Conte´

udo

Conte´udo 3

Lista de Figuras 7

Lista de Tabelas 11

1 Introdu¸c˜ao 13

1.1 Mapeamento e explora¸c˜ao em rob´otica . . . 15

1.2 Objetivos . . . 16 1.3 Estrutura . . . 17 2 T´ecnicas de Mapeamento 19 2.1 Conceitos . . . 19 2.1.1 Conceito de confian¸ca . . . 19 2.1.2 Regra de Bayes . . . 20

2.1.3 Distribui¸c˜ao Normal de Probabilidade . . . 20

2.2 T´ecnicas . . . 21 2.2.1 Filtro de Bayes . . . 21 2.2.2 Filtro Gaussiano . . . 22 2.2.3 Filtro de Kalman . . . 22 2.2.4 Algoritmo de Lu/Milios . . . 23 2.2.5 Expectation Maximization . . . 24

2.2.6 Incremental Maximum Likelihood Method (Incremental ML) . . . 24

2.2.7 H´ıbridos . . . 24

2.2.8 Occupancy Grid Maps . . . 25

2.2.9 Dogma . . . 25

2.2.10 YAM . . . 25

2.2.11 Mapeamento de um ambiente dinˆamico . . . 26

2.2.12 Mapas Cognitivos . . . 28

2.3 Resumo . . . 29

3 Explora¸c˜ao 31 3.1 T´ecnicas . . . 31

3.1.1 Explora¸c˜ao Baseada na Transformada de Distˆancia (Zelinsky) . . . 32

Transformada de obst´aculos . . . 34

3.1.2 Explora¸c˜ao Baseada em Fronteiras . . . 35

(15)

3.1.4 Explora¸c˜ao por Zig-zag de Linhas Paralelas . . . 38

3.1.5 Decomposi¸c˜ao Trapezoidal . . . 39

3.2 Resumo . . . 40

4 Implementa¸c˜ao 43 4.1 Plataforma de simula¸c˜ao do ciber-rato . . . 43

4.1.1 Caracter´ısticas do Simulador . . . 43

4.1.2 Caracter´ısticas do Agente . . . 45

4.1.3 Caracter´ısticas da ´Area de Jogo . . . 46

4.2 Algoritmo de Mapeamento . . . 46

4.2.1 Marca¸c˜ao do mapa . . . 46

4.2.2 Modelo do corpo do robˆo . . . 47

4.2.3 Modelo da ´area de incidˆencia dos sensores . . . 47

4.2.4 Comportamentos . . . 50

4.2.5 Diagrama de fluxo do processo de mapeamento . . . 51

4.2.6 YAM . . . 52

4.3 Algoritmo de Explora¸c˜ao . . . 54

4.3.1 Algoritmo de explora¸c˜ao baseado em fronteiras . . . 54

4.3.2 Mapa de fronteiras . . . 56

4.3.3 Comportamentos . . . 56

Algoritmo A* . . . 58

Mapa de obst´aculos expandidos . . . 60

4.4 Implementa¸c˜oes complementares . . . 65

4.4.1 Mapeamento a partir de logs . . . 65

4.4.2 Interface gr´afico . . . 65

4.5 Estrutura da implementa¸c˜ao . . . 66

4.5.1 Diagrama de fluxo completo . . . 66

4.5.2 Organiza¸c˜ao de classes . . . 66 class actions . . . 68 class map . . . 69 class exploration . . . 69 class pathFinding . . . 70 class parserXML . . . 70 class MainWindow . . . 70 class cell . . . 70 class myrobot . . . 70 struct points . . . 71 4.6 Resumo . . . 71 5 Resultados 73 5.1 Mapeamento . . . 73

5.1.1 Sele¸c˜ao dos valores usados no algoritmo de YAM . . . 74

5.1.2 Mapas obtidos com o algoritmo de mapeamento . . . 75

5.2 Explora¸c˜ao . . . 87

5.2.1 Sele¸cão dos valores de threshold e de minimum length usados na sele¸cão de fronteiras . . . 87 5.2.2 Mapas obtido com o uso dos algoritmos de mapeamento e explora¸cão 88

(16)

5.3 Resumo . . . 106

6 Conclus˜ao 107

6.0.1 Trabalho futuro . . . 108

(17)

(18)

Lista de Figuras

1.1 Exemplos de robôs móveis e autónomos . . . 15

2.1 Distribui¸c˜ao Normal de Probabilidade (adaptado de [3]). . . 21

2.2 Corpo do agente e os seus sensores de obst´aculos. . . 26

2.3 Dete¸c˜ao de um obst´aculo. . . 26

2.4 Diferentes ´areas de marca¸c˜ao dos sensores segundo o algoritmo YAM. . . 27

2.5 Exemplo de aumento de resolu¸c˜ao de uma parti¸c˜ao [11]. . . 29

3.1 Categorias de explora¸c˜ao. . . 32

3.2 Representa¸c˜ao dos 8-vizinhos de uma c´elula. . . 33

3.3 Transformada de distˆancia. . . 33

3.4 Exemplos de aplica¸cão da TD para obten¸cão de trajetórias. . . 34

3.5 Aplica¸cão da transformada de distância, de trajetória e de obstáculos a um mapa de exemplo [46]. . . 35

3.6 Transformada de distância com adi¸cão da transformada de obstáculos e re-spetiva transformada de trajetória [46]. . . 36

3.7 Aplica¸cão da transformada de distância e de trajetória de cobertura total a um mapa de exemplo [46]. . . 36

3.8 Transformada de distância com adi¸cão da transformada de obstáculos e re-spetiva transformada de trajetória de cobertura total [46]. . . 37

3.9 Explora¸c˜ao de um gabinete [43]. . . 38

3.10 Explora¸c˜ao do mapa em zig-zag. . . 39

3.11 V´arias fases da explora¸c˜ao de um mapa com inlets e ilhas [15]. . . 40

3.12 Processo de decomposi¸c˜ao do mapa em c´elulas trapezoidais [15]. . . 40

3.13 Movimentos de vai-vem para explora¸c˜ao de c´elulas. . . 40

4.1 Sistema de simula¸c˜ao (adaptado de [1]). . . 44

4.2 Plataforma de simula¸c˜ao Ciber-rato. . . 44

4.3 Corpo do robˆo virtual e caracter´ısticas mais importantes (adaptado de [1]). . 45

4.4 Arena. . . 46

4.5 Representa¸c˜ao do mapa. . . 47

4.6 Representa¸c˜ao do corpo do robˆo. . . 48

4.7 Representa¸cão gráfica de situa¸cões de dete¸cão de obstáculos por parte dos sen-sores de obstáculos. . . 49

4.8 Marca¸c˜ao da posi¸c˜ao dos sensores. . . 50

4.9 Diagrama de fluxo do comportamento avoid. . . 51

(19)

4.11 Dete¸c˜ao de obst´aculos. . . 53

4.12 Diferentes ´areas de incidˆencia dos sensores segundo o algoritmo de YAM im-plementado. . . 54

4.13 Esquemas do estado dos mapas numa fase inicial. . . 55

4.14 Exemplos de mapas de fronteiras. . . 56

4.15 Diagramas de fluxo da obten¸c˜ao do mapa de fronteiras. . . 57

4.16 Diagrama de fluxo do comportamento goToDestiny. . . 58

4.17 Mapa exemplo para aplica¸c˜ao do algoritmo A* . . . 59

4.18 Mapa com indica¸c˜ao dos valores dos custos G. . . 60

4.19 Algumas fases de evolu¸c˜ao do algoritmo A* num mapa exemplo. . . 61

4.20 Diagrama de Fluxo do processo de planeamento de trajet´orias A*. . . 62

4.21 Diagrama da obten¸c˜ao do caminho gerado pelo A* a partir da Closedlist cor-respondente ao exemplo da Figura 4.19. . . 63

4.22 Exemplo de um caso onde o A* é necessário para alcan¸car a rota em seguran¸ca. 63 4.23 Exemplo de um mapa alterado para a implementa¸cão do A*. . . 64

4.24 Interface gr´afico com os mapas gerados em tempo real. . . 66

4.25 Diagrama de fluxo de todos os processos implementados. . . 67

4.26 Classes desenvolvidas. . . 68

5.1 Mapas obtidos pelo algoritmo de mapeamento implementado. . . 73

5.2 Mapas obtidos do labirinto do Ciber 2003, Manga 1. . . 75

5.5 Mapas de algumas das fases de obten¸c˜ao do labirinto Ciber 2003, Manga 1. . 78

5.8 Mapas de algumas das fases de obten¸c˜ao do labirinto Ciber 2003, Manga 3 -novo ensaio. . . 81

5.11 Mapas de algumas das fases de obten¸c˜ao do labirinto Ciber 2005, Final. . . . 84

5.12 Mapas de algumas das fases de obten¸c˜ao do labirinto Ciber 2005, Final - novo ensaio. . . 85

5.13 Mapas de algumas das fases de obten¸c˜ao do labirinto Ciber RTSS 2007, Stage 1. 86 5.14 Mapas obtidos pelos algoritmos implementados, de mapeamento e explora¸c˜ao, do labirinto Ciber 2003, Manga 1. . . 87

5.15 Mapas de algumas das fases de obten¸c˜ao do labirinto Ciber 2003, Manga 1, com minimum length = 10 e threshold = 5. . . 89

(20)

5.20 Mapas de algumas das fases de obten¸c˜ao do labirinto Ciber 2003, Manga 1, com minimum length = 8 e threshold = 10. . . 95 5.21 Mapas de algumas das fases de obten¸c˜ao do labirinto Ciber 2003, Manga 1,

com minimum length = 8 e threshold = 20. . . 96 5.22 Mapas de algumas das fases de obten¸c˜ao do labirinto Ciber 2003, Manga 1,

com minimum length = 5 e threshold = 30. . . 101 5.27 Mapas de algumas das fases de obten¸cão do labirinto Ciber 2003, Manga 2. . 102 5.28 Mapas de algumas das fases de obten¸cão do labirinto Ciber 2003, Manga 3. . 103 5.29 Mapas de algumas das fases de obten¸cão do labirinto Ciber 2005, Final. . . . 104 5.30 Mapas de algumas das fases de obten¸cão do labirinto Ciber RTSS 2007, Stage 1.105

(21)

(22)

Lista de Tabelas

(23)

(24)

Cap´ıtulo 1

Introdu¸

c˜

ao

Nos dias de hoje, encontramo-nos rodeados de tecnologia e até dependentes da mesma, na generalidade dos casos. Quantas pessoas se conhece que não tenham um telemóvel? Uma televisão? Uma máquina de lavar roupa? Estes itens tornaram-se parte do nosso dia a dia ao ponto de já não sabermos viver sem eles. Trazem-nos seguran¸ca, comodismo, lazer. . . Fazem parte da nossa sociedade e estão em constante evolu¸cão.

As pessoas tornam-se cada vez mais exigentes com a tecnologia e a qualidade da mesma. A loi¸ca e a roupa são lavadas em máquinas, o chão é aspirado, as not´ıcias passaram a ser vistas na televisão, as cartas foram substitu´ıdas por e-mails. . . Parece que quanto melhor é a tecnologia, melhor ainda se poderá tornar.

Uma vertente de grande interesse na tecnologia é a robótica, uma área transversal que engloba computadores, eletrónica e computa¸cão [8]. O termo “robô” surgiu pela primeira vez na pe¸ca de teatro Rossum’s Universal Robots, escrita por Karel Capek em 1921 [4]. O escritor usou o termo robota, que significa na sua l´ıngua: “trabalho exercido de forma compulsória”. O termo robótica veio a ser popularizado mais tarde, em 1950, pelo filme de fiçcão cient´ıfica ”I, Robot ”(“Eu, Robô”). É interessante perceber o receio que existia nesta altura quanto à cria¸cão de robôs. Temia-se que os robôs se sobrepusessem à ra¸ca humana. Apesar de tudo, sabia-se que seriam seres inteligentes e capazes de realizar qualquer tarefa, muitas das vezes melhor do que nós. Por isso mesmo eram também temidos. Temia-se o que podia vir a ser descoberto, apesar da enorme curiosidade.

A verdade é que parece que esse medo desvaneceu e foi substitu´ıdo pelo prazer de aproveitar o que a robótica pode trazer de benéfico para a sociedade. Uma simples tarefa de limpar o chão da casa é hoje em dia, facilmente, substitu´ıda por um robô aspirador autónomo (que funciona por si só). Os automóveis já ligam os faróis assim que escurece e estacionam em seguran¸ca sem necessidade de interven¸cão do condutor. As tarefas do dia-a-dia estão a ser substitu´ıdas por robôs.

Desde aplica¸cões domésticas à sua utiliza¸cão para fins militares, a robótica tem vindo a sofrer uma grande evolu¸cão com uma vasta área de implementa¸cão. Um robô serve essencial-mente para facilitar o nosso dia-a-dia, realizando tarefas pelos humanos ou até algumas que seriam imposs´ıveis de realizar por estes.

Existem vários tipos de robôs. Alguns deles assemelham-se a animais ou até mesmo a humanos (Figura 1.1 - a, b, c), enquanto que outros ficam muito longe desse propósito (Figura 1.1 - d, e, f, g). Apesar do desafio de fazer uma réplica de um ser vivo, e do que se pode aprender pelo seu desenvolvimento, numa grande parte das implementa¸cões é prefer´ıvel que o

(25)

modelo se distancie dos animais [9]. Embora já existam vários robôs com pernas, por exemplo, estes necessitam de um controlo complexo apenas para a tarefa de movimenta¸cão, que requer muito equil´ıbrio. Isto leva a que tarefas de maior interesse sejam ainda mais complexas (como por exemplo o transporte de objetos). O robô Asimo da Honda é um bom exemplo de sucesso, para os robôs com pernas. Este consegue andar, subir e descer escadas, transportar objetos e até correr. Em contrapartida, tem gastos energéticos elevados e custos fora do alcance do consumidor comum. Serve como um marco de evolu¸cão e investiga¸cão, sendo um grande avan¸co tecnológico. Por outro lado, utilizar rodas em robôs, em vez de pernas, torna-os mais estáveis e até mais rápidos. Os seus custos são também muito mais reduzidos. Estas vantagens levam a que a maioria dos robôs desenvolvidos para comercializa¸cão tenham esta caracter´ıstica.

Os agentes robóticos mais interessantes são aqueles que executam tarefas sem que haja a necessidade de interven¸cão humana. São designados por robôs autónomos. Estes robôs têm a capacidade de agir e tomar decisões sem que se necessite de um controlo remoto. Agem de acordo com as leituras dos seus sensores, com base em informa¸cão guardada em memória ou até pela sua aprendizagem.

Um robô autónomo pode ter comportamentos tão simples como andar em frente e desviar-se de obstáculos detetáveis pelos seus sensores. A estes agentes dá-se o nome de reativos, uma vez que, não tendo qualquer no¸cão do mundo em que estão inserido, reage apenas a est´ımulos com a¸cões predefinidas. Outros robôs têm comportamentos mais complexos, com algum tipo de planeamento e previsão das consequências das suas a¸cões. Estes agentes usam o seu conhecimento do mundo (dado à partida ou aprendido pelo mesmo) para decidir, a partir de um conjunto de algoritmos, que decisões pretendem tomar. Os dois são interessantes, pois enquanto o primeiro tem baixo consumos computacionais, o segundo oferece solu¸cões otimizadas.

(26)

(a) Nao da Aldebaran

Robotics [37]. (b) Aibo da Sony [29]. (c) Asimo da Honda [23].

(d) Big Dog da Boston Dy-namics para fins militares [18].

(e) Marsrover da NASA para uso em Marte [35].

(f) Robˆo da equipa CAM-BADA de futebol rob´otico da Universidade de Aveiro [14].

(g) Aspirador autom´atico Roomba da iRobot [25].

Figura 1.1: Exemplos de robôs móveis e autónomos

1.1 Mapeamento e explora¸

c˜

ao em rob´

otica

Uma caracter´ıstica muito importante nos humanos é nossa no¸cão do espa¸co, que nos permite deslocar em seguran¸ca e com objetivos, sendo capazes de alcan¸car locais espec´ıficos de forma eficiente. A nossa memória permite-nos criar um mapa mental daquilo que nos rodeia, facilitando a nossa navega¸cão.

Em robótica, agentes meramente reativos são capazes de navegar no mundo desviando-se de obstáculos de forma relativamente segura. Mas quando se pretende uma busca e salvamento

(27)

ou uma cobertura de toda a área, torna-se dif´ıcil assegurar o sucesso da tarefa sem uma no¸cão do espa¸co que o rodeia. Por isso é importante dotar um agente da capacidade de mapeamento, já que nem sempre se tem acesso ao mapa à partida. Obtém-se assim um agente mais eficaz e mais autónomo, capaz de tomar decisões mais razoáveis quanto ao seu trajeto, tanto para evitar obstáculos como para cumprir objetivos.

O processo de mapeamento passa pela recolha de informa¸cão do espa¸co e marca¸cão dessa informa¸cão de uma forma percet´ıvel para humanos, ou para o agente. A recolha e o proces-samento são feitos pelo robô, sem que lhe seja indicado à partida qualquer informa¸cão sobre a zona a mapear. Torna-se um desafio, pois o agente navega “às cegas” pela área pretendida, tendo de se precaver de obstáculos ao mesmo tempo que recolhe dados. A exatidão do mapa é outro ponto de desafio, uma vez que as leituras obtidas pelo robô têm ru´ıdo. Devem ser, portanto, desenvolvidos métodos adequados a cada aplica¸cão, de acordo com as especifica¸cões de cada caso.

Ao mapear uma área desconhecida pode-se usar um agente cujo comportamento é sim-plesmente evitar obstáculos. Garante-se com isto uma navega¸cão minimamente segura, mas não é garantido que o robô seja capaz de obter toda a informa¸cão necessária para a constru¸cão do mapa. Sendo o agente meramente reativo, não possui a capacidade de decidir explorar zonas ainda não explorados. Por isso mesmo, deve haver um algoritmo de explora¸cão aliado a um bom algoritmo de mapeamento. Este leva o robô a realizar uma navega¸cão mais eficiente, conduzindo-o a zonas por explorar.

A explora¸cão em robótica permite ao robô navegar de uma forma estratégica. Essa navega¸cão pode ter como objetivo a pesquisa de objetos ou locais ou a cobertura de toda da área. O algoritmo de explora¸cão garante que o robô se desloca com o intuito de desco-brir novos espa¸cos que ainda não foram visitados. A explora¸cão é muito usada quando se pretende fazer mapeamento, uma vez que garante (se bem implementado) a obten¸cão de um mapa completo da área pretendida.

O processo de mapeamento pode, por vezes, estar aliado a um processo de localiza¸cão, caso não haja conhecimento da posi¸cão do robô. Quando é realizado o mapeamento em simultâneo com a localiza¸cão, dá-se o nome de SLAM ao processo (Simultaneous Localization and Mapping ). Como se pode calcular, nestes casos o mapeamento torna-se um desafio maior, já que não há certezas da localiza¸cão do robô e, consequentemente, dos obstáculos.

1.2 Objetivos

Este trabalho tem como finalidade o estudo de vários tipos de algoritmo de mapeamento e explora¸cão. Serão abordados vários algoritmos, com diferentes tipos de aplica¸cão. A escolha de um algoritmo apropriado vai depender das caracter´ısticas do agente em que se pretende implementar o mesmo e das exigências de performance que se esperam.

Para além do referido estudo, serão também implementados algoritmos de mapeamento e explora¸cão. Através da implementa¸cão destes algoritmos será poss´ıvel analisar os resultados e tirar conclusões, assim como entender os maiores desafios que há em dotar um robô com estes algoritmos. O algoritmo de mapeamento implementado é uma adapta¸cão do algoritmo do YAM [36] (Seçcão 2.2.10) e o algoritmo de explora¸cão é uma adapta¸cão do algoritmo baseado em explora¸cão de fronteiras [38] (Seçcão 2.2.10). Será usada a plataforma de sim-ula¸cão do concurso Ciber-Rato [1] (Seçcão 4.1) para testar os algoritmos. Pretende-se mapear os labirintos do concurso, da forma mais eficiente poss´ıvel, sendo efetuados testes com

(28)

difer-entes parˆametros nos algoritmos, tentando encontrar os mais apropriados `as necessidades do trabalho.

Para a implementa¸cão dos algoritmos, será desenvolvido um agente robótico que, numa primeira fase, irá agir como um agente reativo, para efeitos de mapeamento, e que irá evoluir para um agente capaz de planear trajetórias, através do algoritmo de explora¸cão.

1.3 Estrutura

Esta disserta¸cão encontra-se dividida em seis cap´ıtulos. Os Cap´ıtulos 2 e 3 descrevem alguns algoritmo de mapeamento e explora¸cão, respetivamente. O Cap´ıtulo 4 descreve a implementa¸cão do algoritmo YAM e do algoritmo baseado em explora¸cão de fronteiras, sendo os resultados apresentados no Cap´ıtulo 5. O Cap´ıtulo final apresenta as conclusões do trabalho e também refere algum trabalho futuro que possa ser desenvolvido no âmbito deste assunto.

(29)

(30)

Cap´ıtulo 2

T´

ecnicas de Mapeamento

O processo de mapeamento em robótica come¸ca pela recolha de informa¸cão do espa¸co em que o agente se encontra e do estado do próprio agente. Esta recolha é feita por sensores que devolvam, por exemplo, a posi¸cão do robô e a posi¸cão de obstáculos em rela¸cão ao mesmo. Com esta informa¸cão é poss´ıvel criar um mapa com as caracter´ısticas de interesse.

A representa¸cão dos mapas gerados varia conforme o tipo de aplica¸cão que se pretende. Utilizando por exemplo uma grelha de células, com o aux´ılio de coordenadas cartesianas, obtém-se um mapa com uma resolu¸cão ajustável ao tamanho das células. E uma forma´ simples, que permite a visualiza¸cão e perce¸cão do mapa de uma forma direta. O uso de mapas topológicos, como aqueles usados nos metros, permitem representar tro¸cos cont´ınuos, curvas, cruzamentos e marcos que permitem uma perce¸cão simplificada do mundo, reduzida `

as suas caracter´ısticas de interesse. Existem também algoritmos que registam a forma de objetos e marcam as suas posi¸cões no espa¸co, fazendo uma modela¸cão dos objetos.

Para se gerar um bom mapa é necessário saber a localiza¸cão do robô e a localiza¸cão dos obstáculos que o rodeiam. A localiza¸cão do agente pode ser obtida a partir de sensores (como GPS), ou pode ser necessário localizar o agente no mapa gerado em simultâneo (SLAM). Tendo a localiza¸cão do robô, os obstáculos são marcados a partir da sua posi¸cão com o uso da informa¸cão de sensores como laser-range-finders, sensores de distância ou sensores de colisão, entre outros.

Esta área da robótica tem vindo a ser muito explorada. Desde uso militar ao uso doméstico, a sua aplica¸cão é muito vasta e tem despertado o interesse de muitos investigadores. Seguem-se alguns exemplos que têm vindo a ser estudados.

2.1 Conceitos

Esta seçcão serve de suporte para alguns dos conceitos que serão abordados no decorrer deste cap´ıtulo. O objetivo é facilitar a leitura e compreen¸cão dos assuntos a abordar.

2.1.1 Conceito de confian¸ca

A confian¸ca [41] é uma medida de probabilidade muito útil em robótica. Esta ajuda a representar o conhecimento interno do robô sobre o estado do mundo.

Em termos probabil´ısticos, a confian¸ca de um dado xt´e denotada por bel(xt) que

(31)

São usadas duas nota¸cões para a confian¸ca: bel(xt) (Equa¸cão (2.1)) e bel(xt) (Equa¸cão

(2.2)) [41].

bel(xt) = p(xt|z1:t, u1:t) (2.1)

bel(xt) = p(xt|z1:t−1, u1:t) (2.2)

bel(xt) representa uma distribui¸c˜ao de probabilidade sob xt, tendo em considera¸c˜ao todas

as a¸cões de controlo u1:t e todas as medidas z1:taté ao momento t. Já bel(xt) faz uma previsão

sobre o estado xt, com a informa¸c˜ao de controlo u1:t at´e ao momento t, mas com as medidas

z1:t−1 apenas at´e ao instante anterior t − 1.

2.1.2 Regra de Bayes

A regra de Bayes permite relacionar p(x|y) com p(y|x) [42, 41]. Se se pretende inferir uma quantidade x a partir de y, então p(x) será denominada de probabilidade à priori e p(x|y) de probabilidade à posteriori. No contexto do mapeamento em robótica, x será o mapa a obter e y qualquer tipo de informa¸cão que o permita realizar, como por exemplo medidas de sensores ou a¸cões executadas (distância percorrida, etc). Esta regra, tal como a Equa¸cão (2.3) indica, permite obter o mapa x a partir da informa¸cão y - p(x|y) - através da probabilidade inversa p(y|x) que traduz a probabilidade de observar a informa¸cão y sob a hipótese de mapa x. Como o fator 1/p(y) da referida equa¸cão é independente de x, este será denominado de η. A Equa¸cão (2.3) passa a tomar a forma da Equa¸cão (2.4).

p(x|d) = p(d|x)p(x)

p(d) (2.3)

p(x|d) = ηp(d|x)p(x) (2.4)

2.1.3 Distribui¸c˜ao Normal de Probabilidade

Os casos que serão abordados nas seçcões seguintes lidam com espa¸cos cont´ınuos. Estes espa¸cos são caracterizados por variáveis aleatórias de valores de uma gama cont´ınua. Assume-se para algumas das situa¸cões que estas variáveis têm uma distribui¸cão normal de probabili-dade (Gaussiana).

A distribui¸cão Gaussiana é uma distribui¸cão probabil´ıstica com uma fun¸cão de densidade de probabilidade na forma de um sino [3, 7] (ver Figura 2.1). Esta pode ser completamente definida pelas seus parâmetros µ (média) e σ (desvio padrão). A partir destes valores é poss´ıvel saber qualquer probabilidade da distribui¸cão através da Equa¸cão (2.5), em que σ2 é a variância. A média, ou valor esperado, corresponde ao ponto de maior concentra¸cão dos dados da distribui¸cão [6]. A variância [10] diz respeito à dispersão estat´ıstica, ou seja, serve para medir quão longe se encontram os pontos da distribui¸cão em rela¸cão ao valor médio. O desvio padrão [2], que é a raiz quadrada da variância, traduz a mesma dispersão mas numa escala equivalente à dos valores da dispersão.

p(x) = √ 1 2πσ2e

−(x−µ)2

(32)

Figura 2.1: Distribui¸c˜ao Normal de Probabilidade (adaptado de [3]).

2.2 T´

ecnicas

Nesta seçcão são analisados alguns algoritmos de mapeamento. Estes podem variar na forma como representam o mundo. Alguns com grelhas de células de tamanhos e formas iguais, ou células com formas adaptadas ao meio, outros com a utiliza¸cão de mapas topológicos, semelhantes aos dos metros, onde as diferentes zonas são marcadas com pontos e a rela¸cão entre zonas (os caminhos) são marcados com arcos. Existem também algoritmos que criam modelos de objetos.

Mais diferen¸cas são encontradas na necessidades de certos algoritmos englobarem a esti-mativa da localiza¸cão do robô juntamente com o processo de mapeamento (SLAM).

Enquanto que alguns dos algoritmo se baseiam em probabilidades à posteriori para a marca¸cão da probabilidade de ocupa¸cão das células nos mapas, outros baseiam-se no conceito de “máxima verosimilhan¸ca”, ou até numa conjuga¸cão das duas abordagens. Os algoritmo abordados são essencialmente para implementa¸cão em ambientes estáticos, podendo alguns ser usados em ambientes dinâmicos.

2.2.1 Filtro de Bayes

O filtro de Bayes [42, 41, 26] é uma extensão da regra de Bayes para estima¸cão temporal que calcula a confian¸ca, que nada mais é do que uma probabilidade à posteriori. Faz isso a partir das medidas recolhidas pelos sensores (z) e da informa¸cão de controlo(u).

Uma seçcão do algoritmo do filtro de Bayes é dada pelo algoritmo (1), denominando-se por update rule. Este trecho de algoritmo é aplicado recursivamente para o cálculo de bel(mt)

que é obtido a partir de bel(mt−1). Na linha 3 do Algoritmo 1 é feita a previsão (Equa¸cão

(2.2)) onde ´e calculada a confian¸ca de xtcom base em xt−1e na informa¸c˜ao de controlo. Esta

bel é calculada pelo somatório do produto da probabilidade à priori de xt−1 (bel(xt−1) com

a probabilidade do controlo ut influenciar a transi¸c˜ao de xt−1 para xt (p(xt| ut, xt−1)). Na

linha 4 é feita a atualiza¸cão da medida (Equa¸cão (2.1)), sendo multiplicada a confian¸ca bel, calculada anteriormente, com a probabilidade da medida ztter sido observada com a condi¸cão

(33)

do mapa xt. η ser´a a constante de normaliza¸c˜ao.

(1) Algoritmo BayesFilter ( bel(xt−1) , ut, zt):

(2) for for all xt do

(3) bel(xt) = R p(xt| ut, xt−1)bel(xt−1) dx

(4) bel(xt) = η p(zt| xt)bel(xt)

end

(5) return bel(xt)

Algorithm 1: Trecho de algoritmo do filtro de Bayes.

2.2.2 Filtro Gaussiano

Os filtros Gaussianos [41] foram os primeiros a implementar o filtro de Bayes em espa¸co cont´ınuo. Nestes, a confian¸ca é representada por distribui¸cões normais de multi-variáveis, caracterizadas pela média µ e covariância Σ, cuja defini¸cão matemática é dada por (2.6). Sendo uma distribui¸cão Gaussiana unimodal, ou seja, possui apenas um máximo, esta pode não ser adequada a certas situa¸cões em robótica, uma vez que podem coexistir várias hipóteses plaus´ıveis ao invés de uma solu¸cão isolada.

p(x) = det 1 √ 2πΣ e−(x−µ)T (x−µ)2Σ (2.6)

Este tipo de filtro permite uma atualiza¸cão constante de, por exemplo, a posi¸cão do robô de acordo com os dados obtidos no momento. Esta atualiza¸cão é feita com base na distribui¸cão de probabilidade descrita.

2.2.3 Filtro de Kalman

O filtro de Kalman (FK) [42, 27, 32] foi inventado por Rudolph Emil Kalman em 1950, sendo este um filtro de Bayes que representa probabilidades `a posteriori com Gaussianas. Este permite filtrar e prever sistemas lineares em estados cont´ınuos, n˜ao funcionando para sistemas discretos.

Para um estado ser linear, a posi¸cão do robô e o mapa no instante t têm de depender linearmente da posi¸cão e do mapa anteriores (t − 1) e também do controlo em t. Tendo um mapa estático a linearidade assegura-se para o mapa. O mesmo já não acontece para a posi¸cão do robô, uma vez que esta depende não linearmente da posi¸cão anterior (s(t−1)) e do

controlo ut. Por isso se usa muitas vezes uma versão alterada deste filtro, à qual se dá o nome

de Filtro de Kalman Estendido (FKE) [32]. O FKE aproxima o modelo de movimenta¸cão do robô por uma fun¸cão linear, obtida por uma expansão de série de Taylor de primeira ordem. Desta forma resolve-se o problema da não linearidade da posi¸cão do robô.

Para garantir que as probabilidades `a posteriori s˜ao Gaussianas [41], tem de se verificar o seguinte:

1. Dado que se conhece a informa¸cão no presente, a informa¸cão futura deve ser indepen-dente da informa¸cão passada. Esta é a chamada “Markov Assumption” ou “Complete State Assumption”.

2. O próximo estado de probabilidade tem de ser linear e com adi¸cão de ru´ıdo Gaussiano, tal como se expressa na Equa¸cão (2.7), em que At e Bt são matrizes, que ao

(34)

multi-plicarem por xt e ut, respetivamente, garantem a linearidade no filtro. εt ´e um vetor

Gaussiano aleatório, com média zero e covariância Rt, que modela o ru´ıdo.

xt= Atxt−1+ Btut+ εt (2.7)

3. Também a probabilidade da medida tem de ser linear e com adi¸cão de ru´ıdo Gaussiano. A Equa¸cão (2.8) expressa isso mesmo: Cté uma matriz e δté, à semelhan¸ca de εt, uma

distribui¸cão normal com média zero e covariância Qt.

zt= Ctxt+ δt (2.8)

4. Por fim, a primeira confian¸ca bel(0) tem de ser normalmente distribu´ıda. Tendo portanto uma forma familiar como se apresenta na Equa¸c˜ao (2.9).

bel(x0) = p(x0) = det 1 √ 2πΣ0 e−(x0−µ0) T (x0−µ0) 2Σ0 _(2.9)

Este método sofre de algumas limita¸cões. O filtro de Kalman não é capaz de resolver o problema de correspondência, que consiste em associar medidas individuais dos sensores a car-acter´ısticas do mapa. Isto acontece pois, no caso de existirem duas carcar-acter´ısticas idênticas, estas gerariam uma distribui¸cão multimodal quanto à posi¸cão do robô, que estaria em dis-crepância com a suposi¸cão do KF - com adi¸cão de ru´ıdo Gaussiano unimodal.

Por esta razão, o filtro de Kalman tem um melhor desempenho se se recorrer ao uso de landmarks (etiquetas) - um conjunto de marcos no mapa que são facilmente distingu´ıveis pelas suas caracter´ısticas e também pelas suas localiza¸cões. O seu uso tem, no entanto, o inconveniente de tornar o mapa pobre em pormenores geométricos e limita também o filtro a ambientes estáticos, sendo que é dif´ıcil adaptar um ambiente dinâmico a um sistema de landmarks.

Trata-se de um método incremental e executado em tempo real da aquisi¸cão da informa¸cão, que não necessita de informa¸cão externa quanto à posi¸cão do robô, uma vez que pode executar esta mesma fun¸cão em simultâneo com o mapeamento (SLAM). Permite o mapeamento de pequenas áreas e de ambientes c´ıclicos já que a informa¸cão registada aceita atualiza¸cões.

2.2.4 Algoritmo de Lu/Milios

Esta técnica [42, 30] de mapeamento (e localiza¸cão - SLAM) destina-se especificamente à aplica¸cão em agentes que possuam “laser range finders”. Trata-se de um algoritmo iterativo que se divide em duas fases de estima¸cão: primeiro usa o filtro de Kalman para o cálculo da probabilidade à posteriori sob os mapas e, de seguida, as medidas do laser, que foram repetidas várias vezes, são associadas. Esta associa¸cão é feita pelo emparelhamento de medidas que se considerem próximas, ou seja, pela associa¸cão da “máxima verosimilhan¸ca”.

O facto de ser estimada esta associa¸cão meramente pela sua semelhan¸ca, torna o al-goritmo limitado. Por outro lado, desta forma, o alal-goritmo torna-se capaz de lidar com correspondências erradas, pois, iterando as duas fases, acaba por conseguir corrigir erros. As suas limita¸cões prendem-se com o facto de não ser poss´ıvel mapear ambientes dinâmicos ou c´ıclicos e de não suportar erros na localiza¸cão inicial.

(35)

Devido à necessidade de obten¸cão de vários varrimentos da mesma área para determinar as correspondências mais semelhantes, este algoritmo não pode ser processado em tempo real, ou seja, as medidas são retiradas e só posteriormente serão todas processadas pelo Lu/Milios. Dado que recolhe a informa¸cão do ambiente a partir de “laser range finders” e usa estes dados “puros”, sem ter de recorrer a landmarks, os mapas gerados por este algoritmo podem ser bastante detalhados.

2.2.5 Expectation Maximization

Baseado no filtro de Kalman e no conceito anterior da “máxima verosimilhan¸ca”, surge o algoritmo estat´ıstico “Expectation Maximization” (EM) [42, 33]. Trata-se de um método não incremental de SLAM que necessita de percorrer a informa¸cão várias vezes, iterativa-mente, gerando vários mapas, em busca do mais provável - “hill climbing”. E, por isso,´ obrigatoriamente um algoritmo que opera offline.

Este método de mapeamento divide-se me duas fases: a fase de estima¸cão (E-step), onde é feito o cálculo da probabilidade à posteriori sob a posi¸cão do robô, seguido da fase de maximiza¸cão (M-step), que calcula o mapa mais provável dada a posi¸cão obtida. Em termos matemáticos, a equa¸cão deste método é a apresentada em (2.10), sendo zt a informa¸cão dos

sensores, st o caminho e x(i+1) o mapa no momento i + 1. Esta equa¸c˜ao deriva do filtro de

Bayes, com alguns pressupostos.

x(i+1) = argmax x

Est[log p(zt, st| x) | xi, zt] (2.10)

Como se pode imaginar, este é um método lento, mas com bom desempenho. É capaz de suportar mapas de grandes dimensões e até c´ıclicos. Uma caracter´ısticas importante é o facto de resolver o problema da correspondência de forma muito eficiente.

2.2.6 Incremental Maximum Likelihood Method (Incremental ML)

O incremental ML [42, 20, 34, 44, 45] deve a sua fama à sua simplicidade. Este método cria um só mapa de forma incremental, em tempo real, sem lhe conferir qualquer tipo de incerteza, sendo a informa¸cão uma vez registada jamais inalterável. Tanto o mapa como a posi¸cão são calculados (SLAM) de forma semelhante ao M-step do EM, a partir da máxima verosimilhan¸ca.

Trata-se de um algoritmo r´apido, mas limitado a ambientes est´aticos e sem ciclos.

2.2.7 H´ıbridos

Tal como o algoritmo Incremental ML, os algoritmos h´ıbridos [42, 21, 39, 40] calculam os seus mapas com base na máxima verosimilhan¸ca. Contudo, com a melhoria de não gerar informa¸cão estática, conferindo ao mapa uma no¸cão de incerteza. Esta incerteza é obtida pela aplica¸cão de uma versão do filtro de Bayes às posi¸cões do robô, gerando uma distribui¸cão de probabilidades à posteriori sob as ditas posi¸cões.

Também como o anterior, os h´ıbridos mantêm apenas um mapa, mas agora com a possi-bilidade de corre¸cão de informa¸cão. Em contrapartida, a decisão de alterar a informa¸cão pode resultar num desastre, uma vez poder surgir a necessidade de tomar decisões em situa¸cões demasiado complexas, como em ambientes com vários ciclos. Por esta razão, embora funcione

(36)

com mapas c´ıclicos, este algoritmo não será o mais indicado, não funcionando também com ambientes dinâmicos.

2.2.8 Occupancy Grid Maps

Tal como o nome indica, os mapas gerados por este algoritmo [42, 19, 20, 34] são rep-resentados por uma grelha. Esta grelha é composta por células que representam posi¸cões no espa¸co, com o uso de coordenadas cartesianas. A cada célula é atribu´ıdo o seu respetivo estado de ocupa¸cão: livre ou ocupado. Este estado é obtido com o uso do filtro de Bayes binário, que calcula a probabilidade à posteriori sobre a ocupa¸cão de cada célula. Gera-se assim um mapa probabil´ısticos.

Ao contrario dos anteriores, este algoritmo não é capaz de detetar a localiza¸cão do robô, sendo necessário que esta lhe seja fornecida à partida.

Trata-se de um algoritmo recursivo, que permite a atualiza¸cão incremental de cada célula individualmente. Tem uma boa convergência mas é limitado em ambientes dinâmicos.

2.2.9 Dogma

Muito resumidamente, este algoritmo [42] funciona por aprendizagem de modelos de ob-jetos, baseando-se no algoritmo anterior para a obten¸cão do mapa. Tal como o anterior, necessita que a localiza¸cão do robô seja fornecida.

Este algoritmo admite ambientes dinâmicos, mas sofre com o problema de correspondência, como seria de esperar. Esta limita¸cão pode ser atenuada usando o mutual exclusivity constrait, que determina que um objeto só pode ser visto uma vez no mesmo mapa, durante a otimiza¸cão.

2.2.10 YAM

O trabalho YAM (Yet Another Robot ) [36] foi desenvolvido em 1996 por Pedro Ribeiro, finalista da Licenciatura em Ciências de Computadores da F.C.U.P. (Faculdade de Ciências da Universidade do Porto). Este consistiu no desenvolvimento de um agente virtual para a participa¸cão no concurso Ciber-Rato (descrito em maior detalhe na Seçcão 4.1). Trata-se de um concurso de busca e salvamento, em que o robô é colocado num labirinto, sem qualquer conhecimento prévio deste, tendo de encontrar a meta e voltar ao ponto de partida. Uma parte muito importante do trabalho YAM é a implementa¸cão de um algoritmo de mapeamento, que permite explorar mais facilmente o espa¸co e também facilita ao robô voltar à partida com mais facilidade.

O agente fornecido pela plataforma do concurso tem três sensores de distância (à direita, `

a esquerda e em frente como se apresenta na Figura 2.2) que devolvem valores inversamente proporcionais à distância do objeto mais próximo. Ou seja, se o obstáculo mais próximo se encontrar a uma distância de d do sensor, então este emitirá um valor de s = 1/d. O agente tem ainda outros sensores, mas estes são os que realmente interessam para a aplica¸cão. Os sensores de obstáculos têm um raio de abrangência de 60◦, tendo uma zona de incidência semelhante à apresentada pelas zonas a azul na Figura 2.2.

A marca¸cão de obstáculos a partir deste tipo de sensores não é muito exata, devido ao ru´ıdo associado e à incerteza na localiza¸cão dos obstáculos detetados. Como tal, no trabalho YAM foi desenvolvido um algoritmo de mapeamento que consiste em aumentar ou diminuir a probabilidade de ocupa¸cão dos pontos pertencentes à zona de incidência dos sensores. A ideia é então dividir esta zona de incidência por partes, definindo as que se pensam estar

(37)

livres ou ocupadas. Tomando como exemplo a imagem da Figura 2.3 onde o sensor deteta um obstáculo na parte vermelha, é fácil perceber que todos os pontos até ao limite dessa linha vermelha deveriam estar livres e os que se encontram marcados pela mesma deveriam estar ocupados. Como não há certeza absoluta quanto à leitura do sensor, o algoritmo usa três zonas de marca¸cão, como indicado na Figura 2.4. Segundo este modelo, se o sensor detetar um obstáculo à distância 1/s (linha vermelha da Figura 2.4) e tendo em conta que a leitura tem ru´ıdo Gaussiano, então, há uma probabilidade baixa do obstáculo estar para lá da distância de 1/(s + ru´ıdo). A zona A é por isso marcada com probabilidade m´ınima de ter um obstáculo. Na zona B, que corresponde à distância até 1/s, a probabilidade de ter obstáculo é reduzida em rela¸cão ao valor lá armazenado, por um valor proporcional à distância 1/s. Por fim, na zona C, que vai até à distância de 1/s + largura da parede, a probabilidade à aumentada com um valor também proporcional à distância 1/s. Para evitar falsas marca¸cões, a marca¸cão na zona C aumenta quatro vezes menos a probabilidade de ter parede em rela¸cão `

a diminui¸cão de probabilidade na zona B. A zona de passagem do corpo do robô é marcado com a mesma probabilidade da zona A.

A marca¸cão do mapa desta forma, confere uma certa incerteza ao mapa, o que permite a corre¸cão de erros de marca¸cão. É um algoritmo simples que se encontra bem adaptado ao problema, conseguindo contornar as suas limita¸cões.

Figura 2.2: Corpo do agente e os seus sensores de obst´aculos.

Figura 2.3: Dete¸c˜ao de um obst´aculo.

2.2.11 Mapeamento de um ambiente dinˆamico

Dirk Hähnel et al. desenvolveram um algoritmo de mapeamento [24] para ambientes dinâmicos, baseado no algoritmo de EM (descrito na Seçcão 2.2.5). Estando o mapeamento

(38)

Figura 2.4: Diferentes ´areas de marca¸c˜ao dos sensores segundo o algoritmo YAM.

já sujeito a erros de medi¸cões, no caso de ambientes dinâmicos a situa¸cão é ainda mais agravada. O que este algoritmo tenta fazer é a supressão dos objetos dinâmicos para a obten¸cão do modelo estático do mapa.

Ao contrário de muitos dos algoritmos que lidam com ambientes dinâmicos e usam mode-los predefinidos para a identifica¸cão de objetos dinâmicos, o algoritmo em discussão considera cada medida individualmente e estima a sua probabilidade condicional para saber se a in-forma¸cão foi ou não gerada por um objeto dinâmico. Este cálculo corresponde à primeira fase do EM (fase de estima¸cão), sendo na segunda fase determinada a posi¸cão do robô e o mapa (fase de maximiza¸cão). Este processo é efetuado iterativamente até que não possam haver mais melhoramentos.

O problema de identificar aspetos dinâmicos no mapa é referido como o problema de dete¸cão de discrepâncias, ou seja, de informa¸cão que está longe do que seria previsto. Para que as discrepâncias possam ser identificadas é necessário considerar as medidas como um todo, interpretá-las e processá-las de forma a obter uma representa¸cão global (um mapa). Só depois se podem identificar medidas individuais como sendo ou não discrepâncias.

Seja z = {z1, ..., zT} a sequˆencia de informa¸c˜ao obtida dos sensores, em que cada zt

corresponde a um conjunto de informa¸c˜ao, como acontece no uso de “laser-range-finders” (zt = zt1, ..., ztN); m o modelo gerado a partir de z e filtrado para n˜ao conter objetos

dinâmicos; ct,n uma variável binária que indica se a informa¸cão zt,ncorresponde a um objeto

estático (ct,n = 1) ou dinâmico (ct,n = 0); st a posi¸cão do robô e f a fun¸cão que retorna,

para cada posi¸c˜ao do robˆo, o ´ındice do feixe do laser k e o valor do mesmo n (f (st, n, k)).

A probabilidade da medida zt,n, dados ct,n e o mapa x ´e ent˜ao calculada da seguinte forma,

para o caso do sensor detetar um obst´aculo:

p (zt,n| ct,n, st, x) =xf (st,n,zt,n) ct,n_{1 − x} f (st,n,zt,n) (1−ct,n) zt,n−1 Y k=0 1 − x_{f (s}_t_,n,k) (2.11)

A primeira parcela da equa¸c˜ao diz respeito aos objetos est´aticos (ct,n= 1) enquanto que a

segunda diz respeito a objetos dinâmicos (ct,n = 0). A última parte da equa¸cão faz o cálculo

da probabilidade como sendo o produto das probabilidades dos pontos que o sensor abrangeu at´e atingir o obst´aculo.

(39)

Trata-se de um algoritmo bastante interessante. Baseia-se estritamente em probabilidades, não necessitando da cria¸cão de modelos de objetos, como muitos dos algoritmo usados em ambientes dinâmicos. Esta abordagem torna o algoritmo numa importante referência em mapeamento robótico.

2.2.12 Mapas Cognitivos

O algoritmo de mapeamento desenvolvido dor Angelo Arleo et al. [11] integra o paradigma geométrico com o topológico. No paradigma geométrico os obstáculos são modelados de acordo com a sua forma e com o aux´ılio de uma grelha de representa¸cão. Embora as grelhas sejam fáceis de aprender e manter, estas estão sujeitas a erros provenientes da localiza¸cão do robô e da distância dos objetos ao mesmo. São também dispendiosas em questões de memória e tempo utilizados. Por outro lado, o paradigma topológico baseia-se numa representa¸cão qualitativa, sendo o mapa representado por nós e arcos. Os nós dizem respeito às diferentes ´

areas (landmarks) e os arcos representam as rela¸cões espaciais entre nós. Trata-se de um modelo mais compacto e por isso usa menos memória e também menos tempo para a sua atualiza¸cão. Como armazena rela¸cões entre áreas, vem facilitar o processo de planeamento de trajetórias.

Este algoritmo baseia-se na conjuga¸cão dos dois paradigmas, criando assim um modelo de parti¸cões de resolu¸cão variável. Segundo este modelo, o mundo é dividido em sub-áreas de tamanhos diferentes, de acordo com as necessidades. Desta forma controla-se a resolu¸cão do mapa, sendo dado mais pormenor apenas em áreas onde a navega¸cão do robô se considere mais complexa, devido à existência de obstáculos.

A modela¸cão de um objeto é feita contornando o mesmo para definir os seus cantos. Será a partir destes que se vai particionar mais a zona geográfica do objeto. Sempre que o agente encontra um novo objeto a resolu¸cão da parti¸cão em que se insere é aumentada. Dado como exemplo a zona da Figura 2.5a, assim que o robô define os cantos do objeto lá inserido, tra¸ca linhas que conectem esses mesmos cantos às retas perpendiculares mais próximas que pertencem a outras parti¸cões (Figura 2.5b).

Trata-se de um algoritmo on-line e incremental, para uso em ambientes domésticos. A sua capacidade de adapta¸cão da resolu¸cão do mapa ás necessidades do mesmo torna-o muito eficiente em termo de processamento e uso de memória.

(40)

(a) Parti¸c˜ao com resolu¸c˜ao de-sadequada.

(b) Aumento da resolu¸cão da parti¸cão para modela¸cão do objeto.

Figura 2.5: Exemplo de aumento de resolu¸c˜ao de uma parti¸c˜ao [11].

2.3 Resumo

Este Cap´ıtulo tem como finalidade abranger um leque variado de algoritmos de mapea-mento, capazes de satisfazer diferentes necessidades, de acordo com a implementa¸cão que se pretenda. Os algoritmos abordados variam desde os mais complexos e eficientes, como o Expectation Maximization (Seçcão 2.2.5), aos mais simples e mais rápidos, como é o caso do Incremental ML (Seçcão 2.2.6). Têm por objetivo diferentes tipos de implementa¸cão, de acordo com o tipo de ambiente a mapear, ou também com base nas caracter´ısticas do robô (tipos de sensores, capacidade de processamento, . . . ). Sendo todos capazes de mapear ambi-entes estáticos, apenas alguns deles são capazes de funcionar em ambientes dinâmicos (como o Dogma e o algoritmo de Dirk H., et al., nas Seçcões 2.2.9 e 2.2.11, respetivamente). Certos algoritmos destinam-se a robôs espec´ıficos, como o de Lu/Milios (Seçcão 2.2.4), desenvolvido para o uso em robôs com laser-range-finders, e o YAM, desenvolvido para o agente virtual do concurso Ciber-rato (ou similar).

Os mapas podem ser gerados de diferentes formas. A maioria dos algoritmos faz uso de grelhas de células, enquanto que outros podem usar modela¸cão de objetos, que é o que acontece no algoritmo Dogma (Seçcão 2.2.9), ou usam mapas cognitivos (Seçcão 2.2.12) que dividem o mundo em parti¸cões com diferentes tipos de resolu¸cão.

Este estudo pretende servir como base à fase de implementa¸cão. É já poss´ıvel prever que este não será o único algoritmo necessário para a garantia de obten¸cão de um mapa por completo. No Cap´ıtulo seguinte serão abordados algoritmo que complementarão o de mapeamento.

(41)

(42)

Cap´ıtulo 3

Explora¸

c˜

ao

A capacidade de um agente para navegar de forma segura num ambiente com obstáculos é garantida por algoritmos de navega¸cão que permitem uma desloca¸cão ponto-a-ponto, tendo um ponto de partida e de chegada definidos. O caminho escolhido por estes algoritmos é normalmente baseado no percurso mais curto, mais rápido ou mais seguro (afastado de obstáculos por exemplo), ou outro, conforme o objetivo da aplica¸cão.

Mas e se o desafio for outro? E se o objetivo não for chegar o mais depressa poss´ıvel à meta, mas sim percorrer todo o espa¸co em busca de objetos, ou limpar toda a área? Nestes casos, e noutros semelhantes, os algoritmos referidos não são suficientes. É necessário recorrer a algoritmos de explora¸cão de cobertura completa.

Os algoritmos de explora¸cão têm por objetivo percorrer todo o mapa em questão (cober-tura total), quer este seja dado à partida ou não. Caso não se tenha acesso ao mapa do ambiente, pode, no entanto, nunca se conseguir uma solu¸cão ótima para a explora¸cão de vários ambientes.

3.1 T´

ecnicas

O trabalho de Howie Choset [15] propõe uma divisão dos algoritmos de explora¸cão por quatro categorias:

• heur´ıstica; • aproximada;

• parcialmente aproximada; • decomposi¸c˜ao celular exata.

As diferen¸cas destas abordagens residem na forma como o mapa é ou não repartido e no(s) comportamento(s) de que é dotado o agente. No esquema da Figura 3.1 verifica-se que, embora um algoritmo heur´ıstico tenha baixo consumo de recursos, um algoritmo de decomposi¸cão celular exata é menos suscet´ıvel a erros. Vejamos com mais detalhe o porquê.

Um algoritmo heur´ıstico baseia-se na “regra de ouro” que, embora não tenha qualquer garantia probabil´ıstica, é fácil de implementar e requer baixos consumos computacionais. Balch [13] defende que estes gastos são cinco vezes mais baixos em compara¸cão com algoritmos mais exatos. O(s) agente(s) envolvido(s) nesta explora¸cão é(são) dotado(s) de um ou mais

(43)

Figura 3.1: Categorias de explora¸c˜ao.

comportamentos simples, como por exemplo seguir paredes. Como se trata de um algoritmo que não necessita de muita precisão para funcionar, estes robôs não necessitam de sensores exatos como GPS para determinar a sua posi¸cão, o que torna o robô mais barato para esta aplica¸cão.

H. Choset [15] dá como exemplo para um algoritmo de decomposi¸cão celular aproximada o algoritmo de Zelinsky [46], baseado na transformada de distância (TD). Este divide o espa¸co livre em células iguais, às quais são atribu´ıdos valores (conforme a TD) que levam o agente a percorrer o mapa por completo ou apenas ponto-a-ponto. Na Seçcão 3.1.1 será abordado este algoritmo com mais detalhe.

No caso de uma decomposi¸cão parcialmente aproximada, a divisão por células é feita pela divisão do espa¸co livre em seçcões com um das lados de tamanho fixo. Um bom exemplo [15] para este algoritmo é o proposto por Hert e Lumelsky [22, 31] que fixa a largura das células, fazendo os topos das mesmas adaptarem-se às formas do mapa. A explora¸cão é feita então por zig-zag ao longo das linhas verticais definidas pelas ditas células e por um algoritmo de seguir paredes nos topos. Este algoritmo encontra-se mais detalhado na Seçcão 3.1.4.

Por último, numa decomposi¸cão celular exata a grelha é constitu´ıda por células sem forma ou tamanho definido. A forma da célula deve ser tal que permita ao robô a sua cobertura com movimentos simples de ida e volta. O artigo [15] dá como exemplo a decomposi¸cão trapezoidal [28] cujas células são, como o nome indica, trapézios. Na Seçcão 3.1.5 explicado o algoritmo.

3.1.1 Explora¸c˜ao Baseada na Transformada de Distˆancia (Zelinsky)

Num ambiente em que o espa¸co livre é representado por uma grelha de células do mesmo tamanho (normalmente igual ao do robô), facilmente se estabelece um caminho entre dois pontos, visitando células adjacentes. Mas o problema está em saber que caminho tomar.

A transformada de distância [46] o que faz é atribuir a cada célula um valor proporcional `

a distância da mesma à célula alvo, contornando obstáculos. Considere-se que a distância entre células adjacentes é de d. Uma meta tem de ser estabelecida para que este algoritmo funcione e , partindo desta célula, marcam-se os seus 8-vizinhos (Figura 3.2) com o valor d. De seguida, os vizinhos das células com valor d são marcados com um valor 2d. Este processo repete-se para todo o espa¸co livre, ficando com um aspeto semelhante ao da Figura 3.3.

(44)

Tendo todas as células assinaladas desta forma é poss´ıvel determinar, quer o caminho mais curto entre a partida e a meta, quer um trajeto de cobertura de todas as células (dado que, uma vez visitada, uma célula está explorada por completo). Para tra¸car então a trajetória da partida para a meta, procura-se nos vizinhos da partida a célula com menor valor e visita-se essa mesma célula. A partir desta, segue-se novamente para o vizinho de menor valor. Repete-se este procedimento até se alcan¸car a meta, obtendo assim um trajeto semelhante ao da Figura 3.4a.

Para a explora¸cão completa das células o algoritmo já é diferente. Neste caso o trajeto come¸ca a ser tra¸cado pela visita à célula vizinha da partida que tem maior valor e só se visitam células de valor mais baixo quando nos seus vizinhos não existir nenhuma célula com valor igual ou superior. A ideia aqui é visitar sempre o vizinho com maior valor até alcan¸car a meta, obtendo uma trajetória semelhante à da Figura 3.4b.

´

E necessário ter em aten¸cão que, se o tamanho das células exceder o tamanho do robô, tem de se garantir que o agente ao visitar a célula a vai cobrir por completo, quer seja com os seus sensores de obstáculos ou com um comportamento complementar (que lhe permita, por exemplo, por movimentos de vai e vem, como na Figura 3.13, abranger toda a célula). Se, por outro lado, o tamanho das células for menor que o tamanho do robô, estas trajetórias deixam de ser eficientes, já que vão ser exploradas as mesmas células várias vezes, desnecessariamente.

Figura 3.2: Representa¸c˜ao dos 8-vizinhos de uma c´elula.

(45)

(a) Transformada de trajet´oria. 24

(b) Transformada de trajet´oria de cober-tura total.

Figura 3.4: Exemplos de aplica¸cão da TD para obten¸cão de trajetórias.

Transformada de obst´aculos

Apesar de alcan¸car os objetivos pretendidos, a TD usada por si só não é cem por cento eficiente. No caso do trajeto tra¸cado pela transformada de trajetória, este não previne o robô de navegar demasiado perto dos obstáculos, enquanto que no caso da explora¸cão por cobertura total o robô é for¸cado a realizar demasiadas curvas que podiam ser evitadas. São dados como exemplos destes casos as Figuras 3.5a e 3.7, respetivamente. De ter em aten¸cão que nestas Figuras a TD usa dois valores para d, sendo d = 3 para os vizinhos verticais e horizontais e d = 4 para os vizinhos que se encontram nas diagonais. O facto de d ser igual para os 8-vizinhos ou não, vai depender do grau de precisão e exigência que se pretende, pois embora a distância na diagonal seja diferente da distância na horizontal/vertical, isso pode não ser relevante para a aplica¸cão em causa.

Uma solu¸cão para ambas as aplica¸cões é o uso de outra transformada, que usada em conjunto com a anterior melhora em muito o desempenho do robô. Trata-se da transformada de obstáculos (TO), que funciona de forma muito semelhante à transformada de distância. Basta considerar cada um dos obstáculos como sendo metas e a aplica¸cão da TO é feita usando a mesma metodologia da TD, criando um mapa semelhante ao da Figura 3.5b.

A ideia é, portanto, adicionar uma taxa de desconforto aos caminhos, que corresponde a andar muito perto das paredes, para assim escolher o percurso mais adequado. Seja então Φ a transforma de trajetória de uma célula c cuja meta é cg:

Φ(c, cg) = argmin C∈Xccg  l(C) + α X ci∈C cdanger(ci)   (3.1) Na equa¸c˜ao anterior, Xcg

c ´e o conjunto de caminhos poss´ıveis de c para cg, sendo C

um desses caminhos; l(C) é o comprimento do caminho C; ci é uma célula no caminho C;

cdanger(ci) é a fun¸cão que traduz o desconforto de entrar na célula ci e α é um fator de

(46)

fun¸cão cdanger(ci) é calculada a partir da transformada de obstáculos (Ω):

cdanger(ci) =

(X − Ω(ci))3 if Ω(ci) ≤ X

0 else (3.2)

Nesta equa¸cão X é a distância m´ınima aos obstáculos a que se pretende que o robô navegue.

Como exemplo para o planeamento de trajetórias, tendo uma transforma de distância como a da Figura 3.5a e uma transformada de obstáculos como a da Figura 3.5b (não se usaram necessariamente estes valores), obtêm-se transformadas de trajetórias semelhantes às das Figuras 3.6. A razão pela qual os trajetos são diferentes nessas figuras deve-se aos valores usados na fun¸cão cdanger(ci). Quanto maior for o seu valor, mais afastado dos obstáculos anda

o robô, que é o que acontece na Figura 3.6b em rela¸cão á Figura 3.6a.

Para o caso da explora¸cão, ao serem somadas as duas transformadas (TD e TO) obt´ em-se, por exemplo, um mapa marcado com os valores da Figura 3.8a. Ao contrário do que se passava no mesmo mapa só com a TD (Figura 3.7b), agora o robô faz muito menos curvas como se pode ver na Figura 3.8b.

24 (a) Transformada de distˆancia e de trajet´oria.

24

(b) Transformada de obst´aculos.

Figura 3.5: Aplica¸cão da transformada de distância, de trajetória e de obstáculos a um mapa de exemplo [46].

Tendo uma representa¸cão do mundo armazenada numa grelha de células, esta é uma boa abordagem para garantir a explora¸cão do mapa. Para o funcionamento do algoritmo, é sempre necessário que sejam definidos os pontos de chegada e partida e também tem de se saber o mapa completo antes de aplicar as transformadas. Com estas limita¸cões, não é poss´ıvel usar este algoritmo para explora¸cão com o objetivo de mapeamento do mapa, uma vez que este tem de ser dado à partida.

3.1.2 Explora¸c˜ao Baseada em Fronteiras

Define-se fronteira como sendo uma região nos limites da área explorada e da área por explorar. Brian Yamauchi propõe um algoritmo de explora¸cão de fronteiras [43] que permite uma explora¸cão sem a necessidade de conhecimento do mundo à priori. O seu algoritmo consiste em levar o robô a dirigir-se sempre para as fronteiras, até que não hajam mais fronteiras no mapa. Desta forma garante que todo o espa¸co é explorado.

(47)

(a) (b)

Figura 3.6: Transformada de distância com adi¸cão da transformada de obstáculos e respetiva transformada de trajetória [46].

(a) Transformada de distˆancia.

(b) Transformada de trajet´oria de cobertura total.

Figura 3.7: Aplica¸cão da transformada de distância e de trajetória de cobertura total a um mapa de exemplo [46].

O mapa é marcado numa grelha de células com uma probabilidade inicial de P I. Ao ser obtida informa¸cão para a constru¸cão do mapa, as suas células ficarão num dos três estados:

• livre: P L < P I;

• desconhecido: P D = P I; • ocupado: P O > P I.

A dete¸c˜ao de fronteiras ´e feita depois em quatro passos:

1. uma c´elula marcada como livre, que seja adjacente a uma ou mais c´elulas desconhecidas, ´

e marcada como candidata a c´elula de fronteira;

(48)

(a) Transformada de distância com adi¸cão da transformada de obstáculos.

(b) Transformada de trajet´oria de cobertura total.

Figura 3.8: Transformada de distância com adi¸cão da transformada de obstáculos e respetiva transformada de trajetória de cobertura total [46].

3. apenas as regiões fronteira com um certo tamanho m´ınimo (aproximadamente o tamanho do robô) são consideradas fronteiras;

4. ´e encontrado e marcado o centroide de cada fronteira.

Tendo as fronteiras marcadas, o robô decide então dirigir-se para o centroide mais próximo de si. Para navegar até lá usa um algoritmo de planeamento de trajetórias juntamente com um comportamento reativo de desvio de obstáculos. O que vai acontecer quando alcan¸ca o centroide pretendido é que vai possivelmente encontrar mais obstáculos e mais espa¸cos livres, criando novas fronteiras e espa¸co para explorar. As Figuras 3.9 dão como exemplo alguns estados do mapa quando é feita a explora¸cão de um gabinete, usando este algoritmo. As células livres (P L) são representadas com espa¸cos em branco, as desconhecidas (P D) com pontos pequenos e os pontos maiores dizem respeito a obstáculos (P O). As cruzes são os centroides de cada fronteira e encontram-se etiquetados com números.

Este algoritmo é uma boa escolha para situa¸cões em que se pretende explorar o mundo para efeitos de mapeamento, garantindo que todo o espa¸co é explorado, sem necessidade de conhecimento do mundo à priori.

3.1.3 Transformada de explora¸c˜ao

A transformada de explora¸cão [38] foi desenvolvida por Stephan Wirth e Johannes Pellenz e consiste numa conjuga¸cão da transformada de distância (Seçcão 3.1.1) com a explora¸cão baseada em fronteiras (Seçcão 3.1.2). O mapa gerado pelo algoritmo mantém registo das fronteiras existentes no mesmo, mas em vez do robô de dirigir para a fronteira mais próxima, este vai usar a transformada de trajetória em conjunto com a transformada de obstáculos para determinar o caminho mais seguro. Por outras palavras, a transformada de trajetória é alterada de forma a usar como destino uma fronteira e não uma célula alvo. A equa¸cão da

(49)

Figura 3.9: Explora¸c˜ao de um gabinete [43].

transformada de explora¸cão é então dada pela Equa¸cão (3.3).

Ψ(c) = argmin C∈Xccg  l(C) + α X ci∈C cdanger(ci)   _∀cg∈F (3.3)

Como se pode verificar, esta equa¸cão é muito semelhante à equa¸cão da transformada de trajetória (Equa¸cão (3.1)). F é o conjunto de todas as células de fronteira, sendo cg a célula

selecionada como destino e as restantes variáveis são as mesmas da equa¸cão de trajetória. ´

E uma solu¸cão elegante que leva o robô a navegar a uma distância segura em rela¸cão aos obstáculos, sem que com isso comprometa a explora¸cão e o mapeamento.

3.1.4 Explora¸c˜ao por Zig-zag de Linhas Paralelas

Hert e Lumelsky propõem um algoritmo de explora¸cão que leva o robô a percorrer o mundo num movimento de zig-zag até que toda a área seja coberta [22, 31]. Limitam-se as células do mapa com retas verticais (paralelas) de largura fixa e topos ajustados aos limites do mapa.

(50)

O objetivo é levar o robô a navegar nessas mesmas linhas que definem as células. No exemplo na Figura 3.10 o robô come¸ca a explorar no ponto assinalado (podendo come¸car em qualquer parte do mapa) e executa então movimentos em zig-zag pelas linhas que limitam as células e os topos do mapa.

Pode acontecer que, enquanto se desloca, encontra zonas (definido pelo autor como inlets) que já foram ou que não seriam exploradas se se usasse este procedimento tal e qual como foi descrito. Ao serem encontradas, estas zonas serão exploradas de imediato e o mesmo acontece para inlets dentro de inlets. É necessário marcar o ponto de entrada e sa´ıda das inlets, de forma a garantir que não serão exploradas mais de uma vez. O robô entra nas inlets movendo-se ao longo das bordas do mapa e explora essa área. Quando sai da mesma, retoma o trajeto que deixou pendente. Um procedimento semelhante é usado para mapas que contenham ilhas, armazenando alguns pontos chave que permitem uma correta explora¸cão. Este processo é exemplificado na Figura 3.11.

Este algoritmo tem a vantagem de poder ser executado sem conhecimento do mapa, ou at´e mesmo para esse fim (mapeamento). Embora seja um algoritmo que confere alguma exatid˜ao, tem como contrapartida alguns gastos computacionais.

Figura 3.10: Explora¸c˜ao do mapa em zig-zag.

3.1.5 Decomposi¸c˜ao Trapezoidal

Na decomposi¸cão trapezoidal, tal como o nome indica, as células do mapa são trapézios, sem dimensões definidas. Choset e Pignon [16, 17] desenvolveram uma forma para decompor o mapa em trapézios, à qual chamaram boustrophedon decomposition. A ideia é fazer deslizar um segmento de reta ao longo de toda a área. Assim que essa reta seja interrompida por um obstáculo, são criadas duas novas células, como acontece na Figura 3.12a. Chegando a reta ao fim do obstáculo, as células novas serão juntas numa só (Figura 3.12b). No final, o mapa estará dividido em células exatas, como as do exemplo da Figura 3.12c.

A explora¸cão agora é feita pela visita a cada célula. Basta que em cada uma delas o robô execute movimentos de vai e vem (Figura 3.13) e a célula pode se dar como explorada.

Devido à exatidão das células usadas, este procedimento torna-se bastante dispendioso em recursos computacionais. Outra desvantagem é a necessidade de ser dado à priori ao algoritmo o mapa.

(51)

Figura 3.11: V´arias fases da explora¸c˜ao de um mapa com inlets e ilhas [15].

(a) slice atinge um obst´aculo criando duas novas c´elulas.

(b) slice chega ao fim de um obstáculo fundindo as duas células numa só.

(c) Estado final do mapa decomposto por c´elulas.

Figura 3.12: Processo de decomposi¸c˜ao do mapa em c´elulas trapezoidais [15].

Figura 3.13: Movimentos de vai-vem para explora¸c˜ao de c´elulas.

3.2 Resumo

Este Cap´ıtulo trata do estudo de alguns algoritmos de explora¸cão, que podem servir para uma desloca¸cão controlada, que possam complementar o processo de mapeamento. Os algoritmo de explora¸cão permitem que o mundo possa ser percorrido por completo, quer o mapa deste seja dado como base, quer o objetivo seja exatamente a sua obten¸cão.

Os algoritmos de Zelinsky (Seçcão 3.1.1) e de decomposi¸cão trapezoidal (Seçcão 3.1.5), embora que interessantes, necessitam de um mapa à priori. Isto significa que estes algoritmos

(52)

n˜ao podem ser usados com o objetivo de mapeamento do mundo.

Já os restantes algoritmos não necessitam que o mapa lhes seja dado à partida. Estes podem funcionar com o objetivo de obten¸cão do mapa completo do mundo. O algoritmo de explora¸cão baseada em fronteiras (Seçcão 3.1.2) tem por objetivo a procura constante de zonas inexploradas, levando a uma explora¸cão completa. Uma alternativa a este, que proporciona um comportamento mais eficiente e seguro, é a transformada de explora¸cão (Seçcão 3.1.3). Esta leva o robô a deslocar-se, não para a fronteira à menor distância do robô (como o anterior), mas sim pelo uso das transformadas de trajetória e de obstáculos, para selecionar o ponto fronteira de destino. Por último, a explora¸cão por zig-zag (Seçcão 3.1.4) tem o inconveniente de ser muito dispendiosa a n´ıvel computacional.

Pretende-se que estas bases teóricas sejam úteis para o estudo e implementa¸cão deste al-goritmo, em conjunto com um algoritmo de mapeamento. Segue-se a fase de implementa¸cão destes algoritmos, onde se pretende consolidar melhor os conhecimentos à cerca desta temática.

(53)