Controlo da direc¸ c˜ ao de navega¸ c˜ ao, φ

3.2 Controlo de Robˆ os Aut´ onomos

3.2.1 Controlo da direc¸ c˜ ao de navega¸ c˜ ao, φ

O controlo da direçcão de navega¸cão do robô é feito através de uma série temporal de valores da direçcão de navega¸cão, φ(t), gerados pelo seguinte sistema dinâmico

dφ

dt = f (φ) = fobs(φ) + falvo(φ) (3.6) A fun¸cão f (φ(t), parâmetros) define um campo vectorial, i.e., a cada estado é atribu´ıdo um vector f (φ) (Bicho e Schöner, 1997). Este campo vectorial é constru´ıdo através de um determinado número de for¸cas aditivas, onde cada uma especifica um valor para a direçcão de navega¸cão podendo ser desejado ou indesejado. Cada uma destas for¸cas é caracterizada pelo valor que é especificado para a direçcão de navega¸cão, pela intensidade de atraçcão ou repulsão, e pela gama de valores da direçcão de navega¸cão sobre os quais a for¸ca exerce o seu efeito.

Para atrair o sistema para o valor desejado, que corresponde à direçcão em que se encontra o alvo, ψalvo, é atribu´ıda uma for¸ca atractiva, falvo, enquanto que para evitar

que o sistema tome um valor indesejado, que corresponde à direçcão em que se situa o obstáculo, ψobs, é utilizada uma for¸ca repulsiva, fobs. Da sobreposi¸cão destas for¸cas é

obtido um atractor na dinâmica resultante. Na figura 3.4 podemos observar a dinâmica resultante (em baixo) da adi¸cão de uma for¸ca atractiva (em cima) e de uma for¸ca repulsiva (no meio). A for¸ca atractiva especifica um atractor na direçcão ψalvo, enquanto

que a for¸ca repulsiva especifica um repulsor em ψobs. Da adi¸c˜ao destas duas for¸cas 2_{Para mais informa¸}_c˜_{oes sobre o tipo de bifurca¸}_c˜_{oes que podem ocorrer consultar, por exemplo,}

ψ_alvo π/2 π 3π/2 2π dφ/dt φ Atractor ψ_obs π/2 π 3π/2 2π dφ/dt φ Repulsor π/2 π 3π/2 2π π/2 π 3π/2 2π dφ/dt φ Atractor Resultante

Figura 3.4: Dinâmica obtida na situa¸cão apresentada na figura 3.1. A for¸ca atractiva especifica um atractor na direçcão ψalvo(em cima) e a for¸ca repulsiva especifica um repulsor na direçcão ψobs(no meio). A dinâmica resultante (em baixo) da sobreposi¸cão destas for¸cas especifica um atractor.

3.2. CONTROLO DE ROB ÔS AUT ÓNOMOS 47 emerge um atractor. No entanto, dependendo da contribui¸cão das for¸cas repulsiva e atractiva, podem surgir mais do que um atractor. Nestes casos cada atractor especifica uma direçcão desejada/poss´ıvel para o robô. A decisão sobre qual das direçcões a tomar depende da bacia de atraçcão onde se encontra a direçcão de navega¸cão. Estas situa¸cões serão vista em pormenor no Cap´ıtulo 6.

Evitar colis˜ao com obst´aculos

Considere-se um robô dotado de n sensores de distância3, montados num anel centrado no eixo de rota¸cão do robô, numa direçcão fixa θi, relativamente à direçcão frontal

do robô, φ. Desta forma, no referencial externo fixo, cada sensor aponta na direçcão4 ψi = φ + θi, sendo φ a direçcão de navega¸cão nesse referencial externo (Figura 3.5).

θ₁θ2 θ₃ θ₄ θ₅ ψ5 θ₆ ψ₆ θ₇ _φ Obstáculo Sensores

Figura 3.5: Robô dotado de 7 sensores de distância onde cada um deles está montado numa direçcão, θi (i = 1, . . . , 7), relativamente à direçcão frontal do robô, φ. Cada sensor especifica um obstáculo virtual, na direçcão ψi= φ + θi, no referencial externo.

Assuma-se que cada sensor i (i = 1, . . . , n) especifica um obstáculo virtual, localizado na direçcão ψi, se é detectada uma obstru¸cão nessa direçcão. A for¸ca repulsiva devida

a cada obstáculo aponta na direçcão em que o sensor aponta, e é dada por

fobs,i(φ) = λi(φ − ψi) exp −(φ − ψi) 2 2σ2 i (3.7)

3_{Neste trabalho ´}_{e considerado um robˆ}_{o dotado de 7 sensores (Cap´ıtulo 5).} 4_{Para simplifica¸}_c˜_{ao de nota¸}_c˜_{ao, ψ}

idenota ψobs,i, que designa a direc¸c˜ao, no referencial externo, na qual aponta o sensor i, com (i = 1, . . . , 7).

Visto que a direçcão φ − ψi = −θi é fixa e conhecida, é irrelevante a calibra¸cão do

sistema em rela¸c˜ao ao referencial externo. A magnitude desta for¸ca de repuls˜ao, λi,

exercida pelo obstáculo virtual na direçcão ψi é

λi= β1exp −di β2 (3.8)

onde β1 controla a magnitude m´axima de repuls˜ao, β2 a sua taxa de decaimento com

o aumento da distˆancia, e di, a distˆancia medida pelo sensor i. A figura 3.6 ilustra

a influˆencia de β1, β2 e di na magnitude de repuls˜ao λi. Note-se que a magnitude

de repulsão decresce com o aumento da distância. Quando nenhum obstáculo estiver dentro do raio de deteçcão dos sensores, a for¸ca de repulsão por ele exercida é nula e não contribui para a dinâmica.

β₁=20 di λ_i β₂=10 β₂=20 β₂=20 di λ_i β₁=10 β₁=20

Figura 3.6: Influência de β1, β2 e dina magnitude de repulsão λi. A magnitude máxima de repulsão é controlada por β1(à direita) e β2controla a taxa de decaimento com o aumento da distância, di(à esquerda).

A gama angular sobre a qual a for¸ca repulsiva exerce o seu efeito é controlada por σi, que depende do ângulo de sensibilidade dos sensores, ∆θ = fixo, e da distância di.

Assim, σi = arctan tan ∆θ 2 + Rrobo Rrobo+ di (3.9) onde Rrobo designa o raio do robˆo. Deste modo, a gama angular sobre a qual a for¸ca

3.2. CONTROLO DE ROB ˆOS AUT ´ONOMOS 49

σ_i

Figura 3.7: Varia¸cão de σicom o aumento da distância, di. A gama angular, σi, sobre a qual a for¸ca repulsiva actua diminui com o aumento da distância, di.

Somadas as contribui¸cões de todos os sensores é obtida a dinâmica comportamental fobs(φ) =

i=1

fobs,i(φ) (3.10)

Vejamos o que acontece na situa¸cão apresentada na figura 3.5. Nesta podemos observar que dois dos sensores detectam o obstáculo, criando dois obstáculos virtuais. As duas for¸cas repulsivas criam um repulsor na direçcão em que apontam cada um dos sensores (Figura 3.8), ou seja, em ψ5 e ψ6. Da adi¸cão das contribui¸cões de ambos os sensores,

emerge um repulsor na direc¸c˜ao φ = ψ5+ψ6

2 , pois a distˆancia ´e em ambos os casos igual.

Movimento na direc¸c˜ao do alvo

Assuma-se que as coordenadas do alvo (xalvo, yalvo) são conhecidas. A direçcão, ψalvo,

relativamente ao eixo-x do referencial externo fixo, na qual se situa o alvo em rela¸c˜ao `

a posi¸cão actual do robô, é dada por

ψalvo= arctan

yalvo− yrobo

xalvo− xrobo

(3.11)

Como se pretende que a for¸ca atractiva se exer¸ca qualquer que seja a orienta¸cão do robô, a gama de valores sobre os quais exerce o seu efeito atractivo é o c´ırculo completo. Esta

ψ₅_π_/2 ψ₆ _π 3π/2 ₂_π dφ/dt

Repulsor Resultante

Figura 3.8: Situa¸cão ilustrada na figura 3.5, onde são detectadas obstru¸cões nas direçcões ψ5 = 5π/12 e ψ6 = 7π/12 a uma distância de 20 cm, onde φ = π/4. As for¸cas repulsivas devidas à obstru¸cão nas direçcões ψ5 e ψ6 (vermelho e verde, respectivamente), resultam numa dinâmica (azul) cujo repulsor se encontra em π/2.

for¸ca atractiva ´e dada por

falvo(φ) = −λalvosin(φ − ψalvo) (3.12)

onde λalvo especifica a intensidade.

Na figura 3.9 podemos observar uma situa¸cão em que nenhum dos sensores detecta obstru¸cões e na direçcão ψalvo = π/3 existe um alvo a 45 cm. Nesta situa¸cão, a

dinâmica apresenta um atractor (estado assimptoticamente estável) na direçcão em que o alvo é visto em rela¸cão ao referencial externo (Figura 3.10).

Integra¸c˜ao dos dois comportamentos

Através da soma das contribui¸cões dos obstáculos e do alvo para o campo vectorial da dinâmica da direçcão de navega¸cão, é poss´ıvel integrar os comportamentos movimento na direçcão do alvo e evitar colisão com obstáculos. Assim, o sistema dinâmico resultante é dφ dt = n X i=1 fobs,i(φ) + falvo(φ) (3.13)

3.2. CONTROLO DE ROB ˆOS AUT ´ONOMOS 51 θ₁ θ₂ θ₃ θ₄ θ₅ θ6 θ₇ _φ ψalvo Alvo

Figura 3.9: Robô com direçcão de navega¸cão φ = π/4 e alvo na direçcão ψalvo = π/3 a uma distância de 45 cm.

ψ_alvo π/2 π 3π/2 2π

dφ/dt

Atractor

Figura 3.10: Dinâmica resultante da situa¸cão apresentada na figura 3.9, onde o robô tem direçcão de navega¸cão φ = π/4 e existe um alvo na direçcão ψalvo= π/3 a uma distância de 45 cm.

O sistema obtido é não-linear podendo ter múltiplos atractores (estados estáveis) e repulsores (estados instáveis).

Para garantir a prioridade do comportamento evitar colisão com obstáculos sobre o comportamento movimento na direçcão do alvo, há que garantir que a magnitude das contribui¸cões dos obstáculos seja maior que a da contribui¸cão do alvo.

Quando o número e a estabilidade dos pontos fixos da dinâmica da direçcão de navega¸cão se alteram, surgem mudan¸cas qualitativas no comportamento do robô. Estas mudan¸cas correspondem a bifurca¸cões do campo vectorial induzidas por varia¸cões na informa¸cão

sensorial à medida que o robô se desloca ou que o ambiente se altera. Para garantir a fuga aos repulsores dentro de um tempo limite, é adicionado ao campo vectorial da dinâmica da direçcão de navega¸cão uma for¸ca estocástica

fstoch =

Qξn (3.14)

Esta for¸ca consiste num ru´ıdo branco Gaussiano, ξn, de varia¸c˜ao unit´aria, pelo que Q

é a variância efectiva da for¸ca estocástica.

Assim, a dinâmica da direçcão de navega¸cão vem

dφ dt =

i=1

fobs,i(φ) + falvo(φ) + fstoch (3.15)

Na figura 3.11 é apresentada uma situa¸cão em que o robô, com uma direçcão de navega¸cão φ = π/4, detecta o obstáculo, através da deteçcão de obstru¸cões na direçcão em que apontam 2 dos seus 7 sensores, mais concretamente, nas direçcões ψ5= 5π/12 e

ψ6 = 7π/12, a uma distância de 20 cm. Temos ainda um alvo na direçcão ψalvo = π/3.

A dinâmica resultante consiste na soma das contribui¸cões do obstáculo (que sendo detectado por 2 sensores consiste em 2 obstáculos virtuais) e do alvo.

θ₁θ2 θ₃ θ₄ θ₅ ψ5 θ₆ ψ₆ θ₇ _φ Obstáculo ψ_alvo Alvo

Figura 3.11: Robô dotado de 7 sensores com direçcão de navega¸cão φ = π/4, em que são detectadas obstru¸cões nas direçcões ψ5 = 5π/12 e ψ6 = 7π/12 a uma distância de 20 cm e com um alvo na direçcão ψalvo= π/3.

Na figura 3.12 podemos observar, a azul, a contribui¸cão devida ao obstáculo (que consiste na soma das contribui¸cões de cada um dos obstáculos virtuais), a vermelho,

3.2. CONTROLO DE ROB ÔS AUT ÓNOMOS 53 a respeitante ao alvo, e a preto, a dinâmica resultante. Nesta dinâmica emergem 2 atractores. O sistema irá relaxar para o atractor respeitante à bacia de atraçcão em que se situa a direçcão de navega¸cão actual. Nesta situa¸cão, o sistema relaxará para o atractor à esquerda na figura, pois φ = π/4.

π/2 π 3π/2 2π

dφ/dt

Atractores Resultantes

Figura 3.12: Dinâmica resultante da situa¸cão apresentada na figura 3.11. Com uma direçcão de navega¸cão φ = π/4, é detectado o obstáculo (deteçcão de obstru¸cões nas direçcões ψ5 = 5π/12 e ψ6= 7π/12) e um alvo na direçcão ψalvo= π/3. A azul tem-se a contribui¸cão devida ao obstáculo (que consiste na soma das contribui¸cões de cada um dos obstáculos virtuais), a vermelho a contribui¸cão respeitante ao alvo, e a preto, a dinâmica resultante.

No documento Geração de trajectórias em tempo real: um estudo comparativo (páginas 68-76)