• Nenhum resultado encontrado

4 NOVO MÉTODO PARA MODELAGEM DE SISTEMAS DINAMICOS

5.3 RESULTADOS DE SIMULAÇÃO

6.1.3 Construção da DCN

O desenvolvimento da DCN parte da observação do problema (capítulo 1), onde são identificados inicialmente 3 características relacionadas com a descrição do ambiente (presença de obstáculos à esquerda, a direita ou em frente da trajetória seguida pelo robô) e 3 saídas descrevendo os movimentos do robô: virar à esquerda, virar à direita e seguir em frente. As três entradas assumem valores medidos pelos três sensores localizados à esquerda, direita e frente do móvel. Estes conceitos são conectados por arcos que representam as ações de aceleração (positiva) e de frenagem (negativa). Três decisões são originalmente modeladas, se os sensores acusam um obstáculo à esquerda, o veículo deve virar para o lado direito, e por outro lado se os sensores da direita acusam um obstáculo no lado direito, o veículo vira para lado esquerdo. A decisão de

mudar de direção implica em uma desaceleração suave do robô. A terceira decisão está relacionada a um ambiente livre de obstáculos. Neste caso, a unidade móvel segue uma linha reta acelerando suavemente.

A construção da DCN pode ser dividida em dois passos: no primeiro passo: a DCN inicial modela apenas relações do tipo causal, as quais representam a camada reativa do robô. As funções de baixo nível são então modeladas pela DCN da seguinte forma: os conceitos de entrada são SL, SR e SF que correspondem respectivamente às leituras dos sensores laterais (esquerdo e direito) e do sensor frontal e os conceitos de saída são Outleft, OutRigth e OutFront, que representam os movimentos a esquerda, a direita e em frente. As relações causais entre estes conceitos expressas em termos de efeito e intensidade estão descritas no quadro 9.

O quadro 9 descreve e detalha as relações causais do modelo cognitivo, essas relações são obtidas pela observação da dinâmica do robô móvel (ajuste on-line) no simulador em diferentes cenários. A figura 36 ilustra o mapa cognitivo representativo destas relações. Os valores dos conceitos são as leituras dos sensores correspondentes. Como um número Fuzzy, esses valores são normalizados no intervalo [0, 1]. As relações entre esses conceitos são modelados pelos pesos w1 até w9. Vale à pena observar na figura 36, que os conceitos O.L. (-1) e O.R. (-1) são os valores dos conceitos no estado anterior, portanto são conceitos do tipo memória conforme definidos no capítulo 4. Esta representação é equivalente a inserir valores negativos (-1) nas posições correspondentes à diagonal da matriz de pesos W. Observa-se que nesta aplicação o conceito de memória tem efeito contínuo em toda a trajetória do robô móvel, ou seja, nesse caso é um conceito de memória temporal. Entretanto, é possível ocorrer à inclusão desse conceito para uma tomada de decisão na camada deliberativa da DCN devido à ocorrência de um evento.

Relação Causal

Descrição Efeito Intensidade

W1 Conecta Sensor Right (S.R.) na saída Out Left (O.L.)

Positivo Forte

W2 Conecta Sensor Front (S.F.) na saída Out Left (O.L.)

Positivo Médio

W3 Conecta Sensor Front (S.F) na saída Out Front (O.F.)

Positivo Forte

W4 Conecta Sensor Front (S.F.) na saída Out Right (O.R.)

Positivo Médio

W5 Conecta Sensor Left (S.L) to Out Right

(O.R.)

Positivo Forte

W6 Conecta conceito saída Out Left (O.L) na

saída Out Right (O.R.)

Negativo Muito fraco

W7 Conecta conceito saída Out Right (O.R.) na saída Out Left (O.L.)

Negativo Muito fraco

W8 Conecta Sensor Right (S.R.) na saída Out

Right (O.R.)

Negativo Muito fraco

W9 Conecta Sensor Right (S.R.) na saída Out

Right (O.R.)

Negativo Muito Fraco

Quadro 9 – Descrição das relações da DCN navegação. Fonte: Autoria própria.

O uso deste tipo de conceito permite o robô lembrar-se das medidas tomadas anteriormente para virar à esquerda ou à direita, suavizando um efeito de “zig-zag” no seu movimento. Como resultado, o robô móvel consegue manter uma tendência de movimento.

Figura 36 - DCN Inicial Fonte: autoria própria

O sistema reativo modelado pela DCN na figura 36 tem sempre o mesmo comportamento independente de variações no ambiente e/ou no robô (desgaste de engrenagens e variação de aderências das rodas). Para contornar esses problemas de variações do robô e/ou do ambiente (como por exemplo, a presença de um obstáculo inesperado durante a trajetória), um ajuste dinâmico dos valores das relações causais (w) pode ser realizado através de um algoritmo de aprendizado por reforço. Esta etapa não corresponde a um treinamento propriamente dito, mas antes a um refinamento das relações causais dinâmicas dentro de uma faixa previamente estabelecida pelos especialistas e de acordo com regras heurísticas. A introdução do algoritmo RL na DCN da figura 36 será apresentada na seção a seguir, após a descrição da camada deliberativa.

A fim de modelar a tomada de decisão em face de eventos não modelados (imprevistos), mas considerando um planejamento a priori, são introduzidos 3 novos conceitos para a DCN, associados a uma "intensidade" do movimento (aceleração ou frenagem) em cada direção. Estes conceitos são do tipo fator e ponderam as decisões em cada direção, fator da esquerda, fator da direita e fator de frente. A DCN com a camada deliberativa incorporada é mostrada na figura 37. Os conceitos do tipo fator têm seus valores alterados de acordo com a condição atual do movimento do veículo e a ocorrência de eventos. Estes eventos são modelados pelos pesos “ws” na figura 37, que

são obtidos pela aplicação de regras (implicações linguísticas) do tipo SE-ENTÃO. Estas regras representam algumas decisões, como se o robô está virando à direita porque o sensor da esquerda detectou um obstáculo e de repente o sensor direito também detecta um obstáculo, então o fator de saída à direita é pequeno (ws3). O valor padrão de um conceito fator é 1. Se nenhuma regra é disparada para uma determinada relação, então o valor do peso associado ao conceito fator é nulo. Finalmente as saídas da DCN são: o produto entre os conceitos fator e a saída da DCN de baixo nível (Outleft, OutRight e OutFront).

Figura 37 - Proposta da DCN Fonte: autoria própria

O sistema de navegação autônomo modelado pela DCN da figura 37 confere ao robô / veículo o seguinte comportamento:

• Os robôs são autônomos e movem-se em ambiente desconhecidos desde o ponto de origem até um ponto final dentro de uma região estimada. • Caso um obstáculo seja detectado por sensores na frente, à esquerda e /

ou à direita do móvel, o robô deve tomar uma decisão sobre o novo rumo a seguir.

constante, ou seja, os movimentos laterais são usados apenas como resultado de detecção de obstáculos.

• Quando o robô móvel está em movimento e os sensores não identificam qualquer obstáculo, este acelera suavemente e em seguida permanece em uma velocidade constante.

• A tendência de movimento corresponde a uma média entre os valores de movimento em curso e os valores no instante imediatamente anterior, o que impede qualquer alteração acentuada da direção de navegação do robô.

• Quando o robô móvel está virando à esquerda e o sensor oposto também detecta um obstáculo, a tendência de movimento é mantida, porém o robô começa a ponderar suavemente a presença de obstáculos e toma decisões considerando os movimentos anteriores.