Conclus˜ao - Controle por visão de veiculos roboticos

3.6 Conclus˜ao

A estratégia do tipo ver-e-mover é altamente dependente da precisão do sistema de visão, da calibra¸cão da câmera, dos encoders utilizados e do conhecimento do modelo cinemático do sistema e possui apenas interesse histórico atualmente.

O controle baseado na posi¸cão possui a vantagem das tarefas serem descritas no espa¸co cartesiano, como é comum em robótica, além de desacoplar as tarefas de estima¸cão da posi¸cão do controle da trajetória. Entretanto, perde-se o controle sobre a imagem obser- vada, de modo que não há garantias que o objeto permane¸ca sempre no campo de visão durante a execu¸cão da tarefa, especialmente quando há erros de calibra¸cão significativos. A recupera¸cão da postura absoluta do robô também é um processo delicado e diversas técnicas foram desenvolvidas para aumentar a precisão ou flexibilidade do cálculo.

Finalmente, a estratégia de controle no espa¸co dos sensores, que no caso de uma câmera é o próprio plano imagem, oferece uma alternativa interessante para uma grande classe de problemas. O conceito de matriz de intera¸cão tras a visão robótica ao campo da teoria de controle, oferecendo solu¸cões matemáticas elegantes, especialmente quando a posi¸cão final do robô está relacionada a uma imagem de referência definida por primitivas geométricas.

Cap´ıtulo 4

Vis˜ao Rob´otica

Essencialmente, a visão computacional trata do estudo das propriedades geométricas ou dinâmicas do mundo real através de uma ou mais imagens. Ela distingue-se da área conhecida como processamento digital de imagens, cujo objetivo é realizar transforma¸cões entre imagens.

CCD Lentes

Fonte de Luz

Visao Computacional Imagem Processamento Digital

Figura 4.1: Etapas da vis˜ao computacional.

Um estudo detalhado da solu¸cão de um problema de visão consiste no conhecimento de suas diversas etapas. A Fig. 4.1 descreve seus principais processos. A radiometria estuda a rela¸cão existente entre a quantidade de energia luminosa radiante (recebida) e a energia irradiada (emitida) por um corpo, numa dada dire¸cão. O principal modelo de reflectância de uma superf´ıcie, é conhecido como modelo Lambertiano:

L = ρITn (4.1)

onde, L é a luz irradiada, I a luz radiada, n a normal à superf´ıcie e ρ é denominado albedo, e depende da superf´ıcie.

4.1. Modelo Detalhado de Cˆamera 49

A energia luminosa emitida pelos vários objetos tridimensionais presentes em uma cena atravessa o conjunto óptico de lentes, formando uma imagem bidimensional. O modelo de pinhole representa uma simplifica¸cão do comportamento f´ısico real e, embora seja adequado para uma grande variedade de aplica¸cões, não modela com perfei¸cão as reflexões sofridas pela luz a atravessar as lentes.

A imagem formada na tela da câmera estimula uma matriz de sensores foto-sens´ıveis (CCD), responsáveis por quantizar espacialmente a imagem, que é transformada em um pulso de sinais elétricos. Este sinal é novamente quantizado e amostradado por uma placa de captura (framegrabber ) transformando-a em uma imagem digital.

Nesta etapa, é aplicado uma seqüência de filtros de processamento de imagem, com o intuito de eliminar o ru´ıdo, ou seja, quaisquer dados que não estejam ligados ao objetivo a ser realizado.

Finalmente, as técnicas de visão computacional são utilizadas extraindo informa¸cões a respeito do mundo tridimensional, a partir de uma imagem bidimensional.

Diversas áreas estão relacionadas com visão computacional, como reconhecimento de padrões, fotogrametria, inteligência artificial, dentre outras.

Embora não seja freqüente realizar tal dinstin¸cão, neste trabalho por visão robótica entende-se como sendo a interseçcão da visão computacional com a robótica. Tratam-se dos problemas que surgem na robótica cujas solu¸cões baseiam-se nas técnicas de visão computacional, mas que, além disso, devem atender a restri¸cões de tempo real, às limi- ta¸cões do software e hardware embarcado, e ao ambiente de trabalho.

Este cap´ıtulo encontra-se dividido em duas partes: Na primeira, revisa-se as técnicas de visão computacional necessárias para realizar o controle servo visual baseado na posi¸cão (3.3), e inclui as se¸cões 2.4, onde um modelo detalhado da câmera é apresentado, 4.2, que apresenta um método de calibra¸cão de Tsai e, 4.3, que discute o problema de reconstru¸cão da profundidade baseado em uma ou mais imagens.

A segunda parte trata especificamente dos problemas de visão computacional ne- cessários para realiza¸cão das tarefas de controle servo visual de seguimento de trajetória (3.4.4), posicionamento (3.4.5) e transi¸cão entre tarefas (3.4.6). Nas se¸cões 4.5 e 4.6, as principais técnicas para resolver os problemas de deteçcão e rastreamento de caracter´ısticas visuais, são revistos.

4.1 Modelo Detalhado de Cˆamera

O modelo de câmera de pinhole, visto no cap´ıtulo 2, considera que os raios de luz são projetados em uma tela dentro de uma câmera totalmente fechada, contendo apenas um ´

unico orif´ıcio pontual, atrav´es do qual atravessam todos os feixes de luz que formam a imagem. Entretanto, numa implementa¸c˜ao real deste modelo, a energia que estimula a

4.1. Modelo Detalhado de Cˆamera 50 l_y Y_c X_c l_x u v f z x y

Figura 4.2: Modelo Detalhado de Cˆamera.

tela é muito pequena, demandando um tempo de exposi¸cão muito grande para se obter uma imagem. As câmeras reais substituem o orif´ıcio por um conjunto óptico de lentes que produzem aproximadamente o mesmo efeito. Entretanto, o modelo de pinhole não é capaz de modelar as distor¸cões produzidas pela lente, nem relacionar a imagem projetada com as coordenadas da matriz de CCD. Tsai (1986) propôs uma extensão que permite relacionar de forma mais precisa a imagem esperada da imagem obtida. O modelo possui 11 parâmetros: cinco internos (ou intr´ınsicos):

• f - distˆancia focal da cˆamera,

• κ - coeficiente de distor¸c˜ao de primeira ordem, • Cx, Cy - coordenadas do centro radial da lente,

• sx - fator de escala para incertezas devido `a reamostragem horizontal da placa de captura (framegrabber ),

e seis externos (ou extr´ınsicos):

• Rx, Ry, Rz - ângulos de rota¸cão para a transforma¸cão entre os sistemas de coordenadas do mundo e da câmera, e

• Tx, Ty, Tz - componentes translacionais para a transforma¸c˜ao entre os sistemas de coordenadas do mundo e da cˆamera.

Os parâmetros internos dizem respeito à geometria interna e caracter´ısticas ópticas das lentes e do dispositivo sensor de imagem. Este parâmetros descrevem como a câmera forma a imagem, enquanto os parâmetros externos descrevem a postura da câmera em rela¸cão a um sistema de coordenadas global.

No documento Controle por visão de veiculos roboticos (páginas 63-67)