RELATIVA ENTRE AS CÂMERAS

(1)

SISTEMA DE VIS ÃO EST ÉREO HÍBRIDO COM RECUPERA ¸C ÃO DA POSI ¸C ÃO RELATIVA ENTRE AS C ÂMERAS

Igor Magri Vale∗, Julio Storch Dalfior∗, Raquel Frizera Vassallo∗

∗_{Dpto. de Engenharia El´}_{etrica, Universidade Federal do Esp´ırito Santo}

Av. Fernando Ferrari 514 Vit´oria, ES, Brasil

Emails: igormagrivale@gmail.com, juliostorch@gmail.com, raquel@ele.ufes.br

Abstract— This paper proposes the usage of a hybrid stereo vision system formed by an omnidirectional camera and a perspective camera for recovering the 3D coordinates of points seen in the field view of both cameras. The relative position between the cameras is estimated by using just a pair of images captured when both cameras point at the same scene. The results of this work suggest that the proposed method can be used in a reconfigurable hybrid stereo vision system since the relative position between cameras can be estimated allowing 3D reconstruction any time is needed.

Keywords— Computer Vision, Hybrid Stereo Vision System, 3D Reconstruction, Omnidirectional Vision Resumo— Este artigo propõe a utiliza¸cão de um sistema de visão estéreo h´ıbrido, composto por uma câmera omnidirecional e uma câmera perspectiva, para reconstruir as coordenadas 3D de pontos vistos por essas câmeras. A posi¸cão relativa entre as câmeras é recuperada usando-se apenas um par de imagens e os resultados obtidos são promissores. Isto sugere que o método proposto pode ser usado em um sistema de visão estéreo reconfigurável, pois sempre que necessário é poss´ıvel recuperar a posi¸cão relativa entre as câmeras e realizar a reconstru¸cão 3D. Palavras-chave— Sistema de Visão Estéreo H´ıbrido, Reconstru¸cão 3D, Visão Omnidirecional.

1 Introdu¸c˜ao

Normalmente o controle de robôs móveis depende da incorpora¸cão de sensores externos, somada ao uso de algoritmos avan¸cados de controle. Dos v´ a-rios sensores utilizados na robótica, os sistemas de visão estão entre aqueles capazes de fornecer as informa¸cões mais completas sobre os ambientes de trabalho. Por isso são comumente utilizados mesmo sendo considerados bastante complexos.

Câmeras adquirem imagens em 2D, mas em algumas situa¸cões existe a necessidade de se re-cuperar a informa¸cão 3D dos objetos de interesse. Nesse sentido existem os sistemas de visão est´ e-reo. Porém, para obter informa¸cão tridimensional, deve-se conhecer previamente a posi¸cão relativa das câmeras que compõem o sistema de visão es-téreo, o que, sem uma técnica para recuperar essa posi¸cão automaticamente, tornaria o uso desse sis-tema limitado a aplica¸cões estáticas.

Com base no cenário exposto, esse artigo pro-põe o uso de um sistema de visão estéreo h´ıbrido, composto de uma câmera omnidirecional e uma câmera perspectiva para realizar a reconstru¸cão tridimensional de pontos espec´ıficos das imagens. A idéia de se utilizar um sistema de visão estéreo h´ıbrido se baseia na possibilidade de se desenvol-ver aplica¸cões e tarefas em que se pode aprovei-tar as vantagens de cada uma das câmeras, ou seja, o grande campo visual da omnidirecional e a boa resolu¸cão da perspectiva. Considerando que cada câmera pode estar acoplada a um robô móvel ao invés de uma estrutura estática, nesse projeto foi desenvolvida uma metodologia de recupera¸cão da posi¸cão relativa entre as câmeras utilizando-se

apenas um par de imagens de uma mesma cena vista pelas duas.

Algumas abordagens parecidas são vistas em (Voigtländer et al., 2007) e (Zhu et al., 2000). Em (Voigtländer et al., 2007) um sistema omnidireci-onal e uma câmera perspectiva são usados conjun-tamente para detectar a bola durante um jogo de futebol de robôs. Entretanto, este sistema estéreo é fixo e montado em um único robô não permi-tindo sua reconfigura¸cão ou utiliza¸cão individual por diferentes robôs. Em (Zhu et al., 2000) dois robôs, equipados com câmeras PAL, formam um sistema estéreo móvel com o objetivo de rastrear seres humanos. A diferen¸ca está no fato do sis-tema estéreo não ser do tipo h´ıbrido, utilizando dois sistemas omnidirecionais.

O sistema de visão estéreo deste trabalho é o mesmo que o de (Roberti et al., 2008) e (Roberti et al., 2009). Contudo em (Roberti et al., 2008), a posi¸cão das câmeras era fornecida e, em (Roberti et al., 2009), existe um processo extra no qual o robô com o sistema omnidirecional deve buscar e estimar a posi¸cão do outro robô, e consequen-temente da outra câmera, antes de realizar a re-constru¸cão tridimensional. Diferentemente, neste trabalho, a posi¸cão relativa entre as câmeras é esti-mado diretamente das imagens sem a necessidade de nenhum processamento adicional.

O algoritmo de recupera¸cão da posi¸cão rela-tiva segue a proposta de (Ma et al., 2003), na qual são escolhidos pelo menos oito pontos correspon-dentes, entre duas imagens perspectivas, para esti-mar a rota¸cão e transla¸cão entre as câmeras. Po-rém, como no sistema de visão estéreo uma das imagens é omnidirecional, foi utilizado e

(2)

aprimo-rado o processo apresentado em (Junior, 2002) para retificar essa imagem, gerando uma imagem perspectiva virtual livre de distor¸cões. Vale tam-bém mencionar que a transla¸cão recuperada pela proposta de (Ma et al., 2003) ainda necessita de um fator de escala, que não é poss´ıvel recupe-rar apenas com a metodologia apresentada e, por-tanto, torna-se necessário realizar uma estimativa. Na Se¸cão 2, são apresentadas as caracter´ıs-ticas dos sistemas de visão utilizados para com-por o sistema de visão estéreo h´ıbrido, ou seja, os sistemas de visão perspectiva e omnidirecional, e o processo de retifica¸cão para gera¸cão de ima-gem perspectiva a partir de uma omnidirecional. O sistema de visão estéreo h´ıbrido e o processo de recupera¸cão da posi¸cão relativa entre as cˆ ame-ras são discutidos na Se¸cão 3. Na Se¸cão 4, são apresentados os resultados experimentais obtidos e, finalmente, na Se¸cão 5, estão as conclusões e os trabalhos futuros sugeridos.

2 Os Dois Sistemas de Vis˜ao

O sistema de visão estéreo utilizado nesse trabalho é uma combina¸cão de outros dois sistemas de vi-são: perspectiva e omnidirecional, cujos modelos de representa¸cão serão descritos a seguir.

2.1 Vis˜ao perspectiva

Conforme descrito em (Ma et al., 2003), um ponto P = [X, Y, Z]T terá como imagem o ponto p0 = [u, v]T, e ambos estarão relacionados pela Equa¸cão 1, que representa a proje¸cão perspectiva.

u v = f Z X Y (1)

Na proje¸cão perspectiva dada pela Equa¸cão 1, os pontos no espa¸co 3D estão no mesmo referencial da câmera. Além disso, a proje¸cão obtida está em pixels e, portanto, a distância focal f também deve estar em pixels.

2.2 Vis˜ao omnidirecional

O sistema de visão omnidirecional utilizado nesse trabalho é um sistema catadióptrico. Tipica-mente, este tipo de sistema de visão consiste em utilizar um espelho convexo fixo em frente à uma câmera que também permanece fixa. Algumas for-mas de espelho associadas a determinados tipos de lente fazem com que o sistema de visão resul-tante tenha um centro único de proje¸cão, o que permite a obten¸cão de imagens perspectivas livres de distor¸cões a partir da imagem omnidirecional (Baker and Nayar, 1999). As imagens perspecti-vas assim obtidas são equivalentes a imagens ad-quiridas por uma câmera perspectiva com o foco localizado no centro único de proje¸cão do sistema (Junior, 2002).

Nesse trabalho escolheu-se utilizar um sistema omnidirecional formado por um espelho hiperb´ o-lico fixo em frente à câmera perspectiva. O es-pelho hiperbólico possui a propriedade do centro ´

unico de proje¸c˜ao e pode ser definido pelo sistema de coordenadas centrado no ponto focal F0, como mostrado na Figura 1, pela Equa¸c˜ao 2.

y = s a2 1 +x 2 b2 −pa2_{+ b}2 ₍₂₎

Figura 1: Geometria do espelho e da cˆamera (Ju-nior, 2002).

Na Equa¸cão 2, a e b são parâmetros da hip´ er-bole, sendo sua excentricidade e =√a2_{+ b}2_{. Na}

Figura 1, h é a distância entre a borda do espelho e centro de proje¸cão da câmera, e rtopo o valor de

x quando y = ytopo, com ytopo = h − 2e que ´e a

coordenada y do topo do espelho.

2.3 Retifica¸c˜ao da imagem omnidirecional para gera¸c˜ao de imagem perspectiva

O espelho hiperbólico possui a propriedade do cen-tro único de proje¸cão. Portanto, pode-se definir um plano de proje¸cão perpendicular a qualquer reta que passe pelo foco da hipérbole e mapear os pixels da imagem omnidirecional adquirida. Con-forme explicado em (Junior, 2002), para definir esse plano de proje¸cão da câmera perspectiva vir-tual são necessários estabelecer três parâmetros, fp, θ0 e φ0, que podem ser vistos na Figura 2. O

parˆametro fprepresenta a distˆancia, em pixels, do

centro de proje¸cão F0ao plano definido, enquanto que θ0 e φ0 são os ângulos de dire¸cão azimutal e

de eleva¸c˜ao do plano, respectivamente.

Após a defini¸cão do plano, para gerar uma imagem perspectiva é necessário encontrar para cada pixel (up, vp) desta imagem, a dire¸cão (φ, θ)

de um raio que passa pelo foco da hip´erbole e pelo pixel (up, vp). Isso pode ser feito por meio de

(3)

Figura 2: Plano de proje¸c˜ao da cˆamera perspec-tiva virtual (Junior, 2002).

tan φ = fpsin φ0+ vpcos φ0 fpcos φ0− vpsin φ0

(3) tan θ =(fpcos φ0− vpsin φ0) sin θ0− upcos θ0

(fpcos φ0− vpsin φ0) cos θ0+ upsin θ0 (4)

A Equa¸cão 3 apresenta uma corre¸cão na re-la¸cão para tan φ proposta por (Junior, 2002), que não continha o termo −vpsin φ0no denominador.

Para o determinado raio (φ, θ), deve-se encon-trar o ponto (x, y) na superf´ıcie do espelho onde o raio é refletido. Isto pode ser feito resolvendo-se a Equa¸cão 2 para y = tan φ. Por fim, para o ponto (x, y) encontrado, o pixel (u, v) na ima-gem omnidirecional que corresponde ao raio de luz definido pelos ângulos de dire¸cão (φ, θ) pode ser encontrado usando as Equa¸cões 5 e 6, em que α = r_rptopo

topo e rptopo ´e a medida em pixel de rtopo

visto na imagem omnidirecional gerada (maiores detalhes deste processo em (Junior, 2002)).

u =x (2e + ytopo) α

(x· tan φ + 2e) cos θ (5)

v =x (2e + ytopo) α

(x· tan φ + 2e) sin θ (6)

3 Vis˜ao Est´ereo

O sistema de visão estéreo utilizado nesse tra-balho segue o modelo apresentado por (Roberti et al., 2008) e (Roberti et al., 2009), que é com-posto por duas câmeras, uma perspectiva e outra, que em conjunto com o espelho hiperbólico, ad-quire uma imagem omnidirecional. A Figura 3 exibe o esquema do sistema, assim como os refe-renciais adotados em cada uma das câmeras.

Na Figura 3, P = [X, Y, Z]T _´_{e um ponto visto}

pelas duas cˆameras, p0_p= [up, vp]T e p0o= [uo, vo]T

a proje¸c˜ao do ponto P em nas imagens perspectiva e omnidirecional, Op e Oo s˜ao os centros de cada

imagem, com fpe foos seus focos das cˆameras (em

pixel ), e o ponto Pm= [Xm, Ym, Zm]T ´e o ponto

Figura 3: Sistema de visão estéreo h´ıbrido e os referenciais das câmeras.

em que o raio incidente do ponto P , em dire¸cão ao centro único de proje¸cão, cruza a superf´ıcie do espelho hiperbólico. O centro único de proje¸cão se encontra no ponto F0 _{= [0, 0, 2e]}T _{no referencial}

da cˆamera omnidirecional.

O ponto P pode ser escrito no referencial da cˆamera perspectiva e da cˆamera omnidirecional, respectivamente, como Pp= [Xp, Yp, Zp]T e Po=

[Xo, Yo, Zo]T. Conhecendo-se a posi¸c˜ao relativa

entre essas câmeras, pode-se escrever a Equa¸cão 7, que é uma transforma¸cão de corpo-r´ıgido que relaciona o ponto P visto por elas.

Pp= RPo+ T , R =   r11 r12 r13 r21 r22 r23 r31 r32 r33   e T=   t1 t2 t3   (7) Partindo da Equa¸cão 7 e considerando as re-la¸cões de proje¸cão para as câmeras perspectiva e omnidirecional, encontra-se um sistema de linear composto pelas Equa¸cões 8, 9 e 10, com o qual é poss´ıvel determinar as profundidades Zo e Zp do

ponto P no referencial das duas cˆameras, al´em do fator γ que engloba caracter´ısticas construtivas do sistema omnidirecional. [r11uo+ r12vo] γ + r13Zo− up fp Zp= −t1 (8) [r21uo+ r22vo] γ + r23Zo− vp fp Zp= −t2 (9) [r31uo+ r32vo] γ + r33Zo− Zp= −t3 (10)

Para encontrar as demais coordenadas, basta utilizar as Equa¸c˜oes 11 e 12, e o fator γ obtido junto com as profundidades.

Xo= γ· uo e Yo= γ· vo (11) Xp= Zp fp · up e Yp= Zp fp · vp (12)

3.1 Algoritmo de recupera¸cão da posi¸cão relativa entre as câmeras

Como mencionado anteriormente, para recons-truir as profundidades deve-se conhecer a posi¸c˜ao

(4)

relativa entre as câmeras. Em (Ma et al., 2003), para encontrar a posi¸cão relativa entre duas cˆ ame-ras perspectivas, deve-se escolher pelo menos oito pontos correspondentes nas imagens de cada uma das câmeras. Nesse trabalho foi usada a mesma idéia. Contudo, por não se ter duas imagens em perspectiva, foi necessário retificar uma imagem omnidirecional para obter outra imagem perspec-tiva, como se fosse obtida por uma câmera virtual. Para um ponto P visto por duas câmeras pers-pectivas, as proje¸cões desse ponto (p1 e p2) no

plano da imagem das câmeras devem satisfazer a restri¸cão epipolar, dada pela Equa¸cão 13, em que E é a matriz Essencial.

p2TEp1= 0, E ∈ R3×3 (13)

Com um conjunto de oito pontos correspon-dente ou mais, pode-se aplicar a restri¸cão epipolar para cada um deles e obter um número suficiente de equa¸cões para recuperar os elementos da matriz E. O ideal seria encontrar E = U diag{σ, σ, 0}VT, mas, na realidade, a decomposi¸cão em valor singu-lar (SVD) da matriz E é encontrada como sendo E = U diag{σ1, σ2, σ3}VT , com σ16= σ2e σ36= 0.

Contudo, a proje¸c˜ao no espa¸co essencial pode ser obtida pela Equa¸c˜ao 14.

E = U ΣVT, em que Σ = diag{1, 1, 0} (14)

´

E importante mencionar que essa proje¸cão no espa¸co essencial implica em recuperar uma matriz de transla¸cão com norma unitária. Dessa forma, o valor de T recuperado dever ser multiplicado por um fator de escala λ para obter a transla¸cão real. Em (Ma et al., 2003), é mostrado que a ma-triz essencial encontrada pode ser decomposta em quatro pares de rota¸cões R e transla¸cões T . As Equa¸cões 15-18 exibem essas poss´ıveis solu¸cões, sendo que Rz(θ) denota uma rota¸cão em z de um

ˆ

angulo θ, e ˆT é a matriz anti-simétrica relativa a T . Apesar das quatro solu¸cões, apenas uma delas garante que, em ambas as câmeras, todas as pro-fundidades encontradas para os pontos 3D sejam positivas. Essa será a solu¸cão que representa a po-si¸cão relativa entre a câmera perspectiva real e a virtual, obtida a partir do sistema omnidirecional.

R = U Rz( π 2) T VT e ˆT = U Rz( π 2)ΣU T (15) R = U Rz( π 2) T VT e ˆT = U Rz(− π 2)ΣU T (16) R = U Rz( −π 2 ) T VT e ˆT = U Rz(− π 2)ΣU T (17) R = U Rz( −π 2 ) T VT e ˆT = U Rz( π 2)ΣU T (18)

3.1.1 Posi¸c˜ao relativa final

Obtida a posi¸cão entre as câmeras perspectivas real e virtual, falta agora encontrar a posi¸cão

re-lativa entre as câmeras do sistema de visão estéreo, ou seja, entre a câmera perspectiva real e a omni-direcional. Para isso, será necessário encontrar as matrizes de rota¸cão e transla¸cão que representem tal rela¸cão. Assim, seja um ponto P visto pelas câmeras perspectiva e omnidirecional relacionados pela equa¸cão 19, sendo Ppe Poo ponto nos

respec-tivos referenciais. As matrizes R e T representam a posi¸c˜ao relativa que deve ser recuperada.

Pp= R Po+ T (19)

Se Pv ´e o ponto P visto pela cˆamera virtual,

ele pode ser relacionado com a câmera perspectiva real pela Equa¸cão 20. Nessa equa¸cão, R0 e T0

são as matrizes de rota¸cão e transla¸cão obtidas pelo algoritmo de recupera¸cão da posi¸cão entre as câmeras perspectivas real e virtual.

Pp= R0Pv+ λT0 (20)

Por outro lado, as câmeras omnidirecional e virtual estão relacionadas pela Equa¸cão 21. As matrizes Rov e Tov são a rota¸cão e transla¸cão

en-tre o referencial da cˆamera omnidirecional e o re-ferencial da cˆamera perspectiva virtual.

Po= RovPv+ Tov (21)

Das Figuras 2 e 3 nota-se que Rov´e o produto

de uma rota¸c˜ao de 90o_{em x, seguida de uma}

rota-¸

c˜ao de φ0em z, e uma rota¸c˜ao em y de 90o mais

o ângulo θ0 escolhido. Além disso, a transla¸cão

Tov ´e simplesmente um deslocamento de 2e em z.

Assim, a rela¸cão entre as câmeras omnidirecional e virtual pode escrita como na Equa¸cão 22.

Po= Rx π 2 Rz(φ0) Ry π 2+ θ0 Pv+   0 0 2e   (22) Substituindo a Equa¸cão 22 na Equa¸cão 19, obtém-se outra forma de relacionar os pontos en-tre as câmeras perspectivas real e virtual, que está na Equa¸cão 23. Comparando esta equa¸cão com a Equa¸cão 20, pode-se relacionar R0 e T0 com as

matrizes de rota¸cão R e transla¸cão T , que devem ser recuperadas. O relacionamento entre essas ma-trizes está nas Equa¸cões 24 e 25.

Pp= R Rx π 2 Rz(φ0) Ry π 2 + θ0 Pv+ R   0 0 2e   + T (23) R0= R Rx _π 2 Rz(φ0) Ry _π 2 + θ0 (24) λT0= R   0 0 2e  + T (25)

(5)

Enfim, conhecendo-se R0 e T0, basta utilizar

as Equa¸cões 26 e 27 para obter a posi¸cão relativa entre as câmeras omnidirecional e perspectiva.

R = R0 Ry −π 2− θ0 Rz(−φ0) Rx −π 2 (26) T = λT0− R   0 0 2e   (27) 4 Resultados Experimentais

A fim de validar o modelo de reconstru¸cão das pro-fundidades, assim como a recupera¸cão automática das posi¸cões relativas das câmeras, tal sistema foi montado conforme a Figura 4.

Figura 4: Esquemático do sistema de visão estéreo utilizado para o experimento.

Vale mencionar que, para a realiza¸cão do ex-perimento, foi extra´ıdo um conjunto de pares de imagens perspectiva e omnidirecional, nas quais o objeto de interesse é uma caixa, cuja posi¸cão em rela¸cão à câmera perspectiva foi anotada para posterior análise. Os pontos correspondentes eram escolhidos manualmente, clicando-se diretamente nas imagens. As imagens utilizadas foram as mes-mas usadas no trabalho (Roberti et al., 2008) para efeito de compara¸cão.

4.1 Recupera¸c˜ao da posi¸c˜ao relativa entre as cˆ a-meras perspectivas real e virtual

O algoritmo de recupera¸c˜ao retorna a posi-¸

cão relativa entre as câmeras perspectiva real e virtual, conforme a Equa¸cão 20. Defi-nindo a matrizerro como sendo: matrizerro =

|matrizreal − matrizexp|, as matrizes R0erro e

T0erro se encontram nas Equa¸c˜oes 28 e 29 para

os erros referentes `a R0 e T0. R0erro=   0.0392 0.0315 0.0733 0.0138 0.0055 0.0342 0.0654 0.0371 0.0421   (28) T0erro =   0.0038 0.0126 0.0165   (29)

Pelas matrizes de erro obtidas, pode-se ob-servar que os valores experimentais e reais est˜ao

bem próximos e coerentes, o que indica que a po-si¸cão entre as câmeras perspectivas real e virtual foi recuperada com sucesso. Os pequenos desvios podem ser devidos à pequena resolu¸cão da ima-gem perspectiva virtual, uma vez que foi gerada de uma imagem omnidirecional, cuja caracter´ıs-tica é possuir uma menor resolu¸cão pois concen-tra maior quantidade de informa¸cão por pixel em rela¸cão à uma imagem perspectiva.

4.2 Recupera¸c˜ao posi¸c˜ao relativa entre as cˆ ame-ras perspectiva e omnidirecional

Obtida a posi¸cão das câmeras perspectivas real e virtual, pode-se recuperar a posi¸cão das câmeras do sistema de visão estéreo. Para encontrar os valores de Rexpe Texp, basta aplicar as Equa¸cões

24 e 25 aos valores de R0expT0exp. Contudo, ainda

não foi mencionado qual o valor de λ adotado. Conforme explicado na Se¸cão 3.1, projetar a matriz essencial no espa¸co das matrizes essenciais implica em recuperar uma transla¸cão de norma unitária. Bastaria apenas então multiplicá-la por um fator de escala adequado, mas não foi encon-trado um trabalho que explique a melhor forma de determinar esse fator. Para fins experimentais, decidiu-se seguir uma lógica apresentada em (Ma et al., 2003). Ao realizar o caminho inverso, ou seja, tendo-se a rota¸cão e a transla¸cão entre duas câmeras, quando decomposta em valor singular, a matriz essencial obtida pelo produto ˆT R apre-senta uma matriz S de valores singulares com dois termos não nulos iguais à ||T ||.

Experimentalmente, os dois termos não nulos da matriz S obtida não eram iguais, mas de valo-res numéricos próximos, o que representa um des-vio do valor ideal devido a ru´ıdos e imprecisões no processo experimental. Portanto, decidiu-se ado-tar a média geométrica entre eles como o valor de λ e as matrizes Rerro e Terro referentes à posi¸cão

relativa das câmeras perspectiva e omnidirecional são as apresentadas nas Equa¸cões 30 e 31.

Rerro=   0 0.0800 0.0300 0.0300 0.0200 0 0.0800 0 0.0200   (30) Terro=   16 1 6   (31)

Como pode ser notado, a matriz de rota¸cão para a posi¸cão relativa entre as câmeras do sistema de visão estéreo é obtida com qualidade, visto que os erros por elemento da matriz são muito peque-nos, ou até nulos em alguns casos. Porém, tam-bém pode ser observado que não foi encontrada uma transla¸cão com qualidade. Isso se deve prin-cipalmente ao fator de escala λ, que teve que ser estimado, aumentando a imprecisão nos resulta-dos. A melhora desta estimativa é um dos princi-pais focos de trabalhos futuros.

(6)

4.3 Reconstru¸c˜ao das coordenadas 3D

Posteriormente à recupera¸cão da posi¸cão relativa das câmeras, realizou-se a reconstru¸cão das coor-denadas 3D de um objeto de interesse em 12 pares de imagens. Nestas imagens, as posi¸cões das cˆ a-meras foram mantidas constantes e apenas o ob-jeto de interesse variou de localiza¸cão. Como po-si¸cão relativa entre as câmeras, utilizou-se a que foi recuperada experimentalmente.

Os resultados em rela¸cão ao referencial da cˆ a-mera perspectiva se encontram na Figura 5, onde se pode observar a posi¸cão real do ponto de in-teresse assinalada por um “X” e, por um c´ırculo, a posi¸cão encontrada pelo sistema de visão est´ e-reo. Nota-se uma boa precisão na determina¸cão das coordenadas, principalmente para pontos mais próximos da câmera.

Figura 5: Comparativo entre as reais posi¸c˜oes e as obtidas experimentalmente, expressas no refe-rencial da cˆamera perspectiva.

5 Considera¸c˜oes Finais

Nesse trabalho, utilizou-se um sistema de visão es-téreo h´ıbrido, composto de uma câmera omnidire-cional e uma câmera perspectiva, para reconstruir as coordenadas 3D de um ponto visto pelas duas câmeras. O arranjo com as duas câmeras permite combinar as qualidades de cada uma, o grande campo visual da omnidirecional e a boa resolu¸cão da perspectiva. Para reconstruir coordenadas 3D é preciso saber a posi¸cão relativa entre as câmeras. Nesse sentido, a grande contribui¸cão desse traba-lho é a recupera¸cão da posi¸cão relativa entre as câmeras do sistema de visão estéreo h´ıbrido, utili-zando apenas um par de imagens capturado pelas duas câmeras.

Os resultados obtidos mostram que a rota¸cão que relaciona essas câmeras foi recuperada com sucesso, visto que os erros calculados foram pr´ oxi-mos de zero. Por outro lado, a estimativa do fator de escala da transla¸cão não forneceu um resultado para o vetor de transla¸cão com tanta qualidade. Apesar disso, os resultados descritos sugerem que uma pesquisa na forma de recuperar esse fator de

escala pode ser um trabalho futuro com resultado promissor.

Com a posi¸cão relativa entre as câmeras recu-perada, o sistema foi testado para a reconstru¸cão 3D de pontos vistos nas duas imagens. Apesar da dificuldade devido à transla¸cão não ter sido recuperada com qualidade, os resultados obtidos foram satisfatórios. Enfim, o sistema de visão es-téreo, com a posi¸cão relativa recuperada pelo algo-ritmo proposto nesse trabalho, foi capaz de recons-truir as coordenadas 3D de pontos vistos simul-taneamente pelas câmeras omnidirecional e pers-pectiva. Dessa forma, pode-se pensar em acoplar cada uma das câmeras em robôs móveis distintos e assim obter um sistema de visão estéreo recon-figurável. Este sistema poderá então ser usado em uma tarefa cooperativa onde as propriedades de cada câmera será explorada separadamente ou conjuntamente. Por exemplo, o campo visual am-pliado da câmera omnidirecional é bastante con-veniente para navega¸cão enquanto a boa resolu¸cão da perspectiva facilita a deteçcão de detalhes do ambiente de trabalho, mas ainda assim as duas cˆ a-meras poderão ser utilizadas para a reconstru¸cão 3D de objetos de interesse sempre que necessário.

Referˆencias

Baker, S. and Nayar, S. K. (1999). A theory of single-viewpoint catadioptric image for-mation, Int. Journal of Computer Vision 35(2): 1–22.

Junior, V. G. (2002). Sistema de visão omnidire-cional aplicado no controle de robôs móveis, Master’s thesis, Escola Politécnica da Univer-sidade de São Paulo.

Ma, Y., Soatto, S., Kosecka, J. and Sastry, S. S. (2003). An Invitation to 3-D Vi-sion: From Imagens to Geometric Models, Springer-Verlag, LLC, New York.

Roberti, F., Toibero, J., Soria, C., Vassallo, R. F. and Carelli, R. (2009). Hybrid collaborative stereo vision system for mobile robots forma-tion navigaforma-tion, Internaforma-tional Symposium on Robotics - ISR2009 .

Roberti, F., Vassallo, R. F., Toibero, J. M. and Carelli, R. (2008). 3D position sensing with a hybrid stereo vision system, CBA2008 . Voigtl¨ander, A., Lange, S., Lauer, M. and

Ried-miller, M. (2007). Real-time 3d ball recogni-tion using perspective and catadioptric came-ras, European Conference on Mobile Robots . Zhu, Z., Rajasekar, K. D., Riseman, E. M. and Hanson, A. R. (2000). Panoramic virtual ste-reo vision of cooperative mobile robots for lo-calizing 3d moving objects, IEEE Workshop on Omnidirectional Vision pp. 29–36.