• Nenhum resultado encontrado

A influência da convergência no procedimento de rotulação

Nesta seção é avaliada a influência da convergência das imagens no processo proposto para a determinação das correspondências. Para isso são apresentados os resultados obtidos com o processamentos das imagem mostradas na Tabela 6.1, composto por pares com diferentes convergências.

Ao observar os dados usados na geração das imagens sintéticas, e apresentados na Tabela 6.1, pode-se notar que para os sete primeiros pares de imagens os ângulos ϕ (phi) são, em valor absoluto, crescentes, o que corresponde a ter convergências também crescentes. Deste modo, é possível avaliar o comportamento do algoritmo para diferentes situações. Considerou-se a convergência máxima da ordem de 30o, uma vez que para valores maiores o número de auto-oclusões, ou seja, a oclusão de partes de objetos da cena por objetos da própria cena, é maior.

A Figura 6.7 mostra o resultado do processamento do primeiro par (000e/000d), onde os eixos ópticos são paralelos, e portanto não convergentes. Como descrito anteriormente, para facilitar a verificação visual são sobrepostos sobre as imagens utilizadas os pontos marcados como correspondentes pelo algoritmo ( ), além dos pontos não rotulados ( ).

Figura 6.7 - Imagens do par 000e/000d com os pontos assinalados como correspondentes, e não correspondentes, sobrepostos.

Apesar da convergência ser nula neste par de imagens, pode-se perceber a influência da mudança do ponto de vista. Por exemplo, os dois pontos mais à esquerda, presentes na imagem da esquerda, não aparecem na imagem da direita. Este fato se deve ao enquadramento da imagem da direita. Além disso pode-se observar nesta imagem, e nos detalhes ampliados da Figura 6.8, que apesar da convergência ser nula, as relações base /

profundidade e base / dimensão dos objetos são suficientes para que a perspectiva seja modificada, o que afeta a distribuição dos pontos projetados nos planos imagem.

Figura 6.8 - Detalhes das imagens sintéticas 000e/000d, onde são mostrados os pontos marcados como correspondentes pelo algoritmo, bem com os pontos não selecionados como correspondentes.

Ao observar a Figura 6.8 pode-se notar que dos pontos mostrados, dois pares de pontos não foram rotulados e onze pares foram corretamente rotulados. Este resultado corresponde ao processamento usando o algoritmo proposto, sintetizado no fluxograma da Figura 4.3, no qual se obtém simultaneamente a OR e uma relação de pares de pontos correspondentes. Para as imagens 000e/000d o número total de pares rotulados foi 40. A quantidade de pontos rotulados pela etapa de matching sem as injunções epipolares foi de 28 pares, como pode-se ver na Figura 6.9.

Figura 6.9 - Resultado do processamento do par de imagens 000e/000d, sem a inclusão das injunções epipolares.

Este resultado indica que a inclusão da injunção epipolar via o volume do PM, junto com as demais métricas, proporcionou um aumento da ordem de 42,8% no número de

conjugadas. Na Figura 6.10 são mostradas cinco linhas epipolares conjugadas para o par de imagens 000e/000d.

Figura 6.10 - Linhas epipolares sobrepostas ao par 000e/000d.

Pode-se observar pelo par de imagens da Figura 6.10 que as linhas epipolares são paralelas entre si e horizontais, como é de se esperar no caso em que não se tem rotação e nem convergência.

Da mesma maneira que este par de imagens foi processado, todos os demais pares de imagens citados na Tabela 6.1 também foram, sendo realizada uma análise semelhante. Na seqüência desta seção são apresentados os resultados obtidos para apenas dois outros pares desta mesma série, sendo no final feita uma síntese dos resultados obtidos considerando todas as imagens sintéticas utilizadas.

No próximo par de imagens apresentado, 125e/125d, a convergência é da ordem de 25o. Na Figura 6.11 são apresentadas imagens no qual pode-se ver a distribuição de todos os pontos: os selecionados como correspondentes pelo algoritmo (pontos pretos) e os não selecionados (os demais).

a) b)

Figura 6.11 - Distribuição dos pontos marcados como correspondentes para o par 125e/125d. Em (a) são mostrados os pontos selecionados como correspondentes, sem a inclusão das injunções epipolares, e em (b) usando o algoritmo completo.

Ao comparar os pontos selecionados como correspondentes, a partir das Figuras 6.11a e 6.11b, pode-se notar o aumento do número de pares rotulados ao considerar o

algoritmo completo. Para este par o aumento no número de pontos rotulados foi de aproximadamente 55,5%. A próxima figura mostra as imagens deste par, com os pontos sobrepostos, bem como alguns detalhes ampliados das mesmas imagens.

a)

b)

Figura 6.12 - Resultado do processamento do par 125e/125d, com pontos assinalados como correspondentes pelo algoritmo no qual são incluídas as injunções epipolares (a). Em (b) são mostrados detalhes das mesmas imagens.

Na figura anterior pode-se notar os efeitos da mudança do ponto de vista e da convergência dos eixos ópticos, que provocam a oclusão de partes de alguns objetos da cena e consequentemente a oclusão de alguns pontos, o que dificulta a determinação da correspondência de modo automático. Independente destes fatos, 28 pares de pontos foram selecionados como correspondentes pelo algoritmo. Os parâmetros de OR foram recuperados, como mostram os gráficos da Figura 6.13.

a) b)

Como mencionado anteriormente, apesar do processamento da OR ser feito usando quatérnios, os ângulos mostrados no gráfico (Figura 6.13a) são, por conveniência, expressos usando a representação na forma de ângulos de EULER. Pode-se ver a partir do primeiro gráfico que o ângulo phi entre as imagens é de aproximadamente 25o, como esperado. Ao observar as componentes da base (em 6.13b), pode-se verificar que a componente bx (delta x) assume o valor 1, conforme a injunção aplicada. A componente by assume o valor próximo a zero e bz um valor negativo. Ao observar os valores da Tabela 6.1 verifica-se que não existe correspondência entre os componentes de base desta tabela com os mostrados na Figura 6.13. Isto se deve ao fato de que os referenciais não são os mesmos, uma vez que o resultado da OR é obtido no referencial associado à primeira imagem, que é a imagem da esquerda, enquanto que os valores da Tabela 6.1 estão no referencial do espaço objeto.

A Figura 6.14 apresenta, de forma esquemática, duas câmaras numa situação análoga à mostrada na Figura 6.12, sendo mostrados os componentes do vetor base no referencial da imagem da esquerda. xe ye ze xd yd zd base Plano imagem (vista de topo) bz Prolongamento do plano definido por xeye. bx

Figura 6.14 - Sistema Cartesiano com origem no CP da esquerda e as componentes de base bx e bz, para o caso de câmaras convergentes. A componente by não é mostrada, uma vez que é feita a vista de topo.

A partir da figura anterior pode-se constatar que a componente bz deve ser negativa, devido ao sentido de contagem adotado para o eixo ze. Deste modo, o sinal da componente z obtido pelo processamento, está coerente com o esperado. A verificação da magnitude

pode ser feita de modo analítico (bz= bxtanϕe), considerando o ângulo ϕe obtido da Tabela 6.1, para o par 125e/125d, e o valor de bx.

Um outro resultado da OR automática é a matriz Fundamental, útil na obtenção das linhas epipolares conjugadas, como pode-se ver na Figura 6.15 para o caso deste par.

Figura 6.15 - Cinco pares de linhas epipolares conjugadas sobrepostas ao par de imagens 125e/125d.

Apesar do efeito de aliasing presente nas imagens, da convergência entre os eixos ópticos e da oclusão de algumas faces, as linhas epipolares homólogas, calculadas em função da matriz fundamental, estão coerentes com a disposição e orientação das câmaras, passando por pontos homólogos.

O próximo par de imagens mostrado (rote/rotd), apresenta uma convergência de 5º, e além disso, o eixo z da câmara da direita apresenta uma rotação de 50º. A Figura 6.16 mostra o resultado do processamento deste par, sem considerar as injunções epipolares e considerando o processamento completo, no qual são incluídas as injunções epipolares e a simultânea determinação da OR.

a)

b)

Figura 6.16 - Resultado da rotulação sem as injunções epipolares (a) e com as injunções epipolares (b), para o par de imagens rote/rotd, no qual se tem uma convergência de 5o (phi=5o) e uma rotação de 50o (kappa=50o).

Apesar da acentuada rotação em torno do eixo óptico, o algoritmo encontrou vários pares de pontos correspondentes. Para estas duas imagens, o número de pares rotulados obtidos ao aplicar o algoritmo sem incluir as injunções epipolares foi de 23, e o número de pares rotulados considerando o algoritmo completo, foi de 45, que corresponde a um aumento de 95,6% no número de pares rotulados.

Na Figura 6.17 são mostradas duas regiões ampliadas, destes mesmo par, no qual podem ser verificados os pares de pontos correspondentes, obtidos de modo automático.

Figura 6.17 - Detalhes das imagens mostradas na Figura 6.16, nos quais podem ser vistos os pontos marcados automaticamente como correspondentes.

Pela Figura 6.17 pode-se observar que todos os pontos selecionados como correspondentes pelo algoritmo estão corretos. Na Figura 6.18 são mostradas as linhas epipolares conjugadas obtidas a partir da matriz Fundamental, determinada de modo automático.

Figura 6.18 - Linhas epipolares sobrepostas ao par de imagens rote/rotd.

A partir dos processamentos realizados com os oito pares de imagens sintéticas, foi possível avaliar o comportamento do algoritmo para diferentes situações. O número de pares rotulados, obtidos tanto pelo algoritmo de matching sem injunções epipolares (sem IE), quanto pelo algoritmo considerando as injunções epipolares e a determinação da OR (com IE/OR), permitiu a construção do gráfico mostrado na Figura 6.19.

Figura 6.19 - Número de pares rotulados nos experimentos com imagens sintéticas. Os pontos ligados por segmentos de reta correspondem às imagens sem rotação do eixo óptico e se referem aos sete primeiros pares de imagens mostrados na Tabela 6.1, que estão sujeitos apenas a convergência.

Pode-se ver que o número de pares correspondentes é maior quando se consideram as injunções epipolares, e as demais métricas, com a simultânea obtenção da correspondência. Embora não se tenha um comportamento linear na relação convergência × número de pontos rotulados, pode-se observar que, para a maior parte dos casos, o número de pontos correspondentes diminui com o aumento da convergência. Para evidenciar este fato, ajustou-se uma função linear aos pontos mostrados na Figura 6.19 (menos aqueles que se referem ao par rote/rotd) obtendo-se o resultado mostrado na Figura 6.20.

Figura 6.20 - Comportamento das variáveis: número de pontos correspondentes × convergência, para os processamentos "sem IE" e "com IE/OR" para um conjunto de 7 pares de imagens sintéticas.

A partir das inclinações das retas na Figura 6.20 pode-se notar, de modo mais evidente, a observação anterior, de que o número de pontos selecionados como correspondentes diminui com o aumento da convergência.

Através da análise dos resultados obtidos nesta seção pode-se notar que os valores dos parâmetros de OR são coerentes com o mostrado na Tabela 6.1, excluídos os problemas causados pelo uso de diferentes referenciais e das diferenças de escala. Na maioria das vezes os resultados dos parâmetros de OR não são exatamente os mesmos, e dentre as prováveis razões pode-se considerar:

• a resolução geométrica das imagens geradas, na resolução 320x240, no qual pode- se observar nitidamente o efeito de aliasing;

• a não utilização de métodos de extração com acurácia da ordem de sub pixel;

• a dificuldade de selecionar os pontos de interesse nas imagens digitais;

• as simplificações no modelo estocástico utilizado na OR (ver Seção 5.1.4.1).

É importante ressaltar que nos processamentos realizados com as imagens sintéticas, os parâmetros iniciais definidos no arquivo MTUNIX.PAR foram os mesmos em todos os experimentos apresentados desta seção. Para a descrição dos parâmetros definidos no arquivo MTUNIX.PAR deve-se consultar o Quadro A.1. Quanto aos parâmetros necessários ao processamento onde são consideradas as injunções epipolares, definidos em PM.PAR, alguns sofreram modificações, como apresentado na Tabela B.1 do Apêndice B.

De acordo com alguns autores, o problema de correspondência é malcondicionado, como discutido na revisão bibliográfica. Ao realizar o processamento das imagens, com os mesmos parâmetros, pôde-se observar e constatar o aspecto de malcondicionamento, uma vez que em algumas situações os parâmetros que propiciam um bom resultado para um determinado par de imagens não fornece bons resultados para outro par, considerando que "bom resultado" se refere ao número de pares corretamente rotulados. Neste caso, pode-se supor a adoção de parâmetros diferenciados para classes de imagens

relaxação e OR. Por sua vez, a dimensão das matrizes de similaridade e compatibilidade, é função do número de pontos extraídos em cada uma das imagens, ou seja, dependem das dimensões dos conjuntos M e N. Apenas para que se tenha uma referência, o tempo de processamento do par composto pelas imagens 150e/150d é da ordem de 34 segundos, considerando um computador pessoal IBM PC com processador Pentium-S de 133Mhz e 32Mbytes de memória RAM. Deste modo, pode-se portanto admitir que o tempo de processamento não é um fator limitante. Por outro lado, a falta de robustez devido ao fato deste problema ser malcondicionado, é um fator que merece cuidados, como destacado em outros trabalhos, como por exemplo em Nogueira & Tozzi (2002).