M´etricas de Qualidade de Uma Matriz Fundamental

C.10 Mapas de Disparidades Obtidos: Cena 10

3.3 M´etricas de Qualidade de Uma Matriz Fundamental

da intensidade do brilho dos pixels presentes nesta. Ele utiliza limiares de diferentes valo- res para a determinação de cantos de diferentes regiões da imagem, e é capaz de detectar regiões de bordas com grande variação de intensidade.

• Speeded-Up Robust Features (SURF): é um dos mais conhecidos algoritmos, desenvol- vido por Bay et al. (2008). É inspirado no algoritmo SIFT, porém apresenta tempo de processamento inferior. Os cantos são detectados utilizando-se uma aproximação inteira do determinante de um detector Hessiano, que pode ser calculado por meio de operações inteiras, utilizando-se uma imagem integrante pré-computada. A orientação deles é ob- tida por meio da transformada de Haar (Haar Wavelets), e os descritores são formados a partir de pulsos dos pontos ao redor dos pontos-chave.

• Binary Robust Invariant Scalable Keypoints (BRISK): proposto por Leutenegger, Chli e Siegwart (2011), baseia-se no algoritmo FAST. Inicialmente, tal método calcula as variações de luminosidade até um limiar dado, identificando poss´ıveis candidatos a cantos; em seguida, é reaplicado às áreas detectadas para extrair-se mais informações sobre os candidatos iniciais. É capaz de evitar a perda de informação sobre a luminosidade da imagem, de modo a garantir que os pontos resultantes desse processo sejam coerentes localmente (na sua vizinhança).

3.3 M´etricas de Qualidade de Uma Matriz Fundamental

Uma vez que os pontos que representam cantos em uma cena foram obtidos e correspondi- dos, é poss´ıvel a partir deles encontrar uma forma geral para se mapear qualquer ponto de uma imagem ao seu correspondente presente na outra imagem. Porém, é comum que, após o cálculo das correspondências iniciais entre pontos, algumas dessas tenham sido calculadas incorreta- mente. Isso pode ser representado pela Figura 3.2, onde as correspondências incorretas entre cantos são representadas pelas linhas vermelhas.

A fim de se permitir o mapeamento eficiente entre quaisquer pontos correspondentes em uma cena – e, de quebra, remover correspondências incorretas – costuma-se utilizar a matriz fundamental (ABDEL-AZIZ; KARARA, 1971), que foi descrita inicialmente pela Equação 2.8 apresentada no Cap´ıtulo 2. Ela pode ser definida como sendo a matriz capaz de expressar uma relação entre os pontos de ambas as imagens de um sistema estéreo.

A função da matriz fundamental dentro do contexto de correspondência pode ser interpre- tada de maneira intuitiva por meio de uma representação gráfica. Seja um plano cartesiano

3.3 M´etricas de Qualidade de Uma Matriz Fundamental 40

Figura 3.2: Correspondˆencias incorretas (representadas em vermelho) entre os cantos de um par de imagens est´ereo, que podem ser removidas com o aux´ılio da matriz fundamental.

eixo V contém todos os pontos da outra imagem do par. Da´ı, certo número de correspondências entre os pontos de U e V podem ser escolhidas aleatoriamente, para serem representadas no plano cartesiano. O objetivo da matriz fundamental é fornecer os parâmetros lineares que sejam capazes de aproximar a posição de tais correspondências com uma curva, para qualquer ponto existente no conjunto U ou V , como mostra a Figura 3.3:

Figura 3.3: Graficamente, o objetivo da matriz fundamental é aproximar a relação entre pontos em um par de imagens estéreo com uma curva.

Todos os modelos existentes na literatura para a obtenção de uma matriz fundamental se baseiam em encontrar uma matriz “ótima”, capaz de fornecer da maneira mais próxima poss´ıvel a localização de pares de pontos correspondentes presentes em um par de imagens estéreo.

Inicialmente, para o cálculo da matriz fundamental, é necessário definir a forma como a distância entre um par de pontos correspondentes e a curva linear que a matriz fundamental define será quantificada. Na literatura, costuma-se escolher entre dois tipos de fórmulas para tal cálculo: a distância algébrica comum, ou a distância de Sampson. Considerando-se um par

3.3 M´etricas de Qualidade de Uma Matriz Fundamental 41

de pontos correspondentes(ui, vi), ambos na forma [xi yi 1], e uma matriz fundamental F, a

distância algébrica entre eles pode ser obtida pela Equação 3.1:

d(ui, vi) = (vi· F · uTi )2 (3.1)

enquanto a distância de Sampson (SAMPSON, 1982) pode ser expressa pela Equação 3.2:

d(ui, vi) = (vi· F · uTi )2 1 (F · uT i )21+ (F · uTi )22 + 1 (vi· F)2₁+ (vi· F)2₂ (3.2)

onde i ´e o ´ındice dos pontos correspondentes, e(F · uT

i )2j ´e o quadrado do elemento na entrada

jdo vetor F× uT

i. Da´ı, escolhida a m´etrica de distˆancia entre pontos correspondentes e a curva

linear, a matriz fundamental pode ser computada, de modo geral, da seguinte maneira:

1. Inicializa-se a matriz fundamental F como uma matriz 3× 3, nula;

2. Escolhe-se oito pares de pontos correspondentes aleatórios, e a partir deles se estima uma nova matriz fundamental F′, utilizando um algoritmo de aproximação linear (HARLEY; ZISSERMAN, 2004);

3. Calcula-se a taxa de eficiência para F′: se esta for melhor que a taxa de eficiência de F, a matriz F é substitu´ıda por F′;

4. Repetem-se os passos 2 e 3, quantas vezes forem desejadas.

A taxa de eficiência de uma matriz fundamental, citada no passo 3, serve para indicar o quanto uma matriz fundamental consegue aproximar corretamente a correspondência entre pares de pontos. Existem várias expressões matemáticas que podem calcular a taxa de eficiência de uma matriz, em relação ao conjunto de pontos correspondentes entre um par de imagens, e as principais são:

• Random Sample Consensus (RANSAC): apresentada por Fischler e Bolles (1981), onde a taxa de eficiˆencia ´e dada por:

RANSAC(F) = N

∑

i=1 sgn(d(ui, vi),t) N (3.3) onde:

3.3 M´etricas de Qualidade de Uma Matriz Fundamental 42 sgn(a, b) =    1, se a ≤ b 0, caso contr´ario (3.4)

de modo que o limiar t existente neste método permite definir um limite máximo para a distância entre o par de pontos correspondentes e a aproximação linear definida pela matriz F. Quanto maior o valor obtido pela somatória, melhor a eficiência da matriz fundamental.

• Least Median of Squares (LMedS): desenvolvida por Rousseeuw (1984), em que a taxa de eficiência é dada simplesmente pela mediana das distâncias entre os pontos correspondentes das imagens, ou seja, da forma mostrada na Equação 3.5:

LMedS(F) = mediana[d(u, v)] (3.5) sendo que quanto menor o valor dessa mediana, melhor a eficiência de uma matriz fundamental. Em geral, devido a este fator, tal método é eficiente quando sabe-se inicialmente que mais da metade das correspondências entre pares de pontos presentes em uma cena são corretas.

• Least Trimmed of Squares (LTS): também desenvolvida por Rousseeuw (1984), onde a taxa de eficiência é dada por:

LT S(F) =

_∑

i∈Ω

d(ui, vi) (3.6)

onde Ω é o primeiro valor que for menor que o valor anterior, em um conjunto de q· N pa- res de pontos, com q sendo a porcentagem de correspondências verdadeiras previamente conhecida. Quanto menor o valor obtido pela somatória, melhor a eficiência da matriz fundamental.

• M-estimator Sample Consensus (MSAC): apresentada por Torr e Murray (1997), é uma variação do método RANSAC, onde a taxa de eficiência é dada por:

MSAC(F) =

∑

i=1

min(d(ui, vi),t) (3.7)

onde t também é um limiar que permite definir um limite máximo para a distância entre o par de pontos correspondentes e a aproximação linear definida pela matriz F. No entanto,

No documento UNIVERSIDADE FEDERAL DE S ˜ (páginas 41-45)