C.10 Mapas de Disparidades Obtidos: Cena 10
3.3 M´etricas de Qualidade de Uma Matriz Fundamental
da intensidade do brilho dos pixels presentes nesta. Ele utiliza limiares de diferentes valo- res para a determinac¸˜ao de cantos de diferentes regi˜oes da imagem, e ´e capaz de detectar regi˜oes de bordas com grande variac¸˜ao de intensidade.
• Speeded-Up Robust Features (SURF): ´e um dos mais conhecidos algoritmos, desenvol- vido por Bay et al. (2008). ´E inspirado no algoritmo SIFT, por´em apresenta tempo de processamento inferior. Os cantos s˜ao detectados utilizando-se uma aproximac¸˜ao inteira do determinante de um detector Hessiano, que pode ser calculado por meio de operac¸˜oes inteiras, utilizando-se uma imagem integrante pr´e-computada. A orientac¸˜ao deles ´e ob- tida por meio da transformada de Haar (Haar Wavelets), e os descritores s˜ao formados a partir de pulsos dos pontos ao redor dos pontos-chave.
• Binary Robust Invariant Scalable Keypoints (BRISK): proposto por Leutenegger, Chli e Siegwart (2011), baseia-se no algoritmo FAST. Inicialmente, tal m´etodo calcula as variac¸˜oes de luminosidade at´e um limiar dado, identificando poss´ıveis candidatos a can- tos; em seguida, ´e reaplicado `as ´areas detectadas para extrair-se mais informac¸˜oes sobre os candidatos iniciais. ´E capaz de evitar a perda de informac¸˜ao sobre a luminosidade da imagem, de modo a garantir que os pontos resultantes desse processo sejam coerentes localmente (na sua vizinhanc¸a).
3.3
M´etricas de Qualidade de Uma Matriz Fundamental
Uma vez que os pontos que representam cantos em uma cena foram obtidos e correspondi- dos, ´e poss´ıvel a partir deles encontrar uma forma geral para se mapear qualquer ponto de uma imagem ao seu correspondente presente na outra imagem. Por´em, ´e comum que, ap´os o c´alculo das correspondˆencias iniciais entre pontos, algumas dessas tenham sido calculadas incorreta- mente. Isso pode ser representado pela Figura 3.2, onde as correspondˆencias incorretas entre cantos s˜ao representadas pelas linhas vermelhas.
A fim de se permitir o mapeamento eficiente entre quaisquer pontos correspondentes em uma cena – e, de quebra, remover correspondˆencias incorretas – costuma-se utilizar a ma- triz fundamental (ABDEL-AZIZ; KARARA, 1971), que foi descrita inicialmente pela Equac¸˜ao 2.8 apresentada no Cap´ıtulo 2. Ela pode ser definida como sendo a matriz capaz de expressar uma relac¸˜ao entre os pontos de ambas as imagens de um sistema est´ereo.
A func¸˜ao da matriz fundamental dentro do contexto de correspondˆencia pode ser interpre- tada de maneira intuitiva por meio de uma representac¸˜ao gr´afica. Seja um plano cartesiano
3.3 M´etricas de Qualidade de Uma Matriz Fundamental 40
Figura 3.2: Correspondˆencias incorretas (representadas em vermelho) entre os cantos de um par de imagens est´ereo, que podem ser removidas com o aux´ılio da matriz fundamental.
eixo V cont´em todos os pontos da outra imagem do par. Da´ı, certo n´umero de correspondˆencias entre os pontos de U e V podem ser escolhidas aleatoriamente, para serem representadas no plano cartesiano. O objetivo da matriz fundamental ´e fornecer os parˆametros lineares que sejam capazes de aproximar a posic¸˜ao de tais correspondˆencias com uma curva, para qualquer ponto existente no conjunto U ou V , como mostra a Figura 3.3:
Figura 3.3: Graficamente, o objetivo da matriz fundamental ´e aproximar a relac¸˜ao entre pontos em um par de imagens est´ereo com uma curva.
Todos os modelos existentes na literatura para a obtenc¸˜ao de uma matriz fundamental se baseiam em encontrar uma matriz “´otima”, capaz de fornecer da maneira mais pr´oxima poss´ıvel a localizac¸˜ao de pares de pontos correspondentes presentes em um par de imagens est´ereo.
Inicialmente, para o c´alculo da matriz fundamental, ´e necess´ario definir a forma como a distˆancia entre um par de pontos correspondentes e a curva linear que a matriz fundamental define ser´a quantificada. Na literatura, costuma-se escolher entre dois tipos de f´ormulas para tal c´alculo: a distˆancia alg´ebrica comum, ou a distˆancia de Sampson. Considerando-se um par
3.3 M´etricas de Qualidade de Uma Matriz Fundamental 41
de pontos correspondentes(ui, vi), ambos na forma [xi yi 1], e uma matriz fundamental F, a
distˆancia alg´ebrica entre eles pode ser obtida pela Equac¸˜ao 3.1:
d(ui, vi) = (vi· F · uTi )2 (3.1)
enquanto a distˆancia de Sampson (SAMPSON, 1982) pode ser expressa pela Equac¸˜ao 3.2:
d(ui, vi) = (vi· F · uTi )2 1 (F · uT i )21+ (F · uTi )22 + 1 (vi· F)21+ (vi· F)22 (3.2)
onde i ´e o ´ındice dos pontos correspondentes, e(F · uT
i )2j ´e o quadrado do elemento na entrada
jdo vetor F× uT
i. Da´ı, escolhida a m´etrica de distˆancia entre pontos correspondentes e a curva
linear, a matriz fundamental pode ser computada, de modo geral, da seguinte maneira:
1. Inicializa-se a matriz fundamental F como uma matriz 3× 3, nula;
2. Escolhe-se oito pares de pontos correspondentes aleat´orios, e a partir deles se estima uma nova matriz fundamental F′, utilizando um algoritmo de aproximac¸˜ao linear (HARLEY; ZISSERMAN, 2004);
3. Calcula-se a taxa de eficiˆencia para F′: se esta for melhor que a taxa de eficiˆencia de F, a matriz F ´e substitu´ıda por F′;
4. Repetem-se os passos 2 e 3, quantas vezes forem desejadas.
A taxa de eficiˆencia de uma matriz fundamental, citada no passo 3, serve para indicar o quanto uma matriz fundamental consegue aproximar corretamente a correspondˆencia entre pa- res de pontos. Existem v´arias express˜oes matem´aticas que podem calcular a taxa de eficiˆencia de uma matriz, em relac¸˜ao ao conjunto de pontos correspondentes entre um par de imagens, e as principais s˜ao:
• Random Sample Consensus (RANSAC): apresentada por Fischler e Bolles (1981), onde a taxa de eficiˆencia ´e dada por:
RANSAC(F) = N
∑
i=1 sgn(d(ui, vi),t) N (3.3) onde:3.3 M´etricas de Qualidade de Uma Matriz Fundamental 42 sgn(a, b) = 1, se a ≤ b 0, caso contr´ario (3.4)
de modo que o limiar t existente neste m´etodo permite definir um limite m´aximo para a distˆancia entre o par de pontos correspondentes e a aproximac¸˜ao linear definida pela matriz F. Quanto maior o valor obtido pela somat´oria, melhor a eficiˆencia da matriz fundamental.
• Least Median of Squares (LMedS): desenvolvida por Rousseeuw (1984), em que a taxa de eficiˆencia ´e dada simplesmente pela mediana das distˆancias entre os pontos correspon- dentes das imagens, ou seja, da forma mostrada na Equac¸˜ao 3.5:
LMedS(F) = mediana[d(u, v)] (3.5) sendo que quanto menor o valor dessa mediana, melhor a eficiˆencia de uma matriz funda- mental. Em geral, devido a este fator, tal m´etodo ´e eficiente quando sabe-se inicialmente que mais da metade das correspondˆencias entre pares de pontos presentes em uma cena s˜ao corretas.
• Least Trimmed of Squares (LTS): tamb´em desenvolvida por Rousseeuw (1984), onde a taxa de eficiˆencia ´e dada por:
LT S(F) =
∑
i∈Ω
d(ui, vi) (3.6)
onde Ω ´e o primeiro valor que for menor que o valor anterior, em um conjunto de q· N pa- res de pontos, com q sendo a porcentagem de correspondˆencias verdadeiras previamente conhecida. Quanto menor o valor obtido pela somat´oria, melhor a eficiˆencia da matriz fundamental.
• M-estimator Sample Consensus (MSAC): apresentada por Torr e Murray (1997), ´e uma variac¸˜ao do m´etodo RANSAC, onde a taxa de eficiˆencia ´e dada por:
MSAC(F) =
N
∑
i=1
min(d(ui, vi),t) (3.7)
onde t tamb´em ´e um limiar que permite definir um limite m´aximo para a distˆancia entre o par de pontos correspondentes e a aproximac¸˜ao linear definida pela matriz F. No entanto,