11111111111111123456357589ABC12356D85E9B5F56D85
111111111111E2E8297D356F962D336F56235
11111111111234536789AB3CD1ECB3C1FC43CC1288BBC1E558B11211
C38B31CB561 53C1!B336
"#B
89$8BC%&6 1'8 13C(8 1$57389C5C 1 378B)C5CBCB56 1 53C1 !B336
C38B3**1C3C1+,-.-1D1--/100-1
1B387C'6B1D126B(81,76533-438B7C%&6 1 587BC'66 1 * 1 73)8B3'C'8 1 7C'$C5 1 '8 1 C3C1
8737$761'816$7C%&6--89$8BC%&6 1 '8 1 3C(8- 1 -!B379739C 1 378B)C5CB- 1 :-;BC'3878
6BC53C'6- 1 "-437<93C 1 8$953'3CC- 1 =-8C(8 1 * 1 2C96 1 '8 1
'C'6--!A5381'81378B)C5615EC78A739C6-1118- 1,76533126B(8-188-173)8B3'C'81
7C'$C51'81C3C-18737$761'8116$7C%&6-1888-1>?7$56->?7$561813(5@D18C(81B87B38)C514A1378B)C51$5739C58
.C5C)BC*9BC)81813(5@15C8AD6B'6D1-8C(81B87B38)C5-11-1878B)C51!B37B8739-1
:-1E6BC538'1(BC'387-11"-1 $953'8C1'37C98-11=-18C(81'C7C4C8-11-1878B)C51CC5A31
5EC7B8C7396-FB8C1'8196987BC%&6D1.B698C8761'818C(8
>37$5C%&6D1E87B81813@93C1'C16$7C%&6
2C9C18GC3C'6BCD1.B63-14B-126B(81,76533158117E8!E.6
.B63-14B-1H95361.8'B33158117E8!E.6
.B63-14B-1I$1,B31>3(15F 117E8!E.6
4C7C1'C1'838CD1=000
.B6(BCC1'81.J*;BC'$C%&6D1E87BC'61813@93C1'C16$7C%&6
Universidade Estadualde Campinas
Re uperação de Imagens Multies ala Intervalar
Carlos Elias Arminio Zampieri
1
julho de2010
Ban a Examinadora:
•
Jorge Stol (Orientador)•
HélioPedriniInstituto de Computação- UNICAMP
•
Wu Shin TingFa uldade de Engenharia Elétri a e Computação- UNICAMP
•
Ri ardoda SilvaTorres (SuplenteInterno)Instituto de Computação- UNICAMP
•
LéoPini Magalhães(Suplente Externo)Fa uldade de Engenharia Elétri a e Computação- UNICAMP
1
Neste trabalhoapresentamos um método geral para bus a de imagem por onteúdo (BIPC,
CBIR)emgrandes oleçõesdeimagens,usandoestimaçãointervalarmulties aladedistân ia.
Consideramosespe i amentebus as por exemplo, emque oobjetivo é en ontrar aimagem
da oleção que é mais próxima a uma imagem dada, segundo alguma função de distân ia
de imagens. Neste trabalho não pro uramos desenvolver métri as que melhor atendem as
intençõesdousuário; emvez disso, supondo quea métri aestá es olhida, apresentamos um
algoritmo genéri o (que denominamos MuSIS, de Multis ale Image Sear h) para realizar a
bus ade maneirae ienteusandoaritméti aintervalar. Estimativasintervalaresdas
distân- ias entre imagenssão usadas para eliminarrapidamenteimagens andidatas, onsiderando
apenas versões reduzidas das mesmas, de maneirasemelhante ao paradigma de otimização
bran h-and-bound. Comopartedestetrabalho,desenvolvemosestimadoresintervalares
e a-zes para distân iaeu lidiana ealgumas variantes damesma,in luindométri assensíveisao
gradiente emes alasvariadas. Experimentosindi aramque ométodopromove signi ativa
redução de ustos em relação à bus a exaustiva. Apesar de menos e iente do que outros
métodos omumenteusadosparaBIPC, oalgoritmoMuSIS sempreretornaaresposta exata
istoé, a imagem mais próxima na métri a es olhida e não apenas uma aproximação.
A abordagemMuSIS é ompatível om uma ampla variedade de funções de distân ia, sem
We present a general method for ontent-based image retrieval (CBIR) in large image
ol-le tions, using multis ale interval distan e estimation. We onsider spe i ally queries by
example, where the goal is to nd the image in the olle tion that is losest to a given
image, a ording to some image distan e fun tion. In this work we do not aim to develop
metri s that best meet the user's intentions; instead, assuming that the metri is hosen,
we des ribe an algorithm (wi h we all MuSIS, for MultiS ale Image Sear h) to perform
the sear h e iently usingintervalarithmeti . Interval estimatesof the image distan es are
used toqui kly dis ard andidate images after examiningonly small versions of them, in a
manner similar to the bran h-and-bound optimization paradigm. As part of this work, we
developed ee tive interval estimators for the Eu lidean distan e and for some variations
of it, in luding metri s that are sensitive to the gradient at various s ales. Experiments
indi ate that the method yields signi ant ost savings over exhaustive sear h. Although
less e ient than other methods ommonly used for CBIR, the MuSIS algorithm always
returns the exa t answer that is, the nearest image inmetri hosen and not just an
approximation thereof. The MuSIS approa h is ompatible with a wide variety of distan e
Resumo v
Abstra t vi
1 Preliminares 1
1.1 Contextualização e Motivação . . . 1
1.2 Bus aMulties alaporExemplo . . . 2
1.3 Prin ípiosdoAlgoritmo . . . 2
1.4 Métri aspara Imagens . . . 3
1.5 Testes . . . 3
1.6 Publi ações . . . 3
2 Notações e Denições 4 2.1 Imagens ePixels . . . 4
2.2 Métri aspara Apli ação emImagens . . . 4
2.3 Espaçosde Cor . . . 5
2.3.1 Espaço RGB. . . 5
2.3.2 Espaço YUV . . . 5
2.3.3 Espaço Yuv . . . 6
2.4 Operações om Imagens . . . 6
2.5 Pirâmidede Imagens . . . 7
2.5.1 Blo os de Pixels . . . 7
2.5.2 Aritméti aIntervalar . . . 8
2.6 Métodos de Redução de Es ala . . . 9
2.6.1 ReduçãoIntervalar . . . 9
2.6.2 ReduçãoporMédia e Desvio Padrão . . . 10
3 Bus a Multies ala de Imagens 12 3.1 Estimadores de Distân ia. . . 12
3.2 Bus aIntervalar. . . 12
3.2.1 Corretude eTerminação . . . 14
3.2.4 Inuên iada FunçãoDis repân ia . . . 16
3.3 Extensão para Resultados Multiplos. . . 16
4 Distân ia Eu lidiana 17 4.1 Denição. . . 17
4.2 Imagens om Diferentes Domínios . . . 18
4.3 Estimativasda Distân iaEu lidiana. . . 19
4.3.1 EstimativaporRedução Intervalar . . . 19
4.3.2 EstimativaporMédia e Desvio Padrão . . . 20
5 Distân ia Eu lidiana Cumulativa 23 5.1 EstimaçãoIntervalarda Distân ia Cumulativa . . . 24
6 Distân ia de Gradiente 26 6.1 Formavs Cor naMétri a Eu lidiana . . . 26
6.2 Gradiente . . . 26
6.3 GradienteNormalizado . . . 28
6.4 Distân ia de GradienteNormalizado . . . 30
6.5 Usando GradienteNormalizadono MuSIS . . . 30
6.5.1 Gradientena Base Original, om Métri a Monoes ala . . . 30
6.5.2 Gradientena Base Original, om Métri a Cumulativa . . . 31
6.6 Gradienteem CadaNível daPirâmide . . . 33
7 Métri as para Imagens Coloridas 36 7.1 Distân ia Eu lidianaRGB . . . 36
7.2 Distân ia Eu lidianaYuv. . . 36
7.3 Distân ia de GradienteYuv . . . 37
7.4 OperadorCartoon . . . 38
7.5 Estimadores de Métri as para Imagens Coloridas. . . 39
8 Bases de Imagens 40 8.1 BasesAL . . . 41 8.2 Base C1 . . . 42 8.3 Base C2 . . . 43 8.4 Base CR . . . 45 8.5 Base FF . . . 46 8.6 Base JS . . . 47 9 Testes de Desempenho 49 9.1 Metodologiade Testes . . . 49
9.3 ComparandoEstimadores AI e
µσ
. . . 519.4 Métri a Normale Métri a de Gradiente . . . 51
9.5 Métri asMonoes ala versus Multies ala. . . 52
10 Con lusões e Trabalhos Futuros 54
5.1 Distân ias
d
daimagemA
emrelação aB
eC
dagura 5.1. . . 246.1 Termos da distân ia
dist
H∗
2
em ada es ala da pirâmide para as imagens dagura 6.10, om
β = 2
. Nesta tabelad
r
(G, H) = dist
2
(µG
(r)
, µH
(r)
)
e
analo-gamentepara
d
r
(G, K)
.. . . 326.2 Termos de
dist
⋆
em ada es alada pirâmide,para as imagens dagura 6.12,
om
β = 2
. Nesta tabela,d
r
(A, B) = dist
2
(δA
(r)
), δB
(r)
)
e analogamentepara
d
r
(A, C)
. . . 348.1 Asbasesusadasnos testes, omasdimensões, es alamáxima
m
, onúmerodeimagens
N
e aorigem. . . 409.1 Custorelativodabus aporumaamostragemdeimagensusandoasheurísti a
de es olha para ada base de imagens. . . 50
9.2 Comparação do desempenho do MuSIS om os dois tipos de estimadores:
intervalar(AI) emédia-desvio (
µσ
). . . 519.3 ComparaçãododesempenhodoMuSIS om amétri aeu lidiana
dist
2
, e ommétri asde gradientenormalizado
dist
H
2
e bus a força-bruta. . . 529.4 Comparação do desempenho do MuSIS om métri as monoes ala e
multies- ala umulativa omparâmetros
β = 1/2, 1
e2
emrelaçãoàforça-bruta(FB).Ex etonasduasultimaslinhas,osvaloressãoonúmero
p[k]
de ál ulosdedis-tân ia
dist
2
e/ou o númeroq[k]
de ál ulosde estimadoresdist
(k)
2
exe utados.(Note que
q[k]= 0
nonívelk = 0
e noalgoritmode forçabruta) . . . 529.5 Comparação do desempenho do MuSIS om métri as de gradiente
monoes- ala e multies ala umulativa om parâmetros
β = 1/2, 1
e2
em relação àforça-bruta (FB). Ex eto nas duas ultimas linhas, os valores são o número
p[k]
de ál ulos de distân iasdist
2
e/ou o númeroq[k]
de estimadoresdist
H
(k)
2
exe utados. (Noteque
q[k]= 0
nonívelk = 0
noalgoritmoforçabruta,epara2.1 Umaimageme seus anais de or (R,G, B). . . 5
2.2 Uma imagem
I
(esq.) e os níveisi = 3
ek = 5
da pirâmide de imagensI
,mostrando os onjuntos
D
(0:k)
[p]
eD
(i:k)
[p]
, para o pixelp
deI
(k)
. . . 82.3 Umaimagemmono romáti a (no alto),easversõesreduzidas
I
(1)
, I
(2)
. . . I
(m)
produzidas pelo pro esso de redução intervalar. Cada nível onsiste de uma
imageminferior
I
(k)
↓
(esq) euma imagem superior
I
(k)
↑
(dir). . . 10
2.4 Umaimagemmono romáti a,easversões reduzidasobtidasporredução
mé-diae desvio. Cada nível onsistede uma imagemde média
µI
(k)
(esq) e uma
imagemde desvio padrão
σI
(k)
(dir). . . 11
3.1 Duasiteraçõessu essivas doalgoritmoMuSIS. . . 13
4.1 Quatroimagens esuas respe tivasmás aras binárias. . . 18
4.2 Resultadodadistân iaeu lidianaapli adasobretrêsimagensmono romáti as
(ao alto) om domínios efetivos denidos por más aras (em baixo). Temos
dist
2
(A, B) = 0.166572 < dist
2
(A, C) = 0.216247
. . . 184.3 Três imagens
A, B
eC
usadas para exempli ar estimadores intervales dadistân ia
dist
2
. . . 204.4 Estimadoresdadistân iaeu lidiana
dist
(k)
2
(A
(k)
, B
(k)
)
edist
2
(A
(k)
, C
(k)
)
al u-lados emvárias es alas dapirâmide intervalarpelas fórmulas (4.2)(4.5). . . 21
4.5 Estimadores da distân ia eu lidiana
dist
(k)
2
(A
(k)
, B
(k)
)
edist
2
(A
(k)
, C
(k)
)
al- ulados em várias es alas das pirâmides reduzidas por média-desvio padrão,
pelas fórmulas (4.6)(4.9). . . 22
5.1 Três imagens mono romáti as. . . 24
6.1 Três imagens mono romáti as. Neste exemplo,
dist
2
(A, B) = 0.110640 <
dist
2
(A, C) = 0.433529
. . . 266.2 Umaimagem
I
(esq.) ea imagemgradiente|▽I|
orrespondente (dir.). . . . 276.3 Imagens-gradientedastrêsimagensdagura6.1. Nesteexemplo,
dist
▽
2
(A, B) =
0.165780 > dist
▽
2
(A, C) = 0.030366
. . . 276.4 Três imagens mono romáti as e suas imagens gradiente. Neste exemplo,
dist
▽
2
(A, B) = 0.092293 < dist
▽
|HI|
(dir.). . . 296.6 Umaimagemmono romáti a
I
(esq.) etrêsimagensdegradientenormalizadoH
I
om diferentes valores doparâmetroǫ
. . . 296.7 Resultadodaoperação
|H|
apli adaàsimagensdagura6.4. Temosdist
2
(|HA| , |HB|) =
0.091912 > dist
2
(|HA| , |HC|) = 0.015626
. . . 306.8 Pirâmideobtida apartir daredução dabase om imagens gradiente. . . 30
6.9 Resultadodaoperação
H
apli adasobretrêsimagensmono romáti as. Temosdist
2
(HA, HB) = 0.105913 < dist
2
(HA, HC) = 0.167085
. . . 316.10 Distân ia eu lidiana umulativa om gradiente normalizado apli ado à base original. Temos
dist
H∗
2
(A, B) = 0.079349 > dist
H∗
2
(A, C) = 0.059057
, om o parâmetroβ = 2
. . . 326.11 Pirâmideobtidaapartirdareduçãodabaseoriginal omgradiente
H
apli ado a ada nível. . . 336.12 Distân ia eu lidiana umulativa om o gradiente
H
apli ado a ada nível da pirâmide. Temosdist
⋆
(A, B) = 0.391287 > dist
⋆
(A, C) = 0.160042
, om o parâmetroβ = 2
. . . 347.1 Distân iaeu lidianadeimagens oloridasnoespaçoRGB.Temos
dist
2
(A, B) =
0.242803 > dist
2
(A, C) = 0.098406
. . . 377.2 Uma imagem olorida (esq.) e sua imagem gradiente olorida (dir.) obtida apli ando aoperação
H
a ada anal no espaçoRGB. . . 377.3 Umaimagem olorida (esq.) e oresultado dooperador artoon(dir.). . . 38
8.1 Algumas imagensdabase ALOI-VIEW. . . 41
8.2 Algumas imagensdabase ALNT02. . . 41
8.3 Algumas imagensdabase ALGT01 (mono romáti as). . . 42
8.4 Algumas imagensdabase ALGT01 ( oloridas). . . 42
8.5 Algumas imagensdabase Calte h-101. . . 42
8.6 Algumasimagens dabase C1NT01. . . 43
8.7 Algumasimagens dabase C1GT01 (mono romáti as). . . 43
8.8 Algumasimagens dabase C1GT01 ( oloridas). . . 43
8.9 Algumasimagens dabase Calte h-256. . . 44
8.10 Algumasimagens dabase C2NT01. . . 44
8.11 Algumasimagens dabase C2GT01 (mono romáti as). . . 44
8.12 Algumasimagens dabase C2GT01 ( oloridas). . . 44
8.13 Algumasimagens dabase Corel. . . 45
8.14 Algumasimagens dabase CRNT01. . . 45
8.15 Algumasimagens dabase CRGT01 (mono romáti as). . . 45
8.16 Algumasimagens dabase CRGT01 ( oloridas). . . 46
8.19 Algumasimagens dabase FFGT01 (mono romáti as). . . 47
8.20 Algumas imagensdabase FFGT01 ( oloridas). . . 47
8.21 Algumasimagens dabase JSNT01. . . 47
8.22 Algumasimagens dabase JSGT01 (mono romáti as). . . 47
Preliminares
1.1 Contextualização e Motivação
Este trabalho visa estudar métodos e té ni as omputa ionais para bus a ou re uperação
de imagens emgrandes ban os de imagens,em espe ial utilizandoa aritméti a intervalare
representações multies ala de imagens.
Repositóriosdeimagenssãoutilizadospelas maisdiversasáreas, omomedi ina, iên ias
da terra, jornalismo, arqueologia, biologia, marketing, segurança, et [16℄. Ban os om
entenas de milhares (ou milhões) de imagenssão ada vez mais omuns. Um exemplo é o
Earth Observing System da Nasa, que obtém terabytes de dados de imagens todos os dias
[11℄. Emtaisban os,alo alizaçãovisualde imagensde interesseéimpráti avele,portanto,
háuma grande ne essidade de métodos omputa ionais e ientes para bus ade imagens.
Imagens digitais podem ser obtidas de diversas fontes, omo âmeras digitais, aptura
de quadrosde vídeo, digitalizaçãode fotosedo umentosutilizando-ses anners (demesaou
de mão), et [18℄. Imagens também podem ser produzidas arti ialmente por té ni as de
omputação grá aou tipograadigital.
Há muitas maneiras de efetuar bus as emban os de dados de imagens.
Ossistemasde bus as por meta-dados são baseados emtextos asso iadosa adaimagem
(rótulos,legendas, palavras- have,et ). Grandes bus adores omo Google e Yahoo utilizam
variantes deste método, onde rótulos são extraídos de textos que a ompanham as imagens.
Esta abordagem, apesar de ser relativamentefá il de implementar, é inviável para grandes
oleções de imagens não rotuladas, pois a riação de rótulos adequados é extremamente
dispendiosa.
Uma alternativaà bus a por meta-dadosé a bus a de imagens por onteúdo (BIPC; em
inglês, ontent based image retrieval ou CBIR) [6, 7, 10, 19,8℄. Nesta abordagem, a bus a
utilizapropriedadesintrínse asdas imagens, omodistribuiçãode ores,forma,textura,et .
Por exemplo, ousuário espe i a ertas propriedadesdas imagensdesejadas, ea resposta é
uma lista ontendo asimagens quemelhor seenquadram nessas espe i ações.
exemplo, em que o objetivo é en ontrar a imagem da oleção que é mais próxima a uma
imagem-modelo dada, segundo alguma função de distân ia de imagens. Este on eito é
denido mais formalmenteno apítulo2.
1.2 Bus a Multies ala por Exemplo
Nesta dissertação, apresentamos um novo métodogeral para bus a em grandes oleções de
imagens. Nosso algoritmo,que denominamosMuSIS (de Multis ale Image Sear h) ombina
métodosmulties ala omaritméti a intervalar,e pode ser utilizado om diversas funçõesde
distân ia. O algoritmobási o está des ritono apítulo 3.
Ressaltamos que neste projeto (ao ontrário de muitos trabalhos desta área) o objetivo
não é desenvolver métri as que melhor reetem os desejos dos usuários,mas sima elerar a
bus a para uma métri a espe i ada. Portanto, os ritérios tradi ionais de avaliação para
algoritmos BIPC (pre isão, sensibilidade, a urá ia, et ) não se apli am; o úni o ritério
relevanteé o usto da bus a.
Aliás, observamos que asmétri as eu lidianas que,por simpli idadede exposição,
resol-vemosutilizarnostestessãosabidamentefrágeiseinadequadasparaamaioriadasapli ações
reais. Porém o algoritmobási o pode ser estendido para métri asmais sosti adas.
1.3 Prin ípios do Algoritmo
A té ni a geral de análise multiresolução ou multies ala baseia-se na de omposição dos
objetos emestudo (no aso, uma imagem)em várias amadas, ada uma ontendo detalhes
de tamanhos diferentes [15℄. No nosso trabalho, supomos que para ada imagem da base
é onstruída previamente uma pirâmidede imagens reduzidas em várias es alas. Este
pré-pro essamentoestá detalhado no apítulo2.
Nosso algoritmo omeça al ulandoadistân iaentre aimagemdadae adaumadas
ima-gensdabase,naes alamais reduzida. Oresultado desse ál uloéumaestimativaintervalar
paraasdistân iasexatas(naes alaoriginal)entre essasimagens. Asestimativasintervalares
são usadas para eliminar rapidamente imagens andidatas, de maneirasemelhanteao
para-digmadeotimizaçãobran h-and-bound [14℄. Quandone essário, asestimativasde distân ias
são re al uladas em es alas ada vez mais detalhadas, que permite eliminar mais imagens
até obtermos a imagemdesejada.
Nossos experimentos indi aram que o algoritmo MuSIS é muito mais e iente do que
a bus a exaustiva. Apesar de menos e iente do que outros métodos omumente usados
para este problema, nossa abordagem sempre retorna a resposta exata istoé, a imagem
da base que é mais próxima à imagem-exemplo na métri a es olhida e não apenas uma
aproximação damesma. A té ni a permite onsultas om uma ampla variedade de funções
1.4 Métri as para Imagens
Nos apítulos 4 a 7 des revemos a apli ação do algoritmo MuSIS para várias métri as de
omparaçãode imagens,derivadas damétri a eu lidiana.
No apítulo 5, em parti ular, des revemos o on eito de métri a multies ala,
espe ial-menteinteressanteparauso omoalgoritmoMuSIS,queéumamédiaponderadadosvalores
dadistân ia eu lidianaapli ada atodas ases alas de resolução.
No apítulo 6, onsideramos métri as que levam em onta os gradientes das imagens,
e não apenas seus valores. Para esse m introduzimos um operador espe ial, o gradiente
normalizado. Finalmente,no apítulo7des revemosextensõesdestasmétri asparaimagens
oloridas.
1.5 Testes
No apítulo 8, des revemos as bases de imagens utilizadas nos testes. No apítulo 9,
apre-sentamos testes quantitativos, om várias métri as e bases, que mostram seu desempenho
relativamenteà bus a exaustivae justi am algumases olhas feitas nodesenvolvimentodo
algoritmo.
1.6 Publi ações
Osresultados deste trabalhoforampubli ados em ongressos na ionaiseinterna ionais [23,
22,21℄. Aimplementação(emGnuC)estadisponívelemhttp://www.liv.i .uni amp.br /
~ eaz/sour e.htmleasbasesdetestesestãodisponíveisemhttp://www.liv.i .uni amp .
Notações e Denições
2.1 Imagens e Pixels
Neste trabalho, supomos que uma imagem
I
do ban o de imagens é representada por umafunção nita de um erto domínio
D ⊂ Z × Z
para um espaçoV
de ores om dimensãonita
c
. AssimovalordeI
emum pontop
dodomínio, hamadopixel e denotado porI[p]
,é uma listade
c
números,as amostras dopixel.Neste trabalho, geralmentesupomosque asamostrassão númerosreais quesão
apro-ximadas por números emponto utuante de pre isão limitadana memóriado omputador,
e quantizadas para uma pequena seleção de valores quando armazenadas em arquivos de
imagens.
Para simpli ar, vamos supor que todas as imagens na base têm o mesmo tamanho e
formato
n
x
× n
y
. Porsimpli idade, onsideramosprin ipalmentebasesde imagensmono ro-máti as;porém,osalgoritmosaquides ritos podemser fa ilmenteestendidosparatrabalhar
om imagens oloridas (veja apítulo7) ede diferentes tamanhos (veja seção4.2).
2.2 Métri as para Apli ação em Imagens
Neste trabalho, onsideramos um aso parti ular da bus a por onteúdo, a bus a por
simi-laridade. Nesta modalidade, é forne idauma imagem modelo, eo resultado dabus a são as
imagensda base mais semelhantes à mesma,segundo uma função distân iaqualquer.
Uma função distân ia para imagens é uma função
dist
que, para ada par de imagensA, B
atribuium númerorealdist(A, B)
quemedeadissimilaridadeentre elas. Afunçãodist
pode ser uma métri a ou função distân ia no sentido matemáti o do termo [9℄. Ou seja,
uma função que satisfaz asseguintes propriedades:
1.
dist(A, A) = 0
para qualquerA
3.
dist(A, B) = dist(B, A)
para quaisquerA, B
4.
dist(A, B) <= dist(A, C) + dist(C, B)
para quaisquerA, B, C
Nabus ade imagens,entretanto,nemtodas estaspropriedadessão ne essárias;para muitos
asos,basta que
dist(A, B)
sejatantomaiorquanto maisdis repantes foremasimagens,emalgumsentido. Nesse asoémais orreto hamar
dist
defunçãodis repân ia. Nestetrabalho,usaremos ostermosmétri a efunçãodistân ia omosinnimosde função dis repân ia.
2.3 Espaços de Cor
Nasimagensmono romáti as,oespaço
V
éo onjuntoR
dosnúmerosreais,istoé, adapixeltem apenas uma amostra. Nas imagens oloridas,
V
é geralmenteR
3
, isto é, ada pixel é
uma triplade valores, hamados anaisde or, adaum entre
0
e1
. Emgeral,umaimagemom
c
anais pode ser vista omoc
imagens mono romáti as. Vejaa gura 2.1.Imagem R G B
Figura2.1: Umaimagem e seus anais de or (R, G,B).
Nesta dissertação, quando não for espe í ado o ontrário, supõe-se que as imagens são
mono romáti as.
2.3.1 Espaço RGB
A representação de ores mais difundida é o espaço RGB, onde ada anal de or é a
in-tensidade luminosaem uma faixa espe í a do espe tro (R: vermelho, G: verde e B: azul).
Vamos supor que a intensidade de ada anal varia no intervalo [
0, 1
℄, sendo que1
repre-senta a intensidade máxima que pode ser reproduzida no monitor. Assim, porexemplo, no
espaço RGB
(0, 0, 0)
representa a or preta, e(1, 1, 1)
é o bran o mais luminoso que podeser mostrado natela.
2.3.2 Espaço YUV
Outroespaçode orutilizadoéoYUV [12,13℄,sendoY:luminân ia( larooues uro)eU,V:
e pro essamento de imagens. A onversão do espaço RGB para YUV é dada por uma
transformação linearde oordenadas, espe i amente
Y
U
V
=
0.2989
0.5866
0.1144
−0.14713 −0.28886
0.436
0.615
−0.51499 −0.10001
R
G
B
(2.1) A transformação inversa é
R
G
B
=
1
0
1.13983
1 −0.39465 −0.5806
1 −0.51499
0
Y
U
V
(2.2) 2.3.3 Espaço YuvOespaçoYuvéumatransformaçãonão-lineardoespaçoYUV,ondeos anaisde rominân ia
U, V são divididos pela luminân ia Y, de forma a torná-los independentes do ganho da
âmera e da intensidade da iluminação que in ide sobre os objetos das imagens. Neste
trabalhousamos asfórmulas
u = U
1 + δ
Y + δ
v = V
1 + δ
Y + δ
(2.3) A onversão inversa éU = u
Y + δ
1 + δ
V = v
Y + δ
1 + δ
(2.4)Oparâmetro
δ
éumvalorpequenousadoparaevitardivisãoporzero. Nestetrabalhousamosδ = 0.0001
.2.4 Operações om Imagens
Podemosdeniromáximo,omínimo,ovalormédio,ovalormédio quadráti o earaizmédia
quadrada de um onjunto
P ⊆ D
de pixelsde uma imagemI
, pelas fórmulasmax
P
I = max { I[p] : p ∈ P }
(2.5)min
P
I = min { I[p] : p ∈ P }
(2.6)avg
P
I =
1
#P
X
p∈P
I[p]
(2.7)msq
P
I =
1
#P
X
p∈P
(I[p])
2
(2.8)rms
P
I =
pmsq
P
I =
s
1
#P
X
p∈P
(I[p])
2
(2.9)onde
#P
é a ardinalidade deP
. Denimos também a variân iavar
P
I
e o desvio padrão(ou simplesmentedesvio)
dev
P
I
pelas fórmulasvar
P
I = msq
P
(I − avg
P
I)
(2.10)dev
P
I =
pvar
P
I = rms
P
(I − avg
P
I)
(2.11)Emtodas asoperações, omitiremoso subs rito
P
quando eleé odomínioD
daimagem.No asode imagens oloridas, onven ionaremosqueasfórmulas(2.52.9)são apli adas
a ada anal de or, separadamente, produzindo um resultado quetambéméuma or de
V
.2.5 Pirâmide de Imagens
Para adaimagem
I
,dene-seumapirâmidedeimagensI
(0)
, I
(1)
, . . . , I
(m)
,emque
I
(0)
éuma
imagem de mesmo tamanho que a imagem original
I
, e adaI
(k)
é uma imagem análoga a
I
(0)
,mas omdimensõesreduzidasporumfatorde1/2
k
em adadireção(portanto,umfator
de
1/4
k
em área).
Cada imagem
I
(k)
é um nível da pirâmide, e o índi e
k
é aes ala desse nível. A últimaes ala
m
éum parâmetro do algoritmo;geralmentem
é o menor inteiro tal queI
(m)
possui
umúni opixel(ouumaúni alinhaou oluna),ouentão omaiorvalorde
k
talque2
k
divide
n
x
en
y
. O espaço de valoresU
das imagensI
(k)
pode ser diferente do espaço de valores
V
daimagemoriginal
I
; porexemplo,V
pode ser oespaço de or visual(RGB),enquantoqueU
pode ser outro espaço de or (YUV, Yuv, et .) ou o resultado de outras transformaçõeslo ais da imagem, omo gradiente, variân ia, et . Estas possibilidades serão dis utidas na
seção 2.6.
2.5.1 Blo os de Pixels
Cadapixel
p
deumaversãoreduzidaI
(k)
daimagemé al uladoapartirdeum erto onjunto
D
(0:k)
[p]
de pixelsdeI
.Por exemplo, se o domínio das imagens é o quadrado
{0.. 2
m
− 1} × {0.. 2
m
− 1}
, ada blo oD
(0:k)
[p]
éum quadrado om2
k
× 2
k
pixelsde
D
. Veja a gura2.2. Espe i amenteD
(0:k)
[p] =
2
k
p + r : r ∈
0.. 2
k
− 1 × 0.. 2
k
− 1
(2.12)
Mas geralmente, para quaisquer es alas
i, k
omi < k
, e ada pixelp
deI
(k)
, denimos
oblo o
D
(i:k)
[p]
, omosendo omenor onjuntode pixelsdonível
i
quedependedos mesmospixelsda imagemoriginal queo pixel
I
(k)
[p]
. Isto é,tal que
D
(0:k)
[p] =
[
q∈D
(i:k)
[p]
No exemplo a ima,
D
(i:k)
[p]
é um blo o om
2
k−i
× 2
k−i
pixels dentro do quadrado
{0.. 2
m−i
− 1} × {0.. 2
m−i
− 1}
, espe i amente
D
(i:k)
[p] =
2
k−i
p + r : r ∈
0.. 2
k−i
− 1 × 0.. 2
k−i
− 1
(2.14)
I = I
(0)
I
(i)
I
(k)
Figura 2.2: Umaimagem
I
(esq.) e osníveisi = 3
ek = 5
da pirâmidede imagensI
, mostrando os onjuntosD
(0:k)
[p]
eD
(i:k)
[p]
, para o pixelp
deI
(k)
. 2.5.2 Aritméti a IntervalarA té ni a de aritméti a intervalar (AI) foi desenvolvida por R. Moore em 1960 [17℄ para
obter garantia de resultados em ál ulos om dados in ertos e/ou operações aproximadas.
A aritméti a intervalartem sido usada esporadi amenteempro essamento de imagens,por
exemplo, para aquantização de ores e inserçãode mar asd'água emimagens.
Um intervalo é um par de números
v
¯
= [¯
v↓, ¯
v↑]
que representam o onjunto de todosos valores reais
x
tal quev↓ ≤ x ≤ ¯
¯
v↑
. Sev↓ = v↑
, o intervalo é dito exato, e representao onjunto trivial (unitário)
{¯
v↓} = {¯
v↑}
. Sev↓ > ¯
¯
v↑
o intervalo é o onjunto vazio, queé denotado por
[ ]
. Os extremos de um intervalo podem ser innitos (−∞
ou+∞
); emparti ular, o intervalo
[−∞, +∞]
representa o onjunto de todos os números reais (nitos)R
.Mooreobservouquequalqueroperaçãoelementar
z ← f (x, y)
sobregrandezasordináriaspode ser substituída por uma operação sobre intervalos
¯
z
← f
∗
(¯x, ¯y)
, de tal forma que ointervalo al ulado
z
¯
garantidamente ontémoresultadoordinárioz
,paraquaisqueroperan-dos ordinários
x, y
ontidos nos intervalos¯
x
, ¯y
. Por exemplo, o mínimo, o máximo, a somae asubtração de dois intervalos
x = [¯
¯
x↓
_x↑]
¯
ey = [¯
¯
y↓
_y↑]
¯
são os intervalosmin(¯
x, ¯
y) = [min(¯
x↓, ¯
y↓)
_min(¯
x↑, ¯
y↑)]
max(¯
x, ¯
y) = [max(¯
x↓, ¯
y↓)
_max(¯
x↑, ¯
y↑)]
¯
x + ¯
y = [¯
x↓ + ¯
y↓
_x↑ + ¯
¯
y↑]
¯
x − ¯
y = [¯
x↓ − ¯
y↑
_x↑ − ¯
¯
y↓]
Oquadrado de um intervalo
x
¯
éum pou o mais ompli ado:¯
x
2
=
[(¯
x↓)
2
_(¯
x↑)
2
]
sex↓ ≥ 0,
¯
[(¯
x↑)
2
_(¯
x↓)
2
]
sex↑ ≤ 0,
¯
[0
_max((¯
x↓)
2
, (¯
x↑)
2
)]
aso ontrário. (2.16)No ál ulo destas fórmulas, deve-se tomar uidado para que erros de arredondamento e
aproximaçõessejamsemprenosentido de aumentara larguradointervalo;istoé,aumentar
o valorde
z↑
¯
e diminuirovalor dez↓
¯
.As operaçõeselementares daAI podem ser ombinadaspara realizar ál ulosmais
om-pli ados. Destamaneira,qualquerfórmulapodesersubstituídaporumaversãointervalarda
mesma,queproduzumintervaloquegarantidamente ontémoresultadodaformulaoriginal.
Uma operaçãoimportanteemAI é ajunção
¯
u
∨ ¯v
de dois intervalos¯
u, ¯v
, denida omosendo o menor intervalo que ontem
¯
u
ev
¯
ou seja,u ∨ ¯
¯
v = [min {¯
u↓, ¯
v↓} , max {¯
u↑, ¯
v↑}]
.Noteque
¯
u
∨¯v
éomesmoqueauniãode onjuntosu
∪v
somenteseumdosdoisintervaloéva-zio,ouseelestempelomenosumvalorem omum. Estaoperaçãoéasso iativaetemo
inter-valovazio
[ ]
omoumelementoneutro. Outraoperaçãoéainterseçãodedoisintervalos¯
u
∧¯v
que ésimplesmenteainterseção dos onjuntos, isto é,¯
u
∧ ¯v = [max {¯u↓, ¯v↓} , min {¯u↑, ¯v↑}]
.Notequeesta fórmulaproduzum intervalo
w
vazio ( omw↓ > w↑
)seosdois intervalosnãotem interseção.
2.6 Métodos de Redução de Es ala
Na abordagemdo trabalho, ada pixel das imagensem es ala reduzida
I
(k)
pode ser obtido
de várias maneiras. Apresentamos a seguir duas maneiras, a redução intervalar ea redução
por média e desvio. Outras maneirasde onstruir apirâmideserão dis utidasno apítulo6.
2.6.1 Redução Intervalar
Na redução intervalar, ada pixel
p
deI
(k)
é um intervalo
I
(k)
[p] = [I
(k)
[p]↓, I
(k)
[p]↑]
que
ontém osvalores dos pixelsdo blo o
D
(0:k)
[p]
da imagemI
. Isto é,I
(k)
[p]↓ = min
D
(0:k)
[p]
I
(2.17)I
(k)
[p]↑ = max
D
(0:k)
[p]
I
(2.18)Podemos,portanto,interpretar adanível
I
(k)
dapirâmide omumaimagemintervalar. Veja
agura2.3. Alternativamente,podemosver
I
(k)
omoumpar deimagens
I
(k)
↓
eI
(k)
↑
,ondeI
(k)
↓[p] = I
(k)
[p]↓
eI
(k)
↑[p] = I
(k)
[p]↑
. Observe queI
(0)
[p]↓ = I
(0)
[p]↑ = I[p]
. Portanto, as imagens reduzidas na es ala
0
nãoFigura 2.3: Uma imagem mono romáti a (no alto), e as versões reduzidas
I
(1)
, I
(2)
. . . I
(m)
produzidas pelo pro esso de redução intervalar. Cada nívelon-siste de uma imageminferior
I
(k)
↓
(esq) euma imagemsuperior
I
(k)
↑
(dir).
Cada imagem intervalar
I
(k)
pode ser obtida om relativamente pou o trabalho a partir
da imagem anterior
I
(k−1)
. Espe i amente, ada pixel
I
(k)
[p]
é a junção dos quatro pixels
intervalares
I
(k−1)
[q]
talque
q ∈ P
(k−1:k)
[p]
.
O usto total(em tempoe espaço)de al ulara pirâmideé então menor que
(1 + 1/4 +
1/4
2
+· · ·+1/4
m−1
) < 4/3 ≈ 1.333
vezeso ustode al ularonível
I
(1)
. Portanto,seaimagem
I
temn
pixels,o ustoéO(n)
. Umavez que adapixeldeI
(k)
onsistede doisvaloresde
V
,oespaçone essárioparaarmazenarapirâmidetodaé
1+2(1/4+1/4
2
+· · ·+1/4
m
) < 5/3 ≈ 1.67
vezes o espaçousado pela imagemoriginal.
2.6.2 Redução por Média e Desvio Padrão
Outra forma de onstruir a pirâmide é usar a redução por média e desvio padrão. Nesta
abordagem, ada pixel de
I
(k)
é o par onstituído da média
µI
(k)
[p]
e do desvio padrão
σI
(k)
[p]
dos pixelsdo blo o
D
(0:k)
[p]
da imagem
I
, ousejaµI
(k)
[p] = avg
D
(0:k)
[p]
I
(2.19)Veja a gura 2.4. Observe que
µI
(0)
[p] = I[p]
e
σI
(0)
[p] = 0
, portanto o nível
0
da pirâmidenão pre isa ser armazenado.
Figura2.4: Umaimagemmono romáti a, easversõesreduzidas obtidaspor
redu-ção médiaedesvio. Cadanível onsistedeumaimagemdemédia
µI
(k)
(esq) euma
imagemde desvio padrão
σI
(k)
(dir).
Assim omo na redução intervalar, a redução por média e desvio padrão pode ser feita
in rementalmente. Ou seja, o nível
I
(k)
pode ser al ulado a partir do nível
I
(k−1)
pelas
fórmulas
µI
(k)
[p] = avg
D
(0:k−1)
[p]µI
(k−1)
(2.21)
σI
(k)
[p] =
q
avg
D
(0:k−1)
[p](σI
(k−1)
) + var
D
(0:k−1)
[p](µI
(k−1)
)
(2.22)Assim, omonareduçãointervalar, oespaçoo upadoporestapirâmideé
1 + 2(1/4 + 1/4
2
+
· · · + 1/4
m
) < 5/3 ≈ 1.67
vezes o espaço o upado pela imagem original, e o usto total de
Bus a Multies ala de Imagens
Aidéiafundamentaldoalgoritmode bus a multies alaintervalar (que denominamosMuSIS
do inglês multis ale interval sear h) é utilizar estimadores intervalares da função de
dis re-pân ia para des artar imagens da base, sem pre isar examinar ou omparar as imagensna
es ala original.
3.1 Estimadores de Distân ia
Ométodogeral de bus a propostoexige o ál ulode estimativasdadis repân ia
dist(A, B)
entre duas imagensapartirde suasversõesreduzidas. Ou seja,para ada dis repân ia
dist
,pre isamosdeniruma famíliade estimadoresintervalares
dist
(k)
queoperamsobreimagens
reduzidas em ada es ala
k
.Um estimador intervalar
dist
(k)
re ebe duas imagens reduzidas
A
(k)
, B
(k)
na es ala
k
,e devolve um intervalo
dist
(k)
(A
(k)
, B
(k)
) = [dist
(k)
(A
(k)
, B
(k)
)↑, dist
(k)
(A
(k)
, B
(k)
)↓]
, tal que,
garantidamente,
dist(A, B) ∈ dist
(k)
(A
(k)
, B
(k)
)
.
Para simpli ar, es revemos
dist
(k)
(A, B)
emvez dedist
(k)
(A
(k)
, B
(k)
)
uma vez que o su-pers rito(k)
nasimagensreduzidasésempreigualaodoestimador. Entretanto,éimportante
observar que
dist
(k)
usa apenas o nível
k
das pirâmidesA
, B
(e possívelmente os níveissu-periores) e não as pirâmides inteiras. Nas seções 4.3 e 5.1 mostramos omo al ular estes
estimadores para várias funções de dis repân ia.
3.2 Bus a Intervalar
O algorítmo MuSIS mantém um onjunto
C
de andidatos que ontém a imagem resposta,ouseja, asimagens
B
∗
dabase que são mais próximasà imagemde onsulta
A
,emalgumamétri aarbitrária
dist
. O onjuntoéprogressivamentepodado,até sereduziraapenas umaimagem,que deve ser a resposta desejada
B
∗
.
Cada elemento do onjunto
C
é uma quádruplat = (t.B, t.B, t.k, t.d)
, ondet.B
é umes ala de resolução; e
t.d
é uma estimativa intervalar paradist(A, t.B)
, al ulada a partirdas versõesreduzidas
A
(k)
e
t.B
(k)
.
O algorítmomantém também um intervalo global
d
∗
talque
dist(A, B
∗
) ∈ d
∗
. Uma vez
que
dist(A, B
∗
) = min {dist(A, t.B) : t ∈ C}
então podemos tomard
∗
omo sendo omínimo
de todos osintervalos
t.d
emC
, ousejad
∗
↓ =
min { t.d↓ : t ∈ C }
d
∗
↑ =
min { t.d↑ : t ∈ C }
(3.1)A situação geral durante a bus a é ilustradana gura 3.1(topo). No eixo
x
está indi adaaposiçãodo andidatonala, enoeixo
y
aestimativaintervalart.d
dadistân ia. Cadabarrade erro indi a o intervalo estimado
t.d
para uma quádruplat
emC
. As linhas tra ejadashorizontaisindi am ointervalo
d
∗
. Neste exemplo,
d
∗
↑
ed
∗
↓
são determinadospelos limitesinferior e superior do andidato de número 0. A ada iteração, o algoritmo remove um
andidato
t
da lista, re al ulaa estimativa intervalard
′
= dist
(k−1)
(A, t.B)
para a próxima es alak
′
= t.k − 1
, e reinsere o andidato atualizado(t.B, t.B, k
′
, d
′
)
na lista, atualizandod
∗
de a ordo omd
′
. Apósesta atualização é geralmentepossível eliminarda lista
C
algunsandidatos que não podem ser aimagem desejada.
A gura 3.1(baixo)ilustra o resultado dessas operações. Nesta iteração o andidato 0 é
re al ulado e passou a ser o andidato
21
. O limiar inferiord
∗
↓
passou a ser denido pelonovo andidato
0
,eolimiarsuperiord
∗
↑
oureduzidoaodo andidatore al ulado21
. Estamudança em
d
∗
↑
permitiu ao algoritmo des artar mais de20%
dos andidatos da la, semnun a al ulara distân iaexata entre
A
e asrespe tivasimagenst.B
.0
0.2
0.4
0.6
0.8
1
0
10
20
30
40
50
60
70
80
90
100
110
0
0.2
0.4
0.6
0.8
1
0
10
20
30
40
50
60
70
80
90
100
110
A des rição detalhada do algoritmoé apresentada abaixo.
1. Seja
m
o nível máximo na pirâmidedeA
. Ini ialize o onjuntoC
om todas asquá-druplas
(B, B, m + 1, [0
_1])
tal queB
está na base. Ini ialized
∗
om o intervalo
[0
_1]
.2. Seja
(B, B, k, d)
um andidato om o mínimod↓
. Se é o úni o andidato, retorneB
omoarespostadabus a;epare. Caso ontrárioseja
(B
′
, B
′
, k
′
, d
′
)
um andidato om osegundo menord↓
. Sed↑ ≤ d
′
↓
, então retorneB
omoresposta da bus a;e pare.3. Es olha um andidato
t = (B, B, k, d)
deC
omk > 0
. Cal ule uma nova estimativaintervalar
d
′
= dist
(k−1)
(A, B)∩d
. Substituaaquádruplat
nalistaC
port
′
= (B, B, k −
1, d
′
)
. Atualize ointervalod
∗
,de a ordo om a denição (3.1).
4. Remova de
C
toda quádrupla(B, B, k, d)
ujo intervalod
está inteiramente a ima ded
∗
, ouseja, que tem
d↓ > d
∗
↑
. Repita a partirdo passo 2.Uma vez que o novo intervalo
d
′
= dist
(k−1)
(A, B) ∩ d
al ulado no passo 3 usa maisinformações(imagensmais detalhadas)que asusadas para al ular
d
,espera-se queelesejapelo menostão pre isoquanto
d
, ouseja,d
′
⊆ d
. Porém, dependendo de omo aestimativadist
(k−1)
é al ulada, istopode não ser sempre verdade.Neste aso, se ambos intervalos são orretos (ou seja, ambos ontêm a distân ia exata
dist(A, B)
), sua interseção é orreta também. O omandod
′
← dist
(k−1)
(A, B) ∩ d
asseguraque
d
′
↑ ≤ d↑
ed
′
↓ ≥ d↓
. Portanto, para atualizar o limite superiord
∗
↑
ded
∗
é su iente fazerd
∗
↑ ← min {d
∗
↑, d
′
↑}
. Para atualizar o limite inferiord
∗
↓
e ientemente, pre isamosmanter as quádruplas em uma estrutura de dados heap, ordenada pelo
d↓
, om mínimonaraiz.
3.2.1 Corretude e Terminação
Olaçoprin ipaldoalgoritmopreservaoseguinteinvariante: Existeumaquádrupla
(B, B, k, d)
nala
C
tal queB
éa imagemB
∗
do ban oque é mais próximaa
A
. Esta armação éob-viamenteválida noiní io doalgoritmo. Supondo que osintervalos
t.d
são válidos istoé,a distân ia
dist(A, t.B) ∈ t.d
para adat ∈ C
o passo 4 somenteelimina uma quádruplat
′′
se
dist(A, t
′′
.B)
égarantidamentemaiorquedist(A, B
′
)
,ondeB
′
éaimagem andidata emC
que dened
∗
↑
.Alémdisso, a ada passo oalgoritmoeliminaumaoumais quádruplas, e/ou de rementa
o ampo
k
de alguma quádrupla. Em uma quádrupla omk = 0
, o intervalod
deve ser umintervalotrivial om
d↓ = d↑ = dist(A, B)
. Portanto,no passo 2, setodas asquádruplas deC
temk = 0
, então deve-se terd↓ = d↑ = d
∗
↓ = d
∗
↑
,e então o algoritmopara. Isso garante3.2.2 E iên ia No passo 3, se
d
′
↑ < d
∗
↑
entãod
∗
↑
será reduzido, e possivelmente alguma outra quádruplaseráremovidade
C
napróximaiteraçãodopasso4. Poroutrolado,sed
′
↓ > d
∗
↑
,aquádruplat
pode ser des artada. É laro que pode não o orrer nenhuma destas duas ondições, asoemque nenhum andidato éeliminado.
Opior aso paraoalgoritmoéquandonenhuma dasquádruplas éeliminada,eaiteração
ontinuaaté quetodas asquádruplastenham
k = 0
. Neste aso,dist
(k)
(A, B)
será al ulada
para todas as
N
imagensB
na base e todas as es alask
de0
am
. Supondo que a versãointervalarde
dist
éC
vezesmais ustosaqueaversãosimples,equeo ustodeobteraimagemB
(k)
e al ular
dist
(k)
(A
(k)
, B
(k)
)
éaproximadamente
Dn
paraimagens omn
pixels,entãonopior aso o ustode al ulartodasestas distân iasserá
NDn(1 + C/4 + C/4
2
+ · · · + C/4
m
)
,
queéinferiora
NDn(1 + C/3)
. Em omparação,oalgoritmode forçabrutatem ustoNDn
.Portanto, o pior aso do algoritmo é somente
1 + C/3
vezes mais aro que o algoritmodeforçabruta.
Se o usto de al ular
dist
é mais do que linear no tamanho da imagem, o overhead doalgoritmoMuSIS nopior asoéaindamenor. Ou seja,se
dist(A, B)
ustaaproximadamenteDn
r
paraimagens om
n
pixels, entãoo overhead doMuSIS, nopior aso,éC/4
r
+ C/4
2r
+
· · · + C/4
mr
que é menorque
C/(4
r
− 1)
.
No entanto, odesempenho no aso médio podeser muitomelhorque nopior aso. Cada
quádrupla
(B, B, k, d)
omk > 0
queéeliminadanopasso4terá ustoCDn(1/4
k
+ 1/4
k+1
+
· · · + 1/4
m
) ≤ ((C/3)/4
k−1
)Dn
operações, mas esta eliminaçãoevita o ál ulo da distân ia
dist(A, B)
naresolução original,queéDn
. Nesse aso, arazão entre os dois ustos (MuSISeforçabruta)será
(C/3)/4
k−1
,que énormalmentemenor que1quando
k ≥ 2
. Portanto,seum número su iente de quádruplas forem eliminadasquando elas tem um valor
k
grande,a e onomia ompensará o overhead.
3.2.3 Como o Candidato é Es olhido
No passo 3, existem muitas estratégias possíveis que podem ser usadas para sele ionar a
quádruplado andidato
(B, B, k, d)
para ser renada.Uma possibilidade é es olher o andidato não trivial ( om
k > 0
) que é melhor emalgumsentido (menor
d↓
, maiord↑
, oumenormédia(d↓ + d↑)/2
),naesperançade queesseandidato seja a resposta desejada. Outra possibilidade é es olher o andidato que é pior
por um desses ritérios,na esperança que eleseja prontamenteeliminado.
Na maioriados nossostestes es olhemoso andidato om menor
d↓
; em asode empate,es olhemos o de maior es ala
k
.Observe que não podem existir dois andidatos
t, t
′
na lista
C
omt.k = t
′
.k = 0
, uma3.2.4 Inuên ia da Função Dis repân ia
A orretudedoalgoritmoMuSIS é independente dafunção de dis repân ia de imagens
dist
.De fato,
dist
não pre isa ser uma métri a no sentido matemáti o do termo. Além disso, asubstituição de
dist
porqualquer função monótonadist
′
(A, B) = f (dist(A, B))
não alteraofun ionamentodoalgoritmo,portantoresultaránamesmaimagem
B
∗
, om mesmo ustode
pro essamento.
No entanto, mudanças mais radi aisna função
dist
podem ter um impa tosigni ativonae iên ia doalgoritmo. Se
dist
dependeinteiramentededetalhes pequenosqueestãopre-sentes somenteemníveisdapirâmideabaixo deum ertonível
r
, então nenhumaquádruplaserá des artada de
C
até queelatenhak ≤ r
. Poresta razão, oMuSIS omo des ritoa imaserá ine az para bus asem bases de impressões digitais,ou de textos digitalizados.
3.3 Extensão para Resultados Multiplos
OalgoritmoMuSIS pode ser alteradoparaobtenção das
M
melhoresrespostas,ouseja, dasM
imagens doban o mais próximas à imagemA
. Para isso é ne essário alterar a deniçàodo intervalo
d
∗
de modo que ele ontenha garantidamente as distân ias de
A
a essasM
imagens. O algoritmodeve parar apenas quando
M = 0
no iní io dopasso 2. Ou seja,d
∗
↓
ontinua denido pela equação (3.1), mas
d
∗
↑
passa a ser oM
-ésimo menor valor det.d↑
,dentre todos os andidatos
t
emC
.No passo 2,emvez de simplesmenteparar, oalgoritmodeve a res entaraimagem
B
aoDistân ia Eu lidiana
A métri a mais bási a para avaliara dis repân ia entre duas imagensé a distân ia
eu lidi-ana normalizada. Neste apítulo vamos denir essa distân ia e mostrar omo ela pode ser
estimadaa partir das imagensreduzidas.
4.1 Denição
Supondo queas imagens
A, B
têm omesmo domínioD
, adistân iaeu lidiana normalizadaentre elas édada por
dist
2
(A, B) =
1
# D
s
X
p∈D
|A[p] − B[p]|
2
(4.1)Dito de outra forma,
dist
2
(A, B)
érms(A − B)
, a raiz damédia quadráti a daimagemdiferença
A − B
. Se ovalorde adapixeléumnúmeroreal entre0e1,ovalordedist
2
(A, B)
tambémserá um número entre 0 e 1. Observe que a função
dist
2
éuma métri ano sentidomatemáti o; emparti ular, o valor da fórmula (4.1) é zero se e somente se as imagens são
idênti as, e
dist
2
(A, B) <= dist
2
(A, C) + dist
2
(C, B)
para quaisquer imagensA
,B
eC
.ParansdoalgoritmoMuSIS,émais onvenientetrabalhar omadistân iaaoquadrado,
dist
2
2
(A, B) = msq(A−B)
,doque omadistân iaemsi. Conformeobservadonaseção3.2.4,esta substituição não afetanem oresultado nem o usto doalgoritmoMuSIS.
Ousodamétri aeu lidianaemapli açõesdebus apor onteúdopressupõequeaimagem
desejada
B
∗
estáaproximadamentealinhada omaimagemmodelo
A
,de modoqueospixelsorrespondentes nasduas imagens orrespondemaomesmo ponto(ou pontospróximos) nos
objetos retratados. Ela pressupõe também que os parâmetros fotométri os ( ondições de
iluminação, ajustes de brilho e ontraste, resposta da âmera, et .) são iguais ou próximas
para as duas imagens.
Quando estas ondições não são satisfeitas, a distân ia eu lidiana pode dar resultado
muito diferente doesperado. Nesses asos, ainda pode ser possível o uso da distân ia
4.2 Imagens om Diferentes Domínios
Em muitas bases, as imagens têm tamanhos e/ou aspe tos diferentes, e/ou estão
a ompa-nhadaspormás aras bináriasqueespe i amaparterelevantedaimagem,istoéodomínio
efetivo damesma. Veja a gura4.1.
Figura4.1: Quatro imagense suas respe tivas más aras binárias.
Para estender amétri aeu lidianapara taisimagens,pode-se supor quequalquerpixel
A[p]
situado fora do domínioefetivo daimagem
A
é uma or nula om valorespe ialΦ
, talque|Φ − u| = |u − Φ| = 1
para qualquer or normalu ∈ V
; om a ressalva que|Φ − Φ| = 0
.Então a fórmula (4.1) pode ser usada, tomando-se
P
omo sendo a união dos domíniosefetivos de todas asimagens nabase.
A
B
C
Masc.A
Masc.B
Masc.C
Figura 4.2: Resultadodadistân iaeu lidiana apli ada sobretrês imagens
mono ro-máti as (ao alto) om domínios efetivos denidos por más aras (em baixo). Temos
dist
2
(A, B) = 0.166572 < dist
2
(A, C) = 0.216247
.Entretanto, esta solução tem vários in onvenientes. Em primeiro lugar, pois diferenças
nos parâmetros fotométri os e/ou de posi ionamento ( omo rotação e translação) afetam
signi ativamenteovalordadistân ia. Portanto,objetosidênti osfotografadosem ondições
distintas podem ter dis repân ias próximas a
1
. Portanto, omo dito na seção 4.1, estavariantedadistân iaeu lidianatambémexigequeaimagempro urada
B
∗
eaimagemdada
A
estejam alinhadase om fatores fotométri osiguais oubempróximos.4.3 Estimativas da Distân ia Eu lidiana
Uma maneira sistemáti a de obter estimadores intervalares é usar a aritméti a intervalar
denida na seção 2.5.2.
4.3.1 Estimativa por Redução Intervalar
Paramuitostiposdeimagens, omofotograasdeambientesinternosouexternos,adistân ia
eu lidiana
dist
2
(A, B)
entre duas imagens pode ser estimada de forma e iente a partir desuas versões intervalares reduzidas
A
(k)
, B
(k)
emqualquer es ala
k
. Bastaavaliar afórmula(4.1) para
dist
2
(A
(k)
, B
(k)
)
, om as operações da aritméti a intervalar (2.15). Ou seja,
al ula-se
dist
(k)
2
↓(A, B) =
v
u
u
t
1
# D
(k)
X
p∈D
(k)
[dst↓(A
(k)
[p], B
(k)
[p])]
2
(4.2)dist
(k)
2
↑(A, B) =
v
u
u
t
1
# D
(k)
X
p∈D
(k)
[dst↑(A
(k)
[p], B
(k)
[p]]
2
(4.3) ondedst↓(a, b) =
0
se[a↓
_a↑] ∩ [b↓
_b↑] 6= {} ,
|a↓ − b↑|
sea↓ > b↑,
|a↑ − b↓|
sea↑ < b↓
(4.4)dst↑(a, b) = max{a↑ − b↓, b↑ − a↓}
(4.5)Estas fórmulas produzem um intervalo
d
que ontém garantidamente a distân ia exatadist
2
(A, B)
na es ala original, e é muitas vezes pequeno su iente para permitir de idirqual de dois andidatos
B
′
, B
′′
éo mais pare ido om a imagem
A
. Para ilustrar esteson- eitos, vamos mostrar estimadores para asdistân ias
dist
2
(A, B)
edist
2
(A, C)
, ondeA, B
eA
B
C
Figura 4.3: Três imagens
A, B
eC
usadas para exempli ar estimadores intervalesda distân ia
dist
2
.As guras4.4(a)a 4.4(h)ilustramasestimativasdestas distân ias al uladas nas es alasde
k = 7 (1 × 1
pixels)
aték = 0 (128 × 128
pixels)
. Em ada sub-gura, as imagens são asversões reduzidas
A
(k)
,B
(k)
eC
(k)
das imagens
A
,B
eC
, obtidas om redução intervalar.Em ada par, a imagem da esquerda é o limite inferior (
A
↓
,B
↓
ouC
↓
) e a da direita é olimite superior (
A
↑
,B
↑
ouC
↑
). As barras horizontais mostram as estimativas intervalaresdist
(k)
2
(A, B)
edist
(k)
2
(A, C)
. Observe que os intervalos al ulados para a es alak = 2
são su ientes para de idir quedist
2
(A, B) < dist
2
(A, C)
, de forma que a distân iadist
2
não pre isa ser al ulada nas es alask ≤ 2
.4.3.2 Estimativa por Média e Desvio Padrão
Outra maneira de obter uma estimativa intervalar e iente para
dist
2
(A, B)
é utilizar asimagensreduzidaspormédiaedesvio padrão,
µA
(k)
, σA
(k)
, µB
(k)
eσB
(k)
. Asestimativassãodist
(k)
2
↓(A, B) =
v
u
u
t
1
# D
(k)
X
p∈D
(k)
[dst ↓(A
(k)
[p], B
(k)
[p])]
2
(4.6)dist
(k)
2
↑(A, B) =
v
u
u
t
1
# D
(k)
X
p∈D
(k)
[dst ↑(A
(k)
[p], B
(k)
[p])]
2
(4.7) ondedst↓(a, b) =
p(µa − µb)
2
+ (σa − σb)
2
(4.8)
dst↑(a, b) =
p(µa − µb)
2
+ (σa + σb)
2
(4.9)
Estas fórmulas também forne em um intervalo que garantidamente ontém a distân ia
dist
2
(A, B)
na es alaoriginal.Asguras4.5(a)a4.5(h)ilustramestimativasde
dist
2
(A, B)
edist
2
(A, C)
paraasimagensdagura 4.3. Em ada sub-gura,as imagenssão versões reduzidas
A
(k)
,B
(k)
eC
(k)
de trêsimagens
A
,B
eC
, obtidas om reduçãopormédiaedesvio padrão. Em adapar, aimagemdaesquerdaéamédia(
µA
,µB
ouµC
),eadadireitaéodesvio padrão(σA
,σB
ouσC
). Asbarras horizontaismostramasestimativasintervalares
dist
(k)
2
(A
(k)
, B
(k)
)
edist
(k)
2
(A
(k)
, C
(k)
)
,om várias es alas de resolução desde
k = 7
(1 × 1
pixels) aték = 0
(original,128 × 128
pixels). Observequeosintervalos al uladosparaaes ala
k = 5
jásãosu ientesparade idir quedist
2
(A, B) < dist
2
(A, C)
, de forma que a distân iadist
2
não pre isa ser al ulada nas es alask ≤ 5
.A
(7)
=
B
(7)
=
dist
(7)
2
(A, B)
A
(7)
=
C
(7)
=
dist
(7)
2
(A, C)
(a) Es alak = 7
.A
(6)
=
B
(6)
=
dist
(6)
2
(A, B)
A
(6)
=
C
(6)
=
dist
(6)
2
(A, C)
(b) Es alak = 6
.A
(5)
=
B
(5)
=
dist
(5)
2
(A, B)
A
(5)
=
C
(5)
=
dist
(5)
2
(A, C)
( ) Es alak = 5
.A
(4)
=
B
(4)
=
dist
(4)
2
(A, B)
A
(4)
=
C
(4)
=
dist
(4)
2
(A, C)
(d) Es alak = 4
.A
(3)
=
B
(3)
=
dist
(3)
2
(A, B)
A
(3)
=
C
(3)
=
dist
(3)
2
(A, C)
(e) Es alak = 3
.A
(2)
=
B
(2)
=
dist
(2)
2
(A, B)
A
(2)
=
C
(2)
=
dist
(2)
2
(A, C)
(f) Es alak = 2
.A
(1)
=
B
(1)
=
dist
(1)
2
(A, B)
A
(1)
=
C
(1)
=
dist
(1)
2
(A, C)
(g) Es alak = 1
.A
(0)
=
B
(0)
=
dist
(0)
2
(A, B)
A
(0)
=
C
(0)
=
dist
(0)
2
(A, C)
(h) Es alak = 0
.Figura4.4: Estimadores da distân iaeu lidiana
dist
(k)
2
(A
(k)
, B
(k)
)
edist
2
(A
(k)
, C
(k)
)