• Nenhum resultado encontrado

Recuperação de imagens multiescala intervalar

N/A
N/A
Protected

Academic year: 2021

Share "Recuperação de imagens multiescala intervalar"

Copied!
70
0
0

Texto

(1)
(2)

11111111111111123456357589ABC12356D85E9B5F56D85

111111111111E2E8297D356F962D336F56235

11111111111234536789AB3CD1ECB3C1FC43CC1288BBC1E558B11211

C38B31CB561 53C1!B336

"#B

89$8BC%&6 1'8 13C(8 1$57389C5C 1 378B)C5CBCB56 1 53C1 !B336

C38B3**1C3C1+,-.-1D1--/100-1

1B387C'6B1D126B(81,76533-438B7C%&6 1 587BC'66 1 * 1 73)8B3'C'8 1 7C'$C5 1 '8 1 C3C1

8737$761'816$7C%&6--89$8BC%&6 1 '8 1 3C(8- 1 -!B379739C 1 378B)C5CB- 1 :-;BC'3878

6BC53C'6- 1 "-437<93C 1 8$953'3CC- 1 =-8C(8 1 * 1 2C96 1 '8 1

'C'6--!A5381'81378B)C5615EC78A739C6-1118- 1,76533126B(8-188-173)8B3'C'81

7C'$C51'81C3C-18737$761'8116$7C%&6-1888-1>?7$56->?7$561813(5@D18C(81B87B38)C514A1378B)C51$5739C58

.C5C)BC*9BC)81813(5@15C8AD6B'6D1-8C(81B87B38)C5-11-1878B)C51!B37B8739-1

:-1E6BC538'1(BC'387-11"-1 $953'8C1'37C98-11=-18C(81'C7C4C8-11-1878B)C51CC5A31

5EC7B8C7396-FB8C1'8196987BC%&6D1.B698C8761'818C(8

>37$5C%&6D1E87B81813@93C1'C16$7C%&6

2C9C18GC3C'6BCD1.B63-14B-126B(81,76533158117E8!E.6

.B63-14B-1H95361.8'B33158117E8!E.6

.B63-14B-1I$1,B31>3(15F 117E8!E.6

4C7C1'C1'838CD1=000

.B6(BCC1'81.J*;BC'$C%&6D1E87BC'61813@93C1'C16$7C%&6

(3)
(4)

Universidade Estadualde Campinas

Re uperação de Imagens Multies ala Intervalar

Carlos Elias Arminio Zampieri

1

julho de2010

Ban a Examinadora:

Jorge Stol (Orientador)

HélioPedrini

Instituto de Computação- UNICAMP

Wu Shin Ting

Fa uldade de Engenharia Elétri a e Computação- UNICAMP

Ri ardoda SilvaTorres (SuplenteInterno)

Instituto de Computação- UNICAMP

LéoPini Magalhães(Suplente Externo)

Fa uldade de Engenharia Elétri a e Computação- UNICAMP

1

(5)

Neste trabalhoapresentamos um método geral para bus a de imagem por onteúdo (BIPC,

CBIR)emgrandes oleçõesdeimagens,usandoestimaçãointervalarmulties aladedistân ia.

Consideramosespe i amentebus as por exemplo, emque oobjetivo é en ontrar aimagem

da oleção que é mais próxima a uma imagem dada, segundo alguma função de distân ia

de imagens. Neste trabalho não pro uramos desenvolver métri as que melhor atendem as

intençõesdousuário; emvez disso, supondo quea métri aestá es olhida, apresentamos um

algoritmo genéri o (que denominamos MuSIS, de Multis ale Image Sear h) para realizar a

bus ade maneirae ienteusandoaritméti aintervalar. Estimativasintervalaresdas

distân- ias entre imagenssão usadas para eliminarrapidamenteimagens andidatas, onsiderando

apenas versões reduzidas das mesmas, de maneirasemelhante ao paradigma de otimização

bran h-and-bound. Comopartedestetrabalho,desenvolvemosestimadoresintervalares

e a-zes para distân iaeu lidiana ealgumas variantes damesma,in luindométri assensíveisao

gradiente emes alasvariadas. Experimentosindi aramque ométodopromove signi ativa

redução de ustos em relação à bus a exaustiva. Apesar de menos e iente do que outros

métodos omumenteusadosparaBIPC, oalgoritmoMuSIS sempreretornaaresposta exata

 istoé, a imagem mais próxima na métri a es olhida  e não apenas uma aproximação.

A abordagemMuSIS é ompatível om uma ampla variedade de funções de distân ia, sem

(6)

We present a general method for ontent-based image retrieval (CBIR) in large image

ol-le tions, using multis ale interval distan e estimation. We onsider spe i ally queries by

example, where the goal is to nd the image in the olle tion that is losest to a given

image, a ording to some image distan e fun tion. In this work we do not aim to develop

metri s that best meet the user's intentions; instead, assuming that the metri is hosen,

we des ribe an algorithm (wi h we all MuSIS, for MultiS ale Image Sear h) to perform

the sear h e iently usingintervalarithmeti . Interval estimatesof the image distan es are

used toqui kly dis ard andidate images after examiningonly small versions of them, in a

manner similar to the bran h-and-bound optimization paradigm. As part of this work, we

developed ee tive interval estimators for the Eu lidean distan e and for some variations

of it, in luding metri s that are sensitive to the gradient at various s ales. Experiments

indi ate that the method yields signi ant ost savings over exhaustive sear h. Although

less e ient than other methods ommonly used for CBIR, the MuSIS algorithm always

returns the exa t answer  that is, the nearest image inmetri hosen  and not just an

approximation thereof. The MuSIS approa h is ompatible with a wide variety of distan e

(7)

Resumo v

Abstra t vi

1 Preliminares 1

1.1 Contextualização e Motivação . . . 1

1.2 Bus aMulties alaporExemplo . . . 2

1.3 Prin ípiosdoAlgoritmo . . . 2

1.4 Métri aspara Imagens . . . 3

1.5 Testes . . . 3

1.6 Publi ações . . . 3

2 Notações e Denições 4 2.1 Imagens ePixels . . . 4

2.2 Métri aspara Apli ação emImagens . . . 4

2.3 Espaçosde Cor . . . 5

2.3.1 Espaço RGB. . . 5

2.3.2 Espaço YUV . . . 5

2.3.3 Espaço Yuv . . . 6

2.4 Operações om Imagens . . . 6

2.5 Pirâmidede Imagens . . . 7

2.5.1 Blo os de Pixels . . . 7

2.5.2 Aritméti aIntervalar . . . 8

2.6 Métodos de Redução de Es ala . . . 9

2.6.1 ReduçãoIntervalar . . . 9

2.6.2 ReduçãoporMédia e Desvio Padrão . . . 10

3 Bus a Multies ala de Imagens 12 3.1 Estimadores de Distân ia. . . 12

3.2 Bus aIntervalar. . . 12

3.2.1 Corretude eTerminação . . . 14

(8)

3.2.4 Inuên iada FunçãoDis repân ia . . . 16

3.3 Extensão para Resultados Multiplos. . . 16

4 Distân ia Eu lidiana 17 4.1 Denição. . . 17

4.2 Imagens om Diferentes Domínios . . . 18

4.3 Estimativasda Distân iaEu lidiana. . . 19

4.3.1 EstimativaporRedução Intervalar . . . 19

4.3.2 EstimativaporMédia e Desvio Padrão . . . 20

5 Distân ia Eu lidiana Cumulativa 23 5.1 EstimaçãoIntervalarda Distân ia Cumulativa . . . 24

6 Distân ia de Gradiente 26 6.1 Formavs Cor naMétri a Eu lidiana . . . 26

6.2 Gradiente . . . 26

6.3 GradienteNormalizado . . . 28

6.4 Distân ia de GradienteNormalizado . . . 30

6.5 Usando GradienteNormalizadono MuSIS . . . 30

6.5.1 Gradientena Base Original, om Métri a Monoes ala . . . 30

6.5.2 Gradientena Base Original, om Métri a Cumulativa . . . 31

6.6 Gradienteem CadaNível daPirâmide . . . 33

7 Métri as para Imagens Coloridas 36 7.1 Distân ia Eu lidianaRGB . . . 36

7.2 Distân ia Eu lidianaYuv. . . 36

7.3 Distân ia de GradienteYuv . . . 37

7.4 OperadorCartoon . . . 38

7.5 Estimadores de Métri as para Imagens Coloridas. . . 39

8 Bases de Imagens 40 8.1 BasesAL . . . 41 8.2 Base C1 . . . 42 8.3 Base C2 . . . 43 8.4 Base CR . . . 45 8.5 Base FF . . . 46 8.6 Base JS . . . 47 9 Testes de Desempenho 49 9.1 Metodologiade Testes . . . 49

(9)

9.3 ComparandoEstimadores AI e

µσ

. . . 51

9.4 Métri a Normale Métri a de Gradiente . . . 51

9.5 Métri asMonoes ala versus Multies ala. . . 52

10 Con lusões e Trabalhos Futuros 54

(10)

5.1 Distân ias

d

daimagem

A

emrelação a

B

e

C

dagura 5.1. . . 24

6.1 Termos da distân ia

dist

H∗

2

em ada es ala da pirâmide para as imagens da

gura 6.10, om

β = 2

. Nesta tabela

d

r

(G, H) = dist

2

(µG

(r)

, µH

(r)

)

e

analo-gamentepara

d

r

(G, K)

.. . . 32

6.2 Termos de

dist

em ada es alada pirâmide,para as imagens dagura 6.12,

om

β = 2

. Nesta tabela,

d

r

(A, B) = dist

2

(δA

(r)

), δB

(r)

)

e analogamentepara

d

r

(A, C)

. . . 34

8.1 Asbasesusadasnos testes, omasdimensões, es alamáxima

m

, onúmerode

imagens

N

e aorigem. . . 40

9.1 Custorelativodabus aporumaamostragemdeimagensusandoasheurísti a

de es olha para ada base de imagens. . . 50

9.2 Comparação do desempenho do MuSIS om os dois tipos de estimadores:

intervalar(AI) emédia-desvio (

µσ

). . . 51

9.3 ComparaçãododesempenhodoMuSIS om amétri aeu lidiana

dist

2

, e om

métri asde gradientenormalizado

dist

H

2

e bus a força-bruta. . . 52

9.4 Comparação do desempenho do MuSIS om métri as monoes ala e

multies- ala umulativa omparâmetros

β = 1/2, 1

e

2

emrelaçãoàforça-bruta(FB).

Ex etonasduasultimaslinhas,osvaloressãoonúmero

p[k]

de ál ulosde

dis-tân ia

dist

2

e/ou o número

q[k]

de ál ulosde estimadores

dist

(k)

2

exe utados.

(Note que

q[k]= 0

nonível

k = 0

e noalgoritmode forçabruta) . . . 52

9.5 Comparação do desempenho do MuSIS om métri as de gradiente

monoes- ala e multies ala umulativa om parâmetros

β = 1/2, 1

e

2

em relação à

força-bruta (FB). Ex eto nas duas ultimas linhas, os valores são o número

p[k]

de ál ulos de distân ias

dist

2

e/ou o número

q[k]

de estimadores

dist

H

(k)

2

exe utados. (Noteque

q[k]= 0

nonível

k = 0

noalgoritmoforçabruta,epara

(11)

2.1 Umaimageme seus anais de or (R,G, B). . . 5

2.2 Uma imagem

I

(esq.) e os níveis

i = 3

e

k = 5

da pirâmide de imagens

I

,

mostrando os onjuntos

D

(0:k)

[p]

e

D

(i:k)

[p]

, para o pixel

p

de

I

(k)

. . . 8

2.3 Umaimagemmono romáti a (no alto),easversõesreduzidas

I

(1)

, I

(2)

. . . I

(m)

produzidas pelo pro esso de redução intervalar. Cada nível onsiste de uma

imageminferior

I

(k)

(esq) euma imagem superior

I

(k)

(dir). . . 10

2.4 Umaimagemmono romáti a,easversões reduzidasobtidasporredução

mé-diae desvio. Cada nível onsistede uma imagemde média

µI

(k)

(esq) e uma

imagemde desvio padrão

σI

(k)

(dir). . . 11

3.1 Duasiteraçõessu essivas doalgoritmoMuSIS. . . 13

4.1 Quatroimagens esuas respe tivasmás aras binárias. . . 18

4.2 Resultadodadistân iaeu lidianaapli adasobretrêsimagensmono romáti as

(ao alto) om domínios efetivos denidos por más aras (em baixo). Temos

dist

2

(A, B) = 0.166572 < dist

2

(A, C) = 0.216247

. . . 18

4.3 Três imagens

A, B

e

C

usadas para exempli ar estimadores intervales da

distân ia

dist

2

. . . 20

4.4 Estimadoresdadistân iaeu lidiana

dist

(k)

2

(A

(k)

, B

(k)

)

e

dist

2

(A

(k)

, C

(k)

)

al u-lados emvárias es alas dapirâmide intervalarpelas fórmulas (4.2)(4.5). . . 21

4.5 Estimadores da distân ia eu lidiana

dist

(k)

2

(A

(k)

, B

(k)

)

e

dist

2

(A

(k)

, C

(k)

)

al- ulados em várias es alas das pirâmides reduzidas por média-desvio padrão,

pelas fórmulas (4.6)(4.9). . . 22

5.1 Três imagens mono romáti as. . . 24

6.1 Três imagens mono romáti as. Neste exemplo,

dist

2

(A, B) = 0.110640 <

dist

2

(A, C) = 0.433529

. . . 26

6.2 Umaimagem

I

(esq.) ea imagemgradiente

|▽I|

orrespondente (dir.). . . . 27

6.3 Imagens-gradientedastrêsimagensdagura6.1. Nesteexemplo,

dist

2

(A, B) =

0.165780 > dist

2

(A, C) = 0.030366

. . . 27

6.4 Três imagens mono romáti as e suas imagens gradiente. Neste exemplo,

dist

2

(A, B) = 0.092293 < dist

(12)

|HI|

(dir.). . . 29

6.6 Umaimagemmono romáti a

I

(esq.) etrêsimagensdegradientenormalizado

H

I

om diferentes valores doparâmetro

ǫ

. . . 29

6.7 Resultadodaoperação

|H|

apli adaàsimagensdagura6.4. Temos

dist

2

(|HA| , |HB|) =

0.091912 > dist

2

(|HA| , |HC|) = 0.015626

. . . 30

6.8 Pirâmideobtida apartir daredução dabase om imagens gradiente. . . 30

6.9 Resultadodaoperação

H

apli adasobretrêsimagensmono romáti as. Temos

dist

2

(HA, HB) = 0.105913 < dist

2

(HA, HC) = 0.167085

. . . 31

6.10 Distân ia eu lidiana umulativa om gradiente normalizado apli ado à base original. Temos

dist

H∗

2

(A, B) = 0.079349 > dist

H∗

2

(A, C) = 0.059057

, om o parâmetro

β = 2

. . . 32

6.11 Pirâmideobtidaapartirdareduçãodabaseoriginal omgradiente

H

apli ado a ada nível. . . 33

6.12 Distân ia eu lidiana umulativa om o gradiente

H

apli ado a ada nível da pirâmide. Temos

dist

(A, B) = 0.391287 > dist

(A, C) = 0.160042

, om o parâmetro

β = 2

. . . 34

7.1 Distân iaeu lidianadeimagens oloridasnoespaçoRGB.Temos

dist

2

(A, B) =

0.242803 > dist

2

(A, C) = 0.098406

. . . 37

7.2 Uma imagem olorida (esq.) e sua imagem gradiente olorida (dir.) obtida apli ando aoperação

H

a ada anal no espaçoRGB. . . 37

7.3 Umaimagem olorida (esq.) e oresultado dooperador artoon(dir.). . . 38

8.1 Algumas imagensdabase ALOI-VIEW. . . 41

8.2 Algumas imagensdabase ALNT02. . . 41

8.3 Algumas imagensdabase ALGT01 (mono romáti as). . . 42

8.4 Algumas imagensdabase ALGT01 ( oloridas). . . 42

8.5 Algumas imagensdabase Calte h-101. . . 42

8.6 Algumasimagens dabase C1NT01. . . 43

8.7 Algumasimagens dabase C1GT01 (mono romáti as). . . 43

8.8 Algumasimagens dabase C1GT01 ( oloridas). . . 43

8.9 Algumasimagens dabase Calte h-256. . . 44

8.10 Algumasimagens dabase C2NT01. . . 44

8.11 Algumasimagens dabase C2GT01 (mono romáti as). . . 44

8.12 Algumasimagens dabase C2GT01 ( oloridas). . . 44

8.13 Algumasimagens dabase Corel. . . 45

8.14 Algumasimagens dabase CRNT01. . . 45

8.15 Algumasimagens dabase CRGT01 (mono romáti as). . . 45

8.16 Algumasimagens dabase CRGT01 ( oloridas). . . 46

(13)

8.19 Algumasimagens dabase FFGT01 (mono romáti as). . . 47

8.20 Algumas imagensdabase FFGT01 ( oloridas). . . 47

8.21 Algumasimagens dabase JSNT01. . . 47

8.22 Algumasimagens dabase JSGT01 (mono romáti as). . . 47

(14)

Preliminares

1.1 Contextualização e Motivação

Este trabalho visa estudar métodos e té ni as omputa ionais para bus a ou re uperação

de imagens emgrandes ban os de imagens,em espe ial utilizandoa aritméti a intervalare

representações multies ala de imagens.

Repositóriosdeimagenssãoutilizadospelas maisdiversasáreas, omomedi ina, iên ias

da terra, jornalismo, arqueologia, biologia, marketing, segurança, et [16℄. Ban os om

entenas de milhares (ou milhões) de imagenssão ada vez mais omuns. Um exemplo é o

Earth Observing System da Nasa, que obtém terabytes de dados de imagens todos os dias

[11℄. Emtaisban os,alo alizaçãovisualde imagensde interesseéimpráti avele,portanto,

háuma grande ne essidade de métodos omputa ionais e ientes para bus ade imagens.

Imagens digitais podem ser obtidas de diversas fontes, omo âmeras digitais, aptura

de quadrosde vídeo, digitalizaçãode fotosedo umentosutilizando-ses anners (demesaou

de mão), et [18℄. Imagens também podem ser produzidas arti ialmente por té ni as de

omputação grá aou tipograadigital.

Há muitas maneiras de efetuar bus as emban os de dados de imagens.

Ossistemasde bus as por meta-dados são baseados emtextos asso iadosa adaimagem

(rótulos,legendas, palavras- have,et ). Grandes bus adores omo Google e Yahoo utilizam

variantes deste método, onde rótulos são extraídos de textos que a ompanham as imagens.

Esta abordagem, apesar de ser relativamentefá il de implementar, é inviável para grandes

oleções de imagens não rotuladas, pois a riação de rótulos adequados é extremamente

dispendiosa.

Uma alternativaà bus a por meta-dadosé a bus a de imagens por onteúdo (BIPC; em

inglês, ontent based image retrieval ou CBIR) [6, 7, 10, 19,8℄. Nesta abordagem, a bus a

utilizapropriedadesintrínse asdas imagens, omodistribuiçãode ores,forma,textura,et .

Por exemplo, ousuário espe i a ertas propriedadesdas imagensdesejadas, ea resposta é

uma lista ontendo asimagens quemelhor seenquadram nessas espe i ações.

(15)

exemplo, em que o objetivo é en ontrar a imagem da oleção que é mais próxima a uma

imagem-modelo dada, segundo alguma função de distân ia de imagens. Este on eito é

denido mais formalmenteno apítulo2.

1.2 Bus a Multies ala por Exemplo

Nesta dissertação, apresentamos um novo métodogeral para bus a em grandes oleções de

imagens. Nosso algoritmo,que denominamosMuSIS (de Multis ale Image Sear h) ombina

métodosmulties ala omaritméti a intervalar,e pode ser utilizado om diversas funçõesde

distân ia. O algoritmobási o está des ritono apítulo 3.

Ressaltamos que neste projeto (ao ontrário de muitos trabalhos desta área) o objetivo

não é desenvolver métri as que melhor reetem os desejos dos usuários,mas sima elerar a

bus a para uma métri a espe i ada. Portanto, os ritérios tradi ionais de avaliação para

algoritmos BIPC (pre isão, sensibilidade, a urá ia, et ) não se apli am; o úni o ritério

relevanteé o usto da bus a.

Aliás, observamos que asmétri as eu lidianas que,por simpli idadede exposição,

resol-vemosutilizarnostestessãosabidamentefrágeiseinadequadasparaamaioriadasapli ações

reais. Porém o algoritmobási o pode ser estendido para métri asmais sosti adas.

1.3 Prin ípios do Algoritmo

A té ni a geral de análise multiresolução ou multies ala baseia-se na de omposição dos

objetos emestudo (no aso, uma imagem)em várias amadas, ada uma ontendo detalhes

de tamanhos diferentes [15℄. No nosso trabalho, supomos que para ada imagem da base

é onstruída previamente uma pirâmidede imagens reduzidas em várias es alas. Este

pré-pro essamentoestá detalhado no apítulo2.

Nosso algoritmo omeça al ulandoadistân iaentre aimagemdadae adaumadas

ima-gensdabase,naes alamais reduzida. Oresultado desse ál uloéumaestimativaintervalar

paraasdistân iasexatas(naes alaoriginal)entre essasimagens. Asestimativasintervalares

são usadas para eliminar rapidamente imagens andidatas, de maneirasemelhanteao

para-digmadeotimizaçãobran h-and-bound [14℄. Quandone essário, asestimativasde distân ias

são re al uladas em es alas ada vez mais detalhadas, que permite eliminar mais imagens

até obtermos a imagemdesejada.

Nossos experimentos indi aram que o algoritmo MuSIS é muito mais e iente do que

a bus a exaustiva. Apesar de menos e iente do que outros métodos omumente usados

para este problema, nossa abordagem sempre retorna a resposta exata  istoé, a imagem

da base que é mais próxima à imagem-exemplo na métri a es olhida  e não apenas uma

aproximação damesma. A té ni a permite onsultas om uma ampla variedade de funções

(16)

1.4 Métri as para Imagens

Nos apítulos 4 a 7 des revemos a apli ação do algoritmo MuSIS para várias métri as de

omparaçãode imagens,derivadas damétri a eu lidiana.

No apítulo 5, em parti ular, des revemos o on eito de métri a multies ala,

espe ial-menteinteressanteparauso omoalgoritmoMuSIS,queéumamédiaponderadadosvalores

dadistân ia eu lidianaapli ada atodas ases alas de resolução.

No apítulo 6, onsideramos métri as que levam em onta os gradientes das imagens,

e não apenas seus valores. Para esse m introduzimos um operador espe ial, o gradiente

normalizado. Finalmente,no apítulo7des revemosextensõesdestasmétri asparaimagens

oloridas.

1.5 Testes

No apítulo 8, des revemos as bases de imagens utilizadas nos testes. No apítulo 9,

apre-sentamos testes quantitativos, om várias métri as e bases, que mostram seu desempenho

relativamenteà bus a exaustivae justi am algumases olhas feitas nodesenvolvimentodo

algoritmo.

1.6 Publi ações

Osresultados deste trabalhoforampubli ados em ongressos na ionaiseinterna ionais [23,

22,21℄. Aimplementação(emGnuC)estadisponívelemhttp://www.liv.i .uni amp.br /

~ eaz/sour e.htmleasbasesdetestesestãodisponíveisemhttp://www.liv.i .uni amp .

(17)

Notações e Denições

2.1 Imagens e Pixels

Neste trabalho, supomos que uma imagem

I

do ban o de imagens é representada por uma

função nita de um erto domínio

D ⊂ Z × Z

para um espaço

V

de ores om dimensão

nita

c

. Assimovalorde

I

emum ponto

p

dodomínio, hamadopixel e denotado por

I[p]

,

é uma listade

c

números,as amostras dopixel.

Neste trabalho, geralmentesupomosque asamostrassão númerosreais quesão

apro-ximadas por números emponto utuante de pre isão limitadana memóriado omputador,

e quantizadas para uma pequena seleção de valores quando armazenadas em arquivos de

imagens.

Para simpli ar, vamos supor que todas as imagens na base têm o mesmo tamanho e

formato

n

x

× n

y

. Porsimpli idade, onsideramosprin ipalmentebasesde imagens

mono ro-máti as;porém,osalgoritmosaquides ritos podemser fa ilmenteestendidosparatrabalhar

om imagens oloridas (veja apítulo7) ede diferentes tamanhos (veja seção4.2).

2.2 Métri as para Apli ação em Imagens

Neste trabalho, onsideramos um aso parti ular da bus a por onteúdo, a bus a por

simi-laridade. Nesta modalidade, é forne idauma imagem modelo, eo resultado dabus a são as

imagensda base mais semelhantes à mesma,segundo uma função distân iaqualquer.

Uma função distân ia para imagens é uma função

dist

que, para ada par de imagens

A, B

atribuium númeroreal

dist(A, B)

quemedeadissimilaridadeentre elas. Afunção

dist

pode ser uma métri a ou função distân ia no sentido matemáti o do termo [9℄. Ou seja,

uma função que satisfaz asseguintes propriedades:

1.

dist(A, A) = 0

para qualquer

A

(18)

3.

dist(A, B) = dist(B, A)

para quaisquer

A, B

4.

dist(A, B) <= dist(A, C) + dist(C, B)

para quaisquer

A, B, C

Nabus ade imagens,entretanto,nemtodas estaspropriedadessão ne essárias;para muitos

asos,basta que

dist(A, B)

sejatantomaiorquanto maisdis repantes foremasimagens,em

algumsentido. Nesse asoémais orreto hamar

dist

defunçãodis repân ia. Nestetrabalho,

usaremos ostermosmétri a efunçãodistân ia omosinnimosde função dis repân ia.

2.3 Espaços de Cor

Nasimagensmono romáti as,oespaço

V

éo onjunto

R

dosnúmerosreais,istoé, adapixel

tem apenas uma amostra. Nas imagens oloridas,

V

é geralmente

R

3

, isto é, ada pixel é

uma triplade valores, hamados anaisde or, adaum entre

0

e

1

. Emgeral,umaimagem

om

c

anais pode ser vista omo

c

imagens mono romáti as. Vejaa gura 2.1.

Imagem R G B

Figura2.1: Umaimagem e seus anais de or (R, G,B).

Nesta dissertação, quando não for espe í ado o ontrário, supõe-se que as imagens são

mono romáti as.

2.3.1 Espaço RGB

A representação de ores mais difundida é o espaço RGB, onde ada anal de or é a

in-tensidade luminosaem uma faixa espe í a do espe tro (R: vermelho, G: verde e B: azul).

Vamos supor que a intensidade de ada anal varia no intervalo [

0, 1

℄, sendo que

1

repre-senta a intensidade máxima que pode ser reproduzida no monitor. Assim, porexemplo, no

espaço RGB

(0, 0, 0)

representa a or preta, e

(1, 1, 1)

é o bran o mais luminoso que pode

ser mostrado natela.

2.3.2 Espaço YUV

Outroespaçode orutilizadoéoYUV [12,13℄,sendoY:luminân ia( larooues uro)eU,V:

(19)

e pro essamento de imagens. A onversão do espaço RGB para YUV é dada por uma

transformação linearde oordenadas, espe i amente

Y

U

V

=

0.2989

0.5866

0.1144

−0.14713 −0.28886

0.436

0.615

−0.51499 −0.10001

R

G

B

(2.1) A transformação inversa é

R

G

B

=

1

0

1.13983

1 −0.39465 −0.5806

1 −0.51499

0

Y

U

V

(2.2) 2.3.3 Espaço Yuv

OespaçoYuvéumatransformaçãonão-lineardoespaçoYUV,ondeos anaisde rominân ia

U, V são divididos pela luminân ia Y, de forma a torná-los independentes do ganho da

âmera e da intensidade da iluminação que in ide sobre os objetos das imagens. Neste

trabalhousamos asfórmulas

u = U

1 + δ

Y + δ

v = V

1 + δ

Y + δ

(2.3) A onversão inversa é

U = u

Y + δ

1 + δ

V = v

Y + δ

1 + δ

(2.4)

Oparâmetro

δ

éumvalorpequenousadoparaevitardivisãoporzero. Nestetrabalhousamos

δ = 0.0001

.

2.4 Operações om Imagens

Podemosdeniromáximo,omínimo,ovalormédio,ovalormédio quadráti o earaizmédia

quadrada de um onjunto

P ⊆ D

de pixelsde uma imagem

I

, pelas fórmulas

max

P

I = max { I[p] : p ∈ P }

(2.5)

min

P

I = min { I[p] : p ∈ P }

(2.6)

avg

P

I =

1

#P

X

p∈P

I[p]

(2.7)

msq

P

I =

1

#P

X

p∈P

(I[p])

2

(2.8)

(20)

rms

P

I =

pmsq

P

I =

s

1

#P

X

p∈P

(I[p])

2

(2.9)

onde

#P

é a ardinalidade de

P

. Denimos também a variân ia

var

P

I

e o desvio padrão

(ou simplesmentedesvio)

dev

P

I

pelas fórmulas

var

P

I = msq

P

(I − avg

P

I)

(2.10)

dev

P

I =

pvar

P

I = rms

P

(I − avg

P

I)

(2.11)

Emtodas asoperações, omitiremoso subs rito

P

quando eleé odomínio

D

daimagem.

No asode imagens oloridas, onven ionaremosqueasfórmulas(2.52.9)são apli adas

a ada anal de or, separadamente, produzindo um resultado quetambéméuma or de

V

.

2.5 Pirâmide de Imagens

Para adaimagem

I

,dene-seumapirâmidedeimagens

I

(0)

, I

(1)

, . . . , I

(m)

,emque

I

(0)

éuma

imagem de mesmo tamanho que a imagem original

I

, e ada

I

(k)

é uma imagem análoga a

I

(0)

,mas omdimensõesreduzidasporumfatorde

1/2

k

em adadireção(portanto,umfator

de

1/4

k

em área).

Cada imagem

I

(k)

é um nível da pirâmide, e o índi e

k

é aes ala desse nível. A última

es ala

m

éum parâmetro do algoritmo;geralmente

m

é o menor inteiro tal que

I

(m)

possui

umúni opixel(ouumaúni alinhaou oluna),ouentão omaiorvalorde

k

talque

2

k

divide

n

x

e

n

y

. O espaço de valores

U

das imagens

I

(k)

pode ser diferente do espaço de valores

V

daimagemoriginal

I

; porexemplo,

V

pode ser oespaço de or visual(RGB),enquantoque

U

pode ser outro espaço de or (YUV, Yuv, et .) ou o resultado de outras transformações

lo ais da imagem, omo gradiente, variân ia, et . Estas possibilidades serão dis utidas na

seção 2.6.

2.5.1 Blo os de Pixels

Cadapixel

p

deumaversãoreduzida

I

(k)

daimagemé al uladoapartirdeum erto onjunto

D

(0:k)

[p]

de pixelsde

I

.

Por exemplo, se o domínio das imagens é o quadrado

{0.. 2

m

− 1} × {0.. 2

m

− 1}

, ada blo o

D

(0:k)

[p]

éum quadrado om

2

k

× 2

k

pixelsde

D

. Veja a gura2.2. Espe i amente

D

(0:k)

[p] =

 2

k

p + r : r ∈

0.. 2

k

− 1 × 0.. 2

k

− 1

(2.12)

Mas geralmente, para quaisquer es alas

i, k

om

i < k

, e ada pixel

p

de

I

(k)

, denimos

oblo o

D

(i:k)

[p]

, omosendo omenor onjuntode pixelsdonível

i

quedependedos mesmos

pixelsda imagemoriginal queo pixel

I

(k)

[p]

. Isto é,tal que

D

(0:k)

[p] =

[

q∈D

(i:k)

[p]

(21)

No exemplo a ima,

D

(i:k)

[p]

é um blo o om

2

k−i

× 2

k−i

pixels dentro do quadrado

{0.. 2

m−i

− 1} × {0.. 2

m−i

− 1}

, espe i amente

D

(i:k)

[p] =

 2

k−i

p + r : r ∈

0.. 2

k−i

− 1 × 0.. 2

k−i

− 1

(2.14)

I = I

(0)

I

(i)

I

(k)

Figura 2.2: Umaimagem

I

(esq.) e osníveis

i = 3

e

k = 5

da pirâmidede imagens

I

, mostrando os onjuntos

D

(0:k)

[p]

e

D

(i:k)

[p]

, para o pixel

p

de

I

(k)

. 2.5.2 Aritméti a Intervalar

A té ni a de aritméti a intervalar (AI) foi desenvolvida por R. Moore em 1960 [17℄ para

obter garantia de resultados em ál ulos om dados in ertos e/ou operações aproximadas.

A aritméti a intervalartem sido usada esporadi amenteempro essamento de imagens,por

exemplo, para aquantização de ores e inserçãode mar asd'água emimagens.

Um intervalo é um par de números

v

¯

= [¯

v↓, ¯

v↑]

que representam o onjunto de todos

os valores reais

x

tal que

v↓ ≤ x ≤ ¯

¯

v↑

. Se

v↓ = v↑

, o intervalo é dito exato, e representa

o onjunto trivial (unitário)

v↓} = {¯

v↑}

. Se

v↓ > ¯

¯

v↑

o intervalo é o onjunto vazio, que

é denotado por

[ ]

. Os extremos de um intervalo podem ser innitos (

−∞

ou

+∞

); em

parti ular, o intervalo

[−∞, +∞]

representa o onjunto de todos os números reais (nitos)

R

.

Mooreobservouquequalqueroperaçãoelementar

z ← f (x, y)

sobregrandezasordinárias

pode ser substituída por uma operação sobre intervalos

¯

z

← f

(¯x, ¯y)

, de tal forma que o

intervalo al ulado

z

¯

garantidamente ontémoresultadoordinário

z

,paraquaisquer

operan-dos ordinários

x, y

ontidos nos intervalos

¯

x

, ¯y

. Por exemplo, o mínimo, o máximo, a soma

e asubtração de dois intervalos

x = [¯

¯

x↓

_

x↑]

¯

e

y = [¯

¯

y↓

_

y↑]

¯

são os intervalos

min(¯

x, ¯

y) = [min(¯

x↓, ¯

y↓)

_

min(¯

x↑, ¯

y↑)]

max(¯

x, ¯

y) = [max(¯

x↓, ¯

y↓)

_

max(¯

x↑, ¯

y↑)]

¯

x + ¯

y = [¯

x↓ + ¯

y↓

_

x↑ + ¯

¯

y↑]

¯

x − ¯

y = [¯

x↓ − ¯

y↑

_

x↑ − ¯

¯

y↓]

(22)

Oquadrado de um intervalo

x

¯

éum pou o mais ompli ado:

¯

x

2

=

[(¯

x↓)

2

_

x↑)

2

]

se

x↓ ≥ 0,

¯

[(¯

x↑)

2

_

x↓)

2

]

se

x↑ ≤ 0,

¯

[0

_

max((¯

x↓)

2

, (¯

x↑)

2

)]

aso ontrário. (2.16)

No ál ulo destas fórmulas, deve-se tomar uidado para que erros de arredondamento e

aproximaçõessejamsemprenosentido de aumentara larguradointervalo;istoé,aumentar

o valorde

z↑

¯

e diminuirovalor de

z↓

¯

.

As operaçõeselementares daAI podem ser ombinadaspara realizar ál ulosmais

om-pli ados. Destamaneira,qualquerfórmulapodesersubstituídaporumaversãointervalarda

mesma,queproduzumintervaloquegarantidamente ontémoresultadodaformulaoriginal.

Uma operaçãoimportanteemAI é ajunção

¯

u

∨ ¯v

de dois intervalos

¯

u, ¯v

, denida omo

sendo o menor intervalo que ontem

¯

u

e

v

¯

 ou seja,

u ∨ ¯

¯

v = [min {¯

u↓, ¯

v↓} , max {¯

u↑, ¯

v↑}]

.

Noteque

¯

u

∨¯v

éomesmoqueauniãode onjuntos

u

∪v

somenteseumdosdoisintervaloé

va-zio,ouseelestempelomenosumvalorem omum. Estaoperaçãoéasso iativaetemo

inter-valovazio

[ ]

omoumelementoneutro. Outraoperaçãoéainterseçãodedoisintervalos

¯

u

∧¯v

que ésimplesmenteainterseção dos onjuntos, isto é,

¯

u

∧ ¯v = [max {¯u↓, ¯v↓} , min {¯u↑, ¯v↑}]

.

Notequeesta fórmulaproduzum intervalo

w

vazio ( om

w↓ > w↑

)seosdois intervalosnão

tem interseção.

2.6 Métodos de Redução de Es ala

Na abordagemdo trabalho, ada pixel das imagensem es ala reduzida

I

(k)

pode ser obtido

de várias maneiras. Apresentamos a seguir duas maneiras, a redução intervalar ea redução

por média e desvio. Outras maneirasde onstruir apirâmideserão dis utidasno apítulo6.

2.6.1 Redução Intervalar

Na redução intervalar, ada pixel

p

de

I

(k)

é um intervalo

I

(k)

[p] = [I

(k)

[p]↓, I

(k)

[p]↑]

que

ontém osvalores dos pixelsdo blo o

D

(0:k)

[p]

da imagem

I

. Isto é,

I

(k)

[p]↓ = min

D

(0:k)

[p]

I

(2.17)

I

(k)

[p]↑ = max

D

(0:k)

[p]

I

(2.18)

Podemos,portanto,interpretar adanível

I

(k)

dapirâmide omumaimagemintervalar. Veja

agura2.3. Alternativamente,podemosver

I

(k)

omoumpar deimagens

I

(k)

e

I

(k)

,onde

I

(k)

↓[p] = I

(k)

[p]↓

e

I

(k)

↑[p] = I

(k)

[p]↑

. Observe que

I

(0)

[p]↓ = I

(0)

[p]↑ = I[p]

. Portanto, as imagens reduzidas na es ala

0

não

(23)

Figura 2.3: Uma imagem mono romáti a (no alto), e as versões reduzidas

I

(1)

, I

(2)

. . . I

(m)

produzidas pelo pro esso de redução intervalar. Cada nível

on-siste de uma imageminferior

I

(k)

(esq) euma imagemsuperior

I

(k)

(dir).

Cada imagem intervalar

I

(k)

pode ser obtida om relativamente pou o trabalho a partir

da imagem anterior

I

(k−1)

. Espe i amente, ada pixel

I

(k)

[p]

é a junção dos quatro pixels

intervalares

I

(k−1)

[q]

talque

q ∈ P

(k−1:k)

[p]

.

O usto total(em tempoe espaço)de al ulara pirâmideé então menor que

(1 + 1/4 +

1/4

2

+· · ·+1/4

m−1

) < 4/3 ≈ 1.333

vezeso ustode al ularonível

I

(1)

. Portanto,seaimagem

I

tem

n

pixels,o ustoé

O(n)

. Umavez que adapixelde

I

(k)

onsistede doisvaloresde

V

,o

espaçone essárioparaarmazenarapirâmidetodaé

1+2(1/4+1/4

2

+· · ·+1/4

m

) < 5/3 ≈ 1.67

vezes o espaçousado pela imagemoriginal.

2.6.2 Redução por Média e Desvio Padrão

Outra forma de onstruir a pirâmide é usar a redução por média e desvio padrão. Nesta

abordagem, ada pixel de

I

(k)

é o par onstituído da média

µI

(k)

[p]

e do desvio padrão

σI

(k)

[p]

dos pixelsdo blo o

D

(0:k)

[p]

da imagem

I

, ouseja

µI

(k)

[p] = avg

D

(0:k)

[p]

I

(2.19)

(24)

Veja a gura 2.4. Observe que

µI

(0)

[p] = I[p]

e

σI

(0)

[p] = 0

, portanto o nível

0

da pirâmide

não pre isa ser armazenado.

Figura2.4: Umaimagemmono romáti a, easversõesreduzidas obtidaspor

redu-ção médiaedesvio. Cadanível onsistedeumaimagemdemédia

µI

(k)

(esq) euma

imagemde desvio padrão

σI

(k)

(dir).

Assim omo na redução intervalar, a redução por média e desvio padrão pode ser feita

in rementalmente. Ou seja, o nível

I

(k)

pode ser al ulado a partir do nível

I

(k−1)

pelas

fórmulas

µI

(k)

[p] = avg

D

(0:k−1)

[p]µI

(k−1)

(2.21)

σI

(k)

[p] =

q

avg

D

(0:k−1)

[p](σI

(k−1)

) + var

D

(0:k−1)

[p](µI

(k−1)

)

(2.22)

Assim, omonareduçãointervalar, oespaçoo upadoporestapirâmideé

1 + 2(1/4 + 1/4

2

+

· · · + 1/4

m

) < 5/3 ≈ 1.67

vezes o espaço o upado pela imagem original, e o usto total de

(25)

Bus a Multies ala de Imagens

Aidéiafundamentaldoalgoritmode bus a multies alaintervalar (que denominamosMuSIS

do inglês multis ale interval sear h) é utilizar estimadores intervalares da função de

dis re-pân ia para des artar imagens da base, sem pre isar examinar ou omparar as imagensna

es ala original.

3.1 Estimadores de Distân ia

Ométodogeral de bus a propostoexige o ál ulode estimativasdadis repân ia

dist(A, B)

entre duas imagensapartirde suasversõesreduzidas. Ou seja,para ada dis repân ia

dist

,

pre isamosdeniruma famíliade estimadoresintervalares

dist

(k)

queoperamsobreimagens

reduzidas em ada es ala

k

.

Um estimador intervalar

dist

(k)

re ebe duas imagens reduzidas

A

(k)

, B

(k)

na es ala

k

,

e devolve um intervalo

dist

(k)

(A

(k)

, B

(k)

) = [dist

(k)

(A

(k)

, B

(k)

)↑, dist

(k)

(A

(k)

, B

(k)

)↓]

, tal que,

garantidamente,

dist(A, B) ∈ dist

(k)

(A

(k)

, B

(k)

)

.

Para simpli ar, es revemos

dist

(k)

(A, B)

emvez de

dist

(k)

(A

(k)

, B

(k)

)

uma vez que o su-pers rito

(k)

nasimagensreduzidasésempreigualaodoestimador. Entretanto,éimportante

observar que

dist

(k)

usa apenas o nível

k

das pirâmides

A

, B

(e possívelmente os níveis

su-periores) e não as pirâmides inteiras. Nas seções 4.3 e 5.1 mostramos omo al ular estes

estimadores para várias funções de dis repân ia.

3.2 Bus a Intervalar

O algorítmo MuSIS mantém um onjunto

C

de andidatos que ontém a imagem resposta,

ouseja, asimagens

B

dabase que são mais próximasà imagemde onsulta

A

,emalguma

métri aarbitrária

dist

. O onjuntoéprogressivamentepodado,até sereduziraapenas uma

imagem,que deve ser a resposta desejada

B

.

Cada elemento do onjunto

C

é uma quádrupla

t = (t.B, t.B, t.k, t.d)

, onde

t.B

é um

(26)

es ala de resolução; e

t.d

é uma estimativa intervalar para

dist(A, t.B)

, al ulada a partir

das versõesreduzidas

A

(k)

e

t.B

(k)

.

O algorítmomantém também um intervalo global

d

talque

dist(A, B

) ∈ d

. Uma vez

que

dist(A, B

) = min {dist(A, t.B) : t ∈ C}

então podemos tomar

d

omo sendo omínimo

de todos osintervalos

t.d

em

C

, ouseja

d

↓ =

min { t.d↓ : t ∈ C }

d

↑ =

min { t.d↑ : t ∈ C }

(3.1)

A situação geral durante a bus a é ilustradana gura 3.1(topo). No eixo

x

está indi adaa

posiçãodo andidatonala, enoeixo

y

aestimativaintervalar

t.d

dadistân ia. Cadabarra

de erro indi a o intervalo estimado

t.d

para uma quádrupla

t

em

C

. As linhas tra ejadas

horizontaisindi am ointervalo

d

. Neste exemplo,

d

e

d

são determinadospelos limites

inferior e superior do andidato de número 0. A ada iteração, o algoritmo remove um

andidato

t

da lista, re al ulaa estimativa intervalar

d

= dist

(k−1)

(A, t.B)

para a próxima es ala

k

= t.k − 1

, e reinsere o andidato atualizado

(t.B, t.B, k

, d

)

na lista, atualizando

d

de a ordo om

d

. Apósesta atualização é geralmentepossível eliminarda lista

C

alguns

andidatos que não podem ser aimagem desejada.

A gura 3.1(baixo)ilustra o resultado dessas operações. Nesta iteração o andidato 0 é

re al ulado e passou a ser o andidato

21

. O limiar inferior

d

passou a ser denido pelo

novo andidato

0

,eolimiarsuperior

d

 oureduzidoaodo andidatore al ulado

21

. Esta

mudança em

d

permitiu ao algoritmo des artar mais de

20%

dos andidatos da la, sem

nun a al ulara distân iaexata entre

A

e asrespe tivasimagens

t.B

.

0

0.2

0.4

0.6

0.8

1

0

10

20

30

40

50

60

70

80

90

100

110

0

0.2

0.4

0.6

0.8

1

0

10

20

30

40

50

60

70

80

90

100

110

(27)

A des rição detalhada do algoritmoé apresentada abaixo.

1. Seja

m

o nível máximo na pirâmidede

A

. Ini ialize o onjunto

C

om todas as

quá-druplas

(B, B, m + 1, [0

_

1])

tal que

B

está na base. Ini ialize

d

om o intervalo

[0

_

1]

.

2. Seja

(B, B, k, d)

um andidato om o mínimo

d↓

. Se é o úni o andidato, retorne

B

omoarespostadabus a;epare. Caso ontrárioseja

(B

, B

, k

, d

)

um andidato om osegundo menor

d↓

. Se

d↑ ≤ d

, então retorne

B

omoresposta da bus a;e pare.

3. Es olha um andidato

t = (B, B, k, d)

de

C

om

k > 0

. Cal ule uma nova estimativa

intervalar

d

= dist

(k−1)

(A, B)∩d

. Substituaaquádrupla

t

nalista

C

por

t

= (B, B, k −

1, d

)

. Atualize ointervalo

d

,de a ordo om a denição (3.1).

4. Remova de

C

toda quádrupla

(B, B, k, d)

ujo intervalo

d

está inteiramente a ima de

d

, ouseja, que tem

d↓ > d

. Repita a partirdo passo 2.

Uma vez que o novo intervalo

d

= dist

(k−1)

(A, B) ∩ d

al ulado no passo 3 usa mais

informações(imagensmais detalhadas)que asusadas para al ular

d

,espera-se queeleseja

pelo menostão pre isoquanto

d

, ouseja,

d

⊆ d

. Porém, dependendo de omo aestimativa

dist

(k−1)

é al ulada, istopode não ser sempre verdade.

Neste aso, se ambos intervalos são orretos (ou seja, ambos ontêm a distân ia exata

dist(A, B)

), sua interseção é orreta também. O omando

d

← dist

(k−1)

(A, B) ∩ d

assegura

que

d

↑ ≤ d↑

e

d

↓ ≥ d↓

. Portanto, para atualizar o limite superior

d

de

d

é su iente fazer

d

↑ ← min {d

↑, d

↑}

. Para atualizar o limite inferior

d

e ientemente, pre isamos

manter as quádruplas em uma estrutura de dados heap, ordenada pelo

d↓

, om mínimona

raiz.

3.2.1 Corretude e Terminação

Olaçoprin ipaldoalgoritmopreservaoseguinteinvariante: Existeumaquádrupla

(B, B, k, d)

nala

C

tal que

B

éa imagem

B

do ban oque é mais próximaa

A

. Esta armação é

ob-viamenteválida noiní io doalgoritmo. Supondo que osintervalos

t.d

são válidos  istoé,

a distân ia

dist(A, t.B) ∈ t.d

para ada

t ∈ C

o passo 4 somenteelimina uma quádrupla

t

′′

se

dist(A, t

′′

.B)

égarantidamentemaiorque

dist(A, B

)

,onde

B

éaimagem andidata em

C

que dene

d

.

Alémdisso, a ada passo oalgoritmoeliminaumaoumais quádruplas, e/ou de rementa

o ampo

k

de alguma quádrupla. Em uma quádrupla om

k = 0

, o intervalo

d

deve ser um

intervalotrivial om

d↓ = d↑ = dist(A, B)

. Portanto,no passo 2, setodas asquádruplas de

C

tem

k = 0

, então deve-se ter

d↓ = d↑ = d

↓ = d

,e então o algoritmopara. Isso garante

(28)

3.2.2 E iên ia No passo 3, se

d

↑ < d

então

d

será reduzido, e possivelmente alguma outra quádrupla

seráremovidade

C

napróximaiteraçãodopasso4. Poroutrolado,se

d

↓ > d

,aquádrupla

t

pode ser des artada. É laro que pode não o orrer nenhuma destas duas ondições, aso

emque nenhum andidato éeliminado.

Opior aso paraoalgoritmoéquandonenhuma dasquádruplas éeliminada,eaiteração

ontinuaaté quetodas asquádruplastenham

k = 0

. Neste aso,

dist

(k)

(A, B)

será al ulada

para todas as

N

imagens

B

na base e todas as es alas

k

de

0

a

m

. Supondo que a versão

intervalarde

dist

é

C

vezesmais ustosaqueaversãosimples,equeo ustodeobteraimagem

B

(k)

e al ular

dist

(k)

(A

(k)

, B

(k)

)

éaproximadamente

Dn

paraimagens om

n

pixels,entãono

pior aso o ustode al ulartodasestas distân iasserá

NDn(1 + C/4 + C/4

2

+ · · · + C/4

m

)

,

queéinferiora

NDn(1 + C/3)

. Em omparação,oalgoritmode forçabrutatem usto

NDn

.

Portanto, o pior aso do algoritmo é somente

1 + C/3

vezes mais aro que o algoritmode

forçabruta.

Se o usto de al ular

dist

é mais do que linear no tamanho da imagem, o overhead do

algoritmoMuSIS nopior asoéaindamenor. Ou seja,se

dist(A, B)

ustaaproximadamente

Dn

r

paraimagens om

n

pixels, entãoo overhead doMuSIS, nopior aso,é

C/4

r

+ C/4

2r

+

· · · + C/4

mr

que é menorque

C/(4

r

− 1)

.

No entanto, odesempenho no aso médio podeser muitomelhorque nopior aso. Cada

quádrupla

(B, B, k, d)

om

k > 0

queéeliminadanopasso4terá usto

CDn(1/4

k

+ 1/4

k+1

+

· · · + 1/4

m

) ≤ ((C/3)/4

k−1

)Dn

operações, mas esta eliminaçãoevita o ál ulo da distân ia

dist(A, B)

naresolução original,queé

Dn

. Nesse aso, arazão entre os dois ustos (MuSIS

eforçabruta)será

(C/3)/4

k−1

,que énormalmentemenor que1quando

k ≥ 2

. Portanto,se

um número su iente de quádruplas forem eliminadasquando elas tem um valor

k

grande,

a e onomia ompensará o overhead.

3.2.3 Como o Candidato é Es olhido

No passo 3, existem muitas estratégias possíveis que podem ser usadas para sele ionar a

quádruplado andidato

(B, B, k, d)

para ser renada.

Uma possibilidade é es olher o andidato não trivial ( om

k > 0

) que é melhor em

algumsentido (menor

d↓

, maior

d↑

, oumenormédia

(d↓ + d↑)/2

),naesperançade queesse

andidato seja a resposta desejada. Outra possibilidade é es olher o andidato que é pior

por um desses ritérios,na esperança que eleseja prontamenteeliminado.

Na maioriados nossostestes es olhemoso andidato om menor

d↓

; em asode empate,

es olhemos o de maior es ala

k

.

Observe que não podem existir dois andidatos

t, t

na lista

C

om

t.k = t

.k = 0

, uma

(29)

3.2.4 Inuên ia da Função Dis repân ia

A orretudedoalgoritmoMuSIS é independente dafunção de dis repân ia de imagens

dist

.

De fato,

dist

não pre isa ser uma métri a no sentido matemáti o do termo. Além disso, a

substituição de

dist

porqualquer função monótona

dist

(A, B) = f (dist(A, B))

não alterao

fun ionamentodoalgoritmo,portantoresultaránamesmaimagem

B

, om mesmo ustode

pro essamento.

No entanto, mudanças mais radi aisna função

dist

podem ter um impa tosigni ativo

nae iên ia doalgoritmo. Se

dist

dependeinteiramentededetalhes pequenosqueestão

pre-sentes somenteemníveisdapirâmideabaixo deum ertonível

r

, então nenhumaquádrupla

será des artada de

C

até queelatenha

k ≤ r

. Poresta razão, oMuSIS omo des ritoa ima

será ine az para bus asem bases de impressões digitais,ou de textos digitalizados.

3.3 Extensão para Resultados Multiplos

OalgoritmoMuSIS pode ser alteradoparaobtenção das

M

melhoresrespostas,ouseja, das

M

imagens doban o mais próximas à imagem

A

. Para isso é ne essário alterar a deniçào

do intervalo

d

de modo que ele ontenha garantidamente as distân ias de

A

a essas

M

imagens. O algoritmodeve parar apenas quando

M = 0

no iní io dopasso 2. Ou seja,

d

ontinua denido pela equação (3.1), mas

d

passa a ser o

M

-ésimo menor valor de

t.d↑

,

dentre todos os andidatos

t

em

C

.

No passo 2,emvez de simplesmenteparar, oalgoritmodeve a res entaraimagem

B

ao

(30)

Distân ia Eu lidiana

A métri a mais bási a para avaliara dis repân ia entre duas imagensé a distân ia

eu lidi-ana normalizada. Neste apítulo vamos denir essa distân ia e mostrar omo ela pode ser

estimadaa partir das imagensreduzidas.

4.1 Denição

Supondo queas imagens

A, B

têm omesmo domínio

D

, adistân iaeu lidiana normalizada

entre elas édada por

dist

2

(A, B) =

1

# D

s

X

p∈D

|A[p] − B[p]|

2

(4.1)

Dito de outra forma,

dist

2

(A, B)

é

rms(A − B)

, a raiz damédia quadráti a daimagem

diferença

A − B

. Se ovalorde adapixeléumnúmeroreal entre0e1,ovalorde

dist

2

(A, B)

tambémserá um número entre 0 e 1. Observe que a função

dist

2

éuma métri ano sentido

matemáti o; emparti ular, o valor da fórmula (4.1) é zero se e somente se as imagens são

idênti as, e

dist

2

(A, B) <= dist

2

(A, C) + dist

2

(C, B)

para quaisquer imagens

A

,

B

e

C

.

ParansdoalgoritmoMuSIS,émais onvenientetrabalhar omadistân iaaoquadrado,

dist

2

2

(A, B) = msq(A−B)

,doque omadistân iaemsi. Conformeobservadonaseção3.2.4,

esta substituição não afetanem oresultado nem o usto doalgoritmoMuSIS.

Ousodamétri aeu lidianaemapli açõesdebus apor onteúdopressupõequeaimagem

desejada

B

estáaproximadamentealinhada omaimagemmodelo

A

,de modoqueospixels

orrespondentes nasduas imagens orrespondemaomesmo ponto(ou pontospróximos) nos

objetos retratados. Ela pressupõe também que os parâmetros fotométri os ( ondições de

iluminação, ajustes de brilho e ontraste, resposta da âmera, et .) são iguais ou próximas

para as duas imagens.

Quando estas ondições não são satisfeitas, a distân ia eu lidiana pode dar resultado

muito diferente doesperado. Nesses asos, ainda pode ser possível o uso da distân ia

(31)

4.2 Imagens om Diferentes Domínios

Em muitas bases, as imagens têm tamanhos e/ou aspe tos diferentes, e/ou estão

a ompa-nhadaspormás aras bináriasqueespe i amaparterelevantedaimagem,istoéodomínio

efetivo damesma. Veja a gura4.1.

Figura4.1: Quatro imagense suas respe tivas más aras binárias.

Para estender amétri aeu lidianapara taisimagens,pode-se supor quequalquerpixel

A[p]

situado fora do domínioefetivo daimagem

A

é uma or nula om valorespe ial

Φ

, talque

|Φ − u| = |u − Φ| = 1

para qualquer or normal

u ∈ V

; om a ressalva que

|Φ − Φ| = 0

.

Então a fórmula (4.1) pode ser usada, tomando-se

P

omo sendo a união dos domínios

efetivos de todas asimagens nabase.

A

B

C

Masc.A

Masc.B

Masc.C

Figura 4.2: Resultadodadistân iaeu lidiana apli ada sobretrês imagens

mono ro-máti as (ao alto) om domínios efetivos denidos por más aras (em baixo). Temos

dist

2

(A, B) = 0.166572 < dist

2

(A, C) = 0.216247

.

(32)

Entretanto, esta solução tem vários in onvenientes. Em primeiro lugar, pois diferenças

nos parâmetros fotométri os e/ou de posi ionamento ( omo rotação e translação) afetam

signi ativamenteovalordadistân ia. Portanto,objetosidênti osfotografadosem ondições

distintas podem ter dis repân ias próximas a

1

. Portanto, omo dito na seção 4.1, esta

variantedadistân iaeu lidianatambémexigequeaimagempro urada

B

eaimagemdada

A

estejam alinhadase om fatores fotométri osiguais oubempróximos.

4.3 Estimativas da Distân ia Eu lidiana

Uma maneira sistemáti a de obter estimadores intervalares é usar a aritméti a intervalar

denida na seção 2.5.2.

4.3.1 Estimativa por Redução Intervalar

Paramuitostiposdeimagens, omofotograasdeambientesinternosouexternos,adistân ia

eu lidiana

dist

2

(A, B)

entre duas imagens pode ser estimada de forma e iente a partir de

suas versões intervalares reduzidas

A

(k)

, B

(k)

emqualquer es ala

k

. Bastaavaliar afórmula

(4.1) para

dist

2

(A

(k)

, B

(k)

)

, om as operações da aritméti a intervalar (2.15). Ou seja,

al ula-se

dist

(k)

2

↓(A, B) =

v

u

u

t

1

# D

(k)

X

p∈D

(k)

[dst↓(A

(k)

[p], B

(k)

[p])]

2

(4.2)

dist

(k)

2

↑(A, B) =

v

u

u

t

1

# D

(k)

X

p∈D

(k)

[dst↑(A

(k)

[p], B

(k)

[p]]

2

(4.3) onde

dst↓(a, b) =

0

se

[a↓

_

a↑] ∩ [b↓

_

b↑] 6= {} ,

|a↓ − b↑|

se

a↓ > b↑,

|a↑ − b↓|

se

a↑ < b↓

(4.4)

dst↑(a, b) = max{a↑ − b↓, b↑ − a↓}

(4.5)

Estas fórmulas produzem um intervalo

d

que ontém garantidamente a distân ia exata

dist

2

(A, B)

na es ala original, e é muitas vezes pequeno su iente para permitir de idir

qual de dois andidatos

B

, B

′′

éo mais pare ido om a imagem

A

. Para ilustrar estes

on- eitos, vamos mostrar estimadores para asdistân ias

dist

2

(A, B)

e

dist

2

(A, C)

, onde

A, B

e

(33)

A

B

C

Figura 4.3: Três imagens

A, B

e

C

usadas para exempli ar estimadores intervales

da distân ia

dist

2

.

As guras4.4(a)a 4.4(h)ilustramasestimativasdestas distân ias al uladas nas es alasde

k = 7 (1 × 1

pixels

)

até

k = 0 (128 × 128

pixels

)

. Em ada sub-gura, as imagens são as

versões reduzidas

A

(k)

,

B

(k)

e

C

(k)

das imagens

A

,

B

e

C

, obtidas om redução intervalar.

Em ada par, a imagem da esquerda é o limite inferior (

A

,

B

ou

C

) e a da direita é o

limite superior (

A

,

B

ou

C

). As barras horizontais mostram as estimativas intervalares

dist

(k)

2

(A, B)

e

dist

(k)

2

(A, C)

. Observe que os intervalos al ulados para a es ala

k = 2

são su ientes para de idir que

dist

2

(A, B) < dist

2

(A, C)

, de forma que a distân ia

dist

2

não pre isa ser al ulada nas es alas

k ≤ 2

.

4.3.2 Estimativa por Média e Desvio Padrão

Outra maneira de obter uma estimativa intervalar e iente para

dist

2

(A, B)

é utilizar as

imagensreduzidaspormédiaedesvio padrão,

µA

(k)

, σA

(k)

, µB

(k)

e

σB

(k)

. Asestimativassão

dist

(k)

2

↓(A, B) =

v

u

u

t

1

# D

(k)

X

p∈D

(k)

[dst ↓(A

(k)

[p], B

(k)

[p])]

2

(4.6)

dist

(k)

2

↑(A, B) =

v

u

u

t

1

# D

(k)

X

p∈D

(k)

[dst ↑(A

(k)

[p], B

(k)

[p])]

2

(4.7) onde

dst↓(a, b) =

p(µa − µb)

2

+ (σa − σb)

2

(4.8)

dst↑(a, b) =

p(µa − µb)

2

+ (σa + σb)

2

(4.9)

Estas fórmulas também forne em um intervalo que garantidamente ontém a distân ia

dist

2

(A, B)

na es alaoriginal.

Asguras4.5(a)a4.5(h)ilustramestimativasde

dist

2

(A, B)

e

dist

2

(A, C)

paraasimagens

dagura 4.3. Em ada sub-gura,as imagenssão versões reduzidas

A

(k)

,

B

(k)

e

C

(k)

de três

imagens

A

,

B

e

C

, obtidas om reduçãopormédiaedesvio padrão. Em adapar, aimagem

daesquerdaéamédia(

µA

,

µB

ou

µC

),eadadireitaéodesvio padrão(

σA

,

σB

ou

σC

). As

barras horizontaismostramasestimativasintervalares

dist

(k)

2

(A

(k)

, B

(k)

)

e

dist

(k)

2

(A

(k)

, C

(k)

)

,

om várias es alas de resolução  desde

k = 7

(

1 × 1

pixels) até

k = 0

(original,

128 × 128

pixels). Observequeosintervalos al uladosparaaes ala

k = 5

jásãosu ientesparade idir que

dist

2

(A, B) < dist

2

(A, C)

, de forma que a distân ia

dist

2

não pre isa ser al ulada nas es alas

k ≤ 5

.

(34)

A

(7)

=

B

(7)

=

dist

(7)

2

(A, B)

A

(7)

=

C

(7)

=

dist

(7)

2

(A, C)

(a) Es ala

k = 7

.

A

(6)

=

B

(6)

=

dist

(6)

2

(A, B)

A

(6)

=

C

(6)

=

dist

(6)

2

(A, C)

(b) Es ala

k = 6

.

A

(5)

=

B

(5)

=

dist

(5)

2

(A, B)

A

(5)

=

C

(5)

=

dist

(5)

2

(A, C)

( ) Es ala

k = 5

.

A

(4)

=

B

(4)

=

dist

(4)

2

(A, B)

A

(4)

=

C

(4)

=

dist

(4)

2

(A, C)

(d) Es ala

k = 4

.

A

(3)

=

B

(3)

=

dist

(3)

2

(A, B)

A

(3)

=

C

(3)

=

dist

(3)

2

(A, C)

(e) Es ala

k = 3

.

A

(2)

=

B

(2)

=

dist

(2)

2

(A, B)

A

(2)

=

C

(2)

=

dist

(2)

2

(A, C)

(f) Es ala

k = 2

.

A

(1)

=

B

(1)

=

dist

(1)

2

(A, B)

A

(1)

=

C

(1)

=

dist

(1)

2

(A, C)

(g) Es ala

k = 1

.

A

(0)

=

B

(0)

=

dist

(0)

2

(A, B)

A

(0)

=

C

(0)

=

dist

(0)

2

(A, C)

(h) Es ala

k = 0

.

Figura4.4: Estimadores da distân iaeu lidiana

dist

(k)

2

(A

(k)

, B

(k)

)

e

dist

2

(A

(k)

, C

(k)

)

Referências

Documentos relacionados

O objetivo é minimizar o número de bits que devem ser transmitidos para o decodificador de tal forma que ele possa fazer a transformada inversa e reconstruir a imagem: uma

Objeto: Autorizar a Interessada, inscrita no CNPJ/MF sob o nº 31.428.952/0001-34, a implantar e explorar a UFV Raios do Parnaíba I, CEG UFV.RS.PI.043203- 2.01, sob o regime de

Após, consegui contrato pelo estado e fui trabalhar em São Vendelino, em um grupo escolar com um quinto ano, tendo 36 alunos, sendo que dois alunos eram mais

Consulte a Secção 11 para obter informações pormenorizadas sobre sintomas e efeitos na saúde.. Classificação conforme Regulamentação (EC) 1272/2008 [CLP/GHS] SECÇÃO

Visando o aproveitamento alimentar do pequi que possui excelentes características relacionadas ao sabor, aroma e aparência, este trabalho objetivou-se desenvolver

Ao contrário da opinião popular, a carne suína, além de não ser perigosa para a saúde, pode ser considerada uma aliada do homem no controle de uma série de enfermidades e, além

Sugere­se que novas pesquisas sejam conduzidas na avaliação da influência do período de interrupção na aptidão funcional de idosos praticantes de exercícios físicos, de

• Utilize o compartimento frigorífico apenas para a conservação de alimentos frescos e o compartimento congelador apenas para a conservação de alimentos congelados, para a