Recuperação de Imagens Baseado em Conteúdo

(1)

Recuperação de Imagens Baseado em Conteúdo

Daniel Moutinho de Moura Lena Veiga e Silva Marcelo Souza Nery Paulo Sergio Silva Rodrigues

Departamento de Ciência da Computação, Universidade Federal de Minas Gerais, Av. Antônio Carlos, 6657, Belo Horizonte, MG, Brasil, 31270-901

{danielmm, lenavs, msnery, pssr}@dcc.ufmg.br

Resumo: Este trabalho apresenta um estudo comparativo entre técnicas de recuperação de imagens baseada no conteúdo,

utilizando três sistemas recentes de recuperação de imagens: SCARLET [11], RETIN [8] e GRAS [13], que empregam, respectivamente, técnicas de recuperação de imagens pela forma, cor e estrutura. É realizada uma análise dos resultados dos sistemas, os quais foram obtidos sobre uma base de dados controlada.

1 Introdução

Documentos digitais vêm tomando um espaço cada vez maior na sociedade, especialmente imagens digitais. Seu uso está em constante crescimento, sendo armazenadas em diferentes bases de dados que podem ser acessadas através de redes de comunicação como a Internet.

Devido à grande quantidade destes documentos, existe uma necessidade crescente por algoritmos de busca, métodos de indexação e técnicas de classificação. Este trabalho se concentrará em busca de imagens.

Dentre os métodos para a busca de imagens, pode-se citar um método de indexação das imagens através de palavras-chaves que descrevam as próprias imagens [12], podendo assim realizar casamento de strings sobre estas palavras. Porém, este método é dispendioso em termos de tempo das descrições, pois estas precisam ser inseridas manualmente, além do que são imprecisas em relação à classificação das imagens, pois a descrição é subjetiva. Outro método muito utilizado é o de busca de imagens baseado no contexto do documento em que a imagem está inserida [12]. O processo se baseia no casamento de uma palavra-chave que descreva a imagem. O sistema procura em arquivos de hipertexto com imagens que possuam a palavra chave. O problema deste método é que as imagens inseridas nos hipertextos não necessariamente correspondam ao texto. Um terceiro método é o de busca de imagens através do próprio conteúdo da imagem, denominado RIBC (Recuperação de Imagens Baseada no Conteúdo)[16]. Este método será tratado neste trabalho, por ser o único que depende das características da imagem.

Existem quatro sistemas de busca utilizadas pelos RIBCs [9]. O primeiro deles é o esboço, no qual o usuário traça um desenho da imagem que se deseja recuperar. Possuem a desvantagem de que o usuário deve saber se expressar através de desenhos (círculos, linhas, quadrados). O segundo é o diretório, onde as imagens são organizadas na forma de diretórios; a desvantagem é a classificação manual destas imagens. O terceiro método é o de exemplo; o usuário entra com uma imagem de exemplo para buscar correspondentes no BD. Esta imagem de exemplo pode ser fornecida pelo usuário ou a partir de um exemplo do próprio banco. Este terceiro método por ser o mais usado nos sistemas atuais será o tratado neste trabalho. E por fim, o quarto método é o de busca por contexto, onde a imagem é recuperada de acordo com o contexto dos seus objetos constituintes.

O sistema do RIBC de exemplos possui algumas etapas básicas, que são ilustradas na figura 1.

Figura 1 - Etapas de um RIBC

De acordo com [12] a etapa de aquisição consiste em obter as imagens digitais a serem utilizadas através de algum meio físico de imageamento. O pré-processamento baseia-se em melhorar a imagem1 de forma a aumentar as chances para o sucesso dos processos seguintes. A etapa de extração de características tem por objetivo extrair informações da imagem que serão utilizadas na busca do BD. O processo de indexação consiste em otimizar a consulta no BD. E finalmente, o

1

Ténicas para realce de contraste, remoção de ruído, isolamento de regiões etc Aquisição Pré-Proces-samento Extração de Caracte-rísticas Indexação Recuperação

(2)

processo de recuperação consiste da varredura de toda a base de dados, de forma a recuperar as imagens mais similares com a imagem de exemplo. Neste trabalho, será tratado apenas as fases de extração de características e recuperação. Sendo assim, o objetivo deste trabalho é descrever e comparar estas fases de três recentes métodos representativos de RIBC.

Este trabalho é composto por 6 seções, onde na Seção 2 são descritos alguns trabalhos relacionados com RIBC. Na Seção 3 são mostrados três métodos estudados neste trabalho que se fundamentam na busca de imagens baseada em conteúdo. Na Seção 4 é realizada uma comparação entre os métodos, expondo suas semelhanças e diferenças. Nesta mesma seção é mostrado os experimentos realizados e feito uma análise dos resultados obtidos. Por fim, são apresentados as conclusões e trabalhos futuros.

2 Histórico

Como RIBC é uma tecnologia recente que se encontra em desenvolvimento, vários trabalhos foram desenvolvidos nesta área.

Hirata e Kato [23] propuseram um RIBC baseado em exemplos visuais, extraindo as arestas da consulta e fazendo um casamento com outras arestas de outras imagens através de deslocamentos e deformações sem usar qualquer tipo de indexação.

Faloutsos et. al. [22] desenvolveu um sistema QBIC (pela IBM) baseado em vários parâmetros das imagens, permitindo que os usuários fizessem uma consulta baseada em cor, forma e textura que fossem semi-automaticamente extraídas. Também implementou uma forma de indexação baseada em árvores.

Jacobs et. al. [18] propuseram a recuperação usando informação espacial (disposição física de regiões) e características visuais representadas no domínio dos coeficientes de wavelets. Não implementaram qualquer tipo de indexação.

Smith e Chang [25] criaram um sistema chamado VisuaSeek que permitia busca por cor, regiões e layout espacial. Usaram indexação para aumentar a eficiência do sistema.

Ooi et. al. [24] criou o sistema VIPER que utilizava cor e informação espacial. Extraía primeiramente um conjunto de cores dominantes e então derivava a informação espacial composta por tais cores. Para a busca utilizava indexação.

3 Métodos de Recuperação

Nesta seção, serão apresentados três métodos de RIBC: Scarlet, Retin e Grass, os quais foram escolhidos para a realização deste trabalho por serem trabalhos bastante recentes e que já possuíam uma plataforma bem testada e analisada, obtendo resultados relevantes. Além disso, cada método se fundamenta na extração de uma determinada característica da imagem, realizando processos diferentes de comparação entre a imagem fornecida pelo usuário e as imagens da base de dados.

Porém, todos os três métodos sofrem três etapas semelhantes: a primeira etapa consiste da extração de características das images do BD, realizada off-line. A segunda etapa consiste na extração de caraterísticas sobre a imagem de consulta, realizada on-line. Por fim, a terceira etapa efetua uma pesquisa sobre a base de dados procurando um casamento entre as características da imagem da consulta e das imagens do BD, resultando as imagens mais semelhantes.

A seguir será descrito todo o processo de recuperação dos métodos estudados.

3.1. SCARLET

O SCARLET [11] (System for Content imAge Retrieval using waveLET) é um sistema desenvolvido para extrair características de forma dos objetos presentes nas imagens, através de Transformada de Wavelets. A principal contribuição do trabalho de Lee [11] é o desenvolvimento de um sistema de indexação que não será abordado neste trabalho. O foco principal aqui é a RIBC utilizando as wavelets sobre o mapa de bordas das imagens monocromáticas.

3.1.1. A Transformada de Wavelet

A Transformada de Wavelet (TW) foi criada nos anos 80 [12, 18] como uma alternativa para a Transformada de Fourier (TF) como forma de codificar, de modo econômico e preciso, os sinais das imagens. Consta basicamente em calcular a partir da imagem dois tipos de coeficientes: metade deles é uma soma (coeficientes principais) e a outra é uma subtração (resíduos).

Enquanto a transformada de Fourier converte um sinal numa série de sinusóides de frequência e amplitude constante e duração infinita, a Transformada de Wavelet converte o sinal numa série esparsa de wavelets.

A característica importante da TW é o fato dos níveis mais finos de detalhe do sinal serem codificados em sucessivas iterações do algoritmo. Assim, a magnitude das componentes da TW está intimamente relacionada com o nível de detalhe

(3)

do sinal que representam. Ao eliminar as componentes de pequena magnitude, mesmo que em grande número, apenas se afeta o detalhe e não a forma do sinal transformado. Este fato está em contraste com a TF, em que são as componentes de maior ordem e não as de menor amplitude que podem ser eliminadas.

3.1.2. Algoritmo para extração de características

As vantagens da utilização de wavelets sobre o mapa de bordas é o baixo custo de processamento (ao contrário da TF que trabalha com números complexos) e o fato de ser possível capturar gradientes de bordas que sejam relevantes para as imagens. O algoritmo abaixo ilustra os passos tomados:

Algoritmo Extração de Características

1.ENTRADA:imagens cromáticas

2.SAÍDA:vetores de caraterísticas de dimensão f

3.

4.for all imagens no banco de dados do

5. converta a imagem cromática para monocromática

6. extraia o mapa de bordas da imagem monocromática

7. aplique a Transformada Discreta de Wavelet na

informação de arestas

8. normalize os coeficientes de Wavelet de modo

que cada coeficiente possua valor entre 0..1

9. escolha f coeficientes de maior magnitude

10. componha um vetor de característica usando

estes f coeficientes truncados

11. end for

A informação do mapa de bordas que é utilizada são os níveis de cinza de cada pixel da borda. Monta-se um vetor com esses níveis de cinza e computa-se a transformada de wavelet sobre esses dados e não sobre a imagem inteira (ou seja, o background não é computado).

A análise importante a ser feita é que a wavelet foi aplicada às bordas da imagem e com isso temos uma representação da imagem como um todo e não apenas de um objeto da mesma. Outro ponto interessante é que apenas os coeficientes mais relevantes da wavelet são usados: isso facilitaria uma menor representação da imagem, possibilitando também algum tipo de indexação, caso desejado.

A transformada de wavelet utilizada foi a de Haar porque é rápida de ser computada e trabalha bem na prática [18]. Usou-se wavelet porque os vetores numéricos obtidos são invariantes às transformações afins (translação, rotação e escala); dessa forma, os usuários podem consistentemente recuperar imagens do BD através da forma.

A medida de similaridade usada por Lee foi a distância Euclidiana, dada por: 2 / 1 1 0 2

)

,

(









₋

=

∑

− = f i i i

T

Q

T

Q

D

&

A escolha da distância Euclidiana foi devido à necessidade de preservar as transformações ortonormais (tais como as wavelets) [11].

3.2. RETIN

O método RETIN (Retirevel e Interactive Tracking of Images) foi desenvolvido pela Equipe de Tratamento de Imagens e Sinal da Université de Cergy-Pontoise, na França [8]. É um método que utiliza dois tipos de consultas: global e parcial. A consulta parcial é referente a determinados objetos ou áreas selecionadas dentro da imagem. A consulta global é refente a toda imagem, este tipo de consulta que será aplicada na comparação entre os outros sistemas.

Este método promove as buscas baseadas em dois atributos das imagens: cor e textura. Para cor, emprega o histograma das cores no sistema HVS. Para textura usam diversos filtros Garbor [19], que consistem em uma decomposição espectral do sinal que determina diferentes freqüências e direções. Utilizam 12 filtros correspondendo a 4 orientações e 3 freqüências. Para cada pixel têm-se um vetor com 12 valores representando a energia de resposta de um filtro correspondente.

A extração das características é realizada dividindo-se a imagem em diversas regiões cromáticas que são reclassificadas através de uma rede neural Kohonen [20]. O mapa de Kohonen baseia-se num conjunto composto por um grande número de pixels, os quais representam uma amostragem randômica da imagem (partes), onde atributos pontuais

(4)

(cores) e locais (textura) são computados para cada uma dessas partes. Como as características não são uniformemente distribuidas na imagem, alguns dados são aglomerados em determinadas regiões, enquanto outras regiões ficam vazias. Assim, para a representação das características das regiões da imagem é empregado um histograma das regiões, que representa a distribuição estatística de um determinado atributo da imagem (cor e textura).

A medida de similaridade é realizada entre as distribuições estatísticas da imagem fornecida pelo usuário e as imagens da base de dados. A medida utilizada neste método se baseia na métrica de Minkowski (L-metrics) [21] . A função de similaridade usada permite uma flexibilidade de casamento entre a requisição de distribuição R={Ri , 1 ≤ i ≤ N} e a distribuição atingida T={Ti , 1 ≤ i ≤ N}, onde N é o número de regiões. Para solução do problema são propostas duas funções de dissimilaridade (d1 e d2) derivada de L-metrics.

d1:

( )

N p i p i i iR T T R d 1 1 1 ,     − =

∑

= α com ₁ 1 =

∑

= N i i

α

e

α

_i

≥

0

d2:

( )

N p i p j i ij N j T R T R d 1 1 1 2 ,        − =

∑∑

= = α com

1

1 1

=

∑∑

= = N i ij N j

α

e

α

_ij

≥

0

Se a distribuição não obtém uma significante estatística, a classificação correspondente é descartada, ou seja a classificação da imagem não pode ser utilizada para a recuperação. Isto faz com que o desempenho melhore.

Para melhorar a qualidade dos resultados e o tempo de resposta são usados métodos de indexação e relevance feedback, porém estes não serão considerados no trabalho. É importante ressaltar também que no estudo comparativo serão utilizados somente atributos de cores.

3.3. GRAS

O trabalho desenvolvido por [13], introduz um novo algoritmo, GRAS, acrônimo de Graph Region Arrow Shot, para reconhecimento de objetos baseados nas suas estruturas globais, ao contrário da maioria dos algoritmos propostos até hoje, que trabalham apenas com informações locais, como por exemplo o mapa de bordas.

O algoritmo GRAS obtém as características de um grupo de regiões geradas a partir de uma fase de pré-processamento. De acordo com autor, este nome foi escolhido devido ao fato das regiões serem alcançadas e ligadas (shot) pelas suas regiões vizinhas, por arcos direcionados (arrows).

3.3.1. Fase de Pré-Processamento

Antes da etapa de extração de características, é necessário realizar um pré-processamento na imagem com o objetivo de reduzir o ruído e definir as regiões onde o algoritmo irá trabalhar. As operações realizadas na fase de pré-processamento são clássicas e constam de eliminação de ruído com um filtro da média [14]; detecção do mapa de bordas utilizando por exemplo filtro Sobel [14] e eliminação de pequenas regiões através de operações morfológicas como por exemplo a dilatação. Na Fig. 2 é apresentado um diagrama de blocos dessa fase.

Figura 2 – Fase de Pré-processamento.

Na Fig. 3 tem-se uma imagem original de um objeto e na Fig. 4 mostra-se o resultado após a fase de pré-processamento. As regiões resultantes são numeradas com valores inteiros e seus centróides são calculados.

Eliminação de Ruídos Detecção de Bordas Operações Morfológicas

(5)

Figura 3 – Imagem original de um objeto

Figura 4 – Imagem pré-processada. 3.3.2. O Algoritmo GRAS

A estrutura de dados de entrada para o GRAS é uma matriz n x n (onde n é o número de regiões) onde cada elemento (i, j) é a distância do centróide da região i ao centróide da região j. A cada uma dessas regiões é atribuído um número inteiro seguindo a ordem da região mais acima para a mais embaixo. A saída do algoritmo é um grafo direcionado do qual diversas características podem ser extraídas. Essas características podem ser: maior caminho, menor caminho, número de nodos, número de ciclos, número de bifurcações em nodos com grau de entrada ou de saída menor que 2.

Essas características são características globais do grafo, que correspondem também às características globais da imagem. Essa é uma das principais contribuições do algoritmo, uma vez que não somente captura as informações locais das imagens, mas também captura informações globais.

O algoritmo usa também um outro parâmetro, d, que representa a idéia de proximidade entre os centróides das regiões do objeto. O conceito de proximidade é relativo e no algoritmo GRAS é representado como a média das distâncias. Assim, se a distância entre dois centróides é menor que o parâmetro d, diz-se que estes centroídes são próximos, o autor do GRAS frisa que outras medidas para se determinar proximidade podem ser usadas.

Essas características são extraídas durante a varredura do algoritmo, com conseqüênte ganho de custo computacional. O grafo direcionado é criado baseando-se em diversas regras descritas abaixo:

1 – Se i = 1 e existe um centróide j a uma distância menor ou igual a d, aplica-se a regra 2, caso contrário aplica-se a regra 3.

2 – Se um centróide

i

≠

j

esta a uma distância menor ou igual a d de um outro centróide j, um arco direcionado é criado de i para j. Diz-se que i flecha j por limiar.

3 – Se um centróide i não tem nenhum outro centroíde com distância menor ou igual a d, e j é o centroide mais perto, cria-se um arco de i para j. Diz-se que i flecha j por proximidade.

4 – Se um centroide

i

≠

1

ainda não tiver sido flechado, ele é flechado pelo centróide mais perto do grupo de centróides que já tenha sido flechado por algum outro centróide, de acordo com as regras 2 e 3.

(6)

5 – uma região j não pode ser flechada por uma região i se i já tiver flechada por j. 6 – Se um centroíde i posui o maior número de rótulo, este não flecha ninguém.

4 Comparação entre os Métodos

Observa-se que os métodos diferem no tratamento do problema; entretanto, todos utilizam o mesmo princípio para a recuperação da imagem.

No caso da extração de características, o SCARLET utiliza Transformadas de Wavelets no mapa de bordas da imagem para extrair informação da forma. O RETIN utiliza histogramas de cores da imagem para extração de informação de cor. O GRAS, por sua vez, usa a relação espacial entre as regiões da imagem para capturar informações da estrutura global da imagem.

Como o sistema RETIN utiliza informações de cor para comparação das imagens, suas imagens de entrada devem ser somente cromáticas. Já os sistemas GRAS e SCARLET, como não utilizam informações de cor, as imagens cromáticas são transformadas para escala de cinza antes de serem efetivamente tratadas; portanto, estes sistemas aceitam tanto imagens cromáticas como monocromáticas.

Para a fase de recuperação, o SCARLET usa distância Euclidiana. O RETIN usa duas funções de dissimilaridade baseadas na métrica L. Já o GRAS utiliza o modelo vetorial [26].

4.1 Experimentos

Para os experimentos, utilizou-se a Base de Dados Columbia [29], que contém imagens coloridas de 100 objetos isolados, cada objeto possuindo 72 perspectivas, diferenciando de 5º cada uma, totalizando 7.200 imagens. Esta base é adequada para avaliar o desempenho dos sistemas por ser uma base de dados controlada (iluminação, rotações etc). Nos testes utilizou-se imagens de 100 objetos, sendo 10 perspectivas de cada objeto variando de 0º a 45º, totalizando um grupo de 1000 imagens. Na Fig. 5 tem-se exemplos de imagens da base de dados Columbia, de um mesmo objeto com nove perspectivas diferentes, variando de 0º a 40º.

(7)

Realizou-se um conjunto de 1.000 testes para cada método apresentado, utilizando cada uma das imagens, do grupo de 1.000 imagens, como imagem de consulta. Calculou-se os valores de precisão (P) e revocação(R) através das seguintes equações: rel N r R N r P= , =

onde N é o número total de imagens recuperadas, r o número das imagens relevantes recuperadas, e Nrel é o número total de imagens relevantes na coleção. Calculou-se então a média das 1.000 consultas e plotou-se os resultados em um gráfico apresentados na Fig. 6.

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 Revocação P re c is ã o

GRAS RETIN SCARLET

Figura 6 – Gráfico Precisão x Revocação

Pelo gráfico, pode-se perceber que o sistema SCARLET foi o de pior resultado tendo desempenho abaixo dos outros em todo o gráfico, já o sistema RETIN foi o de maior precisão na faixa de revocação 0,33 a 0,80, e o GRAS foi mais preciso na faixa de revocação de 0,1 a 0,33.

O sistema RETIN foi o que obteve a melhor precisão na média; entretanto, não significa que ele seja o melhor para todas as aplicações.

Se houvesse, por exemplo, uma base de dados muito grande - como a Internet - não seria necessário retornar uma grande porcentagem das imagens relevantes da base de dados; neste caso, o GRAS seria mais eficiente pois numa faixa de revocação baixa ele é mais preciso.

No caso da busca ser realizada em uma base de dados especializada, com um número restrito de imagens, e que se desejasse obter o maior número possível de imagens relevantes; assim, o sistema RETIN seria o mais eficiente, pois ele demonstrou maior precisão numa faixa maior de revocação.

Deve-se levar em consideração que os testes foram realizados em uma base de dados controlada, onde os grupos de imagens, que representam imagens relevantes, são perspectivas de um mesmo objeto. Nestas perspectivas, as variações de cores são muito pequenas favorecendo o resultado do sistema RETIN, já que o mesmo se baseia em informações de cor, enquanto o GRAS utiliza informações da estrutura global da imagem, e o SCARLET informações da forma.

5 Conclusão

As técnicas abordadas neste trabalho se mostraram eficientes, retornando resultados desejados. Porém, como dito anteriomente, é importante citar que os experimentos foram realizados em uma base de dados controlada. Em uma base de dados de imagens naturais estas técnicas devem obter resultados bem inferiores, pois este tipo de imagens é bem mais complexa.

(8)

Percebeu-se que para a base utilizada, os sistemas RETIN e GRAS se mostraram superior ao sistema SCARLET, sendo que na média o RETIN foi o melhor de todos. Salientando que, dependendo da aplicação, o GRAS seria mais adequado por possuir maior precisão em uma faixa menor de revocação.

Pode-se perceber também que o uso da Tecnologia RIBIC ainda é restrita, não pela falta de necessidade do usuário para a utilização deste tipo de sistema, mas porque ainda estão longe de se atender às reais necessidades. Por exemplo, os usuários podem não estar interessados em recuperar imagens baseadas na “similaridade”, mas sim interessados em recuperar fotos e cenas específicas, de um tipo particular de objeto, fenômeno ou evento. Desse modo, ainda existem muitos caminhos a serem percorridos nesta área, para que os sistemas RIBC cheguem ao nível dos sistemas de busca atuais de documentos de texto.

6 Trabalhos Futuros

Como trabalhos futuros, é sugerido a execução de testes sobre uma base de dados de imagens naturais, para verificação do comportamento entre os métodos.

Outra passo a ser tomado seria avaliar a eficiência de tempo de consulta de cada método em bases de dados maiores e utilizar técnicas para melhorar seu desempenho.

7 Bibliografia

[1] C. Li, R. Smith, Decoding Image Semantics Using Composite Region Templates, IEEE CVPR-98 Workshop on Content-based Access to Image, Video Databases, June, 1998.

[2] Columbia object image library (coil-100). Department of Computer Science, Columbia University. htp://www.cs. columbia.edu/CAVE/research/softlib/coil-100.html.

[3] G. Gagaudakis, P. L. Rosin. Incorporation shape into histograms of CBIR. Pattern Recognition, 35:81-91, 2002. [4] H. Müller, W. Müller, D. Squire, S. Marchand-Maillet, T. Pun. Performance evaluation in content-based image retrieval: overview and proposals. Pattern Recognition Letters, 22:593-601, 2001.

[5] H. Yoo, D. Jang, S. Jung, Jin Park, K Song. Visual information retrieval system via content-based approach. Pattern Recognition, 35:749-769, 2002.

[6] H. Yoo, S. Jung, D. Jang, Y. Na. Extraction of major object features using VQ clustering for contet-based image retrieval. Pattern Recognition, 35:1115-1126, 2002.

[7] I. Fudos, L. Palios. An efficient shape-based approach to image retrieval. Pattern Recognition Letters, 23:731-741, 2002.

[8] J. Fournier, M. Cord, S. Philipp-Foliguet. RETIN: A content-based image indexing and retrieval system. Pattern Analysis and Applications Journal, vol. 4(2/3): 153-173, 2001.

[9] J. P. Eakins. Towards. Intelligent image retrieval. Pattern Recognition, 35:3-14, 2002.

[10] L. Cinque, G. Ciocca, S. Levialdi, A.Pellicanò, R. Schettini. Color-based image retrieval using spatial-chromatic histograms. Image and Vision Computing, 19:979-986, 2001.

[11] Dong-Ho Lee, H. Kim. A Fast Content-Based Indexing and Retrieval Technique by the Shape Information in Large Image Database. The Journal of Systems and Software 56, 165-182, 2001.

[12] M. S. Lew. Principles of Visual Information Retrieval. Springer, 2001.

[13] P. S. Rodrigues, A. Araújo. A Region-based object recognition algorithm. In Proc. of SIBGRAPI’ 02 (do appear) . Fortaleza, Brazil, october, 2002

[14] R. C. Gonzalez, R. E. Woods. Digital Image Processing. Addison Wesley, 1992

[15] Y. Rubner, J. Puzicha, C. Tomasi, J. Buhmann. Empirical evaluation of dissimilarity measures for color and texture. Computer Vision and Image Understanding, 84: 25-43 (2001).

[16] J. Eakins, M. Graham. Content-based image retrieval. Available online at http:// www.unn.ac.uk/iidr/CBIR/ report.html, Setembro, 2002. JISC Technology Applications Programme Report 39.

[17] C. Sidnwy Burrus, Ramesh A. Gopinath, Haitao Guo. Introduction to Wavelets and Wavelets Transforms. Ed. Paperback, 2000.

(9)

[18] C.E. Jacobs, A. Finkelstein, D. H. Salesin. Fast Multiresolution Image Query. Proceedings of the ACM SIBGRAPH, 1995.

[19] D. Garbor. Theory of Communication. The Journal of the Institute of Electrical Engineers, 93 (21) (Part III): 492-457, January 1946.

[20] T. Kohonen. The self-organizing map. Proc IEEE, 78(9), 1990.

[21] A. Heinrichs, D. Koubaroulis, et al. Robust image retrieval in a statistical framework. Technical report rr-04.99, Ruhr-Universitat Bochum, Germany, April 1999.

[22] Faloutsos, C. Fast Searching by Content in Multimedia Databases. Data Engineering Bulltein 18 (4), 31-40. 1995. [23] Hirata, K. Kato, T. Query byVisual Example-Content Based Image Retrieval. Advances in Database Technology (EDBT’ 92), 56-71. 1992.

[24] Ooi, B.C., Tan, K.L. Chua, T.S., Hsu, W. Fast Image Retrieval Using Color-Spatial Information. The VLDB Journal 7 (2), 115-128, 1998.

[25] Smith, J.R., Chang, S.F. VisualSEEK: A Fully Automatec Conten-Based Image Query System. ACM Multimedia 96, Boston, MA, 87-98. 1996.