• Nenhum resultado encontrado

Recuperação de Imagens da Web Utilizando Múltiplas Evidências Textuais e Programação Genética

N/A
N/A
Protected

Academic year: 2021

Share "Recuperação de Imagens da Web Utilizando Múltiplas Evidências Textuais e Programação Genética"

Copied!
15
0
0

Texto

(1)

Recuperac¸˜ao de Imagens da Web Utilizando M ´ultiplas

Evidˆencias Textuais e Programac¸ ˜ao Gen´etica

Katia C. L. Santos1, Humberto M. Almeida1, Marcos A. Gonc¸alves1, Ricardo da S. Torres2

1Departamento de Ciˆencia da Computac¸˜ao – Universidade Federal de Minas Gerais (UFMG)

Av. Antˆonio Carlos 6627 - ICEx – 31.270-901 – Belo Horizonte – MG – Brazil

2Instituto de Computac¸˜ao

Universidade Estadual de Campinas (Unicamp) – Campinas, SP – Brasil {katia,hmossri,mgoncalv}@dcc.ufmg.br, rtorres@ic.unicamp.br Abstract. This paper describes an image retrieval framework that employs a evolutionary approach. The proposed framework explores Genetic Program-ming for combining multiple textual sources of evidence associated to Web im-ages. Experiments performed with a collection extracted from the Web formed by 1,223,829 pages and 254,495 images showed that the evolutionary frame-work was able to overcome the Belief Netframe-works (Bayesian Model) with gains upper to 100% for precision (p@n and MAP) and recall measures.

Resumo. Este artigo apresenta um arcabouc¸o para recuperac¸˜ao de imagens da Web que emprega uma abordagem evolucion´aria. O arcabouc¸o proposto con-siste na utilizac¸˜ao da Programac¸˜ao Gen´etica para combinac¸˜ao de m´ultiplas evidˆencias textuais associadas a imagens da Web. Experimentos realizados com uma colec¸˜ao extra´ıda da Web contendo 1.223.829 p´aginas e 254.495 ima-gens mostram que o arcabouc¸o evolucion´ario foi capaz de superar as Redes de Crenc¸a (Modelo Bayesiano) com ganhos superiores a 100% na recuperac¸˜ao de imagens, considerando as medidas de precis˜ao (p@n e MAP) e revocac¸˜ao.

1. Introduc¸˜ao

Os avanc¸os no armazenamento de dados e nas tecnologias para aquisic¸˜ao de imagens tornaram poss´ıvel a criac¸˜ao de grandes bases ou colec¸˜oes de imagens [Torres et al. 2009]. Al´em disso, o enorme sucesso da Web tem proporcionado baixo custo e acessibilidade em larga escala deste material [Coelho et al. 2004]. Em [Modesto et al. 2005], conforme dados extra´ıdos no ano de 2005, constatou-se que o tipo de arquivo multim´ıdia mais encontrado na Web brasileira corresponde a imagens. Aliado a esses fatores, uma vari-edade de atividades lucrativas demandam transferˆencia de informac¸˜ao baseada em ima-gem. Exemplos t´ıpicos s˜ao projetos arquitetˆonicos, desenhos de engenharia e de moda, perfumes, novos carros, campanhas de marketing, p´aginas da Internet, etc. Todas essas necessidades tˆem levado a um crescimento do interesse em organizar, indexar e consultar imagens digitais na ´ultima d´ecada [Datta et al. 2008].

Em uma colec¸˜ao que cont´em imagens, o servic¸o de consulta ou recuperac¸˜ao de imagens ´e de extrema relevˆancia para o usu´ario. Na literatura relacionada, a recuperac¸˜ao de imagem ´e geralmente baseada em uma das duas abordagens b´asicas: recuperac¸˜ao baseada em conte´udo ou recuperac¸˜ao baseada em texto. Na recuperac¸˜ao baseada em

(2)

conte´udo, caracter´ısticas da imagem, como cor, forma ou textura, s˜ao utilizadas para indexac¸˜ao e busca. Para fazer uma consulta, o usu´ario provˆe um esboc¸o de um desenho do que deseja recuperar, uma imagem-exemplo (que pode ou n˜ao pertencer `a colec¸˜ao) do que deseja ou simplesmente uma combinac¸˜ao de ambos. J´a na recuperac¸˜ao baseada em texto, a indexac¸˜ao e a busca s˜ao realizadas a partir de evidˆencias textuais associadas `as imagens da colec¸˜ao. Exemplos de evidˆencias textuais s˜ao: anotac¸˜oes expl´ıcitas sobre o conte´udo da imagem, texto nas redondezas da imagem e o pr´oprio nome do arquivo da imagem.

Em linhas gerais, para uma ampla colec¸˜ao, a adoc¸˜ao de indexac¸˜ao com posterior recuperac¸˜ao de imagem somente baseada no conte´udo apresenta como desvantagens o alto custo computacional para se extrair caracter´ısticas de cada uma das imagens e uma dificuldade no processo de busca relacionado `a necessidade intr´ınseca ao processo de se definir um rascunho da imagem objetivo para expressar a consulta do usu´ario. J´a para a realizac¸˜ao dos processos de indexac¸˜ao e recuperac¸˜ao baseada em texto identifica-se como problema a definic¸˜ao de quais evidˆencias textuais relacionadas `as imagens s˜ao mais relevantes para representar o conte´udo da imagem.

Este artigo apresenta um arcabouc¸o evolucion´ario para recuperac¸˜ao de imagens. Este opera a partir da combinac¸˜ao de m´ultiplas evidˆencias textuais e utiliza os preceitos da Programac¸˜ao Gen´etica (PG), baseada na id´eia de melhoramento cont´ınuo da qualidade da soluc¸˜ao de um dado problema a partir de soluc¸˜oes anteriores. Dentre os fatores que motivam a utilizac¸˜ao da PG para o referido problema a ser tratado podem ser citados: a automatizac¸˜ao do processo de melhoria do resultado; o fato de n˜ao requerer que a func¸˜ao de avaliac¸˜ao a ser usada seja cont´ınua, desde que ela possa diferenciar boas soluc¸˜oes (mais pr´oximas do ´otimo global) de soluc¸˜oes razo´aveis (´otimos locais), proporcionando comu-mente bons resultados, independentecomu-mente da consulta realizada; o paralelismo intr´ınseco `a t´ecnica; a capacidade de escolher automaticamente as melhores evidˆencias e combin´a-las de forma efetiva e a obtenc¸˜ao de bons resultados quando utilizada a Programac¸˜ao Gen´etica para soluc¸˜ao de outros problemas de ranqueamento [Lacerda et al. 2006], [Almeida et al. 2007], [Carvalho et al. 2008] e [Ferreira et al. 2008].

Este trabalho est´a organizado da seguinte maneira. Na sec¸˜ao 2 s˜ao apresentados alguns dos trabalhos relacionados ao tema de recuperac¸˜ao de imagens a partir do conte´udo ou texto. Nas sec¸˜oes 3 e 4 s˜ao discutidos, respectivamente, o arcabouc¸o evolucion´ario e o baseline de comparac¸˜ao, desenvolvido este a partir da teroria das Redes de Crenc¸a (Mo-delo Bayesiano). Os experimentos realizados com ambas as soluc¸˜oes para o Problema de Recuperac¸˜ao de Imagens da Web s˜ao apresentados na sec¸˜ao 5. Ao final, s˜ao apresenta-dos na sec¸˜ao 6 as conclus˜oes e os trabalhos futuros que se seguir˜ao a partir deste estudo inicial.

2. Trabalhos Relacionados

Grandes sistemas de recuperac¸˜ao de imagens, como Google [Google 2009], Yahoo [Yahoo 2009] e MSN [MSN 2009], permitem que os usu´arios da Web realizem con-sultas a imagens a partir de palavras-chave, de forma similar a busca por p´aginas Web. Esses sistemas utilizam anotac¸˜ao autom´atica de imagem e t´ecnicas de ´ındice invertido para atender as consultas dos usu´arios e ent˜ao retornam as imagens relevantes com base nas palavras-chave informadas na consulta.

(3)

Em [Chang 2008] ´e proposto um sistema para recuperac¸˜ao de imagens da Web que contempla t´ecnicas de anotac¸˜ao autom´atica das imagens da colec¸˜ao. Nesse cen´ario, s˜ao armazenadas somente as imagens reduzidas, denominadas thumbnails e informac¸˜oes da imagem como largura, altura e formato do arquivo, al´em de dados extra´ıdos do pr´oprio documento HTML, como o conte´udo das tags img, table e a.

Em [Coelho et al. 2004] ´e empregada a t´ecnica da recuperac¸˜ao de imagens da Web a partir de evidˆencias textuais apenas. S˜ao consideradas quatro fontes de evidˆencia con-tidas em documentos Web: tags de descric¸˜ao, tags de metadados, texto completo e pas-sagens textuais. O objetivo do trabalho ´e definir um subconjunto dessas evidˆencias de forma que o resultado das consultas realizadas utilizando a combinac¸˜ao delas seja melhor que a utilizac¸˜ao de uma ´unica fonte de evidˆencia textual. Para a recuperac¸˜ao das imagens a partir de evidˆencias textuais m´ultiplas, ´e empregado o conceito de Redes Bayesianas. Re-sultados obtidos mostraram que a combinac¸˜ao de evidˆencias m´ultiplas produz melhores resultados que a utilizac¸˜ao de uma ´unica fonte de evidˆencia. As duas principais fontes de evidˆencias destacadas pelos experimentos foram as tags de descric¸˜ao e as passagens textuais com 40 termos.

Com o objetivo de viabilizar consultas a uma base de dados mista for-mada por imagens e texto, al´em de melhorar a qualidade das respostas obtidas, em [Torres et al. 2006] ´e apresentado um arcabouc¸o para Sistemas de Informac¸˜ao sobre Bio-diversidade. Os experimentos realizados mostraram que a combinac¸˜ao de metadados de ambos os tipos de evidˆencias (imagem e texto) apresentam melhores resultados que a utilizac¸˜ao de apenas uma fonte de informac¸˜ao. Outros experimentos envolvendo tamb´em a recuperac¸˜ao baseada no conte´udo da imagem, al´em dos metadados de ambas as fontes (imagens e texto), apresentaram melhores resultados. Os resultados v˜ao ao encontro do esperado pelos pr´oprios autores, pois a combinac¸˜ao de v´arias fontes de evidˆencia hetero-gˆeneas contribuiu em algum grau para o resultado final.

Diferentes abordagens para descoberta de func¸˜oes de ordenac¸˜ao baseadas em t´ecnicas de aprendizado de m´aquina, tais como algoritmos gen´eticos e programac¸˜ao gen´etica, tˆem sido propostas na literatura de recuperac¸˜ao de informac¸˜ao. Em [Fan et al. 2000] ´e proposta uma nova abordagem para gerar automaticamente estrat´egias de ponderac¸˜ao de termos para diferentes contextos baseada em Programac¸˜ao Gen´etica. Como argumento ´e apresentado que cada contexto espec´ıfico exige um estrat´egia diferente de ponderac¸˜ao de termos, isto ´e, uma func¸˜ao de ordenac¸˜ao deve ser adaptada para diferen-tes colec¸˜oes de documentos. Ao longo dos anos de pesquisa, os trabalhos apresentados em [Fan et al. 2004b], [Fan et al. 2004c], [Fan et al. 2004d] e [Fan et al. 2005] tˆem de-monstrado que a Programac¸˜ao Gen´etica ´e uma t´ecnica eficaz para melhorar a efic´acia da tarefa de recuperac¸˜ao de informac¸˜ao. Em [Fan et al. 2004a], ´e estudado tamb´em o efeito de diferentes func¸˜oes de utilidade, isto ´e, func¸˜oes que, quando usadas como func¸˜oes de aptid˜ao, privilegiam a recuperac¸˜ao de documentos relevantes no topo da lista de docu-mentos retornados. Uma func¸˜ao de aptid˜ao ´e aquela utilizada na Programac¸˜ao Gen´etica para avaliar a qualidade de uma soluc¸˜ao do problema ou indiv´ıduo. Em todos esses traba-lhos, os terminais, elementos constituintes de um indiv´ıduo definidos no arcabouc¸o evolu-cion´ario, s˜ao baseados fundamentalmente em informac¸˜oes estat´ısticas brutas da colec¸˜ao, documentos, termos e consultas, tais como freq¨uˆencia do termo (tf), n´umero total de documentos, tamanho em bytes de um documento, n´umero de termos distintos em um

(4)

documento, etc. Em [Fan et al. 2004c], os autores comparam sua abordagem (referenci-ada de agora em diante por FAN-GP) com uma abordagem base(referenci-ada em aprendizado de m´aquina que utiliza redes neurais. Nesse trabalho, os resultados mostram que FAN-GP supera substancialmente a estrat´egia baseada em redes neurais. Em [Fan et al. 2005], FAN-GP descobre func¸˜oes de ordenac¸˜ao para busca na Web, explorando a informac¸˜ao de estrutura dos documentos Web, superando uma outra abordagem baseada em m´aquinas de vetor de suporte na tarefa de recuperac¸˜ao de informac¸˜ao.

A utilizac¸˜ao da Programac¸˜ao Gen´etica pelo grupo de pesquisa do qual os au-tores do presente trabalho participa tem resultado em soluc¸˜oes de destaque em outros problemas. Em [Lacerda et al. 2006] foi proposta uma abordagem para solucionar a dif´ıcil tarefa de associar automaticamente an´uncios publicit´arios com p´aginas Web. Uma estrat´egia evolucion´aria para definir o ranking de colec¸˜oes distintas foi proposta e avaliada em [Almeida et al. 2007]. J´a o problema conhecido na literatura relacionado como Identificac¸˜ao de R´eplicas foi tratado em [Carvalho et al. 2008]. Arcabouc¸os para recuperac¸˜ao de imagens por conte´udo com realimentac¸˜ao de relevˆancia foram tratados em [Ferreira et al. 2008].

3. O Arcabouc¸o Evolucion´ario

Algoritmos Gen´eticos (AG) e Programac¸˜ao Gen´etica (PG) formam um conjunto de t´ecnicas de Inteligˆencia Artificial para soluc¸˜ao de problemas baseados no princ´ıpio de heranc¸a biol´ogica e evoluc¸˜ao. A principal diferenc¸a entre essas duas t´ecnicas refere-se `a representac¸˜ao interna, ou estrutura de dados, de um indiv´ıduo [Zhang 2006]. Em geral, aplicac¸˜oes em AG representam um indiv´ıduo como uma string de bits de tamanho fixo, como (11011110...) ou uma sequˆencia de n´umeros reais (1,2, 2,4,...). Por outro lado, na PG s˜ao utilizadas estruturas de dados mais complexas como ´arvores, listas encadeadas ou pilhas. Estas estruturas de dados n˜ao tˆem tamanho fixo, entretanto pode ser restringido o seu tamanho por um parˆametro denominado profundidade. A profundidade corresponde ao n´umero de n´ıveis, ou distˆancia, entre o nodo raiz e os nodos folhas ou terminais da ´arvore. Cada soluc¸˜ao potencial, na PG, ´e chamada de um indiv´ıduo (ou seja, um cromos-somo) em uma populac¸˜ao [Zhang 2006].

A seguir, o funcionamento de algoritmo que adota a t´ecnica de PG ´e descrito. Inicialmente, ´e criada uma populac¸˜ao de indiv´ıduos, geralmente por meio de um m´etodo aleat´orio. A partir deste ponto, enquanto o crit´erio de parada para o algoritmo n˜ao for atingido, s˜ao realizadas avaliac¸˜oes sobre a qualidade de cada indiv´ıduo da populac¸˜ao atual. Um crit´erio de parada comumente adotado ´e o n´umero m´aximo de iterac¸˜oes do algoritmo, denominado na Programac¸˜ao Gen´etica como n´umero de gerac¸˜oes. Para avaliar a populac¸˜ao de indiv´ıduos, ´e atribu´ıdo um valor de aptid˜ao para esse indiv´ıduo, com base em uma lei de avaliac¸˜ao comum a todos os indiv´ıduos de todas as iterac¸˜oes sub-sequentes. Ap´os a avaliac¸˜ao da populac¸˜ao, s˜ao aplicadas transformac¸˜oes gen´eticas, tais como selec¸˜ao1, cruzamento2, mutac¸˜ao3e reproduc¸˜ao4, com o objetivo de criar indiv´ıduos

1Rotina utilizada para selecionar um indiv´ıduo de uma populac¸˜ao.

2Dois indiv´ıduos previamente selecionados sofrem um corte em cada uma das ´arvores que os

represen-tam, trocando depois os ramos cortados de cada um deles e formando dois novos indiv´ıduos.

3Um indiv´ıduo ´e escolhido aleatoriamente para se submeter a uma mutac¸˜ao que poder´a ser a n´ıvel local

de um nodo da ´arvore, ou modificando um ramo do mesmo.

(5)

mais diversos e com melhor desempenho nas gerac¸˜oes subsequentes. Em seguida, a populac¸˜ao ´e novamente avaliada e o teste de parada ´e realizado. Esse ciclo repete-se at´e que o crit´erio de parada seja satisfeito.

Para o emprego da PG, inicialmente ´e necess´ario definir claramente qual ´e o ob-jetivo da soluc¸˜ao computacional que se deseja modelar. No contexto do nosso problema, as fontes de informac¸˜ao s˜ao quatro tipos de evidˆencias textuais extra´ıdas dos documentos HTML onde as imagens est˜ao inseridas: metadados, tags de descric¸˜ao, passagens textu-ais (essas comportam as quantias de 10, 20 e 40 termos ao redor da imagem) e o texto completo. Dessa forma, o objetivo do arcabouc¸o evolucion´ario pode ser definido como: definir uma func¸˜ao que combine as evidˆencias textuais de tal forma que esta func¸˜ao seja utilizada para determinar um conjunto-resposta ordenado (rank) mais preciso quanto a relevˆancia para uma dada consulta.

Para atingir tal objetivo, utilizamos a biblioteca lilgp [Zongker and Punch 1996]. Na modelagem do arcabouc¸o a partir desta biblioteca, definimos como sendo formador do conjunto de terminais os operadores aritm´eticos de soma, multiplicac¸˜ao, produto e logaritmo e o valor de tf-idf de cada evidˆencia textual. O valor de tf-idf consiste na multiplicac¸˜ao de duas medidas calculadas de forma independente: a frequˆencia do termo na evidˆencia textual (tf) e o inverso da frequˆencia do termo na evidˆencia textual (idf). Para o termo ti dentro da evidˆencia dj, o valor de tf-idf pode ser obtido por meio da seguinte

relac¸˜ao: tf ∗ idf (ti, dj) = ni,j P knn,k ∗ |D| |dj : ti ∈ dj|

onde ni,j ´e o n´umero de ocorrˆencias do termo considerado na evidˆencia textual dj,Pknn,k

´e a soma do n´umero de ocorrˆencias de todos os termos na evidˆencia textual dj, |D| ´e

n´umero total de imagens na colec¸˜ao e|dj : ti ∈ dj| ´e n´umero de imagens para a qual o

termo tiest´a associado (ou seja, ni,j 6= 0). No caso de consultas com mais de um termo, o

valor do terminal consiste na soma aritm´etica dos valores tf-idf de cada termo da consulta existente na evidˆencia textual correspondente, que est´a associada `a imagem.

Para viabilizar o processo de evoluc¸˜ao da populac¸˜ao, foi necess´ario ainda definir uma m´etrica de c´alculo da func¸˜ao de aptid˜ao de um dado indiv´ıduo. Essa informac¸˜ao ´e de extrema importˆancia, pois ela avalia o qu˜ao bom um indiv´ıduo ´e na populac¸˜ao. Em func¸˜ao dos bons resultados obtidos em [Almeida et al. 2007], foi utilizada a m´etrica Mean Aver-age Precision (MAP). Na sec¸˜ao 5.3.2 h´a uma definic¸˜ao desta m´etrica.

4. Baseline

Para avaliar o desempenho do arcabouc¸o evolucion´ario, foi selecionado o Modelo Bayesiano, originalmente utilizado em [Coelho 2001]. O Modelo Bayesiano combina as mesmas evidˆencias textuais empregadas no presente trabalho como fonte de informac¸˜ao sobre imagens da Web: tags de descric¸˜ao, metadados, texto completo e passagens textu-ais com 10, 20 e 40 termos. Do Modelo Bayesiano apresentado em [Coelho et al. 2004] podem ser extra´ıdas diferentes equac¸˜oes que combinam m´ultiplas evidˆencias textuais, vi-abilizando a identificac¸˜ao das evidˆencias textuais mais adequadas para relacionar com o conte´udo da imagem. Esta ´e uma caracter´ıstica similar ao arcabouc¸o evolucion´ario, pois este tem como resultado de sua execuc¸˜ao uma func¸˜ao que combina as diversas fontes de evidˆencias. Al´em disso, o Modelo Bayesiamo serve como uma ferramenta te´orica e

(6)

formal de avaliac¸˜ao e estudo tanto das evidˆencias em isolado quanto de forma de com-bin´a-las. Esses fatos motivaram a selec¸˜ao do Modelo Bayesiano como baseline. A Tabela 1 mostra as v´arias equac¸˜oes de recuperac¸˜ao de imagem usadas por [Coelho et al. 2004].

Cada equac¸˜ao define uma func¸˜ao para avaliac¸˜ao das imagens da colec¸˜ao, com relac¸˜ao a consulta realizada e as evidˆencias textuais extra´ıdas. Nas equac¸˜oes foi adotada a seguinte notac¸˜ao: j ´e uma imagem da colec¸˜ao, q ´e consulta e η ´e uma constante de normalizac¸˜ao [Pearl 1988] utilizada para garantir que a soma das probabilidades de todas as imagens, para uma determinada consulta, seja sempre igual a 15. O valor da

simila-ridade de um documento dj (documento HTML que cont´em a imagem j) com relac¸˜ao `a

consulta q ´e dado por P(dj|k). As denominac¸˜oes RDjq, RMjqe RP jq correspondem `as

respectivas probabilidades para as evidˆencias textuais relacionadas `as tags de descric¸˜ao, metadados e passagens textuais. Neste ´ultimo caso, s˜ao contempladas as passagens de 10, 20 ou de 40 termos e o texto completo. Para cada tipo de evidˆencia textual considerada, o valor de P(dj|k) ´e obtido a partir da seguinte relac¸˜ao:

P(dj|k) = Pt i=1wij ∗ wiq q Pt i=1w2ij ∗ q Pt i=1wiq2

O valor de k ´e o estado em que figuram exatamente as palavras-chaves ativas que est˜ao na consulta q. J´a wij ´e o peso do termo ki na evidˆencia textual considerada, associada `a

imagem Ij e wiq ´e o peso do termo i na consulta do usu´ario. Esses pesos s˜ao definidos

como: wij = (1 + ln fij) e wiq = ln(1 +Nn

i). Nestas relac¸˜oes, fij ´e a frequˆencia do termo

ki na evidˆencia textual considerada da imagem Ij; N ´e o n´umero total de imagens e ni ´e

o n´umero de evidˆencias textuais, do tipo considerado, que contˆem o termo ki.

Abordagem P(ij|q)

Tags de descric¸˜ao η∗ RDjq

Metadados η∗ RMjq

Passagens/Texto Completo η∗ RPjq

Descric¸˜ao + Metadados η∗ [1 − (1 − RDjq) ∗ (1 − RMjq)] Descric¸˜ao + Passagens/Texto Completo η∗ [1 − (1 − RDjq) ∗ (1RPjq)] Passagens/Texto Completo + Metadados η∗ [1 − 1 − RPjq) ∗ (1 − RMjq)]

Descric¸˜ao + Metadados + Passagens η∗ [1 − (1 − RDjq) ∗ (1 − RMjq) ∗ (1 − RPjq)]

Tabela 1. Combinac¸ ˜ao de evid ˆencias modeladas no Modelo de Redes de Crenc¸a.

5. Experimentos

5.1. Colec¸˜ao

Os experimentos realizados tiveram por objetivo avaliar a efic´acia dos m´etodos de recuperac¸˜ao de imagens da Web. Para isso, foi utilizada uma colec¸˜ao Web, extra´ıda de parte do diret´orio Yahoo. A Tabela 2 apresenta um resumo de algumas estat´ısticas levantadas sobre a referida colec¸˜ao:

5O valor de η ´e apresentado apenas para garantir a corretude te´orica do modelo, portanto n˜ao afeta os

(7)

Tamanho da colec¸˜ao (GB) 20 N ´umero de p´aginas 1.223.829 N ´umero de Imagens Distintas 254.495

N ´umero de Consultas 35

N ´umero de Imagens Relevantes Por Pool de Consulta 35,7 Tabela 2. Caracter´ısticas da colec¸ ˜ao Web usada nos experimentos.

5.2. Consultas

Para definic¸˜ao das consultas textuais a serem avaliadas e de seu conjunto de imagens rele-vantes associadas foi adotado o m´etodo pooling, comumente adotado nas colec¸˜oes TRECs [Voorhees and Harman 2000]. Foram selecionadas e avaliadas 35 consultas. Parte destas consistem em consultas populares retiradas do log da m´aquina de busca TodoBr e que se encontram dispon´ıveis na colec¸˜ao WBR99. Outra parte das consultas consiste naquelas utilizadas no trabalho [Coelho et al. 2004]. O julgamento de relevˆancia do conjunto for-mado por um pool contendo as respostas obtidas por cada evidˆencia em isolado, para cada uma das consultas, foi realizado por dois volunt´arios, seguindo a definic¸˜ao de relevˆancia ou n˜ao-relevˆancia, independentemente da forma como as imagens foram recuperadas. Nos casos de discordˆancia quanto ao julgamento de relevˆancia, foram realizadas novas avaliac¸˜oes em conjunto para determinar a relevˆancia ou a n˜ao-relevˆancia.

Foram consideradas as seguintes consultas: por do sol, igreja, coca cola, Cor-covado, Serra da Canastra, Linux, Jesus, Piren´opolis, Fernando de Noronha, fotos, carnaval, tubar˜ao, alimentos transgˆenicos, animais, backstreet boys, cart˜oes de natal, cart˜oes virtuais, filmes, pokemon, hotel fazenda, ´ındios, jornal, machado de assis, ma-conha, mp3, munic´ıpios, origem da vida, papel de parede, piadas, poesias, poluic¸˜ao, receitas, turismo, vestibular e v´ırus.

5.3. M´etricas

Para a avaliac¸˜ao da efic´acia dos m´etodos avaliados, foram utilizadas as m´etricas descritas nas sec¸˜oes seguintes: precis˜ao, revocac¸˜ao e MAP.

5.3.1. Precis˜ao e Revocac¸˜ao

Considere uma requisic¸˜ao de informac¸˜ao I de exemplo (de uma colec¸˜ao de referˆencia de teste) e seu conjunto R de documentos relevantes. Seja|R| o n´umero de documentos neste conjunto. Assuma que uma dada estrat´egia de recuperac¸˜ao (que est´a sendo avaliada) processa a requisic¸˜ao de informac¸˜ao I e gera um conjunto de documentos de resposta A. Seja |A| o n´umero de documentos neste conjunto. Al´em disso, seja |Ra| o n´umero de

documentos na intersec¸˜ao dos conjuntos R e A. Assim, a revocac¸˜ao (recall) ´e a frac¸˜ao dos documentos relevantes (o conjunto R) que foram recuperados, ou seja, Revocac¸˜ao =

Ra

R. A precis˜ao ´e a frac¸˜ao dos documentos recuperados (o conjunto A) que ´e relevante, ou

seja, Precis˜ao = Ra

A.

A efic´acia do m´etodo avaliado, para um conjunto de consultas, pode ser avaliado pela curva de precis˜ao versus revocac¸˜ao, obtido a partir dos valores dessas m´etricas que

(8)

foram calculados pelas relac¸˜oes anteriores. Um determinado ponto na curva pode ser in-terpretado da seguinte maneira: considerando o percentual de documentos relevantes que foram recuperados (revocac¸˜ao), h´a um valor que corresponde `a relevˆancia dos documen-tos recuperados (precis˜ao). Maiores detalhes sobre essas m´etricas podem ser obtidos em [Baeza-Yates and Ribeiro-Neto 1999].

5.3.2. Mean Average Precision

A m´etrica Mean Average Precision (MAP) representa o valor m´edio das precis˜oes cal-culadas sobre o valor m´edio de um conjunto de consultas e definida como M AP =

1 k

Pk

q=1Pq, onde k ´e o n´umero total de consultas e Pq ´e a precis˜ao m´edia nos documentos

relevantes recuperados para a consulta q. Pq ´e definida como:

Pq= 1 n( m X i=1 rqi ∗ 1 i i X j=1 rqj)

onde m ´e o n´umero de documentos retornados como resultado da consulta q, n ´e o n´umero total de documentos relevantes para a consulta q e rqi ´e 1 se o i-´esimo documento

retor-nado ´e relevante e 0 zero caso contr´ario. Esta m´etrica intuitivamente atribui um peso maior aos documentos relevantes que aparecem nas posic¸˜oes do topo da lista do rank [Silva et al. 2009].

5.4. Metodologia

Os experimentos iniciais foram realizados com as diferentes equac¸˜oes de recuperac¸˜ao de imagem do Modelo Bayesiano, apresentadas na Tabela 1. Em seguida, foram realizados experimentos comparativos com o arcabouc¸o evolucion´ario e as equac¸˜oes de recuperac¸˜ao de imagem do Modelo Bayesiano que apresentaram melhores resultados em termos das m´etricas adotadas.

Nos referidos experimentos, apresentados nas sec¸˜oes 5.5 e 5.6, foi adotado o m´etodo de avaliac¸˜ao denominado K-fold cross validation. Segundo este m´etodo, os dados de entrada do problema em an´alise s˜ao divididos em k subconjuntos e o m´etodo para soluc¸˜ao ´e repetido k vezes. Para cada vez, um dos k subconjuntos ´e utilizado como o conjunto de teste e os outros k-1 subconjuntos s˜ao utilizados no conjunto de treinamento. Cada um dos dados de entrada estar´a presente em um conjunto de teste exatamente uma vez e em um conjunto de treinamento k-1 vezes [Duda et al. 2000].

Realizamos experimentos com k igual a 5. Dessa forma, as 35 consultas avali-adas, apresentadas na sec¸˜ao 5.2, foram divididas em cinco grupos de sete consultas cada. Para cada uma das cinco execuc¸˜oes dos m´etodos de recuperac¸˜ao de imagens da Web, foi adotado um conjunto de consultas distinto. Ainda, em relac¸˜ao ao arcabouc¸o evolucion´ario, para cada execuc¸˜ao distinta do m´etodo, dos quatro grupos restantes de consultas, trˆes foram tomados para a fase de treinamento do m´etodo. O quarto grupo de consultas foi utilizado para uma fase de validac¸˜ao do algoritmo, com o intuito de evitar uma poss´ıvel especializac¸˜ao dos indiv´ıduos formados para o grupo de consultas utilizado na fase de treinamento. Este problema tratado ´e comumente conhecido na li-teratura relacionada como overfitting e para evit´a-lo foi adotada a mesma estrat´egia que

(9)

em [Almeida et al. 2007] para a selec¸˜ao do melhor indiv´ıduo: seja ti a efic´acia de um

in-div´ıduo i na fase de treinamento, vi a efic´acia na fase de validac¸˜ao e σi o correspondente

desvio padr˜ao. O melhor indiv´ıduo ´e selecionado por argmaxi((ti + vi) − σi). 5.5. An´alise das Evidˆencias e Combinac¸˜oes com o Modelo Bayesiano

Esses experimentos contemplaram a an´alise da efic´acia obtida pelo Modelo Bayesiano, considerando as diferentes equac¸˜oes de recuperac¸˜ao de imagem derivadas do modelo te´orico. Eles foram realizados com uma colec¸˜ao Web distinta em [Coelho et al. 2004]. Uma breve descric¸˜ao do modelo, bem como as equac¸˜oes obtidas a partir dele, foram apre-sentadas na sec¸˜ao 4 deste trabalho.

5.5.1. Texto Completo versus Passagens Textuais

Os primeiros experimentos com o Modelo Bayesiano consistiram em determinar o melhor tamanho de passagens ao redor das imagens. A Figura 1(a) apresenta os valores de pre-cis˜ao m´edia para cada n´ıvel de revocac¸˜ao. A Tabela 3 cont´em os intervalos de confianc¸a correspondentes aos valores m´edio de MAP, calculados para um n´ıvel de confianc¸a de 95%. As denominac¸˜oes 10 T, 20 T, 40 T e TC referem-se, respectivamente, `as passagens textuais de 10, 20, 40 termos e ao texto completo.

(a) Passagens textuais (b) Evidˆencias Isoladas

Figura 1. Curvas de Precis ˜ao versus Revocac¸ ˜ao.

10 T 20 T 40 T TC

11, 272 ± 8, 601 11,823± 7,745 11, 810 ± 7, 722 8, 639 ± 5, 773 Tabela 3. Intervalos de confianc¸a a 95% da m ´etrica MAP obtidos para as

pas-sagens textuais.

De forma similar aos resultados obtidos em [Coelho et al. 2004], observa-se que as passagens textuais de 10, 20 e 40 termos apresentam comportamento bastante similar, com um desempenho bastante superior ao texto completo. Apesar das passagens de 10, 20 e 40 termos serem estatisticamente equivalentes, em func¸˜ao do maior valor m´edia de precis˜ao para o primeiro n´ıvel de revocac¸˜ao e de MAP utilizou-se a passagem textual de 20 termos na comparac¸˜ao com os demais resultados obtidos pelas outras evidˆencias isoladas. Diferentemente, em [Coelho et al. 2004] foi identificada a passagem de 40 termos como aquela que provˆe melhores resultados.

(10)

5.5.2. Evidˆencias Isoladas

O pr´oximo experimento contemplou a comparac¸˜ao dos resultados obtidos pelas passagens textuais de 20 termos com aqueles alcanc¸ados pelas demais evidˆencias isoladas: tags de descric¸˜ao e metadados. A Figura 1(b) apresenta os valores de precis˜ao m´edia para cada n´ıvel de revocac¸˜ao. A Tabela 4 cont´em os intervalos de confianc¸a correspondentes ao valores m´edio de MAP, calculados para um n´ıvel de confianc¸a de 95%. As denominac¸˜oes META e DESC referem-se, respectivamente, `as tags de metadados e de descric¸˜ao.

META DESC 20 T

13,091± 6.194 8,071± 4,641 11,823± 7,745

Tabela 4. Intervalos de confianc¸a a 95% da m ´etrica MAP obtidos para as evid ˆencias isoladas.

Comparando as curvas da Figura 1(b), constata-se que para um n´ıvel de revocac¸˜ao inferior a 15%, as passagens textuais de 20 termos apresentaram melhores valores de pre-cis˜ao m´edia. A partir desse n´ıvel de revocac¸˜ao at´e o valor de 82%, os melhores resultados j´a s˜ao apresentados pelas tags de metadados. Para n´ıveis superiores a 82%, os maiores valores de precis˜ao m´edia s˜ao obtidos pelas tags de descric¸˜ao. Ao analisar os valores de MAP (ver Tabela 4) as tags de metadados apresentam um valor superior em comparac¸˜ao com as demais fontes de evidˆencia isolada. Por esse motivo, pode-se concluir que dentre as fontes de evidˆencia isoladas as tags de metadados s˜ao aquelas que apresentam melhor resultado.

5.5.3. M ´ultiplas Fontes de Evidˆencia

Examinando agora os resultados obtidos quando combinadas m´ultiplas fontes de evidˆencia no Modelo Bayesiano, inicialmente ser˜ao analisados os resultados obtidos com as combinac¸˜oes que envolvem as tags descric¸˜ao e uma outra fonte de evidˆencia textual: tags de descric¸˜ao + metadados e tags de descric¸˜ao + passagens textuais. S˜ao apresentados na Figura 2(a) os valores de precis˜ao m´edia para cada n´ıvel de revocac¸˜ao. A Tabela 5 cont´em os intervalos de confianc¸a correspondentes ao valores m´edio de MAP, calculados para um n´ıvel de confianc¸a de 95%. O sinal indicativo de adic¸˜ao representa a combinac¸˜ao das evidˆencias textuais envolvidas, assim DESC + META representa a combinac¸˜ao das tags de descric¸˜ao com as de metadados.

Em decorrˆencia da baixa efic´acia das tags de descric¸˜ao e do texto completo, quando tomados isoladamente, a combinac¸˜ao dessas duas fontes de evidˆencia resultou nos piores resultados. Utilizando esse mesmo crit´erio, as combinac¸˜oes que envolvem as tags de descric¸˜ao e as demais passagens textuais apresentam comportamento bastante similar. O desempenho da combinac¸˜ao das tags de descric¸˜ao com as tags de metadados, apesar de bastante similar `aquele obtido pelas passagens textuais de 10, 20 e 40 termos, apresenta melhores valores de precis˜ao m´edia entre 42% e 80%. Estendendo a comparac¸˜ao para os valores m´edios de MAP, esta ´ultima combinac¸˜ao confirma o melhor desempenho.

O pr´oximo grupo de combinac¸˜oes de m´ultiplas fontes de evidˆencia contempla os resultados obtidos com as combinac¸˜oes que envolvem as tags de metadados e uma

(11)

outra fonte de evidˆencia textual: metadados + tags de descric¸˜ao e metadados + passagens textuais. S˜ao apresentados na Figura 2(b) os valores de precis˜ao m´edia para cada n´ıvel de revocac¸˜ao e a Tabela 6 cont´em os intervalos de confianc¸a correspondentes ao valores m´edio de MAP, calculados para um n´ıvel de confianc¸a de 95%.

(a) Combinac¸˜oes com as Tags de descric¸˜ao (b) Combinac¸˜oes com as Tags de metada-dos

Figura 2. Curvas de Precis ˜ao versus Revocac¸ ˜ao.

DESC + META DESC + 10 T DESC + 20 T DESC + 40 T DESC + TC

14,898± 3,945 14,071± 8,461 14,214± 7,749 14,151± 7,854 8,415± 5,548 Tabela 5. Intervalos de confianc¸a a 95% da m ´etrica MAP para as combinac¸ ˜oes com as tags de descric¸ ˜ao.

META + DESC META + 10 T META + 20 T META + 40 T META + TC

14,898± 3,945 14,498± 7,138 14,618± 7,323 14,558± 7,446 7,527± 6,566 Tabela 6. Intervalos de confianc¸a a 95% da m ´etrica MAP obtidos para as combinac¸ ˜oes com os metadados.

Assim como foi observado nos resultados das tags de descric¸˜ao e suas combinac¸˜oes, em decorrˆencia do baixo desempenho do texto completo, a combinac¸˜ao resultante desta evidˆencia textual com as tags de metadados resultou nos piores resulta-dos. As demais combinac¸˜oes de passagens textuais e das tags de metadados apresentaram resultados similares. Comparando os valores de MAP, a combinac¸˜ao com as tags de descric¸˜ao foi aquela que apresentou maior valor.

Para finalizar a an´alise dos resultados obtidos com as diversas equac¸˜oes do Modelo Bayesiano, s˜ao apresentados na Figura 3(a) os valores de precis˜ao m´edia para cada n´ıvel de revocac¸˜ao, das m´ultiplas evidˆencias textuais consideradas. A Tabela 7 cont´em os intervalos de confianc¸a correspondentes ao valores m´edio de MAP, calculados para um n´ıvel de confianc¸a de 95%.

A an´alise dos resultados obtidos nos mostra que as combinac¸˜oes que envolvem as tags de descric¸˜ao, os metadados e as passagens textuais de 10, 20 ou 40 termos apresentam comportamento similar, havendo visivelmente um melhor desempenho da combinac¸˜ao que envolvem as pessagens de 40 termos. Assim como nas demais combinac¸˜oes, nova-mente constata-se o pior desempenho da combinac¸˜ao que envolve o texto completo.

(12)

(a) Combinac¸˜oes de todas as evidˆencias textuais

(b) PG e melhores abordagens do bayesiano

Figura 3. Curvas de Precis ˜ao versus Revocac¸ ˜ao.

META + DESC + 10 T META + DESC + 20 T META + DESC + 40 T META + DESC + TC 16,281± 6,266 16,307± 6,315 16,340± 6,500 7,651± 6,344 Tabela 7. Intervalos de confianc¸a a 95% da m ´etrica MAP para as combinac¸ ˜oes de todas as evid ˆencias textuais.

5.6. Experimentos Comparativos dos M´etodos de Recuperac¸ ˜ao de Imagens da Web Ap´os um estudo pr´evio da qualidade dos resultados obtidos pelo o arcabouc¸o evolu-cion´ario, nos experimentos apresentados nas sec¸˜oes seguintes foi adotada a seguinte configurac¸˜ao: populac¸˜ao inicial de 50 indiv´ıduos, gerada a partir do m´etodo half-and-half6, profundidade m´axima do indiv´ıduo igual a 4, crit´erio de parada igual a 15 gerac¸˜oes,

selec¸˜ao por torneio7 com taxa de crossover de 90% e taxas de mutac¸˜ao e de reproduc¸˜ao

iguais a 5%.

A comparac¸˜ao dos m´etodos segue nas sec¸˜oes seguintes, sob os termos da efic´acia e eficiˆencia na recuperac¸˜ao das imagens web.

5.6.1. Tempo de Execuc¸ ˜ao

Como foi apresentado na sec¸˜ao 5.4, o arcabouc¸o evolucion´ario demanda duas fases ini-ciais `a avaliac¸˜ao do conjunto de teste: treinamento e validac¸˜ao. Em m´edia, as fases de treinamento demandaram um tempo de execuc¸˜ao de cinco horas. A fase de validac¸˜ao consiste na avaliac¸˜ao de um conjunto de melhroes indiv´ıduos e demandou menos de um minuto.

A fase de teste do arcabouc¸o e a avaliac¸˜ao de cada uma das equac¸˜oes do baseline equiparam-se em termos de tempo de execuc¸˜ao, pois consiste na avaliac¸˜ao de toda a colec¸˜ao e ordenac¸˜ao do conjunto na sequˆencia.

6A populac¸˜ao inicial ´e gerada de forma que 50% dos indiv´ıduos s˜ao ´arvores cujos terminais est˜ao no

mesmo n´ıvel e os demais 50% s˜ao gerados a partir de um nodo raiz, que ´e chamado recursivamente para gerar ´arvores filhas, com uma profundidade m´axima.

7Os indiv´ıduos s˜ao escolhidos de uma forma aleat´oria, segundo uma distribuic¸˜ao uniforme. Em seguida,

o melhor dentre os n indiv´ıduos, tendo como crit´erio o valor da func¸˜ao de aptid˜ao, ´e selecionado. O valor de n refere-se ao tamanho do torneio.

(13)

5.6.2. Efic´acia dos M´etodos

A comparac¸˜ao dos resultados obtidos pelo arcabouc¸o evolucion´ario e os melhores resul-tados obtidos pelo Modelo Bayesiano inicia-se pelos dados apresenresul-tados na Figura 3(b). Nesta, s˜ao apresentadas as curvas geradas a partir dos valores de precis˜ao m´edia, para cada n´ıvel de revocac¸˜ao. Comparando os resultados apresentados ´e poss´ıvel constatar o melhor desempenho do arcabouc¸o evolucion´ario (PG) para todos os n´ıveis de revocac¸˜ao. Esse mesmo cen´ario pode ser confirmado pelo valor do MAP m´edio apresentado na Tabela 8. Como n˜ao h´a sobreposic¸˜ao dos intervalos de confianc¸a, pode-se afirmar que o arcabouc¸o evolucion´ario ´e superior ao Modelo Bayesiano com n´ıvel de confianc¸a igual a 95%.

META META + DESC META + DESC + 40 T PG 13,091± 6,194 14,898± 3,945 16,340± 6,500 35,313± 7,767 Tabela 8. Intervalos de confianc¸a a 95% da m ´etrica MAP para o PG e melhores

abordagens do bayesiano.

Para cada uma das cinco execuc¸˜oes do arcabouc¸o evolucion´ario foi obtido um me-lhor indiv´ıduo, apresentados na Tabela 9. Nos operadores apresentados, rlog representa o logaritmo na base dez.

Fold Melhor Indiv´ıduo PG

1 (rlog (+ (+ 40T 40T) (rlog (+ META DESC)))) 2 (rlog (+ (* (+ 40T TC) (* META META)) (+ DESC 20T))) 3 (+ (+ 48.48 (rlog (rlog 40T))) (rlog 40T))

4 (+ (rlog 40T) 48.48)

5 (rlog (+ META (+ DESC (+ 40T 40T)))) Tabela 9. Melhores indiv´ıduos PG obtidos, para cada fold.

A partir dos dados apresentados na Tabela 9 pode-se constatar que as evidˆencias correspondentes `as tags de descric¸˜ao, `as passagens textuais de 20 e 40 termos e `as tags de descric¸˜ao, est˜ao presentes em todos os melhores indiv´ıduos obtidos pelo m´etodo evolu-cion´ario. Deve ser destacado que a presenc¸a dessas evidˆencias ocorre por mais de uma vez, como nos folds 1, 2 e 5. Essas constatac¸˜oes reafirmam a expressiva contribuic¸˜ao das informac¸˜oes armazenadas nessas fontes de evidˆencia no processo de recuperac¸˜ao de ima-gens da Web e indicam sua maior contribuic¸˜ao no processo (e.g., 40T tem duas vezes mais peso nos folds 2 e 5). Interessante observar a presenc¸a do texto completo na formac¸˜ao do indiv´ıduo correspondente `a segunda execuc¸˜ao (fold igual a 2). Este resultado vai de encontro `aquele obtido com as diversas equac¸˜oes do Modelo Bayesiano que consideram essa fonte de evidˆencia, pois nestes casos a considerac¸˜ao do texto completo do documento HTML contribui de forma pouco expressiva ou at´e mesmo negativa para a qualidade dos resultados. Al´em disso, tamb´em indica que esta fonte de evidˆencia pode ser interessante para algumas consultas.

6. Conclus˜oes e Trabalhos Futuros

Neste trabalho foi proposto um modelo de recuperac¸˜ao de imagens da Web, baseado na Programac¸˜ao Gen´etica. A soluc¸˜ao do m´etodo evolucion´ario consiste em uma func¸˜ao

(14)

resultante da combinac¸˜ao de distintas evidˆencias textuais associadas `as imagens de um documento HTML. As evidˆencias textuais consideradas foram: tags de descric¸˜ao, os metadados e as passagens textuais, sendo que nestas est˜ao inclu´ıdas as passagens textuais com 10, 20 ou 40 termos ao redor da imagem e o texto completo do documento. Con-siderando as mesmas fontes de evidˆencia, os resultados foram comparados com aqueles obtidos pelo Modelo Bayesiano, apresentado em [Coelho et al. 2004].

Por meio de experimentos do tipo 5-fold cross validation, foi comparado o de-sempenho do arcabouc¸o evolucion´ario e das melhores abordagens do Modelo Bayesiano. Avaliadas as m´etricas precis˜ao m´edia, para todos os n´ıveis de revocac¸˜ao, e MAP, os resul-tados mostraram que o m´etodo que emprega a Programac¸˜ao Gen´etica apresenta desem-penho significativamente maior, com ganhos de mais de 100% sobre o baseline bayesiano (n´ıvel de confianc¸a de 95%).

Como trabalhos futuros podem ser citados: utilizar o arcabouc¸o na recuperac¸˜ao de imagens pertencentes a colec¸˜oes existentes em outros contextos, incorporar novas evidˆencias textuais e comparar os resultados obtidos com outras soluc¸˜oes para o pro-blema, em especial com aquelas que envolvam m´etodos de aprendizagem.

7. Agradecimentos

Os autores agradecem o apoio da FAPEMIG, FAPESP, CAPES, Microsoft Research e do CNPq, particularmente do Instituto Nacional de Ciˆencia e Tecnologia para a Web (CNPq processo 573871/2008-6) e Projeto InfoWeb (CNPq processo 55.0874/2007-0), a suas atividades de pesquisa.

Referˆencias

Almeida, H., Gonc¸alves, M., Cristo, M., and Calado, P. (2007). A combined component approach for finding collection-adapted ranking functions based on genetic programming. ACM SIGIR, pages 399–406.

Baeza-Yates, R. A. and Ribeiro-Neto, B. (1999). Modern Information Retrieval. Addison-Wesley Longman Publishing Co., Inc., Boston, MA, USA.

Carvalho, M. G., Laender, A. H. F., Gonc¸alves, M. A., and Porto, T. C. (2008). The impact of parameter setup on a genetic programming approach to record deduplication. In SBBD, pages 91–105, Porto Alegre, Brazil.

Chang, H.-T. (2008). Web image retrieval systems with automatic web image annotating tech-niques. WSEAS Trans. Info. Sci. and App., 5(8):1313–1322.

Coelho, T. A. S. (2001). Recuperac¸˜ao de imagens na web baseada em m ´ultiplas evidˆencias textu-ais. Master’s thesis, UFMG.

Coelho, T. A. S., Calado, P. P., Souza, L. V., Ribeiro-Neto, B., and Muntz, R. (2004). Image retrieval using multiple evidence ranking. IEEE TKDE, 16(4):408–417.

Datta, R., Joshi, D., Li, J., and Wang, J. Z. (2008). Image retrieval: Ideas, influences, and trends of the new age. ACM Comput. Surv., 40(2):1–60.

Duda, R. O., Hart, P. E., and Stork, D. G. (2000). Pattern Classification (2nd Edition). Wiley-Interscience.

Fan, W., Fox, E. A., Pathak, P., and Wu, H. (2004a). The effects of fitness functions on genetic programming-based ranking discovery for web search: Research articles. J. Am. Soc. Inf. Sci. Technol., 55(7):628–636.

(15)

Fan, W., Gordon, M., and Pathak, P. (2004b). A generic ranking function discovery framework by genetic programming for information retrieval. Information Processing and Management, 40(4):587–602.

Fan, W., Gordon, M. D., and Pathak, P. (2000). Personalization of search engine services for effective retrieval and knowledge management. In ICIS, pages 20–34, Atlanta, GA, USA. Fan, W., Gordon, M. D., and Pathak, P. (2004c). Discovery of context-specific ranking functions

for effective information retrieval using genetic programming. IEEE TKDE, 16(4):523–527. Fan, W., Gordon, M. D., and Pathak, P. (2005). Genetic programming-based discovery of ranking

functions for effective web search. J. Manage. Inf. Syst., 21(4):37–56.

Fan, W., Gordon, M. D., Pathak, P., Xi, W., and Fox, E. A. (2004d). Ranking function optimization for effective web search by genetic programming: An empirical study. In HICSS, page 40105, Washington, DC, USA.

Ferreira, C. D., S. Torres, R., Gonc¸alves, M. A., and Fan, W. (2008). Image retrieval with relevance feedback based on genetic programming. In SBBD, pages 120–134, Campinas, Brazil.

Google (2009). Google image search. http://images.google.com/.

Lacerda, A., Cristo, M., Gonc¸alves, M. A., Fan, W., Ziviani, N., and Ribeiro-Neto, B. (2006). Learning to advertise. In ACM SIGIR, pages 549–556, New York, NY, USA.

Modesto, M., ´Alvaro R. Pereira Jr., Castillo, C., Ziviani, N., and Baeza-Yales, R. (2005). Um novo retrato da web brasileira. Anais do XXXII Semin´ario Integrado de Hardware e Software (SEMISH 32), pages 2005–2017.

MSN (2009). Msn image search. http://search.msn.com/images/.

Pearl, J. (1988). Probabilistic Reasoning in Intelligent Systems: Networks of plausible inference. Morgan Kaufmann, 2th edition.

Silva, A., Gonc¸alves, M., Laender, A., Modesto, M., Cristo, M., and Ziviani, N. (2009). Finding what is missing from a digital library: A case study in the computer science field. Information Processing and Management.

Torres, R. d. S., Falc ao, A. X., Gonc¸alves, M. A., Papa, J. a. P., Zhang, B., Fan, W., and Fox, E. A. (2009). A genetic programming framework for content-based image retrieval. Pattern Recogn., 42(2):283–292.

Torres, R. S., Medeiros, C. B., Goncalves, M. A., and Fox, E. A. (2006). A digital library frame-work for biodiversity information systems. Intern. Journal on Digital Libraries, 6(1):3–17. Voorhees, E. and Harman, D. (2000). Overview of the Eighth Text REtrieval Conference

(TREC-8). Proceedings of the Eighth Text REtrieval Conference (TREC-8), pages 1–24.

Yahoo (2009). Yahoo image search. http://images.search.yahoo.com/images. Zhang, B. (2006). Intelligent Fusion of Evidence from Multiple Sources for Text Classification.

Phd thesis, Virginia Polytechnic Institute and State University, USA.

Zongker, D. and Punch, B. (1996). lilgp 1.01 user’s manual. Technical report, Michigan State University, USA.

Referências

Documentos relacionados

La asociación público-privada regida por la Ley n ° 11.079 / 2004 es una modalidad contractual revestida de reglas propias y que puede adoptar dos ropajes de

Para casos específicos, os contadores são procurados, como por exemplo a declaração do imposto de renda no qual muitos alegaram se tornar o período de maior contato, pois os

Quando conheci o museu, em 2003, momento em foi reaberto, ele já se encontrava em condições precárias quanto à conservação de documentos, administração e organização do acervo,

Para Souza (2004, p 65), os micros e pequenos empresários negligenciam as atividades de planejamento e controle dos seus negócios, considerando-as como uma

O CES é constituído por 54 itens, destinados a avaliar: (a) cinco tipos de crenças, a saber: (a1) Estatuto de Emprego - avalia até que ponto são favoráveis, as

Os resultados são apresentados de acordo com as categorias que compõem cada um dos questionários utilizados para o estudo. Constatou-se que dos oito estudantes, seis

de professores, contudo, os resultados encontrados dão conta de que este aspecto constitui-se em preocupação para gestores de escola e da sede da SEduc/AM, em

Essa modalidade consiste em um “estudo profundo e exaustivo de um ou de poucos objetos, com contornos claramente definidos, permitindo seu amplo e detalhado