• Nenhum resultado encontrado

2.3 Recuperação de informação baseada no conteúdo visual na ciência da

2.3.1 Recuperação da informação baseada no conteúdo visual da imagem

Resumidamente, as técnicas de recuperação da informação, baseadas no conteúdo visual da imagem, utilizam algoritmos que testam a imagem inteira ou parte dela, para identificar imagens semelhantes. Normalmente, utilizam-se atributos referentes ao conteúdo visual da imagem e não se consideram atributos textuais referentes à descrição ou à interpretação da imagem.

Um sistema Content-Based Image Retrieval - CBIR de recuperação da informação, baseado no conteúdo visual da imagem, extrai características da imagem, indexa e processa consultas efetuadas pelo usuário. O princípio básico do CBIR requer que as propriedades

visuais da imagem sejam usadas no lugar da descrição textual para recuperar dado pictorial, com o objetivo da busca em uma base de dados.

De acordo com estudo realizado por Eakins (1999), que revê a situação atual de sistemas CBIR, conclui-se que esses sistemas operam eficazmente através das características sintáticas. Os níveis mais elevados de demanda dos usuários requerem características semânticas de entendimento de imagem, as quais são mais difíceis de extrair. A eficácia dos sistemas CBIR era limitada, pelo fato de operar somente no nível primitivo. Com a evolução tecnológica, os sistemas tornaram-se mais robustos considerando variações da imagem.

As pesquisas CBIR abrangem tópicos como a extração de características (primitivas e semânticas), a indexação e a interface com o usuário. As características primitivas são cor, textura, forma e relacionamentos espaciais (FIG. 4); são quantitativas por natureza e podem ser extraídas, automaticamente, ou de forma semi-automática. As características semânticas ou lógicas são qualitativas e representadas pelos dados visuais em diferentes níveis. A interface com o usuário consiste em mecanismos de navegação na base de dados e no processador de consultas, sendo compostos por palavra-chave (ícone-chave), esboço (sketching), imagem exemplo ou categoria.

Segundo Del Bimbo (1999), a recuperação de imagens, de acordo com as características cor, textura e forma, constituem o paradigma básico de recuperação onde, para cada imagem, as características são computadas previamente e as pesquisas são expressas através de exemplos visuais. Para iniciar uma pesquisa, o usuário seleciona a característica que procura e define uma medida de similaridade. A imagem procurada pode ser definida pelo usuário ou extraída de um exemplo, conforme a FIG. 4. O sistema checa a similaridade entre o conteúdo visual da pesquisa e as imagens do banco de dados. Esses exemplos são rígidos, falta flexibilidade para tratar os conceitos e a semântica da imagem.

Um sistema de recuperação baseado na imagem envolve a extração de características da imagem e, sumariamente, segue os seguintes passos: relaciona características visuais da imagem baseadas em cor, textura e forma; faz a classificação das características visuais da imagem, utilizando-as para alimentar o banco de dados; e, posteriormente, a recuperação da imagem procurada. Esta última é alcançada através de comparação por similaridade. O sistema de recuperação envolve percepção, representação, codificação e recuperação da imagem em base de dados.

FIGURA 4 - Exemplo de pesquisa por cor, textura e forma

Fonte: elaboração do autor.

O primeiro sistema comercial de recuperação da informação baseada no conteúdo visual foi desenvolvido pela IBM e denominado Query by Image Content - QBIC. O QBIC é considerado um marco no desenvolvimento de sistemas de recuperação de imagens. Suporta consulta baseada em imagens e realiza o processamento através das características de cor, textura e forma. A característica referente à cor utiliza histograma de cores. A característica textura é baseada na combinação de regularidade, contraste e direção. A característica forma consiste do contorno ou da área dos objetos, formas geométricas e orientações. De acordo com Raghavan (1995), esse sistema ajuda os usuários, mesmo aqueles menos familiarizados com a base de dados, a recuperar imagens relevantes baseadas em índices. Afirma que o aumento do interesse em sistemas multimídia com as técnicas de CBIR atrai a atenção de pesquisa em diversas disciplinas.

Além do sistema QBIC, desenvolvido pela IBM, outros sistemas foram desenvolvidos com o mesmo objetivo: Chabot é um sistema que agrupa informações de texto com histograma de cores citado por Ogle e Stonebraker (1995); Virage, desenvolvido por Gupta e Jain (1997) e o Visual SEEK de Smith e Chang (1996) que agrupa informações do histograma de cores e o relacionamento entre eles; Scarlet de Lee e Kim (2001) baseado na característica forma; entre outros.

O conteúdo visual das imagens é classificado por Guimarães e Araújo (2002) em dois tipos principais: primitivo e complexo. O conteúdo primitivo das imagens de natureza quantitativa refere-se aos elementos básicos que são as características que podem ser extraídas, automaticamente, pelo computador, através de técnicas de análise de imagem, reconhecimento de padrões e visão computacional. O conteúdo complexo das imagens é

aquele percebido por humanos, em geral, não são reconhecidos pelo computador e são de natureza qualitativa. Um problema chave para a indexação é estabelecer relações entre os dois tipos.

A indexação está ligada à consulta. Para recuperar imagens usando-se metadados de conteúdo (cor, textura e forma), as consultas são expressas através de exemplos visuais extraídos das imagens. O sistema verifica a similaridade entre a imagem-chave usada na consulta e as imagens na base de dados.

De acordo com Pala e Santini (1999), aplicações que utilizam a recuperação, pela similaridade da imagem dada, são particularmente restritas. A dificuldade do processo é derivar uma medida de similaridade que envolva as características de acordo com a percepção humana. Zachary e Yengar (2001) destacam que o aspecto fundamental dos sistemas CBIR é a extração e a representação de uma característica visual que seja um discriminante eficaz entre pares da imagem.

Hède et al. (2007) apresentam o objetivo de sistemas CBIR de procurar as imagens por similaridade, considerando variações em relação à imagem pesquisada, as quais aumentam o nível de recuperação da informação, conforme apresentado na FIG. 5. Utiliza o processo de assinatura para a recuperação da imagem. A assinatura das imagens, segundo Oliveira et al. (2002), faz parte do módulo de extração dos atributos da imagem. Trata-se de uma representação da imagem em um sistema de recuperação. Os componentes das assinaturas são chamados de atributos.

FIGURA 5 - Esquema CBIR.

As imagens resultantes de um sistema CBIR não são, necessariamente, imagens idênticas à imagem-chave, e abrangem imagens similares. Essa é a complexidade de um sistema que trabalha com informações baseadas no conteúdo da imagem.

Documentos relacionados