• Nenhum resultado encontrado

5.2 Coleta de Informação sobre Similaridade

5.2.1 Sistema web para coleta de dados

Foi desenvolvido um sistema web para a coleta da informação sobre a semântica nas imagens. Este sistema foi desenvolvido usando PHP4 e MySQL no sistema operacional Linux. A figura 5.4 mostra a arquitetura deste sistema denominado ESI - Extração de Se- mântica das Imagens. O objetivo deste projeto é fazer um estudo do significado semântico das imagens em diferentes grupos de usuários.

Este sistema inicialmente foi desenvolvido para armazenar as relações de similaridade entre as imagens tendo como base a informação fornecida pelos usuários. Porém, ele está pensado e estruturado para converter-se no futuro em um sistema de recuperação de imagens baseada em conteúdo. No momento o sistema suporta interações com um administrador e com um usuário. O administrador, usando o módulo de administração, poderá definir o método de seleção de imagens, tendo como opções uma forma aleatória, formas baseadas em técnicas de CBIR e formas híbridas (por exemplo, 50% das imagens escolhidas de forma aleatória e 50% escolhidas com algum método de CBIR). Ele também poderá definir quais os bancos de imagens a serem usados na seleção.

O administrador também pode realizar consultas ao banco de dados para poder ana- lisar as relações semânticas ou para fazer estatísticas de uso do sistema. Finalmente, ele pode enviar emails aos usuários cadastrados informando o estado da sua participação no projeto ou estatísticas do mesmo.

O usuário pode definir a similaridade entre as imagens a ele mostradas através da interface do sistema web, estas imagens são escolhidas usando o método de seleção de imagens definido pelo administrador do sistema. O usuário pode ser anônimo ou ca- dastrado no sistema. No segundo caso o usuário deve fazer o login no sistema, o qual será definido no momento do cadastro ao mesmo e validado no módulo de autenticação.

Banco de Imagens Banco de dados Usuário Administrador Seleção Dirigida Seleção Aleatória Seleção de Imagens Cadastro Autenticação Registro Relações Login Administrar Definir Similaridade Consultas Enviar Emails

Figura 5.4: Arquitetura do Sistema Web

Quando o usuário registra a similaridade que as imagens apresenta, segundo o critério dele, o sistema armazena relações imagem a imagem no banco de dados. No futuro o sistema, além de registrar a similaridade entre as imagens, deverá permitir ao usuário recuperar as imagens similares àquela que ele defina como critério de busca.

Assim, no sistema são apresentadas ao usuário um conjunto de 20 imagens e uma imagem exemplo. O usuário escolhe quais imagens são similares ao exemplo dado e esta informação é salva no banco de dados desenvolvido em MySQL. A figura 5.5 apresenta a interface onde é escolhida a similaridade entre as imagens.

O banco de dados é composto por 7 tabelas. A figura 5.6 apresenta o diagrama entidade-relação do banco de dados desenvolvido. Neste diagrama, se mostram as ta- belas com os campos principais (e.g. aqueles que têm relação com outras tabelas).

As tabelas do banco de dados e sua descrição são detalhadas a seguir:

• bancoimag: Tabela que armazena os nomes, tipo, quantidade de imagens e origem

dos bancos de imagens disponíveis no sistema.

• classes: Tabela que armazena as classes predefinidas às quais pertencem cada uma

das imagens dos bancos de dados inclusos no sistema. Esta tabela inclui dois cam- pos: O nome da classe é uma descrição do conteúdo da mesma.

• imag_recupera: Tabela que armazena as relações de similaridade registradas pelo

usuário. Esta tabela também armazena o método pelo qual foi recuperada uma imagem e o banco ao qual pertence a imagem. Neste sentido, nesta tabela são armazenados: o login do usuário que realizou o registro, a imagem exemplo, a imagem mostrada, um flag indicando se o usuário indicou que as imagens eram similares ou não e o método pelo qual foi recuperada a imagem.

• images: Tabela que armazena os dados das imagens disponíveis no sistema, dentre

destes dados se considera o banco de imagens ao qual pertence, o nome do arquivo, a classe à qual pertence o endereço da imagem no servidor, a descrição da imagem

imag_recupera login imag_mod imag_recu similar metodo index_recupera index metodo index 1 . . . iindex 50 images index banco clase classes id bancoimag cd_base metodo id user login . . .

Figura 5.6: Entidade-Relação do Banco de dados

e a orientação da imagem (horizontal ou vertical).

• index_recupera: Tabela que melhora o desempenho do sistema e acelera o pro-

cesso de recuperar as imagens para serem mostradas ao usuário. Nesta tabela se armazena para cada imagem os resultados de recuperação de no máximo as 50 ima- gens mais similares baseadas em algum método de CBIR, sejam os tradicionais (composto e paralelo) ou nossa proposta (sequencial).

• metodo: Tabela que armazena os métodos usados para a recuperação de imagens

no sistema. Nesta tabela será armazenado o nome do método e uma descrição que indique os descritores usados, sua sequencia, se for o caso, e alguma outra informação relevante que permita identificar o método.

• user: Tabela que armazena os usuários cadastrados no sistema. Dentre os dados

armazenados têm-se o login, a senha, o email, se ele está ativo ou não, o nome, a idade, a ocupação, a escolaridade, o sexo, a cidade e o país.

Apresentada a informação coletada pelo sistema e as características do banco de da- dos, é importante observar que uma das aplicações futuras deste sistema é definir relações semânticas entre as imagens agrupando-as pelas características dos usuários como idade, sexo, escolaridade, etc.