• Nenhum resultado encontrado

4.2 An´alise Semˆantica Latente (ASL)

4.2.2 O modelo de decomposi¸c˜ao

Nesta se¸c˜ao, ´e descrita uma nova abordagem — e que ´e uma das propostas desta tese —- na ´area de RIBC, que serve como uma alternativa para aumentar a quantidade de informa¸c˜ao — a informa¸c˜ao latente — de uma imagem-consulta.

A id´eia ´e encontrar um modelo que represente os relacionamentos entre caracter´ısticas e imagens, de maneira que n˜ao somente caracter´ısticas que apare¸cam na imagem-consulta sejam usadas para varrer a base de dados, mas tamb´em aquelas que ocorrem com relativa freq¨uˆencia no contexto, as chamadas caracter´ısticas latentes.

No caso de RIBC, o espa¸co vetorial da base de dados ´e usado para observar as ocorrˆencias de caracter´ısticas nas imagens. Considerando esse espa¸co, o objetivo aqui ´e usar um mo- delo matem´atico que explicitamente represente a estrutura semˆantica latente. A an´alise dessa estrutura ´e feita com o uso da decomposi¸c˜ao em valores singulares (DVS), defini- da na Se¸c˜ao 3.5. Essa t´ecnica est´a estritamente relacionada com um grande n´umero de abordagens estat´ısticas em uma grande variedade de ´areas, incluindo decomposi¸c˜ao de autovalores, an´alise espectral e an´alise fatorial.

A decomposi¸c˜ao, feita sobre o espa¸co vetorial de imagens x caracter´ısticas, gera trˆes matrizes especiais, atrav´es da DVS (ver Se¸c˜ao 3.5). Essas matrizes cont´em “ valores sin- gulares” e “ vetores singulares”, e “ quebram” o relacionamento original entre imagens e caracter´ısticas em uma s´erie de componentes linearmente independentes chamados de fa- tores. Muitos desses componentes s˜ao muito pequenos, e podem ser ignorados, levando a um modelo aproximado em uma dimens˜ao menor.

Nesse modelo reduzido, todas as similaridades imagens x imagens s˜ao agora represen- tadas por valores dessa nova e menor dimens˜ao. O resultado pode ainda ser representado geometricamente por uma configura¸c˜ao, na qual o produto interno ou o cosseno entre dois vetores representa a estimativa da medida de similaridade entre duas imagens.

Ent˜ao, para os prop´ositos de RIBC, a DVS pode ser vista como uma t´ecnica que gera um conjunto de valores de ´ındices, chamados de fatores; onde cada imagem ´e representada por um conjunto desses fatores. Observe que, devido `a redu¸c˜ao da dimens˜ao, imagens no espa¸co original com perfis de caracter´ısticas diferentes, mas em contextos similares, s˜ao mapeadas para o mesmo vetor no espa¸co latente. Entretanto, esta ´e justamente a propriedade desejada; pois faz com que a DVS possa ser usada para modelar o problema da contextualiza¸c˜ao, discutida na Se¸c˜ao 1.2, uma vez que agrupa imagens por contextos de caracter´ısticas similares (caracter´ısticas latentes). Embora seus resultados estejam longe do ideal, a DVS ´e uma abordagem adequada para o problema, uma vez que permite a inclus˜ao de informa¸c˜oes que n˜ao foram necessariamente fornecidas diretamente pelo usu´ario. Al´em do que, o Cap´ıtulo 5 mostra que essa estrat´egia leva a uma melhoria tanto da precis˜ao de busca (grau de certeza na recupera¸c˜ao) quanto da revoca¸c˜ao (quantidade de imagens relevantes recuperadas).

De maneira superficial, os “ fatores” gerados para o espa¸co latente podem ser pensa- dos como “ conceitos artificiais”; eles representam componentes comuns de muitas carac- ter´ısticas e imagens. Cada imagem ´e ent˜ao representada por um vetor de fatores que indicam seu relacionamento com outras imagens; isto ´e, o “ significado” de uma imagem particular pode ser expressado por k fatores, ou equivalentemente, por uma localiza¸c˜ao de um vetor no espa¸co de fatores k-dimensional. Esta representa¸c˜ao ´e econˆomica, no sentido de que os N ´ındices originais s˜ao substitu´ıdos pelos k ≤ N melhores fatores. O objeti- vo aqui n˜ao ´e gerar um espa¸co onde esses fatores possam ser interpretados fisicamente, mas representar imagens e consultas de uma maneira que n˜ao seja a limitada, amb´ıgua e redundante representa¸c˜ao de caracter´ısticas como descritores de imagens, simplesmente.

Nesta representa¸c˜ao ´e poss´ıvel reconstruir o espa¸co original imagem x caracter´ısticas, a partir dos k-fatores, com relativa perda. ´E importante para o m´etodo que o espa¸co de

CAP´ITULO 4. METODOLOGIAS PROPOSTAS 55

fatores k-dimensional n˜ao reconstrua o espa¸co original perfeitamente; isso porque o es- pa¸co original n˜ao ´e confi´avel. Primeiramente, deseja-se derivar um espa¸co que expresse o que ´e mais importante e influente no relacionamento entre caracter´ısticas e imagens. Ao contr´ario de muitas maneiras de se usar an´alise fatorial, n˜ao se est´a necessariamente inte- ressado aqui em reduzir a representa¸c˜ao para uma dimens˜ao menor — por exemplo, para 2 ou 3 fatores —, porque o objetivo n˜ao ´e ser capaz de visualizar ou entender topologicamente o espa¸co, mas sim, manipular informa¸c˜oes latentes. Neste trabalho, acredita-se tamb´em que a representa¸c˜ao do espa¸co conceitual, para qualquer cole¸c˜ao de imagens suficiente- mente grande, requerer´a mais do que a descri¸c˜ao de conceitos independentes, e o n´umero de fatores ortogonais que ser˜ao necess´arios ser´a proporcionalmente grande. Na realidade, rela¸c˜oes conceituais entre caracter´ısticas e imagens certamente envolvem estruturas mais complexas, incluindo, por exemplo, hierarquias locais e rela¸c˜oes n˜ao lineares entre signifi- cados. Rela¸c˜oes mais complexas podem ser geradas simplesmente aumentando a dimens˜ao do espa¸co. Ent˜ao, tem-se raz˜ao aqui em evitar tanto baixas quanto altas dimens˜oes no espa¸co. No entanto, neste trabalho, os valores escolhidos s˜ao aqueles que d˜ao os melhores resultados de busca (melhor precis˜ao).

Como ´e poss´ıvel ent˜ao processar uma consulta nesta representa¸c˜ao? Pode ser observado primeiro que cada imagem-consulta ´e representada por um vetor de fatores no espa¸co k-dimensional. Uma imagem-consulta inicialmente ´e um vetor de caracter´ısticas. Para retornar um conjuto de imagens potencialmente relevantes, a imagem-consulta inicialmente ´e descrita nesse espa¸co, e os cossenos dos ˆangulos entre seu vetor de fatores e todos os outros vetores do espa¸co s˜ao calculados; aqueles com valor de cosseno alto s˜ao retornados como relevantes.

Documentos relacionados