Relevance Feedback
Modelos Dinâmicos
Modelo Fuzzy
A lógica aristotélica é uma forte presença na cultura
ocidental e está profundamente enraizada em nossa
forma de pensar.
◦ Uma determinada afirmação é verdadeira ou falsa; Uma pessoa
ou é amiga ou inimiga.
◦ Na ciência, a verdade e a precisão estão intimamente ligadas e são partes indispensáveis do método científico.
◦ Porém, o mundo real contém uma infinidade de gradações entre
o preto e o branco, entre o certo e o errado, entre o verdadeiro e o falso. O mundo real é multivalente e analógico. Verdade e precisão absolutas existem apenas em casos extremos.
Modelo Fuzzy
Quando se diz que uma determinada pessoa é “alta”, o
que se está querendo dizer precisamente: 170 cm, 180
cm, 190 cm? Se fosse definido um limite de altura de
180 cm, por exemplo, então uma pessoa com 179 cm
não seria considerada alta.
Intuitivamente sabemos que não há uma distinção clara
entre uma pessoa de 179 cm de altura e uma de 180
cm. Quando os seres humanos pensam em altura eles
normalmente não têm um limite fixo em mente, mas
uma definição nebulosa, vaga.
Modelo Fuzzy
Lógica fuzzy (nebulosa)
◦ Tem como objetivo é capturar e operar com a diversidade, a
incerteza e as verdades parciais dos fenômenos da natureza de uma forma sistemática e rigorosa (SHAW; SIMÕES, 1999).
Modelo Fuzzy:
conjuntos fuzzy
Zadeh (1965) propôs uma nova teoria de conjuntos em
que não há descontinuidades, ou seja, não há uma
distinção abrupta entre elementos pertencentes e não
pertencentes a um conjunto: os Conjuntos Nebulosos
(Fuzzy Sets).
Modelo Fuzzy:
conjuntos fuzzy
Nos conjuntos fuzzy um elemento pode ser membro de um conjunto apenas parcialmente. Um valor entre zero e um (1) indicará o quanto o elemento é membro do conjunto.
A teoria dos conjuntos fuzzy é baseada no fato de que os conjuntos existentes no mundo real não possuem limites precisos.
Um conjunto fuzzy é um agrupamento indefinido de elementos no qual a transição de cada elemento de não-membro para membro do conjunto é gradual. .
Na figura, se o elemento x2for movido em direção ao elemento x1, no limite do conjunto A ocorrerá
subitamente uma alteração de seu estado, passando de não-membro para membro do conjunto
Modelo Fuzzy:
conjuntos fuzzy
Na figura, o conjunto dos diversos valores das alturas de uma pessoa é denominado universo do
discurso. Todo conjunto fuzzy é um subconjunto do universo do discurso. Um subconjunto A do
universo do discurso U é caracterizado por uma função µA que associa a cada elemento x de U um número µA(x) entre 0 e 1.
{
x x}
x UModelo Fuzzy
Um documento pode ser visto como um conjunto fuzzy
de termos, { t, µ(t) }, cujos pesos dependem do
documento e do termo em questão, isto é: µ(t) = F(d,t).
Portanto, a representação fuzzy de um documento é
baseada na definição de uma função F(d, t) que produz
um valor numérico que representa o peso do termo t
para o documento d
Modelo Fuzzy:
exemplo
O cálculo dos pesos não considera que em muitos casos os
documentos podem estar estruturados em sub-partes lógicas
ou seções, e que as ocorrências de um termo podem assumir
significados diferentes dependendo da seção onde ele aparece.
Um artigo científico, por exemplo, geralmente está organizado
em título, autores, palavras-chave, resumo, referências, etc.
Uma única ocorrência de um termo no título sugere que o
artigo discorre sobre o conceito expresso pelo termo.
Modelo Fuzzy:
exemplo
(BORDOGNA e PASI, 1995)
Para cada seção o usuário pode associar uma importância numérica α que será usada para enfatizar a função FSi(t,d).
O grau de pertinência de um termo em relação a um documento é realizado através da função de agregação. A função de agragação utiliza os graus de pertinência do termo em cada uma das seções FS1(d,t), FS2(d,t),...FSn(d,t). Esta representação fuzzy de documentos foi implementada em um sistema denominado DOMINO (Bordogna et al, 1990) e mostrou ser mais eficaz em relação a outros tipos de representação fuzzy
Discussão
O modelo fuzzy busca superar as limitações do modelo booleano generalizando a teoria dos conjuntos tradicional.
Na concepção tradicional um elemento pertence ou não a um determinado conjunto, da mesma forma como no modelo booleano um documento é ou não relevante para uma determinada expressão de busca.
Porém, em um sistema de recuperação de informação esse limite claro e preciso não existe. Entre um documento relevante e um não-relevante podem existem gradações (graus de relevância) com as quais o modelo booleano não consegue lidar.
O modelo fuzzy tem sido discutido principalmente na literatura dedicada à teoria fuzzy, sendo utilizado esporadicamente no campo da recuperação de informação.
A grande maioria dos experimentos realizados com este modelo considera apenas pequenos conjuntos de documentos, que não comprovam sua efetiva superioridade em relação a outros modelos de recuperação de informação.
Relevance Feedback
Baeza-Yates; Ribeiro-Neto, (2011, cap 5) distinguem dois
métodos:
◦ Explicit Relevance Feedback
a informação para a reformulação da consulta é fornecida diretamente pelo usuário;
Identificar termos dos documentos considerados relevantes para melhorar a consulta do usuário, melhorando o resultado da consulta;
◦ Implicit Relevance Feedback
a informação para a reformulação da consulta é implicitamente derivada pelo sistema.
Pesquisas indicam que melhoram os resultados de
busca não somente de texto mas também de imagens;
Explicit Relevance Feedback
por meio dos cliques
Os usuários dos mecanismos de buscas (search engines)
não somente verificam os resultados de suas buscas
mas também clicam sobre eles;
Os cliques refletem preferências por certos documentos
no contexto de uma dada consulta (busca);
Esses cliques podem ser contabilizados sem que o
usuário perceba;
Esses cliques podem refletir julgamentos de relevância
e podem ser utilizados para decidir a relevância de
documentos em futuras buscas (?)
Explicit Relevance Feedback
por eye tracking
A posição dos olhos do usuário podem ser “rastreados”
por dispositivos;
Esses dispositivos permitem detectar a área da tela de
interesse do usuário entre 60 e 90% dos casos;
Essas dados fornecem informações a respeito da reação
do usuário sobre o resultado de uma busca;
Modelo Vetorial
1. Após uma busca, o usuário seleciona (marca) os documentos que considera relevantes e submete tal seleção aos sistema;
2. Os termos que ocorrem nos documentos identificados como relevantes são adicionados ao vetor da expressão de busca original, ou os pesos de tais termos são aumentados na construção de uma nova expressão de busca; 3. Termos que ocorrem em documentos identificados como não relevantes são excluídos da expressão de busca original, ou os pesos de tais termos são reduzidos;
Documento considerado não-Relevante
Documento considerado Relevante
? Expressão de busca
Modelo Probabilístico
sim DOC4 t1, t4, t10 0.51 DOC1 t1, t4, t8, t9 0.26 DOC2 t8, t9, t10 0.26 ∑ = − ≈ t i n n N eBUSCA d sim 1 log ) , ( ∑ = − × − + − − × ≈ t i n r R r r n R N r eBUSCA d sim 1 ( ) ( ) ) ( log ) , ( √ √√ √ √ √√ √ DOC4 t1, t4, t10 2.02 DOC2 t8, t9, t10 1.65 DOC1 t1, t4, t8, t9 0.37 . . . . .Implicit Relevance Feedback
É realizado sem a intervenção/assistência do usuário;
◦ Análise Local
Deriva a informação para feedback dos documentos melhor ranqueados no conjunto de resultados;
◦ Análise Global
Deriva a informação para feedback de fontes externas tais como tesauros ou ontologias, ou relações entre termos extraídos dos documentos do corpus;
Redes Neurais
Um neurônio é uma célula formada por três seções:
corpo, dendritos e axônio.
Dendritos captam os estímulos e os transmitem ao corpo do neurônio;
Quando os estímulos atingirem um determinado limite, o corpo da célula envia um novo impulso que se propaga pelo axônio e é transmitido às células vizinhas através de sinapses; Como resultado, a informação de entrada é processada, podendo levar o cérebro a comandar reações físicas..
Capacidade de aprender:
Redes Neurais:
neurônio
Redes Neurais:
neurônio artificial
Conjunto de n conexões de entrada (x1, x2, ..., xn),
caracterizadas por pesos (p1, p2, ..., pn);
Somador (ΣΣΣΣ) para acumular os sinais de entrada; O valor resultante é enviado para a função de ativação (ϕϕ) , que define a saída (y) do neurônio.ϕϕ
Redes Neurais:
redes neurais artificiais
• Combinando diversos neurônios forma-se uma rede neural artificial (RNA).
• As RNA são modelos que buscam simular o processamento de informação do cérebro humano. • São compostas por unidades de processamentos simples, os neurônios, que se unem e se
comunicam por meio de conexões sinápticas.
• De uma forma simplificada, uma rede neural artificial pode ser vista como um grafo onde os nós são os neurônios e as ligações fazem a função das sinapses
• As RNA se diferenciam pela sua arquitetura e pela forma como os pesos associados às conexões são ajustados durante o processo de aprendizado.
Redes Neurais:
aplicações
Aprendizado de máquina
Reconhecimento de padrões
◦ Visão artificial ◦ Reconhecimento de voz ◦ Reconhecimento de facesRedes Neurais
... na recuperação de informação
Redes Neurais
... na recuperação de informação
• Mozer (1984) foi o pioneiro na utilização de técnicas de RNA na recuperação de informação.
• Ele utilizou uma arquitetura bastante simples que não empregava uma das principais características das redes neurais, que é a capacidade de aprender.
• A figura mostra um exemplo apresentado por Ford (1991, p. 108), que utiliza a arquitetura de RNA idealizada por Mozer.
• As linhas contínuas representam ligações
excitatórias entre os termos de indexação e os
documentos.
• As linhas pontilhadas, que ligam pares de documentos, representam ligações inibitórias, isto é, ligações que reduzem a força de associação entre os nós.
• Os termos de indexação ativam os documentos que são indexados por eles e vice-versa.
• Um documento, ao ser ativado, reduz o nível de ativação dos demais documentos
Redes Neurais
1. Busca: ativação de qualquer tipo de nó;
2. Quando a rede se estabiliza, os nós e as ligações que foram inferidos são apresentados ao usuário; 3. Em uma interface apropriada, o usuário poderá atribuir um grau de relevância para cada um dos
itens recuperados;
4. Este feedback é utilizado na aprendizagem da rede neural, que modifica os pesos associados às conexões entre seus nós.
5. O sistema busca gradualmente adequar os pesos das conexões.
(Belew, 1989)
Redes Neurais:
o sistema AIR
Redes Neurais:
... na Web
Shu e Kak (1999) implementaram um metabuscador que se apoia em quatro mecanismos de busca: Yahoo, Excite, Infoseek e WebCrawler Após a execução de uma busca, os resultados de cada um desses mecanismos são ordenados utilizando um algoritmo de classificação baseado em uma rede neural. Este algoritmo é o principal componente do metabuscador denominado “Anvish”.
Para o treinamento da rede neural, o Anvish utiliza as duas primeiras páginas do resultado de cada buscador Web como exemplo de respostas relevantes. As duas últimas páginas são apresentadas à rede neural como exemplo de respostas não relevantes.
Uma vez terminado este processo de aprendizagem, o Anvish apresenta as referências em ordem decrescente de relevância,
Discussão
Discussão
Vantagens
◦ Habilidade em produzir resultados não esperados, recuperando documentos que não possuem nenhum termo em comum com a expressão de busca, mas, mesmo assim, possivelmente relevantes para o usuário;
◦ Características atrativas no processo de recuperação de informação, principalmente a habilidade inata de se adaptarem às modificações nas condições do “ambiente”, representado pelas buscas dos usuários.
Discussão
De forma geral, não existem evidências conclusivas da
superioridade das RNA em relação aos modelos tradicionais
de recuperação de informação. Porém, as redes neurais
artificiais oferecem muitas características atrativas no
processo de recuperação de informação, principalmente a
habilidade inata de se adaptarem às modificações nas
condições do “ambiente”, representado pelas buscas dos
usuários (DOSZKOCS; REGGIA; LIN, 1990).
Baeza-Yates e Ribeiro-Neto (1999, p.48) consideram que
embora não se possa concluir a superioridade das RNA, uma
vez que sua aplicação na recuperação de informação não foi
suficientemente testada, tal abordagem apresenta-se como
um paradigma alternativo.
Algoritmos Genéticos
Algoritmos Genéticos
Seleção Natural
◦ Os indivíduos de uma mesma espécie apresentam variações que
os fazem mais ou menos adaptados ao meio ambiente onde vivem;
◦ Os organismos com variações favoráveis às condições do
ambiente têm maiores chances de sobreviver e se reproduzirem, transmitindo suas características a seus descendentes;
◦ Ao longo das gerações, a atuação da seleção natural sobre os
indivíduos melhora o grau de adaptação destes ao meio.
Reprodução
Seleção Mutação Nova população
Algoritmos Genéticos
Genética
◦ A teoria de Darwin não explicava como era feita a transmissão das características dos pais para os filhos, a hereditariedade.
◦ Em 1900, Hugo de Vries deparou-se com alguns artigos publicados pelo monge austríaco Gregor Mendel. Embora seu trabalho tivesse sido ignorado durante sua vida, Mendel, trabalhando com ervilhas, descobrira as leis da hereditariedade que revolucionaram a biologia e traçariam as bases da genética.
Algoritmos Genéticos
Reprodução
◦ Na reprodução cada um dos pais passa metade de seus cromossomos
aos filhos.
◦ Durante esse processo os cromossomos podem sofrer recombinações,
em um processo denominado crossover, tendo como consequência uma diversificação nas características do indivíduo
◦ O material genético pode sofrer mutações decorrentes de operações de crossover imperfeitas ou de estímulos externos.
◦ Sobre a inerente casualidade do processo de reprodução age a seleção natural, que seleciona os indivíduos cujas características os fazem mais adaptados ao meio ambiente onde vivem.
◦ Esses indivíduos possuem maiores chances de sobreviver e de se reproduzir, transmitindo assim seu material genético às gerações futuras.
Algoritmos Genéticos
Algoritmos genéticos (AG) são mecanismos de otimização baseados na teoria evolucionista de Darwin e nas descobertas sobre a reprodução humana e a genética;
As soluções obtidas através de algoritmos genéticos são chamadas “evolutivas”;
AG é um processo repetitivo que mantém uma população de “indivíduos”, que representam as possíveis soluções para um determinado problema;
A cada “geração” os indivíduos da população passam por uma avaliação de sua capacidade em oferecer uma solução satisfatória para o problema;
De acordo com esta avaliação alguns indivíduos, selecionados de acordo com uma regra probabilística, passam por um processo de reprodução, gerando uma nova população de possíveis soluções;
Algoritmos Genéticos:
etapas
Algoritmos Genéticos
... na recuperação de informação
Novo modelo para todo o processo de recuperação.
As representações dos documentos podem ser vistas como
um tipo de “código genético”.
Nesse código genético um cromossomo é representado por
um vetor binário onde cada elemento armazena o valor 0 ou
o valor 1, correspondendo respectivamente à presença ou
ausência de um determinado termo na representação do
documento.
Algoritmos Genéticos
... na recuperação de informação
Após execução da busca, o usuário seleciona os
documentos que considera relevantes para sua
necessidade de informação.
Durante esse processo, para um documento
considerado relevante as descrições que foram
responsáveis pela sua recuperação recebem um crédito
pelo seu sucesso e as descrições que não participaram
de sua recuperação são rebaixadas.
Para um documento recuperado que não foi
considerado relevante, as descrições que foram
responsáveis pela sua recuperação são rebaixadas e as
demais descrições recebem um crédito.
Algoritmos genéticos
...
na recuperação de informação
Codificação dos indivíduos
Representação da expressão de busca
Um gene representa a presença (1) ou a ausência (0) de um determinado termo de indexação ( ti) na descrição do documento e da busca
Algoritmos genéticos
...
na recuperação de informação
CorpusAlgoritmos Genéticos
... na recuperação de informação
0.2 0.0 0.25 Grau de adaptação FitnessAlgoritmos Genéticos
... na recuperação de informação
0.2 0.0 0.25 0.25 posição = 4 1 0 1 1 1 1 0 1 0 1 Reprodução posição = 3 1 0 1 0 1 1 0 1 1 1 0 0 1 1 1 0 0 1 0 1 Crossover Mutação “relevante”Algoritmos Genéticos
... na recuperação de informação
Discussão
Discussão
Vantagens
◦ Não exige precisão na indexação inicial dos documentos, o que
permite que esta tarefa seja realizada por profissionais não especialistas ou por computadores;
Desvantagens
◦ Excesso de parâmetros, o que dificulta a análise dos resultados;
Referências bibliográficas
Referências bibliográficas
BAEZA-YATES, R.; RIBEIRO-NETO, B. Modern Information Retrieval. Addison-Wesley, 1999.
BELEW, R. K. Adaptive information retrieval. Proceedings of the 12th annual
international ACM SIGIR conference on research and development in information retrieval, 1989. p.11-20.
BLAIR, D.C. Language and representation in information retrieval. Amsterdam: Elsevier, 1990.
BORDOGNA, G.; PASI, G. Controlling Information Retrieval through a user adaptive representation of documents. International Journal of Approximate Reasoning, 12, 1995. p.317-339.
BORDOGNA, G. et al. A system architecture for multimedia information retrieval.
Journal of Information Science. v. 16, n. 2, 1990. p.229-238.
Referências bibliográficas
GORDON, M. Probabilistic and genetic algorithms for document retrieval.
Communications of the ACM, v. 31, n. 10, 1988. p.1208-1218.
HAYKIN, S. Redes Neurais: Princípios e prática. Porto Alegre: Bookman, 2001. MOZER, M.C. Inductive information retrieval using parallel distributed
computation. ICS Technical Report 8406. University of California, San Diego, 1984.
SHAW, I.S. ; SIMÕES, M.G. Controle e modelagem fuzzy. São Paulo: Edgard Blücher, 1999.
ZADEH, L.A. Fuzzy sets. Information and Control, v. 8, n. 3, 1965. p.338-353. SHU, B.; KAK, S. A neural network-based intelligent metasearch engine. Information