25/04/2017. Relevance Feedback. Modelos Dinâmicos. Modelo Fuzzy

(1)

Relevance Feedback

Modelos Dinâmicos

(2)

Modelo Fuzzy

A lógica aristotélica é uma forte presença na cultura

ocidental e está profundamente enraizada em nossa

forma de pensar.

◦ Uma determinada afirmação é verdadeira ou falsa; Uma pessoa

ou é amiga ou inimiga.

◦ Na ciência, a verdade e a precisão estão intimamente ligadas e são partes indispensáveis do método científico.

◦ Porém, o mundo real contém uma infinidade de gradações entre

o preto e o branco, entre o certo e o errado, entre o verdadeiro e o falso. O mundo real é multivalente e analógico. Verdade e precisão absolutas existem apenas em casos extremos.

Modelo Fuzzy

Quando se diz que uma determinada pessoa é “alta”, o

que se está querendo dizer precisamente: 170 cm, 180

cm, 190 cm? Se fosse definido um limite de altura de

180 cm, por exemplo, então uma pessoa com 179 cm

não seria considerada alta.

Intuitivamente sabemos que não há uma distinção clara

entre uma pessoa de 179 cm de altura e uma de 180

cm. Quando os seres humanos pensam em altura eles

normalmente não têm um limite fixo em mente, mas

uma definição nebulosa, vaga.

(3)

Modelo Fuzzy

Lógica fuzzy (nebulosa)

◦ Tem como objetivo é capturar e operar com a diversidade, a

incerteza e as verdades parciais dos fenômenos da natureza de uma forma sistemática e rigorosa (SHAW; SIMÕES, 1999).

Modelo Fuzzy:

conjuntos fuzzy

Zadeh (1965) propôs uma nova teoria de conjuntos em

que não há descontinuidades, ou seja, não há uma

distinção abrupta entre elementos pertencentes e não

pertencentes a um conjunto: os Conjuntos Nebulosos

(Fuzzy Sets).

(4)

Modelo Fuzzy:

conjuntos fuzzy

Nos conjuntos fuzzy um elemento pode ser membro de um conjunto apenas parcialmente. Um valor entre zero e um (1) indicará o quanto o elemento é membro do conjunto.

A teoria dos conjuntos fuzzy é baseada no fato de que os conjuntos existentes no mundo real não possuem limites precisos.

Um conjunto fuzzy é um agrupamento indefinido de elementos no qual a transição de cada elemento de não-membro para membro do conjunto é gradual. .

Na figura, se o elemento x₂for movido em direção ao elemento x1, no limite do conjunto A ocorrerá

subitamente uma alteração de seu estado, passando de não-membro para membro do conjunto

Modelo Fuzzy:

conjuntos fuzzy

Na figura, o conjunto dos diversos valores das alturas de uma pessoa é denominado universo do

discurso. Todo conjunto fuzzy é um subconjunto do universo do discurso. Um subconjunto A do

universo do discurso U é caracterizado por uma função µA que associa a cada elemento x de U um número µA(x) entre 0 e 1.

{

x x

}

x U

(5)

Modelo Fuzzy

Um documento pode ser visto como um conjunto fuzzy

de termos, { t, µ(t) }, cujos pesos dependem do

documento e do termo em questão, isto é: µ(t) = F(d,t).

Portanto, a representação fuzzy de um documento é

baseada na definição de uma função F(d, t) que produz

um valor numérico que representa o peso do termo t

para o documento d

Modelo Fuzzy:

exemplo

O cálculo dos pesos não considera que em muitos casos os

documentos podem estar estruturados em sub-partes lógicas

ou seções, e que as ocorrências de um termo podem assumir

significados diferentes dependendo da seção onde ele aparece.

Um artigo científico, por exemplo, geralmente está organizado

em título, autores, palavras-chave, resumo, referências, etc.

Uma única ocorrência de um termo no título sugere que o

artigo discorre sobre o conceito expresso pelo termo.

(6)

Modelo Fuzzy:

exemplo

(BORDOGNA e PASI, 1995)

Para cada seção o usuário pode associar uma importância numérica α que será usada para enfatizar a função FSi(t,d).

O grau de pertinência de um termo em relação a um documento é realizado através da função de agregação. A função de agragação utiliza os graus de pertinência do termo em cada uma das seções F_S1(d,t), F_S2(d,t),...F_Sn(d,t). Esta representação fuzzy de documentos foi implementada em um sistema denominado DOMINO (Bordogna et al, 1990) e mostrou ser mais eficaz em relação a outros tipos de representação fuzzy

(7)

Discussão

O modelo fuzzy busca superar as limitações do modelo booleano generalizando a teoria dos conjuntos tradicional.

Na concepção tradicional um elemento pertence ou não a um determinado conjunto, da mesma forma como no modelo booleano um documento é ou não relevante para uma determinada expressão de busca.

Porém, em um sistema de recuperação de informação esse limite claro e preciso não existe. Entre um documento relevante e um não-relevante podem existem gradações (graus de relevância) com as quais o modelo booleano não consegue lidar.

O modelo fuzzy tem sido discutido principalmente na literatura dedicada à teoria fuzzy, sendo utilizado esporadicamente no campo da recuperação de informação.

A grande maioria dos experimentos realizados com este modelo considera apenas pequenos conjuntos de documentos, que não comprovam sua efetiva superioridade em relação a outros modelos de recuperação de informação.

(8)

Relevance Feedback

Baeza-Yates; Ribeiro-Neto, (2011, cap 5) distinguem dois

métodos:

◦ Explicit Relevance Feedback

a informação para a reformulação da consulta é fornecida diretamente pelo usuário;

Identificar termos dos documentos considerados relevantes para melhorar a consulta do usuário, melhorando o resultado da consulta;

◦ Implicit Relevance Feedback

a informação para a reformulação da consulta é implicitamente derivada pelo sistema.

Pesquisas indicam que melhoram os resultados de

busca não somente de texto mas também de imagens;

(9)

Explicit Relevance Feedback

por meio dos cliques

Os usuários dos mecanismos de buscas (search engines)

não somente verificam os resultados de suas buscas

mas também clicam sobre eles;

Os cliques refletem preferências por certos documentos

no contexto de uma dada consulta (busca);

Esses cliques podem ser contabilizados sem que o

usuário perceba;

Esses cliques podem refletir julgamentos de relevância

e podem ser utilizados para decidir a relevância de

documentos em futuras buscas (?)

Explicit Relevance Feedback

por eye tracking

A posição dos olhos do usuário podem ser “rastreados”

por dispositivos;

Esses dispositivos permitem detectar a área da tela de

interesse do usuário entre 60 e 90% dos casos;

Essas dados fornecem informações a respeito da reação

do usuário sobre o resultado de uma busca;

(10)

Modelo Vetorial

1. Após uma busca, o usuário seleciona (marca) os documentos que considera relevantes e submete tal seleção aos sistema;

2. Os termos que ocorrem nos documentos identificados como relevantes são adicionados ao vetor da expressão de busca original, ou os pesos de tais termos são aumentados na construção de uma nova expressão de busca; 3. Termos que ocorrem em documentos identificados como não relevantes são excluídos da expressão de busca original, ou os pesos de tais termos são reduzidos;

Documento considerado não-Relevante

Documento considerado Relevante

? Expressão de busca

Modelo Probabilístico

sim DOC4 t1, t4, t10 0.51 DOC1 t1, t4, t8, t9 0.26 DOC2 t8, t9, t10 0.26 ∑ =       − ≈ t i n n N eBUSCA d sim 1 log ) , ( ∑ =      − × − + − − × ≈ t i n r R r r n R N r eBUSCA d sim 1 ( ) ( ) ) ( log ) , ( √ √√ √ √ √√ √ DOC4 t1, t4, t10 2.02 DOC2 t8, t9, t10 1.65 DOC1 t1, t4, t8, t9 0.37 . . . _. .

(11)

Implicit Relevance Feedback

É realizado sem a intervenção/assistência do usuário;

◦ Análise Local

Deriva a informação para feedback dos documentos melhor ranqueados no conjunto de resultados;

◦ Análise Global

Deriva a informação para feedback de fontes externas tais como tesauros ou ontologias, ou relações entre termos extraídos dos documentos do corpus;

(12)

Redes Neurais

Um neurônio é uma célula formada por três seções:

corpo, dendritos e axônio.

Dendritos captam os estímulos e os transmitem ao corpo do neurônio;

Quando os estímulos atingirem um determinado limite, o corpo da célula envia um novo impulso que se propaga pelo axônio e é transmitido às células vizinhas através de sinapses; Como resultado, a informação de entrada é processada, podendo levar o cérebro a comandar reações físicas..

Capacidade de aprender:

Redes Neurais:

neurônio

(13)

Redes Neurais:

neurônio artificial

Conjunto de n conexões de entrada (x₁, x₂, ..., x_n),

caracterizadas por pesos (p1, p2, ..., pn);

Somador (ΣΣΣΣ) para acumular os sinais de entrada; O valor resultante é enviado para a função de ativação (ϕϕ) , que define a saída (y) do neurônio.ϕϕ

Redes Neurais:

redes neurais artificiais

• Combinando diversos neurônios forma-se uma rede neural artificial (RNA).

• As RNA são modelos que buscam simular o processamento de informação do cérebro humano. • São compostas por unidades de processamentos simples, os neurônios, que se unem e se

comunicam por meio de conexões sinápticas.

• De uma forma simplificada, uma rede neural artificial pode ser vista como um grafo onde os nós são os neurônios e as ligações fazem a função das sinapses

• As RNA se diferenciam pela sua arquitetura e pela forma como os pesos associados às conexões são ajustados durante o processo de aprendizado.

(14)

Redes Neurais:

aplicações

Aprendizado de máquina

Reconhecimento de padrões

◦ Visão artificial ◦ Reconhecimento de voz ◦ Reconhecimento de faces

Redes Neurais

... na recuperação de informação

(15)

Redes Neurais

... na recuperação de informação

• Mozer (1984) foi o pioneiro na utilização de técnicas de RNA na recuperação de informação.

• Ele utilizou uma arquitetura bastante simples que não empregava uma das principais características das redes neurais, que é a capacidade de aprender.

• A figura mostra um exemplo apresentado por Ford (1991, p. 108), que utiliza a arquitetura de RNA idealizada por Mozer.

• As linhas contínuas representam ligações

excitatórias entre os termos de indexação e os

documentos.

• As linhas pontilhadas, que ligam pares de documentos, representam ligações inibitórias, isto é, ligações que reduzem a força de associação entre os nós.

• Os termos de indexação ativam os documentos que são indexados por eles e vice-versa.

• Um documento, ao ser ativado, reduz o nível de ativação dos demais documentos

Redes Neurais

(16)

1. Busca: ativação de qualquer tipo de nó;

2. Quando a rede se estabiliza, os nós e as ligações que foram inferidos são apresentados ao usuário; 3. Em uma interface apropriada, o usuário poderá atribuir um grau de relevância para cada um dos

itens recuperados;

4. Este feedback é utilizado na aprendizagem da rede neural, que modifica os pesos associados às conexões entre seus nós.

5. O sistema busca gradualmente adequar os pesos das conexões.

(Belew, 1989)

Redes Neurais:

o sistema AIR

Redes Neurais:

... na Web

Shu e Kak (1999) implementaram um metabuscador que se apoia em quatro mecanismos de busca: Yahoo, Excite, Infoseek e WebCrawler Após a execução de uma busca, os resultados de cada um desses mecanismos são ordenados utilizando um algoritmo de classificação baseado em uma rede neural. Este algoritmo é o principal componente do metabuscador denominado “Anvish”.

Para o treinamento da rede neural, o Anvish utiliza as duas primeiras páginas do resultado de cada buscador Web como exemplo de respostas relevantes. As duas últimas páginas são apresentadas à rede neural como exemplo de respostas não relevantes.

Uma vez terminado este processo de aprendizagem, o Anvish apresenta as referências em ordem decrescente de relevância,

(17)

Discussão

Discussão

Vantagens

◦ Habilidade em produzir resultados não esperados, recuperando documentos que não possuem nenhum termo em comum com a expressão de busca, mas, mesmo assim, possivelmente relevantes para o usuário;

◦ Características atrativas no processo de recuperação de informação, principalmente a habilidade inata de se adaptarem às modificações nas condições do “ambiente”, representado pelas buscas dos usuários.

(18)

Discussão

De forma geral, não existem evidências conclusivas da

superioridade das RNA em relação aos modelos tradicionais

de recuperação de informação. Porém, as redes neurais

artificiais oferecem muitas características atrativas no

processo de recuperação de informação, principalmente a

habilidade inata de se adaptarem às modificações nas

condições do “ambiente”, representado pelas buscas dos

usuários (DOSZKOCS; REGGIA; LIN, 1990).

Baeza-Yates e Ribeiro-Neto (1999, p.48) consideram que

embora não se possa concluir a superioridade das RNA, uma

vez que sua aplicação na recuperação de informação não foi

suficientemente testada, tal abordagem apresenta-se como

um paradigma alternativo.

Algoritmos Genéticos

(19)

Algoritmos Genéticos

Seleção Natural

◦ Os indivíduos de uma mesma espécie apresentam variações que

os fazem mais ou menos adaptados ao meio ambiente onde vivem;

◦ Os organismos com variações favoráveis às condições do

ambiente têm maiores chances de sobreviver e se reproduzirem, transmitindo suas características a seus descendentes;

◦ Ao longo das gerações, a atuação da seleção natural sobre os

indivíduos melhora o grau de adaptação destes ao meio.

Reprodução

Seleção Mutação Nova população

Algoritmos Genéticos

Genética

◦ A teoria de Darwin não explicava como era feita a transmissão das características dos pais para os filhos, a hereditariedade.

◦ Em 1900, Hugo de Vries deparou-se com alguns artigos publicados pelo monge austríaco Gregor Mendel. Embora seu trabalho tivesse sido ignorado durante sua vida, Mendel, trabalhando com ervilhas, descobrira as leis da hereditariedade que revolucionaram a biologia e traçariam as bases da genética.

(20)

Algoritmos Genéticos

Reprodução

◦ Na reprodução cada um dos pais passa metade de seus cromossomos

aos filhos.

◦ Durante esse processo os cromossomos podem sofrer recombinações,

em um processo denominado crossover, tendo como consequência uma diversificação nas características do indivíduo

◦ O material genético pode sofrer mutações decorrentes de operações de crossover imperfeitas ou de estímulos externos.

◦ Sobre a inerente casualidade do processo de reprodução age a seleção natural, que seleciona os indivíduos cujas características os fazem mais adaptados ao meio ambiente onde vivem.

◦ Esses indivíduos possuem maiores chances de sobreviver e de se reproduzir, transmitindo assim seu material genético às gerações futuras.

Algoritmos Genéticos

Algoritmos genéticos (AG) são mecanismos de otimização baseados na teoria evolucionista de Darwin e nas descobertas sobre a reprodução humana e a genética;

As soluções obtidas através de algoritmos genéticos são chamadas “evolutivas”;

AG é um processo repetitivo que mantém uma população de “indivíduos”, que representam as possíveis soluções para um determinado problema;

A cada “geração” os indivíduos da população passam por uma avaliação de sua capacidade em oferecer uma solução satisfatória para o problema;

De acordo com esta avaliação alguns indivíduos, selecionados de acordo com uma regra probabilística, passam por um processo de reprodução, gerando uma nova população de possíveis soluções;

(21)

Algoritmos Genéticos:

etapas

Algoritmos Genéticos

... na recuperação de informação

Novo modelo para todo o processo de recuperação.

As representações dos documentos podem ser vistas como

um tipo de “código genético”.

Nesse código genético um cromossomo é representado por

um vetor binário onde cada elemento armazena o valor 0 ou

o valor 1, correspondendo respectivamente à presença ou

ausência de um determinado termo na representação do

documento.

(22)

Algoritmos Genéticos

... na recuperação de informação

Após execução da busca, o usuário seleciona os

documentos que considera relevantes para sua

necessidade de informação.

Durante esse processo, para um documento

considerado relevante as descrições que foram

responsáveis pela sua recuperação recebem um crédito

pelo seu sucesso e as descrições que não participaram

de sua recuperação são rebaixadas.

Para um documento recuperado que não foi

considerado relevante, as descrições que foram

responsáveis pela sua recuperação são rebaixadas e as

demais descrições recebem um crédito.

Algoritmos genéticos

...

na recuperação de informação

Codificação dos indivíduos

Representação da expressão de busca

Um gene representa a presença (1) ou a ausência (0) de um determinado termo de indexação ( t_i) na descrição do documento e da busca

(23)

Algoritmos genéticos

...

na recuperação de informação

Corpus

Algoritmos Genéticos

... na recuperação de informação

0.2 0.0 0.25 Grau de adaptação Fitness

(24)

Algoritmos Genéticos

... na recuperação de informação

0.2 0.0 0.25 0.25 posição = 4 1 0 1 1 1 1 0 1 0 1 Reprodução posição = 3 1 0 1 0 1 1 0 1 1 1 0 0 1 1 1 0 0 1 0 1 Crossover Mutação “relevante”

Algoritmos Genéticos

... na recuperação de informação

(25)

Discussão

Discussão

Vantagens

◦ Não exige precisão na indexação inicial dos documentos, o que

permite que esta tarefa seja realizada por profissionais não especialistas ou por computadores;

Desvantagens

◦ Excesso de parâmetros, o que dificulta a análise dos resultados;

(26)

Referências bibliográficas

Referências bibliográficas

BAEZA-YATES, R.; RIBEIRO-NETO, B. Modern Information Retrieval. Addison-Wesley, 1999.

BELEW, R. K. Adaptive information retrieval. Proceedings of the 12th annual

international ACM SIGIR conference on research and development in information retrieval, 1989. p.11-20.

BLAIR, D.C. Language and representation in information retrieval. Amsterdam: Elsevier, 1990.

BORDOGNA, G.; PASI, G. Controlling Information Retrieval through a user adaptive representation of documents. International Journal of Approximate Reasoning, 12, 1995. p.317-339.

BORDOGNA, G. et al. A system architecture for multimedia information retrieval.

Journal of Information Science. v. 16, n. 2, 1990. p.229-238.

(27)

Referências bibliográficas

GORDON, M. Probabilistic and genetic algorithms for document retrieval.

Communications of the ACM, v. 31, n. 10, 1988. p.1208-1218.

HAYKIN, S. Redes Neurais: Princípios e prática. Porto Alegre: Bookman, 2001. MOZER, M.C. Inductive information retrieval using parallel distributed

computation. ICS Technical Report 8406. University of California, San Diego, 1984.

SHAW, I.S. ; SIMÕES, M.G. Controle e modelagem fuzzy. São Paulo: Edgard Blücher, 1999.

ZADEH, L.A. Fuzzy sets. Information and Control, v. 8, n. 3, 1965. p.338-353. SHU, B.; KAK, S. A neural network-based intelligent metasearch engine. Information