• Nenhum resultado encontrado

3 TECNOLOGIAS USADAS NO DESENVOLVIMENTO DA PROPOST

3.1 Recuperação e Filtragem da Informação

3.1.2 Filtragem de Informação – FI

A Filtragem de Informação (BURKE, 2000) é a área de pesquisa que oferece ferramentas para separar informações relevantes e irrelevantes, e a sua entrega para pessoas que precisam dela. A FI (BELKIN, CROFT, 1992) objetiva atender às necessidades de longo prazo do usuário, as quais são expressas como perfis, que são utilizados no processo de busca. Os perfis podem ser adquiridos tanto de maneira explicita, através de informações diretamente fornecidas pelos usuários, bem como implicitamente, através da captura automática baseada nas observações do comportamento do usuário. Na definição da relevância das informações podem ser utilizadas tanto informações do usuário alvo, como também de outros usuários com hábitos similares ao mesmo, ou mesmo uma abordagem híbrida através da combinação de várias informações disponíveis.

As principais técnicas atualmente utilizadas no processo de filtragem da informação são: Filtragem Colaborativa (FC), Filtragem Baseada no Conteúdo (FBC) e Filtragem Híbrida (FH) (ADOMAVICUS, TUZHILIN, 2005).

o Filtragem Baseada em Conteúdo - FBC: baseia-se em informações obtidas

através da análise do conteúdo dos itens de informação pelos quais o usuário demonstrou preferência no passado (ADOMAVICUS, TUZHILIN, 2005). Ou seja, para fazer a recomendação, os sistemas que utilizam essa abordagem inicialmente tentam “entender” padrões de preferências existentes nos itens previamente avaliados pelo próprio usuário e, a partir daí, fazem a extração de vários termos ou palavras-chave, que servem para a configuração de um perfil contendo as suas preferências. Para cada item de informação são configurados perfis de representação, contento os termos considerados mais importantes destes itens. A definição dos itens de maior relevância para os usuários é realizada através da análise da similaridade entre as representações internas dos itens de informação e a representação do perfil dos usuários, a partir da qual é montado um ranking.

o Filtragem Colaborativa - FC: baseia em avaliações realizadas pelo usuário

alvo, mas sim nas avaliações deste item realizadas por outros usuários que possuem um padrão semelhante de avaliação ao usuário alvo (HERLOCKER et al, 2004). Ou seja, usuários que no passado avaliaram os mesmos itens que o usuário alvo de uma maneira similar, teoricamente teriam gostos semelhantes aos gostos que este. O funcionamento básico desta técnica, divide-se em três passos principais: definição da similaridade, seleção dos vizinhos mais próximos e predição (que é a recomendação propriamente dita).

o Filtragem Híbrida - FH: consiste em combinar diversos recursos utilizados

na Filtragem Baseada no Conteúdo e na Filtragem Colaborativa (HERLOCKER et al, 2004), com o principal objetivo de suprir certas limitações existentes nessas duas abordagens. Existem inúmeras técnicas para realizar essa combinação, as quais basicamente fundamentam-se em três princípios: combinação de resultados em separado, introdução de métodos de FC em FBC, introdução de métodos de FBC em FC, e construção de modelos genéricos envolvendo as duas técnicas. É utilizada

para suprir certas limitações das abordagens baseadas no conteúdo e colaborativas.

3.1.2.1 Limitações das Técnicas de Filtragem

A FBC permite uma exploração mais personalizada de detalhes relativos ao usuário, tendo em vista que refere-se a informações exclusivas ao seu comportamento. Porém, os dois principais problemas associados com a mesma, e que devem ser inicialmente resolvidos estão relacionados à dificuldade na definição da representação dos documentos, e à definição de um perfil efetivamente representativo em relação às preferências do usuário (ADOMAVICUS, TUZHILIN, 2005). Outras limitações comumente observadas na utilização desta técnica são referentes a: limitação das análises a conteúdos apenas na forma de texto; não distinção de qualidade entre bons e maus textos; possibilidade de recomendar apenas itens semelhantes aos que o usuário já avaliou (superespecialização); usuários novos (sem avaliações) não recebem recomendações; etc.

A FC permite uma exploração mais ampla de itens ainda não avaliados pelo usuário, solucionando algumas limitações da FBC (ADOMAVICUS, TUZHILIN, 2005). Contudo, a mesma também possui algumas limitações, dentre as quais destacam-se: itens novos (sem avaliações) não podem ser recomendados; usuários novos não possuem vizinhos – conseqüentemente não recebem recomendações; só é possível recomendar itens semelhantes aos que o usuário já avaliou (superespecialização); o aumento do número de itens sem avaliações diminui a quantidade de vizinhos (esparsividade); bases de dados muito grandes demandam longo tempo de processamento (escalabilidade); etc.

3.1.2.2 Sistemas de Recomendação

Sistemas de Recomendação são tipos particulares de aplicações de filtragem de informação (ADOMAVICUS, TUZHILIN, 2005). Os mesmos vêm sendo desenvolvidos para mediar, apoiar e automatizar o processo cotidiano de compartilhar recomendações (TERVEEN, HILL,2001), e têm se mostrado uma ferramenta poderosa a ser utilizada em comércio eletrônico, bibliotecas digitais e gerência de conhecimento. Nos últimos anos, estes sistemas passaram a serem utilizados comercialmente em lojas na Web.

O uso crescente desses sistemas tem possibilitado o aumento das vendas, por ser uma abordagem que ajuda o consumidor a encontrar o produto desejado (SCHAFER et al., 2001). De acordo com Cazella e Reategui (2004) “em um sistema típico as pessoas fornecem recomendações como entradas e o sistema agrega e direciona para os indivíduos considerados potenciais interessados neste tipo de recomendação”. Para cumprir o seu objetivo, um sistema de recomendações deve seguir três etapas necessárias para a geração da recomendação, as quais consistem em: identificação do usuário, definição de um perfil para representar os interesses do usuário e geração das recomendações.

Após a identificação do usuário, o sistema de recomendação deve ser capaz de coletar dados destinados à representação das suas preferências, e isso é realizado através da definição de um perfil do usuário. Este perfil pode ser definido de duas maneiras: implícita ou explícita. O perfil definido explicitamente é obtido através de informações explicitamente fornecidas pelo usuário em relação às suas preferências. No perfil definido implicitamente, as informações relacionadas às preferências do usuário são baseadas no comportamento em relação às informações acessadas pelo mesmo (por exemplo, as páginas da Web que este acessa).

Dentre as técnicas utilizadas para a definição do perfil implícito do usuário, encontra-se a Mineração de uso na Web, a qual consiste, em geral, na investigação ou monitoramento das páginas visitadas pelos usuários, na busca de ocorrências e tendências que possam levar a inferências relacionadas aos interesses de informação dos mesmos. Essas inferências, por sua vez,

conduzem à identificação de padrões (CHEN, et. al., 1998) de relevância para o domínio da aplicação, possibilitando, desta forma, a definição dos modelos que representam o comportamento e interesses dos usuários (PIERRAKOS, et. al., 2003). Nesse contexto, os dados de uso podem ser encontrados tanto nos logs dos servidores Web, como nas próprias estruturas dos sites Web, ou mesmo obtidos através de cookies, etc.

Na proporção que ocorre mais interação do usuário com o sistema, este é capaz de realizar refinamentos e atualizações do perfil do usuário em relação às suas necessidades de informação, as quais podem se modificar com o tempo. A Figura 6 mostra um modelo genérico de sistema de recomendação (BURKE, 2002).

Figura 6 Sistema de Recomendação Genérico (BURKE, 2002)