• Nenhum resultado encontrado

VANTAGENS E DESVANTAGENS DA FILTRAGEM BASEADA EM CONTEÚDO

No documento TCC Ivo Romário R. Carneiro Lima 2012.2 (páginas 32-36)

2   SISTEMAS DE RECOMENDAÇÃO

2.2   TÉCNICAS DE RECOMENDAÇÃO 21

2.2.2   FILTRAGEM BASEADA EM CONTEÚDO 28

2.2.2.3   VANTAGENS E DESVANTAGENS DA FILTRAGEM BASEADA EM CONTEÚDO

A filtragem por conteúdo funciona muito bem para recomendar itens em domínios textuais. Por depender apenas das descrições textuais dos itens, ela apresenta duas vantagens preponderantes sobre a abordagem colaborativa: Não há problemas de Partida Fria e Esparsidade. Ou seja, por não precisarem das avaliações feitas pelos usuários, pouco importa se existem muitos itens sem serem avaliados ou mesmo se um item acabou de ser adicionado aos demais.

Contudo, não se pode modelar um sistema muito eficiente com uma abordagem exclusivamente baseada em conteúdo. Suas limitações aparecem em alguns domínios onde nem sempre é possível representar os itens adequadamente. Aspectos como a qualidade de um filme e opiniões a respeito do estilo de escrita de determinado autor não podem ser extraídos sem que haja colaboração dos usuários.

Por fim, as técnicas analisam apenas o conteúdo dos textos e então recomendam itens com conteúdo similar. Isso gera uma superespecialização nas recomendações. Por exemplo, se considerarmos um usuário que tenha lido apenas textos relacionados a esporte, é muito mais complicado para o sistema surpreendê-lo com recomendações que extrapolem essa área, mesmo que o leitor tenha interesse por outros assuntos.

2.2.3 FILTRAGEM HÍBRIDA

Como pôde ser observado através dos tópicos anteriores, cada técnica de filtragem, seja colaborativa ou baseada em conteúdo, possui algumas limitações em sua aplicação. Nesse contexto, a partir da necessidade de contornar tais limitações, surgem então, sistemas denominados híbridos.

Os Sistemas de Recomendação por Filtragem Híbrida são aqueles que combinam duas ou mais dessas técnicas com o intuito de melhorar a qualidade e o desempenho no processo de geração das recomendações. A principal ideia em combinar diversas técnicas de recomendação está em superar as limitações que são encontradas em cada técnica separadamente.

O Netflix Prize, por exemplo, é uma competição aberta que disponibiliza uma base de dados com mais de 100 milhões de avaliações de filmes e ofereceu durante três anos um prêmio de um milhão de dólares à equipe que conseguir apresentar os algoritmos de recomendação mais

acurados. Em 2007, o algoritmo da equipe vencedora utilizou 107 técnicas diferentes, misturadas para gerar a recomendação. Isso mostra a ampla gama de combinações que podem ser executadas na construção de sistemas híbridos de recomendação.

Uma taxonomia proposta por Burke (2002) define métodos que podem ser utilizados na modelagem de sistemas híbridos. Esses métodos são baseados nas relações de entrada e saída e hierarquia envolvida no uso das técnicas de recomendação. A seguir, cada um deles é descrito:

Weighted

No modelo, a nota de um item é definida através das notas de todas as técnicas de recomendação que o sistema utiliza. Por exemplo, a combinação linear das notas de recomendação dadas por cada técnica em separado. O sistema P-Tango (CLAYPOOL et al., 1999) usa esse modelo híbrido, inicialmente dando pesos iguais às recomendações baseadas em conteúdo e colaborativas e, gradualmente realizando ajustes nos pesos.

Um benefício do uso desse modelo é que todas as técnicas são utilizadas diretamente no processo de recomendação e o peso de suas participações é ajustado conforme necessário.

Switching

No modelo, são usados critérios para alternar entre as técnicas de recomendação que compõem o sistema. O sistema DailyLearner (BILLSUS & PAZZANI, 2000) usa uma abordagem híbrida baseada em conteúdo e colaboração, onde o método executado inicialmente é o baseado em conteúdo. Caso tal método não possa gerar recomendações com confiança suficiente para um usuário, a técnica colaborativa é tentada.

Essa abordagem pode evitar problemas específicos de um dos métodos, como por exemplo, a dificuldade que a FC tem em lidar com itens novos, simplesmente trocando para a recomendação por conteúdo. No entanto, um novo nível de complexidade é adicionado ao SR como um todo, visto que é necessário modelar os critérios para a realização dessa troca.

O modelo mixed é indicado quando é possível fazer muitas recomendações ao mesmo tempo. Nele as recomendações geradas por mais de uma técnica são unidas e fornecidas. O sistema PTV (SMYTH & COTTER, 2000) usa um componente baseado em conteúdo e outro colaborativo para recomendar uma programação de TV.

A mistura de técnicas evita o problema para sugerir novos itens, pois mesmo que não tenham sido avaliados por ninguém, esses itens podem ser recomendados através da atuação da componente baseada em conteúdo.

Feature Combination

No modelo feature combination as duas técnicas de recomendação são usadas de forma que a primeira técnica coleta características que são usadas pela segunda técnica, processando assim dados diferentes.

Cascade

No modelo cascade, o processo de recomendação envolve estágios. Dessa forma, uma técnica de recomendação é empregada inicialmente para produzir um resultado intermediário, e em seguida, uma segunda técnica refina esse resultado parcial, gerando as recomendações.

O SR EntreeC (BURKE, 2002) utiliza esse modelo híbrido no seu processo de recomendar restaurantes. Inicialmente é usado um SR baseado em Conhecimento (taxonomia não abordada nesse trabalho) para gerar recomendações de acordo com os interesses especificados pelo usuário. Estas, por sua vez, são agrupadas em conjuntos de preferências idênticas, e só então, um SR Colaborativo atua sobre os restaurantes contidos em um mesmo conjunto, funcionando como um processo de desempate.

Meta-level

O último dos modelos consiste em combinar duas técnicas de recomendação usando um modelo gerado por uma delas como entrada para a outra. Enquanto no Feature Augmentation o

modelo aprendido é usado para gerar características e agregá-las como entrada para o segundo algoritmo, no Meta-level o modelo inteiro se torna entrada para a segunda técnica utilizada.

Um exemplo de SR que utiliza esse modelo híbrido é o Fab (BALABANOVIC & SHOHAM, 1997), cujo foco está em recomendar documentos na Web. Ele é composto de um SR colaborativo que gera um modelo utilizado posteriormente pelo SR baseado em conteúdo.

No documento TCC Ivo Romário R. Carneiro Lima 2012.2 (páginas 32-36)

Documentos relacionados