SISTEMA DE RECOMENDAÇÃO DE OBJETOS DE APRENDIZAGEM

(1)

UNIVERSIDADE DO VALE DO ITAJAÍ

CENTRO DE CIÊNCIAS TECNOLÓGICAS DA TERRA E DO MAR CURSO DE CIÊNCIA DA COMPUTAÇÃO

SISTEMA DE RECOMENDAÇÃO DE OBJETOS DE APRENDIZAGEM

Área de Informática na Educação por

Vinicius Hartmann Ferreira

André Luis Alice Raabe, Dr.

Orientador

Itajaí (SC), dezembro de 2009

(2)

UNIVERSIDADE DO VALE DO ITAJAÍ

CENTRO DE CIÊNCIAS TECNOLÓGICAS DA TERRA E DO MAR CURSO DE CIÊNCIA DA COMPUTAÇÃO

SISTEMA DE RECOMENDAÇÃO DE OBJETOS DE APRENDIZAGEM

Área de Informática na Educação

por

Vinicius Hartmann Ferreira

Relatório apresentado à Banca Examinadora do Trabalho de Conclusão do Curso de Ciência da Computação para análise e aprovação.

Orientador: André Luis Alice Raabe, Dr.

Itajaí (SC), dezembro de 2009

(3)

SUMÁRIO

LISTA DE ABREVIATURAS... iv

LISTA DE FIGURAS ... v

LISTA DE TABELAS ... vi

LISTA DE EQUAÇÕES ... vii

RESUMO ... viii

ABSTRACT ... ix

1 INTRODUÇÃO ... 1

1.1 PROBLEMATIZAÇÃO ... 3

1.1.1 Formulação do Problema ... 3

1.1.2 Solução Proposta ... 4

1.2 OBJETIVOS ... 4

1.2.1 Objetivo Geral ... 4

1.2.2 Objetivos Específicos ... 4

1.3 METODOLOGIA ... 5

1.4 ESTRUTURA DO TRABALHO ... 5

2 FUNDAMENTAÇÃO TEÓRICA ... 6

2.1 SISTEMAS DE RECOMENDAÇÃO ... 6

2.1.1 Identificação do usuário e obtenção de dados ... 7

2.1.2 Estratégias de recomendação ... 9

2.1.3 Técnicas de recomendação ... 14

2.1.4 Trabalhos similares ... 21

2.1.5 Análise dos Trabalhos Similares ... 33

2.2 LEARNING MANAGEMENT SYSTEM (LMS) ... 35

2.2.1 Objetos de Aprendizagem ... 36

2.2.2 SCORM ... 37

2.2.3 Repositório de Objetos de Aprendizagem ... 38

2.2.4 Ambiente Sophia ... 39

3 PROJETO ... 41

3.1 LEVANTAMENTO DE REQUISITOS ... 41

3.1.1 Requisitos Funcionais ... 41

3.1.2 Requisitos não Funcionais ... 41

3.1.3 Regras de negócio ... 42

3.2 MODELAGEM DO SISTEMA... 42

3.3 DESENVOLVIMENTO ... 48

3.3.1 Aquisição de informação ... 49

3.3.2 Recomendação ... 49

3.3.3 Visualização da recomendação ... 53

(4)

3.4 RESULTADOS ... 54

4 CONCLUSÕES ... 59

REFERÊNCIAS BIBLIOGRÁFICAS ... 61

(5)

LISTA DE ABREVIATURAS

COFI Collaborative Filtering

DISCORS Dual Information Source Model-Based Collaborative Recommender System

EaD Ensino a Distância

LMS Learning Management System

LOM Learning Object Metadata

LorSys Learning Object Recommender System MIT Massachussets Institute of Technology

MOODLE Modular Object-Oriented Dynamic Learning Enviroment

NRC National Research Council

PHOAKS People Helping One Another Know Stuff RALOCA Rule Applying Learning Comparison Object ROA Repositório de Objetos de Aprendizagem SCORM Sharable Content Object Reusable Model

SisRecCol Sistema de Recomendação para apoio à Colaboração

TCC Trabalho de Conclusão de Curso

UNIVALI Universidade do Vale do Itajaí

(6)

LISTA DE FIGURAS

Figura 1. Estrutura dos sistemas de recomendação ... 7

Figura 2. Lista de Recomendação ... 10

Figura 3. Avaliação dos usuários ... 11

Figura 4. Recomendações personalizadas ... 12

Figura 5. Usuários que se interessam por X também se interessam por Y ... 13

Figura 6. Associação por conteúdo ... 13

Figura 7. Filtragem Híbrida ... 19

Figura 8. Arquitetura Fab ... 25

Figura 9. Exemplo de comentário MobyRek ... 26

Figura 10. Exemplo de possibilidade de recomendação ... 26

Figura 11. Arquitetura da plataforma RecS-DL Fonte: Pedronette e Torres (2008). ... 28

Figura 12. DISCORS... 29

Figura 13. Processo de recomendação baseado em comentários dos usuários ... 30

Figura 14. Recomendação gerada pelo RACOFI Music ... 32

Figura 15. Seções da especificação do padrão SCORM ... 38

Figura 16. Bloco no MOODLE ... 40

Figura 17. Diagrama de atividade para filtragem baseada em conteúdo ... 44

Figura 18. Diagrama de seqüência da recomendação baseada em conteúdo ... 45

Figura 19. Diagrama de atividade para filtragem colaborativa ... 46

Figura 20. Diagrama de seqüência da recomendação por filtragem colaborativa ... 47

Figura 21. Diagrama E-R do LorSys ... 48

Figura 22. Filtragem colaborativa ... 50

Figura 23. Objetos de aprendizagem disponíveis em uma disciplina ... 51

Figura 24. Interface de relação entre objetos de aprendizagem ... 52

Figura 25. Objetos de Aprendizagem recomendados ... 53

Figura 26. Recomendação recebida pelo Usuário 4 ... 57

(7)

LISTA DE TABELAS

Tabela 1. Técnicas de recomendação ... 14

Tabela 2. Filtragem colaborativa ... 15

Tabela 3. Síntese dos trabalhos similares ... 33

Tabela 4. Objetos de Aprendizagem disponibilizados na disciplina Revisão Computação ... 54

Tabela 5. Recomendações acessadas pelos usuários ... 55

Tabela 6. Objetos acessados por completo pelos usuários. ... 56

(8)

LISTA DE EQUAÇÕES

Equação 1. Correlação de Pearson ... 16 Equação 2. Cálculo de predição ... 16 Equação 3. Equação de similaridade ... 17

(9)

RESUMO

FERREIRA, Vinicius H. Sistema de Recomendação de Objetos de Aprendizagem. Itajaí, 2009.

70 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação)–Centro de Ciências Tecnológicas da Terra e do Mar, Universidade do Vale do Itajaí, Itajaí, 2009.

Dá-se o nome de e-learning ao emprego da tecnologia computacional na educação. Através do e- learning é possível que o ensino a distância seja realizado através da internet. Com o amadurecimento das metodologias de design instrucional e simultânea evolução da infra-estrutura tecnológica de apoio a esta modalidade de ensino surgiram os objetos de aprendizagem. Geralmente armazenados em ambientes chamados de LMSs (Learning Management systems), estes materiais de ensino são desenvolvidos baseados em padrões como o SCORM (Shareable Content Object Reference Model) que possibilitam a sua catalogação e facilitam sua busca. Um problema atual é que os alunos usuários destes LMSs muitas vezes não tem a experiência necessária para encontrar os objetos de aprendizagem que podem contribuir com seu aprendizado e muitas vezes nem iniciativa em fazê-lo. Este trabalho busca auxiliar a reduzir este problema ao propor e desenvolver um sistema que recomenda objetos de aprendizagem aos alunos. O desenvolvimento deste sistema de recomendação foi focalizado no Ambiente Sophia, LMS desenvolvido pela UNIVALI a partir de uma adaptação do MOODLE. As recomendações foram geradas utilizando as técnicas de filtragem colaborativa e filtragem baseada em conteúdo. Foi realizado um experimento com alunos de um curso de Ciência da Computação que permitiu verificar a adequação das funcionalidades desenvolvidas e a pertinência das recomendações.

Palavras-chave: Sistema de Recomendação. Objetos de Aprendizagem. MOODLE.

(10)

ABSTRACT

The use of computer technology in education is called e-learning. Through e-learning is possible to accomplish distance learning through Internet. With the maturing of instructional design methodologies and simultaneous development of technological infrastructure to support this type of education emerged the learning objects technology. Usually stored in environments called LMS (Learning Management Systems), these learning materials are developed based on standards such as SCORM (Shareable Content Object Reference Model) that enable them to be cataloged and make them easy to find. One current problem is that LMS users often do not have the experience needed to find learning objects that can contribute to their learning and often don´t have the initiative to do so. This monograph seeks to aid in reducing this problem by proposing and developing a system that recommends learning objects to students. The development of this recommender system was focused on the environment named Sophia which is an LMS developed by UNIVALI as an adaptation of MOODLE. The recommendations were generated using the collaborative filtering and content-based filtering techniques. An experiment conducted with students in a computer science course has shown the adequacy of the features developed and relevance of the recommendations.

Keywords: Recommender System. Learning Objects. MOODLE.

(11)

1 INTRODUÇÃO

A formação acadêmica e profissional é um aspecto cada vez mais importante em entrevistas de emprego. As empresas buscam funcionários capacitados que possam lhe garantir um serviço de qualidade. Embora necessária, a formação almejada muitas vezes esbarra em obstáculos como a falta de tempo e a dificuldade de locomoção devido à distância da instituição de ensino.

Com os avanços tecnológicos cada vez mais presentes no cotidiano, como a possibilidade de se comunicar com o mundo através da internet em poucos segundos e em qualquer lugar que possua conexão e um dispositivo apropriado, as barreiras que dificultam a busca pela formação profissional e acadêmica começaram a ser contornadas.

Dá-se o nome e-learning para o emprego da tecnologia em sistemas Web voltados para o ensino (SANTOS, 2007). Através do e-learning a modalidade de EaD (Ensino a Distância) pode ser também ofertada através da internet. Esta modalidade de ensino permite uma maior flexibilidade de horários e menor necessidade de deslocamento físico do aluno. Para dar suporte aos alunos do EaD disponibilizado através da internet são utilizados sistemas Web chamados Ambientes Virtuais de Aprendizado (AVA). O termo LMS (Learning Management System) também é freqüentemente usado como sinônimo de AVA. Por ser uma terminologia mais abrangente e utilizada em trabalhos reconhecidos internacionalmente, neste trabalho é utilizada apenas a sigla LMS.

Segundo Hall (2009), o principal objetivo de um LMS é gerenciar os alunos e controlar o seu progresso e desempenho em todas as atividades disponibilizadas. O LMS também permite gerenciar a interação entre o aluno, o ambiente e os recursos relacionados (IRLBECK; MOWAT, 2005). Para dar apoio aos cursos disponibilizados na modalidade de EaD através da internet, a UNIVALI (Universidade do Vale do Itajaí) desenvolveu o Ambiente Sophia.

O Ambiente Sophia foi desenvolvido baseado no LMS MOODLE (Modular Object- Oriented Dynamic Learning Enviroment), que é um LMS de código aberto que permite aos educadores criar sites para o ensino apoiado pela tecnologia. O MOODLE também permite o desenvolvimento de módulos (blocos, atividades ou plugins) que podem ser acoplados a ele.

Entre os avanços obtidos com o e-learning, encontra-se o desenvolvimento de objetos de aprendizagem, que podem ser definidos como qualquer entidade digital que pode ser usada, reusada e referenciada no processo de ensino apoiado pela tecnologia (WILEY, 2001). Os objetos de

(12)

aprendizagem são construídos para um assunto específico, permitindo assim que sejam referenciados quando o assunto é discutido em diversas disciplinas.

Para identificar os objetos de aprendizagem são utilizados metadados¹. Existem diferentes tipos de metadados utilizados para padronizar as informações sobre objetos de aprendizagem. O padrão utilizado pelos objetos do ambiente Sophia é o LOM (Learning Object Metadata). LOM é um padrão que permite especificar um esquema conceitual de dados para a estrutura do metadado de um objeto de aprendizagem (HANSEN; PINTO, 2003).

Reunindo os diferentes tipos de padrões de metadados definidos para objetos de aprendizagem, entre eles o LOM, a ADLNET (instituição ligada ao exército norte-americano) definiu um modo comum para os LMSs executarem e utilizarem os objetos de aprendizagem, intitulado SCORM (Sharabled Content Object Reference Model).

O SCORM é uma coleção de padrões e especificações que define como o objeto de aprendizagem deve ser organizado e “empacotado” para ser aberto por um LMS, gerando assim interoperabilidade, reusabilidade e acessibilidade ao conteúdo produzido (ADLNET, 2008).

Segundo Bohl et al (2002) os objetivos fundamentais do padrão SCORM são facilitar a portabilidade do conteúdo produzido de um LMS para outro e a reusabilidade dos objetos de aprendizagem.

Segundo Santos (2007), um dos principais benefícios gerados pela utilização de objetos de aprendizagem é o reuso do material produzido. Esta característica é viabilizada pela utilização de um padrão de metadados para descrever e referenciar os objetos e com isso possibilitar que sejam encontrados por mecanismos de busca.

Segundo Rosseto e Moraes (2007), um ROA (Repositório de Objetos de Aprendizagem) pode ser definido como uma espécie de banco de dados, geralmente integrado a um LMS, que armazena objetos de aprendizagem e seus metadados de forma organizada. O Ambiente Sophia foi desenvolvido também com o papel de ser um ROA.

Tendo em vista a diversidade de objetos de aprendizagem disponíveis no ambiente o usuário muitas vezes ignora a existência de objetos de aprendizagem que poderiam auxiliar a complementar

1 Metadados são definidos como dados sobre dados (WILEY, 2001).

(13)

o seu aprendizado, se limitando a acessar aqueles que estão disponíveis em uma disciplina e que foram previamente sugeridos pela equipe que elabora os materiais. Acredita-se que se o sistema puder sugerir ao aluno outros objetos para serem explorados poderá estar incentivando um aprofundamento nos estudos e conseqüentemente melhorando a aprendizagem.

A construção de sistemas de recomendação tem sido realizada para abordar problemas semelhantes. Conforme Reategui e Cazella (2005) com a facilidade de obter informações e a disponibilidade das mesmas proporcionadas pela utilização da internet o usuário se depara com uma vasta gama de opções. Muitas vezes o usuário não possui a experiência necessária para fazer escolhas perante as muitas opções, optando então por proceder de acordo com as mais diversas formas de recomendação que recebe.

A aplicação de sistemas de recomendação abrange diversas áreas. Em uma breve pesquisa foi possível identificar sistemas de recomendação empregados na área comercial, tendo como casos de sucesso o site de leilão on-line e-Bay (www.ebay.com) e o site de comércio eletrônico Amazon (www.amazon.com) que sugerem produtos e na área de entretenimento o site lastFM (www.lastfm.com), que sugere músicas e artistas. Na área acadêmica é possível citar o sistema RecS-DL (PEDRONETTE; TORRES, 2008), que é um sistema de recomendação para bibliotecas digitais na forma de um WebService e o SisRecCol (LICHTNOW et al, 2006), que é um sistema de apoio a aprendizado colaborativa.

Através do sistema de recomendação desenvolvido o usuário recebe sugestões de objetos de aprendizagem que se relacionam com o conteúdo estudado, ou com escolhas feitas por usuários de perfil semelhante (ex: colegas de disciplina) incentivando o aluno a complementar seu aprendizado.

Através da sugestão de objetos de aprendizagem o sistema fará valer a principal característica destes, a reusabilidade, sugerindo objetos em diferentes contextos.

1.1 PROBLEMATIZAÇÃO

1.1.1 Formulação do Problema

Com a popularização do EaD via internet, diversas tecnologias relacionadas vêm se consolidando. A produção e disponibilização de repositórios de objetos de aprendizagem vêm se configurando como uma das iniciativas mais freqüentes nesta direção. No entanto, muitas vezes a pesquisa por palavras-chave disponibilizada nestes repositórios não é suficiente para o estudante

(14)

encontrar o que deseja. Adicionalmente, o aluno precisa realizar uma consulta a fim de encontrar materiais de seu interesse.

Ocorre que em diversas situações materiais que poderiam ser úteis ao aprendiz não são localizados por falta de experiência de pesquisa ou por não terem a iniciativa para realizar a busca.

Conforme Lichtnow et al (2006) por vezes uma questão pedagógica recorrente pode ter sido discutida e solucionada, possuindo inclusive material instrucional relacionado, e este não é encontrado facilmente. Nestes casos o material tem que ser indicado por usuários mais experientes.

1.1.2 Solução Proposta

A solução proposta por este trabalho é o desenvolvimento de um sistema de recomendação de objetos de aprendizagem no padrão SCORM para o Ambiente Sophia.

Através do desenvolvimento de um sistema de recomendação para objetos de aprendizagem o usuário receberá recomendações de objetos que se relacionam através do seu conteúdo ou através de objetos que tenham sido acessados por usuários com interesses similares ao dele, permitindo complementar seu aprendizado.

1.2 OBJETIVOS

1.2.1 Objetivo Geral

Desenvolver um sistema de recomendação de objetos de aprendizagem no padrão SCORM para o Ambiente Sophia.

1.2.2 Objetivos Específicos

• Pesquisar e conhecer trabalhos similares;

• Definir quais informações do usuário serão utilizadas como parâmetros para a recomendação;

• Pesquisar e definir as estratégias de recomendação que serão utilizadas;

• Modelar e desenvolver o Sistema;

(15)

1.3 Metodologia

A metodologia para o desenvolvimento deste trabalho foi composta por cinco etapas.

Inicialmente foi realizado um estudo sobre sistemas de recomendação, buscando conceitos fundamentais como técnicas e estratégias conhecidas. Na etapa seguinte realizou-se um estudo sobre trabalhos similares, buscando encontrar relatos de experiências no desenvolvimento de sistemas de recomendação. Após obter as informações necessárias, o próximo passo foi definir os parâmetros e estratégias que serão utilizados pelo sistema proposto por este trabalho. Em seguida foi realizada a modelagem do sistema aqui proposto. Ao final foram realizadas as etapas de desenvolvimento e testes.

1.4 Estrutura do trabalho

Este trabalho está estruturado em 4 capítulos, onde o Capítulo 2 contém toda a etapa de fundamentação teórica, apresentando todos os conceitos necessários para o entendimento do trabalho. Entre eles, conceitos sobre sistemas de recomendação, LMS, objetos de aprendizagem e análise de trabalhos similares. O Capítulo 3 apresenta as definições e a descrição do sistema desenvolvido, incluindo a modelagem e os testes realizados. E, por fim, o Capítulo 4 apresenta as conclusões obtidas com este trabalho.

(16)

2 FUNDAMENTAÇÃO TEÓRICA

Na fundamentação teórica são apresentados tópicos relevantes ao desenvolvimento do trabalho. Na seção 2.1 são apresentados os conceitos de sistemas de recomendação, as técnicas e estratégias utilizadas na sua implementação e sistemas similares desenvolvidos nesta área de estudo.

Na seção 2.2 são apresentados conceitos sobre LMS, objetos de aprendizagem, repositório de objetos de aprendizagem, SCORM e o Ambiente Sophia, o LMS desenvolvido pela UNIVALI e que é utilizado para testar o sistema desenvolvido.

2.1 Sistemas de Recomendação

Segundo Schafer (1999) o aumento da possibilidade de disponibilização de conteúdo (produtos ou informação) através de sistemas web, faz com que os sistemas web apresentem mais opções de escolha para o usuário antes de ele estar apto a encontrar a opção que vai ao encontro de sua necessidade. Uma das soluções para resolver este problema de sobrecarga de informação é a utilização de sistemas de recomendação.

Segundo Burke (2002) um sistema de recomendação pode ser qualquer sistema que produza recomendações individuais ao usuário ou que tenha o efeito de guiar o usuário através de recomendações personalizadas a itens que sejam de seu interesse ou que o sejam úteis diante de uma vasta gama de opções. Um sistema de recomendação pode também identificar similaridade entre o comportamento dos usuários e recomendar itens, como objetos de aprendizagem, que já foram recomendados para outros usuários.

Segundo Schafer (1999), a estrutura dos sistemas de recomendação é dividida em quatro etapas: identificação do usuário, coleta de informações, estratégias de recomendação e visualização das recomendações, como pode ser visto na Figura 1.

(17)

Figura 1. Estrutura dos sistemas de recomendação Fonte: Barcellos et al (2007).

Nesta seção são apresentadas as formas mais comuns utilizadas para identificar e coletar informações dos usuários, as estratégias utilizadas para recomendações e as técnicas utilizadas pelos sistemas de recomendação.

2.1.1 Identificação do usuário e obtenção de dados

Segundo Reategui e Cazella (2005), para que um sistema possa realizar recomendações a um usuário é necessário que ele conheça este usuário. O sistema deve possuir informações sobre o comportamento do usuário quando opera o sistema e também quais são as suas preferências.

Nos sistemas web atuais é comum solicitar ao usuário informações pessoais e profissionais.

Através destas informações o sistema pode identificar os seus usuários e tornar o atendimento personalizado. Existem duas formas mais comumente usadas para obter informações do usuário e assim identificá-lo, a identificação no servidor e a identificação no cliente.

2.1.1.1 Identificação no Servidor

Esta forma de identificação ocorre quando ao se cadastrar em um site o sistema solicita ao usuário que informe dados pessoais e profissionais, um login e uma senha. Estes dados informados

(18)

pelo usuário são armazenados no servidor do sistema. Toda vez que o usuário acessar o site e se autenticar, o sistema identifica qual usuário está conectado no momento.

2.1.1.2 Identificação no Cliente

Segundo Reategui e Cazella (2005), esta forma de identificação baseia-se no uso de cookies, um mecanismo que permite a um sistema web (servidor) identificar que um computador (cliente) está se conectando novamente a ele. Esta forma de identificação supõe que o computador é usado sempre pelo mesmo usuário. Esta condição torna esta forma de identificação não muito confiável, já que na maioria das vezes um computador é usado por mais de um usuário.

2.1.1.3 Coleta de Informações

Após o sistema identificar o usuário é possível coletar dados sobre ele de forma implícita ou explícita. Conforme Reategui e Cazella (2005), a forma implícita se vale dos dados armazenados pelo sistema sobre o comportamento do usuário quando utiliza o sistema. As informações armazenadas podem ser diversas, entre elas estão quais páginas o usuário acessou, quantas vezes ele acessou um jogo, quais itens ele comprou ou visitou. Esta forma de coleta de informação torna invisível ao usuário quais dados o sistema armazena sobre seu comportamento, tornando a identificação mais natural.

A forma explícita de coleta de informação se dá através de formulários que o usuário preenche ao acessar o sistema ou se cadastrar neste. Esta forma de coleta de informação é visível ao usuário, e também é conhecida como customização, já que é o próprio usuário que informa seus interesses e pode assim tornar o sistema customizado. As informações que o sistema solicita ao usuário podem variar de acordo com o seu escopo, podendo solicitar desde interesses gerais até o seu estilo preferencial de aprendizagem.

Através da coleta de informações, um sistema de recomendação pode identificar similaridade entre a navegação dos usuários pelo sistema ou buscar itens que sejam similares aos seus interesses e realizar recomendações.

(19)

2.1.2 Estratégias de recomendação

Segundo Reategui e Cazella (2005), diferentes estratégias podem ser utilizadas para personalizar as ofertas que o sistema recomenda para o usuário. As estratégias são basicamente como serão agrupadas ou apresentadas as recomendações. As estratégias de recomendação mais utilizadas são apresentadas a seguir.

2.1.2.1 Listas de recomendação

Esta estratégia de recomendação baseia-se em organizar listas de recomendações baseadas em tipos de interesse, não exigindo uma grande análise dos dados do usuário para sua criação. Esta estratégia de recomendação é exemplificada por grupos como: “Mais vendidos da semana”, “Mais vistos do mês”, “mais recentemente incluídos”. Segundo Reategui e Cazella (2005), por não necessitar uma profunda análise do perfil do usuário torna-se uma estratégia de fácil implementação, ao mesmo tempo em que perde o caráter de recomendação pessoal, já que é voltada para o grande grupo de usuários e é desenvolvida de acordo com as necessidades de marketing ou de aumento de lucratividade da empresa que utiliza o sistema. A Figura 2 apresenta uma lista de recomendação de vídeos no site Youtube², apresentando os vídeos mais vistos no momento e os vídeos em destaque.

2 O site do Youtube está localizado no endereço http://www.youtube.com

(20)

Figura 2. Lista de Recomendação Fonte: Youtube (2009).

2.1.2.2 Avaliações de usuários

Conforme Reategui e Cazella (2005), esta estratégia de recomendação baseia-se nos comentários ou avaliação dos usuários a respeito de um item. Caracteriza-se geralmente por disponibilizar ao usuário uma escala de avaliação, ou a opção de deixar um comentário a respeito do item visitado. Na Figura 3 visualiza-se a escala de avaliação disponibilizada pelo site Amazon³ aos seus usuários para que possam avaliar o item que estão visualizando ou comprando.

Não se trata de uma estratégia de difícil implementação, pois o sistema apenas disponibiliza a opção do usuário avaliar o item e armazena a sua avaliação. A exibição desta recomendação não necessita de nenhuma análise, apenas exibe a média das avaliações atribuídas pelos usuários no

3 O site do Amazon está localizado no endereço http://www.amazon.com

(21)

momento oportuno. Não se trata de uma estratégia confiável, pois depende da veracidade dos comentários ou notas atribuídas pelos usuários.

Figura 3. Avaliação dos usuários Fonte: Amazon (2009).

2.1.2.3 Recomendações personalizadas

Esta estratégia de recomendação apresenta recomendações personalizadas e individuais.

Segundo Reategui e Cazella (2005), ela se baseia nos dados coletados do usuário de forma implícita ou explícita. Na Figura 4 pode-se visualizar as recomendações de música que o site LastFm⁴ fez para o usuário baseando-se nas músicas que ele havia escutado no site. Este é um exemplo de recomendação baseada em dados coletados de forma implícita, pois o usuário não informou de forma explícita que tem interesse por determinado estilo de música.

4 O site do LastFm está localizado no endereço http://www.lastfm.com

(22)

Figura 4. Recomendações personalizadas Fonte: LastFm (2009).

2.1.2.4 Usuários que se interessam por X também se interessam por Y

Esta estratégia de recomendação é obtida com a utilização de técnicas que possam realizar associação entre itens avaliados (lidos, assistidos) pelo usuário. Partindo da idéia de que se o usuário se interessou por um item existe uma grande possibilidade de ele se interessar por outros itens associados a este.

Conforme Reategui e Cazella (2005), esta é a estratégia de recomendação mais complexa de implementação, pois requer uma análise aprofundada do comportamento do usuário quando opera o sistema para realizar a associação entre os itens. Após realizar a análise do comportamento do usuário o sistema deve determinar os padrões seguidos pelo usuário e realizar as recomendações baseadas nestes padrões. A Figura 5 apresenta um exemplo desta estratégia de recomendação. Ao analisar o filme que o usuário deseja comprar, o sistema indica uma associação entre o item desejado e outros demais itens. A associação identificada foi a de que estes filmes são geralmente comprados juntos.

(23)

Figura 5. Usuários que se interessam por X também se interessam por Y Fonte: Amazon (2009).

2.1.2.5 Associação por conteúdo

Esta estratégia de recomendação baseia-se no conteúdo do item, como estilo de música, autor e compositor. Segundo Reategui e Cazella (2005), para realizar esta recomendação é necessário que o sistema faça uma análise afim de encontrar uma associação mais restrita entre os itens, por exemplo: Quem comprou o filme Scarface também comprou GoodFellas, The Godfather e Pulp Fiction, ambos sobre Máfia, conforme pode ser visto na Figura 6.

Figura 6. Associação por conteúdo Fonte: Amazon (2009).

(24)

2.1.3 Técnicas de recomendação

Segundo Reategui e Cazella (2005), muitas técnicas estão sendo utilizadas para identificar o padrão de comportamento do usuário em um sistema e como utilizar estas informações para personalizar o atendimento ao usuário. Diferente das estratégias de recomendação, que definem o modo como a sugestão será apresentada ao usuário, as técnicas de recomendação são utilizadas para realizar as recomendações. As técnicas são responsáveis por realizar a inferência entre os dados dos usuários e os dados dos itens. Segundo Burke (2002), um sistema de recomendação possui: (i) dados do sistema, informações que o sistema armazena antes do processo de recomendação iniciar;

(ii) dados de entrada, as informações que o usuário deve informar ao sistema para receber a recomendação; (iii) um algoritmo que combine os dados do sistema com os dados de entrada do usuário para produzir as recomendações.

Baseando-se nisso, podem ser identificadas três técnicas de recomendação mais utilizadas. A filtragem colaborativa, a filtragem baseada em conteúdo e a filtragem híbrida, que é a combinação das duas. A comparação entre as duas primeiras técnicas pode ser vista na Tabela 1. Assume-se que U é o grupo de usuários de que se tem conhecimento sobre suas preferências, I é o conjunto de itens que podem ser recomendados, u é o usuário para o qual as recomendações devem ser realizadas e i é um item de interesse de u.

Tabela 1. Técnicas de recomendação

Técnica Dados do sistema Dados de entrada Algoritmo Colaborativa Avaliação de U para

os itens em I. Avaliação de u para

itens em I. Identificar usuários em U similares a u e extrapolar de sua avaliação em i.

Baseada em conteúdo Recursos de itens em

I. Avaliação de us para

itens em I. Gerar um classificador que identifica o

comportamento de avaliação de us e o usa em i.

Fonte: Adaptado de Burke (2002).

2.1.3.1 Filtragem Colaborativa

Segundo Burke (2002), a filtragem colaborativa é a técnica mais conhecida, mais implementada e mais madura de todas. Ela reúne as notas ou recomendações atribuídas pelos usuários aos itens, identifica as similaridades entre os usuários baseado em suas avaliações e gera

(25)

novas recomendações com base em comparações entre os usuários. Segundo Lichtnow et al (2006), define-se que usuários com perfil similar são os usuários que avaliaram os mesmo itens de forma similar. O sistema armazena as notas que o usuário atribui para cada item visitado, e permite que um determinado grupo formado pelos interesses em comum possa visualizar a avaliação que este usuário deu para cada item. Segundo Schafer (1999), esta técnica de recomendação pode ser chamada de recomendação de “pessoa para pessoa”.

Segundo Herlocker (2000 apud Burke, 2002), os primeiros sistemas de filtragem colaborativa exigiam que o usuário informasse ao sistema quais eram seus interesses. Com o avanço das pesquisas os sistemas passaram a automatizar este processo, associando os interesses em comum dos usuários partindo da avaliação que eles atribuem aos itens. A Tabela 2 exemplifica o funcionamento da filtragem colaborativa na prática:

Tabela 2. Filtragem colaborativa

Fonte: Reategui e Cazella (2005).

Para realizar uma recomendação para o usuário Ana, o sistema verifica usuários que avaliaram o mesmo item que ela (Item 4). Após identificar que a usuária Márcia avaliou este mesmo item, o sistema recomenda para Ana os itens que Márcia avaliou e que ela ainda não avaliou (Item 3 e Item 5).

Segundo Reategui e Cazella (2005), sistemas simples que utilizam a técnica de filtragem colaborativa exibem a média de avaliação dada pelos usuários para os itens que são do interesse do usuário, permitindo que ele acesse os que obtiveram boa avaliação ou evite os que obtiveram uma fraca avaliação. Os sistemas mais complexos descobrem relações entre os usuários através da identificação de padrões comuns de comportamento.

A filtragem colaborativa possui as vantagens de que o sistema não analisa o conteúdo dos itens avaliados, evitando uma complexidade maior na sua implementação e facilitando a recomendação de itens como músicas e jogo onde a variação nos gostos do usuário influencia na

Usuário Item 1 Item 2 Item 3 Item 4 Item 5 Item 6

Paulo x x

João x x

Márcia x x x

Carlos x x

Ana x

Mauro x

(26)

variação das suas preferências, e também pode realizar recomendações inesperadas ao usuário.

Porém para que as recomendações sejam relevantes é necessário que haja uma grande quantia de usuários no sistema e usuários que possuam interesses não muito comuns receberão recomendações pobres.

Segundo Cazella et al (2008), os usuários que recebem recomendações de um sistema que utilize filtragem colaborativa são supridos de informação seguindo 3 etapas: (i) comparação entre perfil do usuário que receberá a recomendação e dos demais usuários para obter o grau de similaridade através do coeficiente de Pearson (REATEGUI; CAZELLA, 2005); (ii) identificação dos perfis com maior grau de similaridade; (iii) análise da avaliação que os usuários com perfil semelhante atribuíram ao item que está em questão.

Segundo Reategui e Cazella (2005) existem diversas técnicas para determinar a similaridade entre os perfis dos usuários, sendo a mais utilizada a correlação de Pearson (Equação 1).

( ) ( )

u a m

i ai a ui u

u a

r r

r w r

σ σ ∗

−

∗

= ∑

₌₁ ,

−

,

, Equação 1. Correlação de Pearson

r a,i = conjunto de avaliações do usuário ativo;

r u,i = conjunto de avaliações do usuário similar a u;

W a,u = nível de similaridade entre os usuários comparados.

O nível de similaridade gira em torno de 1 (total similaridade) e -1 (total dissimilaridade).

Para que a realização da recomendação seja feita, é necessário verificar as avaliações feitas pelos usuários ao item em questão e o grau de similaridade entre os perfis deles e do usuário a quem deseja-se realizar a recomendação. Afim de calcular a predição utiliza-se a Equação 2.

( )

∑

=

− ∗

+

=

_n

u au

n

u ui u au

i a

a

w

w r

r r p

1 ,

1 , ,

, Equação 2. Cálculo de predição

(27)

Na Equação 2 assume-se que o valor de predição (P a,i), o grau de relevância dela, para o usuário ativo a do item i é dada pela média ponderada das avaliações dadas ao item i pelos n vizinhos u. A quantidade n de vizinhos é uma decisão do sistema que utiliza esta fórmula.

Alguns dos sistemas de recomendação mais importantes que utilizam a filtragem colaborativa são o RACOFI (ANDERSON et al, 2003), DISCORS (CHO et al, 2007) e PHOAKS (TERVEEN et al, 1997).

2.1.3.2 Filtragem por conteúdo

Segundo Lichtnow et al (2006) a filtragem por conteúdo parte do princípio de que os usuários tendem a se interessar por itens que se interessaram no passado, tornando-se necessária a identificação de associação entre os itens. Diferente da filtragem colaborativa, esta técnica analisa o conteúdo dos itens. A recomendação realizada por esta técnica ocorre através da associação entre a similaridade entre o conteúdo dos itens e a análise dos interesses do usuário ou do conteúdo dos itens já avaliados pelo usuário.

Para encontrar a similaridade entre os conteúdos de interesse do usuário e dos itens a serem recomendados existem diversas abordagens, uma delas é a abordagem vetorial (SALTON, 1988 apud LOPES et al, 2006). Nesta abordagem os documentos e as preferências do usuário são vetores de termos que possuem um grau de relevância (peso). Define-se também que documentos mais similares são aqueles em que os vetores se localizam espacialmente mais próximos.

Afim de calcular a similaridade entre um documento (D) e as preferências do usuário (Q) é utilizada a Equação 3. Nesta equação assume-se que w representa os pesos e t o número total de documentos considerados. O valor de similaridade encontrado definirá a relevância do documento em relação as preferências do usuário.

Equação 3. Equação de similaridade

(28)

Segundo Lopes et al (2006), o grau de similaridade depende crucialmente dos pesos adotados para os termos e da escolha dos termos que irão compor os vetores. Para definir os termos que irão compor os vetores é necessário ignorar preposições, artigos e conjunções, pois estas se repetem muitas vezes em um documento. Para determinar os pesos dos termos que compõem o vetor de preferências do usuário é analisado o contexto em que será realizada a recomendação, adotando pesos maiores para as informações contidas nos campos que se julga de maior relevância e pesos menores para as informações contidas em campos de menor relevância.

Para definir os pesos adotados para os termos do vetor de documentos utiliza-se a abordagem (tf X itf) (The product of the term frequency and the inverse document frequency) (SALTON, 1988 apud LOPES et al, 2006). Nesta abordagem assume-se tf como o número de vezes que um termo se repete em um documento e itf como o inverso da freqüência do termo na coleção, este fator varia inversamente com o número de documentos n nos quais um termo aparece de uma coleção de N elementos, calculado através de log(N/n). Segundo Lopes et al (2006), os melhores termos para utilização são aqueles que diferenciam um documento dentro de um grande conjunto, ou seja, os termos que apresentam maior peso são aqueles que apresentam alto valor de tf e baixo valor de itf.

Para realizar a associação entre os itens é necessário identificar atributos que eles possuam em comum para compará-los, um exemplo ocorre na busca pela associação entre um carro e uma roupa. Podem-se comparar atributos como cor, preço e marca. Quando a comparação é entre itens como artigos científicos ou livros a comparação é facilitada, pois pode ser realizada entre as palavras-chave encontradas nestes itens.

Segundo Schafer (1999), esta técnica pode ser chamada de recomendação de “item para item”, pois baseia-se no conteúdo dos itens. Segundo Shardanand e Maes (1995), esta técnica não realiza a avaliação qualitativa dos itens que são recomendados, pois basta que haja similaridade entre os atributos que são comparados para que o item seja recomendado para o usuário.

A técnica de filtragem baseada em conteúdo apresenta fragilidade na recomendação de itens com pouca descrição, pois é baseado nesta descrição dos itens que o sistema realiza a recomendação ao usuário. A descrição dos itens deve ser bem elaborada, pois até mesmo a utilização de sinônimos pode gerar recomendações erradas.

(29)

Um exemplo de sistema de recomendação que utiliza a técnica de filtragem baseada em conteúdo é o Sistema de Recomendação para Bibliotecas Digitais (LOPES et al, 2006).

2.1.3.3 Filtragem Híbrida

Segundo Herlocker (2000 apud REATEGUI; CAZELLA, 2005), a filtragem híbrida visa combinar os pontos fortes da filtragem baseada em conteúdo e a filtragem colaborativa para criar uma técnica que possa melhor atender as necessidades dos usuários, como se pode ver na Figura 7.

Figura 7. Filtragem Híbrida Fonte: Reategui e Cazella (2005).

Segundo Balabanovic e Shoham (1997) para a compreensão da necessidade de desenvolvimento de uma técnica híbrida, é necessário compreender os problemas apresentados por implementações puras das técnicas de filtragem baseada em conteúdo e colaborativa.

Uma implementação pura da técnica de filtragem baseada em conteúdo ocorre quando as recomendações são baseadas somente na análise do conteúdo dos itens avaliados por um usuário no passado. Nesta técnica somente o conteúdo dos itens é avaliado, dificultando a comparação em itens como músicas ou imagens. O fato de que somente serão recomendados itens que tenham conteúdo semelhante ao dos itens anteriormente avaliados pelo usuário, comparados com seu perfil, torna a recomendação muito especializada, não gerando recomendações de novos conteúdos. A técnica de filtragem baseada em conteúdo também apresenta um dos problemas mais comuns em sistemas de recomendação, a avaliação do usuário. Como a avaliação do usuário é fator determinante na recomendação, deve-se levar em conta que nem sempre o usuário avalia os itens de forma proporcional, pois ele não acessa somente itens de seu interesse ou não aplica os mesmos critérios ao atribuir uma nota aos itens.

(30)

Uma implementação pura da técnica de filtragem colaborativa ocorre quando o sistema não tem conhecimento do conteúdo dos itens, baseando-se apenas na similaridade entre os perfis dos usuários para realizar as recomendações. Segundo Balabanovic e Shoham (1997), a filtragem colaborativa resolve os problemas encontrados na filtragem por conteúdo, pois baseando-se na similaridade dos perfis dos usuários as recomendações não abordarão apenas um tema, trazendo para o usuário recomendações de itens que ele muitas vezes não sabia da existência. Porém, a filtragem colaborativa introduz novos problemas.

Um item adicionado recentemente não será recomendado, pois será necessário que vários usuários avaliem este item para que seja recomendado. Outro problema encontrado nesta técnica é o de que usuários com interesses fora do comum receberão recomendações pobres. Outra deficiência desta técnica em relação a filtragem por conteúdo é o fato de que mesmo se usuários acessarem itens semelhantes seus perfis podem não ser considerados semelhantes. Um exemplo dessa sentença é que o se o usuário A acessa o site X para saber informações sobre futebol e o usuário B acessa o site Y para também obter informações sobre futebol o sistema não os considera com perfis semelhantes, pois não acessaram o mesmo item.

Segundo Balabanovic e Shoham (1997) para criar uma técnica híbrida baseada na filtragem por conteúdo e filtragem colaborativa, mantém-se o perfil dos usuários baseado na análise do conteúdo e compara-se diretamente estes perfis para determinar perfis semelhantes para realizar a recomendação colaborativa. O usuário recebe recomendação de itens baseado nos interesses do seu perfil e quando eles são bem avaliados por usuários de perfil semelhante. A abordagem híbrida supera as fraquezas descritas na filtragem por conteúdo e colaborativa e gera importantes benefícios. Quando a busca por itens com conteúdo de interesse do usuário retorna apenas um item, o sistema utiliza a pura implementação da filtragem colaborativa. Quando encontra-se apenas um perfil de usuário similar, o sistema utiliza a pura implementação da filtragem baseada em conteúdo.

Um exemplo de trabalho que utiliza a técnica de filtragem híbrida é o FAB (BALABANOVIC; SHOHAM, 1997), descrito na seção 2.1.4.4 deste trabalho.

(31)

2.1.4 Trabalhos similares

Esta seção apresenta trabalhos similares ao sistema desenvolvido. Ao final desta seção encontra-se uma comparação entre os trabalhos explanados.

2.1.4.1 PHOAKS (TERVEEN et al, 1997)

O PHOAKS ( People Helping One Another Know Stuff – Pessoas ajudando umas as outras a encontrar material) é um sistema de recomendação que utiliza a técnica de filtragem colaborativa para realizar recomendações de recursos Web, através de URLs, baseado nas informações contidas nas mensagens postadas pelos usuários da UseNet. A UseNet é um sistema web, que funciona como um quadro de avisos em que qualquer usuário do sistema pode comentar, enviar ou ler um artigo.

As recomendações geradas pelo PHOAKS baseiam-se nas mensagens postadas pelos usuários da UseNet. O sistema vasculha as mensagens que foram postadas em busca de recomendações de URLs feitas pelos usuários. Ao encontrar as URLs o sistema realiza uma série de testes e análises para verificar se a URL não é uma propaganda, não está sendo replicada da mensagem anterior ou não foi postada em diversos grupos diferentes e é então considerada genérica demais para ser uma recomendação. Segundo Terveen et al (1997), estes testes e análises permitem distinguir o propósito em que uma URL foi mencionada.

Segundo Terveen et al (1997), para avaliar as recomendações geradas pelo PHOAKS são observados dois aspectos: precision (precisão) e recall (revocação). Precisão define-se pelo percentual de recursos web que os testes classificaram como pertencentes a categoria em que o recurso já está inserido e revocação define-se pelo percentual de recursos que pertencem a uma categoria e que os testes classificaram como pertencentes aquela categoria.

As URLs são recomendadas para um grupo que tenha interesse no assunto em que ela foi sugerida. A lista de URLs recomendadas apresenta o número de vezes que a URL foi citada e permite que o usuário acesse a mensagem em que a URL foi postada, podendo analisar em que contexto ela foi sugerida.

Segundo Terveen et al (1997), o PHOAKS se diferencia dos demais sistemas de recomendação em dois princípios: especialização das funções e reuso. A maioria dos sistemas de recomendação, principalmente os que se baseiam na avaliação dos itens por parte dos usuários, considera que os usuários desempenham funções iguais (ex: todos são alunos). As recomendações

(32)

de URLs feitas por um professor são diferentes das recomendações feitas por um aluno, assim como a recepção das recomendações. O PHOAKS assume que destinatários e provedores de recomendações possuem funções diferenciadas. O PHOAKS reusa recomendações provindas do conteúdo postado pelos usuários, algo que não exige trabalho extra por parte dos provedores de recomendação nem avaliação da qualidade das informações por parte dos usuários.

O PHOAKS tem acesso livre desde fevereiro de 1996, e até o final de dezembro do mesmo ano já havia sido acessado por 300 mil usuários.

2.1.4.2 Sistema de Recomendação para Bibliotecas Digitais (LOPES et al, 2006)

O Sistema de Recomendação para Bibliotecas Digitais foi desenvolvido para realizar a recomendação de artigos científicos na área da Ciência da Computação, armazenados em uma biblioteca digital, baseado nas informações contidas no Currículo Lattes do usuário e na descrição dos artigos.

Do ponto de vista tecnológico, o sistema foi desenvolvido sobre a perspectiva da Web Semântica, pois utiliza-se de suas tecnologias emergentes como a utilização de metadados padrão para descrição dos artigos (Dublin Core), uso de XML padrão para descrever o perfil do usuário (Currículo Lattes) e provedor de serviços e dados para gerar as recomendações (LOPES et al, 2006).

O sistema utiliza a técnica de filtragem baseada em conteúdo para realizar as recomendações, pois tem por objetivo comparar as informações obtidas no perfil do usuário com os dados obtidos da descrição dos artigos. Os dados extraídos do Currículo Lattes utilizados para comparação por parte do perfil do usuário são o título e as palavras-chave contidas na formação acadêmica e a produção bibliográfica do autor. Os dados extraídos dos metadados dos artigos utilizados para comparação são o dc:title (título) e dc: description (descrição).

O sistema foi desenvolvido como um provedor de serviços, WebService, em que o sistema busca os metadados em formato Dublin Core que descrevem os artigos armazenados em uma determinada biblioteca digital, extrai as informações pertinentes para a recomendação e armazena estas em um banco de dados local, e cataloga os arquivos XML recebidos. O usuário que deseja receber as recomendações se cadastra no sistema e envia o seu Currículo Lattes em formato XML para o sistema. Assim como com o XML que descreve os artigos, o sistema extrai as informações do Currículo Lattes pertinentes para realizar a recomendação e armazena no banco de dados local.

(33)

Tendo estes dados armazenados, o sistema realiza a tarefa de recomendação, e produz um arquivo XML no padrão Dublin Core com os artigos recomendados para o usuário.

Para avaliar o sistema desenvolvido foi realizado um teste com alunos e professores da Pós- Graduação do Instituto de Informática da UFRGS. Os usuários que se prontificaram em participar do teste disponibilizaram seus currículos Lattes. Foi possível avaliar as recomendações através da avaliação que cada um destes usuários atribuiu aos artigos recebidos avaliando-as como (i) péssimo;

(ii) ruim; (iii) médio; (iv) bom; e (v) ótimo. Foram realizadas diversas seções de avaliação das recomendações e em todas elas as avaliações positivas foram maiores que as negativas.

2.1.4.3 SisRecCol (LICHTNOW et al, 2006)

Segundo Lichtnow et al (2006) o SisRecCol (Sistema de Recomendação para apoio à Colaboração) foi desenvolvido para apoiar o processo de aprendizagem colaborativa. Partindo da idéia de que em muitas ocasiões o aluno não encontra o material de aprendizado que busca, necessitando assim da recomendação de um usuário mais experiente, o SisRecCol assume o papel intermediário entre os usuários, sugerindo materiais que venham complementar ou aprofundar o conhecimento do aluno através da identificação de seus interesses.

O SisRecCol recomenda materiais didáticos no formato .pdf, .doc e .rtf. Estes materiais estão armazenados na biblioteca digital. Todo o conteúdo da biblioteca é indexado e associado a conceitos, através do uso de ontologias. As recomendações realizadas pelo SisRecCol ocorrem em seções de chat ou fora das seções de chat.

As recomendações geradas na seção de chat ocorrem quando o sistema identifica os conceitos que estão sendo tratados enquanto os usuários trocam mensagens, então realiza uma cálculo de similaridade entre os conceitos e o material armazenado na biblioteca digital, para então realizar a recomendação. As recomendações feitas fora da seção de chat analisam os interesses que estão armazenados no perfil do usuário. O perfil do usuário possui campos cadastrais como nome, endereço, e-mail e assuntos de interesse. Este último dado é construído enquanto o usuário interage com o ambiente, avaliando os materiais.

As recomendações realizadas durante a seção de chat baseiam-se no perfil do usuário e no conteúdo do material, portanto nesta ocasião o sistema utiliza a técnica de filtragem baseada em conteúdo. Nas recomendações feitas fora da seção de chat o sistema se baseia nos materiais

(34)

acessados por outros usuários, portanto nesta ocasião o sistema utiliza a técnica de filtragem colaborativa.

Segundo Lichtnow et al (2006), para avaliar as recomendações realizadas pelo sistema durante a seção de chat, são observados dois aspectos: precisão e abrangência. Entende-se por precisão, a razão entre número de mensagens em que o assunto foi identificado corretamente e o número de mensagens em que o assunto foi identificado. Abrangência entende-se pela razão entre o número de mensagens em que o assunto foi identificado corretamente e o número de mensagens em que o assunto deveria ter sido identificado.

Conforme Lichtnow et al (2006), foram realizadas 3 seções de recomendação com o objetivo de avaliar o SisRecCol. O melhor resultado foi obtido quando se realiza as recomendações baseando-se num conjunto de mensagens, e o pior resultado foi obtido quando se analisa uma mensagem isolada. Através dos experimentos também foi possível verificar que é necessário um aperfeiçoamento das interfaces oferecidas pelo sistema.

2.1.4.4 Fab (BALABANOVIC; SHOHAM, 1997)

Segundo Balabanovic e Shohan (1997) o Fab é um sistema de recomendação que combina as técnicas de filtragem baseada em conteúdo e filtragem colaborativa, utilizando assim uma técnica de recomendação híbrida para recomendar páginas web. O objetivo de utilizar a técnica híbrida é o de eliminar os pontos fracos encontrados nas demais técnicas. O Fab foi implementado de forma distribuída e faz parte do projeto da Biblioteca digital da Universidade de Stanford.

A arquitetura do Fab baseia-se em dois agentes: agentes de coleção e agentes de seleção.

Além deles o sistema possui um roteador. Cada um dos agentes mantém um perfil com palavras contidas em páginas web que já foram avaliadas. Os agentes de coleção representam a pesquisa do usuário, é através deles que as páginas web que abordam um determinado interesse são indexadas.

Os agentes de seleção, baseando-se nos interesses do usuário, selecionam quais páginas lhe devem ser recomendadas, como apresentado na Figura 8.

(35)

Figura 8. Arquitetura Fab

Fonte: Balabanovic e Shohan (1997).

Quando o usuário recebe recomendações ele deve avaliá-las. Esta avaliação é importante, pois serve para atualizar o perfil do seu agente de seleção e também é utilizada para que o sistema recomende páginas bem avaliadas para usuários que possuam perfil similar.

Para avaliar o sistema um grupo de usuários o utilizou por um mês. Foi observado que as recomendações apresentadas pelo sistema baseando-se nos conteúdos de interesse dos usuários obtiveram uma avaliação positiva. Os usuários que possuíam interesses em comum receberam recomendações de um único agente de seleção, provando que um agente de seleção pode assumir em um momento recomendações específicas sobre um tema e automaticamente encontrar temas de interesse em comum entre os usuários.

2.1.4.5 Acquiring and revising preferences in a critique-based mobile recommender System (RICCI e NGUYEN, 2007)

Segundo Ricci e Nguyen (2007), raramente o usuário tem conhecimento efetivo de suas preferências quando começa a utilizar um sistema. Estas preferências tomam forma no momento em que o usuário deve tomar decisões de escolher ou descartar um produto. Em vista disso, é pertinente ao usuário revisar opiniões sobre o produto durante este processo.

O trabalho desenvolvido por Ricci e Nguyen (2007) desenvolveu uma metodologia de recomendação de produtos e a implementou no MobyRek, um sistema de recomendação para dispositivos portáteis que auxilia os usuários na busca por produtos de viagem.

Nesta abordagem o usuário pode fazer críticas as recomendações geradas pelo sistema. Ao receber a recomendação o usuário deve comentar se gostou ou não do produto sugerido. Os

(36)

comentários que o usuário faz permitem ao sistema ajustar as recomendações de acordo com as suas preferências. O sistema analisa os comentários através de regras criadas para classificá-los. As opiniões emitidas pelo usuário classificam-se em wish (desejo) ou must (dever). Uma tela do sistema pode ser vista na Figura 9.

Figura 9. Exemplo de comentário MobyRek Fonte: Ricci e Nguyen (2007).

O sistema permite ao usuário optar por receber recomendações baseadas em seu perfil, construído através de seções de recomendações anteriores (produto selecionado, comentários feitos), similaridade com algum produto que o usuário especifica, e através de busca por um produto informado pelo usuário, como pode ser visto na Figura 10.

Figura 10. Exemplo de possibilidade de recomendação Fonte: Ricci e Nguyen (2007).

(37)

Segundo Ricci e Nguyen (2007), para realizar testes com o sistema um grupo de 15 usuários utilizando um celular Nokia 6600 respondeu um questionário avaliando o sistema. Os aspectos avaliados neste questionário variaram entre a usabilidade do sistema e o aproveitamento das recomendações recebidas.

Conforme Ricci e Nguyen (2007), os resultados obtidos através dos testes com o sistema atingiram os objetivos esperados. Os usuários consideraram a interface do sistema amigável, a interação prazerosa e conseguiram de forma rápida achar restaurantes que atendessem aos seus interesses.

2.1.4.6 RecS-DL (PEDRONETTE; TORRES, 2008)

Segundo Pedronette e Torres (2008) existem diversos problemas que podem ser encontrados nas ferramentas utilizadas para a realização de recomendações disponíveis. Entre eles estão problemas como o fato de os sistemas de recomendação serem desenvolvidos para um domínio de aplicação único, utilizarem apenas uma técnica de recomendação e serem desenvolvidos em uma plataforma específica.

A fim de desenvolver uma plataforma de serviços de recomendação que reduza as limitações das ferramentas já existentes, tornando-se flexível quanto a plataforma e o domínio de aplicação e extensível quanto as técnicas de recomendação empregadas foi proposto o desenvolvimento da plataforma RecS-DL, que unifica as vantagens de algumas ferramentas já desenvolvidas na forma de um WebService (PEDRONETTE; TORRES, 2008).

Para realizar a comunicação entre as bibliotecas digitais e a plataforma de recomendação são utilizadas interfaces de comunicação, conforme visto na Figura 11. A interface de comunicação entre a aplicação e a plataforma é realizada através de serviços web, sendo que os métodos de acesso aos serviços providos pela plataforma seguem o padrão WSDL e a chamada de serviços através de requisições se dá através de requisições SOAP, conforme ilustra o identificador A.

(38)

Figura 11. Arquitetura da plataforma RecS-DL Fonte: Pedronette e Torres (2008).

Como as aplicações são independentes da plataforma RecS-DL é necessário que a plataforma disponha de uma forma de acessar os dados das aplicações, esta se dá através do módulo de aquisição, como ilustra o identificador B. As informações de cada aplicação obtidas pela plataforma são armazenadas em repositórios distintos, conforme ilustra o identificador C. Com as informações obtidas e armazenadas das aplicações, as técnicas de recomendação podem ser aplicadas para realizar recomendações a aplicação cliente através das engines de recomendação, conforme ilustra o identificador D. Como a plataforma RecS-DL tem o objetivo de ser utilizada por diversas bibliotecas digitais, há o módulo de configuração da plataforma, ilustrado pelo identificador E. A plataforma RecS-DL trabalha em seu módulo de engines de recomendação com o conceito de plug-ins. Através deste conceito é possível desenvolver e instalar facilmente novos métodos de recomendação. O módulo de engines de recomendação é composto basicamente por dois elementos, um pacote de implementação em Java e um conjunto de metadados XML baseados no padrão Dublin Core (PEDRONETTE; TORRES, 2008).

Para avaliar a plataforma RecS-DL foram realizados testes por um grupo de usuários que cursou a disciplina de Bibliotecas Digitais no ano de 2007 no Instituto de Computação da Unicamp

(39)

para verificar a efetividade de sua integração com distintas plataformas digitais. Não foi realizado nenhum teste a fim de validar as recomendações geradas pela plataforma. O único teste que foi aplicado neste sentido foi o de validar a utilidade da ferramenta com este grupo de usuários, no qual foi obtido um grau de 87% de aprovação.

2.1.4.7 Collaborative Filtering Using Dual Information Sources ( CHO et al, 2007)

A maioria dos sistemas que utiliza a técnica de filtragem colaborativa leva em conta que há apenas uma categoria de usuários. A proposta deste trabalho é a utilização de dois perfis de usuários que devem ser levados em conta quando se realiza recomendações, o grupo de usuários similares e o grupo de usuários especialistas.

Partindo desta abordagem foi desenvolvido o método DISCORS (Dual Information Source Model-Based Collaborative Recommender System). Levando em conta que a técnica de filtragem colaborativa baseia-se na similaridade entre os perfis dos usuários para realizar recomendações, o método DISCORS baseia-se na similaridade entre os perfis dos usuários e no nível de experiência que os usuários similares possuem na área, conforme visto na Figura 12.

Figura 12. DISCORS

Fonte: Adaptado de Cho et al (2007).

(40)

Segundo Cho et al (2007), para validar esta abordagem proposta foi comparada sua precisão de recomendação com estratégias como filtragem híbrida e filtragem colaborativa. Foram realizados testes com duas bases de usuários. O primeiro teste foi realizado com a base do MovieLens, obtendo uma precisão superior as demais técnicas. O segundo teste foi realizado com os usuários de um dos sites de uma subsidiária da Telecom Coreana. Novamente a precisão de recomendação obtida pela abordagem DISCORS foi superior as demais técnicas.

2.1.4.8 Informed Recommender: Basing Recommendations on Consumer Product Reviews ( ACIAR et al, 2007)

Este trabalho desenvolveu uma nova abordagem para realizar recomendações aos usuários.

Baseando-se nos comentários de forma textual feitos pelos usuários acerca de um produto, utilizam- se técnicas de text-mining para mapear automaticamente cada parte do comentário para uma ontologia já definida, conforme pode ser visto na Figura 13.

Figura 13. Processo de recomendação baseado em comentários dos usuários Fonte: Adaptado de Aciar et al (2007).

Segundo Aciar et al (2007), o sucesso da recomendação se dá pelo conhecimento semântico que se tem sobre o comentário que foi feito pelos usuários, obtido pelo mapeamento deste para uma ontologia. A ontologia definida para esta abordagem possui duas partes principais, qualidade da opinião e qualidade do produto. A qualidade da opinião se refere à experiência que o usuário possui e a experiência que o usuário possui sobre o produto que está comentando. A qualidade do produto se refere à avaliação que o usuário fez sobre o produto.

A recomendação é baseada nos comentários feitos pelos usuários, que recebem um peso maior ou menor de acordo com o grau de experiência que se obtém de suas informações. Para

(41)

realizar testes com esta abordagem de recomendação foram utilizados comentários feitos pelos usuários sobre uma câmera digital no site Digital Photography Review.

Partindo dos comentários o sistema realizou o mapeamento destes para a ontologia definida.

Com os comentários mapeados foi realizado o processo de recomendação que analisa a avaliação dada à câmera e os atributos de experiência do usuário que fez os comentários. Esta abordagem apresenta a avaliação que os usuários atribuíram à câmera que o usuário requisitou e apresenta a recomendação de uma câmera que apresente os atributos que o usuário deseja. Como conclusão dos testes o sistema classificou a câmera avaliada como ruim e recomendou uma câmera melhor.

2.1.4.9 RACOFI ( ANDERSON et al, 2003)

Segundo Anderson et al (2003) com a padronização dos objetos de aprendizagem através do SCORM e IMS é possível realizar buscas em repositórios que retornem centenas de objetos de aprendizagem. Porém este processo é inadequado para a demanda atual da sociedade, que necessita de resultados imediatos e que satisfaçam suas necessidades. Para contornar este problema utilizam- se sistemas que prevêem as necessidades dos usuários.

Como parte do projeto Sifter, um projeto comum entre o NRC (National Research Council) e o KnowledgePool do Canada foi desenvolvido o RACOFI, um sistema que aplica regras de filtragem colaborativa para realizar recomendações. O RACOFI é o resultado da integração de dois sistemas: COFI (Collaborative Filtering) e RALOCA (Rule Applying Learning Comparison Object). O RALOCA se foca nos metadados objetivos (dados sobre o item) considerando que o COFI processa os metadados subjetivos (avaliações do usuário). Para realizar a recomendação o RALOCA combina as recomendações realizadas pelo COFI e as recomendações baseadas em conteúdo geradas por ele mesmo.

Utilizando o RACOFI foi desenvolvido o RACOFI Music, um agente de recomendação multidimensional para música canadense. Este sistema propõe uma solução à sobrecarga de informação. Sua abordagem é simples, coleta as avaliações que os usuários atribuem aos itens e recomenda itens a um usuário baseado na correlação entre as avaliações atribuídas pelo usuário e os demais usuários. Ele se diferencia dos demais sistemas de recomendação por poder se adaptar dinamicamente em tempo real as avaliações feitas graças a sua estrutura multidimensional de classificar as avaliações e a capacidade de aplicar regras de consulta.