• Nenhum resultado encontrado

Recomendação de objetos de aprendizagem de línguas baseada em inteligência de enxames

N/A
N/A
Protected

Academic year: 2021

Share "Recomendação de objetos de aprendizagem de línguas baseada em inteligência de enxames"

Copied!
99
0
0

Texto

(1)

Programa de P ´os-Graduac¸ ˜ao em Computac¸ ˜ao

Dissertac¸ ˜ao

Recomendac¸ ˜ao de Objetos de Aprendizagem de L´ınguas baseada em Intelig ˆencia de Enxames

Paulo de Almeida Afonso

(2)

Recomendac¸ ˜ao de Objetos de Aprendizagem de L´ınguas baseada em Intelig ˆencia de Enxames

Dissertac¸ ˜ao apresentada ao Programa de P ´os-Graduac¸ ˜ao em Computac¸ ˜ao da Universi-dade Federal de Pelotas, como requisito par-cial `a obtenc¸ ˜ao do t´ıtulo de Mestre em Ci ˆencia da Computac¸ ˜ao

Orientador: Prof. Dr. Paulo Roberto Ferreira Jr. Coorientador: Prof. Dr. Rafael Vetromille-Castro

(3)
(4)
(5)

AFONSO, Paulo de Almeida. Recomendac¸ ˜ao de Objetos de Aprendizagem de L´ınguas baseada em Intelig ˆencia de Enxames. 2016. 99 f. Dissertac¸ ˜ao (Mestrado

em Ci ˆencia da Computac¸ ˜ao) – Programa de P ´os-Graduac¸ ˜ao em Computac¸ ˜ao, Centro de Desenvolvimento Tecnol ´ogico, Universidade Federal de Pelotas, Pelotas, 2016. Este trabalho prop ˜oe a aplicac¸ ˜ao de t ´ecnicas de intelig ˆencia de enxames para a recomendac¸ ˜ao de objetos de aprendizagem de l´ınguas. No melhor de nosso conhe-cimento, n ˜ao se pode encontrar na literatura trabalhos espec´ıficos de recomendac¸ ˜ao deste tipo de objeto. As abordagens existentes s ˜ao voltadas para a recomendac¸ ˜ao de objetos de aprendizagem de modo gen ´erico, sem considerar os aspectos que norteiam o aprendizado de l´ınguas. Nesse sentido, foi realizado um estudo sobre os elementos essenciais que definem um objeto de aprendizagem de l´ınguas e as

principais abordagens utilizadas em sistemas de recomendac¸ ˜ao de uso geral. O

estudo considerou a hip ´otese de aplicac¸ ˜ao em um reposit ´orio desenvolvido com base em princ´ıpios pedag ´ogicos comunicativos e levou em considerac¸ ˜ao o car ´ater complexo da aprendizagem de l´ınguas. A tarefa de recomendac¸ ˜ao nesse contexto prev ˆe a exist ˆencia de m ´ultiplas conex ˜oes conceituais entre os objetos, que s ˜ao constru´ıdas `a medida que o sistema ´e utilizado, e ocorre atrav ´es da aplicac¸ ˜ao do algoritmo de Otimizac¸ ˜ao por Col ˆonia de Formigas. Como forma de validar a soluc¸ ˜ao proposta foram implementados, al ´em da abordagem proposta, dois dos algoritmos de recomendac¸ ˜ao de uso geral mais empregados atualmente. Considerando que um objeto de aprendizagem de l´ınguas tem como objetivo principal ser um faci-litador do processo de integrac¸ ˜ao de compet ˆencias gramatical, sociolingu´ıstica e estrat ´egica, dois aspectos essenciais devem ser considerados durante o processo de recomendac¸ ˜ao: a capacidade de combinar um objeto com outro e a reusabilidade, de forma mais espec´ıfica, a possibilidade de sua aplicac¸ ˜ao em diferentes contextos de aprendizagem. Dessa forma, os resultados obtidos a partir dos experimentos de-monstraram que a soluc¸ ˜ao proposta mostra-se eficiente para o contexto de aplicac¸ ˜ao a que se prop ˜oe.

Palavras-chave: Intelig ˆencia de enxames, Objetos de Aprendizagem, Objetos de

(6)

AFONSO, Paulo de Almeida. Recommendation of Learning Objects Language based on Swarm Intelligence. 2016. 99 f. Dissertac¸ ˜ao (Mestrado em Ci ˆencia da

Computac¸ ˜ao) – Programa de P ´os-Graduac¸ ˜ao em Computac¸ ˜ao, Centro de Desenvolvi-mento Tecnol ´ogico, Universidade Federal de Pelotas, Pelotas, 2016.

This work proposes the application of swarm intelligence to recommend language learning objects. To the best of our knowledge, one cannot find in the literature specific works addressing the recommendation of this kind of object. Existing approaches are focused to recommend general learning objects without considering the aspects that guide the learning of languages. In this sense, a study of the essential elements that define a language learning object and the main approaches used in the mentioned general-use recommender systems was conducted. The study considered the appli-cation of our approach in a repository developed based on communicative teaching principles and took into account the complex nature of language learning. The recom-mendation in this context considers the existence of multiple conceptual connections among objects, which are built as the system is used, and are driven by the application of an algorithm based on Ant Colony Optimization. In order to validate our approach, we also implemented two of the general recommendation algorithms most widely used currently. Whereas a language learning object aims to be a facilitator of grammatical skills integration process, sociolinguistic and strategic, two essential aspects must be considered during the recommendation process: the ability to combine an object with another and its reusability, more specifically, the possibility of its application in different learning contexts. Thus, the results obtained from the experiments demonstrated that the proposed approach is efficient for the application context that it is proposed.

Keywords: Swarm Intelligence, Learning objects, Language Learning objects,

(7)

Figura 1 OAL - Metadados em uma ontologia comunicativa . . . 20

Figura 2 SWARM - Experimento da ponte com ramos de tamanhos iguais . 36 Figura 3 SWARM - Experimento da ponte com ramos de tamanhos diferentes 37 Figura 4 ACO - Exemplo de construc¸ ˜ao de uma soluc¸ ˜ao por uma formiga . . 39

Figura 5 ACO - Selec¸ ˜ao do pr ´oximo caminho - processo estoc ´astico . . . . 39

Figura 6 DICA - Comparac¸ ˜ao entre temas . . . 48

Figura 7 Exemplo de um grafo de citac¸ ˜oes . . . 52

Figura 8 ACO - Exemplo de construc¸ ˜ao de uma soluc¸ ˜ao por um usu ´ario. . . 57

Figura 9 ACO - Selec¸ ˜ao do pr ´oximo caminho pelo usu ´ario. . . 58

Figura 10 ACO - Representac¸ ˜ao do relacionamento entre OALs. . . 58

Figura 11 ACO - Construc¸ ˜ao de uma soluc¸ ˜ao. . . 59

Figura 12 BALL - Estrutura da tabela Objetos . . . 65

Figura 13 BALL - Estrutura da tabela conex ˜oes entre objetos . . . 66

Figura 14 BALL - Conex ˜oes entre objetos . . . 66

Figura 15 BALL - Estrutura de tabelas para armazenamento de recomendac¸ ˜oes 67 Figura 16 BALL - Tela inicial do sistema . . . 68

Figura 17 BALL - Resultado da busca por palavra-chave . . . 68

Figura 18 BALL - Tela de download . . . 69

Figura 19 Gr ´afico resultante da 1ª etapa de simulac¸ ˜ao . . . 72

Figura 20 Gr ´afico resultante da 2ª etapa de simulac¸ ˜ao . . . 73

Figura 21 Gr ´afico resultante da 3ª etapa de simulac¸ ˜ao . . . 75

Figura 22 Exemplo de c ´odigo utilizado para popular a interface DataModel . . 76

Figura 23 Exemplo de c ´odigo para recomendac¸ ˜ao baseada em usu ´ario . . . 77

Figura 24 Exemplo de conex ˜oes resultantes dos experimentos . . . 78

Figura 25 Intensidade das conex ˜oes . . . 78

Figura 26 Gr ´afico de recomendac¸ ˜oes geradas pelo sistema . . . 80

Figura 27 Percentual de recomendac¸ ˜oes, geradas pelos tr ˆes algoritmos, con-sideradas relevantes para os usu ´arios I, J e K . . . 82

Figura 28 Percentual de recomendac¸ ˜oes consideradas relevantes, para os usu ´arios I, J e K, em relac¸ ˜ao ao n ´umero total de recomendac¸ ˜oes esperadas . . . 83

Figura 29 Percentual de recomendac¸ ˜oes inadequadas para os usu ´arios I, J e K 83 Figura 30 Percentuais obtidos a partir da an ´alise dos tr ˆes algoritmos . . . 84

(8)

Tabela 1 Recomendac¸ ˜ao baseada em filtragem colaborativa . . . 29

Tabela 2 e-LORS - Categorias descritoras . . . 46

Tabela 3 e-LORS - Campos do LOM e dimens ˜oes de prefer ˆencias . . . 46

Tabela 4 Ex. de recomendac¸ ˜oes e valores utilizados no c ´alculo da medida swarm . . . 61

Tabela 5 N ´umero de objetos acessados na 1ª simulac¸ ˜ao . . . 72

Tabela 6 N ´umero de objetos acessados na 2ª etapa de simulac¸ ˜ao . . . 73

Tabela 7 Dados utilizados na simulac¸ ˜ao final . . . 74

Tabela 8 N ´umero de objetos acessados na 3ª etapa de simulac¸ ˜ao . . . 75

Tabela 9 Ex. de dados de acesso, resultantes das 3 etapas de simulac¸ ˜ao . . 76

Tabela 10 Valores associados `as conex ˜oes . . . 79

Tabela 11 Exemplo de recomendac¸ ˜oes para os usu ´arios I, J e K . . . 79

Tabela 12 Recomendac¸ ˜oes realizadas a partir da interac¸ ˜ao dos usu ´arios I, J e K 80 Tabela 13 Classificac¸ ˜ao do resultado da recomendac¸ ˜ao de um item para um usu ´ario . . . 82

Tabela 14 Valores obtidos a partir da an ´alise das recomendac¸ ˜oes . . . 82

(9)

BALL Banco de Atividades para a Aprendizagem de L´ınguas.

BIOE Banco Internacional de Objetos Educacionais

CLT Communicative Language Teaching

CA Classification Accuracy

IEEE Institute of Electrical and Electronics Engineers

LE L´ıngua Estrangeira

LOM Learning Object Metadata

MEC Minist ´erio da Educac¸ ˜ao

MIT Massachusetts Institute of Technology

MAE Mean Absolute Error

MSE Mean Squared Error

NMAE Normalized Mean Absolute Error

OA Objetos de Aprendizagem

OE Objetos Educacionais

OAL Objetos de Aprendizagem de L´ınguas

OIE Organizac¸ ˜ao dos Estados Ibero-americanos

PA Prediction Accuracy

RELPE Rede Latino-americana de Portais Educacionais

RMSE Root Mean Squared Error

SI Swarm Intelligence

SR Sistemas de Recomendac¸ ˜ao

SEV Standard Error Variance

TF-IDF Term Frequency - Inverse Document Frequency

(10)

1 INTRODUC¸ ˜AO . . . . 12

2 FUNDAMENTAC¸ ˜AO TE ´ORICA . . . . 16

2.1 Objetos de Aprendizagem . . . . 16

2.2 Objetos de Aprendizagem de L´ınguas . . . . 19

2.3 Sistemas de Recomendac¸ ˜ao . . . 21

2.3.1 Recomendac¸ ˜ao Baseada em Conte ´udo . . . 23

2.3.2 Recomendac¸ ˜ao Colaborativa . . . 27

2.3.3 Recomendac¸ ˜ao H´ıbrida . . . 31

2.4 Intelig ˆencia de Enxames . . . . 33

2.4.1 Otimizac¸ ˜ao por Col ˆonia de Formigas . . . 35

2.4.2 Algoritmo ACO (Ant Colony Optimization) . . . 37

2.5 Apache Mahout . . . . 40

2.5.1 T ´ecnicas de Recomendac¸ ˜ao . . . 41

2.5.2 Clusterizac¸ ˜ao . . . 41

2.5.3 Classificac¸ ˜ao . . . 42

2.5.4 Recomendac¸ ˜oes com Mahout . . . 42

3 TRABALHOS RELACIONADOS . . . . 44

3.1 Recomendac¸ ˜ao de Objetos de Aprendizagem . . . . 44

3.2 Recomendac¸ ˜ao de Objetos Associados `a Diferentes Contextos . . . 49

4 ACO APLICADO `A RECOMENDAC¸ ˜AO DE OBJETOS DE APRENDIZA-GEM DE L´INGUAS . . . . 56

4.1 Abordagem utilizada . . . . 56

4.2 Aplicac¸ ˜ao do algoritmo ACO . . . 57

5 ESTUDO DE CASO . . . . 63

5.1 BALL - Banco de Atividades para Aprendizagem de L´ınguas . . . . . 63

5.2 Prot ´otipo . . . . 64

6 EXPERIMENTOS E RESULTADOS . . . . 71

6.1 Descric¸ ˜ao dos experimentos . . . 71

6.2 Resultados obtidos . . . 77

6.3 Avaliac¸ ˜ao das recomendac¸ ˜oes . . . . 81

7 CONCLUS ˜OES . . . . 85

(11)

ANEXO A LISTA DE OBJETOS ACESSADOS . . . . 94

ANEXO B RECOMENDAC¸ ˜OES REALIZADAS A PARTIR DA INTERAC¸ ˜AO DOS USU ´ARIOS I, J E K . . . . 99

(12)

A utilizac¸ ˜ao de recursos online tem se tornado cada vez mais presente na educac¸ ˜ao, quer seja no ˆambito do ensino `a dist ˆancia ou presencial. Diante disso no-vas formas de ensino e aprendizagem surgiram, assim como diferentes possibilidades de desenvolvimento de conte ´udos por meio de objetos de aprendizagem (CAZELLA et al., 2012). Objetos de aprendizagem (OA) podem ser definidos como componen-tes de um tipo de instruc¸ ˜ao baseada em computador, fundamentada no paradigma orientado a objetos (WILEY, 2003). Essa caracter´ıstica ´e evidenciada pela possibili-dade de criac¸ ˜ao de pequenos componentes (em relac¸ ˜ao a um curso completo) que podem ser reutilizados em diferentes contextos de aprendizagem. Em uma definic¸ ˜ao mais abrangente, segundo o mesmo autor, um OA pode ser conceituado como qual-quer entidade, digital ou n ˜ao-digital, que pode ser utilizada, reutilizada ou referenciada durante o processo de aprendizagem apoiado pela tecnologia. Como exemplo pode-mos citar conte ´udos multim´ıdia, conte ´udos instrucionais, objetivos de aprendizagem, softwares e ferramentas de software instrucionais, pessoas, organizac¸ ˜oes ou eventos. Com base nesses conceitos, pode-se perceber que esses recursos encontram-se dis-pon´ıveis na Internet, por ´em de forma descentralizada, espalhados por toda a rede, o que dificulta o processo de localizac¸ ˜ao e recomendac¸ ˜ao. Como consequ ˆencia desta descentralizac¸ ˜ao, deixam de lado seu principal objetivo: auxiliar o processo de ensino e aprendizagem.

A f ´acil localizac¸ ˜ao, recomendac¸ ˜ao adequada desses materiais e a disponibilizac¸ ˜ao de recursos em diferentes formatos, al ´em de facilitar a pesquisa, proporciona melhor compreens ˜ao do tema que est ´a sendo pesquisado. Um dos principais desafios do educador ´e a selec¸ ˜ao e organizac¸ ˜ao desses materiais digitais.

Os reposit ´orios de objetos de aprendizagem foram criados para esta finalidade, possibilitando a busca e agregac¸ ˜ao de objetos em um mesmo sistema. Tal carac-ter´ıstica proporciona maior facilidade `a realizac¸ ˜ao de consultas atrav ´es da divis ˜ao por

´areas, conte ´udos e tipos de objetos (CAZELLA et al., 2012).

Diante deste contexto, atrav ´es da presente proposta espera-se contribuir para a produc¸ ˜ao e localizac¸ ˜ao de Objetos de Aprendizagem de L´ınguas (OAL) a partir da

(13)

constituic¸ ˜ao de um reposit ´orio, desenvolvido com base em uma ontologia fundamen-tada pelos princ´ıpios da CLT, voltado n ˜ao somente para o desenvolvimento lingu´ıstico mas tamb ´em para a formac¸ ˜ao (continuada) de professores.

Sabe-se no entanto que os reposit ´orios de aprendizagem, apesar de apresenta-rem a informac¸ ˜ao de forma centralizada, muitas vezes n ˜ao possuem sistemas que recomendem recursos educacionais semelhantes ou complementares (VIEIRA; NU-NES, 2012). Em func¸ ˜ao disso, acabam por sobrecarregar o usu ´ario com informac¸ ˜oes que na maioria das vezes n ˜ao possuem conte ´udos relevantes para o tema que est ´a sendo pesquisado.

Os Sistemas de Recomendac¸ ˜ao (SR) surgiram como proposta para soluc¸ ˜ao deste problema. Eles funcionam como filtros de informac¸ ˜ao, auxiliando o usu ´ario na busca e selec¸ ˜ao de conte ´udo com base em seu perfil. As recomendac¸ ˜oes s ˜ao realizadas a partir da an ´alise de diferentes aspectos, como: prefer ˆencias do usu ´ario, semelhanc¸a entre conte ´udos j ´a acessados, avaliac¸ ˜ao dos usu ´arios, entre outros. Um dos grandes desafios deste tipo de sistema ´e conceber a combinac¸ ˜ao apropriada entre as expec-tativas dos usu ´arios e os itens a serem recomendados. A definic¸ ˜ao e descoberta do tipo de relacionamento de interesses ´e o problema em quest ˜ao (CAZELLA; NUNES; REATEGUI, 2010).

No melhor de nosso conhecimento, n ˜ao se pode encontrar na literatura trabalhos espec´ıficos relacionados `a recomendac¸ ˜ao de Objetos de Aprendizagem de L´ınguas. As abordagens existentes s ˜ao voltadas para a recomendac¸ ˜ao de objetos de aprendi-zagem de modo gen ´erico, sem considerar os aspectos que norteiam a aprendiaprendi-zagem de l´ınguas. Dessa forma, a partir do desenvolvimento do reposit ´orio de OAL, tem-se como principal objetivo deste trabalho propor uma estrat ´egia para recomendac¸ ˜ao, le-vando em considerac¸ ˜ao os aspectos pedag ´ogicos ligados a essa classe de objetos e o car ´ater complexo da aprendizagem de l´ınguas.

A Intelig ˆencia Artificial oferece uma s ´erie de t ´ecnicas que podem ser aplicadas na busca pela soluc¸ ˜ao de problemas complexos em diversas ´areas. Entre as quais est ˜ao, por exemplo, o estabelecimento de rotas de ve´ıculos, o escalonamento de produc¸ ˜ao na ind ´ustria e o projeto de circuitos integrados. Tais t ´ecnicas podem oferecer soluc¸ ˜oes para a localizac¸ ˜ao e recomendac¸ ˜ao adequada de objetos de aprendizagem quando aplicadas a SR. Nesse contexto, o presente trabalho aborda a aplicac¸ ˜ao de t ´ecnicas de Intelig ˆencia de Enxames para a recomendac¸ ˜ao de Objetos de Aprendizagem de L´ınguas (OAL).

O modelo proposto baseia-se na combinac¸ ˜ao de t ´ecnicas colaborativas e baseadas em conte ´udo em um ´unico sistema de recomendac¸ ˜ao h´ıbrido baseado em regras, onde a recomendac¸ ˜ao propriamente dita se d ´a atrav ´es da aplicac¸ ˜ao do Algoritmo de Otimizac¸ ˜ao por Col ˆonia de Formigas.

(14)

proposta em um reposit ´orio desenvolvido com base em princ´ıpios pedag ´ogicos comu-nicativos, atentando para o car ´ater complexo da aprendizagem de l´ınguas. Durante o desenvolvimento desta dissertac¸ ˜ao foi conclu´ıda parte da implementac¸ ˜ao deste repo-sit ´orio, disponibilizando recursos suficientes para a inserc¸ ˜ao e catalogac¸ ˜ao de objetos de aprendizagem. Entretanto, a tarefa de popular o reposit ´orio com uma quantidade de OAL adequada para realizac¸ ˜ao dos experimentos, demandaria muito tempo. Como soluc¸ ˜ao para o problema, foi desenvolvido um prot ´otipo de sistema web populado com dados obtidos do Banco Internacional de Objetos Educacionais (BIOE).

Apesar dos objetos utilizados nos experimentos n ˜ao terem sido constru´ıdos com base na ontologia aqui prevista, a proposta do presente trabalho n ˜ao foi inviabilizada. Os experimentos foram realizados de forma controlada e contaram com o aux´ılio de um professor especialista da ´area de Letras, e tr ˆes professoras de ingl ˆes em formac¸ ˜ao, bolsistas de iniciac¸ ˜ao cient´ıfica, vinculadas ao projeto do Programa de P ´os-Graduac¸ ˜ao em Letras (mestrado) da Universidade Federal de Pelotas.

Os resultados obtidos a partir dos experimentos demonstraram que a soluc¸ ˜ao pro-posta se mostra eficiente para o contexto de aplicac¸ ˜ao a que se prop ˜oe, uma vez que retornou resultados mais relacionados ao termo consultado pelos usu ´arios do que outros modelos. Outrossim, proporcionou o estabelecimento de rotas, constru´ıdas atrav ´es da aplicac¸ ˜ao do conhecimento obtido de forma impl´ıcita por meio da interac¸ ˜ao dos usu ´arios com o sistema.

O conte ´udo do presente trabalho segmenta-se em seis partes distintas e com-plementares, al ´em desta introduc¸ ˜ao: O Cap´ıtulo 2 oferece uma vis ˜ao geral sobre os conceitos relacionados ao tema da pesquisa, abordando conceitos relacionados aos Objetos de aprendizagem, Objetos de Aprendizagem de L´ınguas, bem como suas principais caracter´ısticas e definic¸ ˜oes. Tamb ´em s ˜ao abordados conceitos relaciona-dos aos Sistemas de Recomendac¸ ˜ao, apresentando sua arquitetura, classificac¸ ˜oes e as principais t ´ecnicas utilizadas no processo de recomendac¸ ˜ao. Por fim, s ˜ao apre-sentados os conceitos relacionados ao Apache Mahout, `a Intelig ˆencia de Enxames e o Algoritmo de Otimizac¸ ˜ao por Col ˆonia de Formigas, cujas t ´ecnicas s ˜ao aplicadas na busca pela soluc¸ ˜ao proposta no presente trabalho; O cap´ıtulo 3 apresenta os trabalhos relacionados que serviram de embasamento para an ´alise a viabilidade de aplicac¸ ˜ao da soluc¸ ˜ao proposta. Nesse contexto, foram analisados dois grupos de trabalhos: Recomendac¸ ˜ao de Objetos de Aprendizagem e Recomendac¸ ˜ao de Objetos associa-dos `a diferentes contextos; O cap´ıtulo 4 descreve o Sistema de Recomendac¸ ˜ao pro-posto por este trabalho. A abordagem utilizada para desenvolvimento do sistema ´e apresentada na primeira sec¸ ˜ao do cap´ıtulo. S ˜ao definidos os dados de entrada a serem utilizados, as t ´ecnicas e o tipo de filtragem adotados, os algoritmos implemen-tados e a forma como os dados de entrada e os dados armazenados s ˜ao combinados pelos algoritmos no processo de recomendac¸ ˜ao, resultando na sa´ıda do sistema; O

(15)

cap´ıtulo 5 trata da aplicac¸ ˜ao do Sistema de Recomendac¸ ˜ao. Apresenta as carac-ter´ısticas do prot ´otipo desenvolvido, o local e a forma de coleta dos dados utilizados para realizac¸ ˜ao dos experimentos, bem como a estrutura criada para armazenamento das informac¸ ˜oes. S ˜ao apresentadas as telas e a forma de utilizac¸ ˜ao do sistema, a me-todologia utilizada no processo de recomendac¸ ˜ao e exemplos de c ´odigos utilizados na implementac¸ ˜ao; O cap´ıtulo 6 apresenta a descric¸ ˜ao dos experimentos realizados para verificar a viabilidade do modelo proposto. S ˜ao apresentados os procedimentos rea-lizados, as pessoas envolvidas e a interpretac¸ ˜ao dos resultados obtidos; Finalmente, o cap´ıtulo 7 apresenta as principais conclus ˜oes acerca do que foi realizado durante o desenvolvimento da soluc¸ ˜ao proposta e os trabalhos futuros previstos.

(16)

Este cap´ıtulo oferece uma vis ˜ao geral sobre os conceitos relacionados ao tema da pesquisa. As sec¸ ˜oes que o comp ˜oem abordam conceitos relacionados aos Objetos de aprendizagem, Objetos de Aprendizagem de L´ınguas, bem como suas principais caracter´ısticas e definic¸ ˜oes. Tamb ´em s ˜ao abordados conceitos relacionados aos Sis-temas de Recomendac¸ ˜ao, apresentando sua arquitetura, classificac¸ ˜oes e as princi-pais t ´ecnicas utilizadas no processo de recomendac¸ ˜ao. Por fim, s ˜ao apresentados os conceitos relacionados `a Intelig ˆencia de Enxames e o Algoritmo de Otimizac¸ ˜ao por Col ˆonia de Formigas, cujas t ´ecnicas s ˜ao aplicadas na busca pela soluc¸ ˜ao proposta no presente trabalho.

2.1

Objetos de Aprendizagem

Objetos de Aprendizagem s ˜ao elementos essenciais de um modelo conceitual para a criac¸ ˜ao e distribuic¸ ˜ao de conte ´udo. Seu principal objetivo ´e melhorar o desempenho humano em relac¸ ˜ao ao processo de ensino e aprendizagem (HODGINS, 2002). Com-preendidos como entidades digitais ou recursos educacionais, podem ser acessados via internet, armazenados, distribu´ıdos, compartilhados, modificados e recombinados com outros, formando m ´odulos independentes de instruc¸ ˜ao, para serem utilizados on-line ou off-on-line (SOARES, 2009). Trata-se de um tipo de instruc¸ ˜ao baseada em com-putador, fundamentada no paradigma orientado a objetos. Essa caracter´ıstica pode ser percebida pela possibilidade de criac¸ ˜ao de pequenos componentes chamados de objetos, que podem ser utilizados e reutilizados em diferentes contextos de aprendi-zagem (WILEY, 2003).

Na an ´alise realizada por MCGREAL (2004), um estudo das diferentes terminolo-gias utilizadas para conceituar um OA revela que quatro significados distintos podem ser percebidos:

Qualquer objeto - Um Objeto de Aprendizagem pode ser caracterizado como

qualquer entidade, digital ou n ˜ao digital, que pode ser utilizada, reutilizada ou referenciada durante o processo de ensino e aprendizagem. Essa definic¸ ˜ao,

(17)

extremamente ampla, considera que o uso que se faz de um objeto ´e que o torna, ou n ˜ao, um OA. Nesse contexto, do ponto de vista te ´orico, qualquer objeto utilizado para aprendizagem pode ser considerado um OA.

Qualquer objeto digital - A restric¸ ˜ao imposta pela necessidade de um OA ser

digital deve-se `as caracter´ısticas inerentes a estes objetos, que s ˜ao particu-larmente associadas `a ambientes virtuais. Apesar de ser mais restrita, essa definic¸ ˜ao deve considerar os objetivos para os quais s ˜ao elaborados os objetos. • Qualquer objeto com prop ´osito educacional - Essa definic¸ ˜ao n ˜ao faz distinc¸ ˜ao

entre um objeto digital ou n ˜ao-digital. Nesse caso, um objeto pode ser conside-rado um OA desde que possa ser utilizado para apoiar atividades de aprendiza-gem: um livro, uma p ´agina na web, um microsc ´opio ou at ´e mesmo uma calcula-dora. QUINN; HOBBS (2000), prev ˆe ainda a utilizac¸ ˜ao de blocos ou pedac¸os de conte ´udo educacional, considerando qualquer tipo de m´ıdia, digital ou n ˜ao, que possam ser agrupados e utilizados para compor uma disciplina ou at ´e mesmo um curso completo.

Qualquer objeto digital com objetivo educacional - Um OA pode ser

caracteri-zado como um arquivo digital cuja aplicac¸ ˜ao ´e voltada para fins pedag ´ogicos. Tal arquivo deve incluir internamente, ou de forma associada, sugest ˜oes para sua utilizac¸ ˜ao de forma adequada (SOSTERIC; HESEMEIER, 2002). Nesse con-texto, um objeto torna-se um OA quando ´e projetado para ser utilizado de forma individual ou combinado com outros objetos de m´ıdia, tendo como prop ´osito prin-cipal promover e facilitar a aprendizagem.

Apesar das discuss ˜oes, os dois conceitos, digital ou n ˜ao, tem se perpetuado ao longo dos anos, dividindo as prefer ˆencias dos autores. Apesar disso, existe uma tend ˆencia maior para determinac¸ ˜ao do conceito de um OA como uma entidade digital (LEFFA, 2006).

Para o prop ´osito deste trabalho ser ´a adotada a definic¸ ˜ao de (MCGREAL, 2004), que caracteriza um OA como qualquer recurso digital reutiliz ´avel. Este OA pode ser encapsulado em uma aula, ou conjunto de aulas, agrupados em unidades, m ´odulos, cursos ou programas e deve ter um prop ´osito educacional. Para MCGREAL (2004), a realidade consiste em aceitar a limitac¸ ˜ao de que os Objetos de Aprendizagem devem ser recursos digitais. O autor observa que, embora isso possa comprometer sua usa-bilidade, tal limitac¸ ˜ao n ˜ao impede um OA de referenciar objetos n ˜ao-digitais externos. Al ´em das terminologias acima descritas, os diversos estudos realizados t ˆem des-tacado carater´ısticas inerentes aos objetos que contribuem para a definic¸ ˜ao de um conceito mais claro sobre um OA. Estas caracter´ısticas s ˜ao granularidade,

(18)

reusabili-dade, interoperabilidade e recuperabilidade e ser ˜ao descritas a seguir segundo a vis ˜ao de (LEFFA, 2006):

Granularidade - Refere-se ao termo utilizado para definir o tamanho das

estrutu-ras que comp ˜oem um OA. Por exemplo, quanto menor o objeto (maior granulari-dade), mais f ´acil ser ´a sua combinac¸ ˜ao com diferentes Objetos de Aprendizagem. Esta definic¸ ˜ao tem sido um dos grandes desafios para os pesquisadores, pois impacta diretamente na capacidade de combinar um objeto com outro (WILEY, 2003). Apesar de n ˜ao existirem padr ˜oes ou crit ´erios para definir a granulari-dade, uma forma de determin ´a-la ´e atrav ´es do tempo utilizado para execuc¸ ˜ao de uma atividade LEFFA (2006). Para VETROMILLE-CASTRO et al. (2013), um OA pode ser considerado como tendo a granularidade adequada, quando esta permitir a reutilizac¸ ˜ao e interoperabilidade do recurso a um n´ıvel considerado relevante para o processo de aprendizagem.

Reusabilidade - Significa reaproveitar o objeto constru´ıdo em diferentes

contex-tos de aprendizagem, combinando-o com outros objecontex-tos e recriando-o `a medida que for necess ´ario. Nesse contexto, a reusabilidade sugere a reduplicac¸ ˜ao do mesmo objeto tornando-o mais aprimorado e eficiente ao processo de aprendi-zagem. Para que haja reusabilidade, o objeto deve evoluir `a medida do tempo, de forma a adaptar-se `a constante evoluc¸ ˜ao tecnol ´ogica.

Interoperabilidade - ´E a capacidade de resposta e funcionalidade do OA inde-pendente do ambiente digital em que se encontra. A evoluc¸ ˜ao do objeto e sua capacidade de ser adapt ´avel ´e que o levar ˜ao a interoperabilidade.

Recuperabilidade - Refere-se `a facilidade de acesso ao OA. Significa

proporci-onar ao usu ´ario, no menor tempo poss´ıvel, informac¸ ˜ao ´util e que atenda `as suas necessidades. Este acesso ´e realizado atrav ´es de uma esp ´ecie de catalogac¸ ˜ao do objeto. A catalogac¸ ˜ao ´e realizada utilizando-se descritores, tamb ´em chama-dos de metadachama-dos1do objeto.

Durante o desenvolvimento de Objetos de Aprendizagem t ˆem-se atribu´ıdo maior atenc¸ ˜ao aos aspectos tecnol ´ogicos do que `a aspectos pedag ´ogicos. Dessa forma, para o ensino e aprendizagem de l´ınguas, faz-se necess ´ario um embasamento te ´orico diferenciado, que possua a relac¸ ˜ao adequada com a aprendizagem de l´ınguas es-trangeiras e com ˆenfase na comunicac¸ ˜ao (VETROMILLE-CASTRO et al., 2013). Nesse contexto, surgem os Objetos de Aprendizagem de L´ınguas (OAL), descritos na pr ´oxima sec¸ ˜ao.

1Metadados s ˜ao comumente descritos como dados sobre dados. No contexto de aplicac¸ ˜ao deste

(19)

2.2

Objetos de Aprendizagem de L´ınguas

Um Objeto de Aprendizagem de L´ınguas (OAL) pode ser definido como um

OA preparado especificamente para o ensino e aprendizagem de l´ınguas. Sua

implementac¸ ˜ao tem por objetivo promover e desenvolver a compet ˆencia comunica-tiva. Para este fim, deve ser fundamentado nas teorias do Ensino Comunicativo de

L´ınguas (CLT2) (VETROMILLE-CASTRO et al., 2013).

A definic¸ ˜ao de um OAL deve ser norteada por aspectos de design de usabilidade e usabilidade pedag ´ogica (VETROMILLE-CASTRO, 2003). Deve ter como objetivo principal a capacidade de facilitar a integrac¸ ˜ao de compet ˆencias gramatical, socio-lingu´ıstica e estrat ´egica, caracter´ısticas particularmente ligadas ao ensino e `a apren-dizagem de idiomas (VETROMILLE-CASTRO et al., 2012). Tais aspectos consideram caracter´ısticas relacionadas `a instruc¸ ˜ao, orientac¸ ˜ao e feedback de atividades. Essas caracter´ısticas, al ´em de proporcionarem a interac¸ ˜ao com o aluno, s ˜ao componentes essenciais no desenvolvimento da compet ˆencia comunicativa.

A compet ˆencia comunicativa pode ser definida como uma caracter´ıstica emergente da combinac¸ ˜ao entre o conhecimento e a habilidade necess ´aria para a comunicac¸ ˜ao. O conhecimento, que pode ser consciente ou inconsciente, refere-se `a informac¸ ˜ao que disp ˜oe um indiv´ıduo sobre dada linguagem e sobre outros aspectos de sua utilizac¸ ˜ao, enquanto a habilidade refere-se a forma como um indiv´ıduo pode usar o conhecimento em comunicac¸ ˜ao real (CANALE; SWAIN, 1980; CANALE, 1983).

O trabalho de CANALE; SWAIN (1980) desencadeou uma s ´erie de discuss ˜oes vol-tadas para o desenvolvimento da compet ˆencia comunicativa. Foram apresentados cinco princ´ıpios essenciais necess ´arios para guiar um programa de ensino de l´ınguas estrangeiras atrav ´es de uma abordagem comunicativa. Estes princ´ıpios foram adapta-dos aos OAL, e s ˜ao descritos a seguir, segundo a vis ˜ao de (VETROMILLE-CASTRO et al., 2013):

• Um Objeto de Aprendizagem de L´ınguas deve ter como objetivo principal a capacidade de proporcionar a integrac¸ ˜ao de compet ˆencias gramaticais, socio-lingu´ısticas e estrat ´egicas;

• Objetos de Aprendizagem de L´ınguas devem focar-se na necessidade de comunicac¸ ˜ao dos alunos;

• Devem proporcionar a interac¸ ˜ao dos alunos em situac¸ ˜oes reais e significativas de comunicac¸ ˜ao, sejam elas de produc¸ ˜ao e/ou compreens ˜ao oral e/ou escrita. Considera-se como real, situac¸ ˜oes que, apesar de n ˜ao estarem realmente ocor-rendo no processo de ensino, representam ou retratam poss´ıveis eventos de uso comunicativo da l´ıngua fora do contexto da sala de aula;

(20)

• Devem atentar para a forma da L´ıngua Estrangeira (LE) em situac¸ ˜oes de comunicac¸ ˜ao, conduzindo o aluno do impl´ıcito ao expl´ıcito no uso da l´ıngua; • E por fim, devem possuir aspectos socio-lingu´ıstico-culturais da LE e dos alunos,

afim de facilitar a aprendizagem e uso da l´ıngua.

Objetos de Aprendizagem fundamentados com base nos princ´ıpios acima descri-tos, podem ser considerados mais do que OAs voltados para o ensino e aprendizagem de l´ınguas. Dada sua especificidade, podem ser caracterizados como artefatos ela-borados com o prop ´osito de desenvolver a compet ˆencia comunicativa dos estudantes (VETROMILLE-CASTRO et al., 2013).

Em seu trabalho, VETROMILLE-CASTRO et al. (2013) aborda a elaborac¸ ˜ao de uma ontologia fundamentada pelos princ´ıpios da CLT. Esta ontologia foi constitu´ıda atrav ´es de metadados elaborados a partir da definic¸ ˜ao de uma estrutura de linguagem t ´ecnica e principalmente comunicativa (Figura 1). Segundo o autor, a construc¸ ˜ao de um reposit ´orio de Objetos de Aprendizagem de L´ınguas, norteado por esta ontologia, al ´em de ser um recurso importante para estudantes de l´ınguas, significa a concepc¸ ˜ao de uma ferramenta para a formac¸ ˜ao continuada de professores de l´ınguas.

Figura 1: OAL - Metadados em uma ontologia comunicativa Fonte: VETROMILLE-CASTRO R.; PEREIRA; RAMIRES (2013)

Os metadados apresentados na Figura 1 funcionam como descritores com informac¸ ˜oes relacionadas aos OAL, utilizados para facilitar sua indexac¸ ˜ao e

(21)

identificac¸ ˜ao em reposit ´orios. Dessa forma, percebe-se que a adoc¸ ˜ao de uma on-tologia poder ´a ser utilizada como um recurso importante durante o processo de de-senvolvimento de um sistema para recomendac¸ ˜ao de OAL.

2.3

Sistemas de Recomendac¸ ˜ao

A revis ˜ao da literatura demonstra que as opini ˜oes de diferentes autores convergem para o mesmo conceito acerca de um Sistema de Recomendac¸ ˜ao: uma ferramenta ou conjunto de t ´ecnicas que, independente do escopo ao qual est ´a inserido, tem como prop ´osito principal, atrav ´es da tarefa de recomendac¸ ˜ao, prover ao usu ´ario informac¸ ˜oes e servic¸os que sejam relevantes, ´uteis e atendam `as suas necessidades (RICCI et al., 2010; ZHOU et al., 2008; BURKE, 2002, 2007; MAHMOOD; RICCI, 2009; RESNICK; VARIAN, 1997).

Os Sistemas de Recomendac¸ ˜ao surgiram em meados de 1990, a partir de uma ideia cujo prop ´osito era auxiliar na busca de conte ´udo online mais ´util e relevante, utilizando para tanto, a opini ˜ao das pessoas (JANNACH et al., 2010).

O sistema de correio experimental Tapestry introduziu a ideia de filtragem colabo-rativa e mostrou como a utilizac¸ ˜ao de dados, adquiridos de forma impl´ıcita ou expl´ıcita, baseados no comportamento dos usu ´arios, poderiam ser aplicados para a criac¸ ˜ao de filtros pessoais. Alguns anos depois, diferentes sistemas como GroupLens (RESNICK et al., 1994), Ringo do MIT (SHARDANAND; MAES, 1995) e Bellcore Video Recom-mender (HILL et al., 1995), adotaram t ´ecnicas semelhantes para a recomendac¸ ˜ao de itens relacionados a diferentes contextos, como filmes, m ´usicas, artistas e not´ıcias, to-mando por base as prefer ˆencias dos usu ´arios. No ambiente de aprendizagem online, por exemplo, os SR s ˜ao aplicados de forma a recomendar materiais de aprendiza-gem de interesse dos alunos. Podem ser caracterizados como agentes de software inteligentes, cujas recomendac¸ ˜oes s ˜ao baseadas nas atividades, ac¸ ˜oes ou estilos de aprendizagem, descobertos a partir da an ´alise de padr ˜oes de navegac¸ ˜ao (ZHUHA-DAR et al., 2009).

Em aplicac¸ ˜oes voltadas para o com ´ercio eletr ˆonico e websites, diferentes t ´ecnicas s ˜ao empregadas na tentativa de otimizar a tarefa de recomendac¸ ˜ao e ofertar produtos de interesse aos clientes, objetivando, desse modo, sua fidelizac¸ ˜ao e consequente aumento da lucratividade (CAZELLA; NUNES; REATEGUI, 2010). Como exemplos de websites bastante conhecidos que utilizam SR, podemos destacar Amazon.com, YouTube, Netflix, Yahoo, Tripadvisor, Last.fm, e IMDb (RICCI; ROKACH; SHAPIRA, 2011).

A tarefa de recomendac¸ ˜ao consiste em estimar classificac¸ ˜oes para itens que ainda n ˜ao foram vistos ou avaliados pelos usu ´arios. Normalmente, essa estimativa se d ´a atrav ´es de classificac¸ ˜oes atribu´ıdas `a outros itens, al ´em de outras informac¸ ˜oes

(22)

re-lacionadas ao conjunto de dados dispon´ıveis para avaliac¸ ˜ao. Dessa forma, dada a possibilidade de classificar itens que ainda n ˜ao foram avaliados e, considerando que tal classificac¸ ˜ao baseia-se em avaliac¸ ˜oes de itens relacionados ao grupo de interesses de um determinado usu ´ario, a recomendac¸ ˜ao pode ser realizada atrav ´es da selec¸ ˜ao de itens que obtiveram a melhor classificac¸ ˜ao estimada.

De maneira formal, segundo ADOMAVICIUS; TUZHILIN (2005), o problema de recomendac¸ ˜ao pode ser representado atrav ´es da seguinte equac¸ ˜ao:

∀c ∈ C, s’c = arg max

s∈S u(c, s) (1)

Onde C representa o conjunto de todos os usu ´arios e S o conjunto de todos os itens poss´ıveis que podem ser recomendados.

Considerando que o conjunto de dados, tanto em S quanto em C, pode ser sig-nificativamente grande, u representa uma func¸ ˜ao que mede a utilidade do produto s para o usu ´ario c, ou seja, u : c × s → R, onde R ´e um conjunto totalmente ordenado (por exemplo, n ´umeros inteiros ou n ´umeros reais n ˜ao-negativos em um determinado intervalo). Ent ˜ao, para cada usu ´ario c ∈ C, queremos escolher tal item s0 ∈ S que maximize a utilidade para o usu ´ario.

A medida de utilidade u de um item para o usu ´ario depende do escopo da aplicac¸ ˜ao, podendo ser obtida atrav ´es de classificac¸ ˜oes feitas pelo usu ´ario, ou atrav ´es de uma func¸ ˜ao de utilidade, calculada de forma arbitr ´aria, como uma func¸ ˜ao de utili-dade baseada no lucro, por exemplo.

Cada caracter´ıstica do usu ´ario c ∈ C, como sexo, idade, renda, entre outras, pode ser utilizada para a definic¸ ˜ao de um perfil. Em uma abordagem mais simples, o perfil do usu ´ario pode conter apenas um ´unico elemento, como seu identificador na base de dados, por exemplo. De forma an ´aloga, cada elemento s ∈ S, ´e definido por um conjunto de caracter´ısticas ou atributos que representam o objeto. Assim, em um SR de livros, onde S ´e uma colec¸ ˜ao de livros, cada exemplar pode ser representado por diferentes caracter´ısticas ou atributos como t´ıtulo, descric¸ ˜ao, formato, editora, etc.

O principal problema em um SR, deve-se ao fato de que a utilidade u n ˜ao ´e definida em todo o espac¸o de C × S, mas sim em apenas um subconjunto dele. Ou seja, a utilidade baseia-se apenas em itens previamente classificados pelos usu ´arios, como um subconjunto de filmes j ´a vistos, por exemplo. Sendo assim, a utilidade u deve ser propagada para todo o espac¸o de C × S, atrav ´es da aplicac¸ ˜ao de m ´etodos de aprendizagem de m ´aquina, teoria da aproximac¸ ˜ao e/ou heur´ısticas (ADOMAVICIUS; TUZHILIN, 2005).

De maneira geral, em um SR as recomendac¸ ˜oes s ˜ao realizadas tomando-se por base caracter´ısticas relevantes ao escopo do sistema (ZAINA, 2010). Consequen-temente, os m ´etodos utilizados na implementac¸ ˜ao e sua interface gr ´afica, tamb ´em

(23)

devem ser desenvolvidos de forma personalizada. Dessa forma, deve-se conside-rar os itens a serem recomendados para geconside-rar recomendac¸ ˜oes ´uteis e eficazes aos usu ´arios (RICCI et al., 2010). Nesse contexto, os SR podem ser classificados de acordo com a abordagem de recomendac¸ ˜ao utilizada, constituindo tr ˆes categorias dis-tintas: recomendac¸ ˜ao baseada em conte ´udo, recomendac¸ ˜ao colaborativa e sistemas h´ıbridos, descritos a seguir.

2.3.1 Recomendac¸ ˜ao Baseada em Conte ´udo

A recomendac¸ ˜ao baseada em conte ´udo consiste em recomendar itens seme-lhantes `aqueles que um determinado usu ´ario gostou no passado (BALABANOVI´c; SHOHAM, 1997). Atrav ´es da an ´alise de descric¸ ˜oes de itens busca-se identificar aque-les de maior interesse para o usu ´ario.

A abordagem baseada em conte ´udo originou-se das pesquisas na ´area de recuperac¸ ˜ao da informac¸ ˜ao (CAZELLA; NUNES; REATEGUI, 2010). Embora neces-site de informac¸ ˜oes adicionais sobre os itens e as prefer ˆencias do usu ´ario, n ˜ao exige um grande n ´umero de usu ´arios ou hist ´orico de classificac¸ ˜oes, sendo poss´ıvel gerar recomendac¸ ˜oes mesmo se houver apenas um ´unico utilizador (JANNACH et al., 2010). Devido aos significativos avanc¸os realizados pelas comunidades de recuperac¸ ˜ao e filtragem da informac¸ ˜ao e, considerando a import ˆancia de v ´arias aplicac¸ ˜oes base-adas em texto, atualmente diversos sistemas baseados em conte ´udo s ˜ao focados na recomendac¸ ˜ao de itens que cont ´em informac¸ ˜oes textuais, como documentos, web-sites, mensagens e not´ıcias (ADOMAVICIUS; TUZHILIN, 2005). Segundo o mesmo autor, a melhoria associada `as tradicionais abordagens de recuperac¸ ˜ao da informac¸ ˜ao deu-se atrav ´es da utilizac¸ ˜ao do perfil do usu ´ario. Essa abordagem possibilitou realizar recomendac¸ ˜oes com base em informac¸ ˜oes relacionadas aos gostos, prefer ˆencias e necessidades do usu ´ario. As informac¸ ˜oes podem ser obtidas de duas formas:

• Implicitamente - com base na an ´alise de comportamento, como uma pesquisa realizada em busca de algum item, padr ˜oes de navegac¸ ˜ao ou itens que o usu ´ario j ´a adquiriu, por exemplo.

• Explicitamente - atrav ´es de question ´arios ou atribuic¸ ˜ao de notas associadas aos itens recomendados.

Sistemas de Recomendac¸ ˜ao baseados em conte ´udo geralmente s ˜ao constitu´ıdos de m ´etodos (PAZZANI; BILLSUS, 2007):

• para descric¸ ˜ao dos itens a serem recomendados;

• para a criac¸ ˜ao de um perfil do usu ´ario que representa os itens que s ˜ao de seu interesse;

(24)

• para a comparac¸ ˜ao entre os itens e o perfil do usu ´ario a fim de determinar o que deve ser recomendado.

De maneira formal, a utilidade u(c, s) do item s para o usu ´ario c ´e estimada com base na utilidade u(c, si)atribu´ıda pelo usu ´ario c `a items si ∈ S que s ˜ao similares ao item

s(ADOMAVICIUS; TUZHILIN, 2005).

Assim, considerando Content(s) o perfil de um item, ou seja, um conjunto de atributos que caracterizam o item s, este valor ´e utilizado para determinar a im-port ˆancia do item para fins de recomendac¸ ˜ao, calculado de forma geral atrav ´es da avaliac¸ ˜ao de um conjunto de caracter´ısticas do item s. A partir da obtenc¸ ˜ao do perfil do usu ´ario, associado aos itens de sua prefer ˆencia, o item ou conjunto de itens, cujo perfil Content(s) melhor atende `as suas necessidades ´e utilizado na recomendac¸ ˜ao. Uma t ´ecnica bastante utilizada em SR baseados em conte ´udo ´e a indexac¸ ˜ao de frequ ˆencia de termos. Nessa abordagem, informac¸ ˜oes relacionadas aos documentos e necessidades dos usu ´arios s ˜ao descritas na forma de vetores com uma dimens ˜ao para cada ocorr ˆencia de uma palavra na base de dados (CAZELLA; NUNES; REATE-GUI, 2010).

Uma das medidas mais conhecidas para especificar pesos de palavras-chave em recuperac¸ ˜ao da informac¸ ˜ao ´e a medida TF-IDF (Term Frequency - Inverse Document Frequency), que pode ser representada da seguinte maneira:

Supondo que N ´e o n ´umero total de documentos que podem ser recomendados para os usu ´arios e que a palavra ki aparece em ni documentos.

Considerando que fi,j ´e o n ´umero de vezes em que a palavra ki aparece no

docu-mento dj. Ent ˜ao T Fi,j, a frequ ˆencia do termo (ou frequ ˆencia normalizada) da palavra

ki no documento dj, pode ser definida como:

T Fi,j =

fi,j

maxzfz,j

(2) onde o m ´aximo ´e calculado sobre a frequ ˆencia fz,j de todas as palavras kz que

aparecem no documento dj.

Entretanto, palavras que aparecem em muitos documentos n ˜ao s ˜ao ´uteis na distinc¸ ˜ao de relev ˆancia entre um documento e outro. Dado esse fato, a medida de frequ ˆencia inversa do documento (IDFi) ´e muitas vezes utilizada em combinac¸ ˜ao

com a frequ ˆencia simples do termo (T Fi,j). A medida de frequ ˆencia inversa para a

palavra ki pode ser definida como:

IDFi = log

N ni

(3)

Assim, o peso TF-IDF para a palavra ki no documento dj pode ser definido da

(25)

wi,j = T Fi,j × IDFi (4)

O conte ´udo do documento dj pode ser definido como:

Content(dj) = (w1j, . . . wkj)

A frequ ˆencia que uma determinada palavra ocorre em um documento ou em uma consulta realizada pelo usu ´ario, corresponde a um componente do vetor. Dessa forma, os vetores de documentos mais relevantes para o usu ´ario s ˜ao aqueles mais pr ´oximos aos vetores de consulta.

A definic¸ ˜ao de similaridade pode ser formalizada estabelecendo

ContentBasedP rof ile(c) como sendo o perfil do usu ´ario c, que pode ser

obtido atrav ´es da an ´alise de conte ´udo dos itens previamente avaliados pelo usu ´ario. ContentBasedP rof ile(c) pode ser definido como um vetor de pesos (wc1, . . . , wcj)onde cada peso wci denota a import ˆancia do termo ki para o usu ´ario

cutilizando-se a medida TF-IDF.

Em sistemas baseados em conte ´udo a func¸ ˜ao utilidade u(c, s) ´e geralmente defi-nida conforme a Equac¸ ˜ao 5 (ADOMAVICIUS; TUZHILIN, 2005):

u(c, s) = score(ContentBasedP rof ile(c), Content(s)) (5)

A representac¸ ˜ao na forma de vetores (TF-IDF) de pesos e termos ~wc e ~ws pode

ser adotada tanto para ContentBasedP rof ile(c) como para Content(s). Do mesmo modo, a func¸ ˜ao utilidade u(c, s) geralmente ´e representada na literatura de recuperac¸ ˜ao de informac¸ ˜ao por algum tipo de pontuac¸ ˜ao heur´ıstica sobre vetores ~wc

e ~ws, como por exemplo, a medida de similaridade do cosseno, representada na

Equac¸ ˜ao 6, onde K ´e o n ´umero total de palavras no sistema:

u(c, s) = cos( ~wc, ~ws) = ~ wc. ~ws || ~wc||2 × || ~ws||2 = PK

i=1wi,cwi,s

q PK i=1w 2 i,c q PK i=1w 2 i,s (6)

Assim, o c ´alculo da medida de similaridade do cosseno pode ser obtido consi-derando o cosseno do ˆangulo formado pelos vetores que representam os documen-tos (termos e frequ ˆencias). A descric¸ ˜ao de interesses do usu ´ario ocorre atrav ´es da aquisic¸ ˜ao de informac¸ ˜oes fornecidas pelo pr ´oprio usu ´ario ou por meio de ac¸ ˜oes, como aquisic¸ ˜ao, visualizac¸ ˜ao e selec¸ ˜ao de itens (CAZELLA; NUNES; REATEGUI, 2010).

Um exemplo adotado por ADOMAVICIUS; TUZHILIN (2005) aborda o perfil de um usu ´ario cuja caracter´ıstica principal ´e a leitura de artigos online relacionados ao tema bioinform ´atica. T ´ecnicas de recomendac¸ ˜ao baseadas em conte ´udo podem

(26)

recomen-dar outros artigos relacionados ao tema bioinform ´atica para o usu ´ario c. Uma vez que estes artigos ter ˜ao mais termos relacionados ao tema bioinform ´atica (por exem-plo genoma, sequenciac¸ ˜ao, prote ˆomica) do que os artigos sobre outros assuntos, ContentBasedP rof ile(c), conforme definido pelo vetor ~wc, ir ´a representar tais

ter-mos ki com pesos elevados wic. Consequentemente, um SR utilizando o cosseno ou

uma medida de similaridade relacionada atribuir ´a maior utilidade u(c, s) `a artigos que

tem termos em ~ws com maior peso ponderado e menor utilidade `aqueles em que o

termo bioinform ´atica possui um peso menor.

Dada a necessidade de estabelecer uma similaridade entre os itens, como no exemplo acima descrito, a filtragem baseada em conte ´udo tende a ser indicada para a recomendac¸ ˜ao de itens textuais, como artigos ou documentos, onde a an ´alise de termos em comum ´e mais facilmente executada.

Com base na an ´alise dos trabalhos de SHARDANAND; MAES (1995) e BALA-BANOVI´c; SHOHAM (1997), ADOMAVICIUS; TUZHILIN (2005) destaca as seguintes limitac¸ ˜oes associadas aos SR baseados em conte ´udo:

An ´alise de conte ´udo limitada: Abordagens baseadas em conte ´udo s ˜ao

limita-das pelos recursos explicitamente associados aos objetos a serem recomenda-dos. Conte ´udo multim´ıdia, por exemplo, como imagens gr ´aficas, ´audio e v´ıdeo s ˜ao dif´ıceis de serem analisados de forma autom ´atica. Da mesma forma, a recomendac¸ ˜ao de itens como roupas ou brinquedos tamb ´em poderia ser rea-lizada atrav ´es desta abordagem. Entretanto, ´e necess ´ario identificar atributos associados aos objetos, como peso, prec¸o, marca, entre outros, o que na pr ´atica pode ser trabalhoso ou dificultado pela limitac¸ ˜ao de recursos.

Documentos baseados em texto s ˜ao mais f ´aceis de serem analisados, por ´em, dois itens distintos que s ˜ao representados pelo mesmo conjunto de carac-ter´ısticas ou palavras-chave n ˜ao podem ser distinguidos pelo sistema, como por exemplo, um artigo bem escrito e um mal escrito que utilizam os mesmos termos. • Super especializac¸ ˜ao: Considerando que SR baseados em conte ´udo tendem

a recomendar itens que o usu ´ario gostou ou avaliou positivamente no passado, o usu ´ario est ´a limitado a receber apenas recomendac¸ ˜oes semelhantes `aquelas que j ´a foram classificadas e possuem uma pontuac¸ ˜ao elevada em relac¸ ˜ao ao seu perfil. Outro problema a ser considerado ´e que, dependendo do contexto de aplicac¸ ˜ao, a recomendac¸ ˜ao de itens muito semelhantes aos que o usu ´ario j ´a visualizou pode n ˜ao ser positiva, como uma not´ıcia diferente descrevendo o mesmo evento, por exemplo.

Para ADOMAVICIUS; TUZHILIN (2005) uma caracter´ıstica desej ´avel em um SR ´e a diversidade de recomendac¸ ˜oes, ou seja, o sistema deve ser capaz de

(27)

apresentar uma variedade de opc¸ ˜oes ao usu ´ario, n ˜ao apenas um conjunto ho-mog ˆeneo de alternativas.

Problema do novo usu ´ario: Tendo em vista a necessidade de conhecer as

prefer ˆencias do usu ´ario, para que a recomendac¸ ˜ao seja realizada de forma confi ´avel, um SR baseado em conte ´udo necessita que os itens a serem re-comendados possuam um certo n ´umero de classificac¸ ˜oes. Portanto, um novo usu ´ario, com poucas ou nenhuma avaliac¸ ˜ao sobre os itens, provavelmente n ˜ao receber ´a recomendac¸ ˜oes precisas.

2.3.2 Recomendac¸ ˜ao Colaborativa

A recomendac¸ ˜ao colaborativa foi desenvolvida para complementar a

recomendac¸ ˜ao baseada em conte ´udo (BALABANOVI´c; SHOHAM, 1997). Seu

diferencial ´e caracterizado pelo fato de n ˜ao estar ligada `as caracter´ısticas do objeto, ou seja, compreender ou reconhecer o conte ´udo dos itens, torna-se dispens ´avel (CAZELLA; NUNES; REATEGUI, 2010).

Ao contr ´ario dos m ´etodos de recomendac¸ ˜ao com base em conte ´udo, SR colabo-rativos tentam prever a utilidade de itens para um determinado usu ´ario. Para tanto, deve-se tomar por base itens previamente avaliados por outros usu ´arios. O sistema reconhece semelhanc¸as entre os usu ´arios a partir de um conjunto de avaliac¸ ˜oes ou recomendac¸ ˜oes de objetos, gerando novas recomendac¸ ˜oes baseadas neste relacio-namento (BURKE, 2002). Para CAZELLA; NUNES; REATEGUI (2010) a ideia principal consiste em explorar a troca de experi ˆencias entre pessoas que possuem interesses em comum. Esta t ´ecnica permite lidar com qualquer tipo de conte ´udo, n ˜ao apenas aqueles observados no passado. Ela possibilita que os itens sejam avaliados por diferentes usu ´arios, o que pode melhorar o desempenho do sistema em relac¸ ˜ao ao processo de recomendac¸ ˜ao (BALABANOVI´c; SHOHAM, 1997).

Sistemas de recomendac¸ ˜ao colaborativos geram previs ˜oes ou recomendac¸ ˜oes

para um determinado usu ´ario de um ou mais itens. De maneira formal, a

recomendac¸ ˜ao colaborativa pode ser representada da seguinte maneira (ADOMAVI-CIUS; TUZHILIN, 2005):

a utilidade u(cj, s)do item s para o usu ´ario c ´e estimada com base na utilidade

u(cj, s)por aqueles usu ´arios cj ∈ C que s ˜ao semelhantes ao usu ´ario c.

O termo usu ´ario pode ser atribu´ıdo `a qualquer pessoa respons ´avel pelo

pro-vimento de classificac¸ ˜oes para um sistema. Geralmente este termo ´e utilizado

para referenciar pessoas que utilizam um sistema para receber informac¸ ˜oes, como recomendac¸ ˜oes, por exemplo. Entretanto pode referir-se tamb ´em `aqueles que forne-cem dados (classificac¸ ˜oes) utilizados na produc¸ ˜ao de informac¸ ˜oes.

(28)

O termo item refere-se a qualquer coisa para a qual um ser humano pode atri-buir uma classificac¸ ˜ao, como livros, CDs, artigos de jornal ou destinos de f ´erias. As classificac¸ ˜oes por sua vez, podem assumir diferentes formas (SCHAFER et al., 2007): • Classificac¸ ˜oes escalares - podem ser classificac¸ ˜oes num ´ericas, como as 5

es-trelas previstas no MovieLens ou classificac¸ ˜oes ordinais, como concordo, neutro, discordo, discordo totalmente.

Classificac¸ ˜oes Bin ´arias - modelo de classificac¸ ˜oes com opc¸ ˜oes entre

concor-dam/discordam ou bom/ruim.

Classificac¸ ˜oes Un ´arias - pode indicar que um usu ´ario tenha observado ou

com-prado um item, ou n ˜ao avaliou o item de forma positiva.

Assim, a tarefa principal consiste na previs ˜ao de utilidade de um item para um determinado usu ´ario. Esta previs ˜ao d ´a-se atrav ´es da utilizac¸ ˜ao de uma base de dados, constitu´ıda a partir de avaliac¸ ˜oes de uma amostra ou populac¸ ˜ao de outros usu ´arios.

A aus ˆencia de uma classificac¸ ˜ao indica que n ˜ao se tem informac¸ ˜oes sobre o usu ´ario para o item. Sendo assim, o usu ´ario deve atribuir uma pontuac¸ ˜ao para cada item experimentado de forma a classific ´a-lo em um conjunto de itens de seu interesse. Esta pontuac¸ ˜ao pode ser atribu´ıda de forma expl´ıcita ou impl´ıcita (BREESE; HECKER-MAN; KADIE, 1998):

Expl´ıcita - ocorre atrav ´es da interac¸ ˜ao direta do usu ´ario com o sistema. O

usu ´ario expressa sua prefer ˆencia por um item, geralmente atrav ´es de uma es-cala num ´erica discreta, como a classificac¸ ˜ao de um filme como bom ou ruim em uma escala de um a cinco, por exemplo.

Impl´ıcita - d ´a-se atrav ´es da interpretac¸ ˜ao de comportamento, ou selec¸ ˜oes do

usu ´ario para imputar um voto ou prefer ˆencia. Para tanto, pode basear-se em dados de navegac¸ ˜ao, hist ´orico de compras, entre outros tipos de padr ˜oes de acesso `a informac¸ ˜ao. O sistema infere prefer ˆencias do usu ´ario a partir de suas ac¸ ˜oes, n ˜ao sendo exigido que o mesmo avalie de forma expl´ıcita o item.

O sistema de recomendac¸ ˜ao de filmes MovieLens (GOOD et al., 1999) ´e um exem-plo de aplicac¸ ˜ao baseado em filtragem colaborativa. A partir de pontuac¸ ˜oes atribu´ıdas `a filmes j ´a assistidos, o sistema encontra usu ´arios com gostos semelhantes para re-comendar filmes que ainda n ˜ao tenham visto.

Um usu ´ario do MovieLens atribui classificac¸ ˜oes `a filmes atrav ´es de uma pontuac¸ ˜ao que varia de uma (1) a cinco (5) estrelas, onde uma (1) significa que o filme ´e muito ruim e cinco (5) ´e a melhor classificac¸ ˜ao atribu´ıda, indicando que o usu ´ario gostou e recomenda o filme. Em seguida o sistema utiliza as classificac¸ ˜oes para recomendar

(29)

outros filmes que podem ser de interesse do usu ´ario, ou ainda, para realizar previs ˜oes acerca de como o usu ´ario poderia avaliar outros filmes.

A classificac¸ ˜ao consiste na associac¸ ˜ao entre os usu ´arios e os itens, geralmente por meio de algum valor. Uma maneira de visualizar classificac¸ ˜oes ´e como uma ma-triz. Esta matriz pode ser representada por uma tabela onde cada linha representa um usu ´ario, cada coluna representa um filme espec´ıfico e o valor na intersecc¸ ˜ao de uma linha e uma coluna representa o valor de classificac¸ ˜ao atribu´ıdo pelo usu ´ario. A aus ˆencia de uma pontuac¸ ˜ao de classificac¸ ˜ao nesta intersec¸ ˜ao significa que o usu ´ario ainda n ˜ao avaliou o item (SCHAFER et al., 2007).

A Tabela 1 reproduz de forma pr ´atica o funcionamento da filtragem colaborativa. Neste exemplo, para recomendar um filme ao usu ´ario seis (6), deve-se procurar outros usu ´arios com prefer ˆencias semelhantes. Neste caso, os usu ´arios um (1) e dois (2) j ´a assistiram filmes que o usu ´ario seis (6) tamb ´em assistiu (Filme 2). Portanto, pode-se recomendar ao usu ´ario seis (6) filmes que estes dois outros usu ´arios j ´a assistiram, mas que o usu ´ario seis (6) ainda n ˜ao assistiu, como os Filmes 1 e 5.

A decis ˜ao sobre a recomendac¸ ˜ao destes itens deve ainda basear-se no hist ´orico de avaliac¸ ˜oes comuns e o valor de predic¸ ˜ao calculado a partir das classificac¸ ˜oes atribu´ıdas pelos usu ´arios.

Tabela 1: Recomendac¸ ˜ao baseada em filtragem colaborativa

Usu ´ario Filme 1 Filme 2 Filme 3 Filme 4 Filme 5 Filme 6

1 x R(x) 2 R(x) x 3 x x x 4 x 5 x x 6 ? x ?

Fonte: Adaptada de CAZELLA; NUNES; REATEGUI (2010)

A t ´ecnica de filtragem colaborativa pode ser definida em tr ˆes passos, descritos conforme a seguir, segundo a vis ˜ao de (CAZELLA; NUNES; REATEGUI, 2010):

• Calcular o peso de cada usu ´ario em relac¸ ˜ao `a similaridade ao usu ´ario alvo (m ´etrica de similaridade).

• Classificar um subconjunto de usu ´arios com maior similaridade (vizinhos) para utilizar na predic¸ ˜ao.

• Normalizar as avaliac¸ ˜oes e computar as predic¸ ˜oes ponderando as avaliac¸ ˜oes dos vizinhos com seus pesos.

(30)

A definic¸ ˜ao da similaridade pode ser obtida atrav ´es da aplicac¸ ˜ao de diferentes coe-ficientes de similaridade como Coseno, Pearson, entre outros. A Equac¸ ˜ao 7 apresenta o coeficiente de correlac¸ ˜ao de Pearson (amplamente abordado na literatura sobre SR) e adotado tamb ´em pelo GroupLens (RESNICK et al., 1994), um dos primeiros siste-mas de filtragem colaborativa:

coorab = P i(rai − ra)(rbi− rb) pP i(rai − ra)2 P i(rbi− rb)2 (7) Onde:

• coorab ´e a correlac¸ ˜ao do usu ´ario alvo a com um dado usu ´ario b;

• rai ´e a avaliac¸ ˜ao que o usu ´ario ativo a atribuiu para o item i;

• rbi ´e a avaliac¸ ˜ao que o usu ´ario ativo b atribuiu para o item i;

• ra ´e a m ´edia de avaliac¸ ˜oes do usu ´ario ativo a, em comum com o usu ´ario b;

• rb ´e a m ´edia de avaliac¸ ˜oes do usu ´ario ativo b, em comum com o usu ´ario a.

Segundo CAZELLA; NUNES; REATEGUI (2010) ´e preciso mais de uma avaliac¸ ˜ao em comum para que o ´ındice seja ´util, com resultados variando entre um (1) para similaridade total, e menos um (-1) para total dissimilaridade.

A predic¸ ˜ao ´e calculada independentemente do coeficiente empregado para o c ´alculo de similaridade. D ´a-se atrav ´es de uma m ´edia ponderada das avaliac¸ ˜oes dos vizinhos que apresentaram um coeficiente de similaridade aceit ´avel, tomando-se por base o limiar adotado. A equac¸ ˜ao a seguir apresenta o c ´alculo da predic¸ ˜ao segundo a vis ˜ao do mesmo autor:

pai = ra + Pn b=1(rbi− rb) ∗ coorab Pn b=1|coorab| (8) Onde:

• coorab ´e a correlac¸ ˜ao do usu ´ario alvo a com um determinado usu ´ario b;

• pai ´e a predic¸ ˜ao de um item i para um usu ´ario alvo a;

• ra ´e a m ´edia de avaliac¸ ˜oes do usu ´ario alvo a aos itens que foram pontuados por

todos os seus usu ´arios similares;

• rbi ´e a avaliac¸ ˜ao que o usu ´ario alvo b atribuiu para o item i;

(31)

O algoritmo de filtragem colaborativa mais conhecido e que faz uso das t ´ecnicas acima descritas ´e o algoritmo do vizinho mais pr ´oximo, que pode ser dividido em duas classes ou abordagens distintas: baseado em usu ´ario e baseado em item (SCHAFER et al., 2007).

Baseado em usu ´ario: Gera recomendac¸ ˜oes para um determinado usu ´ario com

base em avaliac¸ ˜oes de usu ´arios semelhantes. Se um usu ´ario n ´e semelhante a um usu ´ario u, dize-se que n ´e um vizinho de u.

Baseado em item: Gera recomendac¸ ˜oes com base na similaridade entre os

itens. A previs ˜ao para um item deve ser baseada em avaliac¸ ˜oes de um usu ´ario para itens semelhantes.

A principal vantagem associada `a utilizac¸ ˜ao da filtragem colaborativa ´e a possibilidade de apresentar aos usu ´arios recomendac¸ ˜oes inesperadas, ou seja, recomendac¸ ˜oes de itens que n ˜ao foram ativamente pesquisados. Al ´em disso, pro-porciona a formac¸ ˜ao de comunidades de usu ´arios atrav ´es da an ´alise de similaridade entre seu gostos e interesses (CAZELLA; NUNES; REATEGUI, 2010).

Apesar das vantagens anteriormente citadas, em sistemas colaborativos, uma quest ˜ao importante a ser observada ´e a coleta de informac¸ ˜oes dos usu ´arios, que pode apresentar as seguintes limitac¸ ˜oes (ADOMAVICIUS; TUZHILIN, 2005):

Problema do novo item: Sistemas colaborativos geram recomendac¸ ˜oes

basea-dos nas prefer ˆencias basea-dos usu ´arios. Deste modo, at ´e que um novo item tenha um n ´umero significativo de avaliac¸ ˜oes, o sistema n ˜ao ser ´a capaz de recomend ´a-lo de forma eficiente.

Problema de pontuac¸ ˜oes esparsas: d ´a-se quando o n ´umero de avaliac¸ ˜oes ´e

muito inferior em relac¸ ˜ao ao n ´umero de classificac¸ ˜oes necess ´arias. Al ´em disso, para o usu ´ario com gostos incomuns em comparac¸ ˜ao ao resto da populac¸ ˜ao, n ˜ao existir ´a outros usu ´arios com gostos semelhantes, levando `a recomendac¸ ˜oes pobres.

Problema do novo usu ´ario: Assim como em sistemas baseados em conte ´udo,

para fazer recomendac¸ ˜oes precisas, o sistema depende de avaliac¸ ˜oes pr ´evias para aprender as prefer ˆencias do usu ´ario. A maioria das t ´ecnicas utilizadas para contornar este problema utiliza a abordagem h´ıbrida, combinando a filtragem baseada em conte ´udo e a filtragem colaborativa.

2.3.3 Recomendac¸ ˜ao H´ıbrida

Um sistema h´ıbrido baseia-se na combinac¸ ˜ao de t ´ecnicas de recomendac¸ ˜ao, obje-tivando suprir limitac¸ ˜oes particularmente associadas a cada t ´ecnica (RICCI; ROKACH; SHAPIRA, 2011), (ADOMAVICIUS; TUZHILIN, 2005).

(32)

A combinac¸ ˜ao de t ´ecnicas para otimizac¸ ˜ao de resultados n ˜ao ´e algo novo. BURKE (2002) j ´a atentava para o fato de que as t ´ecnicas de recomendac¸ ˜ao conhecidas possu´ıam pontos fortes e fracos. Desta forma, sua combinac¸ ˜ao de diferentes ma-neiras, constitui em uma abordagem bastante utilizada por muitos pesquisadores na tentativa de otimizar o processo de recomendac¸ ˜ao.

As diferentes formas de combinar m ´etodos colaborativos e baseados em conte ´udo em um SR H´ıbrido podem ser classificadas da seguinte forma segundo ADOMAVI-CIUS; TUZHILIN (2005):

Implementac¸ ˜ao de m ´etodos de colaborac¸ ˜ao e baseados em conte ´udo se-paradamente, combinando suas previs ˜oes: Consiste na combinac¸ ˜ao de

recomendac¸ ˜oes, adquiridas a partir de SR individuais, em uma recomendac¸ ˜ao final. A principal vantagem na utilizac¸ ˜ao desta abordagem ´e a possibilidade de realizar ajustes em ambas as t ´ecnicas de forma separada, beneficiando a recomendac¸ ˜ao final (CLAYPOOL et al., 1999). Outra forma, seria avaliar as recomendac¸ ˜oes com base em alguma m ´etrica de qualidade ou, de maneira in-dividual, utilizando a que melhor atende `as necessidades do usu ´ario (TRAN; COHEN, 2000).

Incorporando algumas caracter´ısticas baseadas em conte ´udo em uma abordagem colaborativa: Nesta abordagem, diferente de uma abordagem

pu-ramente colaborativa, baseada em classificac¸ ˜oes feitas pelo usu ´ario, o vetor de recomendac¸ ˜oes ´e aumentado tomando-se por base tamb ´em o perfil do usu ´ario (BALABANOVI´c; SHOHAM, 1997). Assim, utiliza-se tamb ´em o hist ´orico relacio-nado aos itens de sua prefer ˆencia, e n ˜ao apenas as classificac¸ ˜oes, para calcular a similaridade entre dois usu ´arios.

Incorporando algumas caracter´ısticas colaborativas em uma abordagem baseada em conte ´udo: Consiste na utilizac¸ ˜ao de t ´ecnicas para reduc¸ ˜ao de

dimensionalidade em um grupo de perfis com base em conte ´udo. Um exem-plo pode ser visto em (SOBOROFF; NICHOLAS, 1999), que utiliza a indexac¸ ˜ao sem ˆantica latente para criar uma vis ˜ao colaborativa de uma colec¸ ˜ao de perfis do usu ´ario.

Construc¸ ˜ao de um modelo unificador geral que incorpora tanto carac-ter´ısticas baseadas em conte ´udo e colaborativas: Esta abordagem

su-gere a utilizac¸ ˜ao de caracter´ısticas peculiares `a cada t ´ecnica, combinando recomendac¸ ˜oes colaborativas e baseadas em conte ´udo em ´unico recomenda-dor baseado em regras, (BASU et al., 1998). A recomendac¸ ˜ao propriamente dita, d ´a-se atrav ´es da utilizac¸ ˜ao de alguma heur´ıstica ou regra probabil´ıstica

(33)

(AN-SARI; ESSEGAIER; KOHLI, 2000; POPESCUL; PENNOCK; LAWRENCE, 2001; SCHEIN et al., 2002).

2.4

Intelig ˆencia de Enxames

O termo intelig ˆencia de enxames surgiu no final de 1980 como refer ˆencia `a siste-mas rob ´oticos celulares nos quais um conjunto de agentes simples em um determi-nado ambiente interagem com base em regras locais (CASTRO, 2007). Atualmente, diversas abordagens t ˆem sido propostas atrav ´es da modelagem de comportamento de enxames de animais e insetos como formigas, cupins, abelhas, p ´assaros e peixes. A Intelig ˆencia de Enxames (SI) ´e uma t ´ecnica para o desenvolvimento de algo-ritmos de otimizac¸ ˜ao projetados com base no comportamento coletivo e na

auto-organizac¸ ˜ao dos insetos sociais (BONABEAU; DORIGO; THERAULAZ, 1999). O

termo enxame ´e utilizado para designar um grupo de animais, tais como um cardume de peixes, um bando de p ´assaros ou col ˆonias de insetos, como formigas, cupins, abe-lhas, entre outros, que executam comportamento coletivo.

A auto-organizac¸ ˜ao pode ser caracterizada como um agrupamento din ˆamico de regras, cujas respostas `as interac¸ ˜oes de baixo n´ıvel de seus elementos menos com-plexos, resultam em padr ˜oes complexos em um n´ıvel global (BOFFO; FERREIRA JR; BAZZAN, 2007). A aplicac¸ ˜ao destas regras deve tomar por base apenas informac¸ ˜oes locais, sem demais refer ˆencias para o n´ıvel global ou macrosc ´opico (FERREIRA JR; BOFFO; BAZZAN, 2007). Esta emerg ˆencia de novos padr ˜oes, sem supervis ˜ao, ´e a caracter´ıstica fundamental de sistemas complexos.

A auto-organizac¸ ˜ao consiste em quatro princ´ıpios b ´asicos (BONABEAU; DORIGO; THERAULAZ, 1999)

1. Feedback positivo - s ˜ao regras comportamentais capazes de promover a

criac¸ ˜ao de estruturas. Recrutamento e reforc¸o tais como assentamentos de tri-lhas a seguir (caracter´ısticos de algumas esp ´ecies de formigas), ou danc¸as (em abelhas) podem ser mostrados como exemplos de respostas positivas.

2. Feedback negativo - Utilizado para contrabalanc¸ar o feedback positivo. Ajuda a

estabilizar o padr ˜ao coletivo, podendo assumir a forma de saturac¸ ˜ao, exaust ˜ao, ou competic¸ ˜ao. Tomando-se o forrageamento como exemplo, o feedback ne-gativo pode decorrer do n ´umero limitado de forrageiras dispon´ıveis, saciedade, aglomerac¸ ˜ao, concorr ˆencia, ou exaust ˜ao da fonte de alimentos.

3. Flutuac¸ ˜oes - A aleatoriedade al ´em de proporcionar o surgimento de estruturas

emergentes, ´e muitas vezes considerada crucial. Assim como permitem a des-coberta de novas soluc¸ ˜oes, as flutuac¸ ˜oes, tais como passeios aleat ´orios, erros ou altern ˆancia de tarefas aleat ´orias entre indiv´ıduos do enxame, s ˜ao vitais para

(34)

a criatividade e inovac¸ ˜ao. Elas podem atuar como sementes das quais as es-truturas de n ´ucleos emergem. Como exemplo, podemos citar forrageiras que se perdem em uma col ˆonia e encontram novas fontes de alimentos ainda n ˜ao exploradas.

4. Variedade de interac¸ ˜oes - A variedade de interac¸ ˜oes ´e fundamental para a

auto-organizac¸ ˜ao. Os agentes devem ser capazes de fazer uso de suas pr ´oprias informac¸ ˜oes, bem como de informac¸ ˜oes provenientes de outros agentes. Dessa forma, as informac¸ ˜oes e os dados poder ˜ao ser propagados pela col ˆonia.

Os agentes em um enxame se comportam sem supervis ˜ao e cada um deles tem um comportamento estoc ´astico relacionado `a sua percepc¸ ˜ao do ambiente (KARA-BOGA; AKAY, 2009). Uma col ˆonia de insetos, por exemplo, com centenas de milhares de membros, opera sem qualquer coordenac¸ ˜ao expl´ıcita. Um agente possui apenas informac¸ ˜ao local simples, sendo incapaz de avaliar as necessidades da col ˆonia.

A principal caracter´ıstica do comportamento emergente ´e a plasticidade na divis ˜ao do trabalho dentro da col ˆonia (ROBINSON, 1992). O ambiente e seus recursos s ˜ao utilizados de maneira eficaz atrav ´es do uso da intelig ˆencia coletiva, respondendo `as mudanc¸as de condic¸ ˜oes internas e externas.

As caracter´ısticas principais que comp ˜oem um sistema de intelig ˆencia de enxame s ˜ao (MILLONAS, 1994):

Proximidade - deve haver interac¸ ˜ao entre os agentes do enxame;

Qualidade - os agentes devem ser capazes de avaliar seus comportamentos,

respondendo a fatores de qualidade no ambiente, tais como seguranc¸a local ou qualidade de produtos alimentares;

Diversidade - permite ao sistema reagir a situac¸ ˜oes inesperadas, utilizando seus

recursos de maneira adequada;

Estabilidade - o comportamento de um agente n ˜ao deve mudar a cada flutuac¸ ˜ao

do ambiente;

Adaptabilidade - capacidade de adequac¸ ˜ao a variac¸ ˜oes ambientais, alterando

seu comportamento quando a economia ou o investimento de energia for conve-niente.

Entre as abordagens mais populares em intelig ˆencia de enxames, pode-se desta-car o algoritmo de otimizac¸ ˜ao por col ˆonias de formigas, descrito na sec¸ ˜ao a seguir.

(35)

2.4.1 Otimizac¸ ˜ao por Col ˆonia de Formigas

Apesar da simplicidade de seus agentes, col ˆonias de formigas, assim como ou-tros grupos de insetos sociais, constituem sistemas distribu´ıdos que apresentam uma organizac¸ ˜ao altamente estruturada (DORIGO; DI CARO; GAMBARDELLA, 1999). Essa organizac¸ ˜ao emergente do comportamento coletivo resulta na realizac¸ ˜ao de tarefas complexas que na maioria das vezes n ˜ao poderiam ser executadas por um ´unico agente. Como exemplo, podemos observar o alto n´ıvel de estruturac¸ ˜ao que uma col ˆonia de formigas pode atingir.

Outro comportamento a ser observado ´e o forrageamento. Particularmente a forma como as formigas encontram o caminho mais curto entre seu ninho e a fonte de ali-mentos. Tal caracter´ıstica est ´a relacionada ao conceito de estigmergia - uma forma de comunicac¸ ˜ao indireta, utilizada por insetos sociais para coordenar suas atividades DORIGO; BONABEAU; THERAULAZ (2000).

Estigmergia foi o termo adotado por GRASS ´E (1959) para definir o est´ımulo dos agentes atrav ´es da performance alcanc¸ada. Ele observou que os insetos s ˜ao capazes de responder aos chamados est´ımulos significativos, que ativam uma reac¸ ˜ao geneti-camente codificada (GRASS ´E, 1946). Em insetos sociais como cupins e formigas os efeitos dessas reac¸ ˜oes podem atuar como novos est´ımulos, tanto para o agente que os produziu, como para outros indiv´ıduos da col ˆonia.

A estigmergia possui duas caracter´ıstica principais (DORIGO; BIRATTARI; ST ¨UTZLE, 2006):

• ´E uma forma indireta, n ˜ao-simb ´olica de comunicac¸ ˜ao, mediada pelo ambiente: insetos trocam informac¸ ˜oes modificando seu meio ambiente;

• As informac¸ ˜oes s ˜ao locais: elas s ´o pode ser acessadas por aqueles agentes que visitam o local em que a informac¸ ˜ao est ´a dispon´ıvel (ou sua vizinhanc¸a imediata). O princ´ıpio b ´asico da estigmergia pode ser descrito como um rastro no ambiente deixado pelo agente durante a realizac¸ ˜ao de alguma tarefa. Esse rastro torna-se um est´ımulo para a realizac¸ ˜ao de tarefas subsequentes, tanto para o agente que o deixou quanto para outros agentes da col ˆonia. Esta mediac¸ ˜ao atrav ´es do ambiente garante que as tarefas sejam executadas de forma ordenada, sem qualquer tipo de controle, planejamento, ou interac¸ ˜ao direta entre os agentes (HEYLIGHEN, 2011). Nesse con-texto, uma classe de mecanismos estigm ´ergicos, particularmente, os chamados algo-ritmos de otimizac¸ ˜ao por col ˆonia de formigas, vem sendo amplamente explorados na tentativa de encontrar soluc¸ ˜oes para uma variedade de problemas computacionais.

Em algoritmos de formigas os agentes s ˜ao denominados formigas artificiais. A coordenac¸ ˜ao entre os agentes ´e obtida atrav ´es da explorac¸ ˜ao do mecanismo de comunicac¸ ˜ao estigm ´ergico (DORIGO; BONABEAU; THERAULAZ, 2000).

Referências

Documentos relacionados

O DIRETOR DO LABORATÓRIO NACIONAL DE COMPUTAÇÃO CIENTÍFICA DO MINISTÉRIO DA CIÊNCIA, TECNOLOGIA, INOVAÇÕES E COMUNICAÇÕES, no uso da competência que lhe foi

Para analisar as Componentes de Gestão foram utilizadas questões referentes à forma como o visitante considera as condições da ilha no momento da realização do

O Documento Orientador da CGEB de 2014 ressalta a importância do Professor Coordenador e sua atuação como forma- dor dos professores e que, para isso, o tempo e

[r]

Statistical relationships between the variability of the area covered by double tropopause events (DTs), the strength of the tropical upwelling, the total column ozone and of the

Shojaie preparou e caracterizou uma série de filmes de híbridos de acetato de celulose (AC) com sílica preparada in situ pelo método sol-gel, usando TEOS como

Apesar da longa distância dos grandes centros urbanos do país, Bonito destaca- se, regionalmente, como uma área promissora dentro do Estado de Mato Grosso do Sul. Bonito,

45 Figure 18 - Study of the extract concentration in the phycobiliproteins extraction and purification using the mixture point composed of 10 wt% Tergitol 15-S-7 + 0.3