• Nenhum resultado encontrado

PROBLEMAS T´IPICOS EM SISTEMAS DE RECOMENDAC ¸ ˜ AO

Os desafios de recomenda¸c˜ao podem ser listados da seguinte ma- neira (KUNAVER; POˇZRL, 2017):

Esparsidade Trata-se de um problema comum a todos os sistemas de recomenda¸c˜ao: trabalhar com conjuntos de dados quase vazios, dado que n˜ao existe a possibilidade de obter avalia¸c˜ao de todos os usu´arios sobre todos os itens dispon´ıveis. Por outro lado, um SR perderia todo sentido se fosse poss´ıvel obter todas as avalia¸c˜oes de todos os usu´arios.

Partida a frio Este problema aparece com cada item ou usu´ario novo no sistema. Para cada item novo, o sistema n˜ao tem como ca- tegorizar ou dar algum tipo de meta-informa¸c˜ao j´a que n˜ao foi avaliado por nenhum usu´ario ainda. J´a para cada usu´ario novo, ao n˜ao se ter um perfil ou modelo para ele, somente pode-se fazer recomenda¸c˜oes gen´ericas.

Big-Data Pode ser encarado como o problema contr´ario ao problema de esparcidade, pois ao se ter sistemas com n´umeros muito gran- des, de at´e bilh˜oes de usu´arios e itens, precisam-se de estruturas de dados e algoritmos especializados para tratar essa informa¸c˜ao. Sobre Ajuste Acontece quando ´e gerado um perfil de interesses do usu´ario muito espec´ıficos e especializados. Uma das causas desse problema pode surgir quando o usu´ario tenta ajudar o sistema de recomenda¸c˜ao dando avalia¸c˜oes muito pontuais, com somente seus interesses, o que acaba limitando o espectro de poss´ıveis novas recomenda¸c˜oes.

3.3 M ´ETODOS DE AVALIAC¸ ˜AO DE SISTEMAS DE RECOMENDAC¸ ˜AO

(SHANI; GUNAWARDANA, 2011) prop˜oe trˆes maneiras de ava- lia¸c˜ao para SRs:

Off-line Um experimento off-line ´e realizado coletando dados de ava- lia¸c˜oes de itens pelos usu´arios. Com esses dados ´e poss´ıvel tentar simular o comportamento que seria demostrado ao interagir com o SR. Ao fazer isso, assume-se que estes dados de avalia¸c˜oes ser˜ao similares ao comportamento do usu´ario quando o sistema entrar em produ¸c˜ao. Este tipo de experimento ´e usado pelo seu baixo custo pois n˜ao requer intera¸c˜ao com usu´arios reais.

Testes com usu´arios Um teste com usu´arios ´e realizado recrutando um conjunto de sujeitos de pesquisa e solicitando que realizem v´arias tarefas que requerem intera¸c˜ao com o SR. Enquanto estes

sujeitos realizam as tarefas, seus comportamentos s˜ao observados e registrados, coletando uma medidas quantitativas, tais como a porcentagem de tarefas realizadas, acur´acia dos resultados, ou o tempo para realizar a tarefa. Tamb´em s˜ao feitas perguntas qualitativas antes, durante e depois os testes.

On-line Um experimento on-line visa obter a verdadeira medida do real ganho de valor que o sistema de recomenda¸c˜ao pode trazer. Normalmente ´e realizado pela an´alise de indicadores de desem- penho, e pode usar algumas t´ecnicas de experimenta¸c˜ao, como os testes AB, ou testes de divis˜ao em grupos de tratamento e controle.

3.3.1 Precis˜ao e Revoca¸c˜ao

(AL-BASHIRI et al., 2018) explica que tradicionalmente, sistemas de recomenda¸c˜ao utilizam as m´etricas precis˜ao e revoca¸c˜ao para medir a performance de SR.

A Precis˜ao pode ser determinada pela fra¸c˜ao de itens que foram ava- liados pelos usu´arios no conjunto de testes e que foram efetivamente recomendados pelo SR. Representa a raz˜ao entre os itens recomenda- dos relevantes com o total de itens recomendados pelo sistema. J´a a Revoca¸c˜ao representa a fra¸c˜ao dos itens relevantes que foram captu- rados. Para entender a defini¸c˜ao dessas m´etricas, o conhecimento dos seguintes termos ´e necess´ario:

VP ou Verdadeiro Positivo, que ´e o n´umero de itens interessantes ao usu´ario que s˜ao recomendadas.

FN ou Falso Negativo, que ´e o n´umero de itens interessantes ao usu´ario que n˜ao s˜ao recomendadas.

VN ou Verdadeiro Negativo, que ´e o n´umero de itens interessantes ao usu´ario que n˜ao s˜ao recomendadas.

FP ou Falso Positivo, que ´e o n´umero de itens n˜ao interessantes ao usu´ario que s˜ao recomendadas.

As defini¸c˜oes matem´aticas de ambas m´etricas se encontra a se- guir:

P recis˜ao = V P V P + F P

Revocac˜ao = V P V P + F N

(CRASWELL, 2009) apresenta tamb´em uma maneira de medir a precis˜ao de uma maneira mais adequada a conjuntos de dados grandes, que ´e a da Precis˜ao em n, onde os primeiros n documentos apresentados na recomenda¸c˜ao s˜ao considerados, esse valor de n pode ser escolhido em base a quantos itens s˜ao recomendados ao usu´ario. Considerando R todos os documentos relevantes e r os que foram obtidos na listagem final da recomenda¸c˜ao.

P recis˜ao em n = r n Revocac˜ao em n = r

R

Uma possibilidade ´e que em um cen´ario que n˜ao se tenham iden- tificado todos os itens relevantes, pode n˜ao ser vi´avel calcular o R.

(STECK, 2013) apresenta, por ´ultimo a m´etrica Mean Average Precision (ou MAP), que aponta como a mais adequada para SRs, isto por que enquanto a Precis˜ao em n captura somente o n´umero de itens relevantes nos primeiros N itens, enquanto MAP tamb´em leva em considera¸c˜ao a posi¸c˜ao na lista de itens. Isto se deve a que na maioria dos SRs, as listas de itens recomendados ´e ordenada de mais relevante para o menos. ´E definido pela seguinte f´ormula:

M AP = 1 m+ N X i i Rankpos,i+,N

aonde Rank+,Npos,i ´e o elemento i na lista ordenada dos N itens relevantes(isto ´e, em ordem ascendente, onde o item melhor avaliado tem a menor posi¸c˜ao pos). O n´umero total de elementos relevantes ´e denotado por m+.

Documentos relacionados