• Nenhum resultado encontrado

Um trabalho que de fato avaliou a rela¸c˜ao entre o conceito de Folkauthority e a RI foi (Pereira e da Silva, 2008c), no qual foram discutidos v´arios benef´ıcios com rela¸c˜ao ao conceito de Folkauthority e a sobrecarga de informa¸c˜ao. O autor realiza um estudo a fim de validar a hip´otese de que “... a aplica¸c˜ao do conceito de autoridade cognitiva por meio de folksonomia eleva a precis˜ao da informa¸c˜ao recuperada e ameniza o impacto da sobrecarga de informa¸c˜ao nestes sistemas.” Esse estudo ´e baseado em uma simula¸c˜ao da categoriza¸c˜ao dos documentos por parte dos usu´arios e em uma simula¸c˜ao da cadeia de autoridades. No entanto, ´e poss´ıvel apontar algumas quest˜oes a serem consideradas na simula¸c˜ao realizada em (Pereira e da Silva, 2008c), a qual ´e baseada em cinco passos que definem o conjunto de elementos a serem utilizados no estudo, a saber: as tags, os usu´arios, os documentos, a categoriza¸c˜ao dos documentos e a concess˜ao de autoridades cognitivas.

Na etapa de defini¸c˜ao de tags foram definidas 250 tags as quais foram utilizadas em todo o estudo realizado por Pereira e da Silva (2008c). Na etapa de defini¸c˜ao dos usu´arios, foram gerados 100 usu´arios e, para cada usu´ario foram associadas 20 tags a fim de denotar seu “vocabul´ario”, isto ´e, de denotar as tags que foram utilizadas por cada usu´ario para categorizar os documentos. No entanto, as 20tags associadas a cada um dos 100 usu´arios foram escolhidas aleatoriamente, o que diverge daquilo que ´e apontado na literatura como um modelo para a utiliza¸c˜ao de tags entre os usu´arios de SBFs (Golder e Huberman, 2006; Halpin et al., 2007; Trant, 2009). ´E conhecido que os termos utilizados tanto para descrever um documento quanto aqueles pertencentes ao vocabul´ario de um usu´ario possuem uma rela¸c˜ao entre si. Um documento possui umtema ouassunto e dessa forma os termos mais importantes contidos no documento possuem uma rela¸c˜ao com o significado desse assunto (Manning et al., 2009). Al´em disso, cada usu´ario possui um ou maisassuntos de interesse e os termos utilizados pelo usu´arios para descrevˆe-los tamb´em guardam essa mesma rela¸c˜ao. Ainda assim, considera-se que a quest˜ao da distribui¸c˜ao da frequˆencia de uso das tags de cada usu´ario foi bem procedida em (Pereira e da Silva, 2008c), pois nesse trabalho utilizou-se a distribui¸c˜ao de Paretto para simular a frequˆencia de uso dastags por cada usu´ario.

No momento de defini¸c˜ao das categoriza¸c˜oes dos documentos, a simula¸c˜ao demonstrada em (Pereira e da Silva, 2008c) procede escolhendo um n´umero fixo de 1000 documentos. Al´em disso, para cada documento foram escolhidos 20 usu´arios aleatoriamente, a fim de denotarem os usu´arios categorizadores dos documentos. A atribui¸c˜ao de tags aos documentos n˜ao obedece `a uma distribui¸c˜ao de probabilidade na qual as tags relaciona-das ao assunto do documento possuem maior probabilidade de serem utilizarelaciona-das. Essa distribui¸c˜ao ´e “aleat´oria”. No entanto, nessa simula¸c˜ao foram utilizadas entre 2 e 5

tags para descrever cada documento (para cada usu´ario). Esse ´e o n´umero de tags de fato utilizadas pelos usu´arios para categorizar os documentos, conforme apontado na literatura que j´a investigou essa quest˜ao (Golder e Huberman, 2006). Por fim, a topologia da cadeia de autoridades foi definida de forma aleat´oria (cada usu´ario categorizava um n´umero aleat´orio entre 0 e 10 de autoridades). No entanto, conforme apontado por autores na ´area de An´alise de Redes Sociais, um modelo generativo aleat´orio n˜ao ´e o mais adequado para descrever uma rede social com caracter´ısticas da cadeia de autoridades. Mika (2007), ao discorrer sobre o modelo generativo conhecido como modelo random graph afirma que uma rede gerada aleatoriamente n˜ao ´e a ideal para denotar redes com caracter´ısticas da cadeia de autoridades. Em seu texto o autor diz que devido `a limita¸c˜oes de espa¸co, ´e improv´avel que as rela¸c˜oes sociais aconte¸cam de forma totalmente aleat´oria, apesar de algumas rela¸c˜oes serem geradas ao acaso ou acidentalmente. Existe uma maior

probabilidade de que essas rela¸c˜oes aconte¸cam em ambientes sociais limitados, sendo as rela¸c˜oes ao acaso mais espor´adicas. Al´em disso, Kleinberg (1999) aponta para um modelo dehubs(n´os com muitas arestas de sa´ıda) eauthorities (n´os com muitas arestas incidentes) a fim de descrever uma rede de “autoridades” (influˆencia) de p´aginas Web.

A Figura 3.2 mostra um excerto da cadeia de autoridades avaliada neste trabalho, a qual foi gerada por meio da minera¸c˜ao de uma rede social existente na Web (maiores detalhes sobre esse procedimento podem ser encontrados no Cap´ıtulo 4, Se¸c˜ao 4.2). Nessa figura ´e poss´ıvel visualizar dois n´os destacados pelos termos “Authority” e “Hub”. Um n´o

Authority representa um usu´ario que publica/disponibiliza muita informa¸c˜ao e ´e bastante reconhecido como autoridade em alguns assuntos. J´a o n´oHub representa um usu´ario que realiza intensa atividade de categoriza¸c˜ao de autoridades cognitivas, podendo ou n˜ao ser tamb´em reconhecido como autoridade em alguns assuntos.

Figura 3.2: Topologia da cadeia de autoridades.

Ainda com rela¸c˜ao ao trabalho de Pereira e da Silva (2008c), a abordagem apresentada para RI utilizandoFolkauthority foi comparada com uma abordagem para RI baseada na ordem cronol´ogica dos resultados. Isto ´e, todos os documentos categorizados com tags

pertencentes `a consulta foram ordenados de acordo com a data em que foram disponibi-lizados no sistema e ent˜ao foram comparados com o resultado de busca gerado por uma abordagem com Folkauthority. ´E claro que esta n˜ao ´e uma abordagem tradicionalmente utilizada naWeb(apesar de ser utilizada pelo sistemaDelicious na ´epoca em que o estudo de Pereira e da Silva (2008c) foi publicado). Dessa forma, h´a uma lacuna sobre estudos na

´

area de RI e de Folkauthority, os quais demonstrem compara¸c˜oes entre uma abordagem para RI que utilize o conceito deFolkauthority e uma abordagem tradicional de RI naWeb

(como ´e o caso do esquema deranking tf-idf). Al´em disso, carece tamb´em de investiga¸c˜oes o problema de gerar dados que sejam baseados em modelos compat´ıveis com uma cadeia de autoridades (um grafo orientado cuja distribui¸c˜ao das arestas incidentes nos n´os obede¸ca uma ordem de probabilidade conhecida). Uma possibilidade para o tratamento dessa quest˜ao ´e a gera¸c˜ao da cadeia de autoridades a partir de dados de uma rede social real – abordagem a qual foi utilizada neste trabalho.

Neste trabalho, a utiliza¸c˜ao de uma rede social real para tratar a quest˜ao da defini¸c˜ao da cadeia de autoridades permitiu obter a topologia da cadeia (quais usu´arios concederam autoridades e `a quem), no entanto os dados relacionados `a concess˜ao de autoridade (quais

tags e n´ıveis foram atribu´ıdos `as autoridades) foram simulados com base no conjunto de

tags dos dois usu´arios que participaram da concess˜ao (as quais foram obtidas a partir de um sistema real). Al´em disso, utilizou-se o algoritmo dePageRank `a Priori para calcular a importˆancia de uma autoridade em uma tag dentro da cadeia de autoridades. Outra quest˜ao tratada neste trabalho foi a lacuna relacionada aos modelos para descrever a categoriza¸c˜ao dos documentos por parte dos usu´arios. Essa quest˜ao tamb´em foi tratada com base na captura de dados de um SBF real, conforme ser´a descrito com detalhes no Cap´ıtulo 4.