• Nenhum resultado encontrado

Capítulo 7 – Previsão/Sugestão de Relacionamentos

7.3 Aplicações

Huang, Li e Chen investigaram a utilização de previsão de relacionamentos para melhorar a filtragem colaborativa em sistemas de recomendação (Huang, Li and Chen, 2005). Eles descobriram que a métrica de Katz foi a mais útil, seguida pela métrica de ligação principal, vizinhos comuns e, finalmente, a métrica Adamic\Adar. As métricas baseadas no caminho e nos vizinhos comuns superaram as métricas mais simples. Eles descobriram que a medida da distância entre nós não foi uma informação útil, provavelmente porque a maioria dos pares de nós do seu conjunto de dados pode ser ligada por um caminho curto.

Farrell, Campbell e Myagmar usam previsão de relacionamentos para projetar um sistema que recomenda novas ligações acadêmicas para pesquisadores de uma conferência sobre ciência da computação (Farrel, Campbell and Mayagmar, 2005). Os pesquisadores mais experientes que usaram o sistema encontraram pouca utilidade para o mesmo, mas os pesquisadores mais novos acharam que a ferramenta era útil ao recomendar colegas em potencial e palestras de seus interesses.

Os autores desse trabalho são defensores das relações humanas orientadas computacionalmente e acreditam que os sistemas de rede social serão úteis para ajudar os humanos a lidar com o grande número de contatos profissionais que necessitam manter. O sistema mantém informações sobre os seus contatos e seus relacionamentos através da análise dos dados em grafos bipartidos, tais como: trabalhos publicados e pesquisadores, ou reuniões e empresários.

Em sua tese de doutorado Zhu (2003) utilizou previsão de relacionamentos para determinar qual página Web um usuário provavelmente irá visitar no seu próximo acesso, a fim de melhorar a navegação e a eficiência dos sites. Isso foi feito armazenando listas de várias páginas Web visitadas como uma cadeia de Markov. Normalmente, quando são previstos novos relacionamentos é assumido que esses relacionamentos são independentes. Em outras palavras, uma pessoa faz novos relacionamentos um a um, e

120

não uma seqüência de novas conexões. Isso é claramente diferente de como Zhu prevê visitas a páginas web. Essa técnica seria útil apenas se fosse possível supor que com a formação de um novo relacionamento com a pessoa A será criado um novo relacionamento com a pessoa B, porém não é dessa maneira que os relacionamentos surgem nas redes sociais.

7.3.1 Complemento das Ligações (Link Completion)

Link Completion é também um problema de análise de relacionamentos bastante

semelhante ao problema de previsão de relacionamentos (Goldenberg, Kubica, Komarek, Moore and Schneider, 2003). A diferença dessa técnica está no fato de seu objetivo ser determinar o nó que está faltando em um par de nós que definem uma ligação do grafo. Em outras palavras, caso se tenha um conjunto de dados com alguns relacionamentos parciais, nos quais não se conhecem os dois elementos responsáveis pelos relacionamentos, é preciso determinar qual é o nó faltante desses relacionamentos.

Assim, link completion é considerado um problema mais difícil e mais genérico que o problema de previsão de relacionamentos, já que ao invés de tentar determinar qual o par de nós têm maior probabilidade de estabelecerem um novo relacionamento, tenta-se determinar para qual nó outro nó está se relacionando. Um exemplo desse problema é quando um usuário compra cinco livros on-line e o nome de um livro é corrompido na transferência. Um algoritmo de link completion poderia prever o nome do livro extraviado com base no nome do usuário e os outros livros que ele comprou.

7.3.2 Descoberta de Ligações Anômalas

Em 2005 Rattigan e Jensen (Rattigan and Jensen, 2005) apresentaram o problema da descoberta de ligações anômalas em resposta às enormes dificuldades dos problemas de previsão de relacionamentos. Eles argumentaram que a previsão de relacionamentos tem dificuldades insuperáveis porque o número de pares de nós que precisam ser avaliados aumenta de forma quadrática em proporção ao número de nós em uma rede.

121

Além disso, segundo eles, as redes sociais são muito esparsas, levando a pouquíssimos casos positivos. Isso torna quase impossível para os sistemas de previsão aprenderem as diferenças significativas entre as métricas, em casos positivos e negativos. Há tão poucos casos positivos que eles acabam sendo “engolidos” pelos casos negativos que têm métricas semelhantes.

Rattigan e Jensen recomendam que o foco da pesquisa seja em descobrir as ligações anômalas. Isso significa detectar quais são as ligações em uma rede social que surgiram em um determinado intervalo de tempo e que são surpreendentes, ou seja, que não era esperado de acorrer; tais como, dois nós que passam a se relacionar, mas que possuíam muito poucos vizinhos em comum ou que estavam muito distantes na etapa de tempo anterior à que ocorreu a ligação.

Uma aplicação importante dessa técnica é a descoberta de ligações anômalas entre dois indivíduos indicando uma colaboração criminosa. A descoberta de ligação anômala é complementar a previsão de relacionamentos no sentido de que ambos usam as mesmas métricas para avaliar quais ligações são surpreendentes e quais são as ligações esperadas. Assim, as pesquisas que envolvem qualquer um dos temas irão beneficiar o outro.

7.3.3 Detecção de Ligações

Detecção de ligações é semelhante à previsão de ligações, porém envolve determinar onde existe um vínculo já estabelecido que não esteja sendo representado no sociograma, talvez devido à falta de dados. Nessa técnica não se deseja prever o que irá acontecer no futuro, o objetivo é saber quais são as relações que de certa forma já existem na rede social, mas que não estão explícitas, ou seja, estão ocultas.

Um exemplo é prever a influência, considerado um tipo de ligação escondida na análise de redes sociais, que um investigador exerce sobre outro, baseado em uma rede social de publicações. Os criminosos gostariam que todas as suas ligações para outros criminosos não fossem conhecidas e talvez intencionalmente eles possam esconder suas ligações o máximo possível. Da mesma forma, as empresas gostariam de saber todas as ligações entre as pessoas mesmo quando baseadas em informações incompletas para que suas estratégias de marketing sejam o mais eficiente e abrangente possíveis.

122

Liben-Nowell (Liben-Nowell and Kleinberg, 2007) e Taskar (Taskar, Wong, Abbeel and Koller, 2004) mencionam esse problema como uma aplicação de previsão de ligações na introdução de seus trabalhos. Alguns pesquisadores utilizam as técnicas de detecção de ligações como um aplicativo de testes para seus trabalhos (Komarek, 2004; Popescul and Ungar, 2003). A técnica de detecção de ligações em redes sociais usando métricas topológicas não deve ser confundida com outros tipos de detecção de ligação, por exemplo, a detecção de ligações históricas (Chen, Farahat and Brants, 2004), onde artigos de notícias são comparados para determinar se eles são sobre o mesmo evento.