• Nenhum resultado encontrado

Capítulo 8 – Estudo de Caso: Sugestão de Relacionamentos

8.3 Configuração dos Parâmetros

8.3.1 Parâmetro 

A configuração do parâmetro é bastante sensível, pois, como dito

anteriormente, caso seja adotado um valor muito baixo a métrica de Katz será aproximada à métrica de vizinhos comuns. Por outro lado, caso seja adotado um valor muito alto a influência dos caminhos longos será muito forte e, conseqüentemente, isso pode prejudicar a previsão de novos relacionamentos.

Alguns experimentos consideraram 0, 001 (Acar, Dunlavy and Kolda, 2009), outros fizeram testes para 0, 05, 0, 005 ou 0, 0005 (Huang, Li and Chen, 2005; Huang and Lin, 2009; Liben-Nowell and Kleinberg, 2007), e concluíram que as melhores previsões ocorreram para  0,005. Assim, com base nessas pesquisas observa-se que os melhores valores para estão na ordem de 3

10 .

Entretanto, para avaliar os melhores valores de para a previsão de

relacionamentos na rede social científica multi-relacional foram feitos experimentos utilizando 0,5, 0, 05, 0, 005 e 0, 0005. O objetivo é avaliar o

148

comportamento da métrica composta e da métrica de Katz com a variação dos valores do parâmetro beta.

Para avaliar as métricas com cada valor do parâmetro beta definido anteriormente foram feitos pontos de corte na base de dados nos anos de 2009 e de 2010. Assim, foi possível analisar a rede social até o ano de 2008 e prever os relacionamentos de 2009 e, da mesma maneira, analisar os relacionamentos da rede social até o ano de 2009 e prever os relacionamentos de 2010.

Tabela 15 - Análise da previsão de relacionamentos para 2009

Ano Tamanho

Caminho Beta

Métrica Katz Métrica Composta

Precisão Recall F Precisão Recall F

2009 3 0,5  0,0168 0,5111 0,0325 0,0175 0,5333 0,0339 0, 05  0,0168 0,5111 0,0325 0,0175 0,5333 0,0339 0,005   0,0168 0,5111 0,0325 0,0175 0,5333 0,0339 0, 0005   0,0168 0,5111 0,0325 0,0175 0,5333 0,0339 4 0,5 0,0190 0,5778 0,0368 0,0197 0,6000 0,0381 0, 05  0,0182 0,5556 0,0352 0,0190 0,5778 0,0368 0, 005  0,0168 0,5111 0,0325 0,0175 0,5333 0,0339 0, 0005  0,0168 0,5111 0,0325 0,0175 0,5333 0,0339 5 0,5  0,0161 0,4889 0,0312 0,0197 0,6000 0,0381 0, 05  0,0182 0,5556 0,0352 0,0190 0,5778 0,0368 0, 005  0,0168 0,5111 0,0325 0,0175 0,5333 0,0339 0, 0005  0,0168 0,5111 0,0325 0,0175 0,5333 0,0339 6 0,5  0,0153 0,4667 0,0296 0,0197 0,6000 0,0381 0, 05  0,0182 0,5556 0,0352 0,0190 0,5778 0,0368 0, 005  0,0168 0,5111 0,0325 0,0175 0,5333 0,0339 0, 0005  0,0168 0,5111 0,0325 0,0175 0,5333 0,0339

149

Os resultados dessa primeira análise para a variação dos parâmetros da métrica de Katz estão na Tabela 15 e na Tabela 16. A Tabela 15 exibe os resultados das previsões de novos relacionamentos para o ano de 2009. Já na Tabela 16 são apresentados os resultados das previsões de relacionamentos para o ano de 2010. Nessas tabelas estão em negrito os melhores resultados obtidos pelas métricas. Para produzir esses resultados todos os dados da base de dados foram utilizados.

É importante observar que para valores de beta pequenos (0, 005 e 0, 0005

 ) os resultados são iguais independentemente do tamanho do caminho. Isso significa que o peso utilizado anula a influência que os caminhos de tamanho maiores poderiam ter na métrica. Esse fato foi observado nos dois anos que foram avaliados.

Observe que a métrica composta, proposta neste trabalho, apresenta resultados melhores que a métrica de Katz, que é considerada a melhor métrica de previsão de relacionamentos (Acar, Dunlavy and Kolda, 2009; Huang, Li and Chen, 2005; Huang and Lin, 2009; Liben-Nowell and Kleinberg, 2007), para o ano de 2009.

Além disso, a métrica composta apresenta uma estabilidade melhor com relação à variação dos parâmetros. Essa estabilidade pode ser verificada tanto na Tabela 15 quanto na Figura 51. Nessa figura estão os gráficos que representam a medida de recall das previsões do ano de 2009, obtidos através da métrica de Katz e da métrica composta.

Tabela 16 - Análise da previsão de relacionamentos para 2010

Ano Tamanho

Caminho Beta

Métrica Katz Métrica

Composta

Precisão Recall F Precisão Recall F

2010 3, 4, 5, 6 0, 05 0,0015 0,5000 0,0030 0,0015 0,5000 0,0030 0, 005 0,0015 0,5000 0,0030 0,0015 0,5000 0,0030 0, 0005 0,0015 0,5000 0,0030 0,0015 0,5000 0,0030 3  0,5 0,0015 0,5000 0,0030 0,0015 0,5000 0,0030 4 0,5 0,0015 0,5000 0,0030 0,0015 0,5000 0,0030 5 0,5 0,0007 0,2500 0,0014 0,0007 0,2500 0,0014 6  0,5 0,0000 0,0000 --- 0,0007 0,2500 0,0014

150

Como pode ser visto nos gráficos da Figura 51, quando é adotado 0,5, a métrica de Katz apresenta uma previsão muito boa com caminhos de tamanho máximo 4, mas piora consideravelmente os resultados quando o tamanho máximo do caminho passa para 5 e 6. Por outro lado, a métrica composta apresenta resultados muito bons para

0, 05

 e 0,5, mesmo quando o tamanho máximo dos caminhos aumenta.

Figura 51 - Análise gráfica das previsões de relacionamentos para o ano de 2009

Analisando a Tabela 16 com mais detalhe observa-se que a métrica composta e a métrica de Katz apresentaram os mesmos resultados para as previsões de relacionamentos do ano de 2010. A métrica composta apresenta resultado melhor que a métrica de Katz quando o tamanho máximo do caminho é igual a 6. Nessa situação a métrica de Katz não foi capaz de acertar nenhuma previsão corretamente.

A Figura 52 representa graficamente a coluna recall da Tabela 16. É fácil ver nessa figura que para o ano de 2010 as duas métricas foram estáveis com  0, 05,

0, 005

 e 0, 0005. Para 0,5 as duas métricas apresentaram uma piora nos resultados para caminhos de tamanho máximo 5 e 6.

151

Figura 52 - Análise gráfica das previsões de relacionamentos para o ano de 2010

Observando os resultados obtidos anteriormente com a variação do parâmetro beta concluiu-se que os melhores resultados foram obtidos com beta mais próximo de 1. Com o intuito de avaliar o comportamento da métrica de Katz utilizando outra função peso com base no tamanho do caminho foi elaborada uma nova função definida na equação (32). A curva descrita por essa função está ilustrada na Figura 53.

1 2

100l l

  (32)

Assim como na equação (31) a variável l da equação (32) é o tamanho do caminho. O objetivo dessa função é favorecer fortemente os relacionamentos diretos e os caminhos de comprimento menor e, por outro lado, penalizar os caminhos mais longos, mas permitindo que eles tenham uma influência na métrica de Katz.

Embora o objetivo das duas funções seja o mesmo, a função l decresce muito

rapidamente e, conseqüentemente, a penalização sobre os caminhos mais longos é muito forte. Assim, para que os caminhos de tamanhos mais longos tenham influência na métrica é necessário que exista uma grande quantidade de caminhos longos.

O objetivo da função alfa é permitir que os caminhos mais longos também tenham alguma influência no valor final das métricas. Os resultados das previsões dos relacionamentos para os anos de 2009 e 2010 utilizando a função alfa estão na Tabela 17.

152

Figura 53 - Definição da função peso alfa.

Os resultados obtidos mostram mais uma vez que a métrica composta sempre produz resultados melhores ou iguais que a métrica de Katz. Comparando a Tabela 17 com a Tabela 15 e a Tabela 16 é possível ver que as métricas apresentaram resultados melhores utilizando a função alfa.

Tabela 17 - Análise da previsão de relacionamentos com o uso da função alfa

Ano Tamanho Caminho

Métrica Katz Métrica Composta

Precisão Recall F Precisão Recall F

2009 3 0,0168 0,5111 0,0325 0,0175 0,5333 0,0339 4 0,0190 0,5778 0,0368 0,0204 0,6222 0,0395 5 0,0175 0,5333 0,0339 0,0197 0,6000 0,0381 6 0,0160 0,4889 0,0310 0,0197 0,6000 0,0381 2010 3 0,0014 0,5000 0,0028 0,0014 0,5000 0,0028 4 0,0014 0,5000 0,0028 0,0014 0,5000 0,0028 5 0,0007 0,2500 0,0014 0,0014 0,5000 0,0028 6 0,0007 0,2500 0,0014 0,0007 0,2500 0,0014

No ano de 2009 houve um aumento na precisão e no recall para todos os tamanhos dos caminhos. No ano de 2010, embora não tenha ocorrido aumento nas medidas de avaliação da métrica composta, o uso da função alfa permitiu que a métrica de Katz acertasse 25% (medida de recall) das previsões com o tamanho do caminho igual a 6.

153

A Figura 54 mostra os gráficos que representam a medida de recall da métrica de Katz e da métrica composta com o uso da função alfa e com o uso da função beta, para

0,5

 . Analisando os gráficos é possível ver que a função alfa apresenta resultados melhores ou iguais que a função beta tanto para a métrica de Katz quanto para a métrica composta.

Para consolidar a análise do parâmetro de penalização com base no tamanho do caminho foi feita uma comparação final entre a métrica composta e a métrica de Katz. O objetivo é comparar a métrica composta usando a função alfa com a métrica de Katz usando a função beta. Para essa comparação foi utilizado 0,5, já que esse valor produziu os melhores resultados para ambas as métricas. Os gráficos com essa comparação estão na Figura 55 e eles mostram que, como dito anteriormente, as previsões dos relacionamentos feitas pela métrica composta são sempre melhores ou iguais que a métrica de Katz.

Figura 54 - Análise das funções alfa e beta

Comparando os resultados obtidos com a variação do parâmetro beta e com a função alfa vê-se que a nova função peso teve resultados muito melhores que os valores propostos na literatura. Essa melhora nas previsões de novos relacionamentos indica que os relacionamentos indiretos nas redes sociais científicas possuem boa influência no

154

nascimento de novos relacionamentos, ou seja, o fluxo de informação entre pesquisadores que estão a dois ou três níveis de distância pode ajudar para que um novo relacionamento seja criado.

Figura 55 - Comparação entre a Métrica Composta e a Métrica de Katz para os anos de 2009 e 2010