Identificação de Usuários Influentes no Twitter

(1)

Identificação de Usuários Influentes no Twitter

Ronan Lopes

Universidade Federal de São João del-Rei Dep. de Ciência da Computação

São João del-Rei, Brasil

lopesronanufsj@gmail.com

Ramon Vieira

Universidade Federal de São João del-Rei Dep. de Ciência da Computação

São João del-Rei, Brasil

r_vieira5@hotmail.com

1. INTRODUÇÃO

Com a intensifica¸cão do uso de redes sociais por usuários da web, tem-se gerado uma grande quantidade de dados provenientes das intera¸cões desses usuários com a rede. Jun-tamente com o volume de dados, cresce também o inter-esse na descoberta de conhecimento, sobretudo a respeito de opiniões e tendências disseminadas na rede. Esse inter-esse impulsiona o desenvolvimento de técnicas de minera¸cão de dados, que permitem extrair informa¸cões impl´ıcitas em bases de dados.

Entender como os usuários se comportam em uma rede so-cial auxilia em tomadas de decisões, como por exemplo, em estratégias de marketing. Exemplificando, é provavelmente mais eficaz iniciar uma campanha eleitoral a partir de um usuário do qual partem conteúdos amplamente propagados na rede. Outro exemplo de aplica¸cão é em sistemas de re-comenda¸cão, onde a identifica¸cão de grupos de usuários na rede permite a ado¸cão de um método mais efetivo de re-comenda¸cão de conteúdo.

A fim de verificar o comportamento de uma rede de usuários no Twitter1, o trabalho apresentado neste artigo tem por ob-jetivo determinar os usuários mais influentes da rede. Para tal, utilizou-se uma base de dados do Reality Show Big Brother Brasil 20142. O objetivo é aplicar diferentes m´ etri-cas dispon´ıveis na literatura, de forma a obter uma medida de influência h´ıbrida, que levem em considera¸cão diferentes aspectos da rede. Busca-se também verificar se a opinião disseminada pelos usuários assinalados como mais influentes refletem no resultado do paredão (evento semanal do Reality Show onde o público vota pela sa´ıda de um participante da casa).

2. TRABALHOS RELACIONADOS

Em busca de métricas de influência a serem aplicadas e apoio à constru¸cão da metodologia a ser utilizada, fez-se o es-tudo de alguns artigos cient´ıficos que propunham diferentes

1_{http://www.twitter.com} 2

http://www.bbb.globo.com/

.

métodos para identifica¸cão de usuários influentes. Foram se-lecionados aqueles que abordaram cenários mais próximos e apresentaram técnicas mais aplicáveis ao contexto. A seguir, faz-se uma breve descri¸cão desses trabalhos, juntamente com as principais contribui¸cões de cada um deles.

O primeiro trabalho foi desenvolvido por Weng et al. [1] e propõe uma métrica de influência que extende o algoritmo de PageRank3. A analogia feita ao algoritmo de PageR-ank é que, assim como uma página da web, um usuário do Twitter tem alta influência se a soma de influência dos seus seguidores é alta; e sua influência em cada seguidor, por sua vez, é determinada pela quantidade de conteúdo que o seguidor recebe dele. Além disso, o algoritmo acrescenta o peso de uma medida de similaridade entre dois usuários de acordo com os tópicos em que estão interessados. A in-fluência dos usuários é calculada para cada tópico da base, mas pode-se obter uma medida geral de influência, através do montante de influência do usuário. A eficácia do Twit-terRank foi demonstrada através de sua correla¸cão com os ranks gerados por outros algoritmos.

O trabalho desenvolvido por Valiati et al.[2] também trata-se de uma extensão do algoritmo PageRank. Entretanto, diferencia-se do primeiro trabalho em duas questões prin-cipais: não é topic-sensitive e não leva em considera¸cão a rede de seguidores por questões de eficiência, uma vez que as requisi¸cões à API do Twitter são estritamente limitadas. O trabalho modela a rede como um grafo bipartido, que associa usuários a conteúdos propagados por eles, e con-teúdo ao usuário que o originou. Dessa forma, utiliza-se uma defini¸cão circular de influência e relevância, onde um usuário ´

e influente se dissemina conte´udo relevante, e um conte´udo ´

e relevante se é disseminado por usuários influentes. In-tuitivamente, a influência de um usuário pode ser definida pela probabilidade de um randomsurfer (usuário que navega aleatoriamente pelo grafo bipartido) visitar esse usuário. O algoritmo demonstrou sua eficácia no contexto de recomen-da¸cão de conteúdo, onde se o modelo é capaz de recomendar conteúdo para os usuários de forma acurada, pode-se inferir que a identifica¸cão de relevância do conteúdo foi bem suce-dida.

Muhammad U. Ilyas e Hayder Radha [3] propõem uma medida de centralidade em redes chamada PCC (Principal Component Centrality), que consiste em considerar a ma-triz de adjacência do grafo que representa a rede como uma matriz de covariância e partindo dela encontrar os P tores mais significativos da matriz. A partir desses autove-tores forma-se um autoespa¸co e o valor do PCC de cada

3

(2)

nó é dado pela norma da distância euclidiana a partir da origem do autoespa¸co encontrado. Essa medida de centrali-dade foi comparada com outra medida bastante utilizada, o EVC (eigenvector centrality), obtendo resultados melhores em rela¸cão ao número de comunidades (centros) encontra-dos. O EVC tem a limita¸cão de se concentrar apenas na maior comunidade, não revelando outras comunidades que podem ter importância significativa. Isso não ocorre com o PCC, conforme comprovado através de testes em uma rede de amigos do Orkut e de uma rede de jogos Fighters Club no Facebook.

Changhyun Lee, Haewoon Kwak, Hosung Park, and Sue Moon[4] propõem um método diferente para medir usuários influentes no Twitter, usando o conceito de leitores efetivos. Um leitor efetivo de um usuário u é um seguidor do usuário u que foi exposto pela primeira vez a um determinado trend-ing topic através de um tweet do usuário u. A influência de um usuário u é medida como o total de leitores efetivos para todos os tweets que o usuário u postou. Usando essa medida de influência, chegou-se ao resultado de que a maioria dos usuários influentes são agências de not´ıcias, que tem uma influência significativa na divulga¸cão de informa¸cões. Com-para¸cões quantitativas com o método que usa a contagem de número de seguidores mostraram que apenas 34% de usuários influentes coincidiram, considerando os 1000 mais influentes. O número de influentes comuns, em compara¸cão com o PageRank, foi ainda menor, o que mostra a singular-idade desse método frente aos existentes.

2.1 TwitterRank

Através de análises de conjunto de dados de usuários do Twitter, foi constatado que 72.4% dos usuários do Twitter segue mais de 80% de seus seguidores, e 80.5% dos usuários tem 80% dos usuários que estão seguindo seguindo-os de volta. De acordo com estudos recentes, essa presen¸ca de re-ciprocidade pode ser explicado pelo fenômeno de homofilia. Com base nessa constata¸cão, foi proposta uma forma de medir a influência de usuários do Twitter com base nessa descoberta.

Figure 1: Base de Dados: Usuários de Singapura 72.4% dos usuários seguem mais de 80% dos seus seguidores e 80.5% dos usuários tem seus amigos seguindo-os de volta.

Para responder a quest˜ao sobre a presen¸ca de homofilia na base:

- Usuários que se seguem são mais similares do que aque-les que não?

Identificar o interesse dos usu´arios (hashtags pouco pre-sentes na base)

Para identificar os interesses, aplica-se uma t´ecnica de aprendizado n˜ao-supervisionado: Latent Dirichlet Alloca-tion (LDA)

Cada documento D (tweet) está associado com uma dis-tribui¸cão de tópicos T, e cada tópico T está associado a uma distribui¸cão de palavras

Sa´ıda: Matriz DxT, onde D é o número de usuários e T o número de tópicos.

Testando a hip´otese:

- Calcular a média da distância de tópicos de cada usuário para seus amigos

- Mesmo cálculo para o mesmo número de usuários, em que não haja rela¸cão entre os usuários

dist(i, j) =p2 ∗ DJ S(i, j)

Djs: Jensen-Shannon Divergence

Matriz com probabilidade de transi¸c˜ao de um usu´ario ui

para uj, para um dado t´opico t:

Vetor de influência tópico-espec´ıfica para um tópico t: −−→

T Rt= γPt×

−−→

T Rt+ (1 − γ)Et

(3)

entre 0 e 1 que controla a probabilidade dessa transi¸c˜ao e TR ´e inicializado como um vetor uniforme

Resultados:

2.2 Usuários Influentes / Conteúdo Relevante

Usu´arios Influentes / Conte´udo Relevante Modelado como um grafo bi-partido:

O grafo bipartido G(U, C, F, E) pode ser representado por duas matrizes, M e L. A matriz M = (mij) ´e |U |x|C| e

mij= 1/qi

Usuários Influentes / Conteúdo Relevante Além disso, L = (lij) é |C|x|U | e lij= 1 se o usuário uj criou o conteúdo

ciou lij = 0, caso contr´ario.

Cálculo do vetor de Influência/relevância: pk_{= p}k−1_{M L, onde p}0 _{= vetor uniforme}

rk= rk−1LM , onde p0 = vetor uniforme

Esse modelo apresenta dois problemas importantes: A poss´ıvel presen¸ca de usu´arios dangling A poss´ıvel existˆ en-cia de buckets

Solu¸c˜ao: Adi¸c˜ao de mecanismo de amortecimento d. Novo modelo:

pk= dpk−1M L + (1 − d)u rk_{= dr}k−1_{LM + (1 − d)u}

- Utilizou-se d=0.85

Após reformular as equa¸cões acima algebricamente, a fim de obter-se a forma não recursiva:

p = (1 − d)u(I − dM L)−1 r = (1 − d)u(I − dLM )−1

Problema: computa¸c˜ao custosa.

Solu¸cão: aplicar o método das potências para solu¸cão aproximada, mas eficiente.

Resultados:

(4)

2.3 Principal Component Centrality

Para calcular a influência dos usuários, essa métrica utiliza a modelagem da rede de usuários do Twitter como um grafo, e a partir do cálculo de centralidade nesse grafo pode-se estimar o quanto um determinado usuário é influente nessa determinada rede.

Essa métrica é baseada em uma outra métrica bastante difundida no estudo de redes sociais, o EVC (centralidade de autovetor). Para calcular a centralidade de cada nó, o EVC dá uma pontua¸cão a esse nó do grafo em rela¸cão aos seus vizinhos. Isso é feito relacionando tanto o número de liga¸cões entre os nós, a robustez entre essas liga¸cões e por fim às centralidades dos nós vizinhos. Para poder encon-trar os valores exatos das centralidades, sendo que não pode ser feito calculando a centralidade de cada nó por vez, é utilizando o autovetor principal da matriz de adjacência do grafo. Essa caracter´ıstica permite que o EVC de um deter-minado nó, assim como o closeness e o betweenness, forne¸ca uma perspectiva de toda a rede. Cada nó receberá um valor de centralidade que indica o ”grau” de conexão ao nó mais central, ou mais dominante. Porém o EVC tem uma car-acter´ıstica que pode não ser muito interessante em determi-nadas bases de dados: é uma métrica que foca somente na maior comunidade de nós centrais, ignorando que existam outras vizinhan¸cas de nós com centralidades menores porém que podem ser igualmente importantes.

Visando obter uma métrica que consiga detectar múltiplas comunidades em um grafo, foi desenvolvida uma métrica nova chamada PCC (Principal Component Centrality). Essa métrica utiliza uma técnica de redu¸cão de dimensionalidade chamada PCA na matriz de adjacência do grafo, transfor-mando o espa¸co vetorial formado pela matriz de adjacência do grafo, em que cada dimensão representa um nó e suas adjacências, em outro espa¸co vetorial reduzido, no qual se preserve o máximo de informa¸cão poss´ıvel. Após fazer essa redu¸cão, calcula-se a centralidade de cada nó como a distˆ an-cia euclidiana entre a origem do espa¸co vetorial e a proje¸cão do nó nesse espa¸co reduzido.

Para a escolha de uma dimensão apropriada para a re-du¸cão, é feito um cálculo de phase angle entre o autovetor do EVC e o vetor de distâncias calculado pelo PCC para uma dimensão d. A dimensão d é escolhida se a varia¸cão entre o phase angle para uma dimensão d e uma dimensão d − 1 for pequena, indicando que a partir dali os valores do PCC não sofrerão grandes altera¸cões.

2.4 Leitores Efetivos

A dinamicidade do Twitter, onde a qualquer momento um usuário ou um grupo de usuários pode causar uma mudan¸ca repentina da opinião geral sobre um determinado assunto, faz com que a temporalidade dos posts tenha grande relevan-cia na identifica¸cão de usuários influentes. Porém, muitas das abordagens atualmente utilizadas para essa análise, como o número de seguidores e o PageRank, não utilizam

infor-Figure 2: Exemplo de c´alculo de centralidade usando o PCC

ma¸cões temporais para esse fim. De modo a usar essas in-forma¸cões temporais, foi desenvolvida uma métrica chamada Leitores Efetivos.

Ao analisar a maneira como se dá a difusão de informa¸cão no Twitter, constatou-se que o número de usuários do Twit-ter que recebem tweets sobre um deTwit-terminado trending topic cresce de forma acelerada no in´ıcio do per´ıodo de evidência de um determinado trending topic. Em contrapartida, o número de usuários que escrevem tweets sobre esse determi-nado trending topic apresenta um crescimento muito menor. Conforme o tempo vai passando, o número cumulativo de usuários que recebe tweets se estabiliza, enquanto o número de escritores continua crescendo.

Ao se fazer uma análise mais atenta percebe-se que o número de leitores proporcionalmente ao número de escritores ´

e muito maior no in´ıcio do per´ıodo de evidência, decaindo conforme o tempo passa e o número de escritores aumenta. Com base nessa observa¸cão, pode-se dizer que um usuário que escreve um determinado conteúdo no in´ıcio do per´ıodo ´

e mais influente do que outro que escrever em um per´ıodo posterior, pois o primeiro atinge muito mais usu´arios do que o segundo.

Desse modo, pode-se medir a influência através dos chama-dos leitores efetivos. Um leitor efetivo de um tweet t postado por um usuário u é qualquer usuário f, seguidor de u, que tem contato com um determinado trending topic através do tweet t.

Caso f tenha sido exposto a uma determinado trending topic através de tweets de vários usuários a quem segue, o usuário f será o leitor efetivo do tweet do usuário que postou a informa¸cão primeiro, de modo que cada usuário seja leitor efetivo de apenas 1 tweet.

A influência de cada usuário é calculada como o somatório das influências de todos os tweets postados por aquele usuário. A influência de cada tweet é o número de leitores efetivos que receberam aquele tweet.

3. METODOLOGIA

A seguir é descrita a metodologia utilizada para a formu-la¸cão do trabalho. Primeiramente foi feito um estudo de como cada métrica funciona, de forma a auxiliar na etapa posterior de implementa¸cão. Depois dessa etapa segue o pré-processamento da base de dados utilizada, assim como a constru¸cão do grafo posteriormente utilizada para as m´ etri-cas de Usuários Influentes/Conteúdo Relevante e PCC.

Após essa etapa de pré-processamento, foi feita a imple-menta¸cão das métricas Usuários Influentes/Conteúdo Rele-vante, PCC e TwitterRank, descritas a seguir. A métrica

(5)

Ef-fective Readers não pôde ser implementada devido a falta de informa¸cões relativas aos trending topics na base de tweets que foi utilizada para as análises das demais medidas de centralidade.

3.1 Modelagem do grafo

O grafo G = (V, E) foi modelado de forma que, cada el-emento de V representa um usuário que gera tweets ou é mencionado em um tweet, e o conjunto E é composto por arestas que indicam uma rela¸cão entre um par de usuários, na qual um usuário cita o outro usuário através de um tweet. Para as métricas grau de entrada, PageRank e betweenness, esse grafo foi modelado como um grafo direcionado. Já para o PCC, o grafo foi modelado de forma não-direcionada.

Para a métrica Usuários Influentes / Conteúdo Relevante, o modelo de grafo utilizado foi um grafo bipartido que as-socia usuários a conteúdos, e foi modelado através de duas matrizes M e L.

3.2 Usuários Influentes/Conteúdo Relevante

A implementa¸cão foi feita usando duas matrizes: M e L. A matriz M é uma matriz de dimensões |U|x|C|, onde |U| é o número de usuários e |C| a quantidade de conteúdo. Cada linha i da matriz é preenchida com o valor inverso da quan-tidade de conteúdo propagado pelo usuário i. A matriz L, de dimensões inversas (|C|x|U|) representa a cria¸cão de con-teúdo por parte dos usuários, onde cada posi¸cão (i,j) contém o valor 1 caso o conteúdo i tenha sido originado pelo usuário j, e 0 caso contrário.

Utilizando o método das potências apresentado anterior-mente, utilizou-se como Z1 a matriz M e Z2 como a ma-triz L, uma vez que o objetivo é somente a identifica¸cão de usuários influentes. Para o parâmetro k, utilizou-se 10 it-era¸cões onde verificou-se que os resultados mantinham-se, alterando somente o valor obtido pela métrica para valores mais precisos. Para o parâmetro de amortiza¸cão d, utilizou-se o mesmo parâmetro dos autores do artigo (0.85).

Para a base de dados utilizada, foi necessária utilizar ar-tif´ıcios de implementa¸cão para contornar o problema de falta de memória. Para a matriz M, foi feita sua representa¸cão através de um vetor, uma vez que o valor para cada linha se mantém, e alterou-se os métodos para que esse vetor fosse tratado como uma matriz. Para a matriz L, uma vez que está é esparsa, utilizou-se uma representa¸cão por dicionários, onde somente armazena-se as tuplas onde o valor é diferente de 0.

3.3 Principal Component Centrality

Para a implementa¸cão da métrica de centralidade PCC, o método que foi utilizado para extra¸cão de autovalores e autovetores de uma matriz foi o SVD (Singular Value De-composition), presente na biblioteca Numpy. Esse método consiste em fatorar uma matriz qualquer em três matrizes

M = U ΣV∗

onde U é uma matriz unitária m × m real or complexa, Σ é uma matriz retangular diagonal m × n com números reais não-negativos na diagonal, e V* (a conjugada transposta de V) é uma matriz unitária n × n real ou complexa. Ao aplicar o SVD na matriz de adjacência M do grafo G, as matrizes U e Σ contém os valores dos autovetores e dos autovalores, respectivamente. Esses valores foram calculados para cada valor de dimensão d até que o phase angle se estabilizasse a

partir de uma determinada dimens˜ao n.

Para que a implementa¸cão feita fosse validada, a imple-menta¸cão foi executada para a base de dados do Orkut, uma das bases de dados utilizada na extra¸cão de usuários influ-entes pelos autores que propuseram a métrica. Ao avaliar os resultados, chegou-se a um resultado semelhante, no qual o usuário mais influente detectado foi o usuário 692, e em seguida usuários com ids próximos a 43000, o que validou a utiliza¸cão do mesmo na utiliza¸cão em outras bases de dados.

Figure 3: Compara¸c˜ao entre os resultados originais e os obtidos pela nossa implementa¸c˜ao

4. RESULTADOS

Figure 4: Valores do PCC para uma base

rela-cionada ao jogo Argentina x Ir˜a

Para identifica¸cão de usuários influentes, utilizaremos uma base de tweets coletada no dia do jogo entre Argentina e Irã, ocorrido durante o per´ıodo de Copa do Mundo. Além das métricas apresentadas, serão utilizadas também outras métricas relacionadas a grafos, como o grau de entrada, o PageRank e o closenness. Na figura 4 é mostrado grafi-camente como está distribu´ıda as influências dos usuários nessa rede.

Outra forma a ser utilizada é a correla¸cão entre as m´ etri-cas, ou seja, de que maneira cada métrica está relacionada com cada uma das outras. Isso será feito através do coefi-ciente de correla¸cão de Pearson, representado por ρ. Este coeficiente assume valores dentro do intervalo [−1, 1], sendo que quanto mais o coeficiente estiver próximo de 1, mais as variáveis estão correlacionadas de forma positiva, ou seja, são diretamente proporcionais, e quanto mais próxima de -1 for o coeficiente, isso significa que existe uma correla¸cão negativa, isto é, as variáveis (ou as métricas avaliadas) são inversamente proporcionais. Quanto mais próximo de 0 for o coeficiente, menos correlacionadas estão as variáveis, tanto positivamente como negativamente. Esse coeficiente é cal-culado através da seguinte fórmula:

ρ =

Pn

i=1(xi− x)(yi− y)

pPn

(6)

onde x1, x2, ..., xn e y1, y2, ..., yns˜ao as medidas de

centrali-dade para cada usuário e as médias aritméticas de ambas as métricas são dadas por

x = 1 n· n X i=1 xi e y = 1 n· n X i=1 yi

Aplicando a fórmula de correla¸cão nas métricas geradas para a base de dados do Big Brother Brasil, identificou-se a divisão de dois grupos de métricas. O primeiro, onde estão contidas as métricas de grau de entrada e PageRank, são baseadas basicamente no grau da rede. O segundo grupo, que contém as métricas de Betweenness, PCC e o algoritmo da UFMG são baseadas em centralidade de grafos. Observa-se na tabela 1 de correla¸cão que as métricas de um grupo são altamente correlacionadas entre si e pouco relacionadas com o outro grupo.

Table 1: Tabela de Correla¸c˜ao - Base do BBB

Grau PageR. Betw. PCC UFMG

Grau 1.0 0.81 0.32 -0.01 0.25

PageR. 0.81 1.0 0.18 -0.05 0.10

Betw. 0.32 0.18 1.0 0.56 0.65

PCC -0.01 -0.05 0.56 1.0 0.69

UFMG 0.25 0.10 0.65 0.69 1.0

Como pode se observar, a tabela é representada por uma matriz simétrica, e sua diagonal principal tem sempre o valor 1.0, pois o coeficiente de correla¸cão entre um conjunto de valores e ele mesmo é sempre 1.0. Calculando-se a corre-la¸cão para a base do jogo entre Argentina e Irã da copa do mundo, verificou-se que as mesmas observa¸cões feitas acima se mantiveram, conforme pode-se observar na tabela 2.

Table 2: Tabela de Correla¸c˜ao - Argentina x Ir˜a

Grau PageR. Betw. PCC UFMG

Grau 1.0 0.73 -0.18 -0.14 -0.11

PageR. 0.73 1.0 0.05 0.03 0.007

Betw. -0.18 0.05 1.0 0.51 0.56

PCC -0.14 0.03 0.51 1.0 0.60

UFMG -0.11 0.007 0.56 0.60 1.0

A fim de fazer ainda uma análise mais semântica, fez-se uma verifica¸cão do conteúdo dos usuários identificados como mais influentes na base do Big Brother Brasil. Para cada métrica, é exibido abaixo o usuário identificado como mais influente e a opinião disseminada por ele:

• Grau de Entrada:

@Tropa Clanessa: “#FORAAMANDA VOTEM VOTEM http://t.co/O71znFWeWX“.

• Betweenness e UFMG:

@EitaBBB: “@ka up Mutirao no @Portal Clanessa ate o encerramento dos votos, vem participa #ForaA-manda #FicaVanessa http://t.co/tf7Mll9x6v“.

• PageRank:

@HugoGloss: “Obaaaaaa! Amandaaaaa foraaaaa!!! Vai fazer propaganda da Koleston, querida #BBB14”. .

• PCC:

@VAZA03PANACAS: “#FORAAMANAJAAAAAAAA #VAZAAAAAAAAAAMANAJAAAAAAAAA #foraa-manda #BBB14”.

Conforme pode se verificar, todos os usuários identificados como mais influentes influenciavam a sa´ıda da Amanda no paredão. Tal opinião mostrou-se coerente com o resultado do paredão: a candidata Amanda foi eliminada.

5. CONCLUSÃO

Por fim, após a aplica¸cão das métricas e análise dos re-sultados, identificou-se algumas particularidades sobre cada uma dessas métricas:

• Grau de Entrada: M´etrica simples que geralmente identifica pessoas famosas ou spammers.

• Betweenness: Usuários que são o centro do fluxo de informa¸cão. Geralmente fã-clubes ou repassadores de conteúdo.

• PageRank: Altamente correlacionado com o grau de entrada, e portanto, tamb´em identifica usu´arios desses grupos.

• Leitores Efetivos: Identifica agência de not´ıcias e jornais, que tem acesso mais rápido às informa¸cões e as divulgam primeiro.

• PCC: Voltado para identifica¸cão de comunidades de usuários influentes TwitterRank: Usuários mais influ-entes de acordo com assunto de interesse.

• UFMG: Identifica usuários comuns, cujo conteúdo é muito repercutido.

Essas particularidades fazem cada métrica mais apropri-ada em aplica¸cões diferentes. Uma vez que o conceito de in-fluência é subjetivo, deve-se avaliar os aspectos relevantes da aplica¸cão a fim de tomar-se uma decisão acerca da métrica a ser utilizada.

6. REFERÊNCIAS

[1] J. Weng, E. Lim, J. Jiang and Q. He. TwitterRank: finding topic-sensitive influential twitterers. In Proceedings of the third ACM international conference on Web search and data mining, pages 261-270, 2010. Everyone’s an influencer: quantifying influence on twitter

[2] H. Valiati, A. Silva, S. Guimar˜aes and W. Jr.

Deteçcão de Conteúdo Relevante e Usuários Influentes no Twitter. In (http://homepages.dcc.ufmg.br/ ar-lei/pubs/brasnam12.pdf), Departamento de Ciência da Computa¸cão, UFMG, Belo Horizonte.

[3] M. Ilyas and H. Radha. Identifying Influential Nodes in Online Social Networks Using Principal Component Centrality. In Proceedings of IEEE International Conference on Communications, pages 1-5, 2011.

(7)

[4] C. Lee, H. Kwak, H. Park and S. Moon. Finding Influentials Based on the Temporal Order of Information Adoption in Twitter. In Proceedings of the 19th International Conference on World Wide Web, pages 1137-1138, 2010.