• Nenhum resultado encontrado

CONCLUSÃO E TRABALHOS FUTUROS

Nesse trabalho, utilizamos conceitos de redes complexas e dados disponíveis da rede social Twitterpara estudar o processo de difusão de informação e de criação de conexões nessa rede e em redes complexas em geral.

No Capítulo4, desenvolvemos métodos e medidas para caracterização de cascatas, e conseguimos separar os processos de difusão de informação que são apenas observados na rede, porém ocorrem por fatores externos daqueles que se beneficiam mais diretamente da topologia da rede para difusão.

Os métodos e medidas desenvolvidos são relevantes para a caracterização de cascatas de informação. Apesar disso, um dos maiores problemas encontrados nessa etapa do trabalho é o caráter amostral dos dados. Propomos duas direções de trabalhos futuros que visam cobrir as falhas observadas nesse sentido: estudos teóricos sobre a influência da amostragem na observação de processos de difusão de informação e estudos com os mesmos métodos e medidas, porém com universos de dados completos ou modelos de difusão simulados. Há muito trabalho a ser feito nas duas direções sugeridas.

Também no Capítulo4, mostramos que a informação de fato propaga-se principalmente por caminhos mínimos, com o auxílio dos dados de cascatas de informação obtidos do Twitter. Como trabalho futuro, é desejável um trabalho maior com mais fontes de dados, de forma a testar essa afirmação em outros domínios.

Por fim, no Capítulo5mostramos que a homofilia tem papel fundamental na construção das conexões de influência no Twitter, e mostramos que é possível agrupar tópicos utilizando apenas a estrutura da rede de co-ocorrência de hashtags. No entanto, nossa única medida de sucesso do método é a inspeção visual e a modularidade da rede, que é uma análise qualitativa. Em trabalhos futuros, podemos replicar os métodos utilizados em outros domínios, onde exista um agrupamento de tópicos que faça sentido semântico a priori, como na Wikipedia, para a qual já existem ontologias pré-compiladas. Dessa forma, seria possível determinar o sucesso do

70 Capítulo 6. Conclusão e Trabalhos Futuros

71

REFERÊNCIAS

AIELLO, L. M.; BARRAT, A.; SCHIFANELLA, R.; CATTUTO, C.; MARKINES, B.; MENC- ZER, F. Friendship prediction and homophily in social media. ACM Transactions on the Web (TWEB), ACM, v. 6, n. 2, p. 9, 2012. Citado na página44.

ALBERT, R.; BARABÁSI, A.-L. Statistical mechanics of complex networks. Reviews of mo- dern physics, APS, v. 74, n. 1, p. 47, 2002. Citado 2 vezes nas páginas24e34.

AMARAL, L.; OTTINO, J. Complex networks: Augmenting the framework for the study of complex systems. The European Physical Journal B-Condensed Matter and Complex Systems, Springer, v. 38, n. 2, p. 147–162, 2004. Citado na página23.

ANDERSON, R. M.; MAY, R. M. Infectious Diseases of Humans Dynamics and Control. [S.l.]: Oxford University Press, 1992. Citado na página37.

ARAL, S.; MUCHNIK, L.; SUNDARARAJAN, A. Distinguishing influence-based contagion from homophily-driven diffusion in dynamic networks. Proceedings of the National Academy of Sciences, National Acad Sciences, v. 106, n. 51, p. 21544–21549, 2009. Citado na página44. BACKSTROM, L.; BOLDI, P.; ROSA, M.; UGANDER, J.; VIGNA, S. Four degrees of separa- tion. In: ACM. Proceedings of the 4th Annual ACM Web Science Conference. [S.l.], 2012. p. 33–42. Citado na página46.

BAKSHY, E.; HOFMAN, J. M.; MASON, W. A.; WATTS, D. J. Everyone’s an influencer: Quantifying influence on twitter. Citeseer, 2011. Citado na página24.

BARABÁSI, A.-L. Linked: How Everything is Connected to Everything Else and what it Means for Business, Science, and Everyday Life. [S.l.]: Plume, 2003. Citado na página24. BARABÁSI, A.-L.; ALBERT, R. Emergence of scaling in random networks. science, American Association for the Advancement of Science, v. 286, n. 5439, p. 509–512, 1999. Citado 2 vezes nas páginas24e35.

BARRAT, A.; BARTHLEMY, M.; VESPIGNANI, A. Dynamical processes on complex networks. [S.l.]: Cambridge University Press New York, NY, USA, 2008. Citado 4 vezes nas páginas36,37,38e39.

BLEI, D. M.; NG, A. Y.; JORDAN, M. I. Latent dirichlet allocation. the Journal of machine Learning research, JMLR. org, v. 3, p. 993–1022, 2003. Citado na página42.

BLONDEL, V. D.; GUILLAUME, J.-L.; LAMBIOTTE, R.; LEFEBVRE, E. Fast unfolding of communities in large networks. Journal of Statistical Mecxhanics: Theory and Experiment, IOP Publishing, v. 2008, n. 10, p. P10008, 2008. Citado na página64.

BOCCALETTI, S.; LATORA, V.; MORENO, Y.; CHAVEZ, M.; HWANG, D.-U. Complex networks: Structure and dynamics. Physics reports, Elsevier, v. 424, n. 4, p. 175–308, 2006. Citado na página29.

72 Referências

BONDY, J. A.; MURTY, U. S. R. Graph theory with applications. [S.l.]: Macmillan London, 1976. v. 290. Citado na página33.

BRANDES, U. A faster algorithm for betweenness centrality*. Journal of mathematical socio- logy, Taylor & Francis, v. 25, n. 2, p. 163–177, 2001. Citado na página61.

CATALDI, M.; CARO, L. D.; SCHIFANELLA, C. Emerging topic detection on twitter based on temporal and social terms evaluation. In: ACM. Proceedings of the Tenth International Workshop on Multimedia Data Mining. [S.l.], 2010. p. 4. Citado na página24.

CHA, M.; HADDADI, H.; BENEVENUTO, F.; GUMMADI, P. K. Measuring user influence in twitter: The million follower fallacy. ICWSM, v. 10, p. 10–17, 2010. Citado na página41. CHA, M.; MISLOVE, A.; GUMMADI, K. P. A measurement-driven analysis of information propagation in the flickr social network. In: ACM. Proceedings of the 18th international conference on World wide web. [S.l.], 2009. p. 721–730. Citado na página43.

COSTA, L.; Oliveira Jr, O.; TRAVIESO, G.; RODRIGUES, F.; BOAS, P.; ANTIQUEIRA, L.; VIANA, M.; Da Rocha, L. Analyzing and modeling real-world phenomena with complex networks: A survey of applications. Advances in Physics, v. 3, n. 60, p. 329–412, 2011. Citado na página24.

DALEY, D.; KENDALL, D. Epidemics and rumours. Nature Publishing Group, 1964. Citado na página38.

EDMONDS, J.; KARP, R. M. Theoretical improvements in algorithmic efficiency for network flow problems. Journal of the ACM (JACM), ACM, v. 19, n. 2, p. 248–264, 1972. Citado na página47.

ERDÖS, P.; RÉNYI, A. On random graphs, i. Publicationes Mathematicae (Debrecen), v. 6, p. 290–297, 1959. Citado na página34.

FIORE, A. T.; DONATH, J. S. Homophily in online dating: when do you like someone like yourself? In: ACM. CHI’05 Extended Abstracts on Human Factors in Computing Systems. [S.l.], 2005. p. 1371–1374. Citado na página44.

FORTUNATO, S. Community detection in graphs. Physics Reports, Elsevier, v. 486, n. 3, p. 75–174, 2010. Citado 2 vezes nas páginas32e33.

FREEMAN, L. C. Centrality in social networks conceptual clarification. Social networks, Elsevier, v. 1, n. 3, p. 215–239, 1978. Citado na página34.

GIRVAN, M.; NEWMAN, M. E. Community structure in social and biological networks. Procee- dings of the National Academy of Sciences, National Acad Sciences, v. 99, n. 12, p. 7821–7826, 2002. Citado 2 vezes nas páginas31e32.

GOEL, S.; WATTS, D. J.; GOLDSTEIN, D. G. The structure of online diffusion networks. In: ACM. Proceedings of the 13th ACM conference on electronic commerce. [S.l.], 2012. p. 623–638. Citado na página43.

GRANOVETTER, M. Threshold models of collective behavior. American journal of sociology, JSTOR, p. 1420–1443, 1978. Citado na página42.

Referências 73

HUBERMAN, B. A.; ROMERO, D. M.; WU, F. Social networks that matter: Twitter under the microscope. Available at SSRN 1313405, 2008. Citado na página41.

KANG, J. H.; LERMAN, K. Using lists to measure homophily on twitter. In: CITESEER. AAAI Workshops. [S.l.], 2012. Citado na página42.

KEMPE, D.; KLEINBERG, J.; TARDOS, É. Maximizing the spread of influence through a social network. In: ACM. Proceedings of the ninth ACM SIGKDD international conference on Knowledge discovery and data mining. [S.l.], 2003. p. 137–146. Citado na página43. KWAK, H.; LEE, C.; PARK, H.; MOON, S. What is twitter, a social network or a news media? In: ACM. Proceedings of the 19th international conference on World wide web. [S.l.], 2010. p. 591–600. Citado na página41.

LEBENSZTAYN, E.; MACHADO, F.; RODRÍGUEZ, P. Limit theorems for a general stochastic rumour model. SIAM Journal on Applied Mathematics, v. 71, n. 4, p. 1476–1486, 2011. Disponível em:<http://epubs.siam.org/doi/abs/10.1137/100819588>. Citado na página39. LYNCH, C. Big data: How do your data grow? Nature, Nature Publishing Group, v. 455, n. 7209, p. 28–29, 2008. Citado na página23.

MANYIKA, J.; CHUI, M.; BROWN, B.; BUGHIN, J.; DOBBS, R.; ROXBURGH, C.; BYERS, A. H. Big data: The next frontier for innovation, competition, and productivity. 2011. Citado na página23.

MCAFEE, A.; BRYNJOLFSSON, E. Big data: the management revolution. Harvard business review, n. 90, p. 60–6, 2012. Citado na página23.

MCPHERSON, M.; SMITH-LOVIN, L.; COOK, J. M. Birds of a feather: Homophily in social networks. Annual review of sociology, JSTOR, p. 415–444, 2001. Citado na página44. MILGRAM, S. The small world problem. Psychology today, New York, v. 2, n. 1, p. 60–67, 1967. Citado 2 vezes nas páginas35e46.

MITCHELL, M. Complex systems: Network thinking. Artificial Intelligence, Elsevier, v. 170, n. 18, p. 1194–1212, 2006. Citado na página23.

. Complexity: A guided tour. [S.l.]: Oxford University Press, 2009. Citado na página24. MORENO, Y.; NEKOVEE, M.; PACHECO, A. Dynamics of rumor spreading in complex networks. Physical Review E, APS, v. 69, n. 6, p. 066130, Jun 2004. Disponível em: <http:

//link.aps.org/doi/10.1103/PhysRevE.69.066130>. Citado na página39.

MORSTATTER, F.; PFEFFER, J.; LIU, H.; CARLEY, K. M. Is the sample good enough? compa- ring data from twitter’s streaming api with twitter’s firehose. arXiv preprint arXiv:1306.5204, 2013. Citado na página28.

NEKOVEE, M.; MORENO, Y.; BIANCONI, G.; MARSILI, M. Theory of rumour spreading in complex social networks. Physica A: Statistical Mechanics and its Applications, v. 374, n. 1, p. 457–470, 2007. ISSN 0378-4371. Disponível em:<http://www.sciencedirect.com/science/

article/pii/S0378437106008090>. Citado na página39.

NEWMAN, M. E. Mixing patterns in networks. Physical Review E, APS, v. 67, n. 2, p. 026126, 2003. Citado 2 vezes nas páginas30e31.

74 Referências

. The structure and function of complex networks. SIAM review, SIAM, v. 45, n. 2, p. 167–256, 2003. Citado na página35.

NEWMAN, M. E.; GIRVAN, M. Finding and evaluating community structure in networks. Physical review E, APS, v. 69, n. 2, p. 026113, 2004. Citado na página32.

NEWMAN, M. E. J. Networks: An Introduction. [S.l.]: Oxford University Press, 2010. Citado 3 vezes nas páginas29,33e38.

PALLA, G.; DERÉNYI, I.; FARKAS, I.; VICSEK, T. Uncovering the overlapping community structure of complex networks in nature and society. Nature, Nature Publishing Group, v. 435, n. 7043, p. 814–818, 2005. Citado na página32.

RODRIGUEZ, M. G.; LESKOVEC, J.; KRAUSE, A. Inferring networks of diffusion and influence. In: ACM. Proceedings of the 16th ACM SIGKDD international conference on Knowledge discovery and data mining. [S.l.], 2010. p. 1019–1028. Citado na página43. ROGERS, E. M. Diffusion of innovations. [S.l.]: Simon and Schuster, 2010. Citado na página

44.

SADIKOV, E.; MEDINA, M.; LESKOVEC, J.; GARCIA-MOLINA, H. Correcting for missing data in information cascades. In: ACM. Proceedings of the fourth ACM international confe- rence on Web search and data mining. [S.l.], 2011. p. 55–64. Citado 2 vezes nas páginas43 e45.

SHALIZI, C. R.; THOMAS, A. C. Homophily and contagion are generically confounded in observational social network studies. Sociological methods & research, Sage Publications, v. 40, n. 2, p. 211–239, 2011. Citado na página44.

SIMON, H. A. A behavioral model of rational choice. The quarterly journal of economics, JSTOR, p. 99–118, 1955. Citado na página23.

SUH, B.; HONG, L.; PIROLLI, P.; CHI, E. H. Want to be retweeted? large scale analytics on factors impacting retweet in twitter network. In: IEEE. Social computing (socialcom), 2010 ieee second international conference on. [S.l.], 2010. p. 177–184. Citado na página42. WATTS, D. A twenty-first century science. Nature, v. 445, n. 7127, p. 489, 2007. Citado na página23.

WATTS, D. J. A simple model of global cascades on random networks. PNAS, v. 99, n. 9, 2002. Citado 2 vezes nas páginas43e45.

WATTS, D. J.; STROGATZ, S. H. Collective dynamics of ‘small-world’networks. nature, Nature Publishing Group, v. 393, n. 6684, p. 440–442, 1998. Citado 2 vezes nas páginas31e35. WELCH, M. J.; SCHONFELD, U.; HE, D.; CHO, J. Topical semantics of twitter links. In: ACM. Proceedings of the fourth ACM international conference on Web search and data mining. [S.l.], 2011. p. 327–336. Citado na página42.

WENG, L. Information diffusion on online social networks. Tese (Doutorado), 2014. Citado na página42.

WENG, L.; LENTO, T. M. Topic-based clusters in egocentric networks on facebook. In: ICWSM. [S.l.: s.n.], 2014. Citado na página44.

Referências 75

YAN, G.; ZHOU, T.; HU, B.; FU, Z.-Q.; WANG, B.-H. Efficient routing on complex networks. Physical Review E, APS, v. 73, n. 4, p. 046108, 2006. Citado na página33.

ZACHARY, W. W. An information flow model for conflict and fission in small groups. Journal of anthropological research, JSTOR, p. 452–473, 1977. Citado na página23.

ZAMAN, T. R.; HERBRICH, R.; GAEL, J. V.; STERN, D. Predicting information spreading in twitter. In: CITESEER. Workshop on computational social science and the wisdom of crowds, nips. [S.l.], 2010. v. 104, n. 45, p. 17599–601. Citado na página42.

ZHAO, W. X.; JIANG, J.; WENG, J.; HE, J.; LIM, E.-P.; YAN, H.; LI, X. Comparing twitter and traditional media using topic models. In: Advances in Information Retrieval. [S.l.]: Springer, 2011. p. 338–349. Citado na página42.

Documentos relacionados