Pesquisas em Redes
Sociais
Em Busca do Genoma de Relacionamentos Profissionais
Mirella
M.
Moro
Todos Sabem
Fonte: https://marketingstrategyx.com/wp-content/uploads/2017/02/social-media-stats-infographic-2017.png
● O que é uma Rede Social ● As mais usadas
● Quem as usa ● Como usá-las
● Como lucrar com elas (?) ● As pessoas influentes (?) ● Como evoluem (?)
Resumindo
Mídias Sociais N: ◉ Pessoas/orgs. ◉ Domínios ◉ Objetivos ◉ Dados <<<<<<< ◉ ... Fonte: https://www.webygeeks.com/social-media-optimization-or-smo/content-types-which-social-media-users-love 3Pesquisas em Redes
Sociais
“
The Human Genome Project (HGP) was an
international scientific research project with the
goal of determining the sequence of nucleotide
base pairs that make up human DNA, and of
identifying and mapping all of the genes of the
human genome from both a physical and a
functional standpoint.
Já em Redes Sociais
>>>>>>>>
Genoma > Redes Sociais?
Indivíduos + Orgs.Modelos
Padrões
Métricas
...
Redes
Sociais
Caracterizar + Desvendar
Relacionamentos
6Então
1 Esforço internacional → vários
1 Indivíduo como foco → vários indivíduos
1 Tipo de DNA → vários tipos de relacionamentos
Artigos / Ano em Computação
Social Networks
∑
10.116
☺17.695
● Conference and Workshop Papers (5.263) Journal Articles (3.383)
Informal Publications (839)
Parts in Books or Collections (228) Reference Works (148)
Books and Theses (129) Editorship (112)
Withdrawn Items (14)
Exemplos de precursores
● Linton C. Freeman: Centered graphs and the
structure of ego networks. Mathematical Social
Sciences 3(3): 291-304 (1982)
● Ian H. Witten, Harold W. Thimbleby, George Coulouris, Saul Greenberg: Liveware: A New
Approach to Sharing Data in Social Networks.
International Journal of Man-Machine Studies 34(3): 337-348 (1991)
Não apenas na
Computação
Valor de Redes Sociais
Examples of the effects of social networks on economic activity are
abundant and pervasive, including roles in transmitting information about jobs, new products, technologies, and
political opinions The people with whom we interact on a
regular basis, and even some with whom we interact only sporadically, influence our beliefs, decisions and behaviors
Matthew O. Jackson: An Overview of Social Networks and Economic Applications. In: Handbook of Social Economics.
Valor de Redes Sociais
Given the many roles of
networks in economic
activity, they have become
increasingly studied by
economists.
Networks of relationships among
various firms and political organizations affect research and development,
patent activity, trade patterns, and political alliances
Matthew O. Jackson: An Overview of Social Networks and Economic Applications. In: Handbook of Social Economics.
Não apenas para a
Computação
pixabay.com
Dengue no Brasil
Mineração de dados do Twitter
◉ Detecção de surtos
◉ Predição de surtos futuros
◉ Ações de combate apropriadas
Genoma de Relacionamentos
Profissionais
Profissionais
◉ Pessoais ←→ psique humana
◉ Dados disponíveis ou coletáveis
◉ Amplo campo aberto
Genoma de Relacionamentos
◉ Como pessoas interagem
◉ Com métricas específicas
◉ Caracterização (como é)
◉ Evolução (como veio a ser)
◉ Prospecção (como será)
A Seguir
1.
Conceitos base
2.
Taxonomia para redes profissionais
3.
Força dos relacionamentos
a.
Redes acadêmicas
b.
Redes de desenvolvimento colaborativo de software
4.
Finalmente: outras pesquisas e trabalhos futuros
Conceitos de Redes Sociais
Dado
Rede social
Indivíduos (orgs.)
Relacionamentos
Modelado
Grafo
Nodos
(vértices)Arestas
(links) 17Calculado
(e.g.)Coeficiente clusteriz.
Grau e closeness
Betweeness e overlap
1
Modelagem de Redes Sociais
Bipartido
Multipartido
Multigrafo
Multinível
Rede
Heterogênea
GitHub
Relationship based on contributing to the same repository
User X follows user Y
User X opened an issue assigned to Y Users commented in the same issue User X watches a repository owned by Y
JavaScript Developer Network
Python Developer Network
Ruby Developer Network
Redes Sociais
Profissionais
Online Offline Publicação Gerência de Processo Networking Profissional Blog Repositório / Competições Troubleshooting Edição compartilhada Controle de versões Marketing Habilidades Área de discussão Negócios Especialistas Compartilhar publicações Encontrar colaboradores Perguntar/responder questões Pesquisa Encontrar / Publicar EmpregosInterações
Sociais
Estrutura e
Semântica
Para lucro
Proc. operacionais Proc. gerência e suporte
Produtividade Citações Qualidade pesquisa Individual Intra/inter grupo 21 M. A. Brandão & M. M. Moro. Social Professional Network: a Survey and Taxonomy.
Problemas em redes sociais relacionados à manutenção e utilização
Questões
Tarefas
Problemas cujas soluções se beneficiam da utilização de dados de redes sociais
Questões
◉
Coletar
◉
Armazenar
◉
Gerenciar
◉
Tratar
dados das redes
Taxonomia
Tarefas
Como redes (dados) são
◉
Analizadas
◉
Utilizadas
◉
Melhoradas
◉
Aplicadas
Força dos Relacionamentos
➔
Propriedade das arestas do grafo
que representa a rede social
➔
Relacionamentos não são
igualmente importantes
➔
Tie Strength
3
"Tie strength may be measured by a combination of
the amount of time, the cooperation intensity and
the reciprocal services that characterize the tie"
[Granovetter, 1973]
Como Medir a Força?
Como medir força de coautoria
Como identificar aspectos que impactam nesta força
Como a força está definida para redes temporais
Como a força varia no tempo
Redes Acadêmicas
28
a
● M. A. Brandão & M. M. Moro. Analyzing the Strength
of Co-authorship Ties with Neighborhood Overlap.
In DEXA 2015.
● M. A. Brandão, M. A. Diniz & M. M. Moro. Using
Topological Properties to Measure the Strength of Co-authorship Ties. In BraSNAM 2016.
● M. A. Brandão & M. M. Moro. The Strength of
Co-authorship Ties through Different Topological Properties. JBCS, 23(1):5, 2017.
● M. A. Brandão, P. O. S. V. Melo & M. M. Moro. Tie
Strength Dynamics over Temporal Co-authorship Social Networks. In: Web Intelligence, 2017.
Redes de Coautoria
OUTRAS ANÁLISES
● L.H.C Lima et al. JBCS v.23, 2017.
● T.H.P. Silva et al. Scientometrics v.113, 2017. ● T.H.P. Silva et al. Scientometrics v.107, 2016.
● L. Mota et al. In SBBD 2015.
● T.H.P. Silva et al. In JCDL 2014.
● M.A. Brandão et al. In WWW, 2013. ● H. Lima et al. In JCDL 2013.
● G.L. Lopes et al. IJCS&A, v. 9, 2012.
● G.L. Lopes et al. In WWW/Internet, 2011. ● A.H.F. Laender et al. In SEMISH 2011. ● G.L. Lopes et al. In ICITA 2011.
Distribuição
#autores/área
Sociologia:
7.195 publicações
84% um autor apenas
Qualquer análise:
limitada a áreas com
boa colaboração
Problemas com
NO e W
#1 Sem coautor comum #2 Muitos coautores #3 Limites
#4 Comunidades
Tieness: Nova Métrica
32
Análises Bases Reais
33
Base de Dados
#Nodos
#Arestas
Período
DBLP Articles
837.583
2.935.590 2000-2015
DBLP Inproceedings
945.297
3.760.247 2000-2015
PubMed
443.784
5.550.294 2000-2016
Tieness
Caso Real
CoautorTop 10 - José Palazzo M. de OliveiraW (freq.) NO TienessLeandro krug Wives 26 0.31 0.48 Ana Marilza Pernas 14 0.2 0.26 Stanley Loh 11 0.12 0.148 Isabela Gasparini 11 0.12 0.148 Daniel Lichtnow 10 0.17 0.21 Marcelo Soares Pimenta 10 0.09 0.116 Giseli Rabello Lopes 8 0.054 0.072 Alencar Machado 7 0.072 0.096 José Valdeni de Lima 6 0.109 0.128 Mirella M. Moro 6 0.055 0.068
34
NO ≠ Tieness
Tieness
Caso Real
CoautorTop 10 - José Palazzo M. de OliveiraW (freq.) NO TienessLeandro krug Wives 26 0.31 0.48 Ana Marilza Pernas 14 0.2 0.26 Stanley Loh 11 0.12 0.148 Isabela Gasparini 11 0.12 0.148 Daniel Lichtnow 10 0.17 0.21 Marcelo Soares Pimenta 10 0.09 0.116 Giseli Rabello Lopes 8 0.054 0.072 Alencar Machado 7 0.072 0.096 José Valdeni de Lima 6 0.109 0.128 Mirella M. Moro 6 0.055 0.068
35
Como
diferenciar??
tempo
Estático vs. Dinâmico
Class Interaction frequency Common Friends Interaction intensity
strong high high high
bridge+ high low high
transient low high high
periodic high high low
bursty low low high
bridge high low low
weak low high low
random low low low
STACY
Strength of Ties Automatic
Classifier over the Years
Neighborhood overlap
# of common friends
Edge persistence
interaction frequency
STACY
Strength of Ties Automatic
Classifier over the Years
Neighborhood overlap (# of common friends) Edge persistence (interaction frequency) Co-authorship frequency
Genoma de Relacionamentos
Co autoria
Coautoria
◉
Bases de dados diversas: cv,
bibliotecas digitais, citações
◉
Evolução: fácil → anual
◉
Prospecção: predição de links
○
Lopes - recomendação
Genoma de Relacionamentos
◉ Como pessoas interagem ◉ Com métricas específicas ◉ Caracterização (como é) ◉ Evolução (como veio a ser) ◉ Prospecção (como será)
40
Força de desenvolvimento
Métricas + semântica + tempo
Redes Software
41
b
Social Coding : desenvolvimento de software através da
colaboração (online) entre programadores
Rede de
Colaboração
“
Tarefa primordial da área de BD
Enriquecer dados existentes em
busca de informações relevantes
Informação
Relevante
Força de
Colaboração :
Desenvolv.
Colaborativo
de Software
Caracterização Rocha et al@SBBD16: Análise de contribuição de código entre repositórios do GitHub Batista et al @ SBBD DSW 2017: GitSED Brandão & Moro @ ComCom 2017: Social professional networks- a survey and taxonomyMétricas
Alves et al@SBBD16: The strength of social coding collaboration on GitHub Semântica
Batista et al @ WI17: Collaboration strength metrics and analyses on GitHub Tempo
Batista et al @ SBBD17: Aspectos Temporais para Medir a Força da Colaboração no GitHub. Janelas Temporais
Próximos Capítulos
Recomendação de times Predição de links
(planejamento, custos, etc)
Enriquecimento
46
# Skill programming languages
●
Maioria: 1-5 LPs
More Collaborative languages Less collaborative languages Very collaborative languages Medium collaborative languages Assembly Pascal VisualBasic Perl JavaScript PHP Python Ruby Java C C++ C#
Grau de
colaboração
entre as
linguagens
47Trabalhos
Relacionados
Medem a força de interação de
modos diferentes. Entretanto
nenhum avalia a melhor maneira de
medir a força
nenhum investiga a correlação entre
as métricas
48
Nossos Trabalhos
◉ GitSED - GitHub Socially Enhanced Dataset
○
curado (específico para 2-3 linguagens)○
aumentado (externos ao GHTorrent)○
enriquecido (métricas de redes sociais)◉ Novas métricas para força de colaboração em social coding:
○
commits’ number of lines○
potential of contribution○
prior social interaction◉ Avalia todas as métricas (com
existentes) em redes: JavaScript e Ruby
GitSED
Métricas e
Análises
Propriedades Topológicas
◉ Clustering coefficient: tendência de agrupamento ◉ Neighborhood overlap: força dos laços◉ Adamic-Adar: mais peso para baixo grau ◉ Preferential attachment: rico mais rico ◉ Resource Allocation: influência indireta ◉ Tieness: NO + W (Brandão)
Nossas
Métricas
Propriedades Semânticas
◉ #Shared Repositories: entre par de nodos
◉ Jointly developers contribution to shared repositories: relativo a outros no mesmo repositório
◉ Jointly developers commits to shared repositories ◉ Jointly developers weighted commit to shared
repositories: relativo a #linhas nos commits Temporais
◉ Previous Collaboration: relativo ao #desenvolvedores ◉ Global + Local Potential Contributions
Análises
◉ O número de conexões entre
desenvolvedores varia de acordo
com a linguagem de programação
◉ Poucos pares de desenvolvedores
interagem em mais de um
repositório
◉ Análises permitem
○ Definir um modelo computacional para o desenvolvimento de software
○ Ranquear desenvolvedores [próximo]
Aplicação: Ranking
Tieness +Jointly developers Weighted Commit to Shared Repositories
*Nova*
Modelagem
A maior parte dos desenvolvedores atua num
repositório em
janelas de tempo
diferentes
Exemplo real da rede:
❏ Repositório JavaScript com 55 nós
❏ Duração: março/2012 a setembro/2015
❏ Arestas: 1.485 ❏ Densidade: 1,000 ❏ Grau Médio: 54,0 ❏ Arestas: 571 ❏ Densidade: 0,385 ❏ Grau Médio: 20,8 56
*Nova*
Modelagem
Software
◉
Caracterização e Evolução
○
Várias variáveis
○
Análise de produtividade do time
○
Ranking individual
◉
Prospecção, talvez principais aplicações
○
Predição de evolução
○
Predição de custo
○
Recomendação de especialistas
○
Recomendação de times
Genoma de Relacionamentos
Desenvolvimento Colaborativo
Genoma de Relacionamentos
◉ Como pessoas interagem ◉ Com métricas específicas
◉ Caracterização (como é)
◉ Evolução (como veio a ser)
◉ Prospecção (como será)
57
4. Finalmente
Mais Redes
◉ Thiago Prado, Mirella M. Moro “Review Recommendation for
Points of Interest’ Owners”. Em: ACM Hypertext 2017.
◉ Wladston Viana, Ana Paula Couto e Silva, Mirella M Moro.
“Pick the Right Team and Make a Blockbuster: a Social
Analysis through Movie History”. Em: ACM SAC 2016.
◉ Leandro A. A. Silva, Johnnatan Messias, Mirella M. Moro, Pedro
Olmo Vaz de Melo, Fabricio Benevenuto. “Algoritmos de
Aprendizado de Máquina para Predição de Resultados das Lutas de MMA”. Em: SBBD Short Paper 2016.
Mais Aplicações
◉ Luciana Maroun, Mirella Moro, Jussara Almeida, Ana Paula C.
da Silva. “Assessing Review Recommendation Techniques
under a Ranking Perspective”. Em: ACM Hypertext 2016.
◉ M. A. Brandão & M. M. Moro. Strength of Co-authorship Ties
in Clusters: a Comparative Analysis. Em: AMW 2017.
◉ M. O. Silva, M. A. Brandão & M. M. Moro. A Força dos
Relacionamentos Pode Medir a Qualidade de Comunidades?
Em: SBBD Short Papers 2017.
“Genoma” até o momento
◉ Perspectivas diferenciadas
○ Força relacionamentos○ Adição de semântica dependente de contexto ○ Análise comparativa com estado-da-arte
○ Evolução temporal → prospecção
◉ Compreensão atual e da evolução
Próximos Passos
◉
Ampliar análises para outros dados, contextos
◉
Aplicações em potencial
○
Ranking, recomendação, predição, etc
○
Software: custo, especialistas, times
Agradecimentos
Equipe, em especial Michele A. Brandão CNPq, CAPES, FAPEMIG, UFMG
Contato
◉
mirella@dcc.ufmg.br
◉