• Nenhum resultado encontrado

Pesquisas em Redes Sociais Em Busca do Genoma de Relacionamentos Profissionais. Mirella M. Moro

N/A
N/A
Protected

Academic year: 2021

Share "Pesquisas em Redes Sociais Em Busca do Genoma de Relacionamentos Profissionais. Mirella M. Moro"

Copied!
63
0
0

Texto

(1)

Pesquisas em Redes

Sociais

Em Busca do Genoma de Relacionamentos Profissionais

Mirella

M.

Moro

(2)

Todos Sabem

Fonte: https://marketingstrategyx.com/wp-content/uploads/2017/02/social-media-stats-infographic-2017.png

● O que é uma Rede Social ● As mais usadas

● Quem as usa ● Como usá-las

● Como lucrar com elas (?) ● As pessoas influentes (?) ● Como evoluem (?)

(3)

Resumindo

Mídias Sociais N:Pessoas/orgs.DomíniosObjetivosDados <<<<<<<... Fonte: https://www.webygeeks.com/social-media-optimization-or-smo/content-types-which-social-media-users-love 3

(4)

Pesquisas em Redes

Sociais

(5)

The Human Genome Project (HGP) was an

international scientific research project with the

goal of determining the sequence of nucleotide

base pairs that make up human DNA, and of

identifying and mapping all of the genes of the

human genome from both a physical and a

functional standpoint.

Já em Redes Sociais

>>>>>>>>

(6)

Genoma > Redes Sociais?

Indivíduos + Orgs.

Modelos

Padrões

Métricas

...

Redes

Sociais

Caracterizar + Desvendar

Relacionamentos

6

(7)

Então

1 Esforço internacional → vários

1 Indivíduo como foco → vários indivíduos

1 Tipo de DNA → vários tipos de relacionamentos

(8)

Artigos / Ano em Computação

Social Networks

10.116

☺17.695

● Conference and Workshop Papers (5.263) Journal Articles (3.383)

Informal Publications (839)

Parts in Books or Collections (228) Reference Works (148)

Books and Theses (129) Editorship (112)

Withdrawn Items (14)

Exemplos de precursores

Linton C. Freeman: Centered graphs and the

structure of ego networks. Mathematical Social

Sciences 3(3): 291-304 (1982)

● Ian H. Witten, Harold W. Thimbleby, George Coulouris, Saul Greenberg: Liveware: A New

Approach to Sharing Data in Social Networks.

International Journal of Man-Machine Studies 34(3): 337-348 (1991)

(9)

Não apenas na

Computação

(10)

Valor de Redes Sociais

Examples of the effects of social networks on economic activity are

abundant and pervasive, including roles in transmitting information about jobs, new products, technologies, and

political opinions The people with whom we interact on a

regular basis, and even some with whom we interact only sporadically, influence our beliefs, decisions and behaviors

Matthew O. Jackson: An Overview of Social Networks and Economic Applications. In: Handbook of Social Economics.

(11)

Valor de Redes Sociais

Given the many roles of

networks in economic

activity, they have become

increasingly studied by

economists.

Networks of relationships among

various firms and political organizations affect research and development,

patent activity, trade patterns, and political alliances

Matthew O. Jackson: An Overview of Social Networks and Economic Applications. In: Handbook of Social Economics.

(12)

Não apenas para a

Computação

(13)

pixabay.com

Dengue no Brasil

Mineração de dados do Twitter

◉ Detecção de surtos

◉ Predição de surtos futuros

◉ Ações de combate apropriadas

(14)

Genoma de Relacionamentos

Profissionais

Profissionais

◉ Pessoais ←→ psique humana

◉ Dados disponíveis ou coletáveis

◉ Amplo campo aberto

Genoma de Relacionamentos

◉ Como pessoas interagem

◉ Com métricas específicas

◉ Caracterização (como é)

◉ Evolução (como veio a ser)

◉ Prospecção (como será)

(15)

A Seguir

1.

Conceitos base

2.

Taxonomia para redes profissionais

3.

Força dos relacionamentos

a.

Redes acadêmicas

b.

Redes de desenvolvimento colaborativo de software

4.

Finalmente: outras pesquisas e trabalhos futuros

(16)
(17)

Conceitos de Redes Sociais

Dado

Rede social

Indivíduos (orgs.)

Relacionamentos

Modelado

Grafo

Nodos

(vértices)

Arestas

(links) 17

Calculado

(e.g.)

Coeficiente clusteriz.

Grau e closeness

Betweeness e overlap

1

(18)

Modelagem de Redes Sociais

Bipartido

Multipartido

Multigrafo

Multinível

(19)

Rede

Heterogênea

GitHub

Relationship based on contributing to the same repository

User X follows user Y

User X opened an issue assigned to Y Users commented in the same issue User X watches a repository owned by Y

JavaScript Developer Network

Python Developer Network

Ruby Developer Network

(20)
(21)

Redes Sociais

Profissionais

Online Offline Publicação Gerência de Processo Networking Profissional Blog Repositório / Competições Troubleshooting Edição compartilhada Controle de versões Marketing Habilidades Área de discussão Negócios Especialistas Compartilhar publicações Encontrar colaboradores Perguntar/responder questões Pesquisa Encontrar / Publicar Empregos

Interações

Sociais

Estrutura e

Semântica

Para lucro

Proc. operacionais Proc. gerência e suporte

Produtividade Citações Qualidade pesquisa Individual Intra/inter grupo 21 M. A. Brandão & M. M. Moro. Social Professional Network: a Survey and Taxonomy.

(22)

Problemas em redes sociais relacionados à manutenção e utilização

Questões

Tarefas

Problemas cujas soluções se beneficiam da utilização de dados de redes sociais

(23)

Questões

Coletar

Armazenar

Gerenciar

Tratar

dados das redes

Taxonomia

Tarefas

Como redes (dados) são

Analizadas

Utilizadas

Melhoradas

Aplicadas

(24)
(25)
(26)

Força dos Relacionamentos

Propriedade das arestas do grafo

que representa a rede social

Relacionamentos não são

igualmente importantes

Tie Strength

3

(27)

"Tie strength may be measured by a combination of

the amount of time, the cooperation intensity and

the reciprocal services that characterize the tie"

[Granovetter, 1973]

Como Medir a Força?

(28)

Como medir força de coautoria

Como identificar aspectos que impactam nesta força

Como a força está definida para redes temporais

Como a força varia no tempo

Redes Acadêmicas

28

a

(29)

M. A. Brandão & M. M. Moro. Analyzing the Strength

of Co-authorship Ties with Neighborhood Overlap.

In DEXA 2015.

M. A. Brandão, M. A. Diniz & M. M. Moro. Using

Topological Properties to Measure the Strength of Co-authorship Ties. In BraSNAM 2016.

M. A. Brandão & M. M. Moro. The Strength of

Co-authorship Ties through Different Topological Properties. JBCS, 23(1):5, 2017.

M. A. Brandão, P. O. S. V. Melo & M. M. Moro. Tie

Strength Dynamics over Temporal Co-authorship Social Networks. In: Web Intelligence, 2017.

Redes de Coautoria

OUTRAS ANÁLISES

L.H.C Lima et al. JBCS v.23, 2017.

T.H.P. Silva et al. Scientometrics v.113, 2017. T.H.P. Silva et al. Scientometrics v.107, 2016.

L. Mota et al. In SBBD 2015.

T.H.P. Silva et al. In JCDL 2014.

M.A. Brandão et al. In WWW, 2013. H. Lima et al. In JCDL 2013.

G.L. Lopes et al. IJCS&A, v. 9, 2012.

G.L. Lopes et al. In WWW/Internet, 2011. A.H.F. Laender et al. In SEMISH 2011. G.L. Lopes et al. In ICITA 2011.

(30)

Distribuição

#autores/área

Sociologia:

7.195 publicações

84% um autor apenas

Qualquer análise:

limitada a áreas com

boa colaboração

(31)

Problemas com

NO e W

#1 Sem coautor comum #2 Muitos coautores #3 Limites

#4 Comunidades

(32)

Tieness: Nova Métrica

32

(33)

Análises Bases Reais

33

Base de Dados

#Nodos

#Arestas

Período

DBLP Articles

837.583

2.935.590 2000-2015

DBLP Inproceedings

945.297

3.760.247 2000-2015

PubMed

443.784

5.550.294 2000-2016

(34)

Tieness

Caso Real

CoautorTop 10 - José Palazzo M. de OliveiraW (freq.) NO Tieness

Leandro krug Wives 26 0.31 0.48 Ana Marilza Pernas 14 0.2 0.26 Stanley Loh 11 0.12 0.148 Isabela Gasparini 11 0.12 0.148 Daniel Lichtnow 10 0.17 0.21 Marcelo Soares Pimenta 10 0.09 0.116 Giseli Rabello Lopes 8 0.054 0.072 Alencar Machado 7 0.072 0.096 José Valdeni de Lima 6 0.109 0.128 Mirella M. Moro 6 0.055 0.068

34

NO ≠ Tieness

(35)

Tieness

Caso Real

CoautorTop 10 - José Palazzo M. de OliveiraW (freq.) NO Tieness

Leandro krug Wives 26 0.31 0.48 Ana Marilza Pernas 14 0.2 0.26 Stanley Loh 11 0.12 0.148 Isabela Gasparini 11 0.12 0.148 Daniel Lichtnow 10 0.17 0.21 Marcelo Soares Pimenta 10 0.09 0.116 Giseli Rabello Lopes 8 0.054 0.072 Alencar Machado 7 0.072 0.096 José Valdeni de Lima 6 0.109 0.128 Mirella M. Moro 6 0.055 0.068

35

Como

diferenciar??

(36)

tempo

(37)

Estático vs. Dinâmico

(38)

Class Interaction frequency Common Friends Interaction intensity

strong high high high

bridge+ high low high

transient low high high

periodic high high low

bursty low low high

bridge high low low

weak low high low

random low low low

STACY

Strength of Ties Automatic

Classifier over the Years

Neighborhood overlap

# of common friends

Edge persistence

interaction frequency

(39)

STACY

Strength of Ties Automatic

Classifier over the Years

Neighborhood overlap (# of common friends) Edge persistence (interaction frequency) Co-authorship frequency

(40)

Genoma de Relacionamentos

Co autoria

Coautoria

Bases de dados diversas: cv,

bibliotecas digitais, citações

Evolução: fácil → anual

Prospecção: predição de links

Lopes - recomendação

Genoma de Relacionamentos

Como pessoas interagem Com métricas específicas Caracterização (como é) Evolução (como veio a ser)Prospecção (como será)

40

(41)

Força de desenvolvimento

Métricas + semântica + tempo

Redes Software

41

b

(42)

Social Coding : desenvolvimento de software através da

colaboração (online) entre programadores

(43)

Rede de

Colaboração

(44)

Tarefa primordial da área de BD

Enriquecer dados existentes em

busca de informações relevantes

(45)

Informação

Relevante

Força de

Colaboração :

Desenvolv.

Colaborativo

de Software

Caracterização Rocha et al@SBBD16: Análise de contribuição de código entre repositórios do GitHub Batista et al @ SBBD DSW 2017: GitSED Brandão & Moro @ ComCom 2017: Social professional networks- a survey and taxonomy

Métricas

Alves et al@SBBD16: The strength of social coding collaboration on GitHub Semântica

Batista et al @ WI17: Collaboration strength metrics and analyses on GitHub Tempo

Batista et al @ SBBD17: Aspectos Temporais para Medir a Força da Colaboração no GitHub. Janelas Temporais

Próximos Capítulos

Recomendação de times Predição de links

(planejamento, custos, etc)

Enriquecimento

(46)

46

# Skill programming languages

Maioria: 1-5 LPs

(47)

More Collaborative languages Less collaborative languages Very collaborative languages Medium collaborative languages Assembly Pascal VisualBasic Perl JavaScript PHP Python Ruby Java C C++ C#

Grau de

colaboração

entre as

linguagens

47

(48)

Trabalhos

Relacionados

Medem a força de interação de

modos diferentes. Entretanto

nenhum avalia a melhor maneira de

medir a força

nenhum investiga a correlação entre

as métricas

48

(49)

Nossos Trabalhos

GitSED - GitHub Socially Enhanced Dataset

curado (específico para 2-3 linguagens)

aumentado (externos ao GHTorrent)

enriquecido (métricas de redes sociais)

Novas métricas para força de colaboração em social coding:

commits’ number of lines

potential of contribution

prior social interaction

Avalia todas as métricas (com

existentes) em redes: JavaScript e Ruby

(50)

GitSED

(51)

Métricas e

Análises

Propriedades Topológicas

Clustering coefficient: tendência de agrupamentoNeighborhood overlap: força dos laços

Adamic-Adar: mais peso para baixo grauPreferential attachment: rico mais ricoResource Allocation: influência indiretaTieness: NO + W (Brandão)

(52)

Nossas

Métricas

Propriedades Semânticas

#Shared Repositories: entre par de nodos

Jointly developers contribution to shared repositories: relativo a outros no mesmo repositório

Jointly developers commits to shared repositoriesJointly developers weighted commit to shared

repositories: relativo a #linhas nos commits Temporais

Previous Collaboration: relativo ao #desenvolvedoresGlobal + Local Potential Contributions

(53)

Análises

◉ O número de conexões entre

desenvolvedores varia de acordo

com a linguagem de programação

◉ Poucos pares de desenvolvedores

interagem em mais de um

repositório

◉ Análises permitem

○ Definir um modelo computacional para o desenvolvimento de software

○ Ranquear desenvolvedores [próximo]

(54)

Aplicação: Ranking

Tieness +Jointly developers Weighted Commit to Shared Repositories

(55)

*Nova*

Modelagem

A maior parte dos desenvolvedores atua num

repositório em

janelas de tempo

diferentes

(56)

Exemplo real da rede:

❏ Repositório JavaScript com 55 nós

❏ Duração: março/2012 a setembro/2015

Arestas: 1.485Densidade: 1,000Grau Médio: 54,0Arestas: 571Densidade: 0,385Grau Médio: 20,8 56

*Nova*

Modelagem

(57)

Software

Caracterização e Evolução

Várias variáveis

Análise de produtividade do time

Ranking individual

Prospecção, talvez principais aplicações

Predição de evolução

Predição de custo

Recomendação de especialistas

Recomendação de times

Genoma de Relacionamentos

Desenvolvimento Colaborativo

Genoma de Relacionamentos

Como pessoas interagem ◉ Com métricas específicas

◉ Caracterização (como é)

◉ Evolução (como veio a ser)

Prospecção (como será)

57

(58)

4. Finalmente

(59)

Mais Redes

Thiago Prado, Mirella M. Moro “Review Recommendation for

Points of Interest’ Owners”. Em: ACM Hypertext 2017.

Wladston Viana, Ana Paula Couto e Silva, Mirella M Moro.

“Pick the Right Team and Make a Blockbuster: a Social

Analysis through Movie History”. Em: ACM SAC 2016.

Leandro A. A. Silva, Johnnatan Messias, Mirella M. Moro, Pedro

Olmo Vaz de Melo, Fabricio Benevenuto. “Algoritmos de

Aprendizado de Máquina para Predição de Resultados das Lutas de MMA”. Em: SBBD Short Paper 2016.

(60)

Mais Aplicações

Luciana Maroun, Mirella Moro, Jussara Almeida, Ana Paula C.

da Silva. “Assessing Review Recommendation Techniques

under a Ranking Perspective”. Em: ACM Hypertext 2016.

M. A. Brandão & M. M. Moro. Strength of Co-authorship Ties

in Clusters: a Comparative Analysis. Em: AMW 2017.

M. O. Silva, M. A. Brandão & M. M. Moro. A Força dos

Relacionamentos Pode Medir a Qualidade de Comunidades?

Em: SBBD Short Papers 2017.

(61)

“Genoma” até o momento

◉ Perspectivas diferenciadas

○ Força relacionamentos

○ Adição de semântica dependente de contexto ○ Análise comparativa com estado-da-arte

○ Evolução temporal → prospecção

◉ Compreensão atual e da evolução

(62)

Próximos Passos

Ampliar análises para outros dados, contextos

Aplicações em potencial

Ranking, recomendação, predição, etc

Software: custo, especialistas, times

(63)

Agradecimentos

Equipe, em especial Michele A. Brandão CNPq, CAPES, FAPEMIG, UFMG

Contato

mirella@dcc.ufmg.br

bit.ly/proj-apoena

PDFs, PPTs, datasets, código

Referências

Documentos relacionados

Este capítulo apresentou o desenvolvimento da estrutura sonora para a integração do feedback sonoro nas aplicações do dispositivo SHaRe e do dispositivo WESt, de forma a

Off-line samples were taken and analyzed by X ray diffraction, scanning electron microscopy (SEM), and by light scattering. Using the on- line and off-line data, mathematical

Program and Book of Abstracts XXVI Meeting of the Portuguese Association for Classification and Data Analysis CLAD 11–13 April 2019 Viseu, Portugal

Essas tarefas, para nossa organização didática, são identificadas como Localizar um ponto no plano, Determinar a distância entre dois pontos dados, Encontrar a

Tese (doutorado) – Universidade Federal do Ceará, Centro de Ciências, Programa de Pós-Graduação em Física , Fortaleza, 2012..

O Ministério da Agricultura e Pescas foi criado pelo Decreto- Lei n.º 7/2007, de 5 de Setembro, que aprovou a Orgânica do IV Governo Constitucional, prevendo-se no seu artigo 30.º

Hoje o gasto com a saúde equivale a aproximada- mente 8% do Produto Interno Bruto (PIB), sendo que, dessa porcentagem, o setor privado gasta mais que o setor público (Portal

Biólogo, mestre em ciências (Biologia celular e molecular) pelo instituto oswaldo cruz (ioc/Fiocruz) e egresso do curso técnico de Pesquisa em Biologia Parasitária do mesmo