• Nenhum resultado encontrado

Estatística de Redes Sociais

N/A
N/A
Protected

Academic year: 2021

Share "Estatística de Redes Sociais"

Copied!
30
0
0

Texto

(1)

Estatística de Redes Sociais

Antonio Galves

Módulo 1

Motivação, quadro conceitual e perguntas básicas

(2)

As marcas mais valiosas do mundo em 2020

1. Apple- Valor: US$ 205,5 bilhões. Receita: US$ 265,8 bilhões. 2. Google- Valor: US$ 207,5 bilhões.

Receita: US$ 145,6 bilhões. 3. Microsoft- Valor: US$ 162,9 bilhões.

Receita: US$ 125,8 bilhões. 4. Amazon- Valor: US$ 134,5 bilhões.

Receita: US$ 260,5 bilhões 5. Facebook- Valor: US$ 70,3 bilhões.

Receita: US$ 49,7 bilhões.

(3)

Redes sociais com mais membros ativos

1. Facebook- 2740 milhões. 2. YouTube- 2291 milhões. 3. WhatsApp- 2000 milhões. 4. Instagram- 1221 milhões. 5. Tik Tok- 689 milhões 6. Twitter- 353 milhões.

fonte: www.statista.com

(4)

Número de usuários do Facebook até abril de 2020

1. India: 280 milhões 2. EUA: 190 milhões 3. Indonesia: 130 milhões 4. Brasil: 120 milhões

fonte: www.statista.com

(5)

Número de usuários do WhatsApp até 2019

1. India: 340 milhões 2. Brasil: 99 milhões 3. EUA: 68,1 milhões

fonte: www.statista.com

(6)

Número de usuários do Twitter até abril 2020

1. EUA: 64,2 milhões 2. Japão: 48,45 milhões 3. Russia: 23,55 milhões 4. Reino Unido: 17,75 milhões 5. Arábia Saudita: 15 milhões 6. Brasil: 14,35 milhões

fonte: www.statista.com

(7)

Um problema interdisciplinar

O estudo de redes sociais

I exige a construção de novos modelos probabilísticos;

I apresenta grandes desafios para os estatísticos e os cientistas de dados, dado o caráter parcial das amostras disponíveis. I É preciso discutir desde as ferramentas computacionais que

podem ser usadas para o levantamento de dados nas redes sociais,

I até as questões de fundo que a análise de redes sociais coloca para a Teoria Estatística e para a Ciência de Dados.

(8)

Curso Estatística de Redes Sociais

Objetivos: Fornecer um quadro estatístico para analisar I a transmissão da informação

I a evolução do conjunto de opiniões

I aformação rápida de consenso em redes sociais I a identificação de comunidades homogêneas de opinião I a identificação de relações de influência em redes sociais

(9)

Formação rápida de consenso em redes sociais

Estudo de caso: as eleições para governador do Rio de Janeiro em 2018.

Resumo:

I As sondagens de intenção de votos indicavam uma disputa acirrada entre Romário e Eduardo Paes.

I Apurados os votos, apareceu em primeiro lugar um obscuro candidato que nas sondagens aparecia numa longínqua terceira posição, ficando Romário fora da disputa.

(10)

Estudo de caso: eleições para senador em 2018

I Na disputa para o Senado no Paraná, Minas Gerais e S.Paulo, Roberto Requião, Dilma Roussef e Eduardo Suplicy,

respectivamente, apareciam largamente na frente em todas as sondagens.

I Os tres foram surpreendentemente derrotados nas urnas.

(11)

Estudo de caso: eleicões presidenciais de 2018

I Nas avaliações das intenções de voto para presidente, nenhuma sondagem previu que o Cabo Daciolo ficaria na frente de Henrique Meirelles e Marina Silva, nem que Alckmin só teria a metade dos votos estimados pelas pesquisas prévias.

I Finalmente e mais importante, as sondagens não previram a quase vitória no primeiro turno do candidato Bolsonaro.

(12)

O que aprendemos com as pesquisas de boca de

urna?

I A pesquisa de boca de urna feita pelo IBOPE no dia mesmo da eleição apontou com muita precisão o resultado que sairia efetivamente das urnas.

I O acerto da pesquisa de boca de urna sugere que a escolha de cidades e grupos sociais utilizada pelos institutos reflete

corretamente a diversidade entre regiões e grupos sociais brasileiros.

I Sugere também que o número de eleitores entrevistados nas pesquisas dos dias anteriores era suficientemente grande para apontar com precisão o resultado da eleição.

(13)

Como explicar o erro nas pesquisas de intenção de

voto?!

I No dia 18 de outubro de 2018 a Folha de S.Paulo publicou um artigo da jornalista Patrícia Campos Mello cujo título era: Empresários bancam campanha contra o PT pelo WhatsApp.

I Mas pode uma campanha no WhatsApp explicar os erros nas predições dos institutos de pesquisa?!

(14)

O que o WhatsApp tem a ver com o erro de predição?

I Mauro Paulino, diretor do instituto DataFolha sugere a resposta a essa pergunta. Num texto publicado em sua conta no Twitter ele diz:

I “PESQUISAS ELEITORAIS evidenciaram a impulsão da onda nos momentos finais. RJ, MG e DF são claros exemplos. Ao se comparar as fotos das vésperas, registradas por Ibope e Datafolha, em comparação com a foto das urnas, o fenômeno é claramente explicitado.”

(15)

Uma onda nos últimos dias?

I Se Mauro Paulino tem razão, houve uma mudança brusca nas intenções de voto nos últimos dias antes da eleição.

I Conjectura-se que essa mudança foi provocada por uma campanha feita nas redes sociais.

I Verificar a plausibilidade dessa conjectura é um desafio científico.

I É preciso modelar estatisticamente como uma onda que muda a opinião de uma grande massa de eleitores em um tempo curtíssimo pode ocorrer numa rede social.

(16)

Aumento explosivo do tráfego no Twitter

Estudo de caso:

I A discussão nas redes sociais gerada pelo Big Brother Brasil 2020 fez com que o tráfego de usuários no Twitter atingisse 3 vezes a capacidade máxima suportada pelos servidores da América do Sul.

I Para evitar a queda do site foi necessário que o tráfego fosse distribuído para os servidores de armazenamento na nuvem do Google e da Amazon.

fonte: https://blog.twitter.com/

(17)

Exemplo: Aumento explosivo do tráfego no Twitter

fonte: https://blog.twitter.com/

(18)

O fenômeno do cancelamento

A Billionaire-Funded Website With Ties to the

Far Right Is Trying to “Cancel” University

Professors

Fonte:The Intercept

(19)

Como modelar uma Rede Social

O modelo tem duas componentes básicas:

1. Uma descrição dasinteraçõesentre os membros da rede (doravante chamados atores).

Observação: Grafoé o nome do objeto matemático que descreve as interações entre os atores.

2. Umafunção probabilísticadescrevendo como a opinião dos demais atores afeta a opinião de cada ator específico.

(20)

O modelo do votante

I Um modelo simples de Rede Social.

I Um conjunto finito de atores que interagem entre si.

I Cada ator emite ao longo do tempo opiniões a respeito de um determinado assunto.

I Essas opiniões podem ser oua favor(+1) oucontra(-1). I O sentido de cada nova opinião emitida por um atordepende

probabilisticamentedas últimas opiniões emitidas por seus influenciadores.

I Atenção: um único ator emite opinião a cada instante.

(21)

O modelo do votante

I A = {1, 2, ..., N }: conjunto de atores, onde N é um número inteiro positivo.

I O = {+1, −1}: conjunto de opiniões possíveis.

I Para cada ator a ∈ A, denotamos V·→ao conjunto dos influenciadores de a.

I An∈ A: ator que emitiu uma opinião no instante n.

I Xn(a) ∈ O: última opinião emitida pelo ator a, até o instante n. I Xn= (Xn(a) : a ∈ O): lista com as últimas opiniões emitidas

pelo conjunto de atores, até o instante n.

(22)

Exemplo de conjuntos de influenciadores

I Seja A = {1, . . . , N } o conjunto de atores da rede;

I Para cada ator a ∈ A, denotamos V·→ao conjunto de seus influenciadores,

I Se a = 2, . . . , N − 1, V·→a= {a − 1, a + 1} I V·→1= {N, 2}, V·→N = {N − 1, 1}.

(23)

Exemplo com N = 6

1 3 2

4

5 6

(24)

Evolução das opiniões no modelo do votante

I Começamos com o vetor

X0= (X0(a) : a ∈ A)

com a lista inicial de opiniões de todos os atores.

I Em cada instante n ≥ 1, primeirosorteamos o ator Anque vai emitir uma opinião no instante n. Esse sorteio é feito

uniformemente em A;

I Para decidir que opinião emitir, o atorAnsorteia uniformemente um de seus influenciadores, isto é, um ator em V·→An, e

reproduz a última opinião que este influenciadoremitiu até o instante n − 1.

(25)

Q U I Z

I A = {1, 2, 3, 4, 5, 6}.

I V·→a= {a − 1, a + 1}para a = 2, . . . , 5, I V·→1= {6, 2}, V·→6= {5, 1}.

I X0(1) = −1, X0(2) = −1, X0(3) = −1, X0(4) = 1, X0(5) = 1, X0(6) = 1. I Se A1= 2, quanto vale X1?

(26)

R E S P O S T A

I O primeiro ator a se manifestar é o ator A1= 2. I Seus dois influenciadores são os atores 1 e 3.

I Logo, a opinião emitida pelo ator A1= 2forçosamente será a opinião −1.

I Como −1 já era a opinião inicial do ator 2, teremos que X0(2) = X1(2) = −1.

I Ora, o único o ator que pode mudar de opinião no instante 1 é A1.

I Logo, X1= X0.

(27)

Q U I Z

I A = {1, 2, 3, 4, 5, 6}.

I V·→a= {a − 1, a + 1}para a = 2, . . . , 5, I V·→1= {N, 2}, V·→6= {5, 1}.

I X0(1) = −1, X0(2) = −1, X0(3) = −1, X0(4) = 1, X0(5) = 1, X0(6) = 1.

I Que atores devem se expressar no instante 1 para eventualmente termos X16= X0?

(28)

R E S P O S T A

I X16= X0só se X0(A1) 6= X0(b)para algum ator b ∈ V·→A1.

I Isso ocorre com os atores 1, 3, 4 e 6.

(29)

Um algoritmo para simular o modelo do votante

1. Escolho arbitrariamente a lista inicial de opiniões X0= (X0(a), a ∈ A)

2. Para n = 1, . . . , T , onde T ≥ 1 é um número inteiro arbitrário: 2.1 Sorteie Anindependentemente dos sorteios passados, com

P{An= b} = 1/|A|, para todo b ∈ A, onde |A| é o número de elementos de A

2.2 Tendo gerado Xn−1= (Xn−1(a) : a ∈ A)e sorteado An= b, sorteie In∈ V·→b, com probabilidade uniforme e defina

On= Xn−1(In)

2.3 Para todo a ∈ A, defina Xn(a) = On, se a = Ane X (a) = X (a), se a 6= A .

(30)

Exercícios

1. Escreva um código implementando o pseudo-código apresentado na transparência anterior.

2. Utilize esse código para simular rede social do exemplo dado na aula, com N = 10 e T = 100 e T = 1000.

3. O que a simulação sugere em termos de constituição de consenso na rede?

4. Para quais valores das listas iniciais de opiniões X0, teremos Xn= X0, para todo n ≥ 1?

Referências

Documentos relacionados

Diante da proposta de discutir as idéias decorrentes das comunidades virtuais de professores, voltada para a qualidade das conexões entre os atores da rede e de seus conteúdos

✓ Os professores proponentes dos projetos aprovados deverão, dentro do prazo máximo de 15 dias corridos após o lançamento do edital do resultado preliminar, assinar um

Neste sentido, a proposta deste trabalho foi analisar se os sensibilizadores da insulina, neste trabalho representados pela troglitazona e met- formina, podem alterar o

O objetivo deste trabalho foi avaliar épocas de colheita na produção de biomassa e no rendimento de óleo essencial de Piper aduncum L.. em Manaus

2. Instale e aperte os parafusos de forma homogênea da tampa da extremidade do mancal de impulso e da estrutura do mancal, conforme os valores do torque mostrados na tabela dos

• Por exemplo, o tempo excedido ou destino inacessível Pacote ICMP enviado de volta para o endereço IP de origem.. • Inclui as informações de erro (por exemplo, tipo

• Suponhamos que você esteja sendo contratado como consultor de rede para instalar uma rede em uma nova empresa ou em novo escritório de uma grande empresa. Quais seriam os fatores

• Retardo de transferência -> é a soma dos dois retardos o de acesso + o de transmissão, assim tendo o tempo total de criação e envio do pacote de informações.... Kleber