• Nenhum resultado encontrado

Information Cascades. Ana Paula Fabrício Benevenuto

N/A
N/A
Protected

Academic year: 2021

Share "Information Cascades. Ana Paula Fabrício Benevenuto"

Copied!
37
0
0

Texto

(1)

Information Cascades

Ana Paula

(2)

Following the crowd

• Pessoas são influenciadas por outras

– Produtos que compram

– Atividades que participam

– Tecnologias que utilizam

– Etc.

(3)
(4)

Movimento de manadas

Um experimento

(5)

Movimento de manadas

Um experimento

• Há uma decisão a ser feita

• Pessoas tomam decisões sequencialmente e

observam as decisões tomadas anteriormente

• Cada pessoa tem uma informação privada que

ajuda a tomar a decisão

• A pessoa pode tomar a decisão baseada na

informação privada ou na informação

(6)

Movimento de manadas

Um experimento

• Primeiro aluno:

– Decisão simples baseada em informação privada

• Segundo aluno

– Confirma a decisão do primeiro aluno

– Ou decide. Espera-se que siga a informação privada

• Terceiro aluno

– Se os dois anteriores fizeram escolhas diferentes, ele precisa desempatar. Tende a seguir informação privada.

– Senão tende a seguir a maioria e ignorar informação privada

• Quarto aluno em diante

(7)

Bayes’ Rule: A Model of Decision Making under

Uncertainty

• Qual a probabilidade de termos a maioria vermelha,

dado que o papel que eu tirei e as escolhas das

outras pessoas?

• Qual a probabilidade de se escolher o melhor

restaurante, dadas as revisões que eu li sobre eles?

“We will compute the probabilities of various events,

and use these probabilities to reason about decision

making.”

(8)

Conditional Probability

“… we need to consider the probability of A given

that some other event B has occurred.

...

We will refer to this quantity as the conditional

(9)
(10)

Conditional Probability of A given B

and the Bayes’ Rule

(11)

Examples of Bayes’ Rule

(12)
(13)
(14)
(15)

Lessons from Cascades

• Cascades can be wrong

– Divergence on the literature (Book: The Wisdow of the Crowds)

• Cascades can be based on very little information

• Cascades are fragile

(16)

Cascades on Real Data

(17)

An experimental study of opinion influenceability

Przemyslaw A. Grabowicz, Francisco Romero-Ferrero, Theo Lins, Gonzalo G. de Polavieja, Fabrício Benevenuto, Krishna P. Gummadi

(18)
(19)
(20)

ACM IMC 2011

On Word-of-Mouth Based Discovery of the Web.

Tiago Rodrigues, Fabricio Benevenuto, Meeyoung Cha, Krishna Gummadi, Virgílio Almeida.

(21)

Extração de URLs

• Tradução de URLs encurtadas

21 http://is.gd/AtF4g

http://bit.ly/ZwW77

(22)

Modelando propagação de informação

• Modelo de Árvore Hierárquica

22 A C B D Initiator Spreader Spreader Receiver Audience

(23)

Qual a estrutura típica de árvores de

propagação?

Árvores são muito mais largas do que altas

23 A C B D 3 2 147 38,418

(24)

Propagação no Twitter Cascades vs.

Propagação por E-mails

• D. Liben-Nowell and J. Kleinberg

– Tracing Information Flow on a Global Scale using

Internet Chain-Letter Data, PNAS, 2008

24 Internet Measurement Conference 2011

e-mail Twitter

(25)

Quão importante é o papel da

propagação na audiência?

• Mais popular: 426.820 espalhadores e audiência

de 28M de usuários

• Propagação pode resultar em grandes cascatas

(26)

O que essas análises inspiraram

• Ideia

: Encontrar usuários que adotam e espalham

amplamente novas tendências

– Algoritmo para identificação de trendsetters

• Como encontrá-los?

– Algoritmo do Pagerank com peso baseado no tempo de postagem

– Modelo de identificação de tópicos

(27)

ACM KDD 2012

Finding Trendsetters in Information Networks.

Diego Saez-Trumper, Giovanni Comarela, Virgílio Almeida, Ricardo Baeza-Yates, Fabrício Benevenuto.

(28)

Quem são os trendsetters nesse grafo?

(29)

Quem são os trendsetters nesse grafo?

(30)

Quem são os trendsetters nesse grafo?

30

Como encontrá-los?

- Algoritmo do Pagerank com peso baseado no tempo de postagem

- Modelo de identificação de tópicos

(31)

Computer Networks 2012

Delayed Information Cascades in Flickr: Measurement, Analysis, and Modeling.

Meeyoung Cha, Fabrício Benevenuto, Young-Yeol Ahn and Krishna Gummadi.

(32)

32

Propagação de informação no Flickr

Fav

Fav Fav Fav

• Rede de amizades possui propriedades small-world

– A topologia é apropriada para a propagação de informação

(33)

Padrão de Crescimento Agregado

 5,346 photos (Mais velhas do que 1 ano com mais de 100 fans)

Fotos ganham popularidade lenta e continuamente. Usuários do Flickr demoram até descobrir novas fotos.

(34)

Comparando padrões de crescimento:

teoria vs. prática

 Teorias Populares (Diffusion of innovations, Bass diffusion model, SIR model) sugerem padrão de crescimento com curva em S

Teoria

Growth Deceleration

Saturation

Rapid acceleration

time

Dados reais do Flickr

Growth

time

Steady growth

(35)

35

Teste de diversas hipóteses

• Crescimento do sistema?

– Padrão observado mesmo quando novos usuários foram desconsiderados

• Hipótese: Excesso de informação é uma fonte de atraso na propagação de informação

– Frequência do login no Flickr

– Usuários só acessam as primeiras páginas de conteúdo

Recovered Infected Susceptibleb Recovered Susceptibleb Exposed Infected s 1-b

(36)

ICDM 2013

Prominent Features of Rumor Propagation in Online Social Media

Sejeong Kwon, Meeyoung Cha, Kyomin Jung, Wei Chen, and Yajun Wang

(37)

23/04/2013 1:07PM plunge by $136 billion 2:13PM 37

Referências

Documentos relacionados

Embora a informação fornecida seja geralmente tratada como privada na Pichelaria Veiga, os dados recolhidos serão utilizados em conformidade com o Regulamento Geral de Proteção de

Contudo, na década de 70, estudos apontavam a preocupação com a geração de informação, que dificultava a escolha do produto decorrente da oferta de variedades e de seus

Existem diversos tipos de ferramentas para simulação, este trabalho se limita a estudar a simulação baseada em agentes utilizando o software gratuito NetLogo,

1. O Fundo orientará a sua política de investimento por princípios de rigor, rendibilidade e diversificação de risco, visando a maximização do valor das Unidades

Quando questionados sobre o uso que fazem da informação, responderam que procuram qualificá-las para que possam ser trabalhadas de acordo com os interesses específicos de cada um

A partir da análise da Figura 4, verificou-se que a composição dos atores sociais para o formato virtual da rede de comunicação da informação é parecida com a analisada dentro

Transferir o exercício do direito de paternidade para o organizador da obra coletiva, em última análise, seria desconstituir um direito que só pode ser reconhecido em favor

Embora a informação fornecida seja geralmente tratada como privada na Faplana, os dados recolhidos serão utilizados em conformidade com o Regulamento Geral de Proteção de