Estudo de sistemas complexos com interações de longo alcance : percolação, redes e tráfego

(1)

DEPARTAMENTO DE FÍSICA TEÓRICA E EXPERIMENTAL PROGRAMA DE PÓS

-GRADUAÇÃO EM FÍSICA

E

STUDO DE SISTEMAS COMPLEXOS COM

INTERAÇÕES DE LONGO ALCANCE

:

PERCOLAÇÃO

,

REDES E TRÁFEGO

G

ABRIEL

A

LVES

M

ENDES

(2)

E

STUDO DE SISTEMAS COMPLEXOS COM

INTERAÇÕES DE LONGO ALCANCE

:

PERCOLAÇÃO

,

REDES E TRÁFEGO

Tese de Doutorado_{apresentada ao Programa de Pós-Graduação}

em Física do Departamento de Física Teórica e Experimental da Universidade Federal do Rio Grande do Norte como requisito par-cial para a obtenção do grau deDoutor_{em Física.}

Orientador: Prof. Dr. Luciano Rodrigues da Silva

Co-orientador: Prof. Dr. Hans Jürgen Herrmann

(3)

À minha família, especialmente à milha mãeRozilda,

ao meu paiRenio, ao meu irmãoRafael, à minha

irmãNarae à minha princesaEliade.

(4)

Ao meu orientador, professor Dr. Luciano Rodrigues da Silva, pela orientação

e pelas discussões que tanto ajudaram meu mestrado e doutorado. Além de ter sido um grande amigo nesse período.

Ao meu co-orientador professor Dr.Hans Jürgen Herrmannpela orientação e

dis-cussões nesse trabalho, pela oportunidade oferecida de assistir suas aulas no Eidgenössis-che TechnisEidgenössis-che Hochschule Zürich (ETHZ) e trabalhar em um ambiente fantástico numa cidade da ciência.

Ao professor Dr. Umberto Laino Fulcopelas grandes discussões e sugestões que

ampliaram meu horizonte de conhecimento e pela colaboração nesse trabalho.

Ao professor Dr. Douglas Soares Galvãopela chance de trabalhar na

Universi-dade Federal de Campinas e pelas discussões cientíﬁcas.

Aos professores Eudenílson Lins de Alburqueque e Liacir dos Santos Lucena

por oferecerem uma estrutura excelente durante o meu doutoramento.

Ao professorJosé Soares de Andrade Jr. pelas sugestões e discussões que

possi-bilitaram o enriquecimento desta tese.

Aos que foram meus professores e à Celina.

À minha família, Dra. Rozilda, Dr. Renio, Rafael eNara pelos apoios e

incen-tivos.

À minha princesa MSc. Eliade pelo apoio, paciência e companhia durante meu

doutoramento. Sua determinação contagiante me fez superar todas as adversidades pre-sentes em meu caminho.

Aos amigos do DFTE e do ETH, em especial aoTiago Medeiros, ao MSc.Antônio

dos Santos ao professor Dr. Sharon da Cunha, ao Dr. Antonio de Macedo, ao MSc.

Maurício de Almeida, ao MSc. Miller Mendozae ao Dr. Nuno Araújopelas discussões

e ajudas durante o desenvolvimento desse trabalho.

Ao Bundesamt für Raumentwicklung por ceder dados das rodovias suíças. Ao CNPq pelo apoio ﬁnanceiro.

(5)

lê de mais e usa o cérebro de menos adquire a preguiça de pensar.”

(Albert Einstein)

(6)

Nesta tese abordaremos problemas físicos que apresentam um alto grau de com-plexidade utilizando ferramentas e modelos da Mecânica Estatística. Daremos ênfase ao estudo de sistemas com interações de longo alcance dentre estes, o caso da percolação com ligações de longo alcance em cadeias lineares, redes complexas sem métricas e tráfego em redes complexas. O ﬂuxo numa cadeia linear (percolação) com interações de primeiros vizinhos só ocorre empc = 1, porém se levarmos em conta “ligações de longo alcance”

o quadro é completamente diferente, ou seja, a transição entre a fase percolante e a fase não percolante ocorre para um valor de p < 1. Esse tipo de transição continua

ocor-rendo mesmo quando diluímos o sistema (“diluição dos sítios”). Outros efeitos estudados nesse trabalho foram a extensividade do sistema, a evolução das propriedades críticas em função da diluição, etc. Em particular, mostramos que a diluição não altera a universali-dade do sistema. Em outro trabalho, veremos as implicações em utilizar uma distribuição de qualidade obedecendo uma lei de potência na dinâmica de crescimento de uma rede estudada por Bianconi e Barabási. Este incorpora na ligação preferencial as diferentes ha-bilidades (qualidades) dos sítios na competição por ligações. Por último, estudamos o tráfego em redes complexas e na malha rodoviária suiça a fim de entender como o con-gestionamento se alastra numa rede quando submetida a um fluxo crescente de carros. Nesse sentido, desenvolvemos dois modelos que nos possibilitam a análise do fluxo total em todas as ruas, bem como o fluxo nas saídas do sistema e o comportamento do número total de ruas congestionadas.

(7)

In this thesis we investigate physical problems which present a high degree of complexity using tools and models of Statistical Mechanics. We give a special atten-tion to systems with long-range interacatten-tions, such as one-dimensional long-range bond-percolation, complex networks without metric and vehicular traffic. The flux in linear chain (percolation) with bond between first neighbor only happens if pc = 1, but when

we consider “long-range interactions”, the situation is completely different, i.e., the tran-sitions between the percolating phase and non-percolating phase happens forpc <1. This

kind of transition happens even when the system is diluted (“dilution of sites”). Some of these effects are investigated in this work, for example, the extensivity of the system, the relation between critical properties and the dilution, etc. In particular we show that the dilution does not change the universality of the system. In another work, we analyze the implications of using a power law quality distribution for vertices in the growth dynamics of a network studied by Bianconi and Barabási. It incorporates in the preferential attach-ment the different ability (fitness) of the nodes to compete for links. Finally, we study the vehicular traffic on road networks when it is submitted to an increasing flux of cars. In this way, we develop two models which enable the analysis of the total flux on each road as well as the flux leaving the system and the behavior of the total number of congested roads.

(8)

2.1 Vizinhança deνcomkν = 6, resultandocν = 1/3. . . 12

2.2 Exemplo de uma rede com k = 3. Pode-se notar que quandol = 1, temos

N = 31 _{= 3}_{nós visitados. Quando}_l _{= 2}_{, temos}_N _{= 3}2 _{= 9}_{. Quando}_l _{= 3}_,

temosN = 33 _{= 27}_{e assim por diante (}_N _∼_zl_). _{. . . 15}

2.3 Experiência realizada por Stanley Milgram em que ele mostrou que o grau de separação entre duas pessoas é seis. . . 17

2.4 Distribuição de conectividade em lei de potência. a)Distribuição do número

de parceiros durante os últimos 12 meses. b) Distribuição do número de

parceiros durante toda a vida. Figura retirada da ref. [1]. . . 19

2.5 Rede WWW com 235729sítios,< k >= 5.46eγin = 2.1. Figura retirada da

ref. [2]. . . 20

2.6 Processo de evolução do modelo de Erdös e Rényi para diferentes p’s. (1)

Começando com N = 10 nós isolados, conectamos cada par de nós com probabilidadep. (2) e (3) mostram dois estágios diferentes no

desenvolvi-mento do grafo, correspondendo ap = 0.1 ep = 0.15. Podemos perceber o surgimento de árvores (uma árvore de ordem 3, linhas tracejadas) e ci-clos (um ciclo de ordem 3, linha tracejada) num grafo, e um aglomerado conectando metade dos nós emp= 0.15 = 15/N. Figura retirada da ref. [3]. 22

(9)

surgem árvores de ordem 4. Emp∼ N−1 _{estão presentes árvores de todas}

ordens, e ao mesmo tempo aparecem circuitos de todas ordens. A proba-bilidadep ∼ N−2/3 _{marca a aparição de sub grafos completos de ordem 4}

ep ∼ N−1/2 _{correspondendo aos sub grafos completos de ordem 5. Com}

ztendendo a 0, o grafo contém sub grafos completos de ordens crescentes.

Figura retirada da ref. [3]. . . 25

2.8 Distribuição de conectividade do modelo de Erdös e Rényi, para redes com

N = 10000 e p = 0,0006 (círculos), p = 0,001 (quadrados), p = 0,0015

(diamantes). Notemos que os sítios possuem aproximadamente o mesmo número de conexões. Figura retirada da ref. [3]. . . 27

2.9 Comparação entre o caminho médio de uma rede real (símbolos) e a predição da equação (2.16) da teoria de redes aleatórias (linha pontilhada). Figura re-tirada da ref. [3]. . . 29

2.10 Comparação entre o coeﬁciente de agregação das redes reais e dos grafos aleatórios. A linha tracejada corresponde a equação (2.17). Figura retirada da ref. [3]. . . 30

2.11 A ﬁgura mostra três valores de p no modelo de Watts e Strogatz.

Inicial-mente temos uma rede regular, p = 0, com um alto coeﬁciente de agre-gação. A seguir com umpintermediário existe o efeito de mundo pequeno,

devido as distâncias pequenas entre os sítios e ao alto valor do coeﬁciente de agregação. Na rede mais a direita, temos uma rede aleatória comp = 1. Nessa ilustração ﬁca claro que o aumento do valor de p é acompanhado

pelo aumento da desorganização na rede. Figura retirada da ref. [4]. . . 31

2.12 Comparação entre o menor caminho médio e o coeﬁciente de agregação para o modelo de Watts-Strogatz comN = 10000. Notemos a rápida queda do menor caminho médio e a constância do coeﬁciente de agregação para pequenos valores dep, responsável pelo efeito de mundo pequeno na rede.

Figura retirada da ref. [4]. . . 32

2.13 Evolução temporal da conectividade. Resultado obtido através de simu-lação numérica obtendo-seβ = 0.5(N = 105_). _{. . . 35}

(10)

o tamanho da rede, o valor deγconcorde com o resultado teórico obtido na

equação (2.26). . . 36

2.15 Gráﬁco do menor caminho médio, l, pelo tamanho da rede,N, no modelo

de Barabási e Albert com< k >= 4, comparado com um grafo aleatório de igual tamanho e conectividade média. Figura retirada da ref. [3]. . . 37

2.16 Gráfico do coeficiente de agregação versus tamanho da rede. Neste grá-fico comparamos o modelo de Barabási e Albert com< k >=4 e uma rede

aleatória comCrand ≃< k > /N. Figura retirada da ref. [3]. . . 38

3.1 Redes regulares. . . 41

3.2 Exemplos de percolação em uma rede quadrada de tamanho100×100para diferentes valores dep. Os sítios azuis são ilhas ﬁnitas e os sítios vermelhos

pertencem ao maior aglomerado. Na ﬁgura (c), os sítios vermelhos fazem parte do aglomerado percolante. . . 42

3.3 CurvasP∞×ppara diferentes tamanhosLde rede. . . 46

3.4 As ﬁguras acima representam o efeito das ligações de longo alcance e da diluição dos sítios para uma cadeia unidimensional. (a) A probabilidade crítica pc para uma cadeia com apenas ligações entre os primeiros

vizin-hos épc = 1. (b) A ausência de uma das ligações entre primeiros vizinhos

impossibilita a conectividade entre o sistema A e B. (c) Um sítio ausente

também impossibilita a conectividade entre o sistema A eB. (d) A

cone-ctividade entre o sistemaAeB é recuperada caso exista ligações entre

viz-inhos distantes (ligações de longo alcance) na cadeia unidimensional. (e) A conectividade entre o sistema AeB é possível numa cadeia linear com

ligações de longo alcance mesmo que alguns sítios estejam ausentes. . . 48

3.5 O colapso de dados mostra a curva universal para váriosN e vários valores

deα, onde a curva em preto é paraps = 0.2, azul é paraps = 0.4, vermelha

é paraps= 0.6e verde é paraps= 0.8. . . 51

(11)

ponto de intersecção das curvas determinapc e a invariância de escala da

média das razões das massas dos dois maiores aglomerados. . . 54

3.7 A probabilidade crítica versus α para diferentes diluições. Os símbolos

ponto, quadrado e triângulo representam, respectivamente, as diluições

ps= 0.4,0.6e0.8. . . 55

3.8 Comportamento da razão entre os expoentes β eν versus o parâmetroα.

As cores vermelha, azul e preta representam, respectivamente, as diluíções

ps= 0.4,0.6e0.8. . . 56

3.9 O colapso de dados mostra a curva universal para vários tamanhos de ca-deia,N, vários valores deαe diferentes diluições (ps= 0.4,0.6e0.8). . . 57

4.1 Dinâmica do crescimento do modelo de qualidade comm= 1. A qualidade de cada sítio é exibida no interior do ponto que ele representa. Os dois val-ores ao lado de cada sítio representam sua conectividade e a probabilidade de obter a ligação naquele tempo. No interior de cada sítio, é mostrada sua qualidade. Emt = 0, existe apenas o sítio inicial com uma dada qualidade. Emt= 1, o segundo sítio é adicionado e ligado ao primeiro sítio. Emt= 2, o terceiro sítio é adicionado a rede, este será conectado com um dos sítios pré-existentes seguindo uma probabilidade que é proporcional a conectivi-dade e a qualiconectivi-dade. A partir det = 3, a dinâmica de crescimento da rede obedece a regra estabelecida emt= 2até o tamanho desejado. . . 62 4.2 Simulação numérica rodada para 1000 amostras em uma rede com m =

1 e N = 105 _{mostrando a dependência temporal da conectividade,} _k

η(t),

para sítios com qualidadeη = 0.3, 0.6e0.9. Notemos que com o aumento do fator de qualidade, a conectividade do sítio cresce mais rapidamente durante a evolução da rede. . . 67

4.3 Comportamento assintótico de D com t → ∞. Notemos a concordância

com a predição analítica, linha tracejada, (equação 4.5). . . 68

(12)

ulação numérica e está em concordância com a predição teórica dada pela equação 4.17 (linha azul), com γ = 2.255. A linha preta representa um ajuste com P(k) ∼ k−2.255 _{sem a correção logarítmica. A linha vermelha}

corresponde a P(k) ∼ k−3 _{como prediz o modelo livre de escala, ou seja,}

todas qualidades são iguais. . . 69

4.5 Resultado da simulação numérica do modelo de Bianconi com qualidade uniforme (1000amostras para uma rede comN = 105 _e_m _{= 1}_):

dependên-cia do expoente dinâmicoβ(η)com o parâmetro da qualidadeη para uma

distribuição uniformeρ(η) =constante. Os círculos foram obtidos através

da simulação numérica enquanto a linha foi feita com base na predição analítica, β(η) = η/1.255. A simulação numérica foi realizada, ﬁxando a qualidade do nó nascido emt0 = 9. . . 70

4.6 Modelo de qualidade estendido: o gráﬁco mostra o comportamento de um sítio com qualidade igual a1ao variarmos o valor do expoenteα. O gráﬁco

interno esboça o comportamento assintótico do valor médio de uma rede comρ=Aηα_{. Resultados obtidos a partir da equação 4.20.} _{. . . 76}

4.7 Modelo de qualidade estendido: Comportamento assintótico de D obtido

através da equação 4.20. Para isso basta ﬁxar o valor deαe resolver a equação. 77

4.8 Resultado da simulação do modelo de qualidade estendido (rede comN = 105 _e_m _{= 1}_{): Observemos que a evolução da conectividade depende de}_α_e

η(1000 amostras). . . 78

4.9 Dependência temporal da conectividade, β(η), para sítios com diferentes qualidades e com diferentesα. Notemos que com o aumento do fator de

qualidade, a conectividade do sítio cresce muito mais rapidamente durante a evolução da rede. Estatística sobre1000 amostras em uma rede com ta-manho de100000sítios em= 1. . . 79 4.10 Resultado da distribuição de conectividade acumulada do modelo de

qua-lidade estendido (3000 realizações para uma rede comN = 105 _e _m _{= 1}_):

Observamos que a distribuição de conectividade é modiﬁcada ao variarmos

α. . . 80

(13)

nho médio versus o tamanho da rede em escala linear-log. . . 81

4.12 Resultado da simulação numérica do modelo de qualidade estendido (80 realizações para uma rede com diferentes tamanhos em = 2): Coeficiente de agregação total versus o tamanho da rede no gráfico log-log. O coefi-ciente de agregação para o modelo BA simulado segue uma lei de potência

C ∼N−0.79_{enquanto para o modelo de qualidade}_C _∼_N−0.49_. _{. . . 82}

5.1 Terceira geração da rede Apoloniana. O ponto azul e os quadrados vermel-hos representam, respectivamente, o ﬂuxo de entrada e o ﬂuxo de saída. . . 86

5.2 O diagrama fundamental da resposta da corrente-voltagem de um fusível ohmico (a) e um fusível não ôhmico (b) para uma velocidade máxima per-mitida de 100km/h, diferentes comprimentos de rua e diferentes valores

de Vc. Vc = 10V, comprimento=10 Km (linha preta), Vc = 10V,

com-primento=15 Km(linha vermelha), Vc = 6V, comprimento=10 Km(linha

verde),Vc = 6V, e comprimento=15Km(linha azul). . . 89

5.3 Corrente saindo da rede Apoloniana para diferentes gerações (50 amostras) para o modelo elétrico ôhmico. . . 96

5.4 Distribuição do ﬂuxo nas ruas usando caixas logarítmicas próximo do co-lapso do sistema. (a) modelo de rebanho para a rede Apoloniana na sexta geração e (b) modelo elétrico não ôhmico para a décima primeira geração da rede Apoloniana. Os parâmetros usados para o modelo de rebanho foramvmax(i) = 0.3eρmax(i)foi obtido a partir de uma distribuição uniforme

no seguinte intervalo(0; 1]. Para o modelo elétrico não ôhmico os parâme-tros são: Vc = 0.1eσjk obtidos de uma distribuição uniforme no intervalo

(0; 1]. O potencial externo foi aumentado a cada passo de tempo por10−4_V. ₉₇

(14)

lizando 50 amostras na rede Apoloniana na sexta geração onde ovmax(i) =

0.3 e ρmax(i) foram escolhidos aleatoriamente seguindo uma distribuição

uniforme no intervalo de(0; 1]. (b) mostra como o número de ruas conges-tionadas evolui a medida que o potencial externo aumenta para o modelo elétrico ôhmico em diferentes gerações da rede Apoloniana. Os parâme-tros são: Vc = 0.1 e σjk foram escolhidos aleatoriamente a partir de uma distribuição uniforme no intervalo de(0; 1], em cada passo, o potencial ex-terno aplicado foi aumentado em10−4_{V (50 realizações).} _{. . . 98}

5.6 Distribuição do tamanho das avalanches o qual é deﬁnido como o número de ruas que ﬁcaram congestionadas entre dois incrementos sucessivos do potencial externo aplicado. Aqui, utilizamos o modelo elétrico ôhmico e a estatística foi realizada com 50 amostras da rede Apoloniana na décima primeira geração. Os parâmetros são: Vc = 0.1 e σjk foram escolhidos

seguindo uma distribuição uniforme no intervalo de(0; 1], para cada passo, o potencial externo aplicado foi aumentado em10−4 _{V (50 realizações).} _{. . 99}

5.7 Distribuição dos ﬂuxos na rede rodoviária suíça em caixas logarítmicas um pouco antes do colapso do sistema, considerando o modelo elétrico ôhmico. A diferença de potencial máxima que todas as ruas toleram é 0.1V e para cada passo, aumentamos o potencial aplicado em10−4_{V. A distribuição dos}

ﬂuxos segue uma lei de potênciaP(Φ) ∼ Φ−0.418_{e a partir de ﬂuxos da}

or-dem de10−₂_{, vemos o efeito de tamanho ﬁnito da rede. O gráﬁco interno}

ilustra o mapa rodoviário suíço. Os seis pontos azuis e vermelhos repre-sentam, respectivamente, os potenciais positivos e nulos. Os dados foram fornecido pela Bundesamt für Raumentwicklung localizado na Suíça. . . . 100

B.1 Alguns tipos padrões de matrizes esparsas. . . 122

(15)

2.1 Dados das redes reais. N é o número de sítios,Eé o número de arestas,γ é

o expoente da distribuição de conectividade,Cé o coeﬁciente de agregação

elé o menor caminho médio. . . 21

3.1 Ponto crítico para diferentes tipos de rede. Z é o número de vizinhos eda

dimensão da rede.. . . 43

3.2 Expoentes críticos da percolação em 2 e 3 dimensões. . . 47

3.3 Dimensão fractal de algumas estruturas do aglomerado inﬁnito em 2 e3 dimensões. . . 47

(16)

1 Introdução 1

2 Conceitos e aplicações das redes 5

2.1 Introdução . . . 5

2.2 Conceitos fundamentais . . . 6

2.2.1 O que são redes? . . . 6

2.2.2 Distribuição de conectividade. . . 8

2.2.3 Coeﬁciente de agregação. . . 12

2.2.4 Mundo pequeno . . . 13

2.3 Redes reais . . . 15

2.3.1 6 graus de separação . . . 15

2.3.2 Internet . . . 18

2.3.3 World Wide Web . . . 18

2.3.4 Relações sexuais . . . 19

2.4 Modelos clássicos . . . 22

2.4.1 Modelo de Erdös-Rényi . . . 22

2.4.1.1 Diâmetro da rede . . . 28

(17)

2.5 Modelo livre de escala . . . 32

2.5.1 Modelo de Barabási-Albert . . . 32

2.5.1.1 Tamanho do menor caminho médio . . . 37

2.5.1.2 Coeﬁciente de agregação . . . 38

3 Percolação com Ligações de Longo Alcance em uma Cadeia Linear Diluída 39 3.1 Introdução . . . 40

3.2 Leis de escala . . . 43

3.3 Percolação com Ligações de Longo Alcance em uma Cadeia Linear . . . 47

3.4 Percolação com Ligações de Longo Alcance em uma Cadeia Linear Diluída 50 3.5 Resultados e Discussões . . . 52

4 Extensão do modelo de qualidade 58 4.1 Introdução . . . 59

4.2 Modelo de qualidade . . . 61

4.3 Extensão do modelo de qualidade . . . 71

4.4 Resultados e discussões . . . 72

5 Tráfego veicular em redes complexas 83 5.1 Introdução . . . 84

5.2 Modelo Elétrico . . . 86

5.3 Modelo de Rebanho . . . 90

5.4 Resultados e Discussões . . . 94

6 Conclusões e perspectivas 101

Apêndices 114

(18)

B Solução de sistemas lineares 116 B.1 Sistemas lineares esparsos . . . 118

B.2 Método do gradiente conjugado para um sistema esparso . . . 118

C Trabalhos publicados e submetidos 123

(19)

INTRODUÇÃO

A Mecânica Estatística (ME) é a ciência que trata um sistema de muitos corpos a partir de uma visão microscópica e obtém as grandezas observáveis da natureza (visão macroscópica). Os principais trabalhos que iniciaram a teoria da ME residem nas tentati-vas iniciais de fundamentar a lei da teoria dos gases [5]: Bernoulli (1738), Herapath (1821), Joule (1851), Krönig (1856) e Clausius. Esse último em 1857 formulou a lei dos gases ideais e posteriormente, em 1859, introduziu o conceito de caminho livre médio, tornando-se o primeiro a analisar o fenômeno de transporte. A base teórica dessa ciência começou a se solidiﬁcar com os trabalhos de:

1. Maxwell (1860): lei da distribuição das velocidades moleculares;

2. Boltzmann (1872 e 1876): hipótese ergódica, equação de transporte, teorema H; 3. Plank (1900): radiação do corpo negro;

4. Gibbs (1902): tornou a teoria dos Ensembles uma ferramenta eﬁciente para os teóri-cos que diretamente inﬂuenciou a formulação da ME no equilíbrio;

5. Einstein e Debye: calor especíﬁco para os sólidos; 6. Langevin e outros.

(20)

Hoje em dia, a ME é aplicada a diversos tipos de problemas nas mais diver-sas áreas como à Economia, Biologia, Meteorologia, Geofísica, entre outros. Fruto dessa grande interdisciplinaridade e da grande quantidade de propriedades (caos, fractalidade, auto-similaridade, complexidade inﬁnita, criticalidade auto organizada, não-linearidade, entre outras) que esses sistemas possuem, surgiu um novo campo de pesquisa chamado de Sistemas Complexos com suas várias áreas: caos, autômatos celulares, difusão anô-mala [6,7], percolação [8], redes complexas [9,10] entre várias outras [11,12].

Uma das características que deﬁnem os Sistemas Complexos é que eles são forma-dos por um grande número de unidades simples, porém a interação entre estes inﬂuencia o comportamento do sistema como um todo. A complexidade é dado pela quantidade de informação necessária para descrevê-lo, assim sistemas com muitos constituintes apre-sentam um alto grau de complexidade como o tráfego veicular [10], porém um gás com bilhões de constituintes é dito ser um sistema simples (o entendimento de uma pequena parte do sistema possibilita a compreensão dele com um todo). Assim o estudo de apenas uma pequena parte do sistema, possibilita a compreensão desse como um todo. Outro exemplo fora do campo da Física é a sociedade. Quando estudamos o funcionamento da sociedade, não podemos estudar a atitude somente de um indivíduo, ou de um grupo, mas sim do conjunto todo. A complexidade emerge do efeito coletivo de um grande número de componentes interagindo entre si.

Essa alta complexidade inerente aos sistemas fora do equilíbrio tem implicações no método adotado, por exemplo, grande parte das pesquisas na área utilizam métodos computacionais em vez de métodos analíticos. Isso se deve também, principalmente, ao avanço tecnológico na construção de computadores de alto desempenho que é um grande estímulo no campo de sistemas complexos. Agora falaremos brevemente sobre a perco-lação e redes complexas que são duas áreas que tiveram um grande avanço com a criação e melhora dos computadores.

(21)

evitar a contaminação com os gases venenosos. A máscara possuía grãos (obstáculos) que dificultavam o fluxo de gás pelos poros arranjados aleatoriamente. Nesse trabalho, eles notaram que quanto maior é a concentração de obstáculos mais difícil será a passagem do fluido, até que num certo ponto, o número de grãos impede o fluxo de gás pela más-cara. Em outras palavras, existe um concentração crítica de grãos que separa uma fase percolante de uma não percolante. Outros exemplos de percolação são o fluxo de infor-mações em uma rede telefônica, fluxo de água através do café ou través de uma barragem, tráfego através de um mapa rodoviário ou hidroviário, fogo na floresta, etc. Por hora, nos limitaremos na discussão sobre percolação o qual será tratado em mais detalhes no capí-tulo 3, percolação de ligações de longo alcance em uma cadeia linear diluída.

O estudo de redes complexas tem sua origem na teoria de grafos. Desde os anos 50, grandes redes aparentemente sem princípios organizacionais tem sido descritas como grafos aleatórios, proposta como a forma mais simples e direta de rede complexa. Do ponto de vista formal, uma rede (ou grafo) é um conjunto de vértices (sítios ou nós) co-nectados via linhas (arestas ou arcos). Uma diversidade de sistemas de alta tecnologia e importância intelectual podem ser descritas pelo formalismo das redes complexas [1,2,14–

37]. Por exemplo, a célula é melhor descrita como uma rede complexa de conexões quími-cas conectadas por reações químiquími-cas [27]; a Internet é uma rede complexa de roteadores e computadores ligados através de várias ligações físicas ou não físicas (sem fio) [2,14–19]; a WWW (World Wide Web) é uma enorme rede virtual de páginas conectadas por "hyper-links". Estes e vários outros sistemas desafiadores representam alguns dos muitos exem-plos que induzem a comunidade científica a investigar os mecanismos que determinam a topologia das redes complexas.

A tese esta organizada em quatro capítulos como segue: No capítulo 2,

con-ceitos e aplicações das redes, discutiremos alguns conceitos e propriedades topológicas

frequentemente abordadas em redes complexas além de apresentarmos alguns modelos teóricos e por ﬁm, falaremos sobre as redes reais. No capítulo seguinte,percolação com

ligações de longo alcance em uma cadeia linear diluída, estudaremos as propriedades

críticas de uma cadeia linear com ligações de longo alcance e sítios diluídos. Neste sen-tido, analisaremos o parâmetro de ordem da percolaçãoP∞e a razão entre os expoentesβ

eν. Mostraremos também que existe um comportamento universal para diferentes

tama-nhos de rede, diferentes valores de diluição e também diferentes valores deα no regime

não-extensivo. No capítulo 4, extensão do modelo de qualidade, estudaremos as

(22)

dinâmica de crescimento de uma rede estudada por Bianconi e Barabási. Este incorpora na ligação preferencial as diferentes habilidades (qualidades) dos sítios na competição por ligações. No último capítulo,tráfego veicular em redes complexas, mostraremos como o

(23)

CONCEITOS E APLICAÇÕES DAS REDES

O estudo da maioria das Redes Complexas foi motivado pelo desejo de entender vários sistemas reais que vão das redes de comunicação às redes ecológicas. Assim a base de dados avaliada para estudo são de várias disciplinas. Por hora, revisaremos os conceitos básicos e os sistemas que tem sido estudados por pesquisadores objetivando características gerais das redes complexas como menor caminho médio, coeﬁciente de agregação e a distribuição de conectividade.

2.1 Introdução

Redes Complexas descrevem uma diversidade de sistemas de alta tecnologia e im-portância intelectual [1,2,14–37]. Por exemplo, a célula é melhor descrita como uma rede complexa de conexões químicas conectadas por reações químicas [27]; a Internet é uma rede complexa de roteadores e computadores ligados através de várias ligações físicas ou não físicas (sem fio) [2,14–19]; a WWW (World Wide Web) é uma enorme rede virtual de páginas conectadas por "hyperlinks". Estes e vários outros sistemas desafiadores (ver a tabela2.1) representam alguns dos muitos exemplos que induzem a comunidade cien-tífica a investigar os mecanismos que determinam a topologia das redes complexas. De forma paralela, as ferramentas da Mecânica Estatística utilizadas em sistemas complexos têm crescido, possibilitando uma melhor forma para descrever fenômenos como os que

(24)

foram citados.

Tradicionalmente o estudo de redes complexas tem sua origem na teoria de grafos. Desde os anos 50, grandes redes aparentemente sem princípios organizacionais tem sido descritas como grafos aleatórios, proposta como a forma mais simples e direta de rede complexa. Os grafos aleatórios foram estudados primeiramente pelos matemáticos hún-garos Paul Erdös e Alfréd Rényi [38]. No modelo de Erdös-Rényi, começamos com N nós e todo par é conectado com probabilidade p, criando uma rede com aproximadamente pN(N −1)/2ligações distribuídas aleatoriamente. Este modelo tem guiado nossos pen-samentos sobre redes complexas por décadas desde sua introdução. Mas o interesse cres-cente em sistemas complexos tem feito com que alguns cientistas reconsiderassem este modelo paradigmático e reﬂetissem sobre uma questão simples: Redes reais comportam-se como sistemas complexos? A Internet é fundamentalmente aleatória? Nossa intuição claramente indica que sistemas complexos devem mostrar alguns princípios organiza-cionais, que devem satisfazer em algum nível sua topologia. Como a topologia de suas re-des vem de fato dos grafos aletórios, nós precisamos re-desenvolver ferramentas de medição para obter em termos quantitativos os princípios organizacionais fundamentais.

2.2 Conceitos fundamentais

Faremos uma breve discussão de alguns conceitos que ocupam uma posição proem-inente no pensamento de redes complexas.

2.2.1 O que são redes?

Do ponto de vista formal, uma rede (ou grafo) é um conjunto de vértices (sítios ou nós) conectados via linhas (arestas ou arcos). Redes com arestas sem direção são con-hecidas comoundirect networks, redes com arestas com direção são conhecidas comodirect networks. Um sítio muito conectado é chamado de pólo ou "hub".

O número total de conexões de um vértice é chamado de suaconectividade k. Na

rede com ligações dirigidas, o número de arestas entrando no vértice é chamado sua co-nectividade de entradaki (i de in), o número de arestas saindo do vértice é chamado sua

(25)

Um caso particularmente importante de grafos são as árvores, que são grafos sem "loops" (conhecidas também como circuitos). Se uma árvore não tem partes separadas, é chamada árvore conectada. O número total de vértices, N, e arestas, L, numa árvore

conectada é relacionado pela seguinte expressão L = N −1. Em geral, o número I de

circuitos num grafo conectado arbitrariamente com arestas sem direção é relacionado ao número da suas arestas e vértices, por

I =L+ 1−N. (2.1)

Esta é uma das fórmulas básicas na teoria dos grafos.

Em termos gerais, redes aleatórias são redes com uma arranjo desordenado das arestas. Enquanto falamos sobre redes aleatórias, temos que manter na cabeça que é uma rede particular, ou seja é um membro doensemble estatísticode todas as realizações

pos-síveis. Desta forma, quando falamos sobre redes aleatórias, estamos falando sobre ensem-ble estatístico. A descrição estatística completa de uma rede aleatória sugere a descrição dos ensembles estatísticos correspondentes. Em princípio, redes aleatórias podem conter vértices com conectividade ﬁxa. Em geral, a conectividade dos vértices estão estatistica-mente distribuídas.

Do ponto de vista físico, as redes aleatórias podem serestáticasoudinâmicas.

Va-mos introduzir essas idéias usando alguns exemplos simples.

(1) O exemplo de uma rede aleatória estática (grafo aleatório clássico). Este grafo é

deﬁnido pela seguinte regra:

(a) O número total de vértices é ﬁxado.

(b) Escolhe-se aleatoriamente o par de vértices que serão conectados.

Podemos por definição proibir múltiplas conexões mas isso não é necessário para grafos grandes onde altas conectividades estão quase ausentes. Podemos dizer que os vértices dos grafos clássicos aleatórios são estatisticamente equivalentes e independentes. Este modelo simples foi proposto por Erdös e Rényi (1959, 1960) [38]. O procedimento de construção deste grafo pode ser através da adição em sequência de novas arestas entre pares de vértices escolhidos aleatoriamente. Quando o número total de vértices é fixado, este procedimento produz configurações de equilíbrio.

(26)

sim-ples crescendo através de adições simultâneas de vértices e arestas. O algoritmo deste grafo é:

(a) Em cada tempo, um novo vértice é adicionado ao grafo.

(b) Simultaneamente, um par (ou alguns pares) de vértices escolhidos aleatori-amente são conectados por uma aresta.

Notemos que o sistema não está no equilíbrio. As arestas não são distribuídas ho-mogeneamente no grafo. Os nós "mais velhos" são os mais conectados enquanto os sítios novos são pouco conectados. Se em algum momento pararmos de aumentar o número de vértices, mas continuarmos com a adição aleatória de arestas, então a rede tenderá para o "estado de equilíbrio" sem nunca chegar a este estado. De fato, se a conectividade da rede não desaparece, então a não homogeneidade sobrevive. Um "estado de equilíbrio" pode ser aproximado, somente se, permitirmos que as arestas mais velhas desapareçam de tempo em tempo.

(3) Outro exemplo de uma rede dinâmica é arede de citações. Vejamos uma versão

bem simples dada pelo seguinte algoritmo:

(a) Em cada tempo, um novo vértice é adicionado ao grafo.

(b) Este é conectado com algum nó anterior por uma aresta sem direção.

Observemos que se usarmos uma regra diferente para a conexão entre os nós geraremos uma rede de citações diferente.

2.2.2 Distribuição de conectividade

Como foi explicado anteriormente, a conectividade dos vértices em redes aleatórias estão distribuídas estatisticamente. Sejam os vértices distinguíveis, que é a situação padrão no crescimento das redes, introduziremos uma distribuição de conectividade p(k, s, N) para cada vértice s. Esta é a probabilidade que o vértice sna rede de tamanho N tenha k conexões (k vizinhos mais próximos). Conhecendo a distribuição de conectividade de

(27)

P(k, N) =

N X

s=1

p(k, s, N). (2.2)

se todos os vértices de uma rede aleatória são estatisticamente equivalentes, como num grafo aleatório clássico, cada um deles terá a mesma distribuição de conectividadeP(k, N).

O primeiro momento da distribuição, conectividade média de uma rede, é dado pork=P_kkP(k). O número totalLde arestas numa rede é igual akN/2.

Apesar de estudarmos nessa tese ligações sem direção, por completeza teórica discutiremos um pouco sobre as ligações que apresentam direções. Analogamente, para vértices individuais numa rede com arestas com direção, pode ser introduzido uma dis-tribuição de conectividade de entradap(i)₍_k

i, s, N)e uma distribuição de conectividade de

saídap(o)₍_k

o, s, N). Podemos também deﬁnir uma distribuição de conectividade total de

entradaP(i)₍_k

i, N)e a distribuição de conectividade total de saídaP(o)(ko, N). Contudo,

é muito mais informativo se juntarmos as distribuições de conectividade de entrada e de saída, ﬁcando comp(ki, ko, s, N)eP(ki, ko, N). Então,

P(i)(ki) = X

ko

P(ki, ko), (2.3)

P(o)(ko) = X

ki

P(ki, ko), (2.4)

P(k) =X

ki

P(ki, k−ki) = X

ko

P(k−ko, ko), (2.5)

onde a rede de tamanhoNnão está explicitamente indicada. Relações semelhantes podem

ser escritas para distribuições de nós individuais. Se a rede não tem conexões com o exterior, então a conectividade média entrando e saindo são iguais:

ki = X

ki

kiP(ki, ko) =ko = X

ko

koP(ki, ko) =k/2. (2.6)

(28)

uma rede, mas é suficiente para determinar suas propriedades básicas (menor caminho médio, coeficiente de agregação, etc). Uma das principais dificuldades no estudo em-pírico de redes é a fraca estatística, além do pequeno tamanho das redes. Em geral, temos somente uma única realização de uma rede aleatória real para obter dados a partir dela. Quando fazemos o gráfico da distribuição de conectividadeP(k)usando dados empíricos, indicamos o número de vértices com uma conectividadeke então fazemos uma

normal-ização apropriada. Ao unirmos a distribuição de conectividade de entrada e de saída

P(ki, ko), usamos duas variáveis,ki eko, produzindo ﬂutuações mais pronunciadas.

Quando os vértices de um grafo são estatisticamente independentes, ou seja, equiv-alentes, suas conexões são aleatórias e a distribuição de conectividade determina comple-tamente as propriedades estatísticas de uma rede. Impondo que a distribuição de cone-ctividadeP(k) está presente (ou seja, apesar de inicialmente todos sítios não possuirem ligações, estamos impondo a condição que cada sítio possuirá um certo número de liga-ções máxima, que obedecem a distribuição de conectividade escolhida) e se o número total

N de nós está ﬁxado, como poderemos construir um grafo que obedeça essa condição?

(1) RotulandoN vértices.

(2) Para o vértice j de um grafo atribuímos conectividadekj a partir de uma

distribuição de conectividadeP(k).

(3) Conectamos aleatoriamente cada par de vértices.

Esta é somente uma realização particular de um grafo, mas dessa forma, é pos-sível construir um ensemble estatístico completo. Semelhantemente, grafos aleatórios no equilíbrio são generalizações naturais de grafos aleatórios clássicos.

Os exemplos seguintes demonstram casos típicos de distribuições de conectivi-dade observadas no estudo de redes complexas.

(1)Distribuição de Poisson:

P(k) = e

−k_kk

k! , (2.7)

onde k a conectividade média dada por k = P∞_k₌₀kP(k). Isto ocorre para os grafos

(29)

(2)Distribuição exponencial:P(k)∝e−k/k_{. Esta é a distribuição de conectividade de}

um grafo crescido aleatoriamente descrito na seção anterior, no exemplo (2). Igualmente para redes com tamanhos inﬁnitos, todos os momentos da distribuição (1) e (2) são ﬁnitos,

Mm ≡P∞k=0kmP(k)<∞.

(3) Distribuição em lei de potência: P(k) ∝ k−γ _com _k ₆_{= 0} _e _γ _{é o expoente da}

distribuição.

A distribuição em lei de potência contrasta com as distribuições de Poisson e ex-ponencial, pois esta não tem nenhuma escala natural (tamanho típico). Redes com essa distribuição são chamadaslivres de escala.

Em redes com tamanhos inﬁnitos (não existe fisicamente), todos momentos de

ordemm ≥ γ −1da distribuição em lei de potência divergem. A partir disso, podemos ver quais valores do expoenteγsão possíveis para redes de escala livre (é claro queγdeve

ser maior que 1 para ser normalizável):

(a) Se a conectividade média da rede livre de escala (primeiro momento da distribuição de conectividade) é ﬁnita, então seu expoente γ deve ser maior

que2ou seja2< γ < ∞.

(b) Um exemplo em que a conectividade média diverge, é quando o número total de arestas de uma certa rede cresce mais rápido que uma função linear do número total de vértices. Isto ocorre para algumas rede reais se a distribuição de conectividade é estacionária,1< γ ≤2.

Em redes com tamanhos ﬁnitos, a distribuição de conectividade apresenta uma cauda larga. Lembrando que todas as redes reais possuem tamanhos ﬁnitos. A maior rede livre de escala conhecida é a WWW, contendo somente 109 _{vértices, isto é muito}

menos do que o número de partículas num sistema macroscópico em sistemas físicos es-tatísticos e da matéria condensada. De fato, redes reais e simuladas, ambas não são objetos macroscópicas masmesoscópicos, e o efeito do tamanho são importantes à primeira vista.

(4)Distribuição discreta:Esse espectro de conectividade é típico em redes crescendo

(30)

2.2.3 Coeficiente de agregação

O coeﬁciente de agregação caracteriza a "densidade" de conexões próximas aos arredores do vértice. Seja uma rede com arestas sem direção, e uma destas arestas tenhaz

vizinhos próximos. A agregação máxima no aglomerado é obtida, quando todasz(z−1)/2 arestas possíveis estão presentes (todos os sítios vizinhos estão ligados). Convencional-mente [4,40,41], o coeﬁciente de agregaçãoC de um vértice é o quociente entre o número

totalyde arestas conectando seus vizinhos mais próximos e o número possível de arestas

entre todos esses vizinhos,

C = 2y

z(z−1). (2.8)

Esta grandeza reﬂete o grau de conhecimento mútuo de seus "amigos" mais próx-imos. Por exemplo, observe a ﬁgura2.1.

i

Figura 2.1: Vizinhança deν comkν = 6, resultandocν = 1/3.

Podemos introduzir a distribuição deCnuma rede, mas em geral somente o valor

médio deC é considerado, que é o coeﬁciente de agregação de uma rede. C expressa a

probabilidade que exista uma aresta entre dois vizinhos de um vértice escolhido aleatori-amente. Podemos dizer que a agregação médiaC mostra "a densidade" de pequenos

(31)

de circuitos é uma forma específica de correlação em redes. Se o coeficiente de agregação de uma rede "infinita" não tende a zero, então a correlação entre vértices de uma rede estão certamente presentes.

Podemos ver que o coeﬁciente de agregação de uma rede completamente conec-tada é igual a 1. No grafo aleatório clássico constituído de N vértices aleatoriamente

conectados por Larestas, cada par de vértices é conectado com a mesma probabilidade p ∼= z/N. Aqui z = k = 2L/N. Então, o coeﬁciente de agregação de um grafo aleatório

clássico éC=z/N o que é minúsculo para grandes redes. Grafos aleatórios clássicos tem

pouquíssimos circuitos, o que não ocorre para a maioria das redes reais.

2.2.4 Mundo pequeno

A maioria das redes são compactas. O termo "mundo pequeno" ou "efeito de mundo pequeno" está presente em redes cientíﬁcas [42]. A compactação, aqui, signiﬁca a pequenez do "tamanho linear" de uma rede. Distâncias entre pares de sítios numa rede po-dem ser medidos usando a seguinte regra: primeiramente, suponha que uma rede possua arestas sem direção e que estas tenham uma unidade de comprimento. Assim, a distância entre dois sítios de uma rede é o comprimento do menor caminho (caminho geodésico) entre eles. As distânciaslentre os pares de vértices de uma rede aleatória são distribuídas

com alguma função de distribuiçãoP(l). Essa é a probabilidade de que o menor caminho

entre dois vértices escolhidos aleatoriamente seja igual al. Assim se quisermos calcular

o "tamanho linear" de uma rede, basta usarmos a função P(l) que é uma das principais características estruturais de uma rede. Para distribuições que vão a zero rapidamente, a distância característica é da ordem do menor caminho médiol ≡P_llP(l). Outra

distân-cia característica natural é o tamanho do caminho mais longo existente numa rede,lmax.1

É claro que amboslelmaxdependem do número totalN de vértices numa rede.

Olhemos o problema por outro ponto de vista. Sejaz ≡ z1, o número de vizinho

mais próximos,z2, o número de segundos vizinhos mais próximos, z3, o número de

ter-ceiros vizinhos mais próximos, e assim por diante. Em geral, existemzm vértices numa

m-ésima esfera centrada num sítio, z0 = 1. A distância entre um sítio e qualquer um

dos seus m-ésimos vizinhos mais próximos é igual a m, e esta é uma forma equivalente

1_{Em diferentes trabalhos, ambos: o comprimento do menor caminho médio e o tamanho do caminho}

(32)

para introduzir a noção de distância numa rede. Podemos introduzir uma distribuição de números de m-ésimos vizinhos mais próximos,Pm(z). Esta é a probabilidade que um

sítio escolhido aleatoriamente de uma rede tenha m-ésimos vizinhos mais próximos. Ob-viamente, as distribuiçõesP(l)ePm(z)são quantidades relacionadas e como esses valores

dependem dos vizinhos mais próximos, logo o menor caminho é uma generalização nat-ural da distribuição de conectividade da rede.

Agora, demonstraremos como estimar o menor caminho médio (tamanho linear) para uma rede não correlacionada. Se uma rede aleatória é grande, então é habitual que tenha uma estrutura local tipo árvore. Isto signiﬁca que circuitos (caminho fechados

numa rede) estão quase ausentes na vizinhança de um vértice. A estrutura local tipo ár-vore em redes é um dos pontos chaves da teoria de redes. Por hora não discutiremos condições para estas realizações mas chamaremos a atenção que em geral é suficiente que a distribuição de conectividade caia suficientemente rápido. Assim, numa situação con-trastante, quando uma fração finita do número total de arestas está anexada a um número finito de vértices, a rede certamente não é do tipo árvore.2 3

Num outro caso, sem entrar em detalhes, vamos fazer uma simples estimativa para uma rede tipo árvore. Consideremos uma rede aleatória com uma conectividade médiaz. Ou seja, um sítio qualquer pode visitar em médiazoutros sítios afastados a uma

distância de um passo, veja a ﬁgura2.2. De uma forma geral, podemos falar que um sítio pode visitarzl _{outros sítios com} _l _{passos. Assim, podemos estimar a distância típica da}

rede, isto é o menor caminho médiol, usando a relaçãoN ∼zl_.

Obtendo a expressão bem conhecida paral,

l ≈ lnN

lnz . (2.9)

Portanto redes com muitos nós possuem um pequeno valor para o menor caminho mé-dio. Esta notável pequenez é em geral referida como "efeito de mundo pequeno" [4,40], presente em todas as redes abordadas nesse trabalho.

Para uma rede com arestas que tenham direção, a situação é mais complexa. Neste caso, podem existir dois menores caminhos diferentes entre um par de pontos. O menor caminho de um ponto a outro não coincide com o menor caminho na direção oposta e seus comprimentos não coincidem necessariamente. Podemos ignorar a direção das arestas e

(33)

introduzir o menor caminho médiolpara essa rede onde esta sempre terá um valor menor

ou igual ao do menor caminho médio de uma rede com arestas dirigidas.

Figura 2.2: Exemplo de uma rede com k = 3. Pode-se notar que quando l = 1, temos N = 31 _{= 3} _{nós visitados. Quando} _l _{= 2, temos} _N _{= 3}2 _{= 9. Quando} _l _{= 3, temos}

N = 33 _{= 27}_{e assim por diante (}_N _∼_zl_).

2.3 Redes reais

2.3.1 6 graus de separação

Stanley Milgram [42], psicólogo e sociólogo americano, desenvolveu uma exper-iência em 1967 com o intuito de saber se era possível que duas pessoas escolhidas aleatori-amente nos Estados Unidos pudessem se conectar através de pessoas conhecidas e se caso fosse possível, encontrar a quantidade de pessoas necessárias para tal feito ("distância").

A pesquisa foi feita da seguinte forma: Stanley Milgram escolheu duas pessoas alvo. Uma dessas duas pessoas era um corretor da bolsa de valores e a outra era a es-posa de um estudante de graduação, ambos em Massachusetts. A experiência consistia em enviar envelopes para pessoas aleatoriamente residindo em Nebraska e Kansas (áreas desérticas) e estas deveriam reenviar o envelope à pessoa alvo, ver ﬁgura2.3(a).

(34)

(1) Cada pessoa que receber o caderno deve colocar seu nome nele. Isto serve para rastrear a origem do envelope, evitando que este retorne para mesma pessoa.

(2) Se você não conhece diretamente a pessoa alvo, não tente contactá-la dire-tamente. Repasse este caderno para algum conhecido que você ache que tenha maior probabilidade de conhecer o destinatário.

(3) Se você conhece a pessoa alvo, mande este documento diretamente para ele(a).

(4) Ao enviar o papel, cada pessoa deve arrancar uma página do caderno, preenchê-la e remetê-la ao cientista que acompanhava o avanço da experiên-cia. Quando o caderno alcançar a pessoa alvo, este deverá enviar o caderno a Milgram para completar a experiência.

O resultado surpreendente foi publicado na revistaPsychology Todaycom o nome

(35)

Massachusetts

(a) Mapa dos Estados Unidos. Os estados em amarelo (Nebraska e Kansas) representam o ponto de saída das correspondências e o estado em verde (Massachusetts) representa o destino ﬁnal.

Omaha

Boston

(b) Esquema do experiência de Stanley Milgram.

(36)

2.3.2 Internet

A Internet é uma rede de ligações físicas entre computadores e outros aparelhos de comunicação. A topologia da Internet é estudada em dois níveis diferentes. Um a nível de roteadores onde os nós são os roteadores, e as ligações são conexões físicas entre eles. O outro a nível de interdomínios (ou sistemas autônomos), onde cada domínio é composto por milhares de roteadores e computadores, sendo representado por um único nó, e a lig-ação é feita entre dois domínios se existir pelo menos um roteador que os ligue. Ambos os níveis estudados pertencem a classe de problemas que seguem uma lei de potência. A Internet como uma rede, apresenta um coeﬁciente de agregação e um menor caminho médio, ambos pequenos. Yook et al. (2002) [43], e Pastor-Satorraset al. (2001) [19]

estu-dando a Internet a nível de domínio entre 1997 e 1999, encontraram que o coeﬁciente de agregação está entre0.18e0.3, sendo comparável comCrand ≃0.001para redes aleatórias

com parâmetros similares (tamanhos comparáveis). O menor caminho médio da Internet a nível de domínio está entre3.70e3.77e a nível de roteadores é cerca de9, indicando seu caráter de mundo pequeno.

2.3.3 World Wide Web

A WWW representa a segunda maior rede conhecida e conta com aproximada-mente um bilhão de sítios [44,45]. Os nós da rede são os documentos ("web page") e as conexões são os "hyperlinks" (URL’s) que apontam de um documento para outro. O in-teresse na WWW como uma rede explodiu depois da descoberta que a distribuição de conectividade das "web pages" segue uma lei de potência [2]. As conexões da WWW tem direção e a rede é caracterizada por duas distribuições: a distribuição de conexões saindo, Pout(k), signiﬁca que o documento tem k "hyperlinks" que saem deste, e a

dis-tribuição de conexões entrando, Pin(k), é a probabilidade que k "hyperlinks" apontem

para o documento. Alguns estudos tem estabelecido que ambosPout ePin tem cauda em

lei de potência:

Pout(k)∼k−γout e Pin(k)∼k−γin

Albert, Jeong, e Barabási (1999) [2] foram os pioneiros no estudo da WWW (con-tendo325729nós) e encontraramγout = 2.45eγin= 2.1, ver ﬁgura2.5. Depois Broderet al.

(37)

queγin é o mesmo para todas medidas apesar da quantidade de documentos ter variado

nesses dois anos. Nesse período, a rede cresceu pelo menos cinco vezes. Entretanto,γout

tem aumentado com o tamanho da amostra ou com o tempo. Um outro ponto interessante é a existência do efeito de mundo pequeno. Como foi relatado por Albert, Jeong e Barabási (1999) que encontraram que o menor caminho médio para uma amostra de 325729 nós é 11.2.

2.3.4 Relações sexuais

Algumas doenças transmitidas sexualmente, incluindo a AIDS, se propagam através da rede de relações sexuais. Liljeroset al. (2001) [1], estudaram uma rede formada por

2810 indivíduos, onde foi analisada a distribuição de parceiros sexuais de um grupo em um ano, obtendo uma distribuição de conectividade em lei de potência tanto para homens quanto para mulheres, com o expoenteγM ales = 3.3±0.2eγF emales = 3.5±0.2

respecti-vamente. Como esta rede é de escala livre, esperamos que as doenças se propaguem rap-idamente o que de fato ocorre. Dessa forma, campanhas para evitar a disseminação das doenças sexualmente transmissíveis devem ser voltadas especialmente para indivíduos com um grande número de parceiros sexuais. Ver a ﬁgura2.4.

Figura 2.4: Distribuição de conectividade em lei de potência. a)Distribuição do número

de parceiros durante os últimos 12 meses.b)Distribuição do número de parceiros durante

(38)

Figura 2.5: Rede WWW com235729 sítios, < k >= 5.46 eγin = 2.1. Figura retirada da

(39)

Rede ou subgrafo N E γ C C/Cr l l/lr Refs.

1 Mapa completodo domínio nd.edu da Web 325 729 1 469 680 γi = 2.1, γo= 2.45

- - 11.2 - [2]

2 WWW analisado pelo Altavista (1999) 2711×108 2130×109 γi = 2.1, γo= 2.7

- - 16 1 [14]

3 (outro ajuste) γi = 2.10,

γo= 2.82

[15] 4 Mapa de páginas de um domínio da WWW 260×105 _- γi= 194 - - - - [16]

5 Mapa com ligações sem direções da WWW 153 127 270×106 - 0.108 470 3.1 0.93

6 Um conjunto de páginas 4923 1335×107

γi= 2.05 - - -

-7 Outro conjunto de páginas - - γi= 2.05 - - -

-8 Conjunto de páginas de uma universidade - - γi= 2.63 - - -

-9 Conjunto de páginas de cientistas 56880 - γi = 2.66, γo= 2.82

- - -

-10 Internet (1998) 4389 8256 γi= 2.2 - - 4 0.6 [18]

11 Internet (1999) 6374 13 641 γi= 2.2 0.24 3.3×102 _3.7 _0.58 _[₁₉_]

12 Internet a nível de roteadores (1995) 3888 5012 γi= 2.5 - - 12.1 1.39 [18]

13 Internet a nível de roteadores (2000) 150 000 200 000 γi= 2.3 - - 10 0.8

14 Citações 783 339 6 716 198 γi= 3 - - - - [20]

15 (outro ajuste) γi= 2.9 [21]

17 Citações no Physical Review D 24 296 351 872 γi= 3 [20]

21 Colaboção de atores de cinema 212 250 61 085 555 γi= 2.3 - - 4.54 1.25 [2]

23 Colaboração 1 388 989 1028×107

γi= 2.5 0.066 6×103 _4.6 _0.9 _[₂₅_]

24 Co-autores 56 627 4898×106 γi= 1.2 0.726 0.24×103 _4.0 _1.88 _[₂₅_]

25 Colaboração 70 975 0.132×106 γi= 2.1 0.59 1.1×104 9.5 1.16 [26]

26 Colaboração 209 293 1214×106

γi= 2.4 0.76 1.4×104 ₆ _1.2 _[₂₆_]

27 Relações sexuais 2810 - γi= 3.4 - - - - [1]

28 Reações metabólicas 200−800 600−3000 _γi = 2.2, γo= 2.2

0.32 12 3.2 0.95 [27,28] 29 Interações entre proteínas 1870 2240 γi= 2.5 0.022 4.4 6.8 0.8 [29,30]

30 Cadeia alimentar 470 000 17 000 000 γi= 2.7 0.44 2.8×103 _2.65 _0.87 _[₃₁_]

31 Cadeia alimentar do parque Silwood 154 366 γi= 1 0.15 5 3.4 1.05

32 "Java Developement Framework" 1376 2174 γi= 2.5 0.06 25 6.39 1.02 [32]

33 Jogo de computador 1989 4.78×103 γi= 2.85 0.08 35 6.2 1.28 [32]

34 Circuitos eletrônicos 2×104 ₄

×104

γi= 3 0.03 150 6 1 [33]

35 Chamadas telefônicas 47×106 8×107 γi= 2.1 - - -

-36 E-mail 5165 6.57×104 γi= 1.5 0.156 3.25×103 4.95 0.48 [34]

37 "Energy landscape net for a 14-atom cluster" 4196 87 219 γi= 2.78 0.073 7.4 2.32 1.04 [35]

Tabela 2.1: Dados das redes reais. N é o número de sítios, E é o número de arestas, γ é

o expoente da distribuição de conectividade,C é o coeﬁciente de agregação el é o menor

(40)

2.4 Modelos clássicos

2.4.1 Modelo de Erdös-Rényi

Em seus primeiros artigos clássicos em redes aleatórias, Erdös e Rényi [38], 1959, deﬁniram um grafo aleatório com N nós que são conectados por n arestas, escolhidas

aleatoriamente das N(N−1)

2 combinações possíveis. Uma deﬁnição alternativa e

equiva-lente de um grafo aleatório é o modelo binomial. Aqui iniciamos comN nós, sendo que

cada par de nós é conectado com probabilidadep(ver ﬁgura2.6) e a conectividade média

é relacionada compda seguinte forma

< k >= 2n

N =p(N −1)≃pN. (2.10)

(1) (2) (3)

p=0 p=0.1 p=0.15

Figura 2.6: Processo de evolução do modelo de Erdös e Rényi para diferentes p’s. (1)

Começando comN = 10nós isolados, conectamos cada par de nós com probabilidade p.

(2) e (3) mostram dois estágios diferentes no desenvolvimento do grafo, correspondendo a p = 0.1 e p = 0.15. Podemos perceber o surgimento de árvores (uma árvore de

or-dem 3, linhas tracejadas) e ciclos (um ciclo de oror-dem 3, linha tracejada) num grafo, e um aglomerado conectando metade dos nós emp= 0.15 = 15/N. Figura retirada da ref. [3].

Consequentemente o número total de arestas é uma variável aleatória com o valor médioE(N) = p[N(N −1)/2].

Algumas propriedades dos grafos aleatórios podem ser determinadas usando ar-gumentos probabilísticos. Representaremos uma propriedade qualquer de um grafo pela letraQ. Vejamos algumas questões relevantes sobre redes complexas: Um grafo típico é

(41)

Na literatura matemática, a construção de um grafo aleatório é frequentemente uma evolução de processos: começando com um conjunto deN sítios isolados, o grafo

desenvolve pela adição aleatória e sucessiva de arestas aleatórias. Os grafos obtidos em diferentes estágios deste processo correspondem a probabilidades de conexãopcada vez

maiores, podendo obter grafos completamente conectados (número máximo de arestas é n = N(N − 1)/2 para p → 1). O principal objetivo da teoria de grafos aleatórios é

determinar em qual probabilidade de conexão, p, o sistema apresenta uma transição de

fase. A maior descoberta de Erdös e Rényi foi que as redes aleatórias possuem transições de fase. Por exemplo em uma dada probabilidade todos os pares de nós estão quase desconectados um do outro (vários aglomerados pequenos e isolados) e de repente para um certo valor depisso não ocorre mais (surge um aglomerado gigante).

Observemos que na teoria de grafos aleatórios, a probabilidade de ocupação é deﬁnida como uma função do tamanho do sistema: prepresenta a fração de arestas que

estão presentes das possíveis N(N − 1)/2. Deste modo é mais provável que ocorra a

presença de circuitos em grafos maiores do que nos menores, sepfor ﬁxo em ambos.

A primeira propriedade de grafos aleatórios estudada por Erdös e Rényi foi a presença de sub grafos. Um grafoG1consistindo de um conjuntoP1de nós e um conjunto

E1de arestas é um sub grafo de um redeG= {P, E}se todos nós emP1são também nós

deP e todas arestas em E1 são também arestas de E. O exemplo mais simples de sub

grafos são circuitos, árvores e sub grafos completos, ver ﬁgura2.6. Um circuito fechado de ordemk possuikarestas em que todos pares de arestas consecutivas tem somente um

nó em comum. Ou seja, graﬁcamente um triângulo é um circuito de ordem 3, enquanto um retângulo é um circuito de ordem 4. A conectividade média de um circuito é igual a 2, desde que todos os nós tenham duas arestas. O oposto de circuitos são as árvores, que não formam circuitos fechados. Mais precisamente, um grafo é uma árvore de ordemk

se este temk nós e k−1arestas, e nenhum de seus sub grafos são circuitos. Sub grafos completos de ordemk contém k nós e todas as possíveis k(k−1)/2arestas. Em outras palavras, eles estão completamente conectados.

Seja a evolução do processo descrito na ﬁgura (2.6) para um grafo

G = GN,p. Iniciemos com N nós desconectados, então conectemos cada par de nós com

probabilidade p. Para probabilidades de conexão pequenas, as arestas ﬁcam isoladas, e

(42)

árvore de ordem 3. Em geral, podemos perguntar se existe uma probabilidade crítica que marca o surgimento de sub grafos arbitrários consistindo dek nós elarestas.

Na teoria de redes aleatórias, existe uma prova rigorosa feita por Bollobás em 1985 [46] sobre a quantidade de sub grafos existentes numa rede. Consideremos um grafo aleatórioG=GN,pe um pequeno grafoF consistindo deknós elarestas. Em princípio, o

grafo aleatórioGpode conter alguns sub grafosF. Nosso primeiro objetivo é determinar

quantos sub grafos existem. Osknós podem ser escolhidos do número total de nósN em Ck

N formas el arestas são formadas com probabilidadepl. Assim, podemos permutar os

knós e obterk!redes novas (o valor correto ék!/a, ondeaé o número de grafos que são

isomórficos). Deste modo o número esperado de sub grafosF contidos emGé

E(X) = C_nkk! ap

l _≃ Nkpl

a . (2.11)

onde X é o número atual de sub grafos. Notemos que as sub redes não tem que estar

isoladas.

A equação2.11 indica que sep(N)é de tal forma que p(N)Nk/l _→ ₀_com_N _→ _0,

o número esperado de sub grafosE(X)→0, ou seja, quase nenhum dos grafos aleatórios

contem um grafoF. Entretanto, sep(N) = cN−k/l_{, o número médio de sub grafos é um}

número ﬁnito, denotado porλ=cl_/a_{, indicando que esta função pode ser a probabilidade}

crítica. A validade disso, pode ser testada calculando a distribuição de números de sub grafos,Pp(X =r), obtendo-se

lim

N→∞Pp(X =r) = e −λλr

r!. (2.12)

A probabilidade queGcontenha pelo menos um sub grafoF é

Pp(G⊃F) =

∞

X

r=1

Pp(X =r) = 1−e−λ, (2.13)

que converge para 1 comccrescendo. Para valores depque satisfaz o limitepNk/l _{→ ∞}_,

a probabilidadePp(G⊃ F)converge para 1. Assim a probabilidade crítica em que quase

todos grafos contenham um sub grafo comknós elarestas épc(N) = cN−k/l.

Alguns casos importantes seguem da equação2.13:

(43)

(b) A probabilidade crítica de ter um circuito de ordemk épc(N) = cN−1.

É instrutivo olhar os resultados acima de um ponto de vista diferente. Considere-mos um grafo aleatório comN nós e que a probabilidade de conexãop(N)varie comNz_,

ondezé um parâmetro que pode tomar qualquer valor entre−∞e0.

Figura 2.7: As probabilidades limites em que diferentes sub grafos aparecem num grafo aleatório. ParapN−3/2 _→ ₀_{árvores de ordem três aparecem. Em} _p _∼ _N−4/3 _surgem

ár-vores de ordem 4. Em p ∼ N−1 _{estão presentes árvores de todas ordens, e ao mesmo}

tempo aparecem circuitos de todas ordens. A probabilidadep ∼ N−2/3 _{marca a aparição}

de sub grafos completos de ordem 4 ep ∼ N−1/2 _{correspondendo aos sub grafos}

com-pletos de ordem 5. Comz tendendo a 0, o grafo contém sub grafos completos de ordens

crescentes. Figura retirada da ref. [3].

Parazmenor que−3/2, quase todos grafos contem somente nós e arestas isoladas.

Quando z passa por−3/2, árvores de ordem 3 aparecem de repente. Quando z alcança

−4/3, árvores de ordem 4 aparecem, e comz aproximando de−1, o grafo contém árvores

de ordens cada vez maiores. Entretanto, com z < −1, a conectividade média do grafo

< k >= pN → 0com N → ∞, o grafo é uma união das árvores não conectadas e não

apresenta ciclos. Quandozpassa exatamente por−1, correspondendo ak =constante, a

probabilidade assintótica de ciclos de todas ordens passam de 0 para 1. Os ciclos de ordem 3 podem ser observados como sub grafos completos de ordem 3. Sub grafos completos de ordem 4 aparecem emz =−2/3, e comzcrescendo, sub grafos completos de ordens cada

vez maiores vão aparecendo. Finalmente, comz tendendo a 0, o grafo contem sub grafos

completos de todas ordens ﬁnitas.

Quando temos p ∝ N−1 _{e a conectividade média dos nós é dada por} _{< k >}₌

(44)

uma mudança abrupta na estrutura do aglomerado de um grafo aleatório com < k >

próximo de 1 como será discutida a seguir.

Se 0 < k < 1, a maioria dos aglomerados são árvores. Apesar dos circuitos

estarem presentes, quase todos nós pertencem a estruturas tipo árvore. O número mé-dio de aglomerados é da ordem deN −n, onde n é o número de arestas, ou seja, nesse

intervalo quando uma nova aresta é adicionada, o número de aglomerados diminui de um.

Para k < 1 o maior aglomerado é uma árvore e ao ultrapassar o valor crítico< k >c= 1, a estrutura do grafo varia abruptamente. Percebemos que sekcresce, os menores

aglomerados colapsarão num aglomerado gigante. Assim os aglomerados menores tem maiores chances de sobreviverem, ou seja não ser "engolidos" pelo aglomerado gigante. Um exemplo prático é: imagine uma rede formada por pessoas representando os sítios e elas estarão ligadas se uma conhece a outra. Assim se a< k >= 1 na rede, não existirá segredo entre ninguém, pois qualquer segredo que você conte a uma dessas pessoas que participe da rede, será passada a todas as outras.

A. Distribuição de conectividade

Erdös e Rényi em 1959 [38] foram os primeiros a estudar a distribuição de conecti-vidade máxima e mínima de um grafo aleatório. Numa rede aleatória com probabilidade de conexãop, a conectividadeki de um nóisegue uma distribuição binomial:

P(ki =k) =pk(1−p)N−1−kCNk−1. (2.14)

onde o primeiro termo é a probabilidade do sítio ter ki ligações, o segundo termo é a

probabilidade de que as outras probabilidades estejam ausentes e o último termo é o número de diferentes combinações em que as ligações podem estar distribuídas. No limite

N → ∞, essa distribuição tende a uma distribuição de Poisson, dada por

P(k)≈e−pN(pN)

k

k! =e

−<k>< k >k

k! , (2.15)

onde< k >é a conectividade média e é regida pela seguinte expressão: < k >= p(N −

(45)

Rényi esta ilustrado na ﬁgura2.8.

Os resultados indicam que para um grande intervalo de valores de p, as

conec-tividades máximas e mínimas são determináveis e ﬁnitas. Outro ponto interessante, é que apesar das arestas serem aleatórias a maioria dos nós possuem o mesmo número de arestas.

Figura 2.8: Distribuição de conectividade do modelo de Erdös e Rényi, para redes com

(46)

2.4.1.1 Diâmetro da rede

O diâmetro de um grafo é a distância máxima entre qualquer par de nós da rede. Porém, o diâmetro de um grafo desconectado (ou seja, grafos que possuem aglomerados isolados) é inﬁnito, pois não é possível conectar todos pares de nós nessa rede. Por esta razão é mais apropriado deﬁnir o diâmetro da rede como o diâmetro máximo dos seus aglomerados. Grafos aleatórios tendem a ter pequenos diâmetros, parap não muito

pe-queno. A razão disso, é que um grafo é igualmente distribuído com uma probabilidade já deﬁnida. Seja uma rede aleatória onde os sítios tenham em médiakligações,< k >, como

na ﬁgura (2.2). Isso signiﬁca que de um sítio qualquer, podemos visitar em médiakoutros

sítios afastados a distância de um passo. De cada um dessesk sítios, podemos visitark

outros sítios. Deste modo podemos visitar< k >n_{sítios com}_n _{passos. Se a rede tiver}_N

sítios,< k >n _{não pode exceder o tamanho}_N_{, ou seja}_N ₌_{< k >}l_{. Assim, para alcançar}

osN sítios da rede são necessários em média,

lrand ≃

ln N

ln < k >, (2.16)

passos. Isso explica o motivo pelo qual partindo-se de um sítio inicial qualquer, será possível com poucos passos encontrar qualquer sítio na rede e esta foi a primeira tentativa de explicar o problema dos seis graus de separação de Milgram.

Vejamos alguns resultados importantes:

(a) Se k = pN < 1, uma rede típica é composta de árvores isoladas e seu

diâmetro é igual ao diâmetro de uma árvore.

(b) Se k > 1, surge um aglomerado gigante. O diâmetro da rede é igual ao

diâmetro do aglomerado gigante sek ≥3.5.

(c) Sek ≥ln(N), quase todo grafo esta conectado.

Outra forma de caracterizar o espalhamento de um grafo aleatório é calculando a distância média entre todos pares de nós, ou o tamanho do menor caminho médio. Es-peramos que o tamanho do menor caminho médio varie com o número de nós da mesma forma como o diâmetro (equação2.16)