DEPARTAMENTO DE FÍSICA TEÓRICA E EXPERIMENTAL PROGRAMA DE PÓS
-GRADUAÇÃO EM FÍSICA
E
STUDO DE SISTEMAS COMPLEXOS COM
INTERAÇÕES DE LONGO ALCANCE
:
PERCOLAÇÃO
,
REDES E TRÁFEGO
G
ABRIEL
A
LVES
M
ENDES
E
STUDO DE SISTEMAS COMPLEXOS COM
INTERAÇÕES DE LONGO ALCANCE
:
PERCOLAÇÃO
,
REDES E TRÁFEGO
Tese de Doutoradoapresentada ao Programa de Pós-Graduação
em Física do Departamento de Física Teórica e Experimental da Universidade Federal do Rio Grande do Norte como requisito par-cial para a obtenção do grau deDoutorem Física.
Orientador: Prof. Dr. Luciano Rodrigues da Silva
Co-orientador: Prof. Dr. Hans Jürgen Herrmann
À minha família, especialmente à milha mãeRozilda,
ao meu paiRenio, ao meu irmãoRafael, à minha
irmãNarae à minha princesaEliade.
Ao meu orientador, professor Dr. Luciano Rodrigues da Silva, pela orientação
e pelas discussões que tanto ajudaram meu mestrado e doutorado. Além de ter sido um grande amigo nesse período.
Ao meu co-orientador professor Dr.Hans Jürgen Herrmannpela orientação e
dis-cussões nesse trabalho, pela oportunidade oferecida de assistir suas aulas no Eidgenössis-che TechnisEidgenössis-che Hochschule Zürich (ETHZ) e trabalhar em um ambiente fantástico numa cidade da ciência.
Ao professor Dr. Umberto Laino Fulcopelas grandes discussões e sugestões que
ampliaram meu horizonte de conhecimento e pela colaboração nesse trabalho.
Ao professor Dr. Douglas Soares Galvãopela chance de trabalhar na
Universi-dade Federal de Campinas e pelas discussões científicas.
Aos professores Eudenílson Lins de Alburqueque e Liacir dos Santos Lucena
por oferecerem uma estrutura excelente durante o meu doutoramento.
Ao professorJosé Soares de Andrade Jr. pelas sugestões e discussões que
possi-bilitaram o enriquecimento desta tese.
Aos que foram meus professores e à Celina.
À minha família, Dra. Rozilda, Dr. Renio, Rafael eNara pelos apoios e
incen-tivos.
À minha princesa MSc. Eliade pelo apoio, paciência e companhia durante meu
doutoramento. Sua determinação contagiante me fez superar todas as adversidades pre-sentes em meu caminho.
Aos amigos do DFTE e do ETH, em especial aoTiago Medeiros, ao MSc.Antônio
dos Santos ao professor Dr. Sharon da Cunha, ao Dr. Antonio de Macedo, ao MSc.
Maurício de Almeida, ao MSc. Miller Mendozae ao Dr. Nuno Araújopelas discussões
e ajudas durante o desenvolvimento desse trabalho.
Ao Bundesamt für Raumentwicklung por ceder dados das rodovias suíças. Ao CNPq pelo apoio financeiro.
lê de mais e usa o cérebro de menos adquire a preguiça de pensar.”
(Albert Einstein)
Nesta tese abordaremos problemas físicos que apresentam um alto grau de com-plexidade utilizando ferramentas e modelos da Mecânica Estatística. Daremos ênfase ao estudo de sistemas com interações de longo alcance dentre estes, o caso da percolação com ligações de longo alcance em cadeias lineares, redes complexas sem métricas e tráfego em redes complexas. O fluxo numa cadeia linear (percolação) com interações de primeiros vizinhos só ocorre empc = 1, porém se levarmos em conta “ligações de longo alcance”
o quadro é completamente diferente, ou seja, a transição entre a fase percolante e a fase não percolante ocorre para um valor de p < 1. Esse tipo de transição continua
ocor-rendo mesmo quando diluímos o sistema (“diluição dos sítios”). Outros efeitos estudados nesse trabalho foram a extensividade do sistema, a evolução das propriedades críticas em função da diluição, etc. Em particular, mostramos que a diluição não altera a universali-dade do sistema. Em outro trabalho, veremos as implicações em utilizar uma distribuição de qualidade obedecendo uma lei de potência na dinâmica de crescimento de uma rede estudada por Bianconi e Barabási. Este incorpora na ligação preferencial as diferentes ha-bilidades (qualidades) dos sítios na competição por ligações. Por último, estudamos o tráfego em redes complexas e na malha rodoviária suiça a fim de entender como o con-gestionamento se alastra numa rede quando submetida a um fluxo crescente de carros. Nesse sentido, desenvolvemos dois modelos que nos possibilitam a análise do fluxo total em todas as ruas, bem como o fluxo nas saídas do sistema e o comportamento do número total de ruas congestionadas.
In this thesis we investigate physical problems which present a high degree of complexity using tools and models of Statistical Mechanics. We give a special atten-tion to systems with long-range interacatten-tions, such as one-dimensional long-range bond-percolation, complex networks without metric and vehicular traffic. The flux in linear chain (percolation) with bond between first neighbor only happens if pc = 1, but when
we consider “long-range interactions”, the situation is completely different, i.e., the tran-sitions between the percolating phase and non-percolating phase happens forpc <1. This
kind of transition happens even when the system is diluted (“dilution of sites”). Some of these effects are investigated in this work, for example, the extensivity of the system, the relation between critical properties and the dilution, etc. In particular we show that the dilution does not change the universality of the system. In another work, we analyze the implications of using a power law quality distribution for vertices in the growth dynamics of a network studied by Bianconi and Barabási. It incorporates in the preferential attach-ment the different ability (fitness) of the nodes to compete for links. Finally, we study the vehicular traffic on road networks when it is submitted to an increasing flux of cars. In this way, we develop two models which enable the analysis of the total flux on each road as well as the flux leaving the system and the behavior of the total number of congested roads.
2.1 Vizinhança deνcomkν = 6, resultandocν = 1/3. . . 12
2.2 Exemplo de uma rede com k = 3. Pode-se notar que quandol = 1, temos
N = 31 = 3nós visitados. Quandol = 2, temosN = 32 = 9. Quandol = 3,
temosN = 33 = 27e assim por diante (N ∼zl). . . . 15
2.3 Experiência realizada por Stanley Milgram em que ele mostrou que o grau de separação entre duas pessoas é seis. . . 17
2.4 Distribuição de conectividade em lei de potência. a)Distribuição do número
de parceiros durante os últimos 12 meses. b) Distribuição do número de
parceiros durante toda a vida. Figura retirada da ref. [1]. . . 19
2.5 Rede WWW com 235729sítios,< k >= 5.46eγin = 2.1. Figura retirada da
ref. [2]. . . 20
2.6 Processo de evolução do modelo de Erdös e Rényi para diferentes p’s. (1)
Começando com N = 10 nós isolados, conectamos cada par de nós com probabilidadep. (2) e (3) mostram dois estágios diferentes no
desenvolvi-mento do grafo, correspondendo ap = 0.1 ep = 0.15. Podemos perceber o surgimento de árvores (uma árvore de ordem 3, linhas tracejadas) e ci-clos (um ciclo de ordem 3, linha tracejada) num grafo, e um aglomerado conectando metade dos nós emp= 0.15 = 15/N. Figura retirada da ref. [3]. 22
surgem árvores de ordem 4. Emp∼ N−1 estão presentes árvores de todas
ordens, e ao mesmo tempo aparecem circuitos de todas ordens. A proba-bilidadep ∼ N−2/3 marca a aparição de sub grafos completos de ordem 4
ep ∼ N−1/2 correspondendo aos sub grafos completos de ordem 5. Com
ztendendo a 0, o grafo contém sub grafos completos de ordens crescentes.
Figura retirada da ref. [3]. . . 25
2.8 Distribuição de conectividade do modelo de Erdös e Rényi, para redes com
N = 10000 e p = 0,0006 (círculos), p = 0,001 (quadrados), p = 0,0015
(diamantes). Notemos que os sítios possuem aproximadamente o mesmo número de conexões. Figura retirada da ref. [3]. . . 27
2.9 Comparação entre o caminho médio de uma rede real (símbolos) e a predição da equação (2.16) da teoria de redes aleatórias (linha pontilhada). Figura re-tirada da ref. [3]. . . 29
2.10 Comparação entre o coeficiente de agregação das redes reais e dos grafos aleatórios. A linha tracejada corresponde a equação (2.17). Figura retirada da ref. [3]. . . 30
2.11 A figura mostra três valores de p no modelo de Watts e Strogatz.
Inicial-mente temos uma rede regular, p = 0, com um alto coeficiente de agre-gação. A seguir com umpintermediário existe o efeito de mundo pequeno,
devido as distâncias pequenas entre os sítios e ao alto valor do coeficiente de agregação. Na rede mais a direita, temos uma rede aleatória comp = 1. Nessa ilustração fica claro que o aumento do valor de p é acompanhado
pelo aumento da desorganização na rede. Figura retirada da ref. [4]. . . 31
2.12 Comparação entre o menor caminho médio e o coeficiente de agregação para o modelo de Watts-Strogatz comN = 10000. Notemos a rápida queda do menor caminho médio e a constância do coeficiente de agregação para pequenos valores dep, responsável pelo efeito de mundo pequeno na rede.
Figura retirada da ref. [4]. . . 32
2.13 Evolução temporal da conectividade. Resultado obtido através de simu-lação numérica obtendo-seβ = 0.5(N = 105). . . . 35
o tamanho da rede, o valor deγconcorde com o resultado teórico obtido na
equação (2.26). . . 36
2.15 Gráfico do menor caminho médio, l, pelo tamanho da rede,N, no modelo
de Barabási e Albert com< k >= 4, comparado com um grafo aleatório de igual tamanho e conectividade média. Figura retirada da ref. [3]. . . 37
2.16 Gráfico do coeficiente de agregação versus tamanho da rede. Neste grá-fico comparamos o modelo de Barabási e Albert com< k >=4 e uma rede
aleatória comCrand ≃< k > /N. Figura retirada da ref. [3]. . . 38
3.1 Redes regulares. . . 41
3.2 Exemplos de percolação em uma rede quadrada de tamanho100×100para diferentes valores dep. Os sítios azuis são ilhas finitas e os sítios vermelhos
pertencem ao maior aglomerado. Na figura (c), os sítios vermelhos fazem parte do aglomerado percolante. . . 42
3.3 CurvasP∞×ppara diferentes tamanhosLde rede. . . 46
3.4 As figuras acima representam o efeito das ligações de longo alcance e da diluição dos sítios para uma cadeia unidimensional. (a) A probabilidade crítica pc para uma cadeia com apenas ligações entre os primeiros
vizin-hos épc = 1. (b) A ausência de uma das ligações entre primeiros vizinhos
impossibilita a conectividade entre o sistema A e B. (c) Um sítio ausente
também impossibilita a conectividade entre o sistema A eB. (d) A
cone-ctividade entre o sistemaAeB é recuperada caso exista ligações entre
viz-inhos distantes (ligações de longo alcance) na cadeia unidimensional. (e) A conectividade entre o sistema AeB é possível numa cadeia linear com
ligações de longo alcance mesmo que alguns sítios estejam ausentes. . . 48
3.5 O colapso de dados mostra a curva universal para váriosN e vários valores
deα, onde a curva em preto é paraps = 0.2, azul é paraps = 0.4, vermelha
é paraps= 0.6e verde é paraps= 0.8. . . 51
ponto de intersecção das curvas determinapc e a invariância de escala da
média das razões das massas dos dois maiores aglomerados. . . 54
3.7 A probabilidade crítica versus α para diferentes diluições. Os símbolos
ponto, quadrado e triângulo representam, respectivamente, as diluições
ps= 0.4,0.6e0.8. . . 55
3.8 Comportamento da razão entre os expoentes β eν versus o parâmetroα.
As cores vermelha, azul e preta representam, respectivamente, as diluíções
ps= 0.4,0.6e0.8. . . 56
3.9 O colapso de dados mostra a curva universal para vários tamanhos de ca-deia,N, vários valores deαe diferentes diluições (ps= 0.4,0.6e0.8). . . 57
4.1 Dinâmica do crescimento do modelo de qualidade comm= 1. A qualidade de cada sítio é exibida no interior do ponto que ele representa. Os dois val-ores ao lado de cada sítio representam sua conectividade e a probabilidade de obter a ligação naquele tempo. No interior de cada sítio, é mostrada sua qualidade. Emt = 0, existe apenas o sítio inicial com uma dada qualidade. Emt= 1, o segundo sítio é adicionado e ligado ao primeiro sítio. Emt= 2, o terceiro sítio é adicionado a rede, este será conectado com um dos sítios pré-existentes seguindo uma probabilidade que é proporcional a conectivi-dade e a qualiconectivi-dade. A partir det = 3, a dinâmica de crescimento da rede obedece a regra estabelecida emt= 2até o tamanho desejado. . . 62 4.2 Simulação numérica rodada para 1000 amostras em uma rede com m =
1 e N = 105 mostrando a dependência temporal da conectividade, k
η(t),
para sítios com qualidadeη = 0.3, 0.6e0.9. Notemos que com o aumento do fator de qualidade, a conectividade do sítio cresce mais rapidamente durante a evolução da rede. . . 67
4.3 Comportamento assintótico de D com t → ∞. Notemos a concordância
com a predição analítica, linha tracejada, (equação 4.5). . . 68
ulação numérica e está em concordância com a predição teórica dada pela equação 4.17 (linha azul), com γ = 2.255. A linha preta representa um ajuste com P(k) ∼ k−2.255 sem a correção logarítmica. A linha vermelha
corresponde a P(k) ∼ k−3 como prediz o modelo livre de escala, ou seja,
todas qualidades são iguais. . . 69
4.5 Resultado da simulação numérica do modelo de Bianconi com qualidade uniforme (1000amostras para uma rede comN = 105 em = 1):
dependên-cia do expoente dinâmicoβ(η)com o parâmetro da qualidadeη para uma
distribuição uniformeρ(η) =constante. Os círculos foram obtidos através
da simulação numérica enquanto a linha foi feita com base na predição analítica, β(η) = η/1.255. A simulação numérica foi realizada, fixando a qualidade do nó nascido emt0 = 9. . . 70
4.6 Modelo de qualidade estendido: o gráfico mostra o comportamento de um sítio com qualidade igual a1ao variarmos o valor do expoenteα. O gráfico
interno esboça o comportamento assintótico do valor médio de uma rede comρ=Aηα. Resultados obtidos a partir da equação 4.20. . . . 76
4.7 Modelo de qualidade estendido: Comportamento assintótico de D obtido
através da equação 4.20. Para isso basta fixar o valor deαe resolver a equação. 77
4.8 Resultado da simulação do modelo de qualidade estendido (rede comN = 105 em = 1): Observemos que a evolução da conectividade depende deαe
η(1000 amostras). . . 78
4.9 Dependência temporal da conectividade, β(η), para sítios com diferentes qualidades e com diferentesα. Notemos que com o aumento do fator de
qualidade, a conectividade do sítio cresce muito mais rapidamente durante a evolução da rede. Estatística sobre1000 amostras em uma rede com ta-manho de100000sítios em= 1. . . 79 4.10 Resultado da distribuição de conectividade acumulada do modelo de
qua-lidade estendido (3000 realizações para uma rede comN = 105 e m = 1):
Observamos que a distribuição de conectividade é modificada ao variarmos
α. . . 80
nho médio versus o tamanho da rede em escala linear-log. . . 81
4.12 Resultado da simulação numérica do modelo de qualidade estendido (80 realizações para uma rede com diferentes tamanhos em = 2): Coeficiente de agregação total versus o tamanho da rede no gráfico log-log. O coefi-ciente de agregação para o modelo BA simulado segue uma lei de potência
C ∼N−0.79enquanto para o modelo de qualidadeC ∼N−0.49. . . . 82
5.1 Terceira geração da rede Apoloniana. O ponto azul e os quadrados vermel-hos representam, respectivamente, o fluxo de entrada e o fluxo de saída. . . 86
5.2 O diagrama fundamental da resposta da corrente-voltagem de um fusível ohmico (a) e um fusível não ôhmico (b) para uma velocidade máxima per-mitida de 100km/h, diferentes comprimentos de rua e diferentes valores
de Vc. Vc = 10V, comprimento=10 Km (linha preta), Vc = 10V,
com-primento=15 Km(linha vermelha), Vc = 6V, comprimento=10 Km(linha
verde),Vc = 6V, e comprimento=15Km(linha azul). . . 89
5.3 Corrente saindo da rede Apoloniana para diferentes gerações (50 amostras) para o modelo elétrico ôhmico. . . 96
5.4 Distribuição do fluxo nas ruas usando caixas logarítmicas próximo do co-lapso do sistema. (a) modelo de rebanho para a rede Apoloniana na sexta geração e (b) modelo elétrico não ôhmico para a décima primeira geração da rede Apoloniana. Os parâmetros usados para o modelo de rebanho foramvmax(i) = 0.3eρmax(i)foi obtido a partir de uma distribuição uniforme
no seguinte intervalo(0; 1]. Para o modelo elétrico não ôhmico os parâme-tros são: Vc = 0.1eσjk obtidos de uma distribuição uniforme no intervalo
(0; 1]. O potencial externo foi aumentado a cada passo de tempo por10−4V. 97
lizando 50 amostras na rede Apoloniana na sexta geração onde ovmax(i) =
0.3 e ρmax(i) foram escolhidos aleatoriamente seguindo uma distribuição
uniforme no intervalo de(0; 1]. (b) mostra como o número de ruas conges-tionadas evolui a medida que o potencial externo aumenta para o modelo elétrico ôhmico em diferentes gerações da rede Apoloniana. Os parâme-tros são: Vc = 0.1 e σjk foram escolhidos aleatoriamente a partir de uma distribuição uniforme no intervalo de(0; 1], em cada passo, o potencial ex-terno aplicado foi aumentado em10−4V (50 realizações). . . . 98
5.6 Distribuição do tamanho das avalanches o qual é definido como o número de ruas que ficaram congestionadas entre dois incrementos sucessivos do potencial externo aplicado. Aqui, utilizamos o modelo elétrico ôhmico e a estatística foi realizada com 50 amostras da rede Apoloniana na décima primeira geração. Os parâmetros são: Vc = 0.1 e σjk foram escolhidos
seguindo uma distribuição uniforme no intervalo de(0; 1], para cada passo, o potencial externo aplicado foi aumentado em10−4 V (50 realizações). . . 99
5.7 Distribuição dos fluxos na rede rodoviária suíça em caixas logarítmicas um pouco antes do colapso do sistema, considerando o modelo elétrico ôhmico. A diferença de potencial máxima que todas as ruas toleram é 0.1V e para cada passo, aumentamos o potencial aplicado em10−4V. A distribuição dos
fluxos segue uma lei de potênciaP(Φ) ∼ Φ−0.418e a partir de fluxos da
or-dem de10−2, vemos o efeito de tamanho finito da rede. O gráfico interno
ilustra o mapa rodoviário suíço. Os seis pontos azuis e vermelhos repre-sentam, respectivamente, os potenciais positivos e nulos. Os dados foram fornecido pela Bundesamt für Raumentwicklung localizado na Suíça. . . . 100
B.1 Alguns tipos padrões de matrizes esparsas. . . 122
2.1 Dados das redes reais. N é o número de sítios,Eé o número de arestas,γ é
o expoente da distribuição de conectividade,Cé o coeficiente de agregação
elé o menor caminho médio. . . 21
3.1 Ponto crítico para diferentes tipos de rede. Z é o número de vizinhos eda
dimensão da rede.. . . 43
3.2 Expoentes críticos da percolação em 2 e 3 dimensões. . . 47
3.3 Dimensão fractal de algumas estruturas do aglomerado infinito em 2 e3 dimensões. . . 47
1 Introdução 1
2 Conceitos e aplicações das redes 5
2.1 Introdução . . . 5
2.2 Conceitos fundamentais . . . 6
2.2.1 O que são redes? . . . 6
2.2.2 Distribuição de conectividade. . . 8
2.2.3 Coeficiente de agregação. . . 12
2.2.4 Mundo pequeno . . . 13
2.3 Redes reais . . . 15
2.3.1 6 graus de separação . . . 15
2.3.2 Internet . . . 18
2.3.3 World Wide Web . . . 18
2.3.4 Relações sexuais . . . 19
2.4 Modelos clássicos . . . 22
2.4.1 Modelo de Erdös-Rényi . . . 22
2.4.1.1 Diâmetro da rede . . . 28
2.5 Modelo livre de escala . . . 32
2.5.1 Modelo de Barabási-Albert . . . 32
2.5.1.1 Tamanho do menor caminho médio . . . 37
2.5.1.2 Coeficiente de agregação . . . 38
3 Percolação com Ligações de Longo Alcance em uma Cadeia Linear Diluída 39 3.1 Introdução . . . 40
3.2 Leis de escala . . . 43
3.3 Percolação com Ligações de Longo Alcance em uma Cadeia Linear . . . 47
3.4 Percolação com Ligações de Longo Alcance em uma Cadeia Linear Diluída 50 3.5 Resultados e Discussões . . . 52
4 Extensão do modelo de qualidade 58 4.1 Introdução . . . 59
4.2 Modelo de qualidade . . . 61
4.3 Extensão do modelo de qualidade . . . 71
4.4 Resultados e discussões . . . 72
5 Tráfego veicular em redes complexas 83 5.1 Introdução . . . 84
5.2 Modelo Elétrico . . . 86
5.3 Modelo de Rebanho . . . 90
5.4 Resultados e Discussões . . . 94
6 Conclusões e perspectivas 101
Apêndices 114
B Solução de sistemas lineares 116 B.1 Sistemas lineares esparsos . . . 118
B.2 Método do gradiente conjugado para um sistema esparso . . . 118
C Trabalhos publicados e submetidos 123
INTRODUÇÃO
A Mecânica Estatística (ME) é a ciência que trata um sistema de muitos corpos a partir de uma visão microscópica e obtém as grandezas observáveis da natureza (visão macroscópica). Os principais trabalhos que iniciaram a teoria da ME residem nas tentati-vas iniciais de fundamentar a lei da teoria dos gases [5]: Bernoulli (1738), Herapath (1821), Joule (1851), Krönig (1856) e Clausius. Esse último em 1857 formulou a lei dos gases ideais e posteriormente, em 1859, introduziu o conceito de caminho livre médio, tornando-se o primeiro a analisar o fenômeno de transporte. A base teórica dessa ciência começou a se solidificar com os trabalhos de:
1. Maxwell (1860): lei da distribuição das velocidades moleculares;
2. Boltzmann (1872 e 1876): hipótese ergódica, equação de transporte, teorema H; 3. Plank (1900): radiação do corpo negro;
4. Gibbs (1902): tornou a teoria dos Ensembles uma ferramenta eficiente para os teóri-cos que diretamente influenciou a formulação da ME no equilíbrio;
5. Einstein e Debye: calor específico para os sólidos; 6. Langevin e outros.
Hoje em dia, a ME é aplicada a diversos tipos de problemas nas mais diver-sas áreas como à Economia, Biologia, Meteorologia, Geofísica, entre outros. Fruto dessa grande interdisciplinaridade e da grande quantidade de propriedades (caos, fractalidade, auto-similaridade, complexidade infinita, criticalidade auto organizada, não-linearidade, entre outras) que esses sistemas possuem, surgiu um novo campo de pesquisa chamado de Sistemas Complexos com suas várias áreas: caos, autômatos celulares, difusão anô-mala [6,7], percolação [8], redes complexas [9,10] entre várias outras [11,12].
Uma das características que definem os Sistemas Complexos é que eles são forma-dos por um grande número de unidades simples, porém a interação entre estes influencia o comportamento do sistema como um todo. A complexidade é dado pela quantidade de informação necessária para descrevê-lo, assim sistemas com muitos constituintes apre-sentam um alto grau de complexidade como o tráfego veicular [10], porém um gás com bilhões de constituintes é dito ser um sistema simples (o entendimento de uma pequena parte do sistema possibilita a compreensão dele com um todo). Assim o estudo de apenas uma pequena parte do sistema, possibilita a compreensão desse como um todo. Outro exemplo fora do campo da Física é a sociedade. Quando estudamos o funcionamento da sociedade, não podemos estudar a atitude somente de um indivíduo, ou de um grupo, mas sim do conjunto todo. A complexidade emerge do efeito coletivo de um grande número de componentes interagindo entre si.
Essa alta complexidade inerente aos sistemas fora do equilíbrio tem implicações no método adotado, por exemplo, grande parte das pesquisas na área utilizam métodos computacionais em vez de métodos analíticos. Isso se deve também, principalmente, ao avanço tecnológico na construção de computadores de alto desempenho que é um grande estímulo no campo de sistemas complexos. Agora falaremos brevemente sobre a perco-lação e redes complexas que são duas áreas que tiveram um grande avanço com a criação e melhora dos computadores.
evitar a contaminação com os gases venenosos. A máscara possuía grãos (obstáculos) que dificultavam o fluxo de gás pelos poros arranjados aleatoriamente. Nesse trabalho, eles notaram que quanto maior é a concentração de obstáculos mais difícil será a passagem do fluido, até que num certo ponto, o número de grãos impede o fluxo de gás pela más-cara. Em outras palavras, existe um concentração crítica de grãos que separa uma fase percolante de uma não percolante. Outros exemplos de percolação são o fluxo de infor-mações em uma rede telefônica, fluxo de água através do café ou través de uma barragem, tráfego através de um mapa rodoviário ou hidroviário, fogo na floresta, etc. Por hora, nos limitaremos na discussão sobre percolação o qual será tratado em mais detalhes no capí-tulo 3, percolação de ligações de longo alcance em uma cadeia linear diluída.
O estudo de redes complexas tem sua origem na teoria de grafos. Desde os anos 50, grandes redes aparentemente sem princípios organizacionais tem sido descritas como grafos aleatórios, proposta como a forma mais simples e direta de rede complexa. Do ponto de vista formal, uma rede (ou grafo) é um conjunto de vértices (sítios ou nós) co-nectados via linhas (arestas ou arcos). Uma diversidade de sistemas de alta tecnologia e importância intelectual podem ser descritas pelo formalismo das redes complexas [1,2,14–
37]. Por exemplo, a célula é melhor descrita como uma rede complexa de conexões quími-cas conectadas por reações químiquími-cas [27]; a Internet é uma rede complexa de roteadores e computadores ligados através de várias ligações físicas ou não físicas (sem fio) [2,14–19]; a WWW (World Wide Web) é uma enorme rede virtual de páginas conectadas por "hyper-links". Estes e vários outros sistemas desafiadores representam alguns dos muitos exem-plos que induzem a comunidade científica a investigar os mecanismos que determinam a topologia das redes complexas.
A tese esta organizada em quatro capítulos como segue: No capítulo 2,
con-ceitos e aplicações das redes, discutiremos alguns conceitos e propriedades topológicas
frequentemente abordadas em redes complexas além de apresentarmos alguns modelos teóricos e por fim, falaremos sobre as redes reais. No capítulo seguinte,percolação com
ligações de longo alcance em uma cadeia linear diluída, estudaremos as propriedades
críticas de uma cadeia linear com ligações de longo alcance e sítios diluídos. Neste sen-tido, analisaremos o parâmetro de ordem da percolaçãoP∞e a razão entre os expoentesβ
eν. Mostraremos também que existe um comportamento universal para diferentes
tama-nhos de rede, diferentes valores de diluição e também diferentes valores deα no regime
não-extensivo. No capítulo 4, extensão do modelo de qualidade, estudaremos as
dinâmica de crescimento de uma rede estudada por Bianconi e Barabási. Este incorpora na ligação preferencial as diferentes habilidades (qualidades) dos sítios na competição por ligações. No último capítulo,tráfego veicular em redes complexas, mostraremos como o
CONCEITOS E APLICAÇÕES DAS REDES
O estudo da maioria das Redes Complexas foi motivado pelo desejo de entender vários sistemas reais que vão das redes de comunicação às redes ecológicas. Assim a base de dados avaliada para estudo são de várias disciplinas. Por hora, revisaremos os conceitos básicos e os sistemas que tem sido estudados por pesquisadores objetivando características gerais das redes complexas como menor caminho médio, coeficiente de agregação e a distribuição de conectividade.
2.1
Introdução
Redes Complexas descrevem uma diversidade de sistemas de alta tecnologia e im-portância intelectual [1,2,14–37]. Por exemplo, a célula é melhor descrita como uma rede complexa de conexões químicas conectadas por reações químicas [27]; a Internet é uma rede complexa de roteadores e computadores ligados através de várias ligações físicas ou não físicas (sem fio) [2,14–19]; a WWW (World Wide Web) é uma enorme rede virtual de páginas conectadas por "hyperlinks". Estes e vários outros sistemas desafiadores (ver a tabela2.1) representam alguns dos muitos exemplos que induzem a comunidade cien-tífica a investigar os mecanismos que determinam a topologia das redes complexas. De forma paralela, as ferramentas da Mecânica Estatística utilizadas em sistemas complexos têm crescido, possibilitando uma melhor forma para descrever fenômenos como os que
foram citados.
Tradicionalmente o estudo de redes complexas tem sua origem na teoria de grafos. Desde os anos 50, grandes redes aparentemente sem princípios organizacionais tem sido descritas como grafos aleatórios, proposta como a forma mais simples e direta de rede complexa. Os grafos aleatórios foram estudados primeiramente pelos matemáticos hún-garos Paul Erdös e Alfréd Rényi [38]. No modelo de Erdös-Rényi, começamos com N nós e todo par é conectado com probabilidade p, criando uma rede com aproximadamente pN(N −1)/2ligações distribuídas aleatoriamente. Este modelo tem guiado nossos pen-samentos sobre redes complexas por décadas desde sua introdução. Mas o interesse cres-cente em sistemas complexos tem feito com que alguns cientistas reconsiderassem este modelo paradigmático e refletissem sobre uma questão simples: Redes reais comportam-se como sistemas complexos? A Internet é fundamentalmente aleatória? Nossa intuição claramente indica que sistemas complexos devem mostrar alguns princípios organiza-cionais, que devem satisfazer em algum nível sua topologia. Como a topologia de suas re-des vem de fato dos grafos aletórios, nós precisamos re-desenvolver ferramentas de medição para obter em termos quantitativos os princípios organizacionais fundamentais.
2.2
Conceitos fundamentais
Faremos uma breve discussão de alguns conceitos que ocupam uma posição proem-inente no pensamento de redes complexas.
2.2.1
O que são redes?
Do ponto de vista formal, uma rede (ou grafo) é um conjunto de vértices (sítios ou nós) conectados via linhas (arestas ou arcos). Redes com arestas sem direção são con-hecidas comoundirect networks, redes com arestas com direção são conhecidas comodirect networks. Um sítio muito conectado é chamado de pólo ou "hub".
O número total de conexões de um vértice é chamado de suaconectividade k. Na
rede com ligações dirigidas, o número de arestas entrando no vértice é chamado sua co-nectividade de entradaki (i de in), o número de arestas saindo do vértice é chamado sua
Um caso particularmente importante de grafos são as árvores, que são grafos sem "loops" (conhecidas também como circuitos). Se uma árvore não tem partes separadas, é chamada árvore conectada. O número total de vértices, N, e arestas, L, numa árvore
conectada é relacionado pela seguinte expressão L = N −1. Em geral, o número I de
circuitos num grafo conectado arbitrariamente com arestas sem direção é relacionado ao número da suas arestas e vértices, por
I =L+ 1−N. (2.1)
Esta é uma das fórmulas básicas na teoria dos grafos.
Em termos gerais, redes aleatórias são redes com uma arranjo desordenado das arestas. Enquanto falamos sobre redes aleatórias, temos que manter na cabeça que é uma rede particular, ou seja é um membro doensemble estatísticode todas as realizações
pos-síveis. Desta forma, quando falamos sobre redes aleatórias, estamos falando sobre ensem-ble estatístico. A descrição estatística completa de uma rede aleatória sugere a descrição dos ensembles estatísticos correspondentes. Em princípio, redes aleatórias podem conter vértices com conectividade fixa. Em geral, a conectividade dos vértices estão estatistica-mente distribuídas.
Do ponto de vista físico, as redes aleatórias podem serestáticasoudinâmicas.
Va-mos introduzir essas idéias usando alguns exemplos simples.
(1) O exemplo de uma rede aleatória estática (grafo aleatório clássico). Este grafo é
definido pela seguinte regra:
(a) O número total de vértices é fixado.
(b) Escolhe-se aleatoriamente o par de vértices que serão conectados.
Podemos por definição proibir múltiplas conexões mas isso não é necessário para grafos grandes onde altas conectividades estão quase ausentes. Podemos dizer que os vértices dos grafos clássicos aleatórios são estatisticamente equivalentes e independentes. Este modelo simples foi proposto por Erdös e Rényi (1959, 1960) [38]. O procedimento de construção deste grafo pode ser através da adição em sequência de novas arestas entre pares de vértices escolhidos aleatoriamente. Quando o número total de vértices é fixado, este procedimento produz configurações de equilíbrio.
sim-ples crescendo através de adições simultâneas de vértices e arestas. O algoritmo deste grafo é:
(a) Em cada tempo, um novo vértice é adicionado ao grafo.
(b) Simultaneamente, um par (ou alguns pares) de vértices escolhidos aleatori-amente são conectados por uma aresta.
Notemos que o sistema não está no equilíbrio. As arestas não são distribuídas ho-mogeneamente no grafo. Os nós "mais velhos" são os mais conectados enquanto os sítios novos são pouco conectados. Se em algum momento pararmos de aumentar o número de vértices, mas continuarmos com a adição aleatória de arestas, então a rede tenderá para o "estado de equilíbrio" sem nunca chegar a este estado. De fato, se a conectividade da rede não desaparece, então a não homogeneidade sobrevive. Um "estado de equilíbrio" pode ser aproximado, somente se, permitirmos que as arestas mais velhas desapareçam de tempo em tempo.
(3) Outro exemplo de uma rede dinâmica é arede de citações. Vejamos uma versão
bem simples dada pelo seguinte algoritmo:
(a) Em cada tempo, um novo vértice é adicionado ao grafo.
(b) Este é conectado com algum nó anterior por uma aresta sem direção.
Observemos que se usarmos uma regra diferente para a conexão entre os nós geraremos uma rede de citações diferente.
2.2.2
Distribuição de conectividade
Como foi explicado anteriormente, a conectividade dos vértices em redes aleatórias estão distribuídas estatisticamente. Sejam os vértices distinguíveis, que é a situação padrão no crescimento das redes, introduziremos uma distribuição de conectividade p(k, s, N) para cada vértice s. Esta é a probabilidade que o vértice sna rede de tamanho N tenha k conexões (k vizinhos mais próximos). Conhecendo a distribuição de conectividade de
P(k, N) =
N X
s=1
p(k, s, N). (2.2)
se todos os vértices de uma rede aleatória são estatisticamente equivalentes, como num grafo aleatório clássico, cada um deles terá a mesma distribuição de conectividadeP(k, N).
O primeiro momento da distribuição, conectividade média de uma rede, é dado pork=PkkP(k). O número totalLde arestas numa rede é igual akN/2.
Apesar de estudarmos nessa tese ligações sem direção, por completeza teórica discutiremos um pouco sobre as ligações que apresentam direções. Analogamente, para vértices individuais numa rede com arestas com direção, pode ser introduzido uma dis-tribuição de conectividade de entradap(i)(k
i, s, N)e uma distribuição de conectividade de
saídap(o)(k
o, s, N). Podemos também definir uma distribuição de conectividade total de
entradaP(i)(k
i, N)e a distribuição de conectividade total de saídaP(o)(ko, N). Contudo,
é muito mais informativo se juntarmos as distribuições de conectividade de entrada e de saída, ficando comp(ki, ko, s, N)eP(ki, ko, N). Então,
P(i)(ki) = X
ko
P(ki, ko), (2.3)
P(o)(ko) = X
ki
P(ki, ko), (2.4)
P(k) =X
ki
P(ki, k−ki) = X
ko
P(k−ko, ko), (2.5)
onde a rede de tamanhoNnão está explicitamente indicada. Relações semelhantes podem
ser escritas para distribuições de nós individuais. Se a rede não tem conexões com o exterior, então a conectividade média entrando e saindo são iguais:
ki = X
ki
kiP(ki, ko) =ko = X
ko
koP(ki, ko) =k/2. (2.6)
uma rede, mas é suficiente para determinar suas propriedades básicas (menor caminho médio, coeficiente de agregação, etc). Uma das principais dificuldades no estudo em-pírico de redes é a fraca estatística, além do pequeno tamanho das redes. Em geral, temos somente uma única realização de uma rede aleatória real para obter dados a partir dela. Quando fazemos o gráfico da distribuição de conectividadeP(k)usando dados empíricos, indicamos o número de vértices com uma conectividadeke então fazemos uma
normal-ização apropriada. Ao unirmos a distribuição de conectividade de entrada e de saída
P(ki, ko), usamos duas variáveis,ki eko, produzindo flutuações mais pronunciadas.
Quando os vértices de um grafo são estatisticamente independentes, ou seja, equiv-alentes, suas conexões são aleatórias e a distribuição de conectividade determina comple-tamente as propriedades estatísticas de uma rede. Impondo que a distribuição de cone-ctividadeP(k) está presente (ou seja, apesar de inicialmente todos sítios não possuirem ligações, estamos impondo a condição que cada sítio possuirá um certo número de liga-ções máxima, que obedecem a distribuição de conectividade escolhida) e se o número total
N de nós está fixado, como poderemos construir um grafo que obedeça essa condição?
(1) RotulandoN vértices.
(2) Para o vértice j de um grafo atribuímos conectividadekj a partir de uma
distribuição de conectividadeP(k).
(3) Conectamos aleatoriamente cada par de vértices.
Esta é somente uma realização particular de um grafo, mas dessa forma, é pos-sível construir um ensemble estatístico completo. Semelhantemente, grafos aleatórios no equilíbrio são generalizações naturais de grafos aleatórios clássicos.
Os exemplos seguintes demonstram casos típicos de distribuições de conectivi-dade observadas no estudo de redes complexas.
(1)Distribuição de Poisson:
P(k) = e
−kkk
k! , (2.7)
onde k a conectividade média dada por k = P∞k=0kP(k). Isto ocorre para os grafos
(2)Distribuição exponencial:P(k)∝e−k/k. Esta é a distribuição de conectividade de
um grafo crescido aleatoriamente descrito na seção anterior, no exemplo (2). Igualmente para redes com tamanhos infinitos, todos os momentos da distribuição (1) e (2) são finitos,
Mm ≡P∞k=0kmP(k)<∞.
(3) Distribuição em lei de potência: P(k) ∝ k−γ com k 6= 0 e γ é o expoente da
distribuição.
A distribuição em lei de potência contrasta com as distribuições de Poisson e ex-ponencial, pois esta não tem nenhuma escala natural (tamanho típico). Redes com essa distribuição são chamadaslivres de escala.
Em redes com tamanhos infinitos (não existe fisicamente), todos momentos de
ordemm ≥ γ −1da distribuição em lei de potência divergem. A partir disso, podemos ver quais valores do expoenteγsão possíveis para redes de escala livre (é claro queγdeve
ser maior que 1 para ser normalizável):
(a) Se a conectividade média da rede livre de escala (primeiro momento da distribuição de conectividade) é finita, então seu expoente γ deve ser maior
que2ou seja2< γ < ∞.
(b) Um exemplo em que a conectividade média diverge, é quando o número total de arestas de uma certa rede cresce mais rápido que uma função linear do número total de vértices. Isto ocorre para algumas rede reais se a distribuição de conectividade é estacionária,1< γ ≤2.
Em redes com tamanhos finitos, a distribuição de conectividade apresenta uma cauda larga. Lembrando que todas as redes reais possuem tamanhos finitos. A maior rede livre de escala conhecida é a WWW, contendo somente 109 vértices, isto é muito
menos do que o número de partículas num sistema macroscópico em sistemas físicos es-tatísticos e da matéria condensada. De fato, redes reais e simuladas, ambas não são objetos macroscópicas masmesoscópicos, e o efeito do tamanho são importantes à primeira vista.
(4)Distribuição discreta:Esse espectro de conectividade é típico em redes crescendo
2.2.3
Coeficiente de agregação
O coeficiente de agregação caracteriza a "densidade" de conexões próximas aos arredores do vértice. Seja uma rede com arestas sem direção, e uma destas arestas tenhaz
vizinhos próximos. A agregação máxima no aglomerado é obtida, quando todasz(z−1)/2 arestas possíveis estão presentes (todos os sítios vizinhos estão ligados). Convencional-mente [4,40,41], o coeficiente de agregaçãoC de um vértice é o quociente entre o número
totalyde arestas conectando seus vizinhos mais próximos e o número possível de arestas
entre todos esses vizinhos,
C = 2y
z(z−1). (2.8)
Esta grandeza reflete o grau de conhecimento mútuo de seus "amigos" mais próx-imos. Por exemplo, observe a figura2.1.
i
Figura 2.1: Vizinhança deν comkν = 6, resultandocν = 1/3.
Podemos introduzir a distribuição deCnuma rede, mas em geral somente o valor
médio deC é considerado, que é o coeficiente de agregação de uma rede. C expressa a
probabilidade que exista uma aresta entre dois vizinhos de um vértice escolhido aleatori-amente. Podemos dizer que a agregação médiaC mostra "a densidade" de pequenos
de circuitos é uma forma específica de correlação em redes. Se o coeficiente de agregação de uma rede "infinita" não tende a zero, então a correlação entre vértices de uma rede estão certamente presentes.
Podemos ver que o coeficiente de agregação de uma rede completamente conec-tada é igual a 1. No grafo aleatório clássico constituído de N vértices aleatoriamente
conectados por Larestas, cada par de vértices é conectado com a mesma probabilidade p ∼= z/N. Aqui z = k = 2L/N. Então, o coeficiente de agregação de um grafo aleatório
clássico éC=z/N o que é minúsculo para grandes redes. Grafos aleatórios clássicos tem
pouquíssimos circuitos, o que não ocorre para a maioria das redes reais.
2.2.4
Mundo pequeno
A maioria das redes são compactas. O termo "mundo pequeno" ou "efeito de mundo pequeno" está presente em redes científicas [42]. A compactação, aqui, significa a pequenez do "tamanho linear" de uma rede. Distâncias entre pares de sítios numa rede po-dem ser medidos usando a seguinte regra: primeiramente, suponha que uma rede possua arestas sem direção e que estas tenham uma unidade de comprimento. Assim, a distância entre dois sítios de uma rede é o comprimento do menor caminho (caminho geodésico) entre eles. As distânciaslentre os pares de vértices de uma rede aleatória são distribuídas
com alguma função de distribuiçãoP(l). Essa é a probabilidade de que o menor caminho
entre dois vértices escolhidos aleatoriamente seja igual al. Assim se quisermos calcular
o "tamanho linear" de uma rede, basta usarmos a função P(l) que é uma das principais características estruturais de uma rede. Para distribuições que vão a zero rapidamente, a distância característica é da ordem do menor caminho médiol ≡PllP(l). Outra
distân-cia característica natural é o tamanho do caminho mais longo existente numa rede,lmax.1
É claro que amboslelmaxdependem do número totalN de vértices numa rede.
Olhemos o problema por outro ponto de vista. Sejaz ≡ z1, o número de vizinho
mais próximos,z2, o número de segundos vizinhos mais próximos, z3, o número de
ter-ceiros vizinhos mais próximos, e assim por diante. Em geral, existemzm vértices numa
m-ésima esfera centrada num sítio, z0 = 1. A distância entre um sítio e qualquer um
dos seus m-ésimos vizinhos mais próximos é igual a m, e esta é uma forma equivalente
1Em diferentes trabalhos, ambos: o comprimento do menor caminho médio e o tamanho do caminho
para introduzir a noção de distância numa rede. Podemos introduzir uma distribuição de números de m-ésimos vizinhos mais próximos,Pm(z). Esta é a probabilidade que um
sítio escolhido aleatoriamente de uma rede tenha m-ésimos vizinhos mais próximos. Ob-viamente, as distribuiçõesP(l)ePm(z)são quantidades relacionadas e como esses valores
dependem dos vizinhos mais próximos, logo o menor caminho é uma generalização nat-ural da distribuição de conectividade da rede.
Agora, demonstraremos como estimar o menor caminho médio (tamanho linear) para uma rede não correlacionada. Se uma rede aleatória é grande, então é habitual que tenha uma estrutura local tipo árvore. Isto significa que circuitos (caminho fechados
numa rede) estão quase ausentes na vizinhança de um vértice. A estrutura local tipo ár-vore em redes é um dos pontos chaves da teoria de redes. Por hora não discutiremos condições para estas realizações mas chamaremos a atenção que em geral é suficiente que a distribuição de conectividade caia suficientemente rápido. Assim, numa situação con-trastante, quando uma fração finita do número total de arestas está anexada a um número finito de vértices, a rede certamente não é do tipo árvore.2 3
Num outro caso, sem entrar em detalhes, vamos fazer uma simples estimativa para uma rede tipo árvore. Consideremos uma rede aleatória com uma conectividade médiaz. Ou seja, um sítio qualquer pode visitar em médiazoutros sítios afastados a uma
distância de um passo, veja a figura2.2. De uma forma geral, podemos falar que um sítio pode visitarzl outros sítios com l passos. Assim, podemos estimar a distância típica da
rede, isto é o menor caminho médiol, usando a relaçãoN ∼zl.
Obtendo a expressão bem conhecida paral,
l ≈ lnN
lnz . (2.9)
Portanto redes com muitos nós possuem um pequeno valor para o menor caminho mé-dio. Esta notável pequenez é em geral referida como "efeito de mundo pequeno" [4,40], presente em todas as redes abordadas nesse trabalho.
Para uma rede com arestas que tenham direção, a situação é mais complexa. Neste caso, podem existir dois menores caminhos diferentes entre um par de pontos. O menor caminho de um ponto a outro não coincide com o menor caminho na direção oposta e seus comprimentos não coincidem necessariamente. Podemos ignorar a direção das arestas e
introduzir o menor caminho médiolpara essa rede onde esta sempre terá um valor menor
ou igual ao do menor caminho médio de uma rede com arestas dirigidas.
Figura 2.2: Exemplo de uma rede com k = 3. Pode-se notar que quando l = 1, temos N = 31 = 3 nós visitados. Quando l = 2, temos N = 32 = 9. Quando l = 3, temos
N = 33 = 27e assim por diante (N ∼zl).
2.3
Redes reais
2.3.1
6 graus de separação
Stanley Milgram [42], psicólogo e sociólogo americano, desenvolveu uma exper-iência em 1967 com o intuito de saber se era possível que duas pessoas escolhidas aleatori-amente nos Estados Unidos pudessem se conectar através de pessoas conhecidas e se caso fosse possível, encontrar a quantidade de pessoas necessárias para tal feito ("distância").
A pesquisa foi feita da seguinte forma: Stanley Milgram escolheu duas pessoas alvo. Uma dessas duas pessoas era um corretor da bolsa de valores e a outra era a es-posa de um estudante de graduação, ambos em Massachusetts. A experiência consistia em enviar envelopes para pessoas aleatoriamente residindo em Nebraska e Kansas (áreas desérticas) e estas deveriam reenviar o envelope à pessoa alvo, ver figura2.3(a).
(1) Cada pessoa que receber o caderno deve colocar seu nome nele. Isto serve para rastrear a origem do envelope, evitando que este retorne para mesma pessoa.
(2) Se você não conhece diretamente a pessoa alvo, não tente contactá-la dire-tamente. Repasse este caderno para algum conhecido que você ache que tenha maior probabilidade de conhecer o destinatário.
(3) Se você conhece a pessoa alvo, mande este documento diretamente para ele(a).
(4) Ao enviar o papel, cada pessoa deve arrancar uma página do caderno, preenchê-la e remetê-la ao cientista que acompanhava o avanço da experiên-cia. Quando o caderno alcançar a pessoa alvo, este deverá enviar o caderno a Milgram para completar a experiência.
O resultado surpreendente foi publicado na revistaPsychology Todaycom o nome
Massachusetts
(a) Mapa dos Estados Unidos. Os estados em amarelo (Nebraska e Kansas) representam o ponto de saída das correspondências e o estado em verde (Massachusetts) representa o destino final.
Omaha
Boston
(b) Esquema do experiência de Stanley Milgram.
2.3.2
Internet
A Internet é uma rede de ligações físicas entre computadores e outros aparelhos de comunicação. A topologia da Internet é estudada em dois níveis diferentes. Um a nível de roteadores onde os nós são os roteadores, e as ligações são conexões físicas entre eles. O outro a nível de interdomínios (ou sistemas autônomos), onde cada domínio é composto por milhares de roteadores e computadores, sendo representado por um único nó, e a lig-ação é feita entre dois domínios se existir pelo menos um roteador que os ligue. Ambos os níveis estudados pertencem a classe de problemas que seguem uma lei de potência. A Internet como uma rede, apresenta um coeficiente de agregação e um menor caminho médio, ambos pequenos. Yook et al. (2002) [43], e Pastor-Satorraset al. (2001) [19]
estu-dando a Internet a nível de domínio entre 1997 e 1999, encontraram que o coeficiente de agregação está entre0.18e0.3, sendo comparável comCrand ≃0.001para redes aleatórias
com parâmetros similares (tamanhos comparáveis). O menor caminho médio da Internet a nível de domínio está entre3.70e3.77e a nível de roteadores é cerca de9, indicando seu caráter de mundo pequeno.
2.3.3
World Wide Web
A WWW representa a segunda maior rede conhecida e conta com aproximada-mente um bilhão de sítios [44,45]. Os nós da rede são os documentos ("web page") e as conexões são os "hyperlinks" (URL’s) que apontam de um documento para outro. O in-teresse na WWW como uma rede explodiu depois da descoberta que a distribuição de conectividade das "web pages" segue uma lei de potência [2]. As conexões da WWW tem direção e a rede é caracterizada por duas distribuições: a distribuição de conexões saindo, Pout(k), significa que o documento tem k "hyperlinks" que saem deste, e a
dis-tribuição de conexões entrando, Pin(k), é a probabilidade que k "hyperlinks" apontem
para o documento. Alguns estudos tem estabelecido que ambosPout ePin tem cauda em
lei de potência:
Pout(k)∼k−γout e Pin(k)∼k−γin
Albert, Jeong, e Barabási (1999) [2] foram os pioneiros no estudo da WWW (con-tendo325729nós) e encontraramγout = 2.45eγin= 2.1, ver figura2.5. Depois Broderet al.
queγin é o mesmo para todas medidas apesar da quantidade de documentos ter variado
nesses dois anos. Nesse período, a rede cresceu pelo menos cinco vezes. Entretanto,γout
tem aumentado com o tamanho da amostra ou com o tempo. Um outro ponto interessante é a existência do efeito de mundo pequeno. Como foi relatado por Albert, Jeong e Barabási (1999) que encontraram que o menor caminho médio para uma amostra de 325729 nós é 11.2.
2.3.4
Relações sexuais
Algumas doenças transmitidas sexualmente, incluindo a AIDS, se propagam através da rede de relações sexuais. Liljeroset al. (2001) [1], estudaram uma rede formada por
2810 indivíduos, onde foi analisada a distribuição de parceiros sexuais de um grupo em um ano, obtendo uma distribuição de conectividade em lei de potência tanto para homens quanto para mulheres, com o expoenteγM ales = 3.3±0.2eγF emales = 3.5±0.2
respecti-vamente. Como esta rede é de escala livre, esperamos que as doenças se propaguem rap-idamente o que de fato ocorre. Dessa forma, campanhas para evitar a disseminação das doenças sexualmente transmissíveis devem ser voltadas especialmente para indivíduos com um grande número de parceiros sexuais. Ver a figura2.4.
Figura 2.4: Distribuição de conectividade em lei de potência. a)Distribuição do número
de parceiros durante os últimos 12 meses.b)Distribuição do número de parceiros durante
Figura 2.5: Rede WWW com235729 sítios, < k >= 5.46 eγin = 2.1. Figura retirada da
Rede ou subgrafo N E γ C C/Cr l l/lr Refs.
1 Mapa completodo domínio nd.edu da Web 325 729 1 469 680 γi = 2.1, γo= 2.45
- - 11.2 - [2]
2 WWW analisado pelo Altavista (1999) 2711×108 2130×109 γi = 2.1, γo= 2.7
- - 16 1 [14]
3 (outro ajuste) γi = 2.10,
γo= 2.82
[15] 4 Mapa de páginas de um domínio da WWW 260×105 - γi= 194 - - - - [16]
5 Mapa com ligações sem direções da WWW 153 127 270×106 - 0.108 470 3.1 0.93
6 Um conjunto de páginas 4923 1335×107
γi= 2.05 - - -
-7 Outro conjunto de páginas - - γi= 2.05 - - -
-8 Conjunto de páginas de uma universidade - - γi= 2.63 - - -
-9 Conjunto de páginas de cientistas 56880 - γi = 2.66, γo= 2.82
- - -
-10 Internet (1998) 4389 8256 γi= 2.2 - - 4 0.6 [18]
11 Internet (1999) 6374 13 641 γi= 2.2 0.24 3.3×102 3.7 0.58 [19]
12 Internet a nível de roteadores (1995) 3888 5012 γi= 2.5 - - 12.1 1.39 [18]
13 Internet a nível de roteadores (2000) 150 000 200 000 γi= 2.3 - - 10 0.8
14 Citações 783 339 6 716 198 γi= 3 - - - - [20]
15 (outro ajuste) γi= 2.9 [21]
16 (outro ajuste) γi= 2.5 [22]
17 Citações no Physical Review D 24 296 351 872 γi= 3 [20]
18 (outro ajuste) γi= 2.6 [21]
19 (outro ajuste) γi= 2.3 [22]
20 (outro ajuste) γi= 1.9 [23]
21 Colaboção de atores de cinema 212 250 61 085 555 γi= 2.3 - - 4.54 1.25 [2]
22 (outro ajuste) γi= 3.1 [24]
23 Colaboração 1 388 989 1028×107
γi= 2.5 0.066 6×103 4.6 0.9 [25]
24 Co-autores 56 627 4898×106 γi= 1.2 0.726 0.24×103 4.0 1.88 [25]
25 Colaboração 70 975 0.132×106 γi= 2.1 0.59 1.1×104 9.5 1.16 [26]
26 Colaboração 209 293 1214×106
γi= 2.4 0.76 1.4×104 6 1.2 [26]
27 Relações sexuais 2810 - γi= 3.4 - - - - [1]
28 Reações metabólicas 200−800 600−3000 γi = 2.2, γo= 2.2
0.32 12 3.2 0.95 [27,28] 29 Interações entre proteínas 1870 2240 γi= 2.5 0.022 4.4 6.8 0.8 [29,30]
30 Cadeia alimentar 470 000 17 000 000 γi= 2.7 0.44 2.8×103 2.65 0.87 [31]
31 Cadeia alimentar do parque Silwood 154 366 γi= 1 0.15 5 3.4 1.05
32 "Java Developement Framework" 1376 2174 γi= 2.5 0.06 25 6.39 1.02 [32]
33 Jogo de computador 1989 4.78×103 γi= 2.85 0.08 35 6.2 1.28 [32]
34 Circuitos eletrônicos 2×104 4
×104
γi= 3 0.03 150 6 1 [33]
35 Chamadas telefônicas 47×106 8×107 γi= 2.1 - - -
-36 E-mail 5165 6.57×104 γi= 1.5 0.156 3.25×103 4.95 0.48 [34]
37 "Energy landscape net for a 14-atom cluster" 4196 87 219 γi= 2.78 0.073 7.4 2.32 1.04 [35]
Tabela 2.1: Dados das redes reais. N é o número de sítios, E é o número de arestas, γ é
o expoente da distribuição de conectividade,C é o coeficiente de agregação el é o menor
2.4
Modelos clássicos
2.4.1
Modelo de Erdös-Rényi
Em seus primeiros artigos clássicos em redes aleatórias, Erdös e Rényi [38], 1959, definiram um grafo aleatório com N nós que são conectados por n arestas, escolhidas
aleatoriamente das N(N−1)
2 combinações possíveis. Uma definição alternativa e
equiva-lente de um grafo aleatório é o modelo binomial. Aqui iniciamos comN nós, sendo que
cada par de nós é conectado com probabilidadep(ver figura2.6) e a conectividade média
é relacionada compda seguinte forma
< k >= 2n
N =p(N −1)≃pN. (2.10)
(1) (2) (3)
p=0 p=0.1 p=0.15
Figura 2.6: Processo de evolução do modelo de Erdös e Rényi para diferentes p’s. (1)
Começando comN = 10nós isolados, conectamos cada par de nós com probabilidade p.
(2) e (3) mostram dois estágios diferentes no desenvolvimento do grafo, correspondendo a p = 0.1 e p = 0.15. Podemos perceber o surgimento de árvores (uma árvore de
or-dem 3, linhas tracejadas) e ciclos (um ciclo de oror-dem 3, linha tracejada) num grafo, e um aglomerado conectando metade dos nós emp= 0.15 = 15/N. Figura retirada da ref. [3].
Consequentemente o número total de arestas é uma variável aleatória com o valor médioE(N) = p[N(N −1)/2].
Algumas propriedades dos grafos aleatórios podem ser determinadas usando ar-gumentos probabilísticos. Representaremos uma propriedade qualquer de um grafo pela letraQ. Vejamos algumas questões relevantes sobre redes complexas: Um grafo típico é
Na literatura matemática, a construção de um grafo aleatório é frequentemente uma evolução de processos: começando com um conjunto deN sítios isolados, o grafo
desenvolve pela adição aleatória e sucessiva de arestas aleatórias. Os grafos obtidos em diferentes estágios deste processo correspondem a probabilidades de conexãopcada vez
maiores, podendo obter grafos completamente conectados (número máximo de arestas é n = N(N − 1)/2 para p → 1). O principal objetivo da teoria de grafos aleatórios é
determinar em qual probabilidade de conexão, p, o sistema apresenta uma transição de
fase. A maior descoberta de Erdös e Rényi foi que as redes aleatórias possuem transições de fase. Por exemplo em uma dada probabilidade todos os pares de nós estão quase desconectados um do outro (vários aglomerados pequenos e isolados) e de repente para um certo valor depisso não ocorre mais (surge um aglomerado gigante).
Observemos que na teoria de grafos aleatórios, a probabilidade de ocupação é definida como uma função do tamanho do sistema: prepresenta a fração de arestas que
estão presentes das possíveis N(N − 1)/2. Deste modo é mais provável que ocorra a
presença de circuitos em grafos maiores do que nos menores, sepfor fixo em ambos.
A primeira propriedade de grafos aleatórios estudada por Erdös e Rényi foi a presença de sub grafos. Um grafoG1consistindo de um conjuntoP1de nós e um conjunto
E1de arestas é um sub grafo de um redeG= {P, E}se todos nós emP1são também nós
deP e todas arestas em E1 são também arestas de E. O exemplo mais simples de sub
grafos são circuitos, árvores e sub grafos completos, ver figura2.6. Um circuito fechado de ordemk possuikarestas em que todos pares de arestas consecutivas tem somente um
nó em comum. Ou seja, graficamente um triângulo é um circuito de ordem 3, enquanto um retângulo é um circuito de ordem 4. A conectividade média de um circuito é igual a 2, desde que todos os nós tenham duas arestas. O oposto de circuitos são as árvores, que não formam circuitos fechados. Mais precisamente, um grafo é uma árvore de ordemk
se este temk nós e k−1arestas, e nenhum de seus sub grafos são circuitos. Sub grafos completos de ordemk contém k nós e todas as possíveis k(k−1)/2arestas. Em outras palavras, eles estão completamente conectados.
Seja a evolução do processo descrito na figura (2.6) para um grafo
G = GN,p. Iniciemos com N nós desconectados, então conectemos cada par de nós com
probabilidade p. Para probabilidades de conexão pequenas, as arestas ficam isoladas, e
árvore de ordem 3. Em geral, podemos perguntar se existe uma probabilidade crítica que marca o surgimento de sub grafos arbitrários consistindo dek nós elarestas.
Na teoria de redes aleatórias, existe uma prova rigorosa feita por Bollobás em 1985 [46] sobre a quantidade de sub grafos existentes numa rede. Consideremos um grafo aleatórioG=GN,pe um pequeno grafoF consistindo deknós elarestas. Em princípio, o
grafo aleatórioGpode conter alguns sub grafosF. Nosso primeiro objetivo é determinar
quantos sub grafos existem. Osknós podem ser escolhidos do número total de nósN em Ck
N formas el arestas são formadas com probabilidadepl. Assim, podemos permutar os
knós e obterk!redes novas (o valor correto ék!/a, ondeaé o número de grafos que são
isomórficos). Deste modo o número esperado de sub grafosF contidos emGé
E(X) = Cnkk! ap
l ≃ Nkpl
a . (2.11)
onde X é o número atual de sub grafos. Notemos que as sub redes não tem que estar
isoladas.
A equação2.11 indica que sep(N)é de tal forma que p(N)Nk/l → 0comN → 0,
o número esperado de sub grafosE(X)→0, ou seja, quase nenhum dos grafos aleatórios
contem um grafoF. Entretanto, sep(N) = cN−k/l, o número médio de sub grafos é um
número finito, denotado porλ=cl/a, indicando que esta função pode ser a probabilidade
crítica. A validade disso, pode ser testada calculando a distribuição de números de sub grafos,Pp(X =r), obtendo-se
lim
N→∞Pp(X =r) = e −λλr
r!. (2.12)
A probabilidade queGcontenha pelo menos um sub grafoF é
Pp(G⊃F) =
∞
X
r=1
Pp(X =r) = 1−e−λ, (2.13)
que converge para 1 comccrescendo. Para valores depque satisfaz o limitepNk/l → ∞,
a probabilidadePp(G⊃ F)converge para 1. Assim a probabilidade crítica em que quase
todos grafos contenham um sub grafo comknós elarestas épc(N) = cN−k/l.
Alguns casos importantes seguem da equação2.13:
(b) A probabilidade crítica de ter um circuito de ordemk épc(N) = cN−1.
É instrutivo olhar os resultados acima de um ponto de vista diferente. Considere-mos um grafo aleatório comN nós e que a probabilidade de conexãop(N)varie comNz,
ondezé um parâmetro que pode tomar qualquer valor entre−∞e0.
Figura 2.7: As probabilidades limites em que diferentes sub grafos aparecem num grafo aleatório. ParapN−3/2 → 0árvores de ordem três aparecem. Em p ∼ N−4/3 surgem
ár-vores de ordem 4. Em p ∼ N−1 estão presentes árvores de todas ordens, e ao mesmo
tempo aparecem circuitos de todas ordens. A probabilidadep ∼ N−2/3 marca a aparição
de sub grafos completos de ordem 4 ep ∼ N−1/2 correspondendo aos sub grafos
com-pletos de ordem 5. Comz tendendo a 0, o grafo contém sub grafos completos de ordens
crescentes. Figura retirada da ref. [3].
Parazmenor que−3/2, quase todos grafos contem somente nós e arestas isoladas.
Quando z passa por−3/2, árvores de ordem 3 aparecem de repente. Quando z alcança
−4/3, árvores de ordem 4 aparecem, e comz aproximando de−1, o grafo contém árvores
de ordens cada vez maiores. Entretanto, com z < −1, a conectividade média do grafo
< k >= pN → 0com N → ∞, o grafo é uma união das árvores não conectadas e não
apresenta ciclos. Quandozpassa exatamente por−1, correspondendo ak =constante, a
probabilidade assintótica de ciclos de todas ordens passam de 0 para 1. Os ciclos de ordem 3 podem ser observados como sub grafos completos de ordem 3. Sub grafos completos de ordem 4 aparecem emz =−2/3, e comzcrescendo, sub grafos completos de ordens cada
vez maiores vão aparecendo. Finalmente, comz tendendo a 0, o grafo contem sub grafos
completos de todas ordens finitas.
Quando temos p ∝ N−1 e a conectividade média dos nós é dada por < k >=
uma mudança abrupta na estrutura do aglomerado de um grafo aleatório com < k >
próximo de 1 como será discutida a seguir.
Se 0 < k < 1, a maioria dos aglomerados são árvores. Apesar dos circuitos
estarem presentes, quase todos nós pertencem a estruturas tipo árvore. O número mé-dio de aglomerados é da ordem deN −n, onde n é o número de arestas, ou seja, nesse
intervalo quando uma nova aresta é adicionada, o número de aglomerados diminui de um.
Para k < 1 o maior aglomerado é uma árvore e ao ultrapassar o valor crítico< k >c= 1, a estrutura do grafo varia abruptamente. Percebemos que sekcresce, os menores
aglomerados colapsarão num aglomerado gigante. Assim os aglomerados menores tem maiores chances de sobreviverem, ou seja não ser "engolidos" pelo aglomerado gigante. Um exemplo prático é: imagine uma rede formada por pessoas representando os sítios e elas estarão ligadas se uma conhece a outra. Assim se a< k >= 1 na rede, não existirá segredo entre ninguém, pois qualquer segredo que você conte a uma dessas pessoas que participe da rede, será passada a todas as outras.
A. Distribuição de conectividade
Erdös e Rényi em 1959 [38] foram os primeiros a estudar a distribuição de conecti-vidade máxima e mínima de um grafo aleatório. Numa rede aleatória com probabilidade de conexãop, a conectividadeki de um nóisegue uma distribuição binomial:
P(ki =k) =pk(1−p)N−1−kCNk−1. (2.14)
onde o primeiro termo é a probabilidade do sítio ter ki ligações, o segundo termo é a
probabilidade de que as outras probabilidades estejam ausentes e o último termo é o número de diferentes combinações em que as ligações podem estar distribuídas. No limite
N → ∞, essa distribuição tende a uma distribuição de Poisson, dada por
P(k)≈e−pN(pN)
k
k! =e
−<k>< k >k
k! , (2.15)
onde< k >é a conectividade média e é regida pela seguinte expressão: < k >= p(N −
Rényi esta ilustrado na figura2.8.
Os resultados indicam que para um grande intervalo de valores de p, as
conec-tividades máximas e mínimas são determináveis e finitas. Outro ponto interessante, é que apesar das arestas serem aleatórias a maioria dos nós possuem o mesmo número de arestas.
Figura 2.8: Distribuição de conectividade do modelo de Erdös e Rényi, para redes com
2.4.1.1 Diâmetro da rede
O diâmetro de um grafo é a distância máxima entre qualquer par de nós da rede. Porém, o diâmetro de um grafo desconectado (ou seja, grafos que possuem aglomerados isolados) é infinito, pois não é possível conectar todos pares de nós nessa rede. Por esta razão é mais apropriado definir o diâmetro da rede como o diâmetro máximo dos seus aglomerados. Grafos aleatórios tendem a ter pequenos diâmetros, parap não muito
pe-queno. A razão disso, é que um grafo é igualmente distribuído com uma probabilidade já definida. Seja uma rede aleatória onde os sítios tenham em médiakligações,< k >, como
na figura (2.2). Isso significa que de um sítio qualquer, podemos visitar em médiakoutros
sítios afastados a distância de um passo. De cada um dessesk sítios, podemos visitark
outros sítios. Deste modo podemos visitar< k >nsítios comn passos. Se a rede tiverN
sítios,< k >n não pode exceder o tamanhoN, ou sejaN =< k >l. Assim, para alcançar
osN sítios da rede são necessários em média,
lrand ≃
ln N
ln < k >, (2.16)
passos. Isso explica o motivo pelo qual partindo-se de um sítio inicial qualquer, será possível com poucos passos encontrar qualquer sítio na rede e esta foi a primeira tentativa de explicar o problema dos seis graus de separação de Milgram.
Vejamos alguns resultados importantes:
(a) Se k = pN < 1, uma rede típica é composta de árvores isoladas e seu
diâmetro é igual ao diâmetro de uma árvore.
(b) Se k > 1, surge um aglomerado gigante. O diâmetro da rede é igual ao
diâmetro do aglomerado gigante sek ≥3.5.
(c) Sek ≥ln(N), quase todo grafo esta conectado.
Outra forma de caracterizar o espalhamento de um grafo aleatório é calculando a distância média entre todos pares de nós, ou o tamanho do menor caminho médio. Es-peramos que o tamanho do menor caminho médio varie com o número de nós da mesma forma como o diâmetro (equação2.16)