• Nenhum resultado encontrado

Papel da dimensionalidade em redes complexas: conexões com a mecânica estatística não-extensiva

N/A
N/A
Protected

Academic year: 2021

Share "Papel da dimensionalidade em redes complexas: conexões com a mecânica estatística não-extensiva"

Copied!
139
0
0

Texto

(1)universidade federal do rio grande do norte centro de ciências exatas e da terra departamento de física teórica e experimental programa de pós-graduação em física. Papel da dimensionalidade em redes complexas: conexões com a mecânica estatística não-extensiva Samuraí Gomes de Aguiar Brito. Natal, 20 de março de 2017.

(2) SAMURAÍ GOMES DE AGUIAR BRITO. Papel da dimensionalidade em redes complexas: conexões com a mecânica estatística não-extensiva. Tese de Doutorado apresentada ao Programa de PósGraduação em Física do Departamento de Física Teórica e Experimental da Universidade Federal do Rio Grande do Norte como requisito parcial para a obtenção do grau de doutor em Física. Orientador: Prof. Luciano Rodrigues da Silva Coorientador: Prof. Constantino Tsallis. Natal, 20 de março de 2017. ii.

(3) Catalogação da Publicação na Fonte. UFRN / SISBI / Biblioteca Setorial Centro de Ciências Exatas e da Terra – CCET.. Brito, Samuraí Gomes de Aguiar. Papel da dimensionalidade em redes complexas: conexões com a mecânica estatística não-extensiva / Samuraí Gomes de Aguiar Brito. - Natal, 2017. 138f. : il. Orientador: Prof. Dr. Luciano Rodrigues da Silva. Coorientador: Prof. Dr. Constantino Tsallis. Tese (Doutorado) – Universidade Federal do Rio Grande do Norte. Centro de Ciências Exatas e da Terra. Programa de Pós-Graduação em Física. 1. Sistemas complexos – Tese. 2. Redes sem escala – Tese. 3. Macânica estatística não-extensiva – Tese. I. Silva, Luciano Rodrigues da. II. Tsallis, Constantino. III. Título. RN/UF/BSE-CCET. CDU: 530.1.

(4) Para Pessoas Especiais:. Ao meu Deus. Ao meu esposo. Aos meus filhos. Aos meus pais.. iv.

(5) Agradecimentos. Á Deus, pela fé, capacitação e força para alcançar meus objetivos, sem ele eu jamais teria chegado até aqui. Ao Prof. Luciano Rodrigues da Silva, pela orientação da pesquisa. Pela amizade conquistada e por todos os preciosos conselhos e palavras de incentivo. Ao Prof. Constantino Tsallis, co-orientador desta tese, por ter aceito o convite e pela oportunidade de crescimento que recebi. Todas as conversas que tivemos foram por demais valiosas e muito me engrandeceram. Ao Prof. Álvaro Ferraz pelo curso de mecânica quântica que me lecionou e quem muito me incentivou na minha carreira acadêmica. Aos demais professores do DFTE, que contribuíram para minha formação profissional. Aos funcionários do DFTE por toda atenção e apoio dispensados. Aos colegas do grupo de sistemas complexos Gerdivane, Thiago Crisóstomo e Thiago Rafael, pelas boas risadas e pelas contribuições direta ou indiretamente nesta tese. À Capes e ao CNPq, pelo apoio financeiro concedido. Ao meu esposo, Daniel Bruno Urbano de Brito, ao meu filho amado Davi Gomes de Aguiar, e à minha filhotinha pimentinha Samara Gomes de Aguiar Brito (minha caçula). Vocês são a minha motivação para sempre seguir em frente e nunca olhar para trás. Vocês me fizeram chegar até aqui, são meu combustível. Todas as vezes que pensei que não conseguiria olhei pra vocês e sabia que eu não poderia parar. Obrigada pelo amor de vocês e por terem me sustentado até aqui. Aos meu pais, Marcos Antônio e Selênia Gomes, por todo amparo, educação, incentivo e confiança. Vocês sempre compartilharam todos os momentos comigo, os bons e ruins, me viram chorar e sorrir. Amo vocês e agradeço a Deus por ter vocês como pais. Obrigada por tudo. Aos meus irmãos, Camoí Gomes de Aguiar, Samira Gomes de Aguiar e Canoi Gomes de Aguiar. Sei que vocês sempre estiveram torcendo por mim, eu torço também por vocês, v.

(6) estarei sempre na primeira fila. Amo vocês demais, obrigada por todo apoio e palavras de incentivo. Ao meu tio José Gomes de Oliveira, “tio Zezinho”, por todo o incentivo à minha carreira. Por sempre ter acreditado que sou capaz e ter me auxiliado em momentos difíceis. À minha tia Espedita, por sempre estar presente em todos os momentos de minhas conquistas. Desde o meu ingresso no curso de física, até hoje na conclusão de meu doutorado. Finalmente, agradeço à minha avó, Maria das Dores Gomes de Morais, que apesar de sua idade avançada sempre está presente acompanhando a minha trajetória e torcendo pelo meu sucesso. Obrigada vó.. vi.

(7) “Porque melhor é a sabedoria do que as jóias; e de tudo o que se deseja nada se pode comparar a ela.” (Provérbios 8.11 - Bíblia). vii.

(8) Resumo. Estudos em redes complexas são bastante atuais e promovem a integração de diversas áreas do conhecimento. Já foi comprovado em pesquisas anteriores que a estatística que rege as redes complexas, quando as interações são de longo alcance, não é a estatística padrão de Boltzmann-Gibbs, mas sim uma estatística que leve em conta correlações de longo alcance. Neste sentido existe uma proposta que tem tido bastante aceitação que é a estatística nãoextensiva de Tsallis. As distribuições de grau, no limite termodinâmico, são da forma P (k) ∝ −k/κ. eq. , onde ezq é a q−exponencial definida por ezq ≡ [1 + (1 − q)z]1/(1−q) que otimiza a entropia. não aditiva Sq (quando q → 1, recupera-se a entropia de Boltzmann-Gibbs). Nesta tese. nós introduzimos um estudo de redes geográficas d-dimensionais (Modelo de Natal) as quais crescem com ligação preferencial envolvendo distância Euclidiana através da introdução do −αA termo rij (αA ≥ 0) na regra de ligação preferencial. Dada a conexão com a q-estatística, nós. numericamente verificamos (para d = 1, 2, 3 e 4) que as distribuições de grau, que em princípio dependem de αA e de d, apresentam comportamentos universais em relação à variável αA /d. Além disso, o limite q = 1 é rapidamente alcançado quando αA /d → ∞. Verificamos ainda. que outras propriedades da rede também possuem dependências universais com relação a αA /d, tais como: menor caminho médio hli, expoente dinâmico β proveniente da evolução. temporal da conectividade dos sítios e a entropia Sq da distribuição de grau.. viii.

(9) Abstract. Studies in complex networks are quite current and promote the integration of several areas of knowledge. Has been verified in previous research that the nonextensive statistical mechanics is the more suitable approach to describe the complex networks when there is long-range interactions between your constituents. At the thermodynamic limit the −k/κ. degree distribution is of the form P (k) ∝ eq. , where ezq is the q−exponential defined. by ezq ≡ [1 + (1 − q)z]1/(1−q) which optimizes the non-additive entropy (when q → 1, the Boltzmann-Gibbs entropy is recovered). In this thesis we have introduced a study of the. d-dimensional geographic networks (Natal Model) which grow with preferential attachment involving Euclidean distance by introducing the term r−αA (αA ≥ 0) into the preferential attachment rule. Given the connection between complex networks and the q-statistics, we numerically verified (for d = 1, 2, 3 e 4) that the degree distributions exhibit, for both q and κ, universal dependencies with respect to the variable αA /d. In addition, the limit q = 1 is quickly reached when αA /d → ∞. We also verified that other properties of the network also have universal dependences with respect to αA /d, such as: average shortest path hli , dyna-. mic exponent β (from connectivity time evolution of the sites) and the degree distribution entropy Sq .. ix.

(10) Índice. Agradecimentos. v. Resumo. viii. Abstract. ix. 1 Introdução. 1. 2 Fundamentos da Teoria de Redes. 5. 2.1. Breve história da ciência das redes . . . . . . . . . . . . . . . . . . . . . . . .. 5. 2.2. Definições e elementos básicos de redes . . . . . . . . . . . . . . . . . . . . .. 7. 2.2.1. Teoria dos grafos . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 9. 2.2.2. Noções básicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 10. Distribuição de grau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 12. 2.3.1. Distribuição de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . .. 13. 2.3.2. Distribuição lei de potência . . . . . . . . . . . . . . . . . . . . . . .. 13. 2.4. Coeficiente de agregação . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 17. 2.5. Menor caminho - distância química . . . . . . . . . . . . . . . . . . . . . . .. 18. 2.6. Entropia da distribuição de grau . . . . . . . . . . . . . . . . . . . . . . . . .. 22. 2.7. Classificação das redes quanto à sua estrutura . . . . . . . . . . . . . . . . .. 23. 2.3. x.

(11) 2.8. 2.7.1. Redes regulares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 23. 2.7.2. Redes aleatórias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 25. 2.7.3. Redes de mundo pequeno. . . . . . . . . . . . . . . . . . . . . . . . .. 25. 2.7.4. Redes livres de escala . . . . . . . . . . . . . . . . . . . . . . . . . . .. 26. Redes reais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 26. 2.8.1. Redes tecnológicas . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 27. 2.8.2. Redes sociais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 27. 2.8.3. Redes de informação . . . . . . . . . . . . . . . . . . . . . . . . . . .. 29. 2.8.4. Redes biológicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 30. 3 Mecânica Estatística e Modelos Teóricos de Redes 3.1. 3.2. 3.3. 32. Mecânica Estatística e conexões com redes complexas . . . . . . . . . . . . .. 32. 3.1.1. Uma breve história da Mecânica Estatística . . . . . . . . . . . . . .. 33. 3.1.2. Entropia de Boltzmann-Gibbs . . . . . . . . . . . . . . . . . . . . . .. 34. 3.1.3. Mecânica Estatística não-extensiva . . . . . . . . . . . . . . . . . . .. 36. 3.1.4. Conexões com redes complexas . . . . . . . . . . . . . . . . . . . . .. 37. Modelos Teóricos de Redes . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 39. 3.2.1. Modelo de Barabási-Albert . . . . . . . . . . . . . . . . . . . . . . . .. 39. 3.2.2. Modelo de Qualidade (MQ) . . . . . . . . . . . . . . . . . . . . . . .. 51. 3.2.3. Modelo de Natal (Geográfico) . . . . . . . . . . . . . . . . . . . . . .. 55. Ligação Preferencial. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 4 Papel da dimensionalidade em redes complexas. 63 67. 4.1. Modelo de Natal (d = 1, 2, 3, 4) . . . . . . . . . . . . . . . . . . . . . . . . .. 69. 4.2. Distribuição de Conectividade . . . . . . . . . . . . . . . . . . . . . . . . . .. 71. 4.3. Ajustes das curvas de distribuição de grau e a universalidade de q e κ . . . .. 79. 4.4. Evolução temporal da conectividade dos sítios . . . . . . . . . . . . . . . . .. 85. xi.

(12) 4.5. Menor caminho médio hli. . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 93. 4.6. Entropia da distribuição de grau . . . . . . . . . . . . . . . . . . . . . . . . .. 94. 5 Conclusões e Perspectivas. 98. Referências Bibliográficas. 101. Role of dimensionality in complex networks. 113. xii.

(13) Lista de Figuras. 2.1. Exemplo simples de rede. As esferas são os vértices e as ligações entre eles são as arestas. Podemos dizer então que esse grafo possui oito (8) vértices e dezessete (17) arestas. Figura retirada da referência [1]. 2.2. . . . . . . . . . . . . . . . . . . . . .. 8. Imagem ilustrativa da cidade de Königsberg. Em azul temos o rio Pregel cortando a cidade produzindo a formação de ilhas. Em vermelho temos as pontes de Königsberg ligando as porções de terra. Figura retirada de http://world.mathigon.org/ Graph_Theory . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 2.3. 9. (a) Grafo não direcionado com 5 vértices e 4 arestas. Os vértices 1, 3, 4 e 5 têm grau igual 1, ou seja, k1 = k3 = k4 = k5 = 1. O vértice 2 tem grau igual a 4, ou seja k2 = 4. (b) Grafo direcionado, neste grafo os vértices 1, 4 e 5 têm apenas grau de entrada ki = 1, mas o vértice 3 tem apenas grau de de saída ko = 1. O vértice 2, no entanto tem grau de entrada ki = 1 e graus de saída ko = 3. (c) O vértice A é vizinho do vértice B, mas não é vizinho do vértice C. . . . . . . . . . . . . . . .. 11. 2.4. Grafo ponderado. Figura retirada da referência [1] . . . . . . . . . . . . . . . .. 12. 2.5. Distribuição de Poisson. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 13. xiii.

(14) 2.6. Figuras ilustrativas do comportamento de algumas distribuições de conectividade. (a) Comparação entre a distribuição de Poisson e a distribuição Lei de Potência. (b) Ilustração do comportamento de uma função exponencial versus uma lei de potência. Ao esboçar as duas funções em um gráfico linear-linear, podemos observar que a função exponencial vai a zero muito mais rapidamente do que a lei de potência. (c) Representamos as três distribuições em um gráfico log − log. Uma das formas de verificar se a função obedece a uma lei de potência é esboçá-la em um gráfico log − log. Podemos ver que a lei de potência corresponde a uma reta cuja inclinação corresponde ao expoente γ da lei de potência. . . . . . . . . . . . . . . . . . . .. 2.7. O vértice verde tem 6 vizinhos próximos, e 5 ligações entre eles (arestas vermelhas) o coeficiente de agregação do sítio 1 é c1 = 1/3. Figura retirada da referência [1] .. 2.8. 15 18. Figura exibindo a fragilidade e robustez das redes aleatórias e de livre escala. Figura. retirada do site http://escoladeredes.net/profiles/blogs/redes-complexas-da-internet-as. 2. 2.9. (a) Mapa dos Estados Unidos - região azul mostra o local onde as cartas foram distribuídas e região vermelha o local onde a pessoa alvo se encontrava. Figura retirada da referência. [1]. (b) Esquema ilustrativo do resultado obtido no ex-. perimento de Milgram “Seis Graus de separação”. Figura retirada do site http:. . . . . . . .. 21. 2.10 Exemplos de redes regulares. . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 24. //www.combatsextrafficking.com/six-degrees-of-separation/.. 2.11 Rede cúbica. O sítios são os átomos (esferas azuis e vermelhas) e as conexões são as ligações entre eles. Figura retirada do site: http://www.e-agps.info/angelus/ cap1/nocaoestcris.htm. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 24. 2.12 Distribuição de conectividade acumulada da internet entre os anos de 1997 a 1999. O expoente da lei de potência γ = 2.2 Figura retirada da referência [2] . . . . . .. 3.1. 28. A evolução do número de hosts WWW, documentando o rápido crescimento da Web. Figura retirada da referência [3] . . . . . . . . . . . . . . . . . . . . . . . . . .. 41. 3.2. Exemplo ilustrativo de crescimento de uma rede de Barabási para m0 = 3 e m = 1.. 43. 3.3. (a) Distribuição de conectividade em Lei de Potência para o modelo BA. Simulação realizada para m = 1, N = 2 × 105 e 2 × 103 amostras. (b) Evolução temporal da conectividade dos sítios i = 10 e i = 97. Simulação realizada para a rede BA com m = 1, N = 105 e 1000 amostras. Figura retirada da referência [1]. . . . . . . . .. xiv. 46.

(15) 3.5. Distribuição de conectividade para o modelo MQ. Figura retirada da referência [3].. 3.6. (a) Evolução temporal do sítio i = 10 para diferentes valores de η. Simulação. 53. realizada para m = 1, N = 105 e 1000 amostras. (b) Dependência linear de β com η, mostrando que dependendo do fitness do sítio, este tem maior probabilidade de receber ligações. Figura retirada da referência [4]. . . . . . . . . . . . . . . . . .. 3.7. Figura esquemática da dinâmica de crescimento e ligação preferencial do Modelo de Natal. Figura retirada da referência [5] . . . . . . . . . . . . . . . .. 3.8. 54 58. (a) Análise da distribuição de conectividade para αA = 2 e valores típicos de αG . Simulação realizada para N = 104 e 3 × 103 amostras. (b) Comportamento da rede. ao variar o parâmetro αA para αG = 2. Simulação realizada para N = 105 nós e 1000 amostras. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 3.9. 59. (a) Sítios distribuídos no plano para valores de αG = 0 e αA = 1. É possível observar o surgimento do pólo mesmo em uma rede pequena. (b) Sítios distribuídos no plano para valores de αG = 0 e αA = 5. É notória a quebra de pólos ao variar o parâmetro αA . Ambas as figuras são simulações feita no Pajek para N = 300 e seus respectivos valores de αG e αA . Figuras retiradas da referência [1] . . . . . . . . . . . . . .. 60. 3.10 (a) Gráfico q versus αA . (b) Gráfico κ versus αA . . . . . . . . . . . . . . . . . .. 61. 3.11 (a) Evolução temporal da conectividade do sítio i = 10 para diversos valores de αA . Podemos observar como β diminui com o aumento de αA . (b) Comportamento do expoente dinâmico β com relação a αA para o modelo MN com d = 2. . . . . . . .. 4.1. Distribuição P (r) de N = 500 sítios. Parâmetros da rede: αA = 2 e αG = 1 para d = 1, 2, 3. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 4.2. 62. 72. (a) Distribuição dos sítios no plano (d = 2) para αG = 1 e αA = 0. (b) Distribuição dos sítios no plano (d = 2) para αG = 1 e αA = 8. Ao comparar as duas figuras vemos nitidamente que a estrutura da rede muda quando variamos αA . As figuras acima são uma amostra da rede para 50 sítios. . . . . . . . . . . . . . . . . . . .. 4.3. 73. (a) Distribuição de conectividade para d = 1, 2, 3, 4, αA /d = 9. (b) Mesmos dados de (a) porém na representação log-linear. Podemos ver nitidamente que a distribuição de conectividade para αA /d = 9 já demonstra o carácter exponencial de P (k).. xv. . .. 74.

(16) 4.4. Distribuição de conectividade para d = 1, 2, 3, 4 e αA = 0. Simulações realizadas para N = 105 e 103 amostras. Podemos ver nesta figura que quando αA = 0 recuperamos o modelo BA com γ = 3 (q = 4/3). . . . . . . . . . . . . . . . . . . . . . . . . .. 4.5. 75. Distribuição de conectividade para d = 1, 2, 3, 4. Fixamos o valor αA = 2 e variamos os valores de αG . As simulações foram feitas para redes de tamanho N = 105 e 103 amostras. Nós verificamos que a distribuição de conectividade P (k) independe de αG (∀d). Quando necessário, representamos P (k) utilizando caixas logarítmicas a fim de diminuir o ruída da cauda da distribuição. Figura retirada da referência [6].. 4.6. 76. Distribuição de grau para d = 1(diamante), 2(triângulo), 3(quadrado), 4(círculo) e valores típicos de αA mantendo constante αG = 2.0. As simulações foram feitas para redes de tamanho N = 105 sítios sob 103 realizações. Podemos perceber que a rede é completamente sensível a variações de αA ∀d. Representação de P (k) utilizando. caixas logarítmicas foi utilizada quando conveniente. Figura retirada da referência [6]. 77. 4.7. −k/κ. Ajustes da distribuição de conectividade com a função P (k) = P (0)eq. foram. feitos para d = 1, 2, 3, 4. (a) Representação dos dados em log−log. Representação de P (k) utilizando caixas logarítmicas foi usado quando conveniente. (b) Representação dos mesmos dados em lnq [P (k)/P (0)] x k. Podemos ver que as linhas retas, na representação lnq −linear, determinam inequivocamente a função q-exponencial como sendo apropriada para representar os dados numéricos. Os parâmetros de ajustes são exibidos na figura 4.8. As falhas numéricas, para valores grandes de k, com respeito às linhas retas, são devido ao efeito de tamanho finito, e desaparecerão gradualmente quando convergirmos para o limite termodinâmico (N → ∞). Figura retirada da referência [6].. 4.8. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 78. q e κ versus αA para d = 1, 2, 3, 4. Quando αA = 0 e ∀d nós recuperamos a classe de universalidade do modelo BA q = 4/3, ou seja, γ = 3, o qual não tem métrica. Figura retirada da referência [6]. . . . . . . . . . . . . . . . . . . . . . . . . . .. 4.9. 82. q e κ versus αA /d (mesmos dados da Fig. 4.8). Podemos ver que q = 4/3 quando 0 ≤. αA /d ≤ 1 e o surgimento de um comportamento exponencial para αA /d > 1 (∀d); resultados similares são obtidos para κ. Estes resultados exibem a universalidade de q e κ. O ponto vermelho indica o modelo de Barábasi-Albert γ = 3 correspondendo a q = 4/3 como um caso particular do nosso modelo. Figura retirada da referência [6]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. xvi. 83.

(17) 4.10 Todos os valores de q e κ para o presente modelo com d = 1, 2, 3, 4 seguem uma relação aproximadamente linear. Figura retirada da referência [6]. . . . . . . . .. 84. 4.11 Evolução temporal da conectividade do sítio i = 10 para d = 1, 2, 3, 4, αG = 2 e valores típicos de αA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 87. 4.12 A linha vermelha contínua expressa o comportamento de β em função de αA /d caso a equação 4.9 fosse válida para qualquer valor de αA . A linha preta tracejada é a equação que melhor se ajusta aos dados numéricos extrapolados para β em função de αA /d. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 88. 4.13 Expoente dinâmico β associado à evolução temporal da conectividade dos sítios. (a) Gráfico de β em função de αA para d = 1, 2, 3, 4. (b) β versus αA /d, onde podemos observar que existe um resultado universal de β que não depende de d ou αA de maneira isolada, mas depende apenas da razão αA /d. As simulações foram realizadas para redes de tamanho 105 sob 103 realizações e as análises são para o sítio i = 10, αG = 2 e valores típicos de αA . . . . . . . . . . . . . . . . . . . . .. 89. 4.14 Expoente β versus αA /d para vários sítios. Os pontos amarelos são valores extrapolados de β quando i → ∞. Esses pontos seguem a equação descrita na Fig.4.12. . .. 90. 4.15 Exemplo do método de extrapolação utilizado para encontrar o comportamento de beta no limite termodinâmico. Nesta figura representamos os pontos de β versus (1/i)0.1 onde i = 5, 10, 50, 100, 200, 500 são os sítios da rede e i indica o tempo de nascimento (quanto maior i mais novo é o sítio). Os pontos acima são para αA /d = 9 e d = 1, 2, 3, 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 91. 4.16 Representação do comportamento esperado de β versus αA /d no limite termodinâmico. Os pontos dessa figura foram obtidos utilizando o método descrito na Fig.4.15. 92. 4.18 Medidas da entropia em redes complexas. Comparação entre a entropia de Tsallis e a entropia BG calculada para o modelo MN d-dimensional, αG = 2 e vários valores de αA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 95. 4.17 (a) Cálculo do menor caminho médio hli para d = 1, 2, 3, 4, αG = 2 e valores típicos. de αA . (b) Gráfico de hli versus αA /d para d = 1, 2, 3, 4, αG = 2 e valores típicos de αA . Todas as simulações foram feitas para redes de tamanho 104 e 500 amostras. .. 96. 4.19 (a) q-entropia calculada para d = 1, 2, 3, 4 e vários valores de αA (b) Colapso de Sq versus αA /d. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. xvii. 97.

(18) Lista de Tabelas. 2.1. Comparação de algumas propriedades dos grafos (n = 100, m = 200) e p = 5% para grafos de mundo pequeno. Tabela retirada de referência [7]. . . . . . . . . . . . .. 2.2. 23. Dados de redes reais. N é o número de sítios, E é o número de arestas, γ é o expoente da distribuição de conectividade, C é o coeficiente de agregação e l é o menor caminho médio.Tabela retirada da referência [4] . . . . . . . . . . . . . .. 3.1. 31. Comparação entre modelos que envolvem conectividade, métrica e qualidade. Nos modelos citados abaixo podemos ver que existem três mecanismos que podem estar presentes ou ausentes na regra de ligação preferencial. A conectividade é o mecanismo básico e está presente em todos os modelos. No entanto, os parâmetros de qualidade e métrica alternam de um modelo para o outro. O modelo MN possui métrica, no entanto, não leva conta a qualidade do sítio em sua regra de ligação preferencial. Ainda assim, quando αA = 0, ∀d, recuperase o modelo BA. O modelo MQ com métrica, possui o modelo MN como caso particular, ∀d, quando ηi = 1. Se αA = 0 e ηi = 1, recupera-se o modelo BA.. O modelo de Afinidade não possui métrica, dessa forma ele não tem o modelo MN como caso particular. Ainda assim é possível recuperar o modelo BA se Aij = 0, indicando que não existe diferença entre a qualidade dos sítios. Este modelo não possui o modelo MQ como caso particular. Por fim, o modelo de Afinidade com Métrica, possui o modelo MN com d = 2 como caso particular. se Aij = 0. É possível ainda recuperar o modelo BA se Aij = 0 e αA = 0. Esse modelo apesar de ser um pouco mais completo, foi estudado apenas para d = 2 e não possui o modelo MQ como caso particular. . . . . . . . . . . . . xviii. 65.

(19) 3.2. Sumário dos mecanismos de alguns modelos de rede. Tabela retirada da referência [8]. . .. 4.1. Nesta tabela constam alguns valores dos parâmetros q e κ referentes aos ajustes. 66. de P (k) da Fig.4.7 usando a função q-exponencial para d = 1, 2, 3, 4. As duas primeiras colunas são os parâmetros da rede. As duas colunas seguintes são os parâmetros de ajuste da q-exponencial. A última coluna corresponde aos “p-values” do teste estatístico não-paramétrico de Kolmogorov-Smirnov. Neste teste, as curvas de ajustes são consideradas aceitáveis se p > 0.05. Podemos ver em nossos resultados que p ≥ 0.73 indicando que as distribuições. de conectividades são muito bem descritas por funções q-exponenciais. Nós analisamos redes com 105 sítios e 103 amostras. Os erros que são indicados foram calculados por meio de limites superiores aos obtidos usando o método do qui-quadrado. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. xix. 81.

(20) Cap´ıtulo. 1. Introdução A palavra “Física” tem origem no antigo grego e significa Natureza. Sendo assim, a física é a ciência que estuda a natureza em seus aspectos mais gerais e busca compreender científica e matematicamente os comportamentos naturais do mundo ao nosso redor, desde partículas elementares até as grandes galáxias. Particularmente, a física desempenha um papel muito importante na área tecnológica, suas evoluções são frequentemente traduzidas no desenvolvimento de novas tecnologias. Dentre várias áreas de estudo da física a Física Estatística é aquela que usa ferramentas da teoria das probabilidades, estatística e, particularmente, as ferramentas matemáticas, na solução de problemas físicos de sistemas que possuem um número muito grande de unidades interagentes. Aplicações da física estatística incluem problemas em diversos campos da ciência: física, biologia, química, neurologia e até mesmo na sociologia. Embora alguns problemas em física estatística possam ser resolvidos analiticamente, vários problemas não possuem ainda soluções analíticas. As pesquisas mais recentes utilizam o moderno poder de processamento computacional para simular ou aproximar soluções desses problemas. As ferramentas analíticas e computacionais, particularmente da física estatística, apresentam um caráter universal, sendo portanto apropriadas para tratar sistemas formados por muitas unidades interagentes, independentemente da natureza dessa unidade. Isto constitui a moderna área de Sistemas Complexos.. 1.

(21) Capítulo 1. Introdução. 2. Não existe uma definição técnica precisa do que é um sistema complexo, porém a maioria dos pesquisadores no campo concordam que um Sistema Complexo (SC) é um sistema composto por muitas partes interagentes, em que o comportamento coletivo destas partes é mais do que a soma do comportamento de suas partes individuais. O comportamento coletivo é algumas vezes também chamado de “comportamento emergente”. Sendo assim, um sistema complexo pode ser definido como sendo um sistema de partes interagentes que apresentam um comportamento emergente. Essas unidades interagentes podem ser átomos, neurônios no cérebro, árvores em uma floresta, as pessoas de uma sociedade, etc. Exemplos clássicos de sistemas complexos incluem sistemas da matéria condensada, ecosistemas, a economia e o mercado financeiro, o cérebro, o sistema imunológico, materiais granulares, o trânsito, as colônias de insetos, e até toda a sociedade humana. As pesquisas na área de SC são muito ativas, multidisciplinares e interdisciplinares, mesclando conhecimentos de diversas áreas, tais como: física, matemática, biologia, sociologia, dentre outras áreas de pesquisa. Infelizmente, os sistemas complexos são, como seu nome deixa claro, complexos, o que os torna difíceis de estudar e compreender. A teoria dos sistemas complexos é dividida em duas abordagens básicas. A primeira envolve a criação e o estudo de modelos matemáticos simplificados que, embora não imitem exatamente o comportamento de sistemas reais, tentam abstrair os elementos qualitativos mais importantes em um quadro solvível a partir do qual podemos obter uma visão científica. As ferramentas usadas nesses estudos incluem teoria de sistemas dinâmicos, teoria de jogos, teoria da informação, autômatos celulares, redes, teoria da complexidade computacional e métodos numéricos. A segunda abordagem é criar modelos mais abrangentes e realistas, geralmente sob a forma de simulações computacionais que representam as partes interativas de um sistema complexo, muitas vezes até detalhes minuciosos e, em seguida, observar e medir os comportamentos emergentes que aparecem. As ferramentas desta abordagem incluem técnicas, como por exemplo, a simulação de Monte Carlo. Dentro da grande área de SC temos uma sub-área bastante estudada, que é a Teoria das Redes e é nessa área que estaremos focando os estudos dessa tese. Uma rede corresponde a um grafo, cuja representação se dá por um conjunto de nós ligados por arestas. Esta rede ou grafo, permite-nos representar relações (interações) entre as partes constituintes deste sistema. Muitos pesquisadores se dedicaram a estudar as propriedades dos vários tipos de grafos e como estes são constituídos, ou seja, como se agrupam os seus nós. No Capítulo 2 apresentaremos um resumo da teoria dos grafos com os principais resultados que serão úteis para o desenvolvimento desta tese. Pesquisas na área de.

(22) Capítulo 1. Introdução. 3. redes são essenciais para a compreensão dos sistemas que possuem relações complexas entre seus constituintes. Estudos nessa área têm dado contribuições significativas em diversos campos da ciência. Duas aplicações de estudos de redes interessantes e bastante atuais são: no tratamento do câncer [9], e em gravitação quântica [10], mostrando o quão interdisciplinar essa área é. A física estatística tem como foco de estudo os sistemas que possuem muitas unidades (átomos ou moléculas) interagentes. Dessa forma, é natural supor que os métodos dessa área sejam úteis no estudo de redes. E de fato já existem vários estudos na área de redes envolvendo percolação, parâmetros de ordem, transições de fase, e outras áreas da física estatística [11]. Devido ao avanço tecnológico e a criação de computadores cada vez mais potentes, no fim do século XX, análises de dados em grande escala passou a ser possível. Com isso, ficou claro que a teoria dos grafos aleatórios clássicos era falha na descrição de muitas redes do mundo real [11]. Os trabalhos de Barabási e Albert sobre a WWW [12], e o de Faloutsos, Faloutsos e Faloutsos sobre os roteadores de Internet [13] mostraram que a distribuição de ligações entre os sítios dessas redes não era completamente aleatória o que as impedia de serem descritas pela teoria dos grafos de Erdös e Rényi (grafos aleatórios). Estas redes, no entanto, apresentavam uma distribuição de grau diferente de uma Poissoniana ou similares. Tal distribuição de conectividade apresentava uma cauda em lei de potência P (k) ∼ k −γ com. o expoente γ entre 2 e 3. A informação implícita nas redes livres de escala, assim chamadas,. é que a distribuição de ligações entre os sítios desta rede não é democrática, ou seja, poucos sítios apresentam alta conectividade enquanto que a maioria dos sítios têm pouquíssimas ligações. A distribuição de ligações das redes livres de escala é heterogênea. Redes desse tipo foram estudadas por Barabási o qual propôs um modelo simples a fim de obter redes com uma distribuição de conectividade em lei de potência (P (k) ∝ k −γ ) [12]. A partir do modelo de Barabási-Albert muitos modelos teóricos foram propostos. incluindo os ingredientes necessários para se obter uma distribuição de conectividade em lei de potência. A maioria dos modelos propostos são apenas topológicos, ou seja, não levam em conta a distância Euclidiana entre os sítios da rede. É verdade que em algumas redes a distância não é relevante, como por exemplo na Internet. Em contrapartida, na rede de aeroportos não se pode negligenciar a distância geográfica. Em 2005 Soares et al. propuseram um modelo de rede geográfica bidimensional o qual foi chamado de Modelo de Natal, e estudaram diversas propriedades dessas redes. O modelo possui dois parâmetros controláveis, αA e αG , os resultados mostraram que αG.

(23) Capítulo 1. Introdução. 4. não altera a distribuição de conectividade, mas o parâmetro αA determina se as interações entre os sítios são de longo alcance ou locais. Podemos usar as ferramentas da mecânica estatística para descrever esse sistema, uma vez que este possui um número muito grande de constituintes. No entanto, foi mostrado por Soares et al.. [14, 15] que a estatística. mais apropriada para descrição de redes complexas com interações de longo alcance, não é a estatística de Boltzmann-Gibbs, mas sim a estatística não-extensiva (também chamada de q−estatística), desenvolvida pelo físico Constantino Tsallis em 1988 [16]. A q-estatística vem sendo utilizada com sucesso para explicar o comportamento de sistemas complexos nãoextensivos, como por exemplo materiais magnéticos e vítreos, galáxias, processamento de imagens, grandes moléculas como o DNA, bolsa de valores, em engenharia hidráulica entre outras aplicações [17, 18, 19, 20, 21, 22, 23, 24]. Recentemente a estatística de Tsallis tem tido uma atenção especial em física de altas energias [25]. A estatística proposta por Tsallis generaliza a Mecânica Estatística de Boltzmann-Gibbs, abrangendo assim fenômenos nãoextensivos e fora do equilíbrio. Nesta tese estaremos apresentando uma generalização do modelo geográfico 2D desenvolvido por Soares D. J, da Silva L. R. e Tsallis C., o qual chamaremos de Modelo de Natal d-dimensional. Simulações computacionais foram realizadas para d = 1, 2, 3 e 4 a fim de verificar como a dimensão influencia nas propriedades da rede. Nosso objetivo é verificar como os parâmetros q e κ, provenientes da mecânica estatística não-extensiva de Tsallis, menor caminho médio (hli), expoente dinâmico β (associado à evolução temporal da conectividade dos sítios) e a entropia da distribuição de grau da rede, são alterados pela dimensão. Essa Tese está organizada em cinco capítulos. No capítulo dois apresentaremos a teoria de redes com os conceitos e resultados essenciais para a compreensão deste trabalho. No capítulo 3 serão expostos três modelos de redes: o modelo de Barabási-Albert (BA), o modelo de qualidade (MQ) e o Modelo de Natal 2D (MN) bem como apresentaremos de maneira sucinta a estatística de Boltzmann-Gibbs e a estatística não-extensiva de Tsallis aplicadas às redes complexas. Tanto os modelos como a teoria da mecânica estatística não-extensiva serão úteis para a compreensão do Modelo de Natal d-dimensional proposto aqui. No capítulo 4 apresentaremos os resultados do modelo geográfico d-dimensional. E por fim, no capítulo 5, falaremos sobre as conclusões e perspectivas de trabalhos futuros..

(24) Cap´ıtulo. 2. Fundamentos da Teoria de Redes Diversos sistemas do mundo real podem ser representados como um grafo, ou seja, um conjunto de vértices e arestas. Ao olharmos ao nosso redor veremos vários sistemas que possuem muitos elementos os quais estão conectados, como por exemplo, as redes tecnológicas (Internet, a rede World Wide Web), redes sociais (facebook, instagram, twitter...), redes biológicas (interações entre genes e proteínas do nosso corpo, rede de neurônios), ecológicas (cadeia alimentar), dentre outras. Sistemas físicos também podem ser modelados como uma rede como por exemplo a interação entre átomos e matéria. A área de redes tem como foco de estudo sistemas com muitos componentes interligados. Com o avanço computacional tem-se tornado comum a utilização da teoria de redes para tratar esses sistemas, uma vez que esse avanço possibilitou o estudo de modelos teóricos e de redes reais com um número muito grande de constituintes, a fim de obter resultados cada vez mais precisos. Nessa abordagem, não estamos interessados nas características individuais de cada elemento que compõe o sistema, mas sim no comportamento coletivo do sistema conectado. Neste capítulo apresentaremos alguns dos principais conceitos e propriedades estudadas em redes a fim de caracterizá-las e classificá-las.. 2.1. Breve história da ciência das redes. A ciência das redes não é uma área nova de estudo, é bastante antiga. Tem suas 5.

(25) Capítulo 2. Fundamentos da Teoria de Redes. 6. raízes em 1735 quando o matemático suíço Leornard Euler usou a teoria de grafos para resolver o problema das pontes de Königsberg. A história da ciência das redes é dividida em três períodos: (1) período inicial (pré-rede) (1736-1966), quando a ciência de redes era realmente a matemática de grafos; (2) período meso-rede (1967-1998), quando a ciência das redes era ainda chamada de “a nova ciência das redes”, mas de fato, aplicações de rede foram surgindo da literatura de pesquisa; e (3) o período moderno (1998 - presente), quando os pioneiros da atual definição de ciência de redes estabeleceram os fundamentos e mostraram que estes fundamentos tinham significado no mundo real [7]. Os avanços na área de redes durante os primeiros 200 anos do início do estudo da teoria, teve basicamente, a contribuição de matemáticos e sociólogos. Por volta de 1950, o matemático Húngaro Paul Erdös, com seu famoso trabalho de grafos aleatórios [26], restabeleceu a teoria de grafos e fundamentou o ramo da matemática discreta [7]. Hoje o modelo de Erdös e Rényi (ER) é usado como referência no estudo de redes aleatórias. Os estudos empíricos de redes, significativamente, tem seus fundamentos na sociologia, nos quais pesquisadores têm se dedicado a estudos de redes sociais desde os anos de 1930. Entre os anos de 1960 e 1970, a teoria de grafos foi bastante utilizada por cientistas sociais para modelar redes sociais e estudar o comportamento de pessoas em grupos [7]. Em 1967, Stanley Milgram introduziu à comunidade científica de ciências sociais a noção de “mundo pequeno”, através do seu experimento “seis graus de separação” [27]. Este experimento mostrou que a distância média entre duas pessoas selecionadas aleatoriamente em uma dada região, é aproximadamente de seis intermediadores. Voltaremos a falar sobre este assunto na seção 2.5. O estudo de redes foi estabelecido como disciplina científica, de fato, no final dos anos 1990 quando um grande número de cientistas de diversas áreas começou a utilizar redes para representar fenômenos físicos e biológicos. Nos dias atuais a área de redes tem desempenhado um importante papel na representação e estudo de sistemas reais interconectados, para os quais as ferramentas de redes fornecem uma representação simples, mas tremendamente útil na análise do comportamento desses sistemas. O interesse de físicos por essa área é recente e a abordagem difere daquela utilizada por matemáticos e sociólogos. Diferentemente de matemáticos, a nossa análise é fundamentada em estudos inspirados em redes reais, tais como a internet [13, 28, 2, 29, 30], redes de relacionamentos [31, 32, 33, 34, 35] e redes biológicas [36, 37, 38, 39]. Ao contrário dos sociólogos, os físicos têm se concentrado nas propriedades estatísticas das redes mais.

(26) Capítulo 2. Fundamentos da Teoria de Redes. 7. do que com as propriedades individuais dos nós. Enquanto que os sociólogos estão preocupados em responder “quais nós da rede têm mais conexões?” os físicos buscam responder: “qual o número médio de conexões que um nó tem?” ou melhor, “qual é a distribuição do número de conexões?”. O questionamento central para os físicos seria como quantificar, de forma apropriada, certos padrões existentes nas redes e como esses padrões influenciariam no funcionamento de sistemas conectados. Ao estudar uma rede, então, estamos preocupados em analisar a estrutura da rede, ou seja, “como um conjunto de nós e arestas que representam algo real estão conectados?” e a dinâmica da rede, ou seja, “como a rede evolui com o tempo?” ou “o que acontece quando ela evolui?” e “por que isso acontece?” [40]. Esses são alguns questionamentos que faremos ao analisar sistemas conectados.. 2.2. Definições e elementos básicos de redes. A teoria de grafos, em sua forma matemática, é frequentemente citada como tendo início com o matemático Leonard Euler e a resolução do problema das pontes de Königsberg. A cidade de Königsberg era banhada pelo rio Pregel, o qual cortava a cidade formando ilhas (ver Fig. 2.2). Haviam sete pontes que conectavam as porções de terra e eram utilizadas para fazer transportes de pessoas e cargas. Leornard Euler lançou a seguinte questão: “Existe algum caminho pelo qual seja possível passar por todas as pontes e retornar ao ponto inicial sem passar pela mesma ponte mais de uma vez?”. Para responder a essa pergunta ele modelou o sistema terra-ponte como uma rede (grafo) onde cada porção de terra era um nó (vértice) e cada ponte uma ligação (ver Fig. 2.2). Euler mostrou que a solução para este problema só era possível se os nós (ilhas) visitados tivessem um número par de arestas (pontes), com exceção do nó de partida e do nó de chegada que deveriam ter um número ímpar. Na cidade de Königsberg mais de dois nós tinham um número ímpar de ligações, portanto, não era possível atravessar a cidade pelo caminho proposto por Euler. Euler percebeu que o único fator importante para resolução desse problema era a estrutura topológica da rede, e portanto, poderia ser representado como um grafo, contendo as ilhas como vértices e as pontes como arestas [11, 34]. Uma rede, de forma simplificada, é uma coleção de itens conectados entre si. De maneira formal, chamamos esses itens de vértices (ou nós), e as ligações entre eles de arestas (ver Fig. 2.1). Uma rede é definida por sua estrutura (vértices e arestas) e seu comportamento.

(27) Capítulo 2. Fundamentos da Teoria de Redes. 8. (o que a rede faz como resultado das interações entre os vértices e as arestas). Em matemática, sistemas que podem ser modelados dessa forma são chamados de grafos. A teoria de grafos, portanto, é utilizada para descrever matematicamente os conceitos em redes. Algumas vezes, redes e grafos podem ser confundidos, no entanto, existem diferenças sutis e conceituais entre os dois termos. Os grafos são representações abstratas de redes, enquanto que redes são simplificações de sistemas reais conectados. Em geral, uma rede sempre é uma representação da realidade, ou mesmo um modelo que remete à realidade observada. Dessa forma, a ciência das redes é uma abstração da realidade, portanto podemos dizer que redes são grafos que representam alguma coisa real. Se essa abstração pode explicar o comportamento de um sistema real então a ciência das redes é uma ferramenta extremamente poderosa e útil para o estudo de sistemas conectados [7, 11].. 7 6 8 5 1 4 2. 3. Figura 2.1: Exemplo simples de rede. As esferas são os vértices e as ligações entre eles são as arestas. Podemos dizer então que esse grafo possui oito (8) vértices e dezessete (17) arestas. Figura retirada da referência [1].

(28) Capítulo 2. Fundamentos da Teoria de Redes. 9. Figura 2.2: Imagem ilustrativa da cidade de Königsberg. Em azul temos o rio Pregel cortando a cidade produzindo a formação de ilhas. Em vermelho temos as pontes de Königsberg ligando as porções de terra. Figura retirada de http://world.mathigon.org/Graph_Theory. 2.2.1. Teoria dos grafos. Matematicamente um grafo G = (V, A, f ) consiste de dois conjuntos finitos V e A em que V são os vértices e A as arestas. Cada aresta consiste de um par de vértices e uma função f que define a forma com que esses vértices estão conectados uns aos outros. Chamamos essa função de Regra de ligação 1 . O conjunto G = (V, A, f ) nos dá informações suficientes para desenhar a rede, no entanto, esse conjunto é insuficiente para definir seu comportamento dinâmico [7]. A parte dinâmica de uma rede é definida por um conjunto de micro regras que governam o comportamento de vértices e arestas. As macro regras ditam o surgimento de propriedades globais da rede. Um exemplo de micro regra seria justamente a regra de ligação preferencial, no entanto, a distribuição de grau da rede, que veremos na próxima seção, é uma regra do nível macro [7]. 1. A regra de ligação pode ser aleatória - não existe nenhum nó privilegiado, todos têm a mesma probabilidade de receber (ou não) ligações. Pode ser ainda preferencial de tal forma que alguns nós da rede terão maiores chances de receber ligações..

(29) Capítulo 2. Fundamentos da Teoria de Redes. 10. É importante ressaltar que em muitos contextos reais, o tamanho do sistema N é determinado pelo número de constituintes que ele possui, ou seja, N = V , sendo V o número de vértices da rede. Na rede de relacionamentos do facebook, por exemplo, o tamanho da rede seria dado pela quantidade de pessoas que fazem parte dessa rede. Na teoria de grafos, V geralmente define a ordem do grafo, enquanto que A, o número de arestas, define o tamanho dele. Nesta tese estaremos considerando sempre, a menos que seja especificado o contrário, que o tamanho da rede é determinado pelo número de vértices que ele possui.. 2.2.2. Noções básicas. Segue abaixo as definições de alguns conceitos fundamentais da teoria de grafos: 1. Topologia − também chamada de arquitetura, é a propriedade que surge, ao longo do. tempo como consequência de forças distribuídas ou comportamentos autônomos de seus nós. Por exemplo, redes de livre-escala surgem como uma força da ligação preferencial [7].. 2. Grau de um vértice − é definido como sendo a quantidade de arestas que conecta. um dado vértice ao grafo (ver Fig. 2.3a). Essa propriedade é também chamada de conectividade e é representada por k. Existem algumas redes que são caracterizadas. pela presença de nós com um número muito grande de conexões (alto grau) comparados à maioria dos nós do grafo. Estes nós são geralmente chamados de pólos ou hubs e a presença de pólos na rede define sua topologia. Para identificar os pólos existentes em uma rede basta contabilizar o grau de todos os nós. Aquele sítio que possuir o maior grau será o pólo dominante do grafo. Algumas redes não apresentam pólos uma vez que a conectividade dos vértices tem um valor próximo à média hki [7]. O grau máximo. kmax de um vértice em uma rede dependerá, em geral, do tamanho da rede.. 3. Vizinhança − dizemos que dois vértices são vizinhos, ou adjacentes, se eles compar-. tilham uma mesma aresta. De maneira formal: se o vértice i está conectado ao vértice j eles são vizinhos (ver Fig. 2.3c).. 4. Grafo direcionado2 − é aquele em que suas arestas definem o sentido de fluxo de. informação, ou seja, se existe uma aresta direcionada de um dado vértice i para outro j, o fluxo de informação no grafo só poderá se dar no sentido de i para j e não no sentido. 2. Também chamado de digrafo..

(30) Capítulo 2. Fundamentos da Teoria de Redes 1. 1. 11. 3. 3 2 2. 4 5 (a) Grafo não direcionado. 4. 5. (c) Vizinhança. (b) Grafo direcionado. Figura 2.3: (a) Grafo não direcionado com 5 vértices e 4 arestas. Os vértices 1, 3, 4 e 5 têm grau igual 1, ou seja, k1 = k3 = k4 = k5 = 1. O vértice 2 tem grau igual a 4, ou seja k2 = 4. (b) Grafo direcionado, neste grafo os vértices 1, 4 e 5 têm apenas grau de entrada ki = 1, mas o vértice 3 tem apenas grau de de saída ko = 1. O vértice 2, no entanto tem grau de entrada ki = 1 e graus de saída ko = 3. (c) O vértice A é vizinho do vértice B, mas não é vizinho do vértice C.. contrário, a não ser que exista uma outra aresta direcionada de j para i. Em um grafo direcionado, o grau total de um vértice (kt ) será igual ao grau de entrada ki , ou seja, a quantidade de arestas que chegam nele, mais o grau de saída ko , que é a quantidade de arestas que saem dele. Dessa forma, dado um vértice j o grau dele será dado por: kj = ki + ko , onde os índices “i” e “o” referem-se a “in” e “out” respectivamente (ver Fig. 2.3b). Nesta tese trabalharemos apenas com grafos não direcionados. 5. Grafo ponderado − os grafos podem ainda ser classificados quanto às suas arestas que podem ou não apresentar pesos. Esses pesos podem representar um custo para ir de um dado vértice à outro, ou ainda, podem representar a facilidade/dificuldade de algumas ligações serem feitas ou desfeitas, caracterizando assim ligações fortes ou fracas. Esses pesos podem representar também a distância Euclidiana entre dois sítios (ver Fig. 2.4). 6. Grafo bipartido − são grafos com mais de um tipo de vértice em que só são permitidas ligações entre vértices do mesmo tipo. Muitas redes sociais são bipartidas, formando, o que os sociólogos chamam de redes de associação. Grafos bipartidos têm sido usados como modelo base de redes de contatos sexuais [31, 32, 33, 34]. Estes grafos possuem duas distribuições de grau (Seção 2.3) uma para cada um dos dois tipos de vértices. 7. Multigrafo − é um grafo no qual é permitido autoconexões (arestas ligando o vértice a si mesmo) ou mais de uma aresta conectando dois pares de vértices.. 8. Grafos estáticos e dinâmicos − grafos estáticos são aqueles em que o número de.

(31) Capítulo 2. Fundamentos da Teoria de Redes. 12. 7 6 8 5 1 4 2. 3. Figura 2.4: Grafo ponderado. Figura retirada da referência [1]. vértices e arestas é constante no tempo, equanto que os grafos dinâmicos crescem gradativamente com a adição de novos vértices e arestas a cada passo de tempo [7].. 2.3. Distribuição de grau. A distribuição de grau é uma das propriedades mais básicas que pode ser medida em uma rede, talvez seja uma das primeiras propriedades a ser analisada. A distribuição de grau ou “distribuição de conectividade” P (k) pode ser definida como sendo a fração de nós de uma rede que possui grau k, ou ainda, a probabilidade que um vértice escolhido aleatoriamente tenha grau k. Em redes direcionadas é necessário levar em consideração a conectividade de entrada kin e de saída kout , uma vez que para cada tipo de conectividade teremos uma distribuição de grau associada Pin (k) e Pout (k), representando a conectividade de entrada e saída do nó, respectivamente. A distribuição de conectividade vai nos dizer de que forma estão distribuídas as conexões em uma rede. Para a rede de Erdös-Rényi (rede aleatória), por exemplo, a distribuição de grau é do tipo Poissoniana. Para a rede WWW, a distribuição é assintoticamente uma Lei de Potência. Diversos tipos de distribuições são encontradas em redes reais e teóricas. Apresentaremos aqui as características e propriedades das distribuições de grau mais conhecidas..

(32) Capítulo 2. Fundamentos da Teoria de Redes. 13. 1.2.  1.0. k. . e− k!. k. k. P ( k). 0.8. 0.6. 0.4. 0.2. 0.0 0. 5. 10. 15. 20. k. Figura 2.5: Distribuição de Poisson.. 2.3.1. Distribuição de Poisson. A distribuição de Poisson é um caso particular da distribuição binomial quando N →. ∞, hki é finito e p, a probabilidade de ocorrência de um dado evento, é muito pequena. Essa distribuição, portanto, é útil para descrever sistemas com um número grande de constituintes e eventos com baixa probabilidade de ocorrência. A distribuição de Poisson é definida como: P (k) =. e−z z k k!. (2.1). onde z = hki = p(N − 1). A maioria dos grafos aleatórios clássicos possuem um distribuição. Poissoniana. A principal característica dessa distribuição é a existência de um valor médio de conexão (conectividade típica) (ver Fig. 2.5) e para valores distantes da média P (k) → 0,. isto acontece devido ao termo de k!. Podemos dizer que redes que apresentam esse tipo de distribuição são mais homogêneas, ou seja, a maioria dos sítios tem conectividade igual à média ou próximo à média.. 2.3.2. Distribuição lei de potência. A quantidade de sistemas reais que compartilham as propriedades de livre escala são consideráveis, por exemplo, muitas redes biológicas, sociais e tecnológicos apresentam essa.

(33) Capítulo 2. Fundamentos da Teoria de Redes. 14. propriedade. A distribuição de grau destas redes é bem aproximada por uma lei de potência, ou seja, P (k) se desvia significativamente de uma distribuição de Poisson (ver Fig. 2.9a). Um aumento significativo na pesquisa de redes livres de escala aconteceu após os trabalhos de Albert, Jeong e Barabási em 1999 [41]. Antes desse marco, pensava-se que a maioria das redes reais fossem aleatórias e obedecessem à distribuição de Poisson, porém não é o que se tem observado em muitas redes reais [8, 12, 42, 36, 43, 44, 13, 45, 46, 47, 31]. A distribuição em lei de potência, embora similar, tem um comportamento extremamente diferente de uma distribuição exponencial (ver Fig. 2.9). A cauda de uma função exponencial vai a zero muito mais rápido, por este motivo a distribuição em lei de potência é algumas vezes chamada de "distribuições de cauda pesada". Uma rede livre de escala ou “scale-free” é uma rede com distribuição de grau obedecendo à uma lei de potência da forma: P (k) ∼ k −γ. (2.2). onde k (1 < k < ∞) é a conectividade e para redes reais, geralmente 2 < γ < 3 [7]. De. maneira informal, redes livres de escala são aquelas em que um número muito pequeno de sítios apresentam alta conectividade (grau alto) e a maioria dos nós apresentam grau muito baixo. Como vimos anteriormente, esses nós com alta conectividade são os chamados pólos, dessa forma, redes livres de escala são redes que possuem pólos. Alguns estudos realizados por Newman e outros, têm mostrado que o grau máximo (kmax ) de um vértice, em redes livres de escala, dependerá do tamanho da rede seguindo a equação kmax ∼ N 1/(γ−1) [34, 48, 49, 50].. Esse tipo de rede não é completamente aleatória, uma vez que estão caracterizadas por alguma. regra de ligação preferencial (alguns sítios têm mais probabilidade de receber ligações que outros), no entanto essas redes estão possuem menos estrutura (regularidade) do que redes de mundo pequeno e mais estrutura dos que as redes aleatórias clássicas. A distribuição de grau P (k) de uma rede nos dá informações sobre a homogeneidade ou heterogeneidade da mesma. As redes aleatórias de Erdös e Rényie e as redes de mundo pequeno de Watts e Strogatz possuem uma distribuição de conectividade Poissoniana, dessa forma a conectividade dos sítios flutuam em torno de um valor médio. Nesse tipo de rede podemos dizer que a conectividade está homogeneamente distribuída. As redes livres de escala, no entanto, são mais heterogêneas por possuir uma distribuição de conectividade “antidemocrática”, ou seja, existem muitos sítios com baixa conectividade e pouquíssimos sítios com conectividade muito alta. As redes heterogêneas são altamente robustas a ataques aleatórios e altamente frágeis a ataques dirigidos aos sítios com alto grau, isto é, as propriedades.

(34) Capítulo 2. Fundamentos da Teoria de Redes. 0.6. 15. 1.0.  0.5. k. . e− k! γ. k. e −k. k. k−. k −γ. 0.8. P ( k). P ( k). 0.4. 0.3. 0.6. 0.4 0.2. 0.2. 0.1. 0.0 0. 10. 20. 30. 40. 50. 5. k. 15. 20. k. (a) Distribuição Poisson 10. log[P(k)]. 10. 10. (b) Distribuição exponencial. 0. -1. e −k. k −γ . 10. k. . e− k!. k. k. -2. 10. 0. log(k). 10. 1. (c) Plot log-log. Figura 2.6: Figuras ilustrativas do comportamento de algumas distribuições de conectividade. (a) Comparação entre a distribuição de Poisson e a distribuição Lei de Potência. (b) Ilustração do comportamento de uma função exponencial versus uma lei de potência. Ao esboçar as duas funções em um gráfico linear-linear, podemos observar que a função exponencial vai a zero muito mais rapidamente do que a lei de potência. (c) Representamos as três distribuições em um gráfico log − log. Uma das formas de verificar se a função obedece a uma lei de potência é esboçá-la em um gráfico log − log. Podemos ver que a lei de potência corresponde a uma reta cuja inclinação corresponde ao expoente γ da lei de potência..

(35) Capítulo 2. Fundamentos da Teoria de Redes. 16. de conectividade de uma rede heterogênea não são afetadas pela remoção aleatória de uma fração de nós quando comparada com uma rede homogênea. No entanto, essas redes são drasticamente afetadas pela remoção preferencial dos pólos, levando à fragmentação da rede [51]. Os momentos de uma distribuição de conectividade em lei de potência P (k) = Ak −γ podem ser calculados da seguinte forma: n. hk i =. Z. ∞. (2.3). k n Ak −γ dk. kmin. onde A é o fator de normalização que pode ser calculado por: 1 =. Z. ∞. Ak −γ dk. kmin. . k −γ+1 1 = A 0 − min −γ + 1 γ−1 A = −γ+1 kmin A = (γ − 1)k γ−1.  (2.4). Para n = 1 temos:. hki = hki =. Z. ∞. Ak 1−γ dk. kmin. A [k 2−γ ]∞ kmin 2−γ. (2.5). Podemos notar que a equação 2.5 diverge se γ ≤ 2. Leis de potência com valores de. γ ≤ 2 não têm hki finito [52]. Mas, o que significa dizer que a média é infinita? Na verdade se pegarmos dados de uma rede real com um distribuição de conectividade em lei de potência. com γ nesse limite, veremos que é possível calcular o grau médio. No entanto, nos referimos aqui a número verdadeiramente infinito de amostras, hki → ∞ [52]. Para γ > 2 na equação 2.5 a média é perfeitamente bem definida com um valor dado por: hki =. γ−1 kmin γ−2. (2.6).

(36) Capítulo 2. Fundamentos da Teoria de Redes. 17. Ao calcularmos o segundo momento da distribuição P (k) temos: 2. hk i = hk 2 i =. Z. ∞. Ak 2−γ dk. kmin. A [k 3−γ ]∞ kmin 3−γ. (2.7). É fácil ver que hk 2 i → ∞ quando γ ≤ 3. Sabemos que a maioria das redes reais possam 2 <. γ < 3. Dessa forma, para redes com γ nesse limite, temos que a variância, e consequentemente p o desvio padrão (σ ≡ hk 2 i − hki), não são bem definidos [52]. Se γ > 3 temos que hk 2 i é. bem definido e assume a forma:. hk 2 i =. γ−1 2 k γ − 3 min. (2.8). Estes resultados podem ser facilmente estendidos para mostrar que, em geral, todos os momentos hk n i existem para n < γ − 1 e divergem caso contrário. Os momentos que são bem. definidos podem ser calculados através da equação [52]: hk n i =. 2.4. γ−1 n kmin γ−1−n. (2.9). Coeficiente de agregação. O Coeficiente de Agregação é uma grandeza que nos informa o quão agregados estão os primeiros vizinhos de um dado sítio, ou seja, quão conectados estão entre si. Essa medida na rede nos dá uma característica local do nó. Watts e Strogatz foram os primeiros a introduzir esse conceito. O coeficiente de agregação é um parâmetro bastante estudado em redes reais [53], ele está relacionado com ciclos de comprimento três (triângulos de ligações) presentes na vizinhança de um dado sítio. É intuitivo pensar que se o vértice i está conectado ao vértice j e o vértice j está conectado ao vértice k então existe uma grande probabilidade de que i e k estejam conectados entre si.3 . Esse conceito é muito estudado em redes sociais onde se vê naturalmente a formação de “panelinhas”, ou seja, é muito provável que “o amigo de seu amigo sejam também amigos” [34, 54]. Matematicamente falando, o coeficiente de agregação é a probabilidade que dois 3. Essa propriedade também é conhecida como Transitividade da rede.

(37) Capítulo 2. Fundamentos da Teoria de Redes. 18. 1. Figura 2.7: O vértice verde tem 6 vizinhos próximos, e 5 ligações entre eles (arestas vermelhas) o coeficiente de agregação do sítio 1 é c1 = 1/3. Figura retirada da referência [1]. vizinhos de um nó estejam conectados entre si, em outras palavras, se um nó j tem kj vizinhos próximos com nj conexões entre eles o coeficiente de agregação local desse sítio será dado por: cj (kj ) =. nj kj (kj − 1)/2. (2.10). Em que kj é a conectividade do sítio j, nj é o número total de conexões dos primeiros vizinhos de j e kj (kj − 1)/2 é o número total de ligações possíveis entre os vizinhos do sítio j, ver Fig. 2.10. Para obter o coeficiente de agregação médio da rede fazemos a média dos ci. individuais e dividimos pelo tamanho da rede, ou seja, pelo número total de vértices conforme a equação abaixo: C=. 2.5. 1 X 1 X ni ci = N i N i ki (ki − 1)/2. (2.11). Menor caminho - distância química. Podemos calcular a distância entre dois nós quaisquer da rede contabilizando a quan-.

(38) Capítulo 2. Fundamentos da Teoria de Redes. 19. tidade de arestas entres eles. Nem sempre há um único caminho conectando dois nós da rede, no entanto, estamos interessados no caminho mais curto que liga esses nós. Por definição, o menor caminho entre dois sítios é aquele que possui a menor quantidade de arestas separandoos. Sendo assim, a distância entre dois vértices quaisquer é calculada através da menor soma possível do número total de arestas que separa esses vértices. Quando não é possível estabelecer um caminho entre dois vértices i e j, ou seja, quando estão desconectados, define-se dij = ∞. O estudo do menor caminho médio em um grafo é importante, por exemplo, para otimização do fluxo de informação em uma dada rede. Redes que possuem o menor caminho médio pequeno quando comparado à redes aleatórias de mesmo tamanho N e hki, permi-. tem que a informação se propague muito rapidamente. Esta medida é muito importante,. por exemplo, na internet, permitindo um tráfego mais rápido na rede. Matematicamente, podemos definir o menor caminho médio da rede como sendo a média de todos os menores caminhos dij tomada sobre todos os N (N − 1)/2 pares de vértices da rede. hli =. X 2 dij N (N − 1) i<j. (2.12). Alguns grafos aleatórios exibem um comportamento tal que o menor caminho médio cresce logaritmicamente com o tamanho do sistema N , ou seja, hli ∼ log N . O fato de. que qualquer par de sítios está conectado por uma distância pequena caracteriza o efeito de mundo pequeno [1]. Outra medida relacionada ao conceito de distância é o diâmetro da rede hlD i. Essa medida está associada à maior distância entre quaisquer dois sítios da rede. O. diâmetro de uma rede está associado à sua robustez, ou seja, o quanto ela é vulnerável a ataques aleatórios ou direcionados (ver Fig. 2.8)..

(39) Capítulo 2. Fundamentos da Teoria de Redes. 20. Figura 2.8:. Figura exibindo a fragilidade e robustez das redes aleatórias e de livre escala. Figura retirada do site http://escoladeredes.net/profiles/blogs/ redes-complexas-da-internet-as.. Experimento de Milgram - o efeito de mundo pequeno. Em 1967, Stanley Milgram realizou um experimento para medir a distância média em uma rede de “conhecidos” nos Estados Unidos [27]. Ele buscava responder a seguinte pergunta: Quantas ligações intermediárias separam dois indivíduos (distantes geograficamente) aleatoriamente selecionados? Para realizar seu experimento Milgram escolheu duas regiões como ponto de partida (Nebraska e Kansas). A pessoa alvo, aquela a qual se queria que a informação chegasse, foi escolhida em Massachusetts. Um número grande de pessoas residentes em Nebraska e Kansas foi escolhido aleatoriamente para receberem uma carta contendo as seguintes instruções: 1. Se você conhece a pessoa alvo, envie a carta diretamente para ela; 2. Caso contrário, envie uma cópia destas instruções para uma pessoa “conhecida” (alguém que você saiba o primeiro nome) que provavelmente tenha mais chances de conhecer a.

Referências

Documentos relacionados

de início das provas, munido de documento de identidade que mereça fé pública e caneta esferográfica azul ou preta para a realização das provas.. Horário de início das

Germana SALA CUIDADO AO ADOLESCENTE Profª Adria 19:20 às 20:10 CUIDADO INTEGRAL À SAÚDE DA MULHER Profª Kalline CENTRO CIRURGICO E CME Prof.Wagner SALA CUIDADO INTEGRAL

Abram faz mais do que indicar um verbete e dar-lhe o sentido: faz uma clas- sificação, nas vinte e tantas categorias (os termos-título) em que consiste o seu livro, da infinidade

Para tal, a ferramenta utilizada e a adaptabilidade de espa&lt;;os de aproximagao e de fungoes para o metodo dos elementos finitos, tendo como parametro de analise urn

O artigo 3º do Projeto de Lei nº 466/2015 prevê que devem ser adotadas, pelo menos, as seguintes medidas mitigadoras do número de acidentes com animais silvestres nas

As atividades do Programa de Controle Vetorial da Doença de Chagas (PCDCh) no Estado do Ceará foram descritas desde o início de suas atividades até o momento coberto pela

Esta unidade discutiu o cuidado à pessoa em situação de crise psíquica, oferecendo subsídios para que o profissional Enfermeiro possa, primeiramente, sensibilizar-se para as ações

Por fim, a análise do modelo matemático obtido é feita durante a fase de interpretação de resultados, seguida pela avaliação (validação) da representação matemática