• Nenhum resultado encontrado

Na Figura 4.1 mostramos uma das mais importantes propriedades da rede gerada pelo modelo homofílico - a distribuição de conectividade. Seu comportamento (gráfico in- terno da Figura 4.1) revela algo interessante: a maioria dos sítios possui um baixo número de primeiros vizinhos, porém existe uma cauda significativa para a distribuição, corres- pondendo aos sítios de conectividades, substancialmente, maiores. Este fato confere, a rede homofílica, uma forte heterogeneidade nos padrões de conexões entre seus sítios, o que, de uma forma mais simples, se traduz na ausência de uma valor típico para a cone- ctividade dos mesmos.

Outra característica interessante (Figura 4.1), aparece quando se usa escala loga- rítmica em ambos os eixos. Esta situação indica que a cauda da distribuição obedece uma lei de potência, P (k) ∼ k−λ, com γ = 2.84 ± 0.01, mostrando que a rede é livre de escala.

A dinâmica da rede homofílica, ou melhor, a evolução de sua estrutura pode ser razoavelmente compreendida, observando que a própria ligação preferencial do modelo já tem, inerentemente, incorporada em si mesma o fato das ligações se formarem, com maior probabilidade, entre novos sítios e aqueles outros, que conjuntamente, apresentem grande número de primeiros vizinhos e alta similaridade entre suas características. Dentro desse contexto, um resultado bastante interessante é visto na Figura 4.2(a). Seu gráfico mostra a dependência temporal da conectividade dos sítios ⟨ki(t, t0)⟩. Mais precisamente,

Figura 4.1: A distribuição de conectividades para o modelo homofílico (m = 1 e N = 105), onde

ambos os eixos estão em escala logarítmica. Ela segue uma lei de potência P (k) ∼ k−λ, com

γ = 2.84 ± 0.01, mostrando que a rede é livre de escala.

o sítio i entrou na rede. A função ⟨ki(t, t0)⟩cresce com o tempo

⟨kηi(t, t0)⟩ ∝

( t t0

com o expoente dinâmico β, indicando a taxa com que os sítios adquirem ligações. Os valores do expoente dinâmico β são limitados, 0 < β < 1, por que à medida que o tempo passa um dado sítio sempre aumenta o número de ligações (β > 0), no entanto ele não recebe mais que uma ligação em cada passo de tempo (β < 1). Outro fato que chama atenção sobre a limitação do valores de β está relacionado com as leis de potências associ-

Figura 4.2:(a) Dependência temporal da conectividade, ⟨ki(t, t0)⟩, para sítios com características

η= 0.1, 0.5 e 0.8. Note que ⟨ki(t, t0)⟩segue uma lei de potência em cada caso e a inclinação cresce

linearmente com η até o sítio apresentar característica igual a 0.5. Após esse valor, a inclinação decresce e é, aproximadamente, igual as de sítios com características abaixo de 0.5. (b) O expoente dinâmico β como uma função de η. Ele é obtido da inclinação de ⟨ki(t, t0)⟩versus η (β é uniforme-

mente distribuído, m = 1 e N = 105). O valor máximo de β ocorre para η = 0.5 e é igual a 0.55, seu

valor mínimo é 0.37 em η=0.0 (ou η = 1.0), indicando que sítios com η ≈ 0.5 adquirem, em média, mais conexões. Isso permite que sítios com características em torno de 0.5 entrem na rede em um tempo posterior e, ainda assim, consigam um maior número de ligações do que outros que já estão nela há muito mais tempo.

adas aos diferentes valores de η. Como podemos ver, a inclinação dos gráficos cresce até o sítio apresentar característica intrínseca igual a 0.5. A partir daí, ou seja, para sítios com características intrínsecas superiores a 0.5, temos que a inclinação decresce e, além disso, seus valores são, aproximadamente, iguais aos dos sítios com características abaixo de 0.5. Isto permite determinar os valores limites (inferior e superior) do expoente dinânico βconforme indicado na legenda da figura 4.2(b).

A figura 4.2(b) exibe um comportamento simétrico de β no intervalo entre 0 e 1. Isso ocorre devido à combinação da ligação preferencial (que privilegia conexões entre sítios de perfis similares) com a distribuição uniforme das características dos sítios. A partir disso, claramente, observamos que as características intrínsecas, η, potencialmente semelhantes, a todas as demais, são as daqueles sítios que possuem características da região central do intervalo [0; 1]. Este fato faz com que tais sítios tenham sua taxa de

recebimento ligação maximizada e, por consequência, tornam-se os prováveis pólos da rede.

GENERALIZAÇÃO DA REDE COMPLEXA HOMOFÍLICA

5.1

Introdução

Muitos sistemas naturais e artificiais, como a Internet, a World Wide Web (WWW), os mapas de estradas [30, 28], a propagação de fofocas [31, 32] e as bacias hidrográficas [4], podem ser facilmente associados às Redes Complexas. Isto é possível devido à definição flexível de uma rede no domínio da ciência complexa, onde um conjunto de sítios e liga- ções representam respectivamente os constituintes do sistema e as interações entre eles. Para descrever o alto grau de complexidade, decorrente do inerente emaranhamento de ligações que acontece durante o processo de crescimento de uma rede, é necessário uma longa lista de propriedades. Normalmente, para as propriedades estruturais, são utiliza- das as seguintes: distribuição de conectividade, comprimento do menor caminho médio, coeficiente de agregação [4, 5], robustez [34, 35] e medições de algum tipo de correlação. Já as propriedades dinâmicas, por outro lado, são geralmente calculadas no âmbito dos pro- cessos de propagação, como problema de navegação [80, 81, 82, 83], sistemas magnéticos [91, 92], sincronização [87, 88] e modelos epidêmicos [84, 85, 86].

Um dos primeiros modelos de redes de crescimento aleatório a mostrar distribui- ção de conectividades exibindo lei de potência foi introduzido por Barabási e Albert (BA), em 1999 [23] ver capítulo 1. O mecanismo do modelo, baseado no crescimento (o sistema se expande através da adição de novos sítios) e na ligação preferencial (um novo sítio tem

uma probabilidade maior de conectar-se com outros mais conectados) produz correlações como a assimetria entre os sítios mais novos e mais velhos, frequentemente observados em redes reais. Apesar do sucesso do modelo BA, redes de livre escala (LE) também po- dem ser geradas por meio de outros modelos [95, 40, 41, 42]. Em particular, a ligação preferencial pode ser facilmente modificada para incorporar parâmetros observados em redes reais, tais como: idade, qualidade (como o conteúdo de uma página web na WWW ou o fator de impacto na rede de citações), o peso de cada ligação que pode representar a força entre dois sítios, e a homofilia, que está relacionada com a semelhança entre as características dos sítios.

Considerando as diferenças na qualidade dos sítios, Bianconi e Barabási [23] mo- dificaram o modelo de ligação preferencial introduzido por BA, incorporando um novo termo chamado fitness. Este, por sua vez, permite que novos sítios se tornem (hubs) pólos [93, 94, 95] (sítios altamente conectados) e, além disso, amplia a heterogeneidade da dis- tribuição de conectividade da rede. Recentemente, diferentes estudos acerca dos efeitos das distribuições fitness em leis de potência e da inclusão do termo homofílico na regra de ligação preferencial tem fornecido modelos LE mais realísticos por explicarem a tendência de sítios se ligarem com outros semelhantes [38, 43]. Em tais modelos, há uma região onde as características intrínsecas de sítios têm um papel importante não só na taxa de obtenção de ligações, bem como no número de ligações entre sítios com características similares e dissimilares.

Apoiado por trabalhos recentes que consideram as características de sítios e liga- ções [103, 104] nesta tese, generalizamos e complementamos o modelo homofílico, e suge- rimos uma nova maneira de medir correlações para os sítios que contêm diferentes qua- lidades, tal como os sítios no modelo fitness. Em primeiro lugar, introduzimos o modelo de rede generalizada homofílica LE e apresentamos os resultados para o comportamento topológico da rede. A seguir, apresentamos a metodologia para medir as correlações in- cluindo a mistura assortativa [19] e mostraremos os resultados das simulações numéricas. Por fim, as conclusões serão apresentadas.

5.2

Modelo Generalizado

são acerca do modelo homofílico LE, bem como investigar as correlações entre os sítios. O algoritmo para obter a rede compreende duas etapas básicas, a etapa de inicialização e a de construção. Na etapa de inicialização atribuímos as propriedades básicas dos sítios, como suas conectividades e qualidades. Dentro da etapa de construção, onde o crescimento da rede acontece, adicionamos sítios e ligações seguindo o processo de ligação preferencial.

No nosso modelo, a rede começa com m0 sítios totalmente conectados. Para cada

sítio i atribuímos ao acaso uma característica intrínseca η, que segue uma distribuição ar- bitrária ρ (η) e toma valores reais entre 0 e 1. Para simplificar, rotulamos todos os sítios de 1 até o tamanho da rede, no sentido de que, a característica intrínseca de um determi- nado sítio i é dada por ηi. Na parte de construção do algoritmo, a cada passo de tempo,

nós adicionamos um novo sítio j a ser ligado com m (6 M0)sítios da rede pré-existente.

Consideramos que a probabilidade de ligação ∏ide um sítio novo n a ser ligado com um sítio i é dada por:

Πi = Aσ iki ∑ jAσjkj , (5.1)

onde ki é a conectividade do sítio i, Ai é a similitude entre a característica intrínseca dos

sítios i e n, e σ é um parâmetro para controlar o grau de importância do termo homofílico na regra da ligação preferencial.

Aqui, definimos que a similitude Aiseja igual a 1−|ηi− ηn|. Observe que 0 < Ai <

1de modo que para sítios perfeitamente similares, aqueles com características intrínsecas iguais, (ηi = ηn), Ai = 1. Por outro lado, Ai = 0 para sítios perfeitamente dissimilares

(|ηi − ηn| = 1). Assim, a similitude Ai mede quão similares dois sítios são, e é usada

para levar em conta as diferentes habilidades dos sítios para competir por uma ligação. Consideramos o parâmetro σ ≥ 0. Portanto, quando σ = 0 o modelo presente se reduz ao modelo BA [23]. Quando σ = 1, recuperamos o modelo homofílico presente na Ref. [38]. Note que a presente generalização da ligação preferencial, Eq. 4.1, privilegia, não somente a conexão entre os novos sítios e aqueles que têm elevado grau, mas também entre sítios com elevada similitude. A figura 4.1 é uma representação pictórica do processo de crescimento descrito.

Figura 5.1: Ilustração de como a generalização do modelo homofílico de escala livre cresce. Em (a) o número inicial de sítios, mo, é dois. Na sequência em (b), (c) e (d), cada sítio faz apenas uma

nova ligação, m = 1, com um sítio pré-existente. Os valores para a característica intrínseca de cada sítio são: η1 = 0, 5, η2 = 0, 1, η3 = 0, 6, η4 = 0, 2, η5 = 0, 4. Ao decidir onde estabelecer uma nova

ligação (linha pontilhada), o novo sítio prefere conectar-se com outro de características similares e com maior número de conexões, conjuntamente. Figura proveniente da Ref. [20]

5.3

Resultados

5.3.1

Resultados Topológicos

A rede homofílica generalizada investigada neste capítulo reflete as propriedades básicas de muitos sistemas reais em que os sítios competem por ligações com outros; assim um sítio pode adquirir ligações apenas à custa de outros sítios. Por isso, uma melhor compreensão do parâmetro σ na ligação preferencial e a distribuição de características intrínsecas serão discutidos e analisados a seguir.

A figura 4.2 mostra que nossa generalização leva a redes LE, onde o valor de cada σestá relacionado com um grau de distribuição específico seguindo uma distribuição em lei de potência, P (k) ∝ k−γ, com γ como é observado na figura 4.3. Isto indica que alguns

sítios têm alta conectividade enquanto muitos têm um número pequeno de vizinhos mais próximos (heterogeneidade de grau) como na rede Apoloniana, modelo BA, modelo fit- ness, a WWW, a rede dos contatos sexuais humanos, redes de citações entre outros. Esta distribuição de conectividade tipo cauda longa, associada com o tamanho finito de nossa rede provoca fortes influências nas propriedades dependentes do tamanho sistema, mas todas as figuras presentes nesta tese contêm propriedades da rede obtidas com o sistema

em um estado estacionário. Esta é a razão pela qual fixamos o tamanho da rede de 105

sítios em todos os gráficos.

10 0 10 1 10 2 10 3 10 4 10 -8 10 -6 10 -4 10 -2 10 0 P ( k ) K

Figura 5.2: Distribuição de conectividades cumulativa P (K) para modelo homofílico generali- zado LE (valores típicos σ, m0 = m = 1, N = 105, η, é distribuído uniformemente, média tomada

sobre 12000 realizações independentes) representada em escala logarítmica. Segue a lei de po- tência. P (k) ∝ k−γ, com valores variando entre 2.84(2) e 2.92(1). Este comportamento revela a

ausência de valores típicos para a conectividade dos sítios.

A partir da Figura 4.3, dois modelos de rede conhecidos são observados. Para σ = 0 o modelo BA é recuperado; por outro lado, a rede homofílica LE é obtida por σ = 1. É interessante observar que para σ = 2, o valor mínimo do expoente γ é obtido e quando o parâmetro σ aumenta, o expoente γ tende para um valor constante em torno de 2.9, ou seja, em σ = 2, existem alguns "super hubs"(sítios que têm conexões superiores aos previstos por outros valores de σ, incluindo modelo BA e rede homofílica LE). Todo esse comportamento do modelo pode ser atribuído à ligação preferencial que privilegia conexões entre sítios que têm elevado número de vizinhos próximos e a alta similaridade

em conjunto.

A figura 4.4 mostra a dependência temporal da conectividade média, ⟨ki(t, t0)⟩

para dois valores diferentes de σ. Esta nos informa como a conectividade média cresce, assintoticamente, com o tempo t/t0, em que t0é o tempo no qual o sítio i foi adicionado ao

sistema. Matematicamente, a dependência temporal da conectividade média é dada por:

⟨ki(t, t0)⟩ ∝ ( t t0 )β , (5.2) 0 2 4 6 8 10 2.84 2.86 2.88 2.90 2.92 2.94 Modelo de Barabasi M o d e l o H o m o f i l i c o

Figura 5.3: Dependência do expoente γ com σ (m0 = m = 1, N = 105, η, é uniformemente

distribuído, e com média acima de 12000 em realizações). Para σ = 0 o modelo BA é recuperado; por outro lado, a rede homofílica de livre escala é alcançada por σ = 1. Um resultado interessante é observado quando σ = 2, o expoente γ é mínimo.

Onde β é o expoente dinâmico, indicando a taxa com a qual os sítios obtêm li- gações. Para σ = 2, notamos um comportamento simétrico de β no intervalo de 0 a 1, bem como a existência de uma característica ideal para os sítios, 0.5, que maximiza a taxa de ligações que um dado sítio específico adquire. O mesmo comportamento é observado

10 0 10 1 10 2 10 3 10 0 10 1 10 2 10 3 10 4 10 0 10 1 10 2 10 3 a) K t , t 0 = 9 b) K t , t 0 = 9 t/t 0

Figura 5.4: Dependência temporal da conectividade média ⟨ki(t, t0)⟩, para sítios com η=0.1, 0.3,

0.5, 0.7 e 0.9 ( m0 = m = 1, N = 105, η é uniformemente distribuído e a média é feita com 12000

realizações independentes). Comparações entre figuras (a) e (b) mostram que ⟨ki(t, t0)⟩segue a lei

de potência em cada caso e o expoente dinâmico β(η) é dependente de σ. Para altos valores de σ ou σ = 0, todos os sítios aumentam sua conectividade no tempo como ⟨ki(t, t0)⟩ ∝ (t/t0)β onde

β = 1/2e t0é o tempo em que o sítio i foi adicionado ao sistema, independente de sua característica

intrínseca.

quando o modelo homofílico LE é considerado, σ = 1 [mais detalhes, veja 34]. Por outro lado, para σ = 0 (modelo BA) e para altos valores de σ, as linhas de dependência temporal da conectividade média se sobrepõem, ou seja, os valores das características intrínsecas levam à mesma lei de potência, Eq. 2, independente de sua idade. Consequentemente, os sítios mais velhos terão maiores números de ligações, pois tiveram um longo tempo para adquiri-las. Isto negligencia um aspecto importante dos sistemas competitivos: nem todos os sítios são igualmente bem sucedidos em adquirir ligações.

Observando a figura 4.5, podemos concluir que valores de σ maior que 0 e menor que 10 tornam β dependente de η. É importante lembrar dois pontos: (i) nem todas as distribuições ρ(η) resultarão em uma dependência temporal da conectividade tipo lei de potência; e (ii) β > 0 porque um sítio sempre aumenta o número de conexões com o passar do tempo e β < 1 porque a conectividade do sítio não ganha mais que m ligações em cada passo, t, isto é, o expoente dinâmico β é limitado.

0.0 0.2 0.4 0.6 0.8 1.0 0.2 0.3 0.4 0.5 0.6

Figura 5.5: Dependência do expoente dinâmico β com η (m0 = m = 1, N = 105, η é unifor-

memente distribuído e com média realizada sobre 12000 realizações independentes) para σ = 0 (modelo BA), 2 e 10. O valor máximo de β é 0.55 em η = 0.5 e em σ = 2, indicando que sítios com ηem torno de 0.5 adquirem, em média, mais ligações. Isso possibilita que sítios, com característica intrínseca em torno de 0.5, entrem na rede um tempo depois e superem sítios que estão na rede por um tempo maior. Para σ = 0 ou 10, o expoente β é o mesmo, consequentemente, todos os sítios são igualmente bem sucedidos em adquirir ligações e independentes do tempo.

Além disso, a figura 4.5 mostra um comportamento simétrico de β no intervalo de 0 a 1, que desaparece quando σ assume um valor nulo ou valores elevados. Isto indica que o modelo BA compartilha do mesmo comportamento para o expoente β, mas não po- demos inferir que σ = 10 (a valores elevados para σ) representa o modelo BA. Quando σ ̸= 0, sítios com perfis semelhantes são importantes na ligação preferencial, refletindo-se

em correlação e diferentes redes do modelo BA (correlações serão discutidas adiante). Por exemplo, em redes sociais, os amigos são geralmente semelhantes entre si em termos de etnia, idade, ocupações, interesses, crenças e opiniões. Então, pessoas que são mais seme- lhantes entre si são melhores em transformar um encontro casual em uma relação social. Os exemplos não se limitam apenas neste tipo de rede, mas acontece com frequência em muitas outras.

5.3.2

Resultados em Correlações

Nesta seção, apresentaremos os resultados numéricos considerando as caracterís- ticas intrínsecas dos sítios sendo distribuídas pela lei de potência e dadas por:

ρ(η) = Bηα

Onde B é uma constante. Portanto, vamos rotular todos os sítios da rede e atri- buir à característica intrínseca do sítio i, ηi(ηivariando entre 0 e 1). É importante notar que

a distribuição ρ(η) pode seguir outro tipo de distribuição, como a distribuição gaussiana ou uniforme. A principal razão da escolha da distribuição em lei de potência é a popu- laridade dela nos problemas acadêmicos, como redes LE, sistemas com geometria fractal, percolação, difusão reorganizada de agregados, entre outros.

As figuras 4.6 e 4.7 descrevem a correlação em função da conectividade onde a pri- meira figura é a dependência do coeficiente de agregação C(k) com o número de vizinhos dos sítios k; e a segunda é o grau médio dos vizinhos versus o número de vizinhos dos sí- tios k. Note que em ambas as figuras há uma dependência do parâmetro m, enquanto este é independente de α. Além disso, o coeficiente de agregação exibe dois comportamentos que são dependentes da conectividade: (i) coeficiente de agregação alto e lei de potência para valores menores que k ∼ 100; e (ii) o coeficiente de agregação estabiliza para valores maiores que k ∼ 100. Por outro lado, a inclinação negativa na figura 4.7 indica que a cor- relação de grau exibe mistura disassortativa, isto é, sítios menos conectados estão ligados a sítios altamente conectados.

A figura 4.8 mostra o grau médio de vizinhos de um sítio como uma função das características intrínsecas dos sítios η. Note que os resultados exibidos são dependen-

10 0 10 1 10 2 10 3 10 4 10 -5 10 -4 10 -3 10 -2 10 -1 10 0 m=2 m=4 m=8 m=2 m=4 m=8 m=2 m=4 m=8 m=2 m=4 m=8 C ( k ) K

Figura 5.6: Simulação numérica do modelo homofílico generalizado LE (o tamanho da rede foi fixado em 105sítios, m

0 = m, σ = 1 e média tomada sobre 12000 realizações independentes): de-

pendência do coeficiente de agregação C(k) com o número de vizinhos k dos sítios para diferentes valores de α e m (número de ligações adicionadas a cada passo de tempo). O gráfico retrata que o coeficiente de agregação apresenta dois comportamentos: (i) para valores menores que k ∼ 100, alto coeficiente de agregação e uma lei de potência é observada; (ii) enquanto para valores maiores que k ∼ 100, o coeficiente de agregação está estabilizado. Assim, isso acontece independente do parâmetro α, mas é influenciado pelo parâmetro m.

tes dos parâmetros α e m. Portanto, a distribuição das características intrínsecas dos sítios afeta somente a correlação das características intrínsecas, enquanto a correlação grau-grau não é influenciada por α, mesmo que a ligação preferencial envolva a conectividade e a similaridade das características intrínsecas. Em particular, o parâmetro m é responsável, diretamente, por incrementar a conectividade dos sítios, logo o grau médio dos vizinhos de um sítio aumenta quando m cresce. Esta é a razão pela qual na figura 4.8 os dados para maiores valores de m estão no topo da figura. Por outro lado, quando α é maior que zero, a simetria do grau médio dos vizinhos de um sítio se quebra. Isso mostra a rele- vância da distribuição das características intrínsecas na correlação entre as características intrínsecas. Lembrando que para σ = 1 e α = 0, mostrado na figura 8a, os hubs são sítios

com características intrínsecas por volta de 0.5 (ver figura 4.5), ao passo que para dife- rentes valores de σ e α uma análise mais detalhada se faz necessária para compreender melhor as influências de α na conectividade média dos sítios. Finalmente, na figura 8d, a flutuação para n menor que η ∝ 0.3 é alta porque há poucos sítios com baixos valores de características intrínsecas quando o parâmetro α assume valores altos.

10 0 10 1 10 2 10 3 10 4 10 0 10 1 10 2 m=2 m=4 m=8 m=2 m=4 m=8 m=2 m=4 m=8 m=2 m=4 m=8 < K n m > K

Figura 5.7:O grau médio dos vizinhos de um sítio, < knn >, como uma função do grau k do sítio.

Ele mostra que a correlação do grau exibe mistura disassortativa. Os símbolos são resultados de simulação numérica do modelo homofílico generalizado LE (o tamanho da rede foi fixado em 105

sítios, m0= m, σ = 1 e média sobre 12000 amostras).

A figura 4.9 mostra a característica intrínseca média dos vizinhos de um sítio como uma função da característica intrínseca de um sítio para diferentes valores de α e m onde σ = 1. Ela retrata que m não é um parâmetro importante para a característica intrínseca média dos vizinhos de um sítio. Porém, uma pequena mudança do parâmetro αpode provocar um salto abrupto no gráfico. Em particular, α = 0 (ρ(η) é uniforme), isto leva a um comportamento linear onde a correlação é positiva, ou seja, sítios com carac- terística intrínseca similar estão conectados entre si. Isto decorre da ligação preferencial onde a similitude Aij facilita a ligação entre sítios de perfis similares. Á medida que o va-

20 40 60 0.0 0.2 0.4 0.6 0.8 1.0 20 40 60 0.0 0.2 0.4 0.6 0.8 1.0 m=2 m=4 m=8 a) b) < K n n > < K n n > c) d)

Figura 5.8: O grau médio < knn >dos vizinhos de um sítio como uma função da característica

Documentos relacionados