Rede de Bianconi-Barab´ asi - An´ alise de Algoritmos de Redes Fundamentais

4.2 An´ alise de Algoritmos de Redes Fundamentais

4.2.3 Rede de Bianconi-Barab´ asi

A grande diferen¸ca entre os modelos de Barabási-Albert e Bianconi-Barabási é o parâmetro η atribu´ıdo a cada vértice da rede e que altera significativamente o cálculo de suas probabilidades. Vejamos como isso se reflete na constru¸cão de uma rede do ponto de vista computacional.

4.2.3.1 C´odigo Padr˜ao

A partir do código padrão do modelo de Barabási-Albert, devemos inicialmente incluir tanto uma nova lista (lista eta) quanto um la¸co que atribua o parâmetro de qualidade de cada vértice representado por eta. O código abaixo faz parte da etapa de inicializa¸cão das variáveis. ite_n = 0 while ite_n < N: eta = random() lista_eta[ite_n] = eta ite_n = ite_n + 1

De acordo com o passo (1) do algoritmo da se¸cão (3.2) o parâmetro η deve ser determinado aleatoriamente, por isso novamente foi utilizado a fun¸cão random explicitamente. Observe que

os valores desse parâmetro para todos os vértices da rede são guardadas em lista eta. Em seguida, deve-se construir a condi¸cão inicial da rede, que é semelhante àquela apresentada para o modelo de Barabási-Albert.

O código padrão para a rede de Bianconi também utiliza as fun¸cões calcula prob e encontra v2 relatadas na se¸cão anterior. Porém há uma diferen¸ca na fun¸cão que calcula a probabilidade de cada vértice, pois agora esta deve incluir em seus cálculos o parâmetro η, de acordo com a equa¸cão (3.13). A seguir é listado o código referente a esta fun¸cão.

def calcula_prob(ite_n): soma_prob = 0

ite_s = 0

while ite_s < ite_n:

s = lista_k[ite_s]*lista_eta[ite_s] lista_k_eta[ite_s] = s

ite_s = ite_s + 1

soma_lista_k_eta = float(sum(lista_k_eta)) ite_p = 0

while ite_p < ite_n:

prob = lista_k_eta[ite_p]/soma_lista_k_eta lista_todas_prob[ite_p] = prob

soma_prob = soma_prob + prob

lista_soma_prob[ite_p] = soma_prob ite_p = ite_p + 1

Note que a fun¸cão acima é divida em dois la¸cos. O primeiro realiza o somatório do produto ηk para todos os vértices e o segundo é responsável por concluir o cálculo da probabilidade de cada vértice. Veja também que foi necessário a cria¸cão de uma nova lista (lista k eta) para armazenar a quantidade ηk de cada vértice.

Como o formato deste código é derivado do código padrão para o modelo de Barabási e Albert, ele herda a desvantagem do desperd´ıcio de tempo na execu¸cão do cálculo de probabilidades. E isso ainda é agravado devido ao aumento do número de la¸cos necessários. Quanto maior o número de vértices na rede, mais facilmente se poderá verificar este excesso de tempo na execu¸cão deste algoritmo.

4.2.3.2 C´odigo R´apido

A partir da ideia do código rápido do modelo de Barabási e Albert, buscamos encontrar também uma forma de modificarmos o cálculo das probabilidades do código padrão do modelo de Bianconi-Barabási, com o objetivo de tornarmos mais eficientes as simula¸cões para esse modelo. Vale ressaltarmos que até o presente momento, não foi encontrado na literatura nenhuma implementa¸cão desse modelo igual a que será apresentada, ou seja, uma versão rápida do modelo de Bianconi-Barabási.

A maneira encontrada baseia-se no cálculo das probabilidades de eventos independentes. Dizemos que dois eventos são independentes quando a probabilidade de ocorrer um deles não depende do fato do outro ocorrer ou não. Além disso, a probabilidade de que os dois eventos ocorram ao mesmo tempo é obtida pelo produto das probabilidades de ocorrência de ambos individualmente. Esse produto é observado na defini¸cão da probabilidade de conexão do modelo de Bianconi (equa¸cão 3.13). Neste caso, os eventos a que nos referimos são: (i) o sorteio aleatório de um vértice dentre os já existentes na rede, utilizando o mesmo método do código rápido para o modelo de Barabási-Albert; (ii) o sorteio da probabilidade referente ao parâmetro η. O funcionamento deste algoritmo é baseado na independência desses dois sorteios. A seguir apresentaremos o la¸co principal deste código, onde estes sorteios são realizados:

ite_n = M+1 while ite_n < N: v1 = ite_n ite_m = 0 while ite_m < M: v2 = lista_todas_conex[int(conta_conex*random())] while v2 in lista_adj[v1]: v2 = lista_todas_conex[int(conta_conex*random())] test_eta = random() if lista_eta[v2] > test_eta: lista_adj[v1].append(v2) lista_adj[v2].append(v1) lista_k[v1] = lista_k[v1] + 1 lista_k[v2] = lista_k[v2] + 1 lista_todas_conex[conta_conex] = v1 conta_conex = conta_conex + 1 lista_todas_conex[conta_conex] = v2 conta_conex = conta_conex + 1 ite_m = ite_m + 1 ite_n = ite_n + 1

Observe então que inicialmente utilizamos o método do código rápido de Barabási-Albert para escolher um vértice já presente na rede para uma poss´ıvel conexão com o vértice que está entrando nela (evento i). Em seguida, realizamos um sorteio de um número aleatório que é comparado ao valor de η do s´ıtio candidato à conexão (evento ii). Se o número sorteado (test eta) for menor ou igual ao η, o vértice sorteado no evento (i) realizará a conexão. Quando o número sorteado é maior do que o η do vértice que está sendo avaliado, realiza-se o sorteio de um novo vértice e de um novo número para compara¸cão com η. Portanto, para que um vértice da rede realize a conexão com o vértice que está entrando, esses dois eventos devem ser satisfeitos. Isto é, o vértice deve ser sorteado e (ao mesmo tempo) ter o valor do η se encaixando dentro da probabilidade sorteada no segundo evento.

Os demais códigos apresentados ao longo deste trabalho derivam dos códigos discutidos nesta se¸cão. Por isso, consideramos estes como códigos fundamentais para os estudo de redes. Deixamos a cargo do leitor interessado as demais implementa¸cões.

Cap´ıtulo 5

Redes sem Escala T´ıpica:

Modelos Alternativos

Dada a diversidade de sistemas reais que apresentam distribui¸cão de conectividade em lei de potência, os estudos sobre quais mecanismos são responsáveis por gerar redes sem escala t´ıpica têm ganhado grande destaque nos últimos anos. Na maioria das redes reais, novos vértices preferem realizar liga¸cões com os vértices mais conectados, processo que foi chamado de liga¸cão preferencial e que retrata como a probabilidade de um certo vértice receber novas liga¸cões aumenta com a sua conectividade. Acredita-se que a primeira inclusão do mecanismo de liga¸cão preferencial para se obter distribui¸cões de conectividade em lei de potência foi realizada por Yule em 1925 [38], buscando explicar a distribui¸cão encontrada no estudo do número de espécies por genêro de plantas com flores, processo que ficou conhecido como “Processo de Yule”. Outros modelos incluindo este mecanismo foram propostos nos anos seguintes por Simon [39], Price [40], entre outros. Entretanto, a denomina¸cão liga¸cão preferencial e a atual popularidade dos modelos de redes sem t´ıpica decorrem do trabalho de Barabási e Albert (se¸cão 3.1), os quais redescobriram o mecanismo de forma independente e propuseram um modelo capaz de gerar redes com distribui¸cão de conectividade em lei de potência a partir de um algoritmo simples, com o objetivo inicial de entender as distribui¸cões de conectividade da Web [17].

Como consequência do modelo de Barabási e Albert, foram surgindo outros modelos de redes, considerando diferentes tipos de fatores inclu´ıdos no mecanismo de liga¸cão preferencial e que continuassem gerando distribui¸cões de conectividade em lei de potência. Observamos isto no cap´ıtulo 3, onde todos os modelos continham o mecanismo de liga¸cão preferencial. Modelos que utilizam este mecanismo reproduzem satisfatoriamente o aparecimento das distribui¸cões que seguem lei de potência em redes reais. Entretanto, a liga¸cão preferencial não é o único mecanismo através do qual uma rede pode crescer e gerar este tipo de distribui¸cão de conectividade. Por isso, é importante estudarmos outros modelos cujas regras de conexão são baseadas em mecanismos diferentes, aparentemente sem nenhum v´ınculo com a liga¸cão preferencial, porém convergindo para um comportamento semelhante ao do modelo de Ba-

rabási e Albert. Dois desses modelos, com distribui¸cão de conectividade em lei de potência, serão discutidos neste cap´ıtulo: o modelo de cópia de vértices e o modelo de transforma¸cão de redes Poissonianas. O primeiro é um modelo amplamente conhecido, o qual foi elaborado para modelar o crescimento da Web. Enquanto isso, o segundo é um modelo em desenvolvimento, proposto para verificar se caracter´ısticas de redes livres de escala poderiam ser reproduzidas em redes constru´ıdas sem a regra de crescimento.

5.1 Modelo de C´opia de V´ertices

O mecanismo de cópia de vértices foi proposto originalmente por Kleinberg em 1999, ao estudar a Web [41], seguido por Vazquez, ao estudar redes biológicas [42]. A relevância deste mecanismo está em sua importância para sistemas reais. A seguir, listamos três exemplos. (i) Em redes sociais, quanto mais pessoas você conhece, maior é a sua chance de ser introduzido em novos c´ırculos de relacionamentos. Isso ocorre porque temos a tendência de “copiar” os amigos de nossos amigos. Por outro lado, se não tivermos amigos, torna-se mais dif´ıcil fazermos novos amigos. (ii) Em redes de itera¸cões de prote´ınas, a duplica¸cão genética, responsável pelo surgimento de novos genes em uma célula, pode ser mapeada pelo modelo de cópia, explicando a natureza livre de escala presente nessas redes [42, 43]. (iii) Na Web, os autores de uma nova página tendem a se conectar com links de outras páginas que possuam tópicos relacionados [41, 45, 46]. Devido à observa¸cão deste tipo de comportamento em vários sistemas reais, nesta se¸cão trataremos de um modelo baseado neste mecanismo e investigaremos suas caracter´ısticas.

A ideia básica deste mecanismo pode ser explicada fazendo alusão à rede de cita¸cões cient´ıficas. Antes disso, vamos analisar este tipo de rede considerando explicitamente1o mecanismo de liga¸cão preferencial. Para este caso, é fácil prever que ao lermos um artigo cient´ıfico, iremos encontrar em suas referências artigos citados mais frequentemente na academia do que artigos menos citados. Segundo o mecanismo de liga¸cão preferencial, isso nos conduziria a ter uma tendência maior de citar os artigos mais citados ao produzirmos artigos sobre temas semelhantes. Isto é, considerando este mecanismo, os pesquisadores seriam levados a “copiar” cita¸cões das referências de artigos que leram.

Vamos analisar agora, este mesmo tipo de rede considerando explicitamente o mecanismo de cópia de vértices. Note que inicialmente podemos estimar que os pesquisadores podem copiar todas as referências de um artigo para usar como referências do seu próprio artigo, dado que o tópico em estudo seja o mesmo. Isto seria então como adicionar um novo

1_{Estamos usando o termo “explicitamente” para deixar claro que estamos olhando para o mecanismo de}

liga¸cão preferencial, embora estejamos buscando implicitamente enxergar o mecanismo de cópia de vértices. De fato, a ideia fundamental por trás da cópia de vértices está impl´ıcita na liga¸cão preferencial, enquanto que a ideia básica da liga¸cão preferencial está impl´ıcita no mecanismo de cópia de vértices. Em outras palavras: quando um vértices escolhe ligar-se com um polo, ele está apenas copiando a escolha mais comum; enquanto que quando um vértice decide que a lista de seus vizinhos seja uma cópia da lista de vizinhos de outro, ele está implicitamente tentando se ligar ao mais conectado.

vértice a uma rede, no qual os seus vizinhos fossem completamente copiados de um único vértice já existente na rede. Esta situa¸cão apresenta um problema, pois apenas os artigos que já estão nas referências dos artigos lidos serão citados, o que faria com que nenhum novo artigo fosse algum dia citado. Uma solu¸cão para esse problema seria supormos que apenas uma parte das referências de um único artigo seja realmente copiada e que as outras cita¸cões sejam de outros artigos que podem ser trabalhos nunca antes citados ou que podem já ter sido citados em outros artigos. O importante é não copiar todas as referências de um único artigo. Isto seria como se ao adicionarmos um novo vértice na rede, este copiasse somente uma fra¸cão de vizinhos de um vértice já existente na rede e que seus outros vizinhos fossem escolhidos dentre os vértices restantes da rede. Dado esta ideia inicial, vamos conhecer as defini¸cões exatas deste mecanismo.

O mecanismo de cópia de vértices ocorre de tal forma que ao se introduzir um novo vértice em uma rede, este herda uma parte dos vizinhos de um vértice já presente nela. Isso é quase como se apenas duplicássemos um vértice que já está na rede. Porém não pode ser uma cópia perfeita, apenas uma fra¸cão γ dos vizinhos que o novo vértice pode ter deve ser copiada. O algoritmo para a constru¸cão de uma rede utilizando o modelo de cópia de vértices é o seguinte:

(1) Inicia-se a rede com N0 v´ertices conectados entre si.

(2) A cada passo de tempo é adicionado um novo vértice, o qual possui um número m´ınimo M0

de liga¸cões que deve realizar. Ao adicionar este novo vértice, é selecionado aleatoriamente um vértice que já está na rede e a partir dele sorteia-se aleatoriamente a fra¸cão γ dos vizinhos iniciais do novo vértice.

(3) A fra¸cão restante, ou seja, (1 − γ) dos seus vizinhos para serem copiados como vizinhos de cada novo vértice é preenchida ao se escolher aleatoriamente a quantidade necessária de vértices entre os que já fazem parte da rede e ainda não estão ligados a ele.

(4) Repete-se os passos (2) e (3) at´e o tamanho desejado do sistema.

Esta fra¸cão γ varia entre 0 e 1. Para os casos limites, é fácil perceber que se fizermos γ = 0, não existirá o sorteio da fra¸cão γ dos vizinhos iniciais do novo vértice, ou seja, nenhum vizinho do vértice escolhido para cópia se tornará vizinho do novo vértice. Então, todos os vizinhos do novo vértice serão escolhidos aleatoriamente dentro da rede já existente até completar o número m´ınimo de vizinhos iniciais M0. Teremos, portanto, uma rede aleatória

cuja distribui¸cão de conectividade tende a uma exponecial. Já quando fazemos γ = 1, todos os vizinhos do novo vértice serão herdados do vértice antigo, ou seja, neste caso sempre que adicionarmos um novo vértice e escolhermos um vértice aleatoriamente na rede para que sua fra¸cão γ seja copiada, podemos dizer que estaremos “duplicando” o mesmo. Com isso, todos os vértices adicionados terão sempre conjuntos de vizinhos idênticos e a distribui¸cão

de conectividade ter´a basicamente dois valores: M0 para a grande maioria dos v´ertices e

aproximadamente N para a minoria que j´a estava conectada aos v´ertices iniciais.

Note que, embora o processo de constru¸cão da rede mencione explicitamente apenas escolhas de caráter aleatório na descri¸cão dos passos do algoritmo, o mecanismo de cópia de vértices também privilegia os vértices mais conectados, pois eles possuem maior probabilidade de que um de seus vizinhos seja escolhido para cópia. Como consequência ocorrerá o aumento de sua conectividade, resultando em uma maior probabilidade de adquirir novas conexões (ver figura 5.1). Ou seja, este mecanismo também tenderá a produzir o efeito “ricos ficam cada vez mais ricos”, como o mecanismo de liga¸cão preferencial.

Figura 5.1: Ilustra¸cão do mecanismo de cópia de vértices. Ao se introduzir um novo vértice à rede, este escolhe um vértice aleatoriamente (na cor vermelha) que já existe na rede para copiar uma fra¸cão (50% para o caso representado) dos seus vizinhos.

Cálculos anal´ıticos mostram que a distribui¸cão de conectividade P (k) para redes constru´ıdas através do mecanismo de cópia de vértices, segue uma lei de potência do tipo P (k) ∼ k1+1/γ. Pode-se explicar este resultado, analisando a probabilidade de que um vértice qualquer da rede, o qual rotularemos como vértice i, receba uma nova conexão como resultado da adi¸cão de um novo vértice. Perceba que, considerando este mecanismo, a conectividade de um vértice qualquer da rede pode aumentar de duas maneiras: (i) quando ele é vizinho do vértice do qual será copiada uma parcela dos vizinhos e ele faz parte dessa parcela; (ii) quando ele não é vizinho do vértice do qual será copiada uma parcela dos vizinhos, mas é escolhido diretamente para conexão.

A primeira maneira, considera dois eventos independentes: o sorteio de um vértice que tem o vértice i como vizinho e o sorteio do vértice i dentro da parcela dos vizinhos a serem copiados. O primeiro evento leva em conta o sorteio aleatório de um vértice qualquer entre os N presentes na rede, o que acontece com probabilidade _N1. Além disso, o vértice sorteado deve ter o vértice i como vizinho, o que ocorre com ki dentre os N vértices da rede,

logo a probabilidade de ocorrˆencia do primeiro evento ´e ki

N. O segundo evento diz respeito `a

probabilidade de que o vértice i esteja entre os vizinhos a serem copiados. Essa probabilidade é igual à fra¸cão γ. Portanto, a probabilidade do vértice i ter sua conectividade aumentada tem probabilidade kiγ

N para o caso relatado.

Assim como no caso anterior, a segunda maneira também leva em conta dois eventos independentes: o fato do vértice i não fazer parte dos vizinhos copiados e o sorteio do vértice i

para se conectar diretamente com o novo vértice. Lembre-se que nesta etapa a fra¸cão restante (1 − γ) dos vizinhos do novo vértice é preenchida ao se escolher aleatoriamente a quantidade necessária de vértices entre os que já fazem parte da rede e ainda não estão ligados a ele. Neste caso, o número inicial de conexões que um novo vértice adicionado à rede estabelece, sem contar as conexões copiadas, é dado por (1−γ)c, onde c expressa a quantidade m´ınima de conexões estabelecidas por cada vértice (c = M0). Logo, a probabilidade do vértice i receber

uma dessas liga¸c˜oes ´e dada por (1−γ)c_N .

A partir dessa análise, podemos expressar a probabilidade de que o vértice i se conecte ao novo vértice adicionado à rede, incrementando sua conectividade, como:

P (ki → ki+ 1) = kiγ N + (1 − γ)c N = kiγ + (1 − γ)c N (5.1)

Para uma rede com N vértices, podemos definir pk(N ) como sendo a fra¸cão destes vértices

que possuem conectividade k. Assim, o número total esperado de tais vértices que devem receber uma nova conexão é dado por:

N pk(N )

kiγ + (1 − γ)c

N = [kiγ + (1 − γ)c]pk(N ) (5.2) Definindo uma nova vari´avel a = c1_γ − 1, podemos escrever γ em termo dela:

γ = c

c + a (5.3)

Dado isso, a equa¸c˜ao (5.2) resulta em:

[kiγ + (1 − γ)c]pk(N ) =

c(ki+ a)

c + a pk(N ) (5.4)

Podemos usar essa probabilidade para escrever a equa¸cão mestra, na qual exclu´ımos o uso do ´ındice i: (N + 1)pk(N + 1) = N pk(N ) + c(k − 1 + a) c + a pk−1(N ) − c(k + a) c + a pk(N ) (5.5) que informa o número de vértices com conectividade k após adi¸cão de um novo vértice. Nesta equa¸cão cada termo, da esquerda para a direita, significa: o número de vértices com conectividade k após a adi¸cão do novo vértice; o número de vértices com conectividade k antes da adi¸cão do novo vértice; o número de vértices que tinham conectividade k−1 antes da adi¸cão do novo vértice e passaram a ter conectividade k após a adi¸cão; e o número de vértices com conectividade k antes da adi¸cão do novo vértice e passaram a ter conectividade k + 1 após a adi¸cão. A resolu¸cão desta equa¸cão é trabalhosa e foge ao escopo deste trabalho, portanto sugerimos que vejam o passo-a-passo em [44]. Depois de resolvida a equa¸cão, obtemos a distribui¸cão de conectividade do modelo.

No limite em que k se torna grande, observa-se que a distribui¸cão de conectividade para o modelo de cópia de vértices segue uma lei de potência P (k) ∼ k−α, onde o expoente é dado por:

α = 2 + a

c = 1 + 1

γ (5.6)

Isto nos fornece que o expoente varia de 2 a infinito, dependendo de quão fiel é a cópia dos vértices. Entretanto, observe que o resultado previsto pela equa¸cão mestra leva a uma distribui¸cão em lei de potência que é apropriada para valores de γ na vizinhan¸ca de γ = 1₂, pois nesse caso a distribui¸cão realmente é uma lei de potência. Porém quando o resultado da equa¸cão mestra é testado com γ = 0 ou γ = 1, as distribui¸cões resultantes não são adequadas. Ou seja, a equa¸cão mestra produz uma solu¸cão em lei de potência que é apenas uma aproxima¸cão do resultado exato que ocorre para um valor intermediário de γ. Quando fazemos γ = 1₂, isto é, quando metade dos vizinhos iniciais do novo vértice é herdada do vértice antigo, a distribui¸cão de conectividade desse modelo é descrita pela mesma lei de potência válida para o modelo de Barabási e Albert, pois o expoente tem valor igual a 3 nos dois casos. Este resultado concorda corretamente com os resultados numéricos (ver figura 5.2). No entanto, esse resultado não é suficiente para podermos afirmar que o mecanismo de cópia

No documento Redes sem escala típica: visão geral, modelos alternativos e técnicas computacionais (páginas 82-92)