• Nenhum resultado encontrado

Meta-atributos para o PCV

4.4 Meta-atributos baseados em características de redes complexas

Redes complexas têm sido muito utilizadas, nos últimos anos, para a aná-lise de grafos. Dentre as diversas variações de redes complexas, as mais comuns são aquelas que podem ser rapidamente modeladas por meios dos seguintes tipos de grafos:

• grafos bidirecionais ponderados; • grafos unidirecionais ponderados; • grafos bidirecionais não ponderados; • grafos unidirecionais não ponderados.

Particularmente, no contexto do PCV, estamos interessados principalmente em grafos ponderados, por causa do valor de custo associado às arestas que conectam as cidades. Algumas características das redes não ponderadas tam-bém podem ser extraídas por conter informações relevantes sobre a estrutura do problema como, por exemplo, a distribuição de conexões entre as cidades. Grafos bidirecionais correspondem aos exemplos de TSP simétricos e os gra-fos unidirecionais representam os exemplos assimétricos. Diversas medidas para a caracterização de redes complexas foram descritas em (Costa et al., 2007). Algumas dessas medidas foram usadas para gerar o conjunto de meta-atributos listados na Tabela 4.4.

Tabela 4.4: Meta-atributos (MA) baseados em medidas para caracterizar redes

complexas.

MA Notação Matemática Descrição

M DG n(n−1)1 P

i6=jcij distância geodésica média

EGR n(n−1)1 P

i6=j 1

cij eficiência global da rede

M HG M DG1 média harmônica da

distân-cias geodésicas CAT 3N N3 coeficiente de agrupamento (transitividade) CAA n1 Pn i=1 N∆(i)

N3(i) coeficiente de agrupamento

alternativo ARP n1 Pn i=1si(k1i−1) Pn j=1 Pn k=j+1 cij+cik 2 aijaikajk coeficiente de agrupamento para redes ponderados

CCR 1 n Pn i=1ki(k2i−1) Pn j=1 Pn

k=1 13aijaik coeficiente cíclico da rede

GM V max {k1, ..., kn} grau máximo dos vértices

CGA (1/m) P j>ikikjaij−[(1/2m)P j>i(ki+kj)aij]2 (1/2m)P j>i(k2 i+k2 j)aij−[(1/2m)P

j>i(ki+kj)aij]2 correlação entre os graus de

saída das arestas V N C max {N V1, ..., N Vn}; N Vi = EGR−EGRi

EGR vulnerabilidade da rede EDG −Pt

k=1P (k)logP (k) entropia da distribuição do

grau dos vértices EV A −1

n

Pn i=1

Pn

j=1ajicijlog2cij entropia do vértice alvo CP V n1 Pn

i=11 −Py s=1(qis

ki)2 taxa de participação dos

vér-tices nas comunidades

GRA 1 m Pn i=1 Pn j=1aijaji Reciprocidade de aresta CM A Pn i=1 Pn j=1(aij−¯(a))(aji−¯(a)) Pn i=1 Pn

j=1(aij−¯(a))2 coeficiente de correlação da matriz de adjacência

Distância é uma das principais características de uma rede, que fornece informações essenciais sobre a sua estrutura geral. Em nosso caso, esta-mos considerando o custo de viagem entre duas cidades como sendo a

me-4.4. META-ATRIBUTOS BASEADOS EM CARACTERÍSTICAS DE REDES

COMPLEXAS 77

nor distância entre elas. Os três primeiros meta-atributos são relativos às propriedades capturadas por meio de medidas de distância. A distância ge-odésica média, que corresponde a média das distâncias entre todos os pares de vértices conectados em uma rede, é calculada pelo meta-atributo MDG. A distância entre dois vértices i e j também pode ser usado para quantificar a eficiência da rede em enviar as informações entre esses vértices, conforme mostra a equação que calcula o valor do meta-atributo EGR. O valor inverso da eficiência global é o resultado da média harmônica da distância geodésica, que é capturado pelo meta-atributo MHG.

Os três próximos meta-atributos (CAT , CAA e ARP ) são referentes a me-didas de agrupamentos e de ciclos. O meta-atributo CAT captura informação sobre a estrutura cíclica de uma rede, mensurada por meio da propriedade de transitividade. Para isso, os coeficientes de agrupamentos N e N3, que identificam ciclos de ordem 3, são calculados. N é o número de triângulos na rede calculado por meio da Equação 4.2. Um triângulo é um conjunto de três vértices com uma aresta para cada par de vértices.

N= X

k>j>i

aijaikajk, (4.2)

onde cada aij é um elemento da matriz de adjacências que assume um valor binário, aij = 1 se existe uma aresta entre os vértices i e j, e aij = 0 caso contrário. N3 é o número de triplos conectados, que pode ser obtido por meio da Equação 4.3:

N3 = X

k>j>i

(aijaik+ ajiajk+ akiakj) (4.3)

Um triplo conectado é um conjunto de três vértices em que cada vértice pode ser atingido por qualquer outro de maneira direta ou indireta. O fator de ponderação do número de triângulos é igual a 3 porque cada triângulo pode ser constituído por três modos diferentes de triplo conectado, nos quais cada vértice é usado como vértice central.

O coeficiente de agrupamento, mensurado pelo meta-atributo CAA, calcula a média das razões entre o número de triângulos e o número de triplos conec-tados de todos vértices da rede. Há coeficientes específicos para mensurar o agrupamento dos vértices em redes ponderadas, como aquele representado pelo meta-atributo ARP , em que: si é a soma dos pesos das arestas conec-tadas ao vértice i; ki é a quantidade de arestas conectadas ao vértice i; cij é o valor do peso da aresta que conecta os vértices i e j; e aij é o valor de um elemento da matriz de adjacências.

Para medir a propriedade cíclica de uma rede, usamos o meta-atributo CCR, que calcula a média do coeficiente cíclico de todos os vértices da rede.

Os dois meta-atributos seguintes, GMV e CGA, estão relacionados às pro-priedades de distribuição e correlações dos graus dos vértices da rede. O grau de um vértice é o número de arestas que conectam esse vértice aos outros vér-tices da rede. O meta-atributo GMV é uma característica bastante simples, pois indica o grau da rede, que é o grau do vértice que possui o maior número de arestas conectadas. Uma propriedade que também pode ser mensurada a partir dos graus dos vértices é o índice de correlação entre os graus de dois vértices adjacentes. Um modo para calcular essa correlação é aplicar o coe-ficiente de Pearson nos graus de saída para cada par de vértices adjacentes, conforme mostra o meta-atributo CGA, que tem as seguintes variáveis: m é o número total de arestas; ki é o grau de saída do vértice i e aij é o valor de um elemento da matriz de adjacências.

Em uma rede, os vértices hubs são geralmente os mais críticos, porque possuem o maior grau de vértice. A desconexão de um vértice hub geralmente causa um impacto maior na rede do que a eliminação de outros vértices de menor grau. No entanto, existem redes, como a árvore binária, em que todos os vértices têm o mesmo grau e o mais crítico é aquele que está na raiz da ár-vore. Para identificar os vértices mais críticos de uma rede, podemos calcular a vulnerabilidade de todos os vértices da rede. O meta-atributo V NC vulnera-bilidade da rede a partir da identificação do vértice mais crítico, em que: EGR é a eficiência global da rede original e EGRi é a eficiência global da rede após a remoção do vértice i e de todas as suas arestas.

Entropia é uma propriedade, bem conhecida da área de Teoria da Infor-mação, usada para mensurar a “desordem” das informações em um dado sis-tema. Em uma rede, essa medida também pode ser aplicada para quantificar algumas características, como aquelas calculadas pelos meta-atributos EDG e EV A. A entropia da distribuição do grau dos vértices (meta-atributo EDG) indica o nível de heterogeneidade dos graus dos vértices de uma rede. Essa entropia atinge o valor máximo quando o grau de cada vértice da rede é di-ferente dos demais, enquanto o valor mínimo (Hmin = 0) é obtido se todos os vértices tem o mesmo grau. A entropia do grau do vértice alvo quantifica a previsibilidade do fluxo de mensagens em uma rede. O meta-atributo EV A calcula essa entropia, assumindo que as mensagens seguem sempre pelo ca-minho mais curto e que todos os pares de vértices trocam o mesmo número de mensagens. O valor mínimo para essa entropia indica que o vértice para onde a próxima mensagem deve seguir pode ser facilmente previsto.

A identificação de comunidades em uma rede grande é, particularmente, útil porque os vértices pertencentes a uma mesma comunidade geralmente possuem propriedades similares. Em redes reais, geralmente, não há qual-quer informação sobre o número de comunidades. Para identificar possíveis