• Nenhum resultado encontrado

De forma geral, uma rede ´e um modelo que representa os poss´ıveis relacionamen- tos entre seus objetos. Um exemplo cl´assico s˜ao as redes sociais, que interligam as pessoas por relac¸˜oes espec´ıficas como grau de parentesco, amizade ou trabalho em conjunto (MENA- CHALCO et al., 2014). A estrutura topol´ogica das redes pode representar seus comportamen- tos, dando a elas a capacidade de modelar diversos problemas do mundo real (FIGUEIREDO, 2011), (LOPES, 2011).

Uma rede normalmente ´e representada por uma estrutura denominada grafo: conjunto de pontos que s˜ao ligados por linhas que representam a conex˜ao entre tais pontos. A linhas recebem o nome de arestas e os pontos s˜ao chamados de n´os ou v´ertices. A representac¸˜ao matem´atica de um grafo ´e G(V,E), onde V representa o conjunto n˜ao vazio de v´ertices e E ´e o conjunto de arestas n˜ao ordenados de V . Dois v´ertices v1e v2∈ V s˜ao chamados de v´ertices adjacentes somente se houver uma aresta entre eles, ou seja, e12 ={e1,e2} ∈ E. Outra forma de representar um grafo ´e por meio de uma matriz adjacˆencias A. Esta representac¸˜ao ´e muito utilizada, pois facilita as operac¸˜oes e c´alculos entre grafos (FREITAS, 2010).

A Figura 20 ilustra um grafo composto por 5 v´ertices e 6 arestas. Entretanto, na pr´atica, um problema representado por meio de grafos pode resultar em um modelo composto por cen- tenas de v´ertices, onde as conex˜oes entre eles podem dificultar a an´alise e visualizac¸˜ao da rede. Outra condic¸˜ao que pode ocorrer ´e a alterac¸˜ao da estrutura topol´ogica, isto ´e, sua dinˆamica. Essa condic¸˜ao leva a Teoria de Redes Complexas (BOCCALETTI et al., 2006).

Figura 20: Grafo simples e sua matriz adjacˆencias. Os itens em azul na matriz representam os v´ertices de 1 `a 5, enquanto os valores em verde representam as arestas: 1 quando h´a aresta entre os v´ertices e 0 quando n˜ao h´a.

(a) Grafo simples.

(b) Matriz adjacˆencias do grafo da subfigura a).

Fonte: Autoria pr´opria

Figura 21: Exemplo de uma rede complexa, criada a partir de estudos sobre doenc¸as sexualmente transmiss´ıveis.

Fonte: (NEWMAN, 2003b), (POTTERAT et al., 2002)

O estudo das redes complexas, tamb´em chamada de Teoria das Redes complexas, ´e o ramo da matem´atica que analisa o comportamento topogr´afico da rede, a fim de entender as relac¸˜oes entre n´os e arestas. Uma rede pode ser representada por suas medidas, de forma que sua estrutura topol´ogica ´e utilizada na an´alise de seus atributos, incluindo representac¸˜ao, caracterizac¸˜ao, classificac¸˜ao e modelagem. A Figura 22 representa o mapeamento de uma rede complexa para um vetor de caracter´ısticas ~µ, composto por diversas propriedades e medidas, como coeficiente de aglomerac¸˜ao, centralidade de grau, resistˆencia e assortividade (COSTA et

al., 2007). Na literatura est˜ao definidas uma grande quantidade de propriedades estruturais, que revelam algo sobre a rede ou descrevem alguma funcionalidade que ela exerce. Neste trabalho ser˜ao apresentadas apenas as propriedades utilizadas na metodologia proposta.

Figura 22: Mapeamento de uma rede complexa em um vetor de caracter´ısticas. Mapeamentos gen´ericos podem ser utilizados a fim de obter uma caracterizac¸˜ao da rede, em termos de um con- junto adequado de medic¸˜oes.

Fonte: (COSTA et al., 2007)

3.4.1 GRAU, PROXIMIDADE, INTERMEDIAC¸ ˜AO, AUTOVETOR E CENTRALIZAC¸ ˜AO As medidas de grau, proximidade, intermediac¸˜ao e autovetor determinam, em func¸˜ao de algumas propriedades invariantes, a importˆancia dos n´os de acordo com a posic¸˜ao estrutural. O grau de um v´ertice indica o total de arestas adjacentes a ele. A proximidade ´e definida como a soma das distˆancias de um v´ertice em relac¸˜ao aos demais v´ertices do grafo. A intermediac¸˜ao representa o total de geod´esicas, o comprimento do menor caminho entre dois n´os (BOUTTIER et al., 2003), entre todos os pares de v´ertices que passam atrav´es de um determinado v´ertice. Por fim, a medida de autovetor determina se um n´o ´e considerado central, caso possuir relac¸˜ao com elementos que tamb´em s˜ao centrais (BONACICH; LLOYD, 2001). O grau de um v´ertice vk, representado por dk ´e definido como:

dk=

ak, (40)

onde ak ´e a aresta adjacente do v´ertice k. A proximidade de um v´ertice vk , representado por ck, ´e definido como:

ck= n

j=1 dist(vj,vk) !−1 , (41)

onde n ´e n´umero de v´ertices do grafo e dist(vj,vk) ´e a distˆancia de vk aos demais v´ertices. A intermediac¸˜ao de um v´ertice vk, representado por bk, ´e definida como:

bk=

1≤i< j≤n i, j6=k    gi j(vk) gi j se caminho entre vi e v j 0, caso contr´ario, (42)

onde n ´e n´umero de v´ertices do grafo, gi j denota o n´umero de geod´esicas (o comprimento do menor caminho entre dois v´ertices) entre vie vje gi j(vk) ´e o n´umero de geod´esicas entre vie vj que passam por vk. O autovetor de um v´ertice vk, representado por ceig ´e definido como:

ceig(vk) = 1 ρ n

j=1 ai jxj;i = 1,...,n, (43)

onde, considerando a matriz de adjacˆencias A = (ai j), n ´e n´umero de v´ertices do grafo, ρ ´e o maior autovalor de A e xjs˜ao os autovetores de A.

As medidas apresentadas s˜ao espec´ıficas para cada um dos v´ertices de um grafo. Entre- tanto, tais medidas n˜ao permitem comparar grafos com topologias diferentes, mesmo que sejam de mesma ordem. Visto isso, Freeman (FREEMAN, 1979) propˆos uma medida de centralidade calculada em relac¸˜ao aos valores das medidas de v´ertices. A centralizac¸˜ao ´e um m´etodo geral para o c´alculo de centralidade do grafo como um todo, baseado em medidas de cada n´o. A Equac¸˜ao 44 pode ser aplicada independentemente da medida de v´ertice utilizada.

cw= n

i=1

(max(cwv)− cwv), (44)

onde w ´e uma medida de v´ertice em quest˜ao, cw ´e a centralidade do grafo, cwv ´e o valor da medida no v´ertice e max(cwv) ´e o maior valor encontrado entre todas as medidas de v´ertices. Logo, as medidas s˜ao ponderadas pela centralidade do grafo com objetivo de produzir medidas gerais da rede.

3.4.2 TRI ˆANGULOS ADJACENTES

A medida de triˆangulos adjacentes de um v´ertice refere-se ao total de triˆangulos for- mados por ele dentro do grafo. Como essa medida ´e aplicada para cada v´ertice, basta somar os totais individuais e dividir pelo n´umero de v´ertices do grafo (COSTA et al., 2007). Matemati- camente, a medida ´e definida por:

tad = 1n n

i=1 n−1

j=1 j6=i n

k= j+1 k6=i ω(i, j,k) (45)

ω(i, j,k)=(1, se ai, j = 1 e ai,k = 1 e aj,k= 1

0, caso contr´ario, (46)

onde, considerando a matriz de adjacˆencias A = (ai, j), n ´e n´umero de v´ertices do grafo e ai, j, ai,ke aj,ks˜ao elementos da matriz A.

3.4.3 COEFICIENTE DE ASSORTATIVIDADE

O Coeficiente de Assortatividade indica a tendˆencia de conex˜ao dos v´ertices de acordo com um ´ındice baseado em ancestralidade comum. Basicamente, a medida indica se os v´ertices tendem a se conectar com outros de graus iguais ou diferentes. O coeficiente ´e dado por:

r = ∑iai, j− ∑ibici

1 − ∑ibici , (47)

onde, considerando a matriz de adjacˆencias A = (ai, j), ei, j ´e a frac¸˜ao de arestas que conecta dois v´ertices de mesma ancestralidade, bi= ∑jei, j e cj= ∑iei, j. O valor de r est´a compreendido no intervalo [-1, 1]. Quando r > 0 h´a conectividade entre v´ertices de mesmo grau. Quando r < 0 h´a conectividade entre v´ertices de graus diferentes (NEWMAN, 2003a).

3.4.4 CLIQUES

Dado um grafo G = (V, E), um clique ´e um subconjunto de v´ertices C ⊆ V que forma um subgrafo completo, ou seja, um subconjunto de v´ertices no qual todos s˜ao adjacentes entre si. O termo “clique” foi proposto por Luce e Perry em 1949 (LUCE; PERRY, 1949; ALBA, 1973), que utilizaram subgrafos completos em redes sociais para agrupar pessoas que se co- nheciam. Apesar de ser considerado um conceito b´asico, a tarefa de encontrar cliques em um grafo ´e considerada NP-completo. Dessa forma, existem na literatura muitos m´etodos para cal- cular cliques e suas propriedades. Neste trabalho, a medida utilizada foi o n´umero do clique ω, que representa o n´umero de v´ertices de um clique m´aximo. O algoritmo proposto por David Eppstein, Maarten Loffler e Darren Strash (EPPSTEIN et al., 2010) ´e capaz de listar todos os cliques maximais de um grafo, isto ´e, cliques que n˜ao podem ser estendidos quando um ou mais v´ertices adjacentes s˜ao adicionados. O maior de todos os cliques maximais ´e considerado o clique m´aximo.

3.4.5 N ´OS MAIS DISTANTES

Os n´os mais distantes correspondem ao conjunto de v´ertices que est˜ao separados pela maior distˆancia geod´esica de um grafo (WEST et al., 2001). A maior distˆancia geod´esica, tamb´em conhecida como diˆametro, pode ser calculada a partir do m´etodo de busca em largura. O valor da medida para compor o descritor proposto ´e definida por:

nd= 1

n d +

Cv , (48)

onde n ´e n´umero de v´ertices do grafo, d ´e o valor do diˆametro e ∑Cv ´e o total de v´ertices separados pelo diˆametro do grafo.

3.4.6 MEDIDAS DE HUB E AUTORIDADE DE KLEINBERG

O algoritmo conhecido como HITS (Hyperlink Induced Topic Search) ´e um m´etodo proposto por Jon Kleinberg (KLEINBERG, 1999) para identificar p´aginas na internet mais re- levantes para t´opicos de busca. A ideia deste algoritmo ´e identificar dois tipos de p´aginas: Hub e Autoridade. As p´aginas do tipo Hubs s˜ao aquelas que n˜ao possuem a informac¸˜ao da busca, mas possuem muitos links para as p´aginas Autoridade, que possuem a informac¸˜ao desejada. A relac¸˜ao entre p´aginas Hubs e Autoridade pode ser representada por um grafo, no qual os v´ertices mais importantes s˜ao aqueles que apontam para muitos v´ertices (Hubs) ou aqueles que s˜ao apontados por muitos outros v´ertices (Autoridade). Para encontrar os Hubs e Autoridades, devem ser atribu´ıdos dois pesos a<vk> e h<vk> para cada v´ertice v

k do grafo. Dessa forma, se vk aponta para v´ertices com altos valores de a, ent˜ao h<vk> deve receber um valor alto. Se vk ´e apontado por v´ertices com altos valores de h, ent˜ao a<vk> deve receber um valor alto. A representac¸˜ao matem´atica a seguir define a interdependˆencia entre a<vk> e h<vk>:

a<vk>=

hvk h<vk> =

avk (49)

Os valores de a<vk> e h<vk> devem ser recalculados at´e que se tornem inalterados. Obviamente, para grafos n˜ao orientados, a matriz de adjacˆencias ´e sim´etrica e os valores de a<vk>e h<vk>s˜ao os mesmos.

Documentos relacionados