2.2 Modelos de redes complexas
2.2.4 M´ etricas de redes complexas
H´a diversas m´etricas utilizadas para a extra¸c˜ao de caracter´ısticas topol´ogicas de redes complexas, destacam-se as correlacionais e as de centralidade (COSTA et al., 2007). As primeiras n˜ao consideram a magnitude dos valores e sim a similaridade entre os padr˜oes, j´a as de centralidade s˜ao representadas pela similaridade entre os valores, ou seja, ´e
considerada a proximidade entre as distˆancias que podem ter padr˜oes muito diferentes ao longo das caracter´ısticas observadas (CAMILO; SILVA, 2009; WEBB; COPSEY, 2011).
Para Barab´asi e Oltvai (2004), as m´etricas mais b´asicas que podem ser utilizadas na caracteriza¸c˜ao de um sistema biol´ogico s˜ao: grau; distribui¸c˜ao de grau; redes scale-free; grau exponencial; caminho m´ınimo; caminho m´edio e coeficiente de clustering. No mesmo sentido Costa (2007), destaca dentre outras m´etricas, as de centralidade para classifica¸c˜ao de problemas do mundo real, uma vez que elas permitem evidenciar quantitativamente os elementos mais importantes ou centrais da rede (COSTA et al., 2007).
A intermedia¸c˜ao ´e uma m´etrica de centralidade que quantifica o n´umero de media¸c˜oes realizadas pelo v´ertice com rela¸c˜ao a outros dois v´ertices, capturando os v´ertices mais utilizados como ponte para outros v´ertices, na qual giej ´e o n´umero de caminho mais curto
entre os v´ertices i e j que passa pelo v´ertice ou aresta e. J´a gij ´e a totalidade dos caminhos
mais curtos entre i e j (COSTA et al., 2007).
A representa¸c˜ao matem´atica ´e dada pela equa¸c˜ao: e =P
i6=j
giej
gij
A proximidade se refere `a semelhan¸ca entre os v´ertices de um grafo, baseada em um v´ertice rotulado ou valores atribu´ıdos a ele. O coeficiente de proximidade, quando positivo, demonstra que os v´ertices tendem a se conectarem, j´a quando o valor ´e negativo, h´a pouca ou nenhuma atratividade entre eles (NEWMAN, 2003), definida pela equa¸c˜ao:
r = P ieii− P iaibi 1−Piaibi
No qual ei j refere-se a fra¸c˜ao das arestas conectadas aos v´ertices i e j. J´a ai = Pj
eij e bj =Pi eij.
A prop´osito do grau, tamb´em uma m´etrica de centralidade, ela reflete o n´umero de arestas conectadas aos v´ertices. No qual ki ´e o v´ertice e aij ´e a soma das arestas conectadas
a ele (COSTA et al., 2007), definida pela equa¸c˜ao: ki = Pjaij =
P
jaj i
Algumas m´etricas s˜ao derivadas da centralidade de grau, dentre elas o grau m´aximo e o grau m´ınimo, representados pelas f´ormulas: kmax = maxi ki e kmin = mini ki, na qual
Destaca-se tamb´em a m´etrica de caminho m´ınimo m´edio que est´a relacionada a caracteriza¸c˜ao estrutural interna da rede, uma vez que determina o comprimento dos menores caminhos entre dois v´ertices que se conectam, representado pela letra l. Na qual N ´e o n´umero de v´ertices do grafo e dij ´e a distˆancia m´edia geod´esica (caminho mais
curto) entre os v´ertices i e j (BOCCALETTI et al., 2006). A representa¸c˜ao matem´atica ´e dada pela equa¸c˜ao:
l=N (N −1)1 P
i6=j dij
O coeficiente de clustering conhecido tamb´em como transitividade ´e uma m´etrica de agrupamento que determina a probabilidade de um v´ertice estar conectado a outro. Onde Cw
i ´e a probabilidade que varia entre 0 e 1, si ´e a for¸ca do v´ertice i, j´a os wij e wik
s˜ao os pesos das arestas, ki ´e o grau do v´ertice e aij, aik e ajk s˜ao elementos da matriz de
adjacˆencias (COSTA et al., 2007), definida pela equa¸c˜ao: Cw i = 1 si(ki−1) P k > j wij+wik 2 aijaikaj k
O desvio padr˜ao (DP) indica a dispers˜ao dos v´ertices relacionados `a m´edia amostral. Onde x ´e a aresta e ¯x as m´edias das arestas, sendo n o n´umero total de possibilidades de arestas no grafo. Representado pela equa¸c˜ao:
DP =
r P|x
i−¯x|2
n
O Motivo (do inglˆes motif ) ´e um subgrafo que representa uma rede maior com a finalidade de quantificar frequˆencias significativas nos parˆametros das an´alises (MILO et al., 2002). Em uma sequˆencia biol´ogica, um motif ´e um padr˜ao que ocorre repetidamente em diferentes posi¸c˜oes na rede, representando m´odulos com informa¸c˜oes moleculares relevantes e representativas da sequˆencia devido `a sua alta recorrˆencia (BERG; L ¨ASSIG, 2004).
Na Figura 13, ´e poss´ıvel verificar que a frequˆencia de ocorrˆencias do motif indicado ´e muito mais intensa em a) do que em b). Assim, evidencia-se que a observa¸c˜ao de motifs em redes reais ´e fundamental enquanto constitui¸c˜ao topol´ogica de uma sub-rede representativa de uma rede maior. Observa-se que o n´umero de ocorrˆencias de motif ´e muito mais significativo em uma rede real (MILO et al., 2002).
a) b)
motif
rede real rede aleatória
Figura 13 – Exemplos de redes com motifs, a) motif em uma rede real e b) motif em uma rede aleat´oria.
Fonte: MILO et al., 2002 - adapta¸c˜ao.
Os motifs podem ser aplicados em diversas ´areas, tais como, an´alises bioqu´ımicas, neurobiol´ogicas, ecol´ogicas, de circuitos eletrˆonicos e hiperlinks em p´aginas web (TAY- LOR; SIEGEL; GALITSKI, 2007; GOLLO; BREAKSPEAR, 2014). H´a v´arias topologias definidoras de motifs, por´em, no ˆambito biol´ogico, de acordo com Milo (2002), destacam-se os denominados feedfoward loop, bi-fan e biparallel, conforme exibido na Figura 14.
Figura 14 – Motifs em redes biol´ogicas.
Fonte: MILO et al., 2002.
No motif feedforward loop de tamanho 3, o v´ertice X influˆencia os v´ertices Y e Z, enquanto Y influˆencia somente o v´ertice Z e Z n˜ao influˆencia nenhum v´ertice. No motif Bi-fan de tamanho 4, os v´ertices X e Y s˜ao reguladores dos v´ertices Z e W simultaneamente, por´em n˜ao s˜ao regulados por nenhum outro v´ertice (MILO et al., 2002). A ocorrˆencia
desses motifs ´e destac´avel em redes de regula¸c˜ao gˆenica e em redes de sinapses neuronais (DREES et al., 2005).
No motif Bi-Parallel, tamb´em de tamanho 4, o v´ertice X influˆencia Y e Z que, por sua vez, influˆencia o v´ertice W. Observa-se, portanto, que X exerce influˆencia indireta em W, sendo X o regulador central dos demais v´ertices. Esses motifs podem ser visualizados em redes de sinapses neuronais e redes representativas de cadeias alimentares (MILO et al., 2002).
Dado que a m´etrica motif ´e um subgrafo que representa uma rede maior, destaca-se a finalidade de quantificar as frequˆencias mais significativas como parˆametros das an´alises. A frequˆencia estat´ıstica de um motif pode ser medida quando comparada `a correspondente em um grafo aleat´orio, sendo Ni(real) o n´umero de vezes que o motif i aparece em uma
rede real e Ni(rand) o n´umero de vezes que o motif i aparece em uma rede aleat´oria, j´a
σi(rand) ´e o desvio padr˜ao de i do n´umero de ocorrˆencias encontradas na rede aleat´oria
(COSTA et al., 2007). O escore-Z ´e definida pela equa¸c˜ao: zi=
Ni(real)−hNi(rand)i
σi(rand)
Dado o exposto, ´e de fundamental importˆancia a busca por m´etricas que extraiam caracter´ısticas relevantes para identificar as sequˆencias biol´ogicas, uma vez que esses padr˜oes podem ser utilizados para compreens˜ao das funcionalidades biol´ogicas das sequˆencias analisadas (BERG; L ¨ASSIG, 2004).