• Nenhum resultado encontrado

Parte dos estudos em redes complexas é motivado pelo desejo de modelar as propriedades e a dinâmica de redes com o objetivo de reproduzir o comportamento dos mais diversos sistemas reais. Estudos como os de Watts e Strogatz (1998), Newman (2001) e Albert e Barabási (2002) resultaram em modelos de rede que refletem características próprias dos sistemas estudados, mas, que também são compartilhadas por diversos outros sistemas complexos reais. Quatro modelos resumem quase todas as redes complexas: as redes regulares, as redes aleatórias, as redes mundo pequeno e as redes livres de escala. Cada modelo será detalhado a seguir.

5.5.1

Redes Regulares

O modelo de redes regulares descreve os grafos cujos nós possuem a mesma quantidade de conexões, ou seja, o mesmo grau. A Figura 26 ilustra uma rede regular de cinco vértices e grau 4.

No caso extremo, em que todos os nós estão conectados entre si, obtém-se uma rede regular completa cujo comprimento médio do caminho (𝑙) e coeficiente de agrupa- mento (𝐶) são máximos. Apesar de nem todas as redes reais regulares conhecidas serem completamente acopladas, os valores de 𝑙 e 𝐶 tendem a ser elevados, raramente apresen- tando fenômenos como o efeito mundo pequeno e o comportamento livre de escala.

Embora seja um importante modelo para teoria dos grafos, redes regulares não são comuns na modelagem de sistemas reais. Uma rede completamente acoplada formada por 𝑁 nós apresenta 𝑁 (𝑁 −1)2 arestas, enquanto a maioria das grandes redes reais apresentam-se esparsas, isto é, não completamente conectadas, e seu número de arestas é geralmente da ordem 𝑁 ou 𝑁2 (WANG; CHEN, 2003).

Figura 26 – Rede regular de 5 nós e grau 4.

5.5.2

Redes Aleatórias

As redes aleatórias são um modelo em que a formação das arestas se dá de maneira randômica, a partir de algum critério ou conjunto de parâmetros definidos. Em sistemas reais, grande parte das redes apresentam uma topologia desconhecida, fazendo das redes aleatórias um importante modelo de estudo para as redes complexas.

Segundo West et al. (2008), neste modelo, métodos probabilísticos são usados para mostrar a existência de ligações entre os vértices sem que necessariamente ela ocorra, tratando as redes como um ente probabilístico. Desta forma, grafos aleatórios são redes cujos dois nós estão conectados por uma probabilidade 𝑝.

A abordagem mais estudada para definição da distribuição de probabilidade de uma rede aleatória é chamada de modelo Erdös-Rényi (ERDOS; RÉNYI, 1960), em que, dada uma rede 𝐺(𝑁, 𝑝), é definida uma probabilidade 𝑝 ∈ [0, 1] de conectar cada par de nós. Assim, quando 𝑝 = 0, a rede não possui nenhuma aresta, e, quando 𝑝 = 1, todos os vértices estão conectados entre si. A Figura 27 apresenta um conjunto de redes do modelo Erdös-Rényi com variados valores de 𝑝.

O grau dos vértices no modelo Erdös-Rényi apresenta uma distribuição bino- mial dada pela expressão:

𝑝𝑘 = ⎛ ⎝ 𝑁 − 1 𝑘 ⎞ ⎠𝑝𝑘(1 − 𝑝)𝑁 −1−𝑘 (5.14)

A partir desta definição, uma série de propriedades podem ser calculadas para as redes aleatórias. A mais simples delas é o grau médio ⟨𝑘⟩, que é dado por ⟨𝑘⟩ = (𝑁 −1)𝑝 e é uma importante medida na análise de conexões da rede e seus hubs. Em geral, para ⟨𝑘⟩ < 1, têm-se redes formadas por pequenas sub-redes pouco conectadas. Já para ⟨𝑘⟩ > 1

Capítulo 5. Projeto e-Ágora: o Extrator de Opinião Pública 129

Figura 27 – Redes aleatórias geradas a partir do modelo Erdös-Rényi com número de nós igual a 8 e diferentes probabilidades.

há o aparecimento de uma sub-rede principal onde a maioria dos vértices estão conectados a seus componentes. Outro caso, para ⟨𝑘⟩ ≥ 𝑙𝑛𝑁 , a rede não apresenta ou apresenta poucos nós isolados.

Outra importante propriedade é o comprimento médio do caminho ⟨𝑙⟩, que em uma rede 𝐺(𝑁, 𝑝) é dado por:

⟨𝑙⟩ ≈ 𝑙𝑛𝑁

𝑙𝑛⟨𝑘⟩ (5.15)

A análise do comprimento médio do caminho de uma rede aleatória permite constatar uma importante informação sobre dois fenômenos frequentemente encontrados nas redes complexas: o efeito mundo pequeno e o comportamento livre de escala. O cres- cimento logarítmico de ⟨𝑙⟩ indica que as redes aleatórias estão sujeitas ao efeito mundo pequeno, mas não necessariamente apresentam o comportamento livre de escala, expresso pela lei de potência. Esses fenômenos serão apresentados nos próximos dois modelos.

5.5.3

Redes Mundo Pequeno

O modelo mundo pequeno caracteriza-se pela pequena distância média entre os componentes de uma rede. Este comportamento foi pela primeira vez observado pelo psicólogo Stanley Milgram em 1967, o qual conduziu o famoso experimento “mundo pe- queno” (TRAVERS; MILGRAM, 1967). O experimento consistiu em enviar 96 pacotes a pessoas aleatórias, escolhidas em uma lista telefonia na cidade de Omaha, nos EUA. Em cada pacote havia um passaporte com nome e profissão do destinatário e um pedido para que o pacote fosse enviado para algum conhecido que julgasse ter mais chance de

conhecer o dono do passaporte. Assim, o passaporte deveria passar de pessoa a pessoa até chegar ao destinatário final. Ao final do experimento, Milgram observou que, em média, cada passaporte passou por 6 destinatários, resultando na famosa ideia, posteriormente conhecida como “seis graus de separação”, a qual afirma que quaisquer duas pessoas no mundo estão relacionadas entre si através de redes de indivíduos que contém em média 6 pessoas.

Em 1998, Watts e Strogatz (1998), ao estudar a rede de transmissão elétrica do oeste dos EUA e a distribuição dos neurônios do verme C. elegans, constataram que seus componentes possuíam uma baixa distância média de aproximadamente 3 nós. A partir desta observação, e fazendo uma analogia com o efeito mundo pequeno observado por Milgram, foi desenvolvido o modelo de rede chamado mundo pequeno.

O modelo mundo pequeno foi gerado como uma extrapolação do modelo de redes aleatórias, assumindo que redes reais podem apresentar uma topologia que não seja randômica, mas sim intermediária entre uma rede regular e uma rede aleatória.

Considerando uma rede contendo 𝑁 nós e 𝑘 arestas por vértice conectadas aos seus vizinhos mais próximos, as arestas podem se rearranjar de forma que elas se reconectem aleatoriamente entre os nós com probabilidade 𝑝, indo de uma rede regular (𝑝 = 0) até uma rede completamente aleatória (𝑝 = 1), possibilitando a formação de uma topologia intermediária 0 < 𝑝 < 1. A Figura 28 exemplifica este processo.

Figura 28 – Procedimento de formação de redes com 𝑁 = 8 segundo o modelo mundo pequeno. A primeira rede, onde 𝑝 = 0, é uma rede regular de grau 4. Na segunda rede alguns nós e arestas foram escolhidos para se reconectarem aleatoriamente com probabilidade 𝑝. Na terceira rede todos os nós foram reconectados aleatoriamente, formando uma rede aleatória onde p = 1.

Duas métricas auxiliam a caracterização de uma rede mundo pequeno: o com- primento médio caminho ⟨𝑙⟩ e o coeficiente de agrupamento ⟨𝐶⟩. Analisando os casos

Capítulo 5. Projeto e-Ágora: o Extrator de Opinião Pública 131

extremos, em uma rede regular em que 𝑝 = 0, ⟨𝑙⟩ e ⟨𝐶⟩ apresentam valores elevados com ⟨𝑙⟩ = 𝑁2𝑘 >> 1 e ⟨𝐶⟩ = 34, não havendo, desta forma, o efeito mundo pequeno. Já para 𝑝 = 1, o modelo converge para uma rede aleatória com baixo ⟨𝑙⟩ e ⟨𝐶⟩ com valores aproximados de ⟨𝑙⟩ ≈ 𝑙𝑛(𝑁 )𝑙𝑛(𝑘) ⟨𝐶⟩ ≈ ⟨𝑘⟩𝑁 . Os casos intermediários ilustram as redes mundo pequeno, as quais, em geral, apresentam elevado coeficiente de agrupamento e um baixo comprimento médio do caminho, com valor aproximado de 𝑙𝑛 (𝑁 ) (NEWMAN, 2018).

5.5.4

Redes Livres de Escala

Ao descrever o modelo de redes mundo pequeno, Watts e Strogatz (1998) não levaram em consideração uma importante propriedade das redes complexas: a distribuição dos graus da rede. Ao estudar alguns sistemas como a World Wide Web, Barabási et al. (1999) perceberam que, em redes reais, alguns poucos vértices estão altamente conectados, enquanto a grande maioria possui poucas ligações. Para quantificar esse feito, propuseram um novo modelo de redes fundamentado na propriedade da distribuição de graus 𝑝𝑘, o qual foi denominado redes livres de escala.

Matematicamente, o comportamento livre de escala descreve a distribuição de graus através de uma lei de potência. Em redes aleatórias, a distribuição de graus tende a obedecer a uma distribuição de Poisson, caracterizada por um pico bem definido. Já em redes regulares, a distribuição da conectividade é dada pela função delta de Dirac, uma vez que todos os vértices realizam o mesmo número de conexões.

Enquanto os modelos de redes aleatórias e mundo pequeno estão diretamente relacionados com a topologia da rede, focando na distribuição das arestas entre uma quantidade fixa de nós, o modelo livre de escala busca capturar a dinâmica, considerando o crescimento da rede mediante a adição contínua de novos vértices segundo a propriedade da conexão preferencial - propriedade que enuncia que as arestas de um novo vértice tendem a se conectar aos vértices que possuem maior grau. Formalmente, uma rede livre de escala é descrita pela seguinte distribuição:

𝑝𝑘≈ 𝑘−𝛾

, (5.16)

onde 𝛾 é denominado expoente livre de escala.

Uma característica importante das redes livres de escala é a existência de hubs, ou seja, vértices com elevado grau ou elevada centralidade. Esta propriedade torna o modelo especialmente importante para o estudo de redes de informação e conhecimento, uma vez que os hubs podem ser interpretados como núcleos de atalho da informação para outros pontos do grafo.

Em relação a suas principais propriedades, as redes livres de escala podem ser caracterizadas a partir do comprimento médio do caminho. Bollobás e Riordan (2004)

observaram, em redes livres de escala com número de arestas 𝑀 > 1, que o comprimento médio do caminho se aproxima de ⟨𝑙⟩ = 𝑙𝑛(𝑙𝑛(𝑁 ))𝑙𝑛(𝑁 ) , valor significantemente menor do que aqueles encontrados nas redes aleatórias e mundo pequeno.

A eficiência da topologia livre de escala e a existência de um mecanismo sim- ples para sua emergência levaram muitos pesquisadores a acreditarem na onipresença do modelo em redes reais. Apesar de pesquisas mostrarem que nem todas as redes reais apre- sentam o comportamento livre de escala, com algumas restrições, quase sempre é possível notá-lo (AMARAL; OTTINO, 2004). Além disso, as redes livres de escala também podem ser entendidas como um subconjunto de todas as redes mundo pequeno por dois motivos:

1. A distância média entre os nós aumenta de forma extremamente lenta com o au- mento do tamanho da rede;

2. o coeficiente de agrupamento é maior do que o das redes aleatórias, se aproximando dos valores encontrados nas redes mundo pequeno.

Os quatro modelos apresentados descrevem a quase totalidade das redes oriun- das de sistemas reais. Porém, de especial importância para este trabalho são os estudos dos sistemas linguísticos. O próximo tópico tratará de apresentar as redes linguísticas e suas potencialidades no campo da extração do conhecimento.