Rede Bipartida do Futebol Brasileiro - A Rede Complexa do Futebol Brasileiro

Capítulo 6. A Rede Complexa do Futebol Brasileiro

6.2 Rede Bipartida do Futebol Brasileiro

U

sando dados coletados do CD-ROM da revista Placar [108] construímos

uma rede (real) bastante peculiar, a rede do futebol brasileiro. Primeiro construímos uma rede bipartida: o primeiro tipo de vértice representa os clubes, em número de 127, e o segundo tipo de vértice representa os jogadores, que totalizam 13 411. Esses números correspondem ao número total de clubes e jogadores de futebol que participaram pelo

menos uma vez do campeonato brasileiro de futebol entre os anos de 1 971 a 2 0023_{. A}

rede bipartida (veja Figura 6.1) é construída da seguinte maneira: se um jogador defendeu um clube, então estabelecemos uma ligação entre eles. Procedimentos semelhan- tes de construção já foram feitos para as seguintes redes bipartidas: ator-filme [31, 109], cientista-artigo [103], diretor-empresa [93] e compositor-interprete [110].

a b c d

A B C D E F G H I J K

Figura 6.1: Rede bipartida de futebol, com 4 vértices do tipo clube e 11 vértices do tipo jogador de futebol. Vértices dea a d representam clubes e os vértices de A até K representam

jogadores, e as linhas ligam os jogadores aos clubes que defenderam.

0,0 0,2 0,4 0,6 0,8 1,0 1,2 1,4 1,6 1,8 2,0 0 5 10 15 20 25 N C G/M

Figura 6.2: Histograma do número de clubes contra o número de gols marcados por partida. A linha cheia corresponde ao ajuste gaussiano. O número médio de gols por partida é aproximadamente 1,0.

Iniciamos nosso estudo analisando a distribuição de gols marcados por partida em função do vários clubes que já participaram do campeonato brasileiro. Na Fi-

gura 6.2 vemos o número de clubes NC versus o número de gols marcados por partida

G/M . Como podemos ver os dados são muito bem ajustados por uma gaussiana centrada

em G /M ≃ 1,03. O clube brasileiro com o melhor desempenho é o São Caetano com uma média de gols por partida de G /M = 1,73 e o clube com o menor desempenho é o Colatina com uma média de G /M = 0,22.

Analisamos também a distribuição de probabilidades de conectividades para os dois tipos de vértices, jogadores e clubes, da rede bipartida do futebol brasileiro (veja Figura 6.3). Seja N o número de clubes que um jogador já defendeu. Definimos P(N )

como a distribuição de probabilidades de que um jogador tenha defendido N clubes di- ferentes. No gráfico maior da Figura 6.3, vemos que a distribuição de probabilidades de jogadores P(N ) exibe um decaimento exponencial com N . Dessa distribuição, determi- namos o número médio de clubes que um jogador defendeu, N = 1,37 . Um jogador que merece destaque nessa análise é o Dadá Maravilha, o jogador que mais atuou por diferentes clubes, que participaram do campeonato brasileiro. Ele defendeu 11 diferentes clubes. Seja S o tamanho do clube — que é medido em termos do número de jogadores que atua- ram pelo clube — e P(S) a distribuição de probabilidades dos tamanhos dos desses clubes. Vemos no gráfico menor da Figura 6.3, que devido ao pequeno número de clubes, não é possível fazer uma análise conclusiva da distribuição de probabilidades P(S) em função do tamanho S do clube.

Um resultado inesperado é obtido quando determinamos a distribuição de probabilidades P(M ) de que um jogador de futebol tenha jogado um total de M jogos pelo campeonato brasileiro (qualquer que tenha sido o clube). Verificamos a existência de um

ponto de inflexão (veja Figura 6.4a ) ou um limiar nas proximidades de Mc =40. Como

existe muita dispersão em P(M ), determinamos a sua correspondente distribuição de pro- babilidades cumulativas Pc(M ) [25]. Essa distribuição é bem ajustada por duas diferentes

exponenciais: Pc(M ) = 0, 150 + 0, 857 × 10−0,042M para M < 40 e Pc(M ) = 0, 410 × 10−0,010M

para M > 40, como é mostrado na Figura 6.4b. Como sabemos, uma distribuição de pro- babilidades com formato exponencial gera uma distribuição de probabilidades cumulativa também exponencial e com o(s) mesmo(s) expoente(s) [25]. A existência do limiar

Mc indica que depois que um jogador alcançou uma certa fama e notoriedade, provavel-

mente, será mais fácil para ele se manter como um jogador de futebol, ou seja, um jogador ao cruzar o limiar Mcpassou por “um estado probatório” e com isso ganhou estabilidade

em seu trabalho.

Seja G o número de gols (a quinta-essência de um jogo de futebol) marca- dos por um jogador no campeonato brasileiro, e P(G ) a distribuição de probabilidades de

0 1 2 3 4 5 6 7 8 9 10 11 12 10 -4 10 -3 10 -2 10 -1 10 0 10 1 0 100 200 300 400 500 0,00 0,05 0,10 0,15 0,20 P ( N ) N P ( S ) S

Figura 6.3: Probabilidade P(N ) de que um jogador tenha trabalho em N clubes. A linha cheia corresponde ao ajuste da curva P(N ) ∼ 10−0,38N_{. Assim sendo, vemos que é 190 vezes}

mais provável de encontrar algum jogador que tenha jogado somente em dois clubes do que encontrar um jogador que tenha jogado em oito clubes. No gráfico menor vemos a distribuição de probabilidade de conectividade P(S) dos clubes.

que um jogador tenha marcado G gols. O comportamento da distribuição de probabili- dade P(G ) em função do número de gols marcados pode ser visto na Figura 6.5a. Nova-

mente encontramos um limiar intrigante próximo de Gc=10, separando duas regiões que

escalam com leis de potências distintas. Um comportamento semelhante já foi observado no contexto de redes de colaborações científicas [25]. Para verificar se esse limiar real- mente existe (uma vez que a cauda da curva apresenta muita dispersão) calculamos a dis- tribuição de probabilidade cumulativa correspondente Pc(G ) (Figura 6.5b). Assim existe

a possibilidade de ajustarmos essa curva com uma lei de potência truncada ou possivel- mente duas leis de potências distintas. Nossos melhores resultados foram obtidos fazendo

uso de leis de potências com dois diferentes expoentes: Pc(G ) = −0,259+1,256 G−0,500para

G < 10 e Pc(G ) = −0,004 + 4,454 G−1,440se G > 10.

Lembrando que para uma distribuição de probabilidades escalando com uma lei de potência, a distribuição de probabilidades cumulativa correspondente tem seu

expoente acrescido de uma unidade, assim sendo temos que P(G ) ∼ G−1,5 _{para G < 10}

e P(G ) ∼ G−2,44 _{para G > 10. Conjecturamos que a origem desse limiar possa ser expli-}

cada pelo posicionamento dos jogadores no campo de futebol. Afinal, cerca de dois terços dos onze jogadores formam a defesa ou o meio de campo, conseqüentemente jogadores nessas posições normalmente têm menos chance de fazer gols.

0 40 80 120 160 200 240 280 320 10 -4 10 -3 10 -2 10 -1 0 40 80 120 160 200 240 280 320 10 -3 10 -2 10 -1 10 0 P ( M ) M c 40 jogos (a) P C ( M ) M (b)

Figura 6.4: (a) Probabilidade de jogos P(M ) vs o número M de partidas disputadas. (b) Distribuição de probabilidade cumulativa Pc(M ) construída a partir de P(M ). As linhas

1 10 100 10 -4 10 -3 10 -2 10 -1 1 10 100 10 -4 10 -3 10 -2 10 -1 10 0 (b) G c 10 gols P ( G ) (a) P C ( G ) G

Figura 6.5: (a) Probabilidade P(G ) que um jogador tenha marcado G gols. É dez vezes mais provável que um jogador escolhido aleatoriamente tenha marcado 13 gols do que 36 gols. O jogador com o maior número de gols marcados no campeonato brasileiro é o Roberto Dinamite com G = 186. (b) Distribuição de probabilidade cumulativa Pc(G ).

6.3 Rede Unipartida de Jogadores do Futebol Brasileiro

No documento Rede complexa e criticalidade auto-organizada: modelos e aplicações (páginas 141-146)