Capítulo 6. A Rede Complexa do Futebol Brasileiro
6.2 Rede Bipartida do Futebol Brasileiro
U
sando dados coletados do CD-ROM da revista Placar [108] construímosuma rede (real) bastante peculiar, a rede do futebol brasileiro. Primeiro construímos uma rede bipartida: o primeiro tipo de vértice representa os clubes, em número de 127, e o segundo tipo de vértice representa os jogadores, que totalizam 13 411. Esses números correspondem ao número total de clubes e jogadores de futebol que participaram pelo
menos uma vez do campeonato brasileiro de futebol entre os anos de 1 971 a 2 0023. A
rede bipartida (veja Figura 6.1) é construída da seguinte maneira: se um jogador defen- deu um clube, então estabelecemos uma ligação entre eles. Procedimentos semelhan- tes de construção já foram feitos para as seguintes redes bipartidas: ator-filme [31, 109], cientista-artigo [103], diretor-empresa [93] e compositor-interprete [110].
a b c d
A B C D E F G H I J K
Figura 6.1: Rede bipartida de futebol, com 4 vértices do tipo clube e 11 vértices do tipo jo- gador de futebol. Vértices dea a d representam clubes e os vértices de A até K representam
jogadores, e as linhas ligam os jogadores aos clubes que defenderam.
0,0 0,2 0,4 0,6 0,8 1,0 1,2 1,4 1,6 1,8 2,0 0 5 10 15 20 25 N C G/M
Figura 6.2: Histograma do número de clubes contra o número de gols marcados por par- tida. A linha cheia corresponde ao ajuste gaussiano. O número médio de gols por partida é aproximadamente 1,0.
Iniciamos nosso estudo analisando a distribuição de gols marcados por par- tida em função do vários clubes que já participaram do campeonato brasileiro. Na Fi-
gura 6.2 vemos o número de clubes NC versus o número de gols marcados por partida
G/M . Como podemos ver os dados são muito bem ajustados por uma gaussiana centrada
em G /M ≃ 1,03. O clube brasileiro com o melhor desempenho é o São Caetano com uma média de gols por partida de G /M = 1,73 e o clube com o menor desempenho é o Colatina com uma média de G /M = 0,22.
Analisamos também a distribuição de probabilidades de conectividades para os dois tipos de vértices, jogadores e clubes, da rede bipartida do futebol brasileiro (veja Figura 6.3). Seja N o número de clubes que um jogador já defendeu. Definimos P(N )
como a distribuição de probabilidades de que um jogador tenha defendido N clubes di- ferentes. No gráfico maior da Figura 6.3, vemos que a distribuição de probabilidades de jogadores P(N ) exibe um decaimento exponencial com N . Dessa distribuição, determi- namos o número médio de clubes que um jogador defendeu, N = 1,37 . Um jogador que merece destaque nessa análise é o Dadá Maravilha, o jogador que mais atuou por diferen- tes clubes, que participaram do campeonato brasileiro. Ele defendeu 11 diferentes clubes. Seja S o tamanho do clube — que é medido em termos do número de jogadores que atua- ram pelo clube — e P(S) a distribuição de probabilidades dos tamanhos dos desses clubes. Vemos no gráfico menor da Figura 6.3, que devido ao pequeno número de clubes, não é possível fazer uma análise conclusiva da distribuição de probabilidades P(S) em função do tamanho S do clube.
Um resultado inesperado é obtido quando determinamos a distribuição de probabilidades P(M ) de que um jogador de futebol tenha jogado um total de M jogos pelo campeonato brasileiro (qualquer que tenha sido o clube). Verificamos a existência de um
ponto de inflexão (veja Figura 6.4a ) ou um limiar nas proximidades de Mc =40. Como
existe muita dispersão em P(M ), determinamos a sua correspondente distribuição de pro- babilidades cumulativas Pc(M ) [25]. Essa distribuição é bem ajustada por duas diferentes
exponenciais: Pc(M ) = 0, 150 + 0, 857 × 10−0,042M para M < 40 e Pc(M ) = 0, 410 × 10−0,010M
para M > 40, como é mostrado na Figura 6.4b. Como sabemos, uma distribuição de pro- babilidades com formato exponencial gera uma distribuição de probabilidades cumula- tiva também exponencial e com o(s) mesmo(s) expoente(s) [25]. A existência do limiar
Mc indica que depois que um jogador alcançou uma certa fama e notoriedade, provavel-
mente, será mais fácil para ele se manter como um jogador de futebol, ou seja, um jogador ao cruzar o limiar Mcpassou por “um estado probatório” e com isso ganhou estabilidade
em seu trabalho.
Seja G o número de gols (a quinta-essência de um jogo de futebol) marca- dos por um jogador no campeonato brasileiro, e P(G ) a distribuição de probabilidades de
0 1 2 3 4 5 6 7 8 9 10 11 12 10 -4 10 -3 10 -2 10 -1 10 0 10 1 0 100 200 300 400 500 0,00 0,05 0,10 0,15 0,20 P ( N ) N P ( S ) S
Figura 6.3: Probabilidade P(N ) de que um jogador tenha trabalho em N clubes. A linha cheia corresponde ao ajuste da curva P(N ) ∼ 10−0,38N. Assim sendo, vemos que é 190 vezes
mais provável de encontrar algum jogador que tenha jogado somente em dois clubes do que encontrar um jogador que tenha jogado em oito clubes. No gráfico menor vemos a distribuição de probabilidade de conectividade P(S) dos clubes.
que um jogador tenha marcado G gols. O comportamento da distribuição de probabili- dade P(G ) em função do número de gols marcados pode ser visto na Figura 6.5a. Nova-
mente encontramos um limiar intrigante próximo de Gc=10, separando duas regiões que
escalam com leis de potências distintas. Um comportamento semelhante já foi observado no contexto de redes de colaborações científicas [25]. Para verificar se esse limiar real- mente existe (uma vez que a cauda da curva apresenta muita dispersão) calculamos a dis- tribuição de probabilidade cumulativa correspondente Pc(G ) (Figura 6.5b). Assim existe
a possibilidade de ajustarmos essa curva com uma lei de potência truncada ou possivel- mente duas leis de potências distintas. Nossos melhores resultados foram obtidos fazendo
uso de leis de potências com dois diferentes expoentes: Pc(G ) = −0,259+1,256 G−0,500para
G < 10 e Pc(G ) = −0,004 + 4,454 G−1,440se G > 10.
Lembrando que para uma distribuição de probabilidades escalando com uma lei de potência, a distribuição de probabilidades cumulativa correspondente tem seu
expoente acrescido de uma unidade, assim sendo temos que P(G ) ∼ G−1,5 para G < 10
e P(G ) ∼ G−2,44 para G > 10. Conjecturamos que a origem desse limiar possa ser expli-
cada pelo posicionamento dos jogadores no campo de futebol. Afinal, cerca de dois terços dos onze jogadores formam a defesa ou o meio de campo, conseqüentemente jogadores nessas posições normalmente têm menos chance de fazer gols.
0 40 80 120 160 200 240 280 320 10 -4 10 -3 10 -2 10 -1 0 40 80 120 160 200 240 280 320 10 -3 10 -2 10 -1 10 0 P ( M ) M c 40 jogos (a) P C ( M ) M (b)
Figura 6.4: (a) Probabilidade de jogos P(M ) vs o número M de partidas disputadas. (b) Distribuição de probabilidade cumulativa Pc(M ) construída a partir de P(M ). As linhas
1 10 100 10 -4 10 -3 10 -2 10 -1 1 10 100 10 -4 10 -3 10 -2 10 -1 10 0 (b) G c 10 gols P ( G ) (a) P C ( G ) G
Figura 6.5: (a) Probabilidade P(G ) que um jogador tenha marcado G gols. É dez vezes mais provável que um jogador escolhido aleatoriamente tenha marcado 13 gols do que 36 gols. O jogador com o maior número de gols marcados no campeonato brasileiro é o Roberto Dinamite com G = 186. (b) Distribuição de probabilidade cumulativa Pc(G ).