• Nenhum resultado encontrado

3. Modelagem: previsão do publico

3.3 As variáveis

São vários os fatores que influenciam um torcedor a sair de casa para ir (ou não ir) a um estádio de futebol. De forma rápida, podemos imaginar e levantar alguns aspectos que pesam na decisão do torcedor:

● O adversário a ser enfrentado; ● O dia da semana do jogo; ● O horário do jogo;

● O preço do ingresso;

● Se está perto ou não do final do mês (perto do recebimento do pagamento); ● O momento da equipe;

● A fase (início, meio ou fim) do campeonato;

● Se o jogo está sendo transmitido pela TV (ou se o último foi transmitido); ● A previsão e as condições climáticas;

● Uma série de fatores difíceis de serem medidos (como a pura vontade do torcedor de sair de casa ou as condições de “diversão” e acomodação que o estádio oferece).

A variável dependente será, obviamente, o público na partida (no caso, o do Botafogo ou do Fluminense). O borderô quase sempre deixa claro o exato número de pessoas que pagaram ingresso para assistirem ao jogo na torcida do time A ou do time B (público pagante). No entanto, as gratuidades (como idosos) não são divididas por setor e, assim, não podem ser atribuídas a nenhuma das torcidas. Neste trabalho, decidimos aproximar o público presente (soma do público pagante com as gratuidades) do Botafogo ou do Fluminense supondo que a proporção de torcedores do time da casa e do time visitante é a mesma para o público pagante e para as gratuidades. Isto é: se em determinado jogo foram registrados, por exemplo, 1.000 pagantes do Palmeiras e 9.000 pagantes do Botafogo além de 5.000 gratuidades, o público presente estimado do Botafogo será de 13.500 pessoas, já que o Botafogo teve 90% do público pagante da partida (9.000 + (9.000/10.000)% de 5000 gratuidades = 9.000 + 0,9*5.000 = 9.000 +

25

4.500 = 13.500). Essa variável será chamada (a única variável dependente) de PubBot (na estimação para o Botafogo) ou PubFlu (na estimação para o Fluminense).

A seguir, serão relatadas as variáveis propostas nesse trabalho.

● Retrospecto recente do time

É esperado que a presença de público seja maior quando o time está bem. Mas como quantificar se um time está bem ou não? Como no Campeonato Brasileiro as vitórias somam 3 pontos à classificação do time, o empate soma 1 e a derrota soma 0, a decisão foi quantificar o momento da equipe pela pontuação dos jogos recentes.

Desta forma, para cada jogo da base de dados, foram computadas as pontuações dos jogos anteriores do Botafogo e do Fluminense, mesmo que os jogos anteriores não fossem todos do Campeonato Brasileiro (Campeonato Carioca, Copa do Brasil, Copa Libertadores e Copa Sul-Americana).

Para decidir a quantidade de jogos que entrariam no modelo, foram calculadas as correlações dos públicos com as pontuações dos 5 jogos anteriores, a fim de estimar até onde iria a “memória” do torcedor. As correlações são apresentadas nas Tabelas 3 e 4.

Tabela 3 - Correlação do público do Botafogo com a pontuação obtida nos 5 jogos anteriores.

Fonte: O autor. 1º jogo Anterior 2º jogo Anterior 3º jogo Anterior 4º jogo Anterior 5º jogo Anterior Correlação com o público 0,406 0,258 0,210 0,164 -0,088

A Tabela 3 mostra que, como esperado, a memória do torcedor “diminui” conforme nos afastamos temporalmente, e a correlação cai até o 4º jogo anterior. A correlação torna-se negativa (algo que foge à realidade) no 5º jogo, o que faz com que o modelo seja constituído de modo a utilizar a pontuação dos 4 jogos anteriores. Assim, serão utilizadas as variáveis R1, R2, R3 e R4, separadamente, tendo, cada uma, valor 3 quando o resultado for vitória, 1 para empate e 0 para derrota. Quando um dos jogos anteriores foi de uma competição eliminatória, consideramos 3 pontos para classificação e 0 para desclassificação, não importando se foi uma vitória, empate ou derrota.

26

Tabela 4 - Correlação do público do Fluminense com a pontuação obtida nos 5 jogos anteriores.

Fonte: O autor. 1º jogo Anterior 2º jogo Anterior 3º jogo Anterior 4º jogo Anterior 5º jogo Anterior Correlação com o público 0,257 0,046 0,210 -0,098 -0,334

A Tabela 4 mostra que, como esperado, a memória do torcedor do fluminense também “diminui” conforme nos afastamos temporalmente, e a correlação cai até o 5º jogo anterior. No entanto, a correlação torna-se negativa (algo que foge à realidade) com relação ao 4º e ao 5º jogo, o que faz com que o modelo seja constituído de modo a utilizar a pontuação dos 3 jogos anteriores. Assim, serão utilizadas, para a equação do Fluminense, as variáveis R1, R2 e R3, separadamente, tendo, cada uma, valor 3 quando o resultado for vitória, 1 para empate e 0 para derrota. Assim como foi para o caso do Botafogo, quando um dos jogos anteriores foi de uma competição eliminatória, consideramos 3 pontos para classificação e 0 para desclassificação, não importando se foi uma vitória, empate ou derrota.

● Momentos especiais

As variáveis R1, R2, R3 (e R4) não conseguem medir, no entanto, situações ditas especiais como um título conquistado ou a estreia de um grande atleta. Assim, foi criada a variável MomP (momento positivo) que será binária: terá valor 1 quando a situação for especial e tiver impacto positivo na presença (apresentação ou estreia de um grande jogador, ou até um jogo subsequente a um título) e será 0 quando o jogo for normal.

Da mesma forma, foi criada a variável MomN (momento negativo) que será binária: terá valor 1 quando a situação for especial e tiver impacto negativo na presença (jogo subsequente à perda de um título ou uma goleada sofrida) e será 0 quando o jogo for normal.

Na base do Botafogo, em 90 observações, apenas 7 jogos tiveram a variável MomP no valor 1 e 2 jogos com a variável MomN com valor 1. Já na base do Fluminense, que é menor (33 jogos), 2 jogos tiveram a variável MomP valendo 1, e nenhum jogo teve a variável MomN valendo 1.

27

● Dia da semana

Acredita-se que o dia da partida influencia diretamente na presença de público. Jogos em finais de semana e em feriados atraem mais famílias e idosos do que jogos durante a semana, basicamente pela questão do horário e por ser um dia de folga. Assim, foi criada mais uma variável binária chamada FDSFer, que será 1 para jogos em finais de semana ou feriados (68 jogos de 90 observações para o Botafogo; 26 para 33 do Fluminense) e 0 para jogos em dias úteis (22 observações para o Botafogo e 7 para o Fluminense).

● Horário da partida

O horário da partida está intimamente ligado com o dia da semana. Um jogo às 16h de domingo está em um horário “nobre”, mas se fosse às 16h de uma quarta-feira seria certamente um desastre de público: são dois tipos diferentes de jogos, com públicos também distintos. Para tentar medir esse efeito, será proposta uma variável relacionada aos dias da semana e horários de jogos. É notável que os horários de jogo e dias da semana têm uma influência conjunta.

Antes de tudo, no entanto, para todos os jogos da base (90 do Botafogo e 34 do Fluminense), foi verificado que houve jogos em 10 horários distintos. Cruzando esses horários com o dia da semana na partida (isto é: se foi um dia útil ou um dia de final de semana ou feriado), foi convencionado que há 3 classificações: “cedo”, “médio” ou "tarde”. A tabela 5, a seguir, mostra os horários em que foram observadas partidas na base e sua respectiva classificação, caso ela tenha sido num dia útil ou não útil. Células com “-“ indicam que não foram observados jogos nesta combinação de dia/hora na base de dados.

28

Tabela 5 - Classificação de “cedo”, “médio ou “tarde” para os jogos das bases de acordo com o horário

de início da partida e dia da semana. Fonte: O autor.

Horário Final de semana/Feriado Dia útil

16:00 Cedo - 16:20 Cedo - 17:00 Cedo - 18:00 Médio - 18:30 Médio - 19:00 Médio - 19:30 Tarde Cedo 20:30 - Médio 21:00 Tarde Médio 21:50 - Tarde 22:00 - Tarde

Obviamente, não se pode incluir “cedo” ou “tarde” na modelagem. Assim, será usada uma modelagem binária, composta pelas variáveis HB1 e HB2. Como há três possibilidades qualitativas para o início de uma partida (“cedo”, “médio” ou “tarde”), a combinação das variáveis HB1 e HB2 vai traduzir estas classificações da seguinte maneira:

Tabela 6 – Comportamento das variáveis HB1 e HB2 de acordo com horário de início

Fonte: O autor.

Classificação do horário de início da partida HB1 HB2

Cedo 0 1

Médio 1 0

Tarde 1 1

Uma partida começando às 19:30 de um sábado (ou seja: segundo a convenção exposta na tabela 5, uma partida considerada “tarde”), HB1 terá valor 1 e HB2 valor 1. No entanto, caso uma partida tenha início às 19:30 de um dia útil (“cedo”), HB1 terá valor 0 e HB2 valor 1.

29

● Distância do dia de pagamento

O torcedor de futebol muitas vezes é de uma classe menos abastada, o que faz com que muitos torcedores deixem de ir ao jogo caso o mês “já esteja no fim”, isto é, a data do jogo seja longe do seu último recebimento. Há diversas maneiras de (tentar) estimar a “perda de intenção” de ir ao jogo conforme os dias passam ao longo do mês. Foram propostas várias formas de descrever essa variável. Em primeiro lugar, deve-se decidir qual é o início do mês do calendário de “recebimento”: o 1º dia do mês do calendário usual, o 5º dia do mês do calendário usual ou o 5º dia útil. Isto é: quando começará o mês do assalariado?

Depois de definir o alvo, deve-se decidir a taxa de decrescimento da intenção de ir ao jogo em função do dia do mês. A ideia é estimar como o salário vai sendo consumido à medida que o tempo passa. Como opções de modelagem é possível utilizar escala linear ou exponencial, por exemplo. Quando se opta por uma escala linear, com os dias passando como passam no calendário (dia 1, 2, 3...), estaremos assumindo que o nível de renda disponível para o torcedor despender em ingresso (ou o interesse do torcedor em ir ao jogo) cairá linearmente.

Foram testadas 15 variáveis diferentes para modelagem desse efeito, já que foram escolhidas 5 escalas (linear, logarítmica, semanal e 2 exponenciais – uma exponencial do dia e outra exponencial do dia dividido por 30) e 3 formas de começar a contagem do calendário (1º dia do mês, 5º dia do mês e 5º dia útil do mês).

Como são muitas as pessoas não recebem já no 1º dia do mês, é natural utilizar as variáveis do 5º dia ou do 5º dia útil.

Por apresentar a maior correlação prévia e também por apresentar o coeficiente na regressão de maior significância estatística, a variável utilizada será uma de escala logarítmica com o mês começando no dia 5.

A escala logarítmica para um mês de 31 dias se comporta da seguinte maneira (sendo 1 o dia 5, 2 o dia 6, 3 o dia 7, etc.):

30

Figura 5 - Comportamento da curva logarítmica de 1 a 31

Fonte: O autor.

Percebe-se, ao se observar a figura 5, que a curva cresce em uma alta taxa nos primeiros dias (basta imaginar a derivada em cada dia), tendendo a uma estabilidade no final do mês. Considerando que a variável tenha coeficiente negativo, então o interesse em ir ao jogo será perdido de maneira rápida, conforme se afasta do dia 5 nos dias próximos (mas posteriores) ao dia 5, e cairá de maneira mais estável a partir daí e até o dia 4 do mês seguinte. Isso faz sentido, imaginando-se que há muitas contas a serem pagas nos dias próximos ao recebimento, sobrando uma porção cada vez menor do salário para o lazer (futebol).

Como exemplo do comportamento da variável criada (LogD5c_1), a tabela a seguir mostra possíveis valores para determinadas datas.

31

Tabela 7 - Comportamento da variável que mede a distância da data da partida para o dia de pagamento

Fonte: O autor.

Data da partida Variável “Distância dia 5” LogD5c_1

05/09/2011 1 0,000 06/09/2011 2 0,301 07/09/2011 3 0,477 08/09/2011 4 0,602 09/09/2011 5 0,699 10/09/2011 6 0,778 11/09/2011 7 0,845 12/09/2011 8 0,903 13/09/2011 9 0,954 14/09/2011 10 1,000 15/09/2011 11 1,041

O conhecimento da influência relatada acima é importante, pois permite que o clube faça uma política de precificação dos ingressos que pode variar de acordo com o dia do mês.

● O preço do ingresso

É automático imaginar que o preço tem influência na partida. No Brasil, a questão tende a ser ainda mais importante. Como falado, não é comum no Brasil a venda de season ticket, como é nos esportes norte-americanos ou no futebol europeu. Consequentemente, não está na cultura do torcedor brasileiro portar o ingresso com antecedência para todas as partidas da temporada (ou do campeonato nacional). Além disso, também é extremamente incomum que clubes brasileiros determinem e/ou divulguem com grande antecedência o preço de ingressos. Como parte de uma iniciativa inovadora, o Fluminense categorizou os adversários do Campeonato Brasileiro de 2014 em 3 tipos (rivais locais, rivais nacionais e sem rivalidade) e anunciou, antes do início do torneio, o valor do ingresso mais barato para cada uma dessas partidas: R$ 10 contra clubes sem rivalidade, R$ 20 contra clubes rivais nacionais e R$ 30 contra clubes rivais

32

locais9. O clube, no entanto, abandonou a medida poucos meses depois, ainda no meio

do campeonato.

É possível lembrar também de “pacotes” lançados para os jogos finais de um campeonato10 ou situações também pontuais, mas talvez o exemplo mais consistente

tenha sido o do Corinthians no Brasileiro de 201711. No entanto, é notável que são raros

os exemplos de políticas de preço antecipadas no futebol brasileiro.

Clubes ingleses divulgam antecipadamente, para os sócios ou os não sócios, os preços de ingressos para os jogos em que terão mando de campo. Como exemplo, o Arsenal FC da Inglaterra divulga os preços da temporada12 de acordo com a

categoria/tipo da partida13. Seu enorme rival londrino, o Tottenham, também faz o

mesmo14, como mostramos a figura abaixo para a temporada 2017/18 da Premier League

(Campeonato Inglês).

Figura 6 - Política de preços da temporada 2017/8 do Tottenham Hotspur (Inglaterra).

Fonte: http://www.tottenhamhotspur.com/tickets/ticket-prices/ 9 http://globoesporte.globo.com/futebol/times/fluminense/noticia/2014/05/flu-divulga-precos-dos- ingressos-para-partidas-em-casa-pelo-brasileirao.html 10 http://globoesporte.globo.com/futebol/times/flamengo/noticia/2016/10/flamengo-lanca-pacote-para- jogos-com-botafogo-coritiba-e-santos.html 11 https://globoesporte.globo.com/futebol/times/corinthians/noticia/corinthians-lanca-pacote-de- ingressos-para-brasileirao-veja-os-precos.ghtml 12 https://www.arsenal.com/tickets/non-member-ticket-prices 13 https://www.arsenal.com/tickets/matchcategories 14 http://www.tottenhamhotspur.com/tickets/ticket-prices/

33

No Brasil, cada jogo tem um preço, e normalmente este é determinado a poucos dias da partida, de acordo com os objetivos do clube ou a importância da partida.

Há diversas possibilidades de se tentar construir uma variável que capte o efeito do aumento, da manutenção ou mesmo da diminuição do preço do ingresso. Com diversos preços para diferentes setores em um mesmo estádio, qual deles utilizar?

Apesar de parecer óbvio e imediato pegar o popular “ticket médio” da partida (renda bruta dividida pelo público pagante), esta variável teria um viés, já que se deseja, justamente, ter o público como variável explicada.

Por conta da modelagem envolver diferentes estádios (inviabilizando, assim, a aplicação de um preço ponderado por setor), será escolhido o preço mínimo da partida. Isto é: para cada um dos 90 jogos do Botafogo e 33 jogos do Fluminense, foi registrado o ingresso de inteira mais barato vendido em cada partida.

A ideia é que o ingresso mais barato seja, talvez, aquele que mais influa na decisão de ir ou não ao jogo: caso o menor preço seja visto como restritivo para um grupo de torcedores, certamente os ingressos mais caros serão, no mínimo, tão restritivos quanto, podendo restringir ainda mais torcedores.

A Figura 7 mostra, na base de dados do Botafogo, um histograma de preços mínimos.

Figura 7 - Histograma com preços mínimos praticados nos jogos do Botafogo FR

Fonte: O Autor 2 1 46 0 22 0 8 0 1 0 6 0 0 0 3 0 0 0 1 0 5 10 15 20 25 30 35 40 45 50 R$ 10 R$ 15 R$ 20 R$ 25 R$ 30 R$ 35 R$ 40 R$ 45 R$ 50 R$ 55 R$ 60 R$ 65 R$ 70 R$ 75 R$ 80 R$ 85 R$ 90 R$ 95 R$ 100 Q ua nt ida de de oc or nc ia s

Preço mínimo (inteira)

Documentos relacionados