A utilização de análise de dados aplicada no esporte é algo que ganhou força nos anos 90 e explodiu nos anos 2000. Esportes americanos, provavelmente, são os pioneiros na área, com a NBA, NFL, NHL e, mais recentemente, com a MLS. Um exemplo da utilização da análise de dados no esporte é o filme Money Ball – o homem que mudou o jogo, estrelado por Brad Pitt, que interpreta Beane, o gerente geral do Oakland Athletics, um time médio da MLB, que, para a disputa da temporada de 2002, contrata Peter Brand (Philip Seymour Hoffman), um recém-formado em economia pela Universidade de Yale, que tinha ideias radicais sobre a contratação de novos jogadores por meio de análises estatísticas.

Futebol e Análise de Dados

Como exemplo tupiniquim da importância da análise de dados no esporte temos Bernardinho, técnico multicampeão no vôlei, que, desde 1996, sempre contou com Roberta Giglio, analista de desempenho para ser responsável pela análise de dados de suas equipes durante e após os jogos.

Diante desses fatos, percebemos, então, que a análise de dados é importante para esportes como basquete, vôlei e baseball, todos de alta pontuação durante um jogo. Mas e para o futebol? Diferentemente dos citados, o futebol é um esporte em que a pontuação depende de um evento raro – o gol, o que dificulta a sua previsão. Mesmo assim, a aplicação de análises de dados, principalmente a partir de 2010, vem crescendo muito, seja por modelos de previsão de resultados, como vemos em sites como o “chance de gol” e o “Infobola”, ou pela análise aplicada diretamente no jogo e contratada pelas próprias equipes de futebol. Esse modelo, em especial, pode ser visto em eventos como StatsBomb Innovation in Football Conference, ocorrido em outubro de 2019 no Stamford Bridge, estádio do Chelsea, com apresentação de diferentes formas de análise de dados de uma partida de futebol.

Como um bom brasileiro, sou mais um apaixonado por futebol, e como estatístico venho testando diferentes métodos para gerar uma melhor estimativa da pontuação final das equipes da série A do campeonato brasileiro. Os métodos que utilizei até hoje seguem a mesma premissa: é necessário ter pelo menos 1 turno, 19 jogos do campeonato jogado, para que por meio desse desempenho seja possível gerar a estimativa final. No meu primeiro estudo, em 2017, quando o campeonato teve 28 rodadas de um total de 38, usei um método que apresentava três cenários: no primeiro, o time manteria o seu aproveitamento da temporada; no segundo cenário, ele manteria o aproveitamento dos 9 jogos do segundo turno; e, num terceiro cenário, teria um desempenho médio, entre o obtido no primeiro e no segundo turnos. Os resultados obtidos foram os seguintes:

Em 2017, a classificação final teve 1º Corinthians, com 72 pontos, 2º Palmeiras, com 63; 3º Santos, também com 63 e 4º Grêmio, com 62. O cenário 2 foi o que se aproximou mais da pontuação final.

Pensando em melhorar o método, nos anos seguintes, resolvi levar em consideração dois fatores: o fator “casa” e o fator “posição na tabela”. Dessa forma, comecei a olhar o desempenho de maneira separada, nessas duas variáveis, e dividir os times em blocos, como apresento a seguir o desenvolvido para o campeonato de 2020:

Bloco 1 (candidatos ao título): São Paulo, Atlético/MG, Flamengo, Grêmio, Fluminense, Internacional, Palmeiras e Santos.
Bloco 2 (times de meio de tabela): Ceará, Fortaleza, Corinthians, Athletico, Bahia, RB Bragantino e Atlético/GO.
Bloco 3 (luta contra rebaixamento): Sport, Vasco, Coritiba, Botafogo e Goiás.

Esse era o cenário após 28 rodadas para uns e 29 para outros, já que em 2020, devido à pandemia do COVID-19, alguns jogos haviam sido adiados e só foram realizados mais para o final do campeonato. As estimativas para os candidatos ao título são apresentadas a seguir:

A pontuação final do campeonato de 2020 ficou da seguinte forma: 1º Flamengo, com 71 pontos, 2º Internacional, com 70, 3º Atlético/MG, com 68, 4º São Paulo, com 66. Esse estudo foi feito entre as rodadas 24 e 29 e, em cada rodada, ajustei o aproveitamento das equipes, em casa e fora de casa, como vemos no gráfico a seguir:

Se tivesse continuado as projeções com esse método, veríamos as estimativas do Flamengo subir, após cada vitória e as da equipe do São Paulo cair, após cada tropeço que a equipe apresentou na reta final da competição. Uma boa alternativa, para a melhoria do método, seria restringir o aproveitamento em casa e fora a um número restrito de jogos, como fiz em 2017, para tentar captar “a fase” de cada equipe.
Com a crescente tendência de um maior profissionalismo no futebol brasileiro e com tudo que gira em torno do universo do futebol com o objetivo de entender quais fatores levam um time a vencer um jogo ou um campeonato – desde sites de apostas e jogos, como o Cartola, até os estudos mais elaborados -, a análise de dados tem todos os pré-requisitos para ser cada dia mais utilizada e estar cada vez mais presente no mundo do futebol, tentando, com isso, prever o esporte mais imprevisível e amado de todo o mundo.

Por Rignaldo Carvalho
Mestre em Estatística, doutorando em Demografia, Estatístico na Cognatis

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *