Desde o lançamento do filme Moneyball (que estreou em 2011), muito se fala no Brasil sobre a necessidade ou viabilidade de um modelo parecido para o futebol. De lá para cá, entre muitas idas e vindas, a maioria dos clubes implementou o que se chama de ‘departamento de scout’, ‘departamento de análise de dados’ e afins.

A ideia desse texto não é discutir a viabilidade de utilizar modelos matemáticos no futebol (muito dizem ser impossível, dado o fator ‘imponderável’ do futebol), ou apontar um grande modelo de sucesso no mundo. A ideia é simplesmente levantar o questionamento: Existe mesmo análise de dados no futebol brasileiro? Ou será que temos apenas os mesmos profissionais do ‘achismo’, pilotando ferramentas extremamente poderosas de scout?

Contexto

Começo fazendo um paralelo com a própria história do filme, que é baseado em história real. Por lá, Billy Beane (General Manager, cargo análogo ao gerente de futebol) se junta a Peter Brand (como assistente) para utilizar modelos matemáticos para a montagem do time.

Aqui a primeira informação chave que precisa ser registrada: Peter Brand é um personagem baseado em Paul DePodesta, que é economista formado pela Harvard.

Vejam que não é um ex-jogador (ainda que ele tenha sido atleta universitário), ex-treinador, ex-preparador físico. Estamos falando de uma pessoa com formação técnica para análise de dados.

Uma rápida busca na internet e linkedin nos ajuda a traçar o perfil dos profissionais das ditas áreas de ‘análise de dados’ dos clubes brasileiros. Não gosto de citar nomes, para não individualizar a crítica, mas o nome mais conhecido dessa área no São Paulo Futebol Clube é formado em Educação Física, e possui diversas licenças de treinador da CBF.

Percebem a diferença? De um lado temos uma pessoa formada em um curso extremamente numérico e estatístico, de uma das universidades de maior renome no mundo. Do outro temos alguém com formação similar a um treinador de futebol (para não dizer igual).

Por que alguém com formação em números?

É natural que surja a pergunta: qual seria o benefício de uma pessoa com formação em números? Não sairia caro demais para um esporte tão imprevisível?

Ou até mesmo as seguintes afirmações: Futebol é diferente. É preciso conhecer do dia a dia do futebol.

O simples caso de sucesso do Moneyball já poderia ajudar a pelo menos combater essas dúvidas – uma combinação de sucesso entre alguém do meio (o famoso ‘boleiro’) com alguém extremamente numérico (o analista de dados).

Porém podemos explorar o lado técnico da estatística para entender porquê da formação estatística ser tão importante.

Quantos treinadores de futebol (ou formados em educação física) tem pleno domínio de conceitos como moda, média, mediana, variância, desvio padrão, distribuição normal, etc.

Quais deles tem domínio de linguagens de programação como javacript, python, SQL e afins?

Existe um motivo para o especialista em futebol ser especialista em futebol: ele estudou para isso, gastou horas e horas estudando isso.
E existe também um motivo para o especialista em estatística e análise de dados ter domínio nessa área: ele também focou nessa área do conhecimento, anos e anos de estudo.

Tão simples quanto 1+1 = 2. Se eu quero um especialista em números, devo contratar alguém que dedicou uma carreira a isso.
Em simplificada analogia, quem você prefere que opere seu joelho: um ortopedista ou um oftalmologista? Ambos estudaram medicina, porém cada um tem sua especialidade.

Ainda que o especialista em data science possa ter dificuldade em contextualizar e definir problemas do futebol – ele terá extrema facilidade em navegar entre os números.
Assim como o profissional do futebol entende da definição dos problemas, mas provavelmente terá dificuldade com termos estatísticos.

Mas e a prática?

Já pensou ter alguém capaz de trabalhar com bases de dados extremamente grandes, e assim construir algoritmos preditivos para aumentar eficácia de contratações?

Vamos pegar um caso real? Pablo.

Todos sabemos que ele teve um 2018 incrível. Aos olhos dos scouts atuais, muito bom (média de gols alta, título, assistências e afins). Que tipos de análise poderiam ser feitas para entender se de fato seria uma ótima contratação?
-> Que tal comparar o ano de 2018 com o resto da carreira dele? Será que foi um ano fora da curva? Será que a boa fase do Atlético Paranaense contribuiu para o bom ano dele?
-> Que tal analisar o rendimento ponderado dele? Isto é, comparar o quanto os scouts individuais dele melhoraram em comparação ao do time inteiro do Atlético Paranaense. Oras, se o time inteiro rendeu muito bem, é natural ele individualmente ter números melhores.
-> Porque não fazer uma comparação histórica com 20, 30 ou 40 jogadores similares (mesma posição, idade parecida, rendimento histórico similar) e aferir a probabilidade de um jogador desses manter alto desempenho após um ano fora da curva.

Vejam bem, na era das inteligências artificiais me parece uma loucura não acreditar que existe algo possível também no futebol. Ou vamos achar que o caderninho do Milton Cruz tem mais potencial que um computador?

E acreditando no poder da estatística e da programação nesse processo todo, por que colocar um profissional de educação física ao invés de um economista, estatístico, engenheiros ou matemático?

Qual o custo disso?

Ainda que a ideia faça sentido no campo teórico, ainda virão as dúvidas: a conta fecha?

Sabemos que um profissional da área de dados, com boa formação, tem um custo relativamente caro. Será que um clube de futebol poderia se dar ao luxo de contratar alguém com formação top no Brasil?

Uma breve pesquisa no Google mostra que o cargo de data scientist no Brasil tem salário entre 6 mil reais e 15 mil reais. Considerando que estamos atrás dos melhores, podemos considerar 20 mil reais mensais como salário alvo.

Ainda fazendo arredondamento, por conta da CLT (aproximadamente 2 vezes o custo do salário), temos o custo de 40 mil mensais. Com dois profissionais, temos um custo mensal de 80 mil reais mensais.

Será que é realmente um custo alto para o contexto do futebol?

Digamos que esse departamento extremamente caro (porém tecnicamente eficiente) evite a contratação de um Trellez a cada 2 anos. Ou que tal evitar um Pablo a cada 4 anos?

Isso sem contar em possíveis benefícios positivos, como descobrir um jogador que acaba vendido. É mais fácil fazer lucro comprando jogadores baratos (pois uma venda baixa já irá resultar em lucro) do que tentar acertar o próximo Bruno Henrique (uma compra cara me obriga a fazer uma venda cara).

Percebem como a conta pode sim fechar?

Conclusão

Ainda que não possa afirmar categoricamente que não existam boas práticas no mercado análise de dados do futebol brasileiro, existem muitos indícios que ainda é um mercado extremamente defasado.

Do alto índice de erros ao grande volume de dinheiro desperdiçado, passando pela formação dos responsáveis pelas áreas, uma coisa podemos afirmar: O desempenho dessas áreas é ruim.

Sempre iremos esbarrar em dois grandes questionamentos:
-> Talvez não exista interesse nos líderes do futebol, simplesmente porque acabaria com negociações sombrias.
-> Talvez eles simplesmente não tenham a visão e entendimento da necessidade de tais profissionais (ainda que seja difícil imaginar que alguns diretores provenientes do ‘mercado’ jamais tenham se deparado com tal questão).

Seja pelo lado da malícia ou da ignorância, o fato é que no futebol brasileiro ainda não temos um grande exemplo do uso da ciência de dados para tomada de decisão.

Vale a pena? Pergunta no Nubank, no Itaú, Magazine Luiza, no Posto Ipiranga, na empresa que você trabalha ou por que não, pergunta para o Billy Beane.

Marcelo Vaz Guimarães