" Que vença o melhor. " - esse é um comprimento muito usado dentro de um jogo futebol, trocado entre adversários, especialmente antes de a partida começar. Num ano de copa do mundo, a competição mais assitida e prestigiada do futebol - e também de todo os esportes -, a mídia reserva às seleções um espaço enorme. Em consequência disso, o assunto 'copa' fica em voga em todas as rodas, e surgem aos montes os palpites a respeito da pergunta mais importante - " Afinal, quem vai ser o campeão ? ".
Provavelmente, você - até talvez sem notar, de tão óbvio que esse raciocínio é - pensa que para responder essa pergunta com segurança basta saber quem é o melhor time. Afinal, assim como informa o comprimento entre os capitães, o melhor time deve vencer, certo? Bem, mais ou menos (muito menos do que mais)...
Não é impressionante que o melhor time perca uma copa de vez em quando. O que se espera, no entanto, é que em muitas vezes isso não aconteça. É até razoável dizer que um dos meios que temos de avaliar o grau de elaboração de uma competição se resume a ver com que frequência o melhor time - aquele que merecia de verdade levantar a taça - termina como vencedor. Mas esse conceito, embora pareça fazer sentido, a priori não deixa claro como então podemos calcular com que frequência o melhor time vence. Essa tarefa exige algo que nunca saberemos com certeza: qual é o melhor time da copa *independentemente* do resultado da copa? O ranking da FIFA não é útil nesse caso, porque ele leva em consideração o resultado de competições em que também não sabemos se podemos confiar.
O que fazer? Analisar, em cada seleção, sua equipe técnica e os jogadores, considerando para cada jogador um conjunto enorme de informações, como gols, passes certos e errados, tempo em jogo, regularidade etc? Talvez isso dê certo, mas não dá para acreditar que entre a quantidade absurda de maneiras de encarar o problema haveria um consenso. Existe com certeza uma solução bem mais simples: simulação. Foi o que eu fiz - várias, mas várias vezes.
Simulação e resultados
A simulação de uma copa pode ser feita assim: sorteiam-se 32 equipes e um parâmetro que resume quão bem cada equipe joga (aqui, seu "poder"). Esse "poder", um valor racional, é gerado por uma função aleatória (do Python), o que mais ou menos garante uma distribuição uniforme de poderes. Em outras palavras, em 32 números gerados, há uma certeza grande de que haverá times fracos, medianos e fortes. Os procedimentos seguintes são idênticos aos de uma copa: as equipes são divididas em grupos ; de cada grupo sãem os dois primeiros colocados ; esses times disputam uma segunda fase, em estilo mata-mata. O resultado de um jogo entre duas equipes tem relação com seu "poder" e com um fator aleatório. Isso possibilita que a Grécia vença o Brasil, mas também garante que isso seja raro.
A mesma coisa foi feita para um torneio no estilo do atual campeonato brasileiro (pontos corridos), mas sem returno e com 32 equipes. Depois de 100 mil copas e 100 mil torneios de pontos corridos (eu disse que eram muitas simulações), os resultados foram os seguintes...
- Nas copas, o melhor time (de maior "poder") ganhou aproximadamente 11% das vezes.
- No outro caso, o melhor time ganhou cerca de 20% das vezes.
Isso sugere que um campeonato em pontos corridos é bem mais competente do que a Copa para determinar o melhor time (quase duas vezes). Para não perder viagem, também simulei o campeonato brasileiro (pontos corridos, 20 times, 2 turnos), e os resultados foram melhores ainda, como era esperado: o melhor time foi o campeão em 30% das simulações. Essa melhora pode ser explicado pelo menor número de times e pelo fato de ter havido returno, o que aumenta as chances de o desempenho dos times ser o desempenho esperado.
As virtudes do modelo da Copa
É verdade que o modelo da copa não é, digamos, "justo", mas permite que muitas seleções disputem um torneio em pouco tempo. Parece inviável que uma competição como essa, que só traz ônus aos clubes, dure muito mais de um mês. Se fosse jogada em pontos corridos (e sem returno), seriam disputados 496 jogos, em 5 meses, enquanto atualmente o torneio é realizado apenas com 64 partidas. Por outro lado, se fosse feito um esforço para reduzir o número de times que são selecionados após as eliminatórias, a competição ainda sim demoraria muito e perderia um pouco do seu propósito globalizante.
Críticas a esse trabalho
Quando realizei as simulações, usei como hipótese que o "poder" dos times era distribuído uniformemente, o que parece não ser verdade. Na Copa, provavelmente existem seleções muito fortes, muito fracas e poucas medianas. No entanto, a maneira como distribuí os times nos grupos foi fiel ao sistema usado pela FIFA, com 4 potes, cabeças de chaves em grupos separados, 1o de um grupo enfretando o 2o de outro. Veja mais detalhes sobre o sorteio de grupos aqui. Talvez o mesmo seja válido para o campeonato brasileiro.
Sobre como avaliar um torneio: lá em cima, afirmei que o grau de elaboração de um competição está relacionado a com que frequência o melhor time termina como vencedor. A rigor, acho que mais fiel ainda à idéia de competição eficiente é ver a relação, para todos os times, entre a posição esperada e a posição obtida. Pretendo fazer isso para o próximo post.
Detalhes sobre a simulação
(adicionado em função dos comentários)
A simulação de uma partida no modelo que utilizei é muito simples (dentro do que poderia ser), uma vez que só estávamos interessados nos resultados dos jogos. Um modelo completo - ou ao menos muito menos pobre do que o meu - poderia por exemplo tratar dos jogadores de cada time e tentar por na conta muitas das possibilidades de um jogo real de futebol. A idéia do "poder" de cada seleção é simplificar: esse parâmetro informa quanto bem um time joga em geral. Assim, ter em mãos o "poder" de duas seleções (s1 e s2) só nos possibilita dizer uma coisa: num confronto entre elas, qual a chance de cada resultado possível - vitória de s1, derrota de s1 e empate.
Depois de muita enrolação, vamos descrever como funciona a partida com mais detalhes.
Sejam S1 e S2 duas seleções de poder P1 e P2, parâmetros reais (não precisa ser inteiro!), respectivamente. Em cada partida realizada entre elas, é gerado um fator aleatório para cada seleção.
Sejam r1 e r2 esses fatores (r de random), também parâmetros reais. Seja int(x) a função que associa um número real x a seu inteiro mais próximo.
O score1 de S1 é dado por int (P1 * r1) ; o score2 de S2 é dado por int (P2 * r2).
Finalmente, se...
[1] score1 > score2 : S1 vence
[2] score1 < score2: S2 vence
[3] score1 = score2: S1 e S2 empatam
O poder P está no intervalo [1,10] ; o fator aleatório r está no intervalo [0,3/2] (mas esses limites não alteram muito a chance de o melhor time ser ou não ser o vencedor).
Ok, mas como podemos saber se essa simulação de partida é boa?
Para responder isso, temos que definir boa. Eu defini que uma simulação de partida é boa quando ela atende a alguns critérios.
[1] É rápida (para possibilitar muitas simulações)
[2] Gera resultados aleatórios
[3] Gera vitórias, derrotas e empates com frequência semelhante à da realidade.
A grande dúvida é se estamos satisfazendo [3]. Pode ser, por exemplo, que os times fiquem empatando demais ou nunca empatem. Nas 100.000 simulações de Copa do Mundo, aproximadamente 19% dos jogos terminaram em empate. Tendo como base, por preguiça, apenas a última copa, de 2006, 15 dos 64 jogos, ou 23% deles, não tiveram um vencedor. Então, dentro dessa definição, estamos bem.
8 comentários:
Bom, interessante o teu texto, mas tive uma duvida, como voce determinou o "poder" de cada time? isso é algo bastante subjetivo, em uma copa do mundo basta ser o mais "poderoso" em apenas 7 jogos, então não deve-se levar em tanta consideração os jogos anteriores
Cala a boca......você nao sabe o que fala, deve ser emo jogador de volei...
É um texto interessante mesmo, mas acho que uma simulação desta depende de muitas variávies, não sei exatamente como vc realizou estes testes, mas acredito que seja muito dificil mensurar assim um campeonato.
Porém, realmente, um campeonato de pontos é mais justo com certeza!
Bom Post!!
Abs
Opa, tentei esclarecer alguns passos da simulação no post, porque dentro de um comentário os recursos são meio limitados. Obrigado pelos comentários.
Muito legal o post. Bem vo comentar o que eu acho:
Toda simulação e modelagem matemática para futebol costuma ser imprecisa, só lembrar que o Fluminense tinha 99,9% de chances de ser rebaixado. Eu acredito que esse erro ocorre não devido à aleatoriedade, mas sim à variação do "poder", um time na reta final pode ficar motivado de forma que ganhe todas as rodadas seguintes, assim como um forte pode "sentir a pressão" e perder todas as outras rodadas, talvez se o parâmetro poder fosse uma variável, com um certo "intervalo" e variasse aleatoriamente o resultado se aproxime ainda mais da realidade.
Na verdade isso tudo lembra que são várias variáveis e que a aleatoriedade delas talvez não seja tão aleatória se levarmos em conta o psicológico dos jogadores.
Isso daria até um post:
A aleatoriedade das decisões das pessoas, ou seja do psicológico delas. Sugiro ainda o local de estudo: o mercado de ações! hahaha
quem sabe vc encontra um modelo que se aproxime à realidade? Ia ficar bilionário com um...
Mandou muito bem! Parabéns pelo texto! Concordo com a metodologia, expos de forma clara como ela foi feita.
Achei a sua forma de medir qual forma de campeonato é mais justa muito boa. Fez-se simplificaçoes de forma boa. Quem sabe voce nao vira um novo tristao garcia da vida hahaha.
Abraços e boa sorte
Queremos mais posts!
Postar um comentário