Ripensare il risultato di una partita in termini di probabilità

di Jeff Sackmann // TennisAbstract

Pubblicato il 28 dicembre 2019 – Traduzione di Edoardo Salvati

Non serve aspettare la conclusione di una partita per sentire durante la telecronaca che le vittorie possono essere decise dal margine più risicato. È frequente per il vincitore raccogliere solo il 51% o il 52% dei punti totali. In decine di occasioni nel corso dell’anno capita di andare anche oltre, quando un giocatore trionfa avendo ottenuto meno della metà dei punti. Così è riuscito a fare Novak Djokovic nella finale di Wimbledon 2019, con 204 punti a suo favore rispetto ai 218 di Roger Federer.

Ha senso dedurre da risultati come quello tra Djokovic e Federer che molte partite sono decise da margini davvero ridotti o che il rendimento su determinati punti è cruciale. Ci sono addirittura situazioni di vittoria con non più del 47% dei punti giocati.

Può capitare però di attribuire al margine ridotto importanza eccessiva. Il 51% richiama effettivamente l’idea di un margine minimo, così come il 53%. In molte attività, sportive e non, il 55% rappresenta quasi una parità, e anche il 60% o il 65% suggerisce che non ci sia molto spazio a separare i contendenti. Nel tennis è diverso, specialmente sul circuito maschile che è dominato dal servizio. Quale ne sia l’interpretazione, il 60% dei punti vinti segnalano una partita a senso unico, il 65% una demolizione quasi imbarazzante. Nel 2019, in sole tre partite il vincitore ha raccolto più del 70% dei punti.

La domanda è un’altra

Per molte ragioni i punti vinti totali sono una misura imperfetta della superiorità di un giocatore, anche all’interno della singola partita. Un primo difetto è che di solito il valore si dispone nell’intervallo tra il 35% e il 65%, portando all’errata convinzione che tutte le partite siano relativamente equilibrate. Un secondo difetto è che non tutti i 55% (o i 51%, o i 62%) sono identici tra loro. Più è lunga la partita, più informazioni accumuliamo sui giocatori.

Per uno specifico formato di gioco, come le partite al meglio dei tre set, una partita più lunga mediamente richiede giocatori tra loro simili per andare al tiebreak o al terzo set. Se vogliamo però paragonare partite di formati diversi (come quelle al meglio dei tre set e dei cinque set), non necessariamente la durata fornisce indicazioni utili. Le partite al meglio dei cinque set sono più lunghe per via del regolamento, non per qualche caratteristica dei giocatori.

La soluzione risiede nel pensare in termini di probabilità

Data la durata di una partita, e la percentuale di punti vinti da ciascun giocatore, qual è la probabilità che il vincitore sia stato anche il giocatore migliore quel giorno?

Per rispondere, usiamo la distribuzione binomiale, considerando la probabilità che un giocatore vinca un numero di punti uguale a quelli che vincerebbe a parità di bravura fra giocatori. Se lanciamo una moneta 100 volte, ci aspetteremmo che esca testa circa 50 volte, senza però che siano sempre esattamente 50 volte. La distribuzione binomiale serve per sapere quanto spesso attendersi un particolare numero di testa su cento lanci: 49, 50 o 51 sono comuni, 53 un po’ meno, 55 ancora meno, 40 o 60 rari e così via. Esiste una probabilità che un qualsiasi numero di testa sia dovuto unicamente al caso, come esiste una probabilità che si verifichi perché la moneta è truccata.

Come si rapporta tutto questo a una partita di tennis?

Quando inizia la partita, facciamo finta di non sapere nulla della bravura dei giocatori e ipotizziamo che siano dello stesso livello. Il numero di punti è equivalente al numero di lanci della moneta, più sono i punti più è probabile che il giocatore che ne vince di più è realmente il migliore dei due. Il numero di punti del vincitore corrisponde al numero di testa nei lanci. Se il vincitore vince il 60% dei punti, possiamo stare certi che è il migliore, allo stesso modo in cui il 60% di testa su cento o più lanci farebbe supporre che probabilmente la moneta è truccata.

Più del solo 59%

La distribuzione binomiale aiuta a convertire queste intuizioni in probabilità. Facciamo un esempio. La finale del Roland Garros 2019 è stata abbastanza a senso unico. Rafael Nadal ha vinto il 58.6% del totale dei punti (116 su 198) contro Dominic Thiem, pur avendo perso il secondo set. Se Nadal e Thiem fossero allo stesso livello, la probabilità che Nadal vinca così tanti punti è poco meno dell’1%. Possiamo quindi dire che c’è una probabilità del 99% che Nadal sia stato — in quel giorno e con quelle condizioni — il giocatore migliore. Non è una sorpresa, e non dovrebbe esserlo.

Il ragionamento si fa più interessante modificando la durata della partita. Le altre due finali maschili del 2019 in cui un giocatore ha vinto circa il 58.6% dei punti sono state vinte da Djokovic. Al Masters di Parigi Bercy ha vinto il 58.7% dei punti (61 su 104) contro Denis Shapovalov, e a Tokyo il 58.3% (56 su 96) contro John Millman.

Vista la differenza di formato, al meglio dei tre set in questo caso, Djokovic ha impiegato la metà del tempo di Nadal, quindi la certezza che sia stato un giocatore migliore, per quanto comunque alta, non dovrebbe essere così vicina al 100%. La distribuzione binomiale assegna a quelle vittorie una probabilità rispettivamente del 95% e 94%.

Considerare anche la durata

In media, il vincitore di una partita del circuito maschile nella stagione 2019 ha vinto il 55% dei punti totali, un numero che può indicare un distacco minimo, anche se gli appassionati più attenti sanno che non è così. Una volta trasformato ogni risultato in probabilità, la probabilità media che il vincitore è anche il giocatore più forte è dell’80%.

Non solo è un numero che, intuitivamente, dà un’interpretazione superiore — sono meno infatti i risultati raggruppati intorno al 55%, con i numeri che si distribuiscono tra il 15% e il 100% — ma considera anche la durata della partita, un aspetto invece ignorato dalla vecchia maniera dei punti vinti totali.

Perché è importante?

Si potrebbe giustamente credere che chiunque interessato a quantificare i risultati delle partite abbia già avuto questo tipo di intuizioni. Si sa ad esempio che il 55% dei punti vinti corrisponde a una vittoria di misura, il 60% a una più facile, e che la durata della partita implica la necessità di leggere questi numeri in funzione del contesto. I punti validi per la classifica e i premi partita vengono assegnati senza tenere conto di queste particolarità, perché quindi cercare un’alternativa?

Per me ha un valore potenziale come modalità rappresentativa del margine di vittoria. Risponde a logica il fatto che qualsiasi sistema di valutazione, come le mie valutazioni Elo, incorpori il margine di vittoria, perché è più difficile vincere demolendo l’avversario di quanto non lo sia in una partita equilibrata. In altre parole, un giocatore che vince il 59% dei punti contro Thiem è probabilmente più forte di uno che ne vince il 51%, sempre contro Thiem. I sistemi di valutazione dovrebbero darne credito.

Ce ne sono già alcuni che lo fanno, tra cui quello introdotto recentemente da Martin Ingram e di cui abbiamo parlato in un podcast. Molti sistemi però non tengono in considerazione il margine di vittoria, tra cui le mie valutazioni Elo. Mi sono cimentato negli anni a provare tutti i possibili modi di integrare il margine di vittoria, non riuscendo a trovarne uno che riesca ad accrescere con continuità il potere predittivo delle valutazioni. Magari è la volta giusta.

Leva e partite lotteria

Ho già accennato a una limitazione di questo approccio, che riguarda la maggior parte degli altri indici sul margine di vittoria. Nella finale di Wimbledon 2019 Djokovic ha vinto solo il 48.3% dei punti totali, riuscendo ad alzare il trofeo grazie a una prestazione superiore a quella di Federer nei momenti più importanti. L’interpretazione del margine di vittoria in termini di probabilità restituisce più risultati all’80% che al 55%, ma anche più risultati al 25% che al 48%. Secondo questa metodologia, esiste solo una probabilità del 24% che Djokovic fosse il giocatore migliore quel giorno a Londra. Seppur una posizione non priva di fondamento, non dimentichiamo il divario di punti a favore di Federer, è però un po’ scomoda.

Con la distribuzione binomiale come descritta in precedenza, tralasciamo completamente la leva, il concetto cioè per il quale alcuni punti hanno più rilevanza di altri. Per quanto la maggior parte dei giocatori non produce un rendimento sempre ottimo o sempre pessimo in circostanze di alta leva, molte partite sono decise esclusivamente da come un giocatore si comporta in quei momenti chiave.

Indice di Leva e Indice di Dominio

Una soluzione potrebbe essere l’inserimento della mia nozione di Indice di Leva, che mette a confronto l’importanza dei punti vinti da ciascun giocatore. Sono poi andato avanti unendo l’Indice di Leva all’Indice di Dominio, una statistica molto vicina ai punti vinti totali, in un solo numero che chiamo DR+, o Indice di Dominio corretto.

È possibile vincere una partita con un Indice di Dominio inferiore a 1.0, che significa vincere meno punti alla risposta di quelli vinti dall’avversario, un’occorrenza che si verifica spesso quanto i punti vinti totali sono meno del 50%. Quando però il DR è corretto per la leva, è estremamente raro per un vincitore terminare con un DR+ inferiore a 1.0. L’Indice di Dominio di Djokovic nella finale di Wimbledon è stato dello 0.87, mentre il suo DR+ dello 0.97, una delle pochissime volte in cui il valore corretto del vincitore è rimasto sotto l’1.0.

Sarebbe impossibile aggiustare il metodo della distribuzione binomiale allo stesso modo in cui ho “sistemato” l’Indice di Dominio. Non si può semplicemente moltiplicare il 65%, l’80% o qualsiasi altro numero, per l’Indice di Leva e aspettarsi un risultato che abba senso. E potrebbe non essere così interessante. Il calcolo dell’Indice di Leva richiede accesso alla sequenza punto per punto della partita, senza poi considerare la complessità del codice per la probabilità di vittoria, che lo rende estremamente lungo, anche in presenza dei dati necessari.

Per il momento, la leva non è qualcosa che si riesce a sistemare, ma solo qualcosa di cui possiamo essere consapevoli, come per i numeri sul margine di vittoria che confondono, ad esempio il 24% di Djokovic nella finale di Wimbledon.

Nuove interpretazioni

Al pari di altre statistiche di mia ideazione, non mi aspetto che vi sia di questa un’adozione diffusa. Se, nella migliore delle ipotesi, diventasse un elemento accrescitivo delle valutazioni Elo, sarebbe un utile passo avanti, anche senza dover approfondire ulteriormente. L’obiettivo ultimo è quello di creare indici che raccolgano più dettagli delle nostre intuizioni. Anche se ci siamo abituati alle stranezze del punteggio tennistico, un universo in cui il 52% dei punti vinti totali segnala una partita equilibrata e il 54% non lo fa, non significa che non possiamo fare meglio di così. Pensare in termini di probabilità richiede uno sforzo aggiuntivo, ma quasi sempre fornisce preziosa conoscenza.

Rethinking Match Results as Probabilities