La competitività negli Slam dal 2000 al 2016

Adam Coti // PureFreedom

Pubblicato il 27 settembre 2017 – Traduzione di Edoardo Salvati

Introduzione

Dopo la pubblicazione di una mia analisi sul punteggio nelle partite degli Slam, ho ricevuto diverse richieste per un approfondimento. Ben Rothenberg del New York Times, da cui avevo preso spunto, ha scritto in un tweet: “ [..] curioso anche di sapere quanto spesso il quarto e il quinto set mancano di competitività perché un giocatore ha finito la benzina o è demoralizzato, rispetto a una partita al meglio dei tre set”.  

Ho fatto quindi un’ulteriore analisi sulle oscillazioni in quella categoria di partite. Si può dire che la competitività di una partita subisce variazioni su base regolare? Esiste evidenza che i set conclusivi di una partita sono più appannaggio del vincitore? Inoltre, con il progredire della partita, è possibile prevedere chi è avvantaggiato per la vittoria finale? Le considerazioni che seguono cercano di trovare risposte a questi interrogativi.  

Ai fini di quest’analisi, il campione statistico considerato è composto da tutte le partite Slam terminate per il periodo dal 2000 al 2016, a eccezione dei ritiri precedenti e durante la partita. Si tratta di 8253 partite per complessivi 30.455 set e 298.207 game. Occorre ricordare che in quegli anni gli Slam non avevano il tiebreak all’ultimo set, tranne gli US Open. Questo si traduce in un leggero aumento delle medie relative ai game del quinto set, quando la partita ha richiesto di andare al quinto set.

Medie complessive

IMMAGINE 1 – Punteggio medio in termini di game per set in funzione del numero di set giocati per il periodo dal 2000 al 2016 

Note:

  • il punteggio medio per set non distingue tra chi vince e chi perde la partita, ma è una misura della competitività aggregata di un set medio
  • utilizzando il Differenziale di Punteggio come criterio, si osserva una maggiore disparità nella competitività tra le partite in tre set e quelle in quattro set, rispetto a quella esistente tra le partite in quattro set e quelle in cinque set.

Partite in tre set

IMMAGINE 2 – Punteggio medio in termini di game per partite terminate in tre set per il periodo dal 2000 al 2016

Note:

  • i primi due set mostrano un livello di competitività simile. Il terzo set invece è più dominato dal vincitore della partita. Lo si può dedurre dal salto del Differenziale di Punteggio nel terzo set e dalla continua diminuzione del numero di tiebreak.

Partite in quattro set

IMMAGINE 3 – Punteggio medio in termini di game per partite terminate in quattro set per il periodo dal 2000 al 2016

Note:

  • il punteggio medio per set non distingue tra chi vince e chi perde la partita, ma è una misura della competitività aggregata di un set medio
  • si assiste a una graduale diminuzione della competitività fino al quarto set, che invece mostra, rispetto agli altri set, un maggiore aumento nel Differenziale di Punteggio e una maggiore diminuzione dei tiebreak. 

IMMAGINE 4 – Punteggio medio in termini di game per le possibili combinazioni con cui una partita in quattro set può essere vinta   

Note:

  • a prescindere dall’andamento dei set, il vincitore della partita ha vinto ognuno dei tre set vinti in maniera più risoluta del singolo set vinto dal giocatore che ha perso la partita
  • la combinazione in cui il vincitore della partita ha dominato di più è quella in cui perde il primo set vincendo poi i tre successivi. Ne è conferma il fatto che il Differenziale di Punteggio complessivo pari a 6.10 è il più alto di qualsiasi possibile scenario. Come visto nella precedente analisi sul punteggio, questa è anche la sequenza più frequente tra quelle di una partita in quattro set.  

Partite in cinque set

IMMAGINE 5 – Punteggio medio in termini di game per partite terminate in cinque set per il periodo dal 2000 al 2016

*Nel periodo considerato, a eccezione degli US Open nessuno degli altri Slam aveva il tiebreak al quinto set. Per lo scopo di questa sola analisi, un quinto set che supera il punteggio di 6-6 è classificato come un set al tiebreak.

Note:

  • il punteggio medio per set non distingue tra chi vince e chi perde la partita, ma è una misura della competitività aggregata di un set medio
  • come per le partite in tre e quattro set, si assiste a una diminuzione del livello competitivo al progredire della partita. Lo testimonia il graduale incremento del Differenziale di Punteggio. A prescindere dal set, non si osserva una chiara tendenza relativamente alla probabilità che si arrivi al tiebreak.

IMMAGINE 6 – Punteggio medio in termini di game per le possibili combinazioni con cui una partita in cinque set può essere vinta  

Note:

  • il vincitore della partita ha vinto i suoi tre set in maniera più risoluta con il progredire della partita, giocando meglio nell’ultimo set
  • ci sono tre scenari in cui il vincitore della partita ha vinto gli ultimi due set e sono anche le vittorie più dominanti e quelle in cui il quinto set ha un Differenziale di Punteggio più alto.

Indicatori predittivi

Quando la partita arriva a una situazione di punteggio di due set pari, il rendimento dei giocatori nei primi quattro set è in qualche modo indicativo di chi vincerà il quinto set? Vale a dire, se uno dei giocatori ha vinto più game dell’avversario all’inizio del quinto set, ha storicamente un vantaggio per la vittoria finale?  

IMMAGINE 7 – Probabilità di vincere la partita all’inizio del quinto set in funzione Differenziale di Game per il periodo dal 2000 al 2016

Note:

  • se un giocatore ha vinto più game dell’avversario all’inizio del quinto set, vince il 55% di quelle partite, con percentuali specifiche indicate nel grafico in funzione del numero di game in più rispetto all’avversario. Ad esempio, se dopo quattro set il punteggio è di 6-2 4-6 6-1 3-6 e un giocatore è avanti 19–15 nei game, storicamente vincerà poi quella partita il 61% delle volte
  • nel 15.1% delle partite al quinto set, i giocatori hanno vinto lo stesso numero di game e non si è quindi nella possibilità di fare una previsione 
  • il punteggio di una partita consente di aver vinto nove o dieci game in più dopo quattro set, ma nel periodo temporale considerato per l’analisi non è mai accaduto.

Cosa succede quando i giocatori hanno vinto un set per parte? Con un campione di due soli set, si può fare una previsione di vittoria sulla base del numero di game vinti fino a quel momento?

IMMAGINE 8 – Probabilità di vincere la partita sul punteggio di un set pari in funzione Differenziale di Game per il periodo dal 2000 al 2016

Note:

  • se un giocatore ha vinto più game dell’avversario dopo due set, vince il 58% di quelle partite, con percentuali specifiche indicate nel grafico in funzione del numero di game in più rispetto all’avversario
  • nel 24.6% delle partite sulla situazioni di un set pari, il numero di game vinti è identico e non si è quindi nella possibilità di fare una previsione
  • nonostante un campione di partite più ridotto, si tratta di un indicatore predittivo più accurato di chi vincerà la partita rispetto alla situazione vista in precedenza.

Distribuzione dei tiebreak

IMMAGINE 9 – Distribuzione dei tiebreak per il periodo dal 2000 al 2016

Note:

  • su un totale di 4915 tiebreak, il punteggio medio è stato 7,48—4,32.

Riconoscimenti

La fonte della maggior parte dei dati grezzi utilizzati nell’analisi è il database dei risultati delle partite del circuito maschile compilato e messo a disposizione da Jeff Sackmann. In caso di dati mancanti, ho fatto riferimento al sito ufficiale dell’ATP. Chi volesse approfondire, può scaricare il file Microsoft Excel con i dati grezzi che ho raccolto. 

Measuring the Competitiveness at Tennis Majors from 2000-2016

Gli effetti della riduzione del numero di teste di serie negli Slam

Adam Coti // PureFreedom

Pubblicato il 18 gennaio 2018 – Traduzione di Edoardo Salvati

Introduzione

Prima dell’inizio degli Australian Open 2019, sembrava che, dopo diciotto anni di stabilità, il numero di teste di serie negli Slam sarebbe stato ridotto della metà, da 32 a 16. In questo modo, le fasi iniziali del torneo avrebbero avuto partite più competitive. In prospettiva storica, sarebbe stato davvero così? Con un ritorno a tabelloni a 16 teste di serie, ci sarebbero state più vittorie a sorpresa nei primi turni? 

L’analisi che segue riguarda 30.408 partite maschili e femminili negli Slam nel periodo dal 1988 al 2017, nella volontà di trovare una risposta. Inoltre, sarebbe utile cercare di capire quanto spesso le teste di serie più alte o giocatori o giocatrici con classifica più alta riescono effettivamente a vincere in qualsiasi delle loro partite Slam. Sulla probabilità di un favorito di vincere incide il turno in cui si gioca la partite? I giocatori favoriti hanno più probabilità di vincere delle giocatrici favorite? Tre tabelle nella parte conclusiva dell’analisi forniscono qualche chiarimento al riguardo. 

La frequenza di vittoria delle teste di serie per turno di gioco

Dal 1988, quando gli Australian Open hanno allargato il tabellone principale a 128 giocatori, fino al Roland Garros 2001, ci sono stati 54 Slam con 16 teste di serie, rispetto ai 66 Slam fino a tutto il 2017 con 32 teste di serie. Per facilitare un confronto più immediato, i risultati di quest’ultimo gruppo sono stati suddivisi in due sottoinsiemi di teste di serie, 1—16 e 17—32.

È importante notare che questi dati rappresentano medie basate sull’esito di tutte le partite negli Slam. Non si considera come è stato ottenuto il passaggio del turno, se da una vittoria o con un ritiro prima o durante la partita. Si tratta semplicemente del calcolo di quanti giocatori di ciascuna categoria sono rimasti dopo ogni turno. 

Tabellone Maschile

IMMAGINE 1 – Prime 16 teste di serie del tabellone maschile rimaste dopo ciascun turno, dal 1988 al 2017

Note:

  • per gli Slam con 16 teste di serie, il campione è composto da 6858 partite, mentre per gli Slam con 32 teste di serie è di 8382 partite
  • in media, un tabellone di 16 teste di serie ha avuto circa una testa di serie vittoriosa in meno dopo il primo e il terzo turno 
  • la discrepanza più ampia è al secondo turno, come mostrato anche dalla distanza maggiore tra le due linee del grafico
  • dal quarto turno in avanti, l’impatto della riduzione delle teste di serie diminuisce gradualmente.

Tabellone Femminile

IMMAGINE 2 – Prime 16 teste di serie del tabellone femminile rimaste dopo ciascun turno, dal 1988 al 2017

Note:

  • per gli Slam con 16 teste di serie, il campione è composto da 6858 partite, mentre per gli Slam con 32 teste di serie è di 8382 partite
  • l’impatto complessivo del numero di teste di serie non è così rilevante come tra gli uomini, come mostrato da una distanza più ravvicinata tra le due linee del grafico 
  • le discrepanze più importanti, e quasi identiche, sono nel terzo e nel quarto turno.

La competitività delle partite degli Slam

In ogni partita di uno Slam, il favorito può essere determinato in modo oggettivo o tramite le teste di serie o in termini di classifica ufficiale. Vale a dire, se giocano due teste di serie, il giocatore con la testa di serie più alta è il favorito. Se invece giocano due giocatori fuori dalle teste di serie, il favorito è quello con la classifica più alta. In ultimo, se una testa di serie gioca contro un giocatore senza testa di serie, il favorito è la testa di serie. 

Sulla base di queste premesse, quanto spesso il giocatore favorito vince poi la partita in uno Slam? Le tabelle che seguono illustrano la tematica per anno, torneo e turno. 

Per Anno

IMMAGINE 3 – Percentuale di vittoria di favoriti e favorite negli Slam per anno, media mobile di tre anni dal 1988 al 2017

Note:

  • per ciascun anno il campione include tutti gli Slam per un totale di 508 partite per il tabellone maschile e per quello femminile 
  • la frequenza di vittoria del favorito e della favorita si è mossa, generalmente, in direzione opposta nell’ultimo decennio
  • per gli uomini, il punto di flesso si è verificato intorno alla fine degli anni ’90, quando a un declino costante del rendimento dei favoriti è seguito l’inizio di una tendenza di stabile risalita.
  • per le donne, nell’ultimo decennio la percentuale di vittoria delle favorite si è attestata su un declino costante.

Per Torneo

IMMAGINE 4 – Percentuale di vittoria di favoriti e favorite negli Slam per torneo, dal 1988 al 2017

Note:

  • per ciascuno Slam, il campione di partite è di 3810 per tabellone maschile e per tabellone femminile
  • per le donne, le favorite vincono più spesso agli US Open, mentre è al Roland Garros che si verifica il maggior numero di vittorie a sorpresa
  • per gli uomini, i favoriti vincono più spesso agli Australian Open, mentre è a Wimbledon che subiscono più sconfitte a sorpresa.

Per turno

IMMAGINE 5 – Percentuale di vittoria di favoriti e favorite negli Slam per turno, dal 1988 al 2017

Note:

  • le favorite vincono con più continuità nei primi turni rispetto agli uomini, anche se poi sono soggette a più sconfitte in semifinale e finale
  • il turno in cui i favoriti vincono più spesso è il quarto, mentre per le donne è il terzo.

Riconoscimenti

La fonte della maggior parte dei dati grezzi utilizzati nell’analisi è il database dei risultati delle partite del circuito maschile compilato e messo a disposizione da Jeff Sackmann. In caso di dati mancanti, ho fatto riferimento al sito ufficiale dell’ATP e della WTA. Chi volesse approfondire, può scaricare il file Microsoft Excel con i dati grezzi che ho raccolto. 

The Effect of Reducing the Number of Seeds at Tennis Majors

Uno studio sulle partite Slam 2000-2016 attraverso l’analisi del punteggio

Adam Coti // PureFreedom

Pubblicato il 28 luglio 2017 – Traduzione di Edoardo Salvati

Introduzione

Per più di cento anni, le partite del tabellone di singolare maschile si sono giocate al meglio dei cinque set. Un intenso dibattito sui social media e su altri canali è sorto relativamente ai meriti dell’adozione di un format al meglio dei tre set. Ben Rothenberg del New York Times, tra i maggiori sostenitori della necessità di accorciare le partite, ne ha scritto – ormai cinque anni fa – illustrando la sua posizione. Per una tematica che genera opinioni così appassionate è però raro il riferimento a statistiche concrete. 

Spinto da curiosità personale, ho analizzato il punteggio di tutte le 8253 partite disputate negli Slam nel periodo dal 2000 al 2016, a esclusione dei ritiri pre- (walkover) e durante la partita (retirement). Ho poi confrontato i dati in termini di anno, sede del torneo, turno e durata delle partite. Questi sono i risultati più interessanti che ho trovato.

Risultati complessivi

I grafici che seguono si basano su tutte le partite completate negli Slam nel periodo tra il 2000 e il 2016, a esclusione dei ritiri prima e durante la partita (nella versione originale, è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). In totale, sono 8253 partite. In tabella, la Prima Settimana comprende i primi tre turni, la Seconda Settimana le partite dagli ottavi di finale in avanti. 

1. Quanti set dura in media una partita?

In media, una partita dura 3.69 set.

IMMAGINE 1 – Ripartizione delle partite completate in funzione del numero di set giocati, 2000-2016

Note:

      • Complessivamente, quasi la metà esatta delle partite termina con una vittoria in tre set
      • La quantità di partite che si concludono in tre set diminuisce nella Seconda Settimana, durante la quale si assiste a un numero maggiore di partite in quattro e in cinque set

2. Qual è la ripartizione di queste partite?

La tabella riepiloga le dieci possibili combinazioni di punteggio e la loro frequenza assoluta e relativa.

Note:

      • Il giocatore che vince i primi due set vince poi il 93.86% delle partite
      • Il giocatore che vince il primo set vince poi il 78.09% delle partiteSe i primi due set terminano in parità, il vincitore del terzo set vince poi l’80.59% delle partite
      • A parità di condizioni, il vincitore in cinque set di una partita avrebbe perso il 10.59% delle volte se la stessa partita si fosse giocata al meglio dei tre set
      • Il punteggio in quattro set più frequente è quello in cui il vincitore perde il primo set per poi vincere i tre successivi
      • Il punteggio in cinque set più frequente è quello in cui il vincitore perde i primi due set per poi vincere i tre successivi

3. Quanto dura in media una partita?

La durata media di una partita è di 2 ore e 28 minuti.

IMMAGINE 2 – Durata media di una partita per numero di set giocati, 2000-2016

Note:

      • La durata media di un set è di 39 minuti e 58 secondi
      • La durata media di una partita aumenta di 12 minuti nella Seconda Settimana rispetto alla Prima Settimana

Risultati per singolo torneo dello Slam

Nelle tabelle che seguono, i risultati relativi al periodo tra il 2000 e il 2016 sono ulteriormente suddivisi per i quattro Slam, nell’ordine in cui si presentano nel calendario.

1. Quanti set dura in media una partita?

IMMAGINE 3 – Suddivisione delle partite completate in funzione del numero di set giocati e per torneo Slam, 2000-2016

Note:

      • Wimbledon ha la percentuale più bassa di partite in tre set, il Roland Garros la percentuale più alta
      • Gli US Open hanno la percentuale più alta di partite in quattro set e la percentuale più bassa di partite in cinque set
      • Se si dà credito alla saggezza popolare tennistica in merito alla velocità relativa delle superfici, allora la percentuale di partite che terminano in tre set è correlata alla velocità della superficie

2. Quanto dura in media una partita?

IMMAGINE 4 – Durata media di una partita per torneo Slam, 2000-2016

Note:

      • Nonostante gli US Open siano l’unico dei quattro Slam a prevedere il tiebreak all’ultimo set, la durata media del quinto set è superiore di 6 minuti rispetto alla durata media del quinto set a Wimbledon
      • Wimbledon è il torneo con il minor numero di partite che terminano in tre set ma, in media, le partite sono le più rapide

3. Quante volte un giocatore si ritira prima o durante la partita?

Il 4.43% delle partite prevedono un ritiro del giocatore prima o durante la partita.

IMMAGINE 5 – Percentuale di ritiri prima o durante la partita per torneo Slam, 2000-2016

Tendenze significative

Le seguenti tabelle mostrano la variazione dei risultati nel tempo. Ho utilizzato una media mobile di tre anni per livellare le fluttuazioni di breve periodo e mettere in evidenza eventuali tendenze di lungo periodo.

1. Quanti set dura in media una partita?

IMMAGINE 6 – Suddivisione per numero di set giocati con media mobile di tre anni, 2000-2016

IMMAGINE 7 – Numero medio di set giocati per partita con media mobile di tre anni, 2000-2016

2. Quanto dura in media una partita?

IMMAGINE 8 – Durata media di una partita con media mobile di tre anni, 2000-2016



Note:

      • Nel tempo, la percentuale delle partite in tre set è aumentata, in corrispondenza di una diminuzione della percentuale delle partite in quattro set quasi dello stesso valore
      • Pur in presenza di una leggera diminuzione del numero medio di set giocati per partita, è cresciuta la durata delle partite

Ringraziamenti

La fonte della maggior parte dei dati grezzi utilizzati nell’analisi è il database dei risultati delle partite del circuito maschile compilato e messo a disposizione da Jeff Sackmann. In caso di dati mancanti, ho fatto riferimento al sito ufficiale dell’ATP. Chi volesse approfondire, può scaricare il file con i dati grezzi che ho raccolto.

An Analysis of Scorelines at Tennis Majors from 2000-2016