La probabilità di doppi decisivi nella nuova Coppa Davis

di Jeff Sackmann // TennisAbstract

Pubblicato il 28 novembre 2019 – Traduzione di Edoardo Salvati

Nel nuovo formato della Coppa Davis, ci sono tre partite per ogni sfida tra nazioni, due di singolare e una di doppio. Si giocano per primi i singolari, rendendo quindi possibile che il doppio perda di valore, cioè sia irrilevante ai fini del risultato finale. 

Gli organizzatori delle Finali di Coppa Davis hanno provato a dare più peso al doppio, utilizzando criteri di spareggio (basati sul numero di set e game vinti) per determinare chi, durante la fase a gironi, si qualifica per quella a eliminazione diretta. Se è servito a mantenere interesse iniziale per i doppi irrilevanti, verso la fine dei gironi le squadre matematicamente qualificate non hanno avuto alcun incentivo a giocare il doppio.

In questo modo il Canada ha regalato il punto agli Stati Uniti con un ritiro pre-partita e l’Australia si è ritirata dopo un solo game giocato. Probabilmente era inevitabile, ma non è di certo auspicabile. Si presume che qualunque appassionato di tennis ne desideri sempre di più, e partite interrotte o non giocate potrebbero gettare scompiglio per lo spareggio.  

Sono molti i modi possibili per un ripensamento dell’evento, talmente tanti che evito di approfondirli in questa sede. Siccome i doppi irrilevanti sono inevitabili, vorrei invece analizzare quanto spesso dovremmo aspettarci che si verificano e, considerando che si verificheranno, se effettivamente è un aspetto che mette il doppio in secondo piano rispetto al singolare. 

Doppi ancora vivi

Lo spunto arriva da una domanda per il podcast della settimana scorsa:

La scelta più estrema riguardo ai doppi irrilevanti è semplicemente quella di non giocarli del tutto. Se si optasse per questa soluzione, a quanti doppi assisteremmo? Nelle Finali di Davis Cup a Madrid, ci sono state 25 sfide: 18 nella fase a gironi e 7 in quella a eliminazione diretta. In 12 sfide il doppio è stato determinante: 7 nelle 18 sfide dei gironi e 5 nelle 7 sfide dell’eliminazione diretta. Sulla base della metodologia proposta nel tweet, è all’incirca quanto ci saremmo attesi che accadesse. In media (per entrambe le fasi), una sfida aveva il 43% di arrivare al doppio decisivo, lasciando intendere che 11 partite di doppio sarebbero state importanti. 

La tabella elenca le 25 sfide, insieme alla probabilità di una vittoria a testa nelle prime due partite di singolare. L’ultima colonna indica se il doppio è stato decisivo. Le valutazioni Elo non sono state particolarmente efficaci nel predire quale sfida avrebbe portato a un doppio decisivo, anche se forniscono una buona stima di quanto spesso il doppio farebbe la differenza.

Sfida                 Prob. doppio   Giocato? 
Semi: GBR vs ESP      56.2%          SI  
Quarti: SRB vs RUS    54.3%          SI  
Semi: RUS vs CAN      53.3%          SI  
RR: FRA vs SRB        52.5%          NO  
RR: ARG vs GER        51.6%          NO  
RR: USA vs CAN        51.4%          NO  
RR: ITA vs CAN        50.0%          NO  
Quarti: GBR vs GER    50.0%          NO  
RR: GBR vs KAZ        49.8%          SI  
RR: ESP vs RUS        49.4%          SI  
Quarti: AUS vs CAN    49.4%          SI  
RR: USA vs ITA        48.7%          SI  
RR: BEL vs AUS        46.1%          NO  
RR: KAZ vs NED        46.0%          SI  
RR: CRO vs RUS        45.7%          NO  
RR: GER vs CHI        44.2%          SI  
RR: ARG vs CHI        43.6%          NO  
RR: FRA vs JPN        43.4%          SI  
Finale: CAN vs ESP    40.8%          NO  
RR: GBR vs NED        37.5%          SI  
RR: BEL vs COL        36.2%          NO  
Quarti: ARG vs ESP    34.6%          SI  
RR: SRB vs JPN        26.1%          NO  
RR: AUS vs COL        10.4%          NO  
RR: CRO vs ESP        7.3%           NO

Solo in pochi casi la vittoria in entrambi i singolari era quasi garantita. Anche in presenza di un tabellone molto lungo di 18 squadre, la maggior parte delle rappresentative è riuscita a schierare due solidi giocatori di singolare, e solo poche avevano il lusso di più di un giocatore di élite. 

Dieci anni di storia

Non si è trattato di pura casualità. Ho verificato tutte le sfide del World Group di Coppa Davis (tralasciando i playoff) dal 2010 al 2018 per identificare i due giocatori migliori di ciascuna squadra. Attraverso le loro valutazioni Elo al momento della partita e declinate sul nuovo formato al meglio dei tre set (anziché al meglio dei cinque), ho stimato quanto spesso saremmo di fronte a un doppio decisivo. In quelle 135 sfide, la probabilità media di un doppio decisivo è del 41%, di poco inferiore alla frequenza dell’edizione appena terminata. Escludendo un radicale rovesciamento gerarchico nella geografia del tennis mondiale, abbiamo una valida approssimazione di quanto frequentemente una squadra vince le prime due partite nel nuovo formato della Coppa Davis.

Quanto conta il doppio?

Quando il doppio ha un valore, è decisamente rilevante. Ogni partita di singolare ha la capacità di incidere in modo sostanziale sulla probabilità di ciascuna squadra di vincere la sfida, ma se il doppio entra in gioco, ha un’incidenza totale. Pensiamone in termini di leva, un concetto che solitamente applico a cambiamenti di punteggio durante la partita. Ipotizziamo due squadre equamente competitive e consideriamo la probabilità di vittoria in ogni passaggio del processo. Ogni squadra ha il 50% di probabilità di vincere ogni partita della sfida, che significa:

  • ogni squadra ha il 50% di probabilità di vincere la sfida
  • la squadra che vince la prima partita avrà il 75% di probabilità di vincere la sfida
  • in caso di parità dopo le prime due partite, ogni squadra avrà ancora una volta il 50% di probabilità di vincere la sfida.  

Prendiamo ora la leva di ciascuna partita dalla prospettiva della squadra A:

  • se vince la prima partita, la probabilità di vincere la sfida sale al 75%, altrimenti scende al 25%. Si tratta di un valore di leva del 75% – 25% = 50%
  • supponiamo che vinca la prima partita. Se vince anche la seconda, vince la sfida, una probabilità cioè del 100%. Se perde, scende al 50%. Di nuovo, è un valore di leva del 100% – 50% = 50% (se perde la prima partita, i calcoli sono identici, solo con probabilità del 50% e 0% invece di 100% e 50%) 
  • in presenza di un doppio decisivo, le probabilità all’inizio della partita di vincere la sfida sono del 50%. Con la vittoria del doppio, la probabilità raggiunge il 100%. Perdendo il doppio, la probabilità diventa dello 0%. È un valore di leva del 100% – 0% = 100%.  

Teoria e realtà

Potreste pensare che sia un ragionamento eccessivamente formale e convoluto, ed è difficile darvi torto. Il punto è che, con due squadre equivalenti, il doppio diventa due volte più decisivo. In molti altri sport succede che vi siano giocatori che non vengono coinvolti in tutte le fasi di gioco, subentrando nei momenti critici. Nel baseball ad esempio, con alcuni lanciatori chiamati a chiudere la partita solo in situazioni molto equilibrate. Oppure i kicker nella NFL, che partecipano a poche azioni della partita, ma con la possibilità di segnare molti punti. 

Per i parametri del mio campione d’indagine, il doppio avrà rilevanza esattamente il 50% delle volte, ed è due volte più importante di ognuna delle partite di singolare. Non funziona proprio così nel mondo reale, visto che il doppio è decisivo poco più del 40% delle volte. Però, quando poi il doppio diventa decisivo, ha sempre conseguenze da tutto o niente. Detto altrimenti, ha un valore di leva del 100%. 

Sono d’accordo nel non giocare i doppi irrilevanti. Non sarebbe una decisione che incontra il favore dei doppisti, e temo scatenerebbe le ire dei puristi della Davis. Pensando però alla posta in gioco, la reazione sarebbe più mitigata. In una formula da 16 o 18 squadre, l’equilibrio è sufficientemente distribuito da rendere necessario il doppio quasi nella metà delle volte. E quando si gioca il doppio, gli spesso dimenticati specialisti si trovano in una partita che è, letteralmente!, due volte più decisiva dei singolari che generano il massimo seguito di pubblico.  

The Likelihood of Live Doubles Rubber in the New Davis Cup

Corridoi e colpi a uscire

di Jeff Sackmann // TennisAbstract

Pubblicato l’11 novembre 2019 – Traduzione di Edoardo Salvati

Le Finali NextGen si giocano su un campo anomalo, nel senso che, dovendo ospitare solo partite di singolare, non possiede le linee che delimitano il corridoio del doppio. Praticamente tutti i tornei della stagione prevedono il tabellone del doppio, e quindi raramente è possibile trovare un campo senza i corridoi. Ci sono state in passato edizioni delle Finali di stagione riservate al singolare, ora però l’esclusiva è delle Finali NextGen.

Si può pensare che il particolare disegno delle linee abbia qualche conseguenza sui giocatori?

Ne ho parlato recentemente con Erik Jonsson, e siamo giunti alla provvisoria conclusione che i professionisti (anche i più giovani di loro), grazie alle migliaia di ore di esperienza di gioco, non dovrebbero sentirsi disorientati in un campo diverso dal solito. Perché però fare congetture quando abbiamo dei dati per un’analisi?

Il database del Match Charting Project, che ho creato per raccogliere statistiche punto per punto di partite ufficiali anche con il prezioso aiuto di volontari, è comprensivo di più dettagli relativi agli errori, sia in termini di natura, cioè forzati e non forzati, che di tipologia, cioè in rete, lunghi, esterni o esterni e lunghi. Le Finali NextGen non hanno destato l’immediato interesse dei volontari, tanto che prima dell’edizione 2019 solo la finale del 2018 era stata inserita, su più di 6600 partite totali. Il 2019 però è diverso, perché abbiamo statistiche di 8 delle 15 partite giocate a Milano la settimana scorsa (un grazie sentito a Carrie, che ha seguito l’intero percorso del finalista Alex De Minaur).

La quantificazione degli errori esterni

Ci interessa la frequenza dei colpi che escono ai lati del campo, un calcolo meno semplice di quanto appaia. Ho deciso di limitarmi ai colpi a rimbalzo, escludendo anche gli errori forzati, quelli in cui il giocatore potrebbe non avere un grande controllo sulla direzione della palla.

Questi sono gli indicatori ipotizzabili per la frequenza degli errori esterni:

  • errori esterni per punto (est./punto)
  • errori esterni per errori non forzati (est./ENF)
  • errori esterni per colpi a rimbalzo “fattibili”, cioè colpi a rimbalzo che sono stati errori non forzati o che sono stati rimessi in gioco (est/. rimbalzo)

Il primo indicatore probabilmente eccede in approssimazione, pur avendo il vantaggio della semplicità. Gli errori esterni per errori non forzati potrebbero essere di aiuto nell’indicare in quale direzione il giocatore è stato più aggressivo. L’ultimo, gli errori esterni per colpi a rimbalzo “fattibili”, è forse la rappresentazione più utile al nostro scopo, perché segnala quanto spesso un giocatore ha tirato un colpo che è uscito a lato.

De Minaur e gli altri

La tabella elenca i numeri di De Minaur per le cinque partite delle Finali NextGen 2019, oltre ai numeri complessivi delle altre 28 partite sul cemento nel database, relative agli ultimi due anni.

             Est./Punto  Est./ENF  Est./Rimbalzo   
NextGen      2.7%        1.5%      21.7%  
Cemento ATP  3.0%        1.4%      21.4%

Almeno per De Minaur, il corridoio non sembra fare troppa differenza. Concentriamoci sul gruppo di giocatori leggermente più ampio. Abbiamo otto partite, vale a dire 16 inserimenti di partita se si considerano i singoli giocatori, tra cui almeno una per ognuno degli otto giocatori che si sono qualificati per Milano. La tabella elenca i tre indici per le partite delle Finali NextGen, insieme agli equivalenti valori per le altre partite sul cemento nel database, relative agli ultimi due anni.

             Est./Punto  Est./ENF  Est./Rimbalzo  
NextGen      3.2%        1.8%      19.5%  
Cemento ATP  3.2%        1.8%      23.1%

Per i primi due indici, non c’è alcun effetto tangibile. Con o senza corridoio, gli errori esterni determinano la fine del 3.2% dei punti, e dell’1.8% del totale degli errori non forzati (il 3.2% è per giocatore, quindi i punti che si sono conclusi con un errore esterno sono il 6.4%). Il terzo indice invece è più interessante. Sul circuito questi giocatori commettono un errore esterno nel 23.1% dei colpi a rimbalzo “fattibili”. Nel campo senza corridoio visto a Milano, lo stesso numero è sceso di più di un settimo, al 19.5%. Contestualmente, la frequenza complessiva di errori non forzati (non solo quindi gli errori esterni) è aumentata rispetto a quanto mostrato dagli stessi giocatori sul cemento in altri eventi.

Acuire la mente

Penso a due possibili spiegazioni per un calo così marcato. Primo, non abbiamo molti dati a disposizione, e magari è solo un caso legato a un campione ridotto. In parte si può far risalire alla prestazione di Ugo Humbert, che non ha commesso nemmeno un errore esterno nell’unica sua partita del database alle Finali NextGen (la frequenza tipica di Humber sugli errori esterni è vicina alla media del circuito). In assenza di molte più partite giocate su campi senza corridoio, e di cui naturalmente dovremmo avere statistiche punto per punto, non si riesce a giungere a conclusioni definitive.

Secondo, potrebbe trattarsi di un effetto concreto legato però a qualche aspetto delle condizioni di gioco di Milano. La mancanza del corridoio, come scritto da @furryyelloballs nel suo tweet, potrebbe davvero “acuire la mente”.

Rispetto ad altre misure innovative sperimentate alle Finali NextGen, il campo dedicato al singolare riceve scarso interesse mediatico. Però, a differenza di modifiche come l’appendi asciugamano o il cronometro al servizio, potrebbe avere una conseguenza reale sul gioco, per quanto limitata.

Tramlines and Wide Groundstrokes

I possibili effetti dell’abolizione della prima di servizio o dei punti ai vantaggi

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 16 agosto 2019 – Traduzione di Edoardo Salvati

Delle numerose proposte sotto esame di modifica al regolamento per ridurre la durata delle partite e rendere il tennis un “prodotto” più attraente, la variazione al formato di gioco in uso negli Slam è la più rilevante. In questo articolo, scritto insieme a Francesco Lisi e Matteo Grigoletto del Dipartimento di Scienze Statistiche dell’Università di Padova, si analizza l’impatto della eliminazione della prima di servizio o dei punti ai vantaggi sulla durata delle partite.

Alla ricerca di partite più corte…

Dopo che la finale di Wimbledon 2019 è stata la prima partita terminata con il tiebreak sul 12-12 al quinto set, in molti si sono interrogati sulla bontà delle nuove regole. Quale sia l’opinione su quello specifico cambiamento, il fatto che nel 2019 ogni prova dello Slam abbia avuto un formato di gioco diverso per il tabellone di singolare maschile è senza dubbio indicazione di quanto il potere decisionale nel tennis è preoccupato dalla durata delle partite.

L’introduzione di nuove regole spazia da modifiche di piccolo cabotaggio, come la limitazione delle interruzioni per assistenza medica o il tempo a disposizione per il riscaldamento pre-partita, a modifiche con più sostanziali, come l’alterazione della struttura dei set e dei tiebreak.

Simon Higson, a capo della comunicazione per l’ATP, ha dichiarato che si è nella fase di aggregazione dei commenti dei vari portatori d’interesse, tra cui giocatori, televisioni, giornalisti, sponsor e pubblico, aggiungendo che non verranno prese decisioni prima di aver portato a termine anche il processo di analisi dei dati.

Per mettere alla prova l’efficacia di alcune di queste regole, l’ATP ha creato una competizione apposita, le Finali Next Gen, con partite giocate al meglio dei cinque set ma con set da 4 game, il tiebreak sul 3-3, senza punteggio ai vantaggi, senza ripetizione se la palla tocca il nastro in battuta e con un cronometro al servizio di 25 secondi. Questo formato, chiamato Fast4, riduce drasticamente la durata delle partite, ma è stato oggetto di critiche perché modifica completamente la struttura tradizionale dei set ed è spesso percepito tanto dai giocatori quanto dal pubblico come “un altro sport”. È possibile quindi introdurre dei cambiamenti che riducano la lunghezza delle partite mantenendo però invariate le caratteristiche portanti del sistema di punteggio?

…senza stravolgere il sistema di punteggio

Credo che, di fondo, ci siano tre possibilità: eliminare i vantaggi, eliminare la seconda di servizio, eliminare entrambi. La logica sottostante è che verrebbe fortemente limitato il dominio del servizio. Per capire meglio il concetto, l’immagine 1 mostra il numero medio di ace a partita per anno, e l’immagine 2 la percentuale media di partite che hanno richiesto uno o più tiebreak per anno nel periodo tra il 1990 e il 2018. La tendenza in questi grafici (misurata dalle curve di regressione non parametriche in rosso) suggerisce che all’aumentare della potenza del servizio è cresciuto anche il numero di game al servizio.

IMMAGINE 1 – Numero medio di ace a partita per anno, ATP

IMMAGINE 2 – Percentuale media di partite con tiebreak all’anno

Difficile stabilire l’impatto di questi cambiamenti, visto che non si giocano al momento partite in cui è introdotta solo una delle due variazioni.

Valutare le ipotesi con l’aiuto delle simulazioni

Possiamo però fare un passo avanti usando le simulazioni, il cui scopo è dimostrare in che modo la probabilità distributiva della durata delle partite cambierebbe in funzione del tipo di modifica. Sia Kovalchik e Ingram (2018) [1] che Lisi e Grigoletto [2] hanno implementato due simulatori per la durata delle partite. Nel secondo simulatore, sono state eseguite simulazioni per 20 mila partite al meglio dei cinque set con il seguente formato di gioco: 1) quello tradizionale, 2) quello tradizionale senza i punti ai vantaggi sul 40-40, 3) quello tradizionale ma con un solo servizio, 4) quello tradizionale senza vantaggi e un solo servizio.

Per ipotizzare una partita con un solo servizio è necessario considerare le conseguenze sul rendimento del giocatore al servizio dell’abolizione della regola della prima e della seconda. Si può prendere a riferimento quanto espresso da Klaassen e Magnus (2014) [3]: un giocatore con un solo servizio è equivalente a un giocatore con due servizi che ha sbagliato il primo. Con un solo servizio, un giocatore dovrebbe quindi usare la sua seconda di servizio, e non una via di mezzo tra una prima e una seconda. Eliminando la prima di servizio, la simulazione utilizza solo dati sul rendimento sulla seconda per stabilire i parametri che determinano i probabili esiti al servizio.

Parametri

La costruzione e impostazione del simulatore richiede le seguenti informazioni: categoria del torneo (Slam, Masters 1000, ATP500, ATP250), superficie, turno, punteggio finale, durata, numero di ace, numero di doppi falli, numero di prime e seconde, numero di prime e seconde valide, percentuale di punti vinti sulla prima e sulla seconda, punti totali vinti, distribuzione della velocità della palla e distribuzione del numero di scambi per ciascun punto. Per quest’ultima variabile i dati arrivano dal Match Charting Project, mentre per la velocità della palla il riferimento è a questo articolo per il dritto e a questo per il rovescio. Tutti gli altri dati sono presi da OnCourt.

Le partite considerate risalgono al periodo da gennaio 2011 a dicembre 2018, con l’esclusione di quelle senza indicazione della durata, delle Olimpiadi, delle Finali Next Gen, dei ritiri pre e durante la partita. Il campione è così composto da 3744 partite al meglio dei cinque set e 16246 al meglio dei tre set.

IMMAGINE 3 – Stima kernel di densità della durata delle partite

L’immagine 3 mostra la stima kernel di densità della distribuzione della durata insieme alla durata media. Le gobbe nella coda di destra di entrambe le distribuzioni sono dovute al numero diverso di set con cui può terminare una partita.

Esiti

La tabella elenca i valori di alcuni specifici quantili, dalla mediana (Q50) al 99.9% (Q999). La durata mediana è di 92 minuti per le partite al meglio dei tre set (media di 98 minuti) e 142 minuti per le partite al meglio dei cinque set (media di 150 minuti).

La tabella che segue elenca gli esiti in termini di durata e probabilità media di partite che durano più di k ore. Si basano su 20 mila partite al meglio dei cinque set. La stima dei parametri del modello ricomprende solo dati dagli Slam.

Emerge che sia il formato senza vantaggi che quello con un solo servizio sono efficaci per ridurre la probabilità che le partite durino più di tre ore, con l’effetto maggiore generato da un solo servizio a disposizione. In dettaglio, la probabilità che una partita al meglio dei cinque set vada oltre le tre ore è di circa il 25% con il formato tradizionale, ma si riduce a circa il 15% con l’abolizione dei vantaggi sul 40-40 e a circa il 10% eliminando un servizio. La riduzione è ancora più marcata se sono introdotte entrambe le modifiche, con la probabilità di più di tre ore che diventa solo del 4.1%. Oltre a essere più brevi, è risaputo che partite con il formato ridotto comportano anche un aumento del numero di vittorie a sorpresa, e quindi dell’incertezza del risultato finale.

Il caso della finale maschile di Wimbledon 2019

Prendiamo ora la finale maschile di Wimbledon 2019, in cui Roger Federer e Novak Djokovic sono rimasti in campo 297 minuti. Sulla base del simulatore, che durata ci saremmo dovuti aspettare per ciascuno dei 4 scenari? È stata eseguita una simulazione su 20 mila partite considerando solo la distribuzione degli scambi sull’erba e le probabilità stimate sulle precedenti partite tra i due. La tabella elenca la durata attesa e la probabilità che la partita superasse le k ore.

Sia nello scenario senza vantaggi che in quello di un solo servizio la durata media non cambia in misura rilevante, ma in entrambi i casi diminuisce con decisione la probabilità di una partita molto lunga. Ad esempio, la probabilità che una partita duri più di quattro ore e mezza è, con le regole di punteggio attuali, dell’1.7%. Pur essendo una probabilità estremamente ridotta, non è comunque del tutto marginale. Con il formato senza vantaggi, si riduce di quasi cinque volte, con quello di un solo servizio di più di quattro volte. Da un punto di vista statistico quindi, sono due cambiamenti i cui effetti non si discostano e la scelta tra i due potrebbe avvenire in funzione della preferenza dei giocatori. Eliminare contestualmente i vantaggi e un servizio sembra invece avere conseguenze eccessive e non è forse così necessaria.

Note:

[1] Kovalchik, S. A., & Ingram, M. (2018) “Estimating the duration of professional tennis matches for varying formats”, Journal of Quantitative Analysis in Sports, 14(1), 13-23

[2] Lisi, F. & Grigoletto, M. (2019) “Modeling and simulating durations of professional tennis matches by resampling match features” (In revisione) 

[3] Klaassen, F., & Magnus, J. R. (2014) “Analyzing Wimbledon: The power of statistics”, Oxford University Press, USA

Possible Effects of Abolishing First Service or Advantage Points

Una breve spiegazione sull’arrivo in volata alla Laver Cup

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 24 settembre 2019 – Traduzione di Edoardo Salvati

Nella terza edizione della Laver Cup, il Resto del Mondo si è avvicinato — come mai era riuscito — a battere l’Europa, che ancora una volta ha dimostrato di essere una potenza. Indietro nel punteggio per 5-7 al termine della seconda giornata, con la vittoria delle prime due partite della terza giornata il Resto del Mondo ha ristabilito l’equilibrio lasciando l’esito della sfida incerto fino all’ultimo. La situazione non sembrava chiara per i telecronisti, aperti alla possibilità di una tredicesima partita tra le due squadre. Vediamo perché non sarebbe potuto accadere e quali condizioni si sarebbero invece dovute verificare per arrivare alla partita decisiva.

La Laver Cup non ha una lunga tradizione, quindi parlare di tendenze può non avere molto senso. Abbandonando temporaneamente i rigidi dettami statistici, è curioso notare che il Resto del Mondo si è migliorato o ha eguagliato sé stesso al termine della seconda giornata in ciascuno dei tre anni. Gli 11 punti vinti in Svizzera sono a oggi il bottino più ampio. Escludendo la conquista del trofeo, il Resto del Mondo potrebbe superare questo traguardo con 12 punti alla fine delle partite della terza giornata forzando la sfida conclusiva, uno scenario che però non si è mai verificato.

Forzare la partita decisiva

Alcuni dei commenti televisivi hanno lasciato intendere che si sarebbe comunque sempre potuti arrivare alla partita decisiva. Non è la prima inesattezza numerica sentita durante una telecronaca, ma si è portati a pensare che la semplice addizione multipli di 3 al punteggio del Resto del Mondo alla fine della seconda giornata avrebbe evitato un errore di quel tipo.

Gli affezionati lettori di questo blog non avranno alcun problema nel realizzare che ci sono solo una manciata di punteggi dalle partite della seconda giornata che possono generare una parità di 12-12 dopo la dodicesima partita della terza giornata. E cioè:

  • 0-12
  • 3-9
  • 6-6
  • 9-3
  • 12-0

Meno immediato è capire quanto probabile fosse ciascuno di essi a Ginevra. Tenendo conto delle valutazioni specifiche per il cemento dei giocatori scelti per il singolare e il doppio nella prima e seconda giornata, il grafico dell’immagine 1 mostra tutte le combinazioni di punteggio possibili per il Resto del Mondo alla fine della seconda giornata, con la relativa probabilità.

Complessivamente, la probabilità che il Resto del Mondo fosse su uno dei cinque punteggi che avrebbe condotto a una partita decisiva era del 33%. Il più probabile era il 3-9, con il Resto del Mondo senza i favori del pronostico in tutti i singolari ma favorito in tutti i doppi.

È interessante notare che il punteggio effettivamente raggiunto (5-7) era, con il 17%, appena meno probabile del 3-9 su cui si sarebbero potuti trovare. Sicuramente la prima vittoria in singolare di Jack Sock (contro Fabio Fognini per 6-1 7-6, n.d.t.) per il Resto del Mondo deve essere tra le più grandi sorprese della competizione.

IMMAGINE 1 – Probabilità attesa per ogni combinazione di punteggio del Resto del Mondo alla fine della seconda giornata, sulla base di 50.000 simulazioni di risultato dalle partite effettive della prima e seconda giornata

Recuperare dallo 0-12?

Quando il Resto del Mondo ci riproverà a Boston, nella quarta edizione della Laver Cup nel 2020, guarderò con attenzione se saranno in grado di fare meglio di 5 punti dopo la seconda giornata e di 11 dopo la terza.

E spero di essere ancora in salute quando una delle due squadre recupererà uno svantaggio di 0-12 per giocarsi tutto nella partita finale. Con i giocatori presenti quest’anno, sarebbe successo solo in 6 delle 50.000 simulazioni della competizione. Temo ci sarà un po’ da aspettare per questo scenario. Per la prima partita decisiva invece, l’anno prossimo potrebbe essere quello giusto.

A Short Explainer on Getting to a Laver Cup Decider

Come Medvedev e Berrettini hanno gestito la pressione agli US Open

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 13 settembre 2019 – Traduzione di Edoardo Salvati

Con il grande risultato ottenuto agli US Open, Daniil Medvedev e Matteo Berrettini hanno mostrato che il futuro del tennis maschile è luminoso. In questo articolo, analizzo il rendimento delle due giovani stelle in termini di pressione punto per punto a ogni turno del loro cammino.

Dopo la conclusione dell’ultimo Slam dell’anno, è tempo di riflessioni su quanto emerso a Flushing Meadows e sulla direzione che il tennis potrebbe intraprendere. L’incredibile progressione di Medvedev e Berrettini è al centro dell’attenzione, anche perché ha alimentato le aspettative di un possibile argine al dominio dei Grandi Tre almeno da parte di alcuni giocatori della Next Gen. Alla luce del clamore suscitato, mi interessava indagare un aspetto della prestazione che solitamente non riceve l’approfondimento che merita, vale a dire la pressione generata da ciascun punto.

La pressione per Berrettini

La pressione punto cattura quanto un giocatore ha da perdere in un qualsiasi punto. Per natura, può variare tremendamente nel corso della partita, specialmente se è di durata e intensità rilevanti come in alcune delle maratone che Medvedev e Berrettini hanno dovuto affrontare a New York.

L’immagine 1 mostra la variazioni della pressione che Berrettini ha dovuto fronteggiare (linea tratteggiata) e la media dei punti pressione vinti (linea continua). In tutti i set giocati, Berrettini si è trovato con una pressione media del 2% per set e una frequenza di punti pressione vinti del 51.5%. Pressione e frequenza sono standardizzate sulla base della media del giocatore e sulla deviazione standard set per set, in modo da capire più facilmente quando ha avuto un rendimento superiore o inferiore alle sue medie del torneo.

Il quinto set nel quarto di finale

Il set più carico di pressione per Berrettini è stato quello decisivo nel quarto di finale contro Gael Monfils — che è anche per lui l’unica partita del torneo andata al quinto — vinto al tiebreak per 7 punti a 5 e con una pressione media del 6.5%. La frequenza di vittoria dei punti pressione è stata in quel set del 54.2%, la seconda più alta come rendimento nei cinque set a maggior pressione, dietro al primo posto occupato dal 55% maturato nel secondo set di quella stessa partita, dopo che Berrettini aveva perso il primo.

IMMAGINE 1 – Pressione fronteggiata (media mobile) e media (mobile) dei punti pressione vinti per set nelle partite di Berrettini agli US Open 2019

È interessante notare quanto è variata la percentuale di trasformazione dei punti pressione di Berrettini nella partita contro Monfils. In particolare, il quinto set ha alternato momenti di egregia maestria, come il sesto game in cui Berrettini ha strappato il servizio a zero, a momenti di cedimento, come il nono game con il doppio fallo sul match point e il conseguente break di Monfils.

Se si prende il primo set della semifinale contro Nadal, Berrettini ha gestito la pressione con ben maggiore continuità e forza mentale rispetto al set decisivo contro Monfils. E questo è valido anche per i punti che hanno determinato l’esito di quel tiebreak, in cui Berrettini è stato in grado di mantenere un rendimento sui punti pressione superiore alla media pur avendo poi perso il set. Nel tiebreak vinto contro Monfils è riuscito a prevalere solo di stretta misura.

Come sono i risultati sotto pressione di Medvedev al confronto?

Al pari di Berrettini, anche Medvedev si è trovato con una pressione media del 2% per set, avendo però avuto complessivamente una migliore frequenza media di trasformazione del 54%. Nessuno dei set giocati da Medvedev ha raggiunto il livello di pressione del quinto set tra Berrettini e Monfils, ma il quinto set contro Nadal ci è andato molto vicino, con una pressione media del 4%.
Dei 7 set a più alta pressione giocati da Medvedev, il quinto contro Nadal è stato l’unico in cui la trasformazione dei punti pressione è scesa sotto il 50%, fermandosi al 46%.

L’andamento della trasformazione dei punti pressione set per set dell’immagine 2 suggerisce un miracoloso ribaltamento iniziato per Medvedev a metà del terzo set. Cosa sia riuscito a fare da li in avanti per rimanere in partita e come mai quella carica è poi svanita in modo così drammatico a metà del quinto set rimane un mistero. Si vede però che il cedimento nella frequenza di trasformazione di Medvedev nel quinto set contro Nadal è coinciso con l’aumento vertiginoso della pressione. Non era la prima volta nel torneo di una situazione a così alta pressione per Medvedev. Ci si era ritrovato ad esempio nel tiebreak del terzo set contro Feliciano Lopez, vinto per 9 punti a 7, in cui è riuscito a rimanere nella media dei punti pressione vinti nonostante l’estremo equilibrio.

Risposte da trovare prima della stagione 2020

Non sapremo mai se è stata la circostanza, l’affaticamento o semplicemente un congiunzione sfortunata in quegli ultimi punti della finale. La convinzione di poter diventare un campione Slam che Medvedev sembra possedere dovrà necessariamente trovare una risposta a queste domande all’approssimarsi della stagione 2020.

IMMAGINE 2 – Pressione fronteggiata (media mobile) e media (mobile) dei punti pressione vinti per set nelle partite di Medvedev agli US Open 2019

How Medvedev and Berrettini Dealt with Pressure at the US Open

Verso una nuova distribuzione d’età bimodale agli US Open

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 6 settembre 2019 – Traduzione di Edoardo Salvati

Con due giocatori e due giocatrici di età inferiore ai 23 anni nelle semifinali degli US Open, stiamo assistendo alla prima ondata di una nuova dominante generazione negli Slam?

È da diverso tempo ormai che la presa di potere dei trentenni è l’argomento più dibattuto nel tennis. C’è estrema familiarità relativa alle statistiche sulla predominanza di giocatori con almeno 30 anni nelle fasi finali degli Slam, statistiche generate in larga parte (anche se non totalmente) dai Grandi Tre tra gli uomini e da Serena Williams tra le donne.

Se la generazione di giocatori nati all’inizio degli anni ’90 ha quasi perso le speranze di rubare uno Slam dalla bacheca dei Grandi Tre, gli US Open 2019 sono stati palcoscenico dei primi forti segnali che la generazione immediatamente successiva — cioè i giocatori nati a metà o verso la fine degli anni ’90 — farà di tutto per interrompere la siccità di titoli.

Matteo Berrettini, 23 anni, ha perso in semifinale contro Rafael Nadal e Daniil Medvedev, anche lui ventitreenne, è riuscito a fare meglio di un turno, dovendosi però poi arrendere al quinto set sempre contro Nadal in finale. Fosse uno dei due riuscito nel risultato a sorpresa, per la prima volta dopo undici Slam si sarebbe avuto un vincitore diverso da Novak Djokovic, Roger Federer o Nadal. E sarebbe stata la prima volta di un giocatore sotto i 23 anni a vincere uno Slam da quando Djokovic ha conquistato gli Australian Open 2011.

Uomini

Già comunque arrivare nei quarti di finale è stata un’impresa ragguardevole. Ne è prova il confronto tra la distribuzione d’età dell’edizione 2019 e quella delle edizioni passate: spiccano due evidenti mode a 23 anni e 33 anni. Serve tornare indietro fino al 2003 per trovare una situazione in cui il valore dell’età era polarizzato così in basso e così in alto allo stesso tempo. Quell’anno infatti Andre Agassi (33) raggiunse la semifinale, Younes El Aynaoui (32) perse ai quarti di finale e un gruppo di ventunenni ottenne un risultato simile o migliore, tra cui Guillermo Coria, David Nalbandian e Andy Roddick, che vinse poi il torneo.

IMMAGINE 1 – Composizione dell’età di giocatori e giocatrici che hanno raggiunto i quarti di finale degli US Open nel periodo dal 2000 al 2019

Donne

Tra le donne, si è già osservato un ciclo simile. Il più recente divario tra mode è stato agli US Open 2015, probabilmente una delle edizioni più strane del tabellone di singolare femminile, a partire dalla sconfitta inattesa di Williams contro Roberta Vinci, oltre alla finale tutta italiana tra la stessa Vinci (32) e Flavia Pennetta (33). Viste le peculiarità del 2015, forse è meglio guardare al 2014 come inizio del cambiamento arrivato a maturazione nel 2019. È stato l’anno infatti in cui Belinda Bencic ha raggiunto i quarti di finale a 17 anni.

Ora ventiduenne, Bencic nel 2019 ha perso la semifinale con un’altra giovanissima, Bianca Andreescu (19), vincitrice poi del torneo contro Williams, che ha rappresentato chiaramente un’eccezione in termini di età. Il 2019 infatti è il primo anno dal 2011 in cui solo una giocatrice sopra i 30 anni ha raggiunto i quarti di finale.

Tra gli uomini invece sono cinque le edizioni consecutive in cui 3 o 4 dei giocatori nei quarti di finale hanno avuto almeno trent’anni. Si dovesse verificare un andamento che rispecchia quanto accaduto tra le donne, quel tipo di sequenza sarà solo un ricordo del passato.

Ages at the US Open are Getting Bimodal, Again

La fortuna del sorteggio: US Open 2019 (donne)

di Chapel Heel // HiddenGameOfTennis

Pubblicato il 26 agosto 2019 – Traduzione di Edoardo Salvati

Come per gli uomini, anche per le donne ho eseguito una simulazione (con la mia variante Elo) di 100.000 configurazioni del tabellone principale, utilizzando lo stesso metodo che gli organizzatori usano per assegnare alle giocatrici la loro posizione. L’ho poi confrontata con la previsione per il torneo su base Elo rispetto al tabellone effettivo.

La tabella mette a confronto la previsione effettiva del tabellone con i risultati dalle simulazioni di rimescolamento dell’intero campo partecipanti (a eccezione delle teste di serie numero 1 e 2, naturalmente), in modo da avere alcune indicazioni sull’accessibilità del tabellone effettivo rispetto alle altre configurazioni. Tonalità di rosso (e arancione) evidenziano la sfortuna della giocatrice. Al contrario, tonalità di verde rappresentano la fortuna ricevuta nel tabellone effettivo, in riferimento a un particolare turno. Il giallo simboleggia neutralità, e si può di fatto ignorare qualsiasi valore superiore o inferiore allo 0.2%.

Per una presentazione più compatta rispetto al passato, ho riportato nella tabella solo le teste di serie, e organizzato nella tabella successiva quelle giocatrici fuori dalle teste di serie per le quali c’è stata un’incidenza degna di nota (almeno l’1% di segno positivo o negativo).

Tabellone effettivo e simulato a confronto per le teste di serie

Il quarto di finale di Elina Svitolina ha proprio una brutta faccia (per il momento ha superato facilmente il primo turno contro Whitney Osuigwe, n.d.t.) . Sembra poi che anche Caroline Wozniacki (che ha superato il primo turno contro Yafan Wang, n.d.t.), Aryna Sabalenka (che ha battuto Victoria Azarenka al primo turno, n.d.t.) e Serena Williams siano state penalizzate dal tabellone effettivo, sebbene il sospetto è che sulla cella arancione di Williams al primo turno pesi in qualche modo una valutazione generosa di Elo della bravura di Maria Sharapova (Williams ha vinto infatti con un doppio 6-1, n.d.t.). La campionessa uscente Naomi Osaka ha il percorso più semplice tra le giocatrici con realistiche possibilità di aspirazione al titolo, rispetto a un tabellone casuale (anche se ha faticato al primo turno contro Anna Blinkova, vincendo in tre set dopo due ore e mezzo, n.d.t.).

IMMAGINE 1 – Confronto tra tabellone effettivo e simulazioni per le teste di serie

Effetti di rilievo su una selezione di giocatori fuori dalle teste di serie

Un tabellone più favorevole per Svetlana Kuznetsova con questa metodologia è dovuto in larga parte a rimanenze nella valutazione Elo di uno stato di forma che potrebbe essere scomparso (e così è stato, vista la sconfitta in due set al primo turno contro Kristie Ahn, n.d.t.), oltre ad avere due delle teste di serie più volubili nella sua sezione in Sloane Stephens (che infatti a perso contro Anna Kalinskaya al primo turno, n.d.t.) e Garbine Muguruza (anche lei perdente al primo turno contro Alison Riske, n.d.t.).

Mi sorprende vedere che il dato di Sharapova non sia peggiore, avendo al primo turno una delle tre giocatrici più forti di sempre.

IMMAGINE 2 – Effetti della casualità del sorteggio su alcune non teste di serie

Luck of the Draw US Open 2019 (Women)

La fortuna del sorteggio: US Open 2019 (uomini)

di Chapel Heel // HiddenGameOfTennis

Pubblicato il 26 agosto 2019 – Traduzione di Edoardo Salvati

Come d’abitudine per gli Slam, ho eseguito una simulazione (con la mia variante Elo) di 100.000 configurazioni del tabellone principale, utilizzando lo stesso metodo che gli organizzatori usano per assegnare ai giocatori la loro posizione. L’ho poi confrontata con la previsione per il torneo su base Elo rispetto al tabellone effettivo.

L’immagine 1 mette a confronto la previsione effettiva del tabellone con i risultati dalle simulazioni di rimescolamento, in modo da avere alcune indicazioni sull’accessibilità del tabellone effettivo rispetto alle altre configurazioni. Tonalità di rosso (e arancione) evidenziano la sfortuna del giocatore. Al contrario, tonalità di verde rappresentano la fortuna ricevuta nel tabellone effettivo, in riferimento a un particolare turno. Il giallo simboleggia neutralità, e si può di fatto ignorare qualsiasi valore superiore o inferiore allo 0.2%.

Per una presentazione più compatta rispetto al passato, ho riportato nella tabella solo le teste di serie, e organizzato nell’immagine 2 quei giocatori fuori dalle teste di serie per i quali c’è stata un’incidenza degna di nota (almeno l’1% di segno positivo o negativo).

Tabellone effettivo e simulato a confronto per le teste di serie

Rispetto a tabelloni casuali, la parte alta del tabellone principale è più difficile di quella bassa. Accade spesso quando Novak Djokovic e Roger Federer si ritrovano dallo stesso lato (in quella alto, vista la testa di serie numero 1 di Djokovic) in un torneo che non sia su terra battuta. Ho eseguito la stessa simulazione prima che si conoscessero i qualificati e la strada di Djokovic al quarto di finale non era così in discesa. Kevin Anderson non sarebbe stato l’Anderson da potenziale semifinale e Milos Raonic non sarebbe stato al massimo della forma, ma i ritiro di entrambi ha facilitato, almeno in termini di valutazioni Elo, il tabellone di Djokovic. Le cose per lui poi si complicano, vista la presenza di Federer invece che di Dominic Thiem. Per la stessa ragione, il percorso di Nadal alla finale è verniciato di verde.

Non ci si deve sorprendere dal rosso vivo nel tabellone di Stefanos Tsitsipas, visto che il suo primo turno assomiglia di più a un quarto turno (e in effetti Tsitsipas ha perso in quattro set contro Andrey Rublev, n.d.t.). Rispetto a un tabellone casuale, Kei Nishikori ha il cammino più facile fino ai quarti di finale, ma la possibilità di approfittane è molto legata al recupero dall’indisposizione subita a Cincinnati e al livello di umidità a New York. Anche Daniil Medvedev, il giocatore più “infuocato” in questo periodo, ha un percorso più semplice del previsto. Avrà ancora benzina a sufficienza? (Medvedev ha superato il primo turno in tre set contro Prajnesh Gunneswaran, n.d.t.)

Particolare attenzione va data all’apparente fortuna di Diego Schwartzman fino ai quarti di finale. Elo ignora che al primo turno Schwartzman deve giocare contro Robin Haase, per lui una vera e propria kryptonite, considerato un record negli scontri diretti di 0-5 con una sconfitta su ogni superficie (Schwartzman si è riscattato vincendo in tre set, n.d.t.).

IMMAGINE 1 – Confronto tra tabellone effettivo e simulazioni per le teste di serie

Effetti di rilievo su una selezione di giocatori fuori dalle teste di serie

Non ci sono qui problematiche degne di nota. Il vincitore di Winston Salem Hubert Hurkacz ha il percorso peggiore (perdendo al primo turno contro Jeremy Chardy in cinque set, n.d.t.), mentre Philipp Kohlschreiber riesce (purtroppo) a finire di nuovo in questo elenco (perdendo al primo turno contro Lucas Pouille in quattro set, n.d.t.).

IMMAGINE 2 – Effetti della casualità del sorteggio su alcune non teste di serie

Luck of the Draw: US Open 2019 (Men)

Chi ha un vantaggio alla vigilia degli US Open?

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 24 agosto 2019 – Traduzione di Edoardo Salvati

Con l’ultimo Slam dell’anno ai blocchi di partenza, è il momento adatto per interrogarsi sulla bravura relativa del campo partecipanti e su quali giocatori e giocatrici si sono allenati più intensamente nell’anno passato per migliorare il vantaggio competitivo sul cemento.

Prendiamo spesso a riferimento la trasferta nordamericana di luglio e agosto come segnale premonitore di cosa potrà accadere gli US Open. Se il Cincinnati Masters (l’ultimo Master prima degli US Open) fosse di qualche indicazione — con la vittoria di Daniil Medvedev contro David Goffin — sarebbe proprio che dal tabellone principale di New York bisogna aspettarsi l’inaspettato.

Medvedev…infuocato

In russo, la parola “fuoco” si scrive “Пожар” e si pronuncia prozhar. È così che chiamerò Medvedev per le prossime due settimane, Пожар-Medvedev, visto che è riuscito ad arrivare in finale in tutti i tornei sul cemento che ha giocato della US Open Series, sconfiggendo anche Novak Djokovic in semifinale a Cincinnati. Questa striscia vincente gli ha permesso di entrare tra i giocatori che più si sono migliorati sulla superficie nelle precedenti 52 settimane. Meglio ancora, tra i quindici giocatori con la valutazione più alta all’inizio degli US Open, (Пожар) Medvedev ha ottenuto il secondo posto per punti guadagnati (+307), appena dietro ai 323 punti di Albert Ramos.

IMMAGINE 1 – Variazione nelle valutazioni specifiche per cemento tra il 2018 e il 2019 per quei giocatori con una valutazione attuale di almeno 2100 punti. In giallo i giocatori con un guadagno di almeno 200 punti

Un salto di 300 o più punti nelle valutazioni da un anno all’altro è raro, specialmente tra giocatori che già si esprimono ad altissimo livello. Negli ultimi 20 anni, i cinque giocatori che più si sono migliorati prima degli US Open sono nomi ben noti. Solo uno di essi però poi si è spinto avanti nel torneo (Guillermo Coria, con il quarto di finale nel 2003). Siamo quindi indotti a pensare che la regressione di rendimento verso la media, o il possibile affaticamento da un numero di partite nei tornei di preparazione superiore a quello inizialmente ipotizzato, agiscano da contrappeso alla fiducia che questi giocatori possono aver acquisito.

La corsa di Kenin e Andreescu

In campo femminile, il rimescolamento nelle valutazioni è per certi versi più interessante rispetto a quanto visto per gli uomini. In linea con gli ultimi anni negli Slam femminili, ci si aspettava che pochi punti separassero le favorite per la vittoria. Nessuno però probabilmente pensava che due delle più forti contendenti, Sofia Kenin e Bianca Andreescu, scalassero le valutazioni così velocemente.

Esattamente un anno fa, Kenin aveva 350 punti in meno. Se non fosse impressionante a sufficienza, il guadagno di Andreescu è stato ancora più clamoroso. In soli 12 mesi, la fenomenale canadese ha migliorato di circa 600 punti. Siamo di fronte a un vero salto dimensionale: per avere un riferimento, sono 100 punti in più anche del miracoloso rientro di Kim Clijsters al professionismo tra il 2009 e 2010.

IMMAGINE 2 – Variazione nelle valutazioni specifiche per cemento tra il 2018 e il 2019 per quelle giocatrici con una valutazione attuale di almeno 2100 punti. In rosso le giocatrici con un guadagno di almeno 200 punti

Per molti dei giovani giocatori e giocatrici del Nord America è l’occasione perfetta per innalzare il livello di gioco. Se a queste dinamiche uniamo la crescita di Coco Gauff, il titolo di Madison Keys a Cincinnati e il ritorno al vertice di Serena Williams, il tifo per i rappresentanti del continente americano non avrà soste.

Who Has the Momentum Going into the US Open?

Federer non è stato dominante nei momenti chiave, ma ci è andato vicino

di Jeff Sackmann // TennisAbstract

Pubblicato il 26 luglio 2019 – Traduzione di Edoardo Salvati

Le statistiche della finale di Wimbledon raccontano una storia senza ombre. Per cinque set, Roger Federer ha fatto molte cose leggermente meglio del suo avversario, Novak Djokovic, che però ha poi vinto di misura perché si è aggiudicato i punti più importanti, un dettaglio che non emerge dai numeri con la stessa nitidezza.

Superando le statistiche tradizionali, possiamo quantificare il dominio nei momenti che fanno la differenza. Un metodo che supera il semplice conteggio delle palle break o dell’individuazione dei passaggi chiave più ovvi in una partita è l’indice di leva per assegnare un valore a ciascun punto, in funzione dell’importanza. Dopo ogni singolo punto della partita, possiamo calcolare una nuova probabilità di vittoria per entrambi i giocatori. Un punto come quello da giocare sul 5-5 in un tiebreak è potenzialmente in grado di alterare la probabilità di vittoria in misura massiccia, mentre così non è per quello sul 40-15 del primo game.

La leva quantifica il potenziale. In media, in una partita al meglio dei cinque set un punto possiede una leva di circa il 4%, ma per i punti più importanti si parla di diverse volte quel valore. Un altro modo per identificare quando un giocatore è predominante è vedere il numero sproporzionato di punti ad alta leva che vince anche di fronte a una prestazione inferiore in quelli a bassa leva.

L’indice di leva

In un recente articolo sulla finale di Wimbledon per l’Economist, ho approfondito ulteriormente il concetto. Djokovic ha vinto meno punti rispetto a Federer, ma quelli che ha vinto hanno contato di più. La leva media dei punti per lui è stata infatti del 7.9%, rispetto al 7.2% di Federer. Possiamo presentare questa differenza sotto forma di indice di leva (Leverage Ratio o LR), dividendo 7.9% per 7.2%, con un risultato di 1.1. Un indice così alto non è insolito. Nelle più di 700 partite Slam maschili del Match Charting Project, l’LR del giocatore più dominante è in media di 1.11. L’eccellenza di Djokovic nei momenti chiave non è stata nemmeno così unica, ma in una partita di quell’equilibrio è bastata a fare la differenza.

Con un indice di leva superiore a 1.0, la vittoria non è comunque garantita. In circa il 30% di queste 700 partite al meglio dei cinque set la vittoria è andata al giocatore che, in media, ha vinto meno punti importanti dell’avversario. Alcune situazioni di vincitori con basso indice di leva quasi rasentano la comicità, come la finale del Roland Garros 2008 in cui Rafael Nadal ha demolito Federer nonostante un LR di 0.77.

Aumento della comprensione

Nelle partite a senso unico non c’è molta leva a disposizione, quindi il numero dei punti vinti ha molta più rilevanza di quando sono stati vinti. Spesso prestazioni non dominanti si traducono in vittorie di partite ancora più equilibrate, come quella di Andy Murray nella semifinale degli US Open 2018 in quattro set contro Nadal nonostante un LR di 0.80, o la super equilibrata semifinale a Wimbledon 2018 in cui Kevin Anderson ha battuto John Isner con un LR di 0.88.

Non serve un foglio di calcolo per capire che le partite di tennis vengono decise da una combinazione di rendimento complessivo e rendimento nei momenti importanti. I numeri che ho citato non portano avanti la nostra comprensione di molto, quantomeno non in modo rigoroso. È questo il prossimo passo.

Indice di leva, ti presento l’indice di leva bilanciato

Coloro che frequentano regolarmente Tennis Abstract hanno familiarità con l’indice di dominio (Dominance Ratio o DR), una statistica inventa da Carl Bialik al fine di riclassificare i punti vinti totali. Il DR si ottiene dalla divisione tra i punti vinti alla risposta e i punti persi al servizio, in modo che il valore medio sia esattamente 1.0. Solitamente, chi vince ha un valore superiore a 1.0 e chi perde un valore inferiore a 1.0.

Nella finale di Wimbledon, il DR di Djokovic è stato di 0.87, estremamente basso per un vincitore, se non addirittura inedito. Il DR compensa gli effetti generati del rendimento al servizio e alla risposta (a differenza dei punti vinti, che possono deviare in una o l’altra direzione a seconda che ci siano più punti al servizio che alla risposta, o viceversa) e sintetizza in un solo numero la qualità della prestazione complessiva.

Equa distribuzione tra servizio e risposta

Non dice però nulla relativamente al dominio nei momenti chiave, tranne quando un giocatore vince con un valore basso del DR, da cui si può dedurre che abbia controllato l’avversario sui punti più caldi.

Per avere una prospettiva bilanciata simile in presenza di rendimenti ad alta leva, possiamo adattare l’indice di leva LR soppesando equamente il dominio nei momenti chiave sia al servizio che alla risposta. Chiamo questa statistica indice di leva bilanciato (Balanced Leverage Ratio o BLR), cioè la media semplice dell’LR nei punti al servizio e dell’LR nei punti alla risposta. Il BLR di solito non si scosta di molto dall’LR, così come spesso otteniamo le stesse informazioni dal DR che dai punti totali. Il BLR di Djokovic nella finale di Wimbledon è stato di 1.11, rispetto a un LR di 1.10. Nelle partite in cui però un numero sproporzionato di punti si giocano sulla racchetta di un giocatore, il BLR fornisce il necessario aggiustamento.

DR corretto per leva

Siamo in grado di registrare rendimenti corretti per leva semplicemente moltiplicando questi due numeri. Ad esempio, prendiamo la vittoria di Stanislas Wawrinka contro Djokovic nella finale degli US Open 2016. Il DR di Wawrinka è stato di 0.90, più alto di quello di Djokovic a Wimbledon 2019 ma difficilmente sufficiente a trionfare. Eppure ha vinto, grazie a un BLR di 1.33, uno dei più alti mai registrati in una finale Slam. Il prodotto tra il DR e il BLR di Wawrinka — che chiameremo DR+ — è pari a 1.20. Lo si può interpretare con la stessa scala di un DR “normale”, dove 1.2 è spesso identificativo di una vittoria con margine ridotto, se non di una al cardiopalma.

Di 167 finali Slam maschili nel Match Charting Project, 14 giocatori hanno vinto nonostante un DR “normale” inferiore a 1.0. Per ciascuno di essi, il BLR era superiore a 1.1, e in 13 delle 14 occorrenze, la forza del BLR del vincitore ha “cancellato” la debolezza del suo DR, nel senso che il DR+ è stato superiore a 1.0. La tabella riepiloga quelle partite, ordinate per DR+ crescente.

Anno  Slam              Vincitore    DR     BLR    DR+  
2019  Wimbledon         Djokovic     0.87   1.11   0.97  
1982  Wimbledon         Connors      0.88   1.20   1.06  
2001  Wimbledon         Ivanisevic   0.95   1.16   1.10  
2008  Wimbledon         Nadal        0.98   1.13   1.10  
2009  Australian Open   Nadal        0.99   1.13   1.12  
1981  Wimbledon         McEnroe      0.99   1.16   1.15  
1992  Wimbledon         Agassi       0.97   1.19   1.16  
1989  US Open           Becker       0.96   1.22   1.18  
1988  US Open           Wilander     0.98   1.21   1.18  
2015  US Open           Djokovic     0.98   1.21   1.18  
2016  US Open           Wawrinka     0.90   1.33   1.20  
1999  Roland Garros     Agassi       0.98   1.25   1.23  
1990  Roland Garros     Gomez        0.94   1.34   1.26  
1991  Australian Open   Becker       0.99   1.30   1.29

Prima finale vinta dal giocatore con il DR+ inferiore

In 167 finali Slam, quella tra Djokovic e Federer è stata la prima vinta dal giocatore con il DR+ più basso (alcuni dei campioni che non compaiono in elenco hanno avuto indici di leva sotto tono e conseguenti DR+ inferiori ai DR, ma nessuno sotto il livello di 1.0). Sebbene Federer è stato più debole nei momenti importanti — in particolare nei tiebreak e quando ha avuto i due match point — il rendimento complessivo in quel tipo di situazione non è stato così scadente come quei pochi memorabili momenti farebbero pensare. È più probabile che un giocatore con un DR di 1.14 e un BLR di 0.90 come quelli di Federer concluda le due settimane di Wimbledon ballando con la campionessa del tabellone femminile.

Sorprendentemente, 1 su 167 potrebbe sottostimare la rarità di un vincitore con un DR+ inferiore a 1.0. Solo una delle partite al meglio dei cinque set nel database del Match Charting Project (su più di 700) possiede quel requisito. Si tratta del controverso quarto turno degli Australian Open 2019 tra Kei Nishikori e Pablo Carreno Busta. Nishikori ha vinto con un DR di 1.06, ma il suo BLR è stato di 0.91, relativamente debole e che ha portato a un DR+ di 0.97. Come per la finale di Wimbledon, anche la partita di Melbourne avrebbe potuto avere un altro vincitore. La fortuna è stata avversa a Carreno Busta non solo per le chiamate arbitrali.

Qual è il significato di tutto questo?

Sappiamo che la finale di Wimbledon è stata in estremo equilibrio, ora abbiamo più numeri che mostrano quanto effettivamente lo sia stata. Sapevamo che Djokovic gioca meglio quando conta di più, ora abbiamo più riferimenti sulla sua maggior bravura, che però non si discosta di un margine insolitamente ampio.

Federer ha vinto cinque dei venti Slam nonostante un BLR nella finale inferiore a 1.0, e altri due con un DR inferiore a 1.14. Non ha mai vinto uno Slam con un DR+ non superiore a 1.03, ma va anche detto che non c’è mai stata una finale Slam che il DR+ ha considerato così ravvicinata. Federer non è la definizione di maestro dei momenti chiave, ma non è poi così malvagio. Avrebbe solamente dovuto portare con sé un po’ di quella dose di domino con cui ha chiuso il secondo set per passaggi più importanti nelle fasi successive.

Se siete anche voi come me, dopo aver letto fino a questo punto non smetterete di farvi domande. Ho riflettuto su alcune che spero di approfondire analogamente. Si può dire che Federer di solito è meno dominante della media nei momenti chiave? (Si). Djokovic è molto più bravo a quel riguardo? (Si). E Nadal? (Anche lui è più bravo). Nadal è davvero migliore, o i suoi numeri sulla leva sono di partenza buoni perché i punti importanti si giocano più spesso sul lato dei vantaggi? (È davvero migliore). Djokovic ha preso le misure a Federer? (Non proprio, a meno che non s’intenda il suo numero di scarpe, allora in quel caso sì). È cambiato tutto dopo che Djokovic ha tirato la famosa risposta? (No).

Rendimenti situazionali

Ci sono anche molti argomenti interessanti che vanno oltre i Grandi Tre. Ho iniziato qualche anno fa a scrivere della leva relativa a sottoinsiemi di partite, spinto dalla semifinale di Wimbledon 2016 tra Federer e Milos Raonic, nella quale Federer ha subito la pressione quando più contava. Come possiamo analizzare la leva media per punti vinti e persi, così riusciamo a stimare l’importanza dei punti in cui un giocatore ha servito un ace, commesso un errore non forzato di rovescio, o scelto di andare a rete.

Le partite sono decise da una combinazione di rendimento complessivo e giocate di alta leva. Le statistiche comunemente disponibili illustrano bene le dinamiche del primo, ma non sono adeguate per fare chiarezza sulle seconde. Il dominio nei momenti chiave è lasciato alle congetture degli opinionisti. Con un insieme di partite in continuo aumento e l’accesso a sempre più dati punto per punto (e quindi a numeri sulla leva per ogni punto e ogni partita), il divario tra le due misure si riduce, consentendoci di quantificare con più precisione il grado in cui il rendimento legato alla specifica situazione incide sulla capacità di ciascun giocatore di vincere la partita.

Roger Federer Wasn’t Clutch, But He Was Almost Clutch Enough