La probabilità di doppi decisivi nella nuova Coppa Davis

di Jeff Sackmann // TennisAbstract

Pubblicato il 28 novembre 2019 – Traduzione di Edoardo Salvati

Nel nuovo formato della Coppa Davis, ci sono tre partite per ogni sfida tra nazioni, due di singolare e una di doppio. Si giocano per primi i singolari, rendendo quindi possibile che il doppio perda di valore, cioè sia irrilevante ai fini del risultato finale. 

Gli organizzatori delle Finali di Coppa Davis hanno provato a dare più peso al doppio, utilizzando criteri di spareggio (basati sul numero di set e game vinti) per determinare chi, durante la fase a gironi, si qualifica per quella a eliminazione diretta. Se è servito a mantenere interesse iniziale per i doppi irrilevanti, verso la fine dei gironi le squadre matematicamente qualificate non hanno avuto alcun incentivo a giocare il doppio.

In questo modo il Canada ha regalato il punto agli Stati Uniti con un ritiro pre-partita e l’Australia si è ritirata dopo un solo game giocato. Probabilmente era inevitabile, ma non è di certo auspicabile. Si presume che qualunque appassionato di tennis ne desideri sempre di più, e partite interrotte o non giocate potrebbero gettare scompiglio per lo spareggio.  

Sono molti i modi possibili per un ripensamento dell’evento, talmente tanti che evito di approfondirli in questa sede. Siccome i doppi irrilevanti sono inevitabili, vorrei invece analizzare quanto spesso dovremmo aspettarci che si verificano e, considerando che si verificheranno, se effettivamente è un aspetto che mette il doppio in secondo piano rispetto al singolare. 

Doppi ancora vivi

Lo spunto arriva da una domanda per il podcast della settimana scorsa:

La scelta più estrema riguardo ai doppi irrilevanti è semplicemente quella di non giocarli del tutto. Se si optasse per questa soluzione, a quanti doppi assisteremmo? Nelle Finali di Davis Cup a Madrid, ci sono state 25 sfide: 18 nella fase a gironi e 7 in quella a eliminazione diretta. In 12 sfide il doppio è stato determinante: 7 nelle 18 sfide dei gironi e 5 nelle 7 sfide dell’eliminazione diretta. Sulla base della metodologia proposta nel tweet, è all’incirca quanto ci saremmo attesi che accadesse. In media (per entrambe le fasi), una sfida aveva il 43% di arrivare al doppio decisivo, lasciando intendere che 11 partite di doppio sarebbero state importanti. 

La tabella elenca le 25 sfide, insieme alla probabilità di una vittoria a testa nelle prime due partite di singolare. L’ultima colonna indica se il doppio è stato decisivo. Le valutazioni Elo non sono state particolarmente efficaci nel predire quale sfida avrebbe portato a un doppio decisivo, anche se forniscono una buona stima di quanto spesso il doppio farebbe la differenza.

Sfida                 Prob. doppio   Giocato? 
Semi: GBR vs ESP      56.2%          SI  
Quarti: SRB vs RUS    54.3%          SI  
Semi: RUS vs CAN      53.3%          SI  
RR: FRA vs SRB        52.5%          NO  
RR: ARG vs GER        51.6%          NO  
RR: USA vs CAN        51.4%          NO  
RR: ITA vs CAN        50.0%          NO  
Quarti: GBR vs GER    50.0%          NO  
RR: GBR vs KAZ        49.8%          SI  
RR: ESP vs RUS        49.4%          SI  
Quarti: AUS vs CAN    49.4%          SI  
RR: USA vs ITA        48.7%          SI  
RR: BEL vs AUS        46.1%          NO  
RR: KAZ vs NED        46.0%          SI  
RR: CRO vs RUS        45.7%          NO  
RR: GER vs CHI        44.2%          SI  
RR: ARG vs CHI        43.6%          NO  
RR: FRA vs JPN        43.4%          SI  
Finale: CAN vs ESP    40.8%          NO  
RR: GBR vs NED        37.5%          SI  
RR: BEL vs COL        36.2%          NO  
Quarti: ARG vs ESP    34.6%          SI  
RR: SRB vs JPN        26.1%          NO  
RR: AUS vs COL        10.4%          NO  
RR: CRO vs ESP        7.3%           NO

Solo in pochi casi la vittoria in entrambi i singolari era quasi garantita. Anche in presenza di un tabellone molto lungo di 18 squadre, la maggior parte delle rappresentative è riuscita a schierare due solidi giocatori di singolare, e solo poche avevano il lusso di più di un giocatore di élite. 

Dieci anni di storia

Non si è trattato di pura casualità. Ho verificato tutte le sfide del World Group di Coppa Davis (tralasciando i playoff) dal 2010 al 2018 per identificare i due giocatori migliori di ciascuna squadra. Attraverso le loro valutazioni Elo al momento della partita e declinate sul nuovo formato al meglio dei tre set (anziché al meglio dei cinque), ho stimato quanto spesso saremmo di fronte a un doppio decisivo. In quelle 135 sfide, la probabilità media di un doppio decisivo è del 41%, di poco inferiore alla frequenza dell’edizione appena terminata. Escludendo un radicale rovesciamento gerarchico nella geografia del tennis mondiale, abbiamo una valida approssimazione di quanto frequentemente una squadra vince le prime due partite nel nuovo formato della Coppa Davis.

Quanto conta il doppio?

Quando il doppio ha un valore, è decisamente rilevante. Ogni partita di singolare ha la capacità di incidere in modo sostanziale sulla probabilità di ciascuna squadra di vincere la sfida, ma se il doppio entra in gioco, ha un’incidenza totale. Pensiamone in termini di leva, un concetto che solitamente applico a cambiamenti di punteggio durante la partita. Ipotizziamo due squadre equamente competitive e consideriamo la probabilità di vittoria in ogni passaggio del processo. Ogni squadra ha il 50% di probabilità di vincere ogni partita della sfida, che significa:

  • ogni squadra ha il 50% di probabilità di vincere la sfida
  • la squadra che vince la prima partita avrà il 75% di probabilità di vincere la sfida
  • in caso di parità dopo le prime due partite, ogni squadra avrà ancora una volta il 50% di probabilità di vincere la sfida.  

Prendiamo ora la leva di ciascuna partita dalla prospettiva della squadra A:

  • se vince la prima partita, la probabilità di vincere la sfida sale al 75%, altrimenti scende al 25%. Si tratta di un valore di leva del 75% – 25% = 50%
  • supponiamo che vinca la prima partita. Se vince anche la seconda, vince la sfida, una probabilità cioè del 100%. Se perde, scende al 50%. Di nuovo, è un valore di leva del 100% – 50% = 50% (se perde la prima partita, i calcoli sono identici, solo con probabilità del 50% e 0% invece di 100% e 50%) 
  • in presenza di un doppio decisivo, le probabilità all’inizio della partita di vincere la sfida sono del 50%. Con la vittoria del doppio, la probabilità raggiunge il 100%. Perdendo il doppio, la probabilità diventa dello 0%. È un valore di leva del 100% – 0% = 100%.  

Teoria e realtà

Potreste pensare che sia un ragionamento eccessivamente formale e convoluto, ed è difficile darvi torto. Il punto è che, con due squadre equivalenti, il doppio diventa due volte più decisivo. In molti altri sport succede che vi siano giocatori che non vengono coinvolti in tutte le fasi di gioco, subentrando nei momenti critici. Nel baseball ad esempio, con alcuni lanciatori chiamati a chiudere la partita solo in situazioni molto equilibrate. Oppure i kicker nella NFL, che partecipano a poche azioni della partita, ma con la possibilità di segnare molti punti. 

Per i parametri del mio campione d’indagine, il doppio avrà rilevanza esattamente il 50% delle volte, ed è due volte più importante di ognuna delle partite di singolare. Non funziona proprio così nel mondo reale, visto che il doppio è decisivo poco più del 40% delle volte. Però, quando poi il doppio diventa decisivo, ha sempre conseguenze da tutto o niente. Detto altrimenti, ha un valore di leva del 100%. 

Sono d’accordo nel non giocare i doppi irrilevanti. Non sarebbe una decisione che incontra il favore dei doppisti, e temo scatenerebbe le ire dei puristi della Davis. Pensando però alla posta in gioco, la reazione sarebbe più mitigata. In una formula da 16 o 18 squadre, l’equilibrio è sufficientemente distribuito da rendere necessario il doppio quasi nella metà delle volte. E quando si gioca il doppio, gli spesso dimenticati specialisti si trovano in una partita che è, letteralmente!, due volte più decisiva dei singolari che generano il massimo seguito di pubblico.  

The Likelihood of Live Doubles Rubber in the New Davis Cup

Stili di gioco e risultati a sorpresa

di Jeff Sackmann // TennisAbstract

Pubblicato il 14 gennaio 2019 – Traduzione di Edoardo Salvati

Durante un podcast con Carl Bialik, ho confessato una teoria che mi ronza in testa da tempo, e cioè che le vittorie a sorpresa sono più probabili in presenza di stili contrastanti di gioco. La logica è piuttosto semplice. Se ci sono due ribattitori, è probabile che il più forte vinca. Se ci sono invece due cannonieri del servizio, il migliore dei due non dovrebbe avere problemi. Ma se un cannoniere affronta un ribattitore beh…può succedere di tutto.

Abbiamo visto Rafael Nadal fare fatica contro giocatori come John Isner e Dustin Brown, così come un grande servizio essere neutralizzato dal suo opposto, ad esempio le sei sconfitte di Marin Cilic contro Gilles Simon a fronte di una sola vittoria. Ci sono comunque vittorie a sorpresa anche nello scontro di stili di gioco simili ma, come per tutte le ipotesi non sottoposte a prova empirica, anche questa ha il suo fascino e non è da scartare in partenza.

Serve una verifica approfondita

Al primo turno degli Australian Open 2019 Reilly Opelka ha battuto Isner. Difficile trovare due stili più affini e, da veterano, Isner aveva tutti i favori del pronostico nel perfetto caso di quel tipo di partita che mi aspetto già delineata, tranne che poi finisce per vincere lo sfavorito. Hanno giocato quattro tiebreak e ci sono stati solo due break, ma Opelka non ha nemmeno dovuto attivare la nuova regola del super-tiebreak al quinto set. Pur trattandosi di una sola partita, il suggerimento implicito che ne deriva è di fare una verifica più approfondita della mia idea.

Dopo un paio di ore di analisi, la teoria può vantare ora una prova ufficiale, e ho scoperto che non è esente da difetti. Fortunatamente, non si tratta solo di un altra battuta d’arresto. Lo stile di gioco è effettivamente correlato alla probabilità di un risultato a sorpresa, semplicemente non nel modo che mi ero immaginato.

Una misura della pronosticabilità

Voglio spiegare in dettaglio il test e poi illustrare gli esiti. Ho utilizzato i dati del Match Charting Project per calcolare l’Indice di Offensività di ciascun giocatore con almeno dieci partite nel database dal 2010. In sintesi, l’Indice di Offensività è la percentuale di colpi che terminano il punto (tramite un vincente, un errore non forzato o un errore forzato commesso dall’avversario) e si comporta da approssimazione dello stile di gioco. Otteniamo così 106 giocatori, da conservatori tipo Simon e Yoshihito Nishioka con Indice di Offensività del 13% a i battitori liberi come Brown e Ivo Karlovic, con indici intorno al 30%. Li ho poi suddivisi in quartili (per numero di partite, non numero di giocatori, con ogni quartile che contiene tra i 21 e 31 giocatori), in modo da vedere come in generale uno stile di gioco si comporta con un altro.

La divisione in quartili

Questi sono i gruppi:

(l’Indice di Offensività mette insieme due aspetti: grande servizio/grande potenza di colpi e aggressività tattica. Isner non è sempre iper aggressivo, ma per via della sua altezza e del talento al servizio, è in grado di terminare i punti così frequentemente che, statisticamente, sembra essere estremamente aggressivo. Quindi, parlerò allo stesso modo di “cannonieri” e “giocatori offensivi”, anche se in realtà ci sono molte differenze tra i due gruppi).

Un campione di 11 mila partite

Concentrandomi su questi 106 giocatori, ho trovato poco più di 11 mila partite da esaminare e le ho divise in insiemi sulla base del quartile di appartenenza dei due giocatori. Ciascuno dei dieci possibili sottoinsiemi di partite, come Q1 contro Q2 o Q4 contro Q4, contiene almeno 400 elementi.

Per ogni partita, ho stabilito la probabilità di vittoria del favorito con le valutazioni Elo corrette per superficie, in modo da ottenere pronostici pre-partita che, seppur non accurati quanto quelli degli allibratori, sono altrettanto affidabili. Questi pronostici permettono di stabilire se determinati gruppi sono più pronosticabili di altri. Se su 100 partite in cui il favorito ha una probabilità di vittoria del 60%, il favorito ne vince 70, diremo che il risultato è più pronosticabile delle attese. Se ne vince solo 50, il risultato è stato meno prevedibile.

Addio mia bella teoria

Per le partite in ciascuno dei dieci sottoinsiemi quartile contro quartile, ho calcolato la probabilità media di vittoria del favorito (“Probabilità Favorito”, confrontandola con la frequenza con cui il favorito ha effettivamente vinto (“% Vittoria Favorito”). La tabella mostra i risultati insieme al rapporto tra quei due numeri (“Indice”). Un indice di 1.0 significa che le partite del sottoinsieme sono pronosticabili esattamente quanto ci si attende che lo siano. Un indice più alto significa che il favorito è stato ancora più forte del pronostico, mentre un indice inferiore manifesta più vittorie a sorpresa delle attese.

Partite
Quartili
Numero
Partite
Probabilità
Favorito
% Vittoria
Favorito
Indice
Q1 vs Q141271.1%75.2%1.06
Q1 vs Q2107269.5%70.6%1.02
Q1 vs Q3138269.7%68.6%0.98
Q1 vs Q4118769.7%70.0%1.00
Q2 vs Q261270.2%69.9%1.00
Q2 vs Q3161668.8%67.8%0.99
Q2 vs Q4143468.8%67.4%0.98
Q3 vs Q388666.7%60.3%0.90
Q3 vs Q4168567.3%66.8%0.99
Q4 vs Q479167.1%61.2%0.91

Emerge un risultato impressionante: il valore più alto, che identifica il gruppo di partite più pronosticabili, arriva dalla coppia di giocatori più conservativi. Viceversa, il valore più basso, che identifica il gruppo di partite con più vittorie a sorpresa, arriva dalla coppia di giocatori più offensivi.

Prima di analizzare le correlazioni, facciamo un’altra verifica. I migliori non sono equamente distribuiti tra quartili, visto che nel Q1 ci sono due dei Fantastici Quattro. Per i più forti e per le partite più sbilanciate è più complicato calcolare con precisione pronostici basati sulle valutazioni Elo, che sono la colonna portante di questo procedimento.

Restringiamo il perimetro

Per questo motivo occorre prestare attenzione quando i giocatori di vertice potrebbero influenzare il risultato finale dell’analisi. Proviamo quindi a vedere gli stessi numeri relativi però solo a quelle partite in cui il favorito ha una probabilità di vittoria che va dal 50 al 70%, escludendo così molti degli scontri tra i giocatori di vertice e tutte le loro partite con pronostico a senso unico.

Partite
Quartili
Numero
Partite
Probabilità
Favorito
% Vittoria
Favorito
Indice
Q1 vs Q119659.5%62.8%1.05
Q1 vs Q260459.8%60.6%1.01
Q1 vs Q373159.7%58.1%0.97
Q1 vs Q466359.9%60.6%1.01
Q2 vs Q232259.0%54.7%0.93
Q2 vs Q393159.8%59.8%1.00
Q2 vs Q482259.7%57.2%0.96
Q3 vs Q354459.5%55.0%0.92
Q3 vs Q4102459.5%58.2%0.98
Q4 vs Q449359.3%55.0%0.93

Si elimina circa il 40% del campione, ma le dinamiche di pronosticabilità rimango in generale le stesse. Sia nel campione complessivo che in quello ridotto del 50-70% di probabilità per il favorito, la correlazione più solida che ho trovato è stato l’Indice di pronosticabilità e il quartile dei giocatori meno offensivi. In altre parole, è probabile che un ribattitore abbia risultati più prevedibili di un giocatore più aggressivo, a prescindere che l’avversario sia un cannoniere del servizio, un altro ribattitore o un giocatore che si pone a metà tra queste due tipologie.

Torniamo ai fondamentali

La mia teoria iniziale è chiaramente sbagliata. Mi aspettavo di trovare che le partite Q1 contro Q1 fossero più pronosticabili della media, e ho avuto ragione. Secondo questa logica, mi aspettavo che anche le partite Q4 contro Q4 andassero in quella direzione mentre accoppiamenti come Q1 contro Q4 fossero più soggetti a risultati a sorpresa. Sarebbe stato meglio che il gatto del mio avesse fatto pronostici per mio conto.

Si trova invece che partite con giocatori più aggressivi portano più probabilmente a esiti contro pronostico. Non è la scoperta del secolo, ed è una conclusione che avrei dovuto intuire. I grandi servitori tengono il servizio più facilmente e fanno break meno frequentemente, così che le loro partite finiscono con punteggi più ravvicinati, lasciando spazio a un ruolo maggiore da parte della fortuna specialmente quando set e partite sono decise da tiebreak.

Starete a questo punto pensando che ho buttato via il mio pomeriggio e la vostra attenzione per giungere a un esito scontato e poco degno di nota. Sono d’accordo, non è particolarmente eccitante proclamare che la fortuna ha un ruolo più incisivo con i cannonieri del servizio. C’è comunque una scoperta utile, e anche sorprendente, nascosta tra le righe.

Potenziale esponenziale di vittoria a sorpresa

Sappiamo che i giocatori in assoluto mono-dimensionali subiscono più di altri gli alti e bassi della fortuna, per via dei margini risicati del tiebreak. Per un giocatore che raramente strappa il servizio all’avversario, nessuna partita ha garanzia di vittoria. Per un giocatore che raramente subisce un break, nessun avversario è impossibile da battere. Però, mi sarei aspettato che la non pronosticabilità dei cannonieri fosse già incorporata nei pronostici delle partite, tramite la loro valutazione Elo. Se un giocatore ha risultati insolitamente casuali, ci attendiamo che la sua valutazione si muova verso la media del circuito. Questo è uno dei motivi per cui è molto difficile per i giocatori con una risposta debole arrivare in cima alla classifica.

Le cose però non sono come sembrano. Per i cannonieri del servizio, le valutazioni Elo, guidate dalla casualità, ottengono risultati quasi perfetti nella previsione delle partite contro i ribattitori, e hanno un leggero eccesso di confidenza contro avversari con uno stile di gioco più a metà strada nei quartili Q2 e Q3. Quando si affrontano tra di loro invece, i risultati a sorpresa sono all’ordine del giorno. Quella frazione di risultati così volatili, le partite piene di tiebreak in presenza di due cannonieri, rappresenta solo una parte della valutazione di questo tipo di giocatori.

Siamo abituati a vedere esiti imprevedibili legati ai giocatori più aggressivi, per via del grande servizio, del rendimento erratico alla risposta e degli scambi corti. L’analisi di oggi aumenta la conoscenza sulla frequenza con cui questo accade o non accade. Contro i ribattitori, la situazione non è poi così difficile da pronosticare. Quando però si ritrovano due cannonieri del servizio, ci aspettiamo l’inatteso, e il risultato diventa ancora più imprevedibile.

What I Should’ve Known About Playing Styles and Upsets

Una breve spiegazione sull’arrivo in volata alla Laver Cup

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 24 settembre 2019 – Traduzione di Edoardo Salvati

Nella terza edizione della Laver Cup, il Resto del Mondo si è avvicinato — come mai era riuscito — a battere l’Europa, che ancora una volta ha dimostrato di essere una potenza. Indietro nel punteggio per 5-7 al termine della seconda giornata, con la vittoria delle prime due partite della terza giornata il Resto del Mondo ha ristabilito l’equilibrio lasciando l’esito della sfida incerto fino all’ultimo. La situazione non sembrava chiara per i telecronisti, aperti alla possibilità di una tredicesima partita tra le due squadre. Vediamo perché non sarebbe potuto accadere e quali condizioni si sarebbero invece dovute verificare per arrivare alla partita decisiva.

La Laver Cup non ha una lunga tradizione, quindi parlare di tendenze può non avere molto senso. Abbandonando temporaneamente i rigidi dettami statistici, è curioso notare che il Resto del Mondo si è migliorato o ha eguagliato sé stesso al termine della seconda giornata in ciascuno dei tre anni. Gli 11 punti vinti in Svizzera sono a oggi il bottino più ampio. Escludendo la conquista del trofeo, il Resto del Mondo potrebbe superare questo traguardo con 12 punti alla fine delle partite della terza giornata forzando la sfida conclusiva, uno scenario che però non si è mai verificato.

Forzare la partita decisiva

Alcuni dei commenti televisivi hanno lasciato intendere che si sarebbe comunque sempre potuti arrivare alla partita decisiva. Non è la prima inesattezza numerica sentita durante una telecronaca, ma si è portati a pensare che la semplice addizione multipli di 3 al punteggio del Resto del Mondo alla fine della seconda giornata avrebbe evitato un errore di quel tipo.

Gli affezionati lettori di questo blog non avranno alcun problema nel realizzare che ci sono solo una manciata di punteggi dalle partite della seconda giornata che possono generare una parità di 12-12 dopo la dodicesima partita della terza giornata. E cioè:

  • 0-12
  • 3-9
  • 6-6
  • 9-3
  • 12-0

Meno immediato è capire quanto probabile fosse ciascuno di essi a Ginevra. Tenendo conto delle valutazioni specifiche per il cemento dei giocatori scelti per il singolare e il doppio nella prima e seconda giornata, il grafico dell’immagine 1 mostra tutte le combinazioni di punteggio possibili per il Resto del Mondo alla fine della seconda giornata, con la relativa probabilità.

Complessivamente, la probabilità che il Resto del Mondo fosse su uno dei cinque punteggi che avrebbe condotto a una partita decisiva era del 33%. Il più probabile era il 3-9, con il Resto del Mondo senza i favori del pronostico in tutti i singolari ma favorito in tutti i doppi.

È interessante notare che il punteggio effettivamente raggiunto (5-7) era, con il 17%, appena meno probabile del 3-9 su cui si sarebbero potuti trovare. Sicuramente la prima vittoria in singolare di Jack Sock (contro Fabio Fognini per 6-1 7-6, n.d.t.) per il Resto del Mondo deve essere tra le più grandi sorprese della competizione.

IMMAGINE 1 – Probabilità attesa per ogni combinazione di punteggio del Resto del Mondo alla fine della seconda giornata, sulla base di 50.000 simulazioni di risultato dalle partite effettive della prima e seconda giornata

Recuperare dallo 0-12?

Quando il Resto del Mondo ci riproverà a Boston, nella quarta edizione della Laver Cup nel 2020, guarderò con attenzione se saranno in grado di fare meglio di 5 punti dopo la seconda giornata e di 11 dopo la terza.

E spero di essere ancora in salute quando una delle due squadre recupererà uno svantaggio di 0-12 per giocarsi tutto nella partita finale. Con i giocatori presenti quest’anno, sarebbe successo solo in 6 delle 50.000 simulazioni della competizione. Temo ci sarà un po’ da aspettare per questo scenario. Per la prima partita decisiva invece, l’anno prossimo potrebbe essere quello giusto.

A Short Explainer on Getting to a Laver Cup Decider

Andreescu, Medvedev e il futuro secondo Elo

di Jeff Sackmann // TennisAbstract

Pubblicato il 10 settembre 2019 – Traduzione di Edoardo Salvati

Con la vittoria agli US Open, che incrementa il bottino del 2019, Bianca Andreescu è finalmente entrata tra le prime 10 della classifica WTA, debuttando al quinto posto. Daniil Medvedev, che durante l’estate ha manipolato l’attenzione del circuito maschile, ha varcato la soglia dei primi 10 solo dopo Wimbledon. Ora occupa la quarta posizione.

Se a una classifica si richiede di predire il futuro, Elo è il sistema migliore. I pronostici fatti con Elo sono significativamente più precisi di quelli che usano i punti classifica. Il primo titolo Premier di Andreescu è arrivato a marzo a Indian Wells, dopo che ha battuto due tra le prime 10, cioè Elina Svitolina in semifinale e Angelique Kerber in finale. La classifica WTA ha reagito facendola salire al 24esimo posto dal numero 60. Già dopo la finale persa a Auckland, Elo vedeva in Andreescu una giocatrice con cui dover fare i conti, mettendola al settimo posto. Dopo altre tre vittorie a Miami, Andreescu è salita tra le prime 5 di Elo.

La prontezza di Elo

Gli algoritmi dietro le classifiche ufficiali impiegano del tempo per accorgersi della presenza di nuove stelle. Elo, invece, reagisce prontamente. Rispetto al metodo di calcolo di ATP e WTA che assegna punti in funzione di un anno di risultati (e in termini di turno raggiunto, non di bravura degli avversari), Elo assegna maggiore importanza a quelli più recenti, con ancora più enfasi per esiti inattesi, come ad esempio sconfitte a sorpresa dei giocatori di vertice.

Gli appassionati sono abituati alla lenta evoluzione della classifica ufficiale, quindi un numero [22] o [15] accanto al nome di Andreescu al Roland Garros e agli US Open non è sembrato fuori luogo. E un giudizio ponderato può avere la sua logica, considerati i passati esempi di giovanissimi che sono rimasti scottati. Elo però ha quasi sempre ragione. Se gli allibratori davano Serena Williams come super favorita nella finale a New York, Elo vedeva in Andreescu la giocatrice più in forma, pronosticandola vincitrice, seppur di poco. Dopo le sette vittorie agli US Open, Elo identifica ora Andreescu come la più forte del circuito, anche se con un margine risicato su Ashleigh Barty. Chi osa non essere d’accordo?

Sulla rampa di lancio

Quando lo scorso ottobre Medvedev ha messo piede tra i primi 10 delle valutazioni Elo per la prima volta, ho messo a confronto i due sistemi di classifica. La maggior parte dei giocatori che guadagna una posizione tra i primi 10 di Elo riesce prima o poi a entrare anche tra i primi 10 della classifica ufficiale, ma Elo è quasi sempre in anticipo. In media, l’algoritmo di Elo seleziona i primi 10 con più di sei mesi di vantaggio sul computer dell’ATP. Medvedev è un buon esempio: ha raggiunto l’ottavo posto di Elo a ottobre 2018, ma gli ci sono voluti altri dieci mesi per avere la stessa posizione nella classifica ufficiale, dopo la finale al Canada Masters.

Andreescu ha colmato il divario più velocemente di Medvedev, nei sei mesi che sono tipicamente richiesti a una giocatrice dall’ingresso tra le prime 10 di Elo a quello nella classifica ufficiale. E non dovrebbe servire molto altro tempo prima di una convergenza perfetta al numero uno delle due classifiche.

Non abbiamo bisogno di Elo per farci dire che Andreescu e Medvedev continueranno presumibilmente a vincere partite ad alto livello. Avendone però riconosciuto l’accuratezza predittiva, vale la pena guardare quali altri giocatori e giocatrici sono sulla rampa di lancio.

Berrettini e Muchova

Dopo gli US Open, la previsione più aggressiva riguarda Matteo Berrettini, che è attualmente al sesto posto. Nella classifica ATP Berrettini è tredicesimo, con una toccata e fuga tra i primi 20 durante l’estate, ed è tra i primi 10 di Elo da metà giugno, quindi ancor prima della semifinale agli US Open. Non solo, ma si trova davanti anche a giocatori giovani ma già avviati come Alexander Zverev e Stefanos Tsitsipas.

In campo femminile, non ci sono sorprese simili tra le prime 10 Elo, il che non significa che ci sia accordo con la classifica WTA. Karolina Muchova, 43esima nonché sua classifica migliore di sempre, è al 23esimo posto di Elo. Anche due veterane e pericoli costanti come Victoria Azarenka e Venus Williams sono confinate fuori dalle prime 40, ma Elo attribuisce loro rispettivamente un 18esimo e 28esimo posto. Da un punto di vista predittivo, la qualità è più importante della quantità, quindi un calendario ridotto non è necessariamente un limite. Elo è ottimista anche su Sofia Kenin, mettendola al 13esimo posto rispetto alla 20esima posizione ufficiale.

Giocatore            Elo   ATP   
Daniil Medvedev        4     4
Matteo Berrettini      6    13
Alexander Zverev       9     6 
Stefanos Tsitsipas    15     7

Giocatrice           Elo   WTA
Bianca Andreescu       1     5
Ashleigh Barty         2     1
Sofia Kenin           13    20
Victoria Azarenka     18    42
Karolina Muchova      23    43
Venus Williams        28    56

Da qui a sei mesi, scommetto che la classifica ufficiale di Berrettini sarà più vicina al sesto posto che al tredicesimo, mentre quella di Muchova più vicina al numero 23 che al 43. Conoscere il futuro è impossibile, ma se si vuole guardare avanti Elo è già li da sei mesi. Occorrerà aspettare per capire se il resto del circuito femminile è in grado di tenere Andreescu lontana dal numero 1 così a lungo.

Andreescu, Medvedev, and the Future According to Elo

I 19 Slam di Nadal, alla maniera di Marcel

di Jeff Sackmann // TennisAbstract

Pubblicato il 9 settembre 2019 – Traduzione di Edoardo Salvati

La distanza si è accorciata. Dopo la vittoria maratona nella finale degli US Open 2019 contro Daniil Medvedev, Rafael Nadal ha raccolto lo Slam numero 19 in carriera, dietro solo ai 20 di Roger Federer. In agguato al terzo posto si trova Novak Djokovic con 16, il favorito agli US Open quest’anno, ritiratosi poi agli ottavi di finale per infortunio.

Appena poche settimane fa, Djokovic appariva come la minaccia più seria per il primo posto di Federer nell’elenco dei vincitori Slam ma, impegnato a riprendersi da una nuova serie di problemi fisici, è Nadal ora ad avere l’abbrivio. Per Federer, che ha compiuto 38 anni a inizio agosto, la prospettiva di aggiungere un altro titolo è sempre più remota.

Recentemente, nel tentativo di prevedere l’evoluzione della classifica Slam, ho ideato un semplice algoritmo, ispirato a Marcel — il sistema di proiezioni del baseball che prende nome della scimmia della famosa serie televisiva “Friends” — così elementare che anche un primate potrebbe usarlo. Le informazioni da considerare sono essenziali: prestazioni nelle semifinali e finali Slam degli ultimi due anni, più l’età. Si scambia ottimizzazione con immediatezza e facilità di comprensione, e i risultati sono incredibilmente affidabili. Per maggiori dettagli sulla metodologia di calcolo e sul rendimento per gli anni passati, potete leggere il precedente articolo.

Risolvete per RN = 19 + x

Prima degli US Open, Marcel sembrava impostato per far arrabbiare il maggior numero di tifosi. Prediceva che, nel corso dei prossimi cinque anni, Djokovic avrebbe vinto quattro Slam, Nadal due e Federer nemmeno uno, lasciando i Grandi Tre in pareggio. Con la conclusione di un altro Slam, le cose sono cambiate. La tabella mostra la nuova previsione, che riflette sia la vittoria di Nadal a New York che un pronostico più roseo per lui dopo aver aggiunto un altro titolo ai risultati più recenti.

Giocatore   Slam  Previsione  Totale  
Nadal       19    3.5         22.5  
Federer     20    0.3         20.3  
Djokovic    16    3.5         19.5

Nadal è ora in corsa per migliorare il totale di almeno tre Slam. Al termine dei cinque anni, avrà forse lasciato Djokovic e Federer nella polvere e ci staremo chiedendo se sarà in grado di raggiungere Serena Williams o anche Margaret Court.

Più previsioni

Questo algoritmo di base consente di generare previsioni di Slam per qualsiasi giocatore che ha raggiunto almeno una semifinale negli ultimi due anni. È importante notare che non cerco di prevedere il totale Slam in carriera, ma solo quanti potrebbero essere vinti nei prossimi cinque anni. Per i Grandi Tre, è ragionevole non preoccuparsi del computo dopo il 2025.
La tabella riepiloga le previsioni attuali per 18 giocatori.

Giocatore       Previsione  
Djokovic        3.5  
Nadal           3.5  
Medvedev        0.8  
Thiem           0.7  
Tsitsipas       0.6  
Berrettini      0.5  
Chung           0.4  
Pouille         0.3  
Edmund          0.3  
Federer         0.3  
Dimitrov        0.1  
Cecchinato      0.1  
Cilic           0.0  
Del Potro       0.0  
Bautista Agut   0.0  
Anderson        0.0  
Nishikori       0.0  
Isner           0.0

La maggior parte di questi giocatori ha solamente una semifinale all’attivo nei due anni passati, ed è l’età a separarli. Sembra logico essere più ottimisti sul futuro negli Slam di Stefanos Tsitsipas (21 anni) che di Roberto Bautista Agut (31), anche se l’algoritmo li pone sullo stesso piano in funzione dei risultati sinora ottenuti, una semifinale negli ultimi 12 mesi.

Cinque anni equivalgono a 20 Slam, e si può notare che la tabella ne tralascia parecchi. Il totale pronosticato è infatti di 10.8 Slam, dando ampio margine di manovra a giocatori che ancora non si sono qualificati, come ad esempio Alexander Zverev e Felix Auger-Aliassime. Sono sicuro che agli US Open 2024 guarderemo alle previsioni di fine 2019 e ci faremo una risata.

Federer manterrà la prima posizione maschile della classifica più santificata nel tennis per almeno quattro mesi. Djokovic sarà probabilmente il favorito agli Australian Open 2020, quindi Federer può godersi almeno nove mesi da unico uomo con 20 Slam. Non serve però un algoritmo, nemmeno il più banale, per identificare il favorito al Roland Garros 2020. Il tennis maschile professionalmente organizzato è rimasto più di un secolo senza un campione con 20 Slam. In meno di un anno, potremmo averne due.

Monkeying Around With Rafael Nadal’s 19 Grand Slams

La fortuna del sorteggio: US Open 2019 (donne)

di Chapel Heel // HiddenGameOfTennis

Pubblicato il 26 agosto 2019 – Traduzione di Edoardo Salvati

Come per gli uomini, anche per le donne ho eseguito una simulazione (con la mia variante Elo) di 100.000 configurazioni del tabellone principale, utilizzando lo stesso metodo che gli organizzatori usano per assegnare alle giocatrici la loro posizione. L’ho poi confrontata con la previsione per il torneo su base Elo rispetto al tabellone effettivo.

La tabella mette a confronto la previsione effettiva del tabellone con i risultati dalle simulazioni di rimescolamento dell’intero campo partecipanti (a eccezione delle teste di serie numero 1 e 2, naturalmente), in modo da avere alcune indicazioni sull’accessibilità del tabellone effettivo rispetto alle altre configurazioni. Tonalità di rosso (e arancione) evidenziano la sfortuna della giocatrice. Al contrario, tonalità di verde rappresentano la fortuna ricevuta nel tabellone effettivo, in riferimento a un particolare turno. Il giallo simboleggia neutralità, e si può di fatto ignorare qualsiasi valore superiore o inferiore allo 0.2%.

Per una presentazione più compatta rispetto al passato, ho riportato nella tabella solo le teste di serie, e organizzato nella tabella successiva quelle giocatrici fuori dalle teste di serie per le quali c’è stata un’incidenza degna di nota (almeno l’1% di segno positivo o negativo).

Tabellone effettivo e simulato a confronto per le teste di serie

Il quarto di finale di Elina Svitolina ha proprio una brutta faccia (per il momento ha superato facilmente il primo turno contro Whitney Osuigwe, n.d.t.) . Sembra poi che anche Caroline Wozniacki (che ha superato il primo turno contro Yafan Wang, n.d.t.), Aryna Sabalenka (che ha battuto Victoria Azarenka al primo turno, n.d.t.) e Serena Williams siano state penalizzate dal tabellone effettivo, sebbene il sospetto è che sulla cella arancione di Williams al primo turno pesi in qualche modo una valutazione generosa di Elo della bravura di Maria Sharapova (Williams ha vinto infatti con un doppio 6-1, n.d.t.). La campionessa uscente Naomi Osaka ha il percorso più semplice tra le giocatrici con realistiche possibilità di aspirazione al titolo, rispetto a un tabellone casuale (anche se ha faticato al primo turno contro Anna Blinkova, vincendo in tre set dopo due ore e mezzo, n.d.t.).

IMMAGINE 1 – Confronto tra tabellone effettivo e simulazioni per le teste di serie

Effetti di rilievo su una selezione di giocatori fuori dalle teste di serie

Un tabellone più favorevole per Svetlana Kuznetsova con questa metodologia è dovuto in larga parte a rimanenze nella valutazione Elo di uno stato di forma che potrebbe essere scomparso (e così è stato, vista la sconfitta in due set al primo turno contro Kristie Ahn, n.d.t.), oltre ad avere due delle teste di serie più volubili nella sua sezione in Sloane Stephens (che infatti a perso contro Anna Kalinskaya al primo turno, n.d.t.) e Garbine Muguruza (anche lei perdente al primo turno contro Alison Riske, n.d.t.).

Mi sorprende vedere che il dato di Sharapova non sia peggiore, avendo al primo turno una delle tre giocatrici più forti di sempre.

IMMAGINE 2 – Effetti della casualità del sorteggio su alcune non teste di serie

Luck of the Draw US Open 2019 (Women)

La fortuna del sorteggio: US Open 2019 (uomini)

di Chapel Heel // HiddenGameOfTennis

Pubblicato il 26 agosto 2019 – Traduzione di Edoardo Salvati

Come d’abitudine per gli Slam, ho eseguito una simulazione (con la mia variante Elo) di 100.000 configurazioni del tabellone principale, utilizzando lo stesso metodo che gli organizzatori usano per assegnare ai giocatori la loro posizione. L’ho poi confrontata con la previsione per il torneo su base Elo rispetto al tabellone effettivo.

L’immagine 1 mette a confronto la previsione effettiva del tabellone con i risultati dalle simulazioni di rimescolamento, in modo da avere alcune indicazioni sull’accessibilità del tabellone effettivo rispetto alle altre configurazioni. Tonalità di rosso (e arancione) evidenziano la sfortuna del giocatore. Al contrario, tonalità di verde rappresentano la fortuna ricevuta nel tabellone effettivo, in riferimento a un particolare turno. Il giallo simboleggia neutralità, e si può di fatto ignorare qualsiasi valore superiore o inferiore allo 0.2%.

Per una presentazione più compatta rispetto al passato, ho riportato nella tabella solo le teste di serie, e organizzato nell’immagine 2 quei giocatori fuori dalle teste di serie per i quali c’è stata un’incidenza degna di nota (almeno l’1% di segno positivo o negativo).

Tabellone effettivo e simulato a confronto per le teste di serie

Rispetto a tabelloni casuali, la parte alta del tabellone principale è più difficile di quella bassa. Accade spesso quando Novak Djokovic e Roger Federer si ritrovano dallo stesso lato (in quella alto, vista la testa di serie numero 1 di Djokovic) in un torneo che non sia su terra battuta. Ho eseguito la stessa simulazione prima che si conoscessero i qualificati e la strada di Djokovic al quarto di finale non era così in discesa. Kevin Anderson non sarebbe stato l’Anderson da potenziale semifinale e Milos Raonic non sarebbe stato al massimo della forma, ma i ritiro di entrambi ha facilitato, almeno in termini di valutazioni Elo, il tabellone di Djokovic. Le cose per lui poi si complicano, vista la presenza di Federer invece che di Dominic Thiem. Per la stessa ragione, il percorso di Nadal alla finale è verniciato di verde.

Non ci si deve sorprendere dal rosso vivo nel tabellone di Stefanos Tsitsipas, visto che il suo primo turno assomiglia di più a un quarto turno (e in effetti Tsitsipas ha perso in quattro set contro Andrey Rublev, n.d.t.). Rispetto a un tabellone casuale, Kei Nishikori ha il cammino più facile fino ai quarti di finale, ma la possibilità di approfittane è molto legata al recupero dall’indisposizione subita a Cincinnati e al livello di umidità a New York. Anche Daniil Medvedev, il giocatore più “infuocato” in questo periodo, ha un percorso più semplice del previsto. Avrà ancora benzina a sufficienza? (Medvedev ha superato il primo turno in tre set contro Prajnesh Gunneswaran, n.d.t.)

Particolare attenzione va data all’apparente fortuna di Diego Schwartzman fino ai quarti di finale. Elo ignora che al primo turno Schwartzman deve giocare contro Robin Haase, per lui una vera e propria kryptonite, considerato un record negli scontri diretti di 0-5 con una sconfitta su ogni superficie (Schwartzman si è riscattato vincendo in tre set, n.d.t.).

IMMAGINE 1 – Confronto tra tabellone effettivo e simulazioni per le teste di serie

Effetti di rilievo su una selezione di giocatori fuori dalle teste di serie

Non ci sono qui problematiche degne di nota. Il vincitore di Winston Salem Hubert Hurkacz ha il percorso peggiore (perdendo al primo turno contro Jeremy Chardy in cinque set, n.d.t.), mentre Philipp Kohlschreiber riesce (purtroppo) a finire di nuovo in questo elenco (perdendo al primo turno contro Lucas Pouille in quattro set, n.d.t.).

IMMAGINE 2 – Effetti della casualità del sorteggio su alcune non teste di serie

Luck of the Draw: US Open 2019 (Men)

Fare previsioni sul migliore di sempre con l’aiuto di una scimmia

di Jeff Sackmann // TennisAbstract

Pubblicato il 3 agosto 2019 – Traduzione di Edoardo Salvati

Dopo la vittoria di Novak Djokovic a Wimbledon, l’attenzione al primato negli Slam è salita alle stelle. Roger Federer è a 20, Rafael Nadal a 18 e Djokovic, ora a 16, è di gran lunga il più forte del mondo sulla superficie dei prossimi due, gli US Open e gli Australian Open. La corsa è assolutamente aperta.

Fare previsioni nel tennis è difficile, anche cercando di pronosticare i risultati delle partite del giorno dopo. Sembra che i giocatori migliorino e peggiorino in modo del tutto casuale, rendendo difficile capire quale sarà la classifica anche a pochi mesi di distanza. Appassionati e tifosi amano perdersi in congetture su chi dei Grandi Tre s’impossesserà della vetta degli Slam, ma troppa incertezza non permette conclusioni definitive.

Si può pensare di costruire una sfera di cristallo con cui analizzare la problematica in modo rigoroso. Prendiamo ad esempio l’età di un giocatore, la probabile durata della carriera, gli eventuali infortuni, il rendimento negli ultimi quattro Slam, la classifica attuale, la bravura degli altri giocatori su ciascuna superficie e altri possibili parametri. Forse si riesce a determinare qualche numero che abbia un senso. E se invece ignorassimo tutto questo, adottando il modello più semplice in assoluto?

Vi presento la scimmia

I patiti di statistiche di baseball hanno familiarità con il sistema di proiezioni Marcel, così chiamato in onore della scimmia nella famosa serie televisiva “Friends”, perché “utilizza meno intelligenza possibile”. Nel caso del baseball, appena tre anni di risultati e una correzione per il fattore età. Non è immune da lacune, e sono evidenti i molti miglioramenti che si potrebbero apportare. Ma, come nel tennis, anche nel baseball le statistiche producono rumore. Per la maggior parte degli scopi, un sistema previsionale “di base” funziona tanto quanto uno più complesso. E, nel corso degli anni, Marcel ha fatto meglio di molti modelli considerevolmente più evoluti.

Applichiamo la logica del mammifero alle previsioni per gli Slam. Per prima cosa, riformulo leggermente la domanda alla ricerca di una risposta più diretta. Invece di prevedere i risultati Slam “in carriera”, mi concentro sulle vittorie per i prossimi cinque anni (includendo, quantomeno a occhio, il cammino completo dei Grandi Tre). Inoltre, nello spirito di Marcel, limito i dati a semifinali, finali e titoli Slam per gli ultimi tre anni, e l’età dei giocatori. Anzi, spengo subito una parte del cervello da scimmia, perché i risultati relativi agli Slam di tre anni fa possiedono scarso potere predittivo. Quindi l’elenco si riduce a due anni di semifinali, finali e titoli Slam, più l’età.

Una buona approssimazione

Il modello che ne consegue è molto valido! Per quei giocatori che hanno raggiunto una semifinale degli ultimi otto Slam, è in grado di prevedere il 40% della variazione nei titoli Slam dei prossimi cinque anni. In assenza di un modello iper-complesso e ottimale, non so esattamente dire dove si posizioni, ma per un orizzonte così lungo prevedere quasi la metà della variazione di risultati Slam giocatore per giocatore è, per me, una buona approssimazione.

Si pensi a tutto ciò che si ignora degli Slam per il 2022, ancor più per il 2024: chi è in attività, chi si è infortunato, chi è migliorato a sufficienza per essere considerato un favorito, quali promesse sono emerse dal nulla, e così via. Voglio dire che anche il modello più perfetto avrebbe molte carenze, quindi non serve stabilire uno standard troppo alto.

Andare dietro alla scimmia

L’algoritmo dei due anni più l’età è così semplice da poter essere eseguito sul retro di una scatola di sigarette (in omaggio al grande fisico Ettore Majorana, n.d.t.). Per il singolo giocatore, si contano le semifinali (vinte o perse), le finali (vinte o perse) e i titoli degli ultimi quattro Slam, e si fa lo stesso per i precedenti quattro. Si considera poi l’età all’inizio dello Slam successivo. Si parte con zero punti e si procede come segue:

  • si aggiungono 15 punti per ogni semifinale degli ultimi quattro Slam
  • si aggiungono 30 punti per ogni finale degli ultimi quattro Slam
  • si aggiungono 90 punti per ogni titolo degli ultimi quattro Slam
  • si aggiungono 6 punti per ogni semifinale dei precedenti quattro Slam
  • si aggiungono 12 punti per ogni finale dei precedenti quattro Slam
  • si aggiungono 36 punti per ogni titolo dei precedenti quattro Slam
  • se il giocatore ha più di 27 anni, si sottraggono 8 punti per ogni anno dopo il 27esimo
  • se il giocatore ha meno di 27 anni, si aggiungono 8 punti per ogni anno fino al 27esimo
  • si divide la somma per 100.

Un test con Djokovic

Finito! Proviamo con Djokovic. Negli ultimi quattro Slam (fino a Wimbledon 2019 incluso), ha vinto tre titoli e raggiunto una semifinale. Dei quattro precedenti, ne ha vinto uno. Agli US Open 2019 avrà 32 anni. Quindi:

  • +60 (15 punti per ognuna delle semifinali negli ultimi quattro Slam)
  • +90 (30 punti per ognuna delle tre finali negli ultimi quattro Slam)
  • +270 (90 punti per ognuno dei tre titoli negli ultimi quattro Slam)
  • +6 (6 punti per la semifinale a Wimbledon 2017)
  • +12 (12 punti per la finale a Wimbledon 2017)
  • +36 (36 punti per il titolo a Wimbledon 2017)
  • -40 (Djokovic ha 32 anni, si sottraggono 8 punti per ognuno dei cinque sopra ai 27).

Sommando, si ottiene 434 che, diviso per 100, genera una previsione di altri 4.34 Slam per Djokovic.

Un nuovo livello di provocazione nella discussione sul più forte di sempre

Avete la mia parola che si tratta di un’analisi totalmente disinteressata. Voglio solo sapere quanto un’accurata previsione Slam di lungo periodo, seppur ridotta all’osso, riesca a essere precisa. Non ho l’intento di farvi perdere i capelli che, temo di dovervi confessare, perderete comunque prima o poi.

Questo è il numero di Slam che il modello prevede per i Grandi Tre tra gli US Open 2019 e Wimbledon 2024:

  • Djokovic, 4.34
  • Nadal, 2.22
  • Federer, 0.26.

Non serve che mostri i calcoli per il passo successivo, ma sapete che non posso esimermi dal farli. Questa è la previsione per il totale in carriera:

  • Djokovic, 20.34
  • Federer, 20.26
  • Nadal, 20.22.

Siccome viviamo in un mondo dove non si vincono frazioni di Slam, abbiamo:

  • Djokovic, 20
  • Federer, 20
  • Nadal, 20

Molto bene…

Torniamo al modello

La previsione di 4.34 Slam per Djokovic è decisamente alta, in linea con un giocatore che ne ha vinti tre degli ultimi quattro. Per ogni anno dal 1971, ho calcolato le previsioni Slam di ciascun giocatore che ha raggiunto una semifinale nei due anni precedenti, un totale di più di 800 previsioni. Solo 14 sono superiori a 4.34, e molte riguardano i Grandi Tre. La tabella riepiloga le prime dieci.

Anno  Giocatore   Età   Previsione   Effettivo     
2008  Federer     26    6.38         5     
2007  Federer     25    5.86         7     
2016  Djokovic    28    5.20         6 *  
2005  Federer     23    4.91         11     
2011  Nadal       24    4.89         5     
2006  Federer     24    4.86         10     
2017  Djokovic    29    4.79         4 *  
2012  Djokovic    24    4.68         8     
1989  Wilander    24    4.65         0     
1988  Lendl       27    4.56         2

* conteggio che potrebbe ancora aumentare

Sono previsioni basate sui dati disponibili all’inizio dell’anno che compare nell’elenco. La prima riga, Federer 2008, si riferisce alla previsione per Federer dei titoli Slam per il periodo dal 2008 al 2012, in funzione del rendimento nel 2006 e 2007 e sull’età agli Australian Open 2008. Se avessi concepito il modello a quel tempo, la previsione si sarebbe attestata intorno alla mezza dozzina di Slam. Federer ne ha vinti cinque.

Ci sarà sempre molto rumore statistico agli estremi di modelli come questi. All’inizio del 2005, l’algoritmo avrebbe assegnato a Federer “solo” cinque dei successivi venti Slam. Invece, ne vinse ben 11. Faccio fatica però a credere che ci fosse stato anche un modello talmente ottimistico da indovinare la doppia cifra. L’edizione 1989 del modello invece sarebbe stata generosa in senso opposto con Mats Wilander, che nel 1988 aveva fatto tre quarti di Slam. Tristemente per lo svedese, un gruppetto di giovanissimi gli passò avanti e non raggiunse più nemmeno una finale.

Diamo uno sguardo anche alle successive dieci previsioni più rosee, e alla stima attuale per Djokovic.

Anno  Giocatore   Età   Previsione   Effettivo     
2010  Federer     28    4.48         2     
1981  Borg        24    4.47         1     
1996  Sampras     24    4.47         6     
1975  Connors     22    4.45         2     

Att.  Djokovic    32    4.34         0 *  

1980  Borg        23    4.28         3     
2013  Djokovic    25    4.24         7     
2009  Federer     27    4.20         4     
1995  Sampras     23    4.16         7     
2009  Nadal       22    4.12         8     
1979  Borg        22    4.09         5

* conteggio che potrebbe ancora aumentare

Di nuovo molto rumore, con risultati tra 0 e 8 Slam. Però, la media delle altre dieci previsioni in elenco è di 4.5 Slam, esattamente in linea con la precedente previsione per Djokovic.

Slam che mancano…

Il modello prevede che i Grandi Tre vincano circa sette dei prossimi venti Slam. Giustamente vi chiederete: e gli altri tredici? La scimmia considera solo i giocatori con una semifinale negli ultimi otto Slam, quindi la somma complessiva non dovrebbe fare venti. Esiste la possibilità che vincitori del 2023 e 2024 non siano ancora nel radar, e molti dei giovani sulla bocca degli opinionisti —come Alexander Zverev, Felix Auger-Aliassime e Daniil Medvedev — non hanno ancora raggiunto una finale Slam. La tabella riepiloga i giocatori per i quali è possibile fare una previsione.

Giocatore         Previsione Slam  
Djokovic          4.34  
Nadal             2.22  
Thiem             0.71  
Tsitsipas         0.63  
H. Chung          0.38  
Pouille           0.31  
Edmund            0.30  
Federer           0.26  
Del Potro         0.19  
Cecchinato        0.06  
----------------  ----  
TOTALE            9.40

* Per gli altri cinque giocatori con una semifinale 
dagli US Open 2017 la previsione di titoli Slam è zero

Sono consapevole che Lucas Pouille e Hyeon Chung non hanno più probabilità di vincere uno Slam di quante ne abbia Federer. Ma sono (relativamente) giovani e il modello riconosce a molti giocatori che hanno raggiunto una semifinale Slam all’inizio della carriera la capacità di gettare le basi sul quel successo.

Oltretutto, ci stiamo perdendo molti Slam. Se la previsione complessiva è corretta, quei giocatori vinceranno meno della metà dei prossimi venti Slam, lasciando almeno dieci titoli a giocatori che ancora devono arrivare a un quarto di finale Slam.

…e il fattore età

Se vi ricordate, ho proceduto a ritroso nelle previsioni per ciascun intervallo di cinque anni fino al 1971-1975. Su 44 anni dall’avvio delle stagioni tra il 1971 e il 2014, il modello tipicamente ha previsto che i giocatori di cui aveva dati — vale a dire quelli con semifinali Slam nei precedenti due anni — avrebbero vinto 13 dei successivi 20 Slam. In realtà, i giocatori nel radar hanno vinto in media 12 Slam nei cinque anni a venire.

È solamente negli ultimi anni che il numero totale di Slam previsti è sceso sotto i 10. La colpa è dell’età: come detto, per correggere per l’età si sottraggono 8 punti (0.08 Slam) per ogni anno oltre i 27. Per Djokovic e Nadal si tratta di una penalizzazione di 0.4 Slam, mentre sono 0.8 gli Slam cancellati dalla futura bacheca di Federer. Accade che il modello prevede il calo di rendimento dei Grandi Tre, e al contempo non ci sono molti giovani (come Pouille e Chung) nell’elenco in grado di compensarlo.

Nuove curve d’invecchiamento

L’interpretazione delle previsioni per i Grandi Tre alla luce degli Slam “mancanti” dipende da un paio di elementi:

  • la curva d’invecchiamento per le mega stelle è cambiata? I 30 sono i nuovi 25, o i 32 i nuovi 27?
  • la nuova generazione di giocatori riuscirà a essere forte abbastanza in fretta da scardinare la presa dei Grandi Tre?

C’è abbondanza di prove a dimostrazione di una modifica della curva d’invecchiamento, dovremmo cioè aspettarci risultati migliori dai trentenni di questa epoca rispetto a quanto accadeva negli anni ’80 e ’90. Questo ridurrebbe gran parte del divario. Ipotizziamo di spostare l’età di massimo picco a 31 anni, quattro in più rispetto alla media maschile di 27 per l’era Open. Così facendo aggiungiamo 0.32 Slam alla previsione di ogni giocatore, probabilmente aumentando di uno il computo previsto per i Grandi Tre. Complessivamente, vorrebbe dire portare il totale della precedente tabella a un po’ più di tre Slam addizionali, avvicinandosi alla media storica di 13 Slam. La variazione di età non sbroglia però la matassa dei Grandi Tre, perché li riguarda allo stesso modo. Solo, essere in parità a 21 Slam diventa leggermente più probabile che esserlo a 20 Slam.

La difficoltà di prevedere il livello di competizione

La seconda domanda è quella più importante, ma anche la meno pronosticabile. Pur risolvendo l’ostica incombenza di arrivare a conoscere il rendimento del singolo giocatore tra tre, quattro o cinque anni (e a volte, come nel caso di Nick Kyrgios, anche domani), rimarremmo comunque con l’ancora più difficile questione di prevedere il livello della competizione.

Nel 2003, la scimmia sarebbe stata convinta che i giocatori di vertice del momento, quelli che avevano raggiunto semifinali Slam nel 2001 e 2002, avrebbero raccolto 13 Slam tra il 2003 e il 2007. Erano 2.5 per Lleyton Hewitt, più uno a testa per Thomas JohanssonAlbert CostaPete SamprasMarat SafinDavid NalbandianJuan Carlos Ferrero. Questi sette giocatori ne hanno poi vinti solo due. L’intero gruppo di venti giocatori meritevoli di previsioni alla vigilia degli Australian Open 2003 ne ha vinti solo 3.

Non riusciremo probabilmente mai a stabilire con esattezza la bravura di quel gruppo rispetto ad altre epoche. La certezza che abbiamo è che nessuno è stato forte quanto Federer tra il 2003 e il 2005 e che, alla fine del periodo di cinque anni, anche Nadal è entrato a dominare la scena (solo Nalbandian era tra i primi 10 in classifica alla fine del 2007). La generazione degli Zverev/Tsitsipas/Auger-Aliassime/etc non raggiungerà l’apice toccato dai Fantastici Quattro, ma l’andamento dei prossimi venti Slam dipenderà più da loro che dalla (relativamente) più prevedibile traiettoria di carriera di Djokovic, Federer e Nadal.

Non ci rimane che un mucchio di incertezze già note ed errori con una parabola più ampia di un rovescio steccato di Federer. Però, rispetto a quanto sappiamo, la vetta della classifica Slam di tutti i tempi diventerà ancora più affollata.

Così parlo la scimmia.

GOAT Races: Forecasting Future Slams With a Monkey

Una statistica per le partite assolutamente da non perdere

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 9 agosto 2019 – Traduzione di Edoardo Salvati

Per l’appassionato di tennis, la scelta di quale partita guardare in un qualsiasi torneo è spesso fonte di grattacapo. In questo articolo, cerco di determinare quanto una partita è imperdibile in funzione della sua qualità e competitività, ricorrendo alle valutazioni dei giocatori.

Molte volte in passato, o anche per la trasferta nordamericana in corso, l’abbondante offerta di partite televisive vi avrà certamente posto di fronte a un bivio. Conoscete il motivo della scelta che avete fatto? Avete optato per la partita in programma sul campo più importante? Per il giocatore con la classifica più alta? O avete seguito il vostro istinto sulla partita che pensavate sarebbe stata più equilibrata?

Specialmente nei primi turni di eventi congiunti tra donne e uomini, il timore di rimanere lontani dal centro dell’azione è una delle circostanze che genera più ansia per il vero seguace di tennis. Naturalmente, la possibilità di cambiare canale per una o l’altra partita ci convince che, in fondo, prendere una decisione non è obbligatorio. Ma non è questo il modo di mantenere viva la passione.

Dove sarà l’esperienza visiva più emozionante?

Forse è solo perché sto invecchiando, ma mi capita spesso di desiderare che la scelta sulla partita da guardare fosse più semplice. O che avessi almeno modo di prevedere dove sarà l’esperienza visiva più emozionante in qualsiasi istante. Di solito, faccio riferimento alle quotazioni assegnate dagli allibratori alle partite in programma, così da avere un’idea di quelle il cui esito finale è considerato più incerto. Mi accorgo però poi che la mia propensione non è sempre per la partita più combattuta. Complessivamente, anche la qualità è un fattore chiave. E sarei disposta ad accettare quote meno favorevoli se il livello di gioco di entrambi i giocatori rimanesse ragionevolmente alto.

Ne ho parlato a lungo con Martin Ingram, già ospite del blog, che condivide l’ossessione per interrogativi di questo tipo e che riesce sempre a trovare una soluzione ingegnosa alla maggior parte dei problemi prima che a me venga in mente. Siamo d’accordo sul fatto che competitività e qualità non sono elementi sufficienti a far decollare una grande partita (stili differenti e scontri diretti sono altri due, ad esempio), ma certamente permettono di pescare nel mucchio con buona probabilità di riuscita.

L’idea di base è di arrivare a una statistica che unisca una misura della qualità e della competitività. In termini matematici:

Partita imperdibile = Competitività + Qualità

Visto che le valutazioni dei giocatori sono il sistema principale per misurarne la bravura relativa, possiamo prenderle a riferimento sia in termini di abilità complessiva (la qualità) che in termini di divario di capacità tra un giocatore e l’altro (competitività).

Qualità

Per definire la qualità, basta la semplice somma delle valutazioni dei giocatori. È un concetto simile a quello del “bonus” secondo la descrizione di Klaasen e Magnus. L’immagine 1 mostra la distribuzione della qualità per le partite del circuito maggiore nel 2019. Pur con una media leggermente più alta per gli uomini, in entrambi i casi assistiamo a un’importante deviazione verso destra. Quella coda, il gruppo di partite con valore maggiore di 5000, racchiude gli scontri di più alta qualità della stagione.

IMMAGINE 1 – Distribuzione della qualità per le partite dei due circuiti maggiori nel 2019

Competitività

Nella sostanza, la competitività invece si riduce al divario tra le valutazioni dei giocatori. Questo è il “malus” nel linguaggio di Klaasen e Magnus. Anzi, la differenza di valutazioni è l’unica quantità veramente casuale nei pronostici sia con Elo che con altri sistemi di previsioni basati sulla comparazione tra giocatori.

IMMAGINE 2 – Distribuzione della competitività per le partite dei due circuiti maggiori nel 2019

La distribuzione di competitività nell’immagine 2 mostra scarsa differenza tra i due circuiti. Inoltre, la pesante deviazione verso destra segnala che è più tipico trovarsi di fronte a una partita molto equilibrata che a una a senso unico. Staremmo parlando di uno sport molto più interessante se la distribuzione non esibisse questo tipo di distorsione.

Da un lato, abbiamo molte partite di qualità ma pochissime di massima qualità, mentre dall’altro sono minori le partite competitive ma è relativamente più frequente che una partita sia competitiva di quanto sia a senso unico. In presenza di proprietà tra loro opposte, come riusciamo a mettere insieme queste due misure?

Un solo numero

Un’idea è quella di concentrarsi sulla qualità, prevedendo però una penalizzazione in funzione della scarsa competitività. Si esprime la competitività come la probabilità di vittoria attesa per il giocatore più forte, per poi quantificare la probabilità di vittoria attesa rispetto alla partita più competitiva (quella in cui la probabilità di vittoria è del 50%).

Partita imperdibile = (Qualità – Media)*(1-(p(v)-0.5))

In questo modo, il valore delle partite con qualità sopra la media è ridotto in proporzione della distanza in punti percentuali da una partita equilibrata. Possiamo verificare in concreto il funzionamento di questo approccio guardando alle prime dieci partite imperdibili del 2019 per uomini e donne. Anche se l’obiettivo dichiarato è di stabilire il livello di qualità tra partite della stessa settimana e turno di gioco, possiamo comunque ricavare una prima impressione della validità della statistica.

Il predominio dei Grandi Tre tra gli uomini e quello di Simona Halep, Serena Williams e Ashleigh Barty tra le donne suggerisce che siamo sulla buona strada. In retrospettiva, un paio di partite non hanno mantenuto il carico d’interesse atteso alla vigilia, fra tutte la finale maschile degli Australian Open e la finale femminile di Wimbledon.

Naturalmente, non ho la pretesa che la statistica per le partite assolutamente da non perdere qui introdotta incontri un favore universale. Sono convinta però che fondendo i due ingredienti chiave di una partita in un solo numero, si ha a disposizione un valido strumento per scegliere cosa vedere in televisione o analizzare a ritroso quali sono state le partite che hanno confermato o disatteso le aspettative riposte.

A Stat for Must-See Matches

Federer non è stato dominante nei momenti chiave, ma ci è andato vicino

di Jeff Sackmann // TennisAbstract

Pubblicato il 26 luglio 2019 – Traduzione di Edoardo Salvati

Le statistiche della finale di Wimbledon raccontano una storia senza ombre. Per cinque set, Roger Federer ha fatto molte cose leggermente meglio del suo avversario, Novak Djokovic, che però ha poi vinto di misura perché si è aggiudicato i punti più importanti, un dettaglio che non emerge dai numeri con la stessa nitidezza.

Superando le statistiche tradizionali, possiamo quantificare il dominio nei momenti che fanno la differenza. Un metodo che supera il semplice conteggio delle palle break o dell’individuazione dei passaggi chiave più ovvi in una partita è l’indice di leva per assegnare un valore a ciascun punto, in funzione dell’importanza. Dopo ogni singolo punto della partita, possiamo calcolare una nuova probabilità di vittoria per entrambi i giocatori. Un punto come quello da giocare sul 5-5 in un tiebreak è potenzialmente in grado di alterare la probabilità di vittoria in misura massiccia, mentre così non è per quello sul 40-15 del primo game.

La leva quantifica il potenziale. In media, in una partita al meglio dei cinque set un punto possiede una leva di circa il 4%, ma per i punti più importanti si parla di diverse volte quel valore. Un altro modo per identificare quando un giocatore è predominante è vedere il numero sproporzionato di punti ad alta leva che vince anche di fronte a una prestazione inferiore in quelli a bassa leva.

L’indice di leva

In un recente articolo sulla finale di Wimbledon per l’Economist, ho approfondito ulteriormente il concetto. Djokovic ha vinto meno punti rispetto a Federer, ma quelli che ha vinto hanno contato di più. La leva media dei punti per lui è stata infatti del 7.9%, rispetto al 7.2% di Federer. Possiamo presentare questa differenza sotto forma di indice di leva (Leverage Ratio o LR), dividendo 7.9% per 7.2%, con un risultato di 1.1. Un indice così alto non è insolito. Nelle più di 700 partite Slam maschili del Match Charting Project, l’LR del giocatore più dominante è in media di 1.11. L’eccellenza di Djokovic nei momenti chiave non è stata nemmeno così unica, ma in una partita di quell’equilibrio è bastata a fare la differenza.

Con un indice di leva superiore a 1.0, la vittoria non è comunque garantita. In circa il 30% di queste 700 partite al meglio dei cinque set la vittoria è andata al giocatore che, in media, ha vinto meno punti importanti dell’avversario. Alcune situazioni di vincitori con basso indice di leva quasi rasentano la comicità, come la finale del Roland Garros 2008 in cui Rafael Nadal ha demolito Federer nonostante un LR di 0.77.

Aumento della comprensione

Nelle partite a senso unico non c’è molta leva a disposizione, quindi il numero dei punti vinti ha molta più rilevanza di quando sono stati vinti. Spesso prestazioni non dominanti si traducono in vittorie di partite ancora più equilibrate, come quella di Andy Murray nella semifinale degli US Open 2018 in quattro set contro Nadal nonostante un LR di 0.80, o la super equilibrata semifinale a Wimbledon 2018 in cui Kevin Anderson ha battuto John Isner con un LR di 0.88.

Non serve un foglio di calcolo per capire che le partite di tennis vengono decise da una combinazione di rendimento complessivo e rendimento nei momenti importanti. I numeri che ho citato non portano avanti la nostra comprensione di molto, quantomeno non in modo rigoroso. È questo il prossimo passo.

Indice di leva, ti presento l’indice di leva bilanciato

Coloro che frequentano regolarmente Tennis Abstract hanno familiarità con l’indice di dominio (Dominance Ratio o DR), una statistica inventa da Carl Bialik al fine di riclassificare i punti vinti totali. Il DR si ottiene dalla divisione tra i punti vinti alla risposta e i punti persi al servizio, in modo che il valore medio sia esattamente 1.0. Solitamente, chi vince ha un valore superiore a 1.0 e chi perde un valore inferiore a 1.0.

Nella finale di Wimbledon, il DR di Djokovic è stato di 0.87, estremamente basso per un vincitore, se non addirittura inedito. Il DR compensa gli effetti generati del rendimento al servizio e alla risposta (a differenza dei punti vinti, che possono deviare in una o l’altra direzione a seconda che ci siano più punti al servizio che alla risposta, o viceversa) e sintetizza in un solo numero la qualità della prestazione complessiva.

Equa distribuzione tra servizio e risposta

Non dice però nulla relativamente al dominio nei momenti chiave, tranne quando un giocatore vince con un valore basso del DR, da cui si può dedurre che abbia controllato l’avversario sui punti più caldi.

Per avere una prospettiva bilanciata simile in presenza di rendimenti ad alta leva, possiamo adattare l’indice di leva LR soppesando equamente il dominio nei momenti chiave sia al servizio che alla risposta. Chiamo questa statistica indice di leva bilanciato (Balanced Leverage Ratio o BLR), cioè la media semplice dell’LR nei punti al servizio e dell’LR nei punti alla risposta. Il BLR di solito non si scosta di molto dall’LR, così come spesso otteniamo le stesse informazioni dal DR che dai punti totali. Il BLR di Djokovic nella finale di Wimbledon è stato di 1.11, rispetto a un LR di 1.10. Nelle partite in cui però un numero sproporzionato di punti si giocano sulla racchetta di un giocatore, il BLR fornisce il necessario aggiustamento.

DR corretto per leva

Siamo in grado di registrare rendimenti corretti per leva semplicemente moltiplicando questi due numeri. Ad esempio, prendiamo la vittoria di Stanislas Wawrinka contro Djokovic nella finale degli US Open 2016. Il DR di Wawrinka è stato di 0.90, più alto di quello di Djokovic a Wimbledon 2019 ma difficilmente sufficiente a trionfare. Eppure ha vinto, grazie a un BLR di 1.33, uno dei più alti mai registrati in una finale Slam. Il prodotto tra il DR e il BLR di Wawrinka — che chiameremo DR+ — è pari a 1.20. Lo si può interpretare con la stessa scala di un DR “normale”, dove 1.2 è spesso identificativo di una vittoria con margine ridotto, se non di una al cardiopalma.

Di 167 finali Slam maschili nel Match Charting Project, 14 giocatori hanno vinto nonostante un DR “normale” inferiore a 1.0. Per ciascuno di essi, il BLR era superiore a 1.1, e in 13 delle 14 occorrenze, la forza del BLR del vincitore ha “cancellato” la debolezza del suo DR, nel senso che il DR+ è stato superiore a 1.0. La tabella riepiloga quelle partite, ordinate per DR+ crescente.

Anno  Slam              Vincitore    DR     BLR    DR+  
2019  Wimbledon         Djokovic     0.87   1.11   0.97  
1982  Wimbledon         Connors      0.88   1.20   1.06  
2001  Wimbledon         Ivanisevic   0.95   1.16   1.10  
2008  Wimbledon         Nadal        0.98   1.13   1.10  
2009  Australian Open   Nadal        0.99   1.13   1.12  
1981  Wimbledon         McEnroe      0.99   1.16   1.15  
1992  Wimbledon         Agassi       0.97   1.19   1.16  
1989  US Open           Becker       0.96   1.22   1.18  
1988  US Open           Wilander     0.98   1.21   1.18  
2015  US Open           Djokovic     0.98   1.21   1.18  
2016  US Open           Wawrinka     0.90   1.33   1.20  
1999  Roland Garros     Agassi       0.98   1.25   1.23  
1990  Roland Garros     Gomez        0.94   1.34   1.26  
1991  Australian Open   Becker       0.99   1.30   1.29

Prima finale vinta dal giocatore con il DR+ inferiore

In 167 finali Slam, quella tra Djokovic e Federer è stata la prima vinta dal giocatore con il DR+ più basso (alcuni dei campioni che non compaiono in elenco hanno avuto indici di leva sotto tono e conseguenti DR+ inferiori ai DR, ma nessuno sotto il livello di 1.0). Sebbene Federer è stato più debole nei momenti importanti — in particolare nei tiebreak e quando ha avuto i due match point — il rendimento complessivo in quel tipo di situazione non è stato così scadente come quei pochi memorabili momenti farebbero pensare. È più probabile che un giocatore con un DR di 1.14 e un BLR di 0.90 come quelli di Federer concluda le due settimane di Wimbledon ballando con la campionessa del tabellone femminile.

Sorprendentemente, 1 su 167 potrebbe sottostimare la rarità di un vincitore con un DR+ inferiore a 1.0. Solo una delle partite al meglio dei cinque set nel database del Match Charting Project (su più di 700) possiede quel requisito. Si tratta del controverso quarto turno degli Australian Open 2019 tra Kei Nishikori e Pablo Carreno Busta. Nishikori ha vinto con un DR di 1.06, ma il suo BLR è stato di 0.91, relativamente debole e che ha portato a un DR+ di 0.97. Come per la finale di Wimbledon, anche la partita di Melbourne avrebbe potuto avere un altro vincitore. La fortuna è stata avversa a Carreno Busta non solo per le chiamate arbitrali.

Qual è il significato di tutto questo?

Sappiamo che la finale di Wimbledon è stata in estremo equilibrio, ora abbiamo più numeri che mostrano quanto effettivamente lo sia stata. Sapevamo che Djokovic gioca meglio quando conta di più, ora abbiamo più riferimenti sulla sua maggior bravura, che però non si discosta di un margine insolitamente ampio.

Federer ha vinto cinque dei venti Slam nonostante un BLR nella finale inferiore a 1.0, e altri due con un DR inferiore a 1.14. Non ha mai vinto uno Slam con un DR+ non superiore a 1.03, ma va anche detto che non c’è mai stata una finale Slam che il DR+ ha considerato così ravvicinata. Federer non è la definizione di maestro dei momenti chiave, ma non è poi così malvagio. Avrebbe solamente dovuto portare con sé un po’ di quella dose di domino con cui ha chiuso il secondo set per passaggi più importanti nelle fasi successive.

Se siete anche voi come me, dopo aver letto fino a questo punto non smetterete di farvi domande. Ho riflettuto su alcune che spero di approfondire analogamente. Si può dire che Federer di solito è meno dominante della media nei momenti chiave? (Si). Djokovic è molto più bravo a quel riguardo? (Si). E Nadal? (Anche lui è più bravo). Nadal è davvero migliore, o i suoi numeri sulla leva sono di partenza buoni perché i punti importanti si giocano più spesso sul lato dei vantaggi? (È davvero migliore). Djokovic ha preso le misure a Federer? (Non proprio, a meno che non s’intenda il suo numero di scarpe, allora in quel caso sì). È cambiato tutto dopo che Djokovic ha tirato la famosa risposta? (No).

Rendimenti situazionali

Ci sono anche molti argomenti interessanti che vanno oltre i Grandi Tre. Ho iniziato qualche anno fa a scrivere della leva relativa a sottoinsiemi di partite, spinto dalla semifinale di Wimbledon 2016 tra Federer e Milos Raonic, nella quale Federer ha subito la pressione quando più contava. Come possiamo analizzare la leva media per punti vinti e persi, così riusciamo a stimare l’importanza dei punti in cui un giocatore ha servito un ace, commesso un errore non forzato di rovescio, o scelto di andare a rete.

Le partite sono decise da una combinazione di rendimento complessivo e giocate di alta leva. Le statistiche comunemente disponibili illustrano bene le dinamiche del primo, ma non sono adeguate per fare chiarezza sulle seconde. Il dominio nei momenti chiave è lasciato alle congetture degli opinionisti. Con un insieme di partite in continuo aumento e l’accesso a sempre più dati punto per punto (e quindi a numeri sulla leva per ogni punto e ogni partita), il divario tra le due misure si riduce, consentendoci di quantificare con più precisione il grado in cui il rendimento legato alla specifica situazione incide sulla capacità di ciascun giocatore di vincere la partita.

Roger Federer Wasn’t Clutch, But He Was Almost Clutch Enough