Una breve spiegazione sull’arrivo in volata alla Laver Cup

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 24 settembre 2019 – Traduzione di Edoardo Salvati

Nella terza edizione della Laver Cup, il Resto del Mondo si è avvicinato — come mai era riuscito — a battere l’Europa, che ancora una volta ha dimostrato di essere una potenza. Indietro nel punteggio per 5-7 al termine della seconda giornata, con la vittoria delle prime due partite della terza giornata il Resto del Mondo ha ristabilito l’equilibrio lasciando l’esito della sfida incerto fino all’ultimo. La situazione non sembrava chiara per i telecronisti, aperti alla possibilità di una tredicesima partita tra le due squadre. Vediamo perché non sarebbe potuto accadere e quali condizioni si sarebbero invece dovute verificare per arrivare alla partita decisiva.

La Laver Cup non ha una lunga tradizione, quindi parlare di tendenze può non avere molto senso. Abbandonando temporaneamente i rigidi dettami statistici, è curioso notare che il Resto del Mondo si è migliorato o ha eguagliato sé stesso al termine della seconda giornata in ciascuno dei tre anni. Gli 11 punti vinti in Svizzera sono a oggi il bottino più ampio. Escludendo la conquista del trofeo, il Resto del Mondo potrebbe superare questo traguardo con 12 punti alla fine delle partite della terza giornata forzando la sfida conclusiva, uno scenario che però non si è mai verificato.

Forzare la partita decisiva

Alcuni dei commenti televisivi hanno lasciato intendere che si sarebbe comunque sempre potuti arrivare alla partita decisiva. Non è la prima inesattezza numerica sentita durante una telecronaca, ma si è portati a pensare che la semplice addizione multipli di 3 al punteggio del Resto del Mondo alla fine della seconda giornata avrebbe evitato un errore di quel tipo.

Gli affezionati lettori di questo blog non avranno alcun problema nel realizzare che ci sono solo una manciata di punteggi dalle partite della seconda giornata che possono generare una parità di 12-12 dopo la dodicesima partita della terza giornata. E cioè:

  • 0-12
  • 3-9
  • 6-6
  • 9-3
  • 12-0

Meno immediato è capire quanto probabile fosse ciascuno di essi a Ginevra. Tenendo conto delle valutazioni specifiche per il cemento dei giocatori scelti per il singolare e il doppio nella prima e seconda giornata, il grafico dell’immagine 1 mostra tutte le combinazioni di punteggio possibili per il Resto del Mondo alla fine della seconda giornata, con la relativa probabilità.

Complessivamente, la probabilità che il Resto del Mondo fosse su uno dei cinque punteggi che avrebbe condotto a una partita decisiva era del 33%. Il più probabile era il 3-9, con il Resto del Mondo senza i favori del pronostico in tutti i singolari ma favorito in tutti i doppi.

È interessante notare che il punteggio effettivamente raggiunto (5-7) era, con il 17%, appena meno probabile del 3-9 su cui si sarebbero potuti trovare. Sicuramente la prima vittoria in singolare di Jack Sock (contro Fabio Fognini per 6-1 7-6, n.d.t.) per il Resto del Mondo deve essere tra le più grandi sorprese della competizione.

IMMAGINE 1 – Probabilità attesa per ogni combinazione di punteggio del Resto del Mondo alla fine della seconda giornata, sulla base di 50.000 simulazioni di risultato dalle partite effettive della prima e seconda giornata

Recuperare dallo 0-12?

Quando il Resto del Mondo ci riproverà a Boston, nella quarta edizione della Laver Cup nel 2020, guarderò con attenzione se saranno in grado di fare meglio di 5 punti dopo la seconda giornata e di 11 dopo la terza.

E spero di essere ancora in salute quando una delle due squadre recupererà uno svantaggio di 0-12 per giocarsi tutto nella partita finale. Con i giocatori presenti quest’anno, sarebbe successo solo in 6 delle 50.000 simulazioni della competizione. Temo ci sarà un po’ da aspettare per questo scenario. Per la prima partita decisiva invece, l’anno prossimo potrebbe essere quello giusto.

A Short Explainer on Getting to a Laver Cup Decider

Andreescu, Medvedev e il futuro secondo Elo

di Jeff Sackmann // TennisAbstract

Pubblicato il 10 settembre 2019 – Traduzione di Edoardo Salvati

Con la vittoria agli US Open, che incrementa il bottino del 2019, Bianca Andreescu è finalmente entrata tra le prime 10 della classifica WTA, debuttando al quinto posto. Daniil Medvedev, che durante l’estate ha manipolato l’attenzione del circuito maschile, ha varcato la soglia dei primi 10 solo dopo Wimbledon. Ora occupa la quarta posizione.

Se a una classifica si richiede di predire il futuro, Elo è il sistema migliore. I pronostici fatti con Elo sono significativamente più precisi di quelli che usano i punti classifica. Il primo titolo Premier di Andreescu è arrivato a marzo a Indian Wells, dopo che ha battuto due tra le prime 10, cioè Elina Svitolina in semifinale e Angelique Kerber in finale. La classifica WTA ha reagito facendola salire al 24esimo posto dal numero 60. Già dopo la finale persa a Auckland, Elo vedeva in Andreescu una giocatrice con cui dover fare i conti, mettendola al settimo posto. Dopo altre tre vittorie a Miami, Andreescu è salita tra le prime 5 di Elo.

La prontezza di Elo

Gli algoritmi dietro le classifiche ufficiali impiegano del tempo per accorgersi della presenza di nuove stelle. Elo, invece, reagisce prontamente. Rispetto al metodo di calcolo di ATP e WTA che assegna punti in funzione di un anno di risultati (e in termini di turno raggiunto, non di bravura degli avversari), Elo assegna maggiore importanza a quelli più recenti, con ancora più enfasi per esiti inattesi, come ad esempio sconfitte a sorpresa dei giocatori di vertice.

Gli appassionati sono abituati alla lenta evoluzione della classifica ufficiale, quindi un numero [22] o [15] accanto al nome di Andreescu al Roland Garros e agli US Open non è sembrato fuori luogo. E un giudizio ponderato può avere la sua logica, considerati i passati esempi di giovanissimi che sono rimasti scottati. Elo però ha quasi sempre ragione. Se gli allibratori davano Serena Williams come super favorita nella finale a New York, Elo vedeva in Andreescu la giocatrice più in forma, pronosticandola vincitrice, seppur di poco. Dopo le sette vittorie agli US Open, Elo identifica ora Andreescu come la più forte del circuito, anche se con un margine risicato su Ashleigh Barty. Chi osa non essere d’accordo?

Sulla rampa di lancio

Quando lo scorso ottobre Medvedev ha messo piede tra i primi 10 delle valutazioni Elo per la prima volta, ho messo a confronto i due sistemi di classifica. La maggior parte dei giocatori che guadagna una posizione tra i primi 10 di Elo riesce prima o poi a entrare anche tra i primi 10 della classifica ufficiale, ma Elo è quasi sempre in anticipo. In media, l’algoritmo di Elo seleziona i primi 10 con più di sei mesi di vantaggio sul computer dell’ATP. Medvedev è un buon esempio: ha raggiunto l’ottavo posto di Elo a ottobre 2018, ma gli ci sono voluti altri dieci mesi per avere la stessa posizione nella classifica ufficiale, dopo la finale al Canada Masters.

Andreescu ha colmato il divario più velocemente di Medvedev, nei sei mesi che sono tipicamente richiesti a una giocatrice dall’ingresso tra le prime 10 di Elo a quello nella classifica ufficiale. E non dovrebbe servire molto altro tempo prima di una convergenza perfetta al numero uno delle due classifiche.

Non abbiamo bisogno di Elo per farci dire che Andreescu e Medvedev continueranno presumibilmente a vincere partite ad alto livello. Avendone però riconosciuto l’accuratezza predittiva, vale la pena guardare quali altri giocatori e giocatrici sono sulla rampa di lancio.

Berrettini e Muchova

Dopo gli US Open, la previsione più aggressiva riguarda Matteo Berrettini, che è attualmente al sesto posto. Nella classifica ATP Berrettini è tredicesimo, con una toccata e fuga tra i primi 20 durante l’estate, ed è tra i primi 10 di Elo da metà giugno, quindi ancor prima della semifinale agli US Open. Non solo, ma si trova davanti anche a giocatori giovani ma già avviati come Alexander Zverev e Stefanos Tsitsipas.

In campo femminile, non ci sono sorprese simili tra le prime 10 Elo, il che non significa che ci sia accordo con la classifica WTA. Karolina Muchova, 43esima nonché sua classifica migliore di sempre, è al 23esimo posto di Elo. Anche due veterane e pericoli costanti come Victoria Azarenka e Venus Williams sono confinate fuori dalle prime 40, ma Elo attribuisce loro rispettivamente un 18esimo e 28esimo posto. Da un punto di vista predittivo, la qualità è più importante della quantità, quindi un calendario ridotto non è necessariamente un limite. Elo è ottimista anche su Sofia Kenin, mettendola al 13esimo posto rispetto alla 20esima posizione ufficiale.

Giocatore            Elo   ATP   
Daniil Medvedev        4     4
Matteo Berrettini      6    13
Alexander Zverev       9     6 
Stefanos Tsitsipas    15     7

Giocatrice           Elo   WTA
Bianca Andreescu       1     5
Ashleigh Barty         2     1
Sofia Kenin           13    20
Victoria Azarenka     18    42
Karolina Muchova      23    43
Venus Williams        28    56

Da qui a sei mesi, scommetto che la classifica ufficiale di Berrettini sarà più vicina al sesto posto che al tredicesimo, mentre quella di Muchova più vicina al numero 23 che al 43. Conoscere il futuro è impossibile, ma se si vuole guardare avanti Elo è già li da sei mesi. Occorrerà aspettare per capire se il resto del circuito femminile è in grado di tenere Andreescu lontana dal numero 1 così a lungo.

Andreescu, Medvedev, and the Future According to Elo

I 19 Slam di Nadal, alla maniera di Marcel

di Jeff Sackmann // TennisAbstract

Pubblicato il 9 settembre 2019 – Traduzione di Edoardo Salvati

La distanza si è accorciata. Dopo la vittoria maratona nella finale degli US Open 2019 contro Daniil Medvedev, Rafael Nadal ha raccolto lo Slam numero 19 in carriera, dietro solo ai 20 di Roger Federer. In agguato al terzo posto si trova Novak Djokovic con 16, il favorito agli US Open quest’anno, ritiratosi poi agli ottavi di finale per infortunio.

Appena poche settimane fa, Djokovic appariva come la minaccia più seria per il primo posto di Federer nell’elenco dei vincitori Slam ma, impegnato a riprendersi da una nuova serie di problemi fisici, è Nadal ora ad avere l’abbrivio. Per Federer, che ha compiuto 38 anni a inizio agosto, la prospettiva di aggiungere un altro titolo è sempre più remota.

Recentemente, nel tentativo di prevedere l’evoluzione della classifica Slam, ho ideato un semplice algoritmo, ispirato a Marcel — il sistema di proiezioni del baseball che prende nome della scimmia della famosa serie televisiva “Friends” — così elementare che anche un primate potrebbe usarlo. Le informazioni da considerare sono essenziali: prestazioni nelle semifinali e finali Slam degli ultimi due anni, più l’età. Si scambia ottimizzazione con immediatezza e facilità di comprensione, e i risultati sono incredibilmente affidabili. Per maggiori dettagli sulla metodologia di calcolo e sul rendimento per gli anni passati, potete leggere il precedente articolo.

Risolvete per RN = 19 + x

Prima degli US Open, Marcel sembrava impostato per far arrabbiare il maggior numero di tifosi. Prediceva che, nel corso dei prossimi cinque anni, Djokovic avrebbe vinto quattro Slam, Nadal due e Federer nemmeno uno, lasciando i Grandi Tre in pareggio. Con la conclusione di un altro Slam, le cose sono cambiate. La tabella mostra la nuova previsione, che riflette sia la vittoria di Nadal a New York che un pronostico più roseo per lui dopo aver aggiunto un altro titolo ai risultati più recenti.

Giocatore   Slam  Previsione  Totale  
Nadal       19    3.5         22.5  
Federer     20    0.3         20.3  
Djokovic    16    3.5         19.5

Nadal è ora in corsa per migliorare il totale di almeno tre Slam. Al termine dei cinque anni, avrà forse lasciato Djokovic e Federer nella polvere e ci staremo chiedendo se sarà in grado di raggiungere Serena Williams o anche Margaret Court.

Più previsioni

Questo algoritmo di base consente di generare previsioni di Slam per qualsiasi giocatore che ha raggiunto almeno una semifinale negli ultimi due anni. È importante notare che non cerco di prevedere il totale Slam in carriera, ma solo quanti potrebbero essere vinti nei prossimi cinque anni. Per i Grandi Tre, è ragionevole non preoccuparsi del computo dopo il 2025.
La tabella riepiloga le previsioni attuali per 18 giocatori.

Giocatore       Previsione  
Djokovic        3.5  
Nadal           3.5  
Medvedev        0.8  
Thiem           0.7  
Tsitsipas       0.6  
Berrettini      0.5  
Chung           0.4  
Pouille         0.3  
Edmund          0.3  
Federer         0.3  
Dimitrov        0.1  
Cecchinato      0.1  
Cilic           0.0  
Del Potro       0.0  
Bautista Agut   0.0  
Anderson        0.0  
Nishikori       0.0  
Isner           0.0

La maggior parte di questi giocatori ha solamente una semifinale all’attivo nei due anni passati, ed è l’età a separarli. Sembra logico essere più ottimisti sul futuro negli Slam di Stefanos Tsitsipas (21 anni) che di Roberto Bautista Agut (31), anche se l’algoritmo li pone sullo stesso piano in funzione dei risultati sinora ottenuti, una semifinale negli ultimi 12 mesi.

Cinque anni equivalgono a 20 Slam, e si può notare che la tabella ne tralascia parecchi. Il totale pronosticato è infatti di 10.8 Slam, dando ampio margine di manovra a giocatori che ancora non si sono qualificati, come ad esempio Alexander Zverev e Felix Auger-Aliassime. Sono sicuro che agli US Open 2024 guarderemo alle previsioni di fine 2019 e ci faremo una risata.

Federer manterrà la prima posizione maschile della classifica più santificata nel tennis per almeno quattro mesi. Djokovic sarà probabilmente il favorito agli Australian Open 2020, quindi Federer può godersi almeno nove mesi da unico uomo con 20 Slam. Non serve però un algoritmo, nemmeno il più banale, per identificare il favorito al Roland Garros 2020. Il tennis maschile professionalmente organizzato è rimasto più di un secolo senza un campione con 20 Slam. In meno di un anno, potremmo averne due.

Monkeying Around With Rafael Nadal’s 19 Grand Slams

La fortuna del sorteggio: US Open 2019 (donne)

di Chapel Heel // HiddenGameOfTennis

Pubblicato il 26 agosto 2019 – Traduzione di Edoardo Salvati

Come per gli uomini, anche per le donne ho eseguito una simulazione (con la mia variante Elo) di 100.000 configurazioni del tabellone principale, utilizzando lo stesso metodo che gli organizzatori usano per assegnare alle giocatrici la loro posizione. L’ho poi confrontata con la previsione per il torneo su base Elo rispetto al tabellone effettivo.

La tabella mette a confronto la previsione effettiva del tabellone con i risultati dalle simulazioni di rimescolamento dell’intero campo partecipanti (a eccezione delle teste di serie numero 1 e 2, naturalmente), in modo da avere alcune indicazioni sull’accessibilità del tabellone effettivo rispetto alle altre configurazioni. Tonalità di rosso (e arancione) evidenziano la sfortuna della giocatrice. Al contrario, tonalità di verde rappresentano la fortuna ricevuta nel tabellone effettivo, in riferimento a un particolare turno. Il giallo simboleggia neutralità, e si può di fatto ignorare qualsiasi valore superiore o inferiore allo 0.2%.

Per una presentazione più compatta rispetto al passato, ho riportato nella tabella solo le teste di serie, e organizzato nella tabella successiva quelle giocatrici fuori dalle teste di serie per le quali c’è stata un’incidenza degna di nota (almeno l’1% di segno positivo o negativo).

Tabellone effettivo e simulato a confronto per le teste di serie

Il quarto di finale di Elina Svitolina ha proprio una brutta faccia (per il momento ha superato facilmente il primo turno contro Whitney Osuigwe, n.d.t.) . Sembra poi che anche Caroline Wozniacki (che ha superato il primo turno contro Yafan Wang, n.d.t.), Aryna Sabalenka (che ha battuto Victoria Azarenka al primo turno, n.d.t.) e Serena Williams siano state penalizzate dal tabellone effettivo, sebbene il sospetto è che sulla cella arancione di Williams al primo turno pesi in qualche modo una valutazione generosa di Elo della bravura di Maria Sharapova (Williams ha vinto infatti con un doppio 6-1, n.d.t.). La campionessa uscente Naomi Osaka ha il percorso più semplice tra le giocatrici con realistiche possibilità di aspirazione al titolo, rispetto a un tabellone casuale (anche se ha faticato al primo turno contro Anna Blinkova, vincendo in tre set dopo due ore e mezzo, n.d.t.).

IMMAGINE 1 – Confronto tra tabellone effettivo e simulazioni per le teste di serie

Effetti di rilievo su una selezione di giocatori fuori dalle teste di serie

Un tabellone più favorevole per Svetlana Kuznetsova con questa metodologia è dovuto in larga parte a rimanenze nella valutazione Elo di uno stato di forma che potrebbe essere scomparso (e così è stato, vista la sconfitta in due set al primo turno contro Kristie Ahn, n.d.t.), oltre ad avere due delle teste di serie più volubili nella sua sezione in Sloane Stephens (che infatti a perso contro Anna Kalinskaya al primo turno, n.d.t.) e Garbine Muguruza (anche lei perdente al primo turno contro Alison Riske, n.d.t.).

Mi sorprende vedere che il dato di Sharapova non sia peggiore, avendo al primo turno una delle tre giocatrici più forti di sempre.

IMMAGINE 2 – Effetti della casualità del sorteggio su alcune non teste di serie

Luck of the Draw US Open 2019 (Women)

La fortuna del sorteggio: US Open 2019 (uomini)

di Chapel Heel // HiddenGameOfTennis

Pubblicato il 26 agosto 2019 – Traduzione di Edoardo Salvati

Come d’abitudine per gli Slam, ho eseguito una simulazione (con la mia variante Elo) di 100.000 configurazioni del tabellone principale, utilizzando lo stesso metodo che gli organizzatori usano per assegnare ai giocatori la loro posizione. L’ho poi confrontata con la previsione per il torneo su base Elo rispetto al tabellone effettivo.

L’immagine 1 mette a confronto la previsione effettiva del tabellone con i risultati dalle simulazioni di rimescolamento, in modo da avere alcune indicazioni sull’accessibilità del tabellone effettivo rispetto alle altre configurazioni. Tonalità di rosso (e arancione) evidenziano la sfortuna del giocatore. Al contrario, tonalità di verde rappresentano la fortuna ricevuta nel tabellone effettivo, in riferimento a un particolare turno. Il giallo simboleggia neutralità, e si può di fatto ignorare qualsiasi valore superiore o inferiore allo 0.2%.

Per una presentazione più compatta rispetto al passato, ho riportato nella tabella solo le teste di serie, e organizzato nell’immagine 2 quei giocatori fuori dalle teste di serie per i quali c’è stata un’incidenza degna di nota (almeno l’1% di segno positivo o negativo).

Tabellone effettivo e simulato a confronto per le teste di serie

Rispetto a tabelloni casuali, la parte alta del tabellone principale è più difficile di quella bassa. Accade spesso quando Novak Djokovic e Roger Federer si ritrovano dallo stesso lato (in quella alto, vista la testa di serie numero 1 di Djokovic) in un torneo che non sia su terra battuta. Ho eseguito la stessa simulazione prima che si conoscessero i qualificati e la strada di Djokovic al quarto di finale non era così in discesa. Kevin Anderson non sarebbe stato l’Anderson da potenziale semifinale e Milos Raonic non sarebbe stato al massimo della forma, ma i ritiro di entrambi ha facilitato, almeno in termini di valutazioni Elo, il tabellone di Djokovic. Le cose per lui poi si complicano, vista la presenza di Federer invece che di Dominic Thiem. Per la stessa ragione, il percorso di Nadal alla finale è verniciato di verde.

Non ci si deve sorprendere dal rosso vivo nel tabellone di Stefanos Tsitsipas, visto che il suo primo turno assomiglia di più a un quarto turno (e in effetti Tsitsipas ha perso in quattro set contro Andrey Rublev, n.d.t.). Rispetto a un tabellone casuale, Kei Nishikori ha il cammino più facile fino ai quarti di finale, ma la possibilità di approfittane è molto legata al recupero dall’indisposizione subita a Cincinnati e al livello di umidità a New York. Anche Daniil Medvedev, il giocatore più “infuocato” in questo periodo, ha un percorso più semplice del previsto. Avrà ancora benzina a sufficienza? (Medvedev ha superato il primo turno in tre set contro Prajnesh Gunneswaran, n.d.t.)

Particolare attenzione va data all’apparente fortuna di Diego Schwartzman fino ai quarti di finale. Elo ignora che al primo turno Schwartzman deve giocare contro Robin Haase, per lui una vera e propria kryptonite, considerato un record negli scontri diretti di 0-5 con una sconfitta su ogni superficie (Schwartzman si è riscattato vincendo in tre set, n.d.t.).

IMMAGINE 1 – Confronto tra tabellone effettivo e simulazioni per le teste di serie

Effetti di rilievo su una selezione di giocatori fuori dalle teste di serie

Non ci sono qui problematiche degne di nota. Il vincitore di Winston Salem Hubert Hurkacz ha il percorso peggiore (perdendo al primo turno contro Jeremy Chardy in cinque set, n.d.t.), mentre Philipp Kohlschreiber riesce (purtroppo) a finire di nuovo in questo elenco (perdendo al primo turno contro Lucas Pouille in quattro set, n.d.t.).

IMMAGINE 2 – Effetti della casualità del sorteggio su alcune non teste di serie

Luck of the Draw: US Open 2019 (Men)

Fare previsioni sul migliore di sempre con l’aiuto di una scimmia

di Jeff Sackmann // TennisAbstract

Pubblicato il 3 agosto 2019 – Traduzione di Edoardo Salvati

Dopo la vittoria di Novak Djokovic a Wimbledon, l’attenzione al primato negli Slam è salita alle stelle. Roger Federer è a 20, Rafael Nadal a 18 e Djokovic, ora a 16, è di gran lunga il più forte del mondo sulla superficie dei prossimi due, gli US Open e gli Australian Open. La corsa è assolutamente aperta.

Fare previsioni nel tennis è difficile, anche cercando di pronosticare i risultati delle partite del giorno dopo. Sembra che i giocatori migliorino e peggiorino in modo del tutto casuale, rendendo difficile capire quale sarà la classifica anche a pochi mesi di distanza. Appassionati e tifosi amano perdersi in congetture su chi dei Grandi Tre s’impossesserà della vetta degli Slam, ma troppa incertezza non permette conclusioni definitive.

Si può pensare di costruire una sfera di cristallo con cui analizzare la problematica in modo rigoroso. Prendiamo ad esempio l’età di un giocatore, la probabile durata della carriera, gli eventuali infortuni, il rendimento negli ultimi quattro Slam, la classifica attuale, la bravura degli altri giocatori su ciascuna superficie e altri possibili parametri. Forse si riesce a determinare qualche numero che abbia un senso. E se invece ignorassimo tutto questo, adottando il modello più semplice in assoluto?

Vi presento la scimmia

I patiti di statistiche di baseball hanno familiarità con il sistema di proiezioni Marcel, così chiamato in onore della scimmia nella famosa serie televisiva “Friends”, perché “utilizza meno intelligenza possibile”. Nel caso del baseball, appena tre anni di risultati e una correzione per il fattore età. Non è immune da lacune, e sono evidenti i molti miglioramenti che si potrebbero apportare. Ma, come nel tennis, anche nel baseball le statistiche producono rumore. Per la maggior parte degli scopi, un sistema previsionale “di base” funziona tanto quanto uno più complesso. E, nel corso degli anni, Marcel ha fatto meglio di molti modelli considerevolmente più evoluti.

Applichiamo la logica del mammifero alle previsioni per gli Slam. Per prima cosa, riformulo leggermente la domanda alla ricerca di una risposta più diretta. Invece di prevedere i risultati Slam “in carriera”, mi concentro sulle vittorie per i prossimi cinque anni (includendo, quantomeno a occhio, il cammino completo dei Grandi Tre). Inoltre, nello spirito di Marcel, limito i dati a semifinali, finali e titoli Slam per gli ultimi tre anni, e l’età dei giocatori. Anzi, spengo subito una parte del cervello da scimmia, perché i risultati relativi agli Slam di tre anni fa possiedono scarso potere predittivo. Quindi l’elenco si riduce a due anni di semifinali, finali e titoli Slam, più l’età.

Una buona approssimazione

Il modello che ne consegue è molto valido! Per quei giocatori che hanno raggiunto una semifinale degli ultimi otto Slam, è in grado di prevedere il 40% della variazione nei titoli Slam dei prossimi cinque anni. In assenza di un modello iper-complesso e ottimale, non so esattamente dire dove si posizioni, ma per un orizzonte così lungo prevedere quasi la metà della variazione di risultati Slam giocatore per giocatore è, per me, una buona approssimazione.

Si pensi a tutto ciò che si ignora degli Slam per il 2022, ancor più per il 2024: chi è in attività, chi si è infortunato, chi è migliorato a sufficienza per essere considerato un favorito, quali promesse sono emerse dal nulla, e così via. Voglio dire che anche il modello più perfetto avrebbe molte carenze, quindi non serve stabilire uno standard troppo alto.

Andare dietro alla scimmia

L’algoritmo dei due anni più l’età è così semplice da poter essere eseguito sul retro di una scatola di sigarette (in omaggio al grande fisico Ettore Majorana, n.d.t.). Per il singolo giocatore, si contano le semifinali (vinte o perse), le finali (vinte o perse) e i titoli degli ultimi quattro Slam, e si fa lo stesso per i precedenti quattro. Si considera poi l’età all’inizio dello Slam successivo. Si parte con zero punti e si procede come segue:

  • si aggiungono 15 punti per ogni semifinale degli ultimi quattro Slam
  • si aggiungono 30 punti per ogni finale degli ultimi quattro Slam
  • si aggiungono 90 punti per ogni titolo degli ultimi quattro Slam
  • si aggiungono 6 punti per ogni semifinale dei precedenti quattro Slam
  • si aggiungono 12 punti per ogni finale dei precedenti quattro Slam
  • si aggiungono 36 punti per ogni titolo dei precedenti quattro Slam
  • se il giocatore ha più di 27 anni, si sottraggono 8 punti per ogni anno dopo il 27esimo
  • se il giocatore ha meno di 27 anni, si aggiungono 8 punti per ogni anno fino al 27esimo
  • si divide la somma per 100.

Un test con Djokovic

Finito! Proviamo con Djokovic. Negli ultimi quattro Slam (fino a Wimbledon 2019 incluso), ha vinto tre titoli e raggiunto una semifinale. Dei quattro precedenti, ne ha vinto uno. Agli US Open 2019 avrà 32 anni. Quindi:

  • +60 (15 punti per ognuna delle semifinali negli ultimi quattro Slam)
  • +90 (30 punti per ognuna delle tre finali negli ultimi quattro Slam)
  • +270 (90 punti per ognuno dei tre titoli negli ultimi quattro Slam)
  • +6 (6 punti per la semifinale a Wimbledon 2017)
  • +12 (12 punti per la finale a Wimbledon 2017)
  • +36 (36 punti per il titolo a Wimbledon 2017)
  • -40 (Djokovic ha 32 anni, si sottraggono 8 punti per ognuno dei cinque sopra ai 27).

Sommando, si ottiene 434 che, diviso per 100, genera una previsione di altri 4.34 Slam per Djokovic.

Un nuovo livello di provocazione nella discussione sul più forte di sempre

Avete la mia parola che si tratta di un’analisi totalmente disinteressata. Voglio solo sapere quanto un’accurata previsione Slam di lungo periodo, seppur ridotta all’osso, riesca a essere precisa. Non ho l’intento di farvi perdere i capelli che, temo di dovervi confessare, perderete comunque prima o poi.

Questo è il numero di Slam che il modello prevede per i Grandi Tre tra gli US Open 2019 e Wimbledon 2024:

  • Djokovic, 4.34
  • Nadal, 2.22
  • Federer, 0.26.

Non serve che mostri i calcoli per il passo successivo, ma sapete che non posso esimermi dal farli. Questa è la previsione per il totale in carriera:

  • Djokovic, 20.34
  • Federer, 20.26
  • Nadal, 20.22.

Siccome viviamo in un mondo dove non si vincono frazioni di Slam, abbiamo:

  • Djokovic, 20
  • Federer, 20
  • Nadal, 20

Molto bene…

Torniamo al modello

La previsione di 4.34 Slam per Djokovic è decisamente alta, in linea con un giocatore che ne ha vinti tre degli ultimi quattro. Per ogni anno dal 1971, ho calcolato le previsioni Slam di ciascun giocatore che ha raggiunto una semifinale nei due anni precedenti, un totale di più di 800 previsioni. Solo 14 sono superiori a 4.34, e molte riguardano i Grandi Tre. La tabella riepiloga le prime dieci.

Anno  Giocatore   Età   Previsione   Effettivo     
2008  Federer     26    6.38         5     
2007  Federer     25    5.86         7     
2016  Djokovic    28    5.20         6 *  
2005  Federer     23    4.91         11     
2011  Nadal       24    4.89         5     
2006  Federer     24    4.86         10     
2017  Djokovic    29    4.79         4 *  
2012  Djokovic    24    4.68         8     
1989  Wilander    24    4.65         0     
1988  Lendl       27    4.56         2

* conteggio che potrebbe ancora aumentare

Sono previsioni basate sui dati disponibili all’inizio dell’anno che compare nell’elenco. La prima riga, Federer 2008, si riferisce alla previsione per Federer dei titoli Slam per il periodo dal 2008 al 2012, in funzione del rendimento nel 2006 e 2007 e sull’età agli Australian Open 2008. Se avessi concepito il modello a quel tempo, la previsione si sarebbe attestata intorno alla mezza dozzina di Slam. Federer ne ha vinti cinque.

Ci sarà sempre molto rumore statistico agli estremi di modelli come questi. All’inizio del 2005, l’algoritmo avrebbe assegnato a Federer “solo” cinque dei successivi venti Slam. Invece, ne vinse ben 11. Faccio fatica però a credere che ci fosse stato anche un modello talmente ottimistico da indovinare la doppia cifra. L’edizione 1989 del modello invece sarebbe stata generosa in senso opposto con Mats Wilander, che nel 1988 aveva fatto tre quarti di Slam. Tristemente per lo svedese, un gruppetto di giovanissimi gli passò avanti e non raggiunse più nemmeno una finale.

Diamo uno sguardo anche alle successive dieci previsioni più rosee, e alla stima attuale per Djokovic.

Anno  Giocatore   Età   Previsione   Effettivo     
2010  Federer     28    4.48         2     
1981  Borg        24    4.47         1     
1996  Sampras     24    4.47         6     
1975  Connors     22    4.45         2     

Att.  Djokovic    32    4.34         0 *  

1980  Borg        23    4.28         3     
2013  Djokovic    25    4.24         7     
2009  Federer     27    4.20         4     
1995  Sampras     23    4.16         7     
2009  Nadal       22    4.12         8     
1979  Borg        22    4.09         5

* conteggio che potrebbe ancora aumentare

Di nuovo molto rumore, con risultati tra 0 e 8 Slam. Però, la media delle altre dieci previsioni in elenco è di 4.5 Slam, esattamente in linea con la precedente previsione per Djokovic.

Slam che mancano…

Il modello prevede che i Grandi Tre vincano circa sette dei prossimi venti Slam. Giustamente vi chiederete: e gli altri tredici? La scimmia considera solo i giocatori con una semifinale negli ultimi otto Slam, quindi la somma complessiva non dovrebbe fare venti. Esiste la possibilità che vincitori del 2023 e 2024 non siano ancora nel radar, e molti dei giovani sulla bocca degli opinionisti —come Alexander Zverev, Felix Auger-Aliassime e Daniil Medvedev — non hanno ancora raggiunto una finale Slam. La tabella riepiloga i giocatori per i quali è possibile fare una previsione.

Giocatore         Previsione Slam  
Djokovic          4.34  
Nadal             2.22  
Thiem             0.71  
Tsitsipas         0.63  
H. Chung          0.38  
Pouille           0.31  
Edmund            0.30  
Federer           0.26  
Del Potro         0.19  
Cecchinato        0.06  
----------------  ----  
TOTALE            9.40

* Per gli altri cinque giocatori con una semifinale 
dagli US Open 2017 la previsione di titoli Slam è zero

Sono consapevole che Lucas Pouille e Hyeon Chung non hanno più probabilità di vincere uno Slam di quante ne abbia Federer. Ma sono (relativamente) giovani e il modello riconosce a molti giocatori che hanno raggiunto una semifinale Slam all’inizio della carriera la capacità di gettare le basi sul quel successo.

Oltretutto, ci stiamo perdendo molti Slam. Se la previsione complessiva è corretta, quei giocatori vinceranno meno della metà dei prossimi venti Slam, lasciando almeno dieci titoli a giocatori che ancora devono arrivare a un quarto di finale Slam.

…e il fattore età

Se vi ricordate, ho proceduto a ritroso nelle previsioni per ciascun intervallo di cinque anni fino al 1971-1975. Su 44 anni dall’avvio delle stagioni tra il 1971 e il 2014, il modello tipicamente ha previsto che i giocatori di cui aveva dati — vale a dire quelli con semifinali Slam nei precedenti due anni — avrebbero vinto 13 dei successivi 20 Slam. In realtà, i giocatori nel radar hanno vinto in media 12 Slam nei cinque anni a venire.

È solamente negli ultimi anni che il numero totale di Slam previsti è sceso sotto i 10. La colpa è dell’età: come detto, per correggere per l’età si sottraggono 8 punti (0.08 Slam) per ogni anno oltre i 27. Per Djokovic e Nadal si tratta di una penalizzazione di 0.4 Slam, mentre sono 0.8 gli Slam cancellati dalla futura bacheca di Federer. Accade che il modello prevede il calo di rendimento dei Grandi Tre, e al contempo non ci sono molti giovani (come Pouille e Chung) nell’elenco in grado di compensarlo.

Nuove curve d’invecchiamento

L’interpretazione delle previsioni per i Grandi Tre alla luce degli Slam “mancanti” dipende da un paio di elementi:

  • la curva d’invecchiamento per le mega stelle è cambiata? I 30 sono i nuovi 25, o i 32 i nuovi 27?
  • la nuova generazione di giocatori riuscirà a essere forte abbastanza in fretta da scardinare la presa dei Grandi Tre?

C’è abbondanza di prove a dimostrazione di una modifica della curva d’invecchiamento, dovremmo cioè aspettarci risultati migliori dai trentenni di questa epoca rispetto a quanto accadeva negli anni ’80 e ’90. Questo ridurrebbe gran parte del divario. Ipotizziamo di spostare l’età di massimo picco a 31 anni, quattro in più rispetto alla media maschile di 27 per l’era Open. Così facendo aggiungiamo 0.32 Slam alla previsione di ogni giocatore, probabilmente aumentando di uno il computo previsto per i Grandi Tre. Complessivamente, vorrebbe dire portare il totale della precedente tabella a un po’ più di tre Slam addizionali, avvicinandosi alla media storica di 13 Slam. La variazione di età non sbroglia però la matassa dei Grandi Tre, perché li riguarda allo stesso modo. Solo, essere in parità a 21 Slam diventa leggermente più probabile che esserlo a 20 Slam.

La difficoltà di prevedere il livello di competizione

La seconda domanda è quella più importante, ma anche la meno pronosticabile. Pur risolvendo l’ostica incombenza di arrivare a conoscere il rendimento del singolo giocatore tra tre, quattro o cinque anni (e a volte, come nel caso di Nick Kyrgios, anche domani), rimarremmo comunque con l’ancora più difficile questione di prevedere il livello della competizione.

Nel 2003, la scimmia sarebbe stata convinta che i giocatori di vertice del momento, quelli che avevano raggiunto semifinali Slam nel 2001 e 2002, avrebbero raccolto 13 Slam tra il 2003 e il 2007. Erano 2.5 per Lleyton Hewitt, più uno a testa per Thomas JohanssonAlbert CostaPete SamprasMarat SafinDavid NalbandianJuan Carlos Ferrero. Questi sette giocatori ne hanno poi vinti solo due. L’intero gruppo di venti giocatori meritevoli di previsioni alla vigilia degli Australian Open 2003 ne ha vinti solo 3.

Non riusciremo probabilmente mai a stabilire con esattezza la bravura di quel gruppo rispetto ad altre epoche. La certezza che abbiamo è che nessuno è stato forte quanto Federer tra il 2003 e il 2005 e che, alla fine del periodo di cinque anni, anche Nadal è entrato a dominare la scena (solo Nalbandian era tra i primi 10 in classifica alla fine del 2007). La generazione degli Zverev/Tsitsipas/Auger-Aliassime/etc non raggiungerà l’apice toccato dai Fantastici Quattro, ma l’andamento dei prossimi venti Slam dipenderà più da loro che dalla (relativamente) più prevedibile traiettoria di carriera di Djokovic, Federer e Nadal.

Non ci rimane che un mucchio di incertezze già note ed errori con una parabola più ampia di un rovescio steccato di Federer. Però, rispetto a quanto sappiamo, la vetta della classifica Slam di tutti i tempi diventerà ancora più affollata.

Così parlo la scimmia.

GOAT Races: Forecasting Future Slams With a Monkey

Una statistica per le partite assolutamente da non perdere

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 9 agosto 2019 – Traduzione di Edoardo Salvati

Per l’appassionato di tennis, la scelta di quale partita guardare in un qualsiasi torneo è spesso fonte di grattacapo. In questo articolo, cerco di determinare quanto una partita è imperdibile in funzione della sua qualità e competitività, ricorrendo alle valutazioni dei giocatori.

Molte volte in passato, o anche per la trasferta nordamericana in corso, l’abbondante offerta di partite televisive vi avrà certamente posto di fronte a un bivio. Conoscete il motivo della scelta che avete fatto? Avete optato per la partita in programma sul campo più importante? Per il giocatore con la classifica più alta? O avete seguito il vostro istinto sulla partita che pensavate sarebbe stata più equilibrata?

Specialmente nei primi turni di eventi congiunti tra donne e uomini, il timore di rimanere lontani dal centro dell’azione è una delle circostanze che genera più ansia per il vero seguace di tennis. Naturalmente, la possibilità di cambiare canale per una o l’altra partita ci convince che, in fondo, prendere una decisione non è obbligatorio. Ma non è questo il modo di mantenere viva la passione.

Dove sarà l’esperienza visiva più emozionante?

Forse è solo perché sto invecchiando, ma mi capita spesso di desiderare che la scelta sulla partita da guardare fosse più semplice. O che avessi almeno modo di prevedere dove sarà l’esperienza visiva più emozionante in qualsiasi istante. Di solito, faccio riferimento alle quotazioni assegnate dagli allibratori alle partite in programma, così da avere un’idea di quelle il cui esito finale è considerato più incerto. Mi accorgo però poi che la mia propensione non è sempre per la partita più combattuta. Complessivamente, anche la qualità è un fattore chiave. E sarei disposta ad accettare quote meno favorevoli se il livello di gioco di entrambi i giocatori rimanesse ragionevolmente alto.

Ne ho parlato a lungo con Martin Ingram, già ospite del blog, che condivide l’ossessione per interrogativi di questo tipo e che riesce sempre a trovare una soluzione ingegnosa alla maggior parte dei problemi prima che a me venga in mente. Siamo d’accordo sul fatto che competitività e qualità non sono elementi sufficienti a far decollare una grande partita (stili differenti e scontri diretti sono altri due, ad esempio), ma certamente permettono di pescare nel mucchio con buona probabilità di riuscita.

L’idea di base è di arrivare a una statistica che unisca una misura della qualità e della competitività. In termini matematici:

Partita imperdibile = Competitività + Qualità

Visto che le valutazioni dei giocatori sono il sistema principale per misurarne la bravura relativa, possiamo prenderle a riferimento sia in termini di abilità complessiva (la qualità) che in termini di divario di capacità tra un giocatore e l’altro (competitività).

Qualità

Per definire la qualità, basta la semplice somma delle valutazioni dei giocatori. È un concetto simile a quello del “bonus” secondo la descrizione di Klaasen e Magnus. L’immagine 1 mostra la distribuzione della qualità per le partite del circuito maggiore nel 2019. Pur con una media leggermente più alta per gli uomini, in entrambi i casi assistiamo a un’importante deviazione verso destra. Quella coda, il gruppo di partite con valore maggiore di 5000, racchiude gli scontri di più alta qualità della stagione.

IMMAGINE 1 – Distribuzione della qualità per le partite dei due circuiti maggiori nel 2019

Competitività

Nella sostanza, la competitività invece si riduce al divario tra le valutazioni dei giocatori. Questo è il “malus” nel linguaggio di Klaasen e Magnus. Anzi, la differenza di valutazioni è l’unica quantità veramente casuale nei pronostici sia con Elo che con altri sistemi di previsioni basati sulla comparazione tra giocatori.

IMMAGINE 2 – Distribuzione della competitività per le partite dei due circuiti maggiori nel 2019

La distribuzione di competitività nell’immagine 2 mostra scarsa differenza tra i due circuiti. Inoltre, la pesante deviazione verso destra segnala che è più tipico trovarsi di fronte a una partita molto equilibrata che a una a senso unico. Staremmo parlando di uno sport molto più interessante se la distribuzione non esibisse questo tipo di distorsione.

Da un lato, abbiamo molte partite di qualità ma pochissime di massima qualità, mentre dall’altro sono minori le partite competitive ma è relativamente più frequente che una partita sia competitiva di quanto sia a senso unico. In presenza di proprietà tra loro opposte, come riusciamo a mettere insieme queste due misure?

Un solo numero

Un’idea è quella di concentrarsi sulla qualità, prevedendo però una penalizzazione in funzione della scarsa competitività. Si esprime la competitività come la probabilità di vittoria attesa per il giocatore più forte, per poi quantificare la probabilità di vittoria attesa rispetto alla partita più competitiva (quella in cui la probabilità di vittoria è del 50%).

Partita imperdibile = (Qualità – Media)*(1-(p(v)-0.5))

In questo modo, il valore delle partite con qualità sopra la media è ridotto in proporzione della distanza in punti percentuali da una partita equilibrata. Possiamo verificare in concreto il funzionamento di questo approccio guardando alle prime dieci partite imperdibili del 2019 per uomini e donne. Anche se l’obiettivo dichiarato è di stabilire il livello di qualità tra partite della stessa settimana e turno di gioco, possiamo comunque ricavare una prima impressione della validità della statistica.

Il predominio dei Grandi Tre tra gli uomini e quello di Simona Halep, Serena Williams e Ashleigh Barty tra le donne suggerisce che siamo sulla buona strada. In retrospettiva, un paio di partite non hanno mantenuto il carico d’interesse atteso alla vigilia, fra tutte la finale maschile degli Australian Open e la finale femminile di Wimbledon.

Naturalmente, non ho la pretesa che la statistica per le partite assolutamente da non perdere qui introdotta incontri un favore universale. Sono convinta però che fondendo i due ingredienti chiave di una partita in un solo numero, si ha a disposizione un valido strumento per scegliere cosa vedere in televisione o analizzare a ritroso quali sono state le partite che hanno confermato o disatteso le aspettative riposte.

A Stat for Must-See Matches

Federer non è stato dominante nei momenti chiave, ma ci è andato vicino

di Jeff Sackmann // TennisAbstract

Pubblicato il 26 luglio 2019 – Traduzione di Edoardo Salvati

Le statistiche della finale di Wimbledon raccontano una storia senza ombre. Per cinque set, Roger Federer ha fatto molte cose leggermente meglio del suo avversario, Novak Djokovic, che però ha poi vinto di misura perché si è aggiudicato i punti più importanti, un dettaglio che non emerge dai numeri con la stessa nitidezza.

Superando le statistiche tradizionali, possiamo quantificare il dominio nei momenti che fanno la differenza. Un metodo che supera il semplice conteggio delle palle break o dell’individuazione dei passaggi chiave più ovvi in una partita è l’indice di leva per assegnare un valore a ciascun punto, in funzione dell’importanza. Dopo ogni singolo punto della partita, possiamo calcolare una nuova probabilità di vittoria per entrambi i giocatori. Un punto come quello da giocare sul 5-5 in un tiebreak è potenzialmente in grado di alterare la probabilità di vittoria in misura massiccia, mentre così non è per quello sul 40-15 del primo game.

La leva quantifica il potenziale. In media, in una partita al meglio dei cinque set un punto possiede una leva di circa il 4%, ma per i punti più importanti si parla di diverse volte quel valore. Un altro modo per identificare quando un giocatore è predominante è vedere il numero sproporzionato di punti ad alta leva che vince anche di fronte a una prestazione inferiore in quelli a bassa leva.

L’indice di leva

In un recente articolo sulla finale di Wimbledon per l’Economist, ho approfondito ulteriormente il concetto. Djokovic ha vinto meno punti rispetto a Federer, ma quelli che ha vinto hanno contato di più. La leva media dei punti per lui è stata infatti del 7.9%, rispetto al 7.2% di Federer. Possiamo presentare questa differenza sotto forma di indice di leva (Leverage Ratio o LR), dividendo 7.9% per 7.2%, con un risultato di 1.1. Un indice così alto non è insolito. Nelle più di 700 partite Slam maschili del Match Charting Project, l’LR del giocatore più dominante è in media di 1.11. L’eccellenza di Djokovic nei momenti chiave non è stata nemmeno così unica, ma in una partita di quell’equilibrio è bastata a fare la differenza.

Con un indice di leva superiore a 1.0, la vittoria non è comunque garantita. In circa il 30% di queste 700 partite al meglio dei cinque set la vittoria è andata al giocatore che, in media, ha vinto meno punti importanti dell’avversario. Alcune situazioni di vincitori con basso indice di leva quasi rasentano la comicità, come la finale del Roland Garros 2008 in cui Rafael Nadal ha demolito Federer nonostante un LR di 0.77.

Aumento della comprensione

Nelle partite a senso unico non c’è molta leva a disposizione, quindi il numero dei punti vinti ha molta più rilevanza di quando sono stati vinti. Spesso prestazioni non dominanti si traducono in vittorie di partite ancora più equilibrate, come quella di Andy Murray nella semifinale degli US Open 2018 in quattro set contro Nadal nonostante un LR di 0.80, o la super equilibrata semifinale a Wimbledon 2018 in cui Kevin Anderson ha battuto John Isner con un LR di 0.88.

Non serve un foglio di calcolo per capire che le partite di tennis vengono decise da una combinazione di rendimento complessivo e rendimento nei momenti importanti. I numeri che ho citato non portano avanti la nostra comprensione di molto, quantomeno non in modo rigoroso. È questo il prossimo passo.

Indice di leva, ti presento l’indice di leva bilanciato

Coloro che frequentano regolarmente Tennis Abstract hanno familiarità con l’indice di dominio (Dominance Ratio o DR), una statistica inventa da Carl Bialik al fine di riclassificare i punti vinti totali. Il DR si ottiene dalla divisione tra i punti vinti alla risposta e i punti persi al servizio, in modo che il valore medio sia esattamente 1.0. Solitamente, chi vince ha un valore superiore a 1.0 e chi perde un valore inferiore a 1.0.

Nella finale di Wimbledon, il DR di Djokovic è stato di 0.87, estremamente basso per un vincitore, se non addirittura inedito. Il DR compensa gli effetti generati del rendimento al servizio e alla risposta (a differenza dei punti vinti, che possono deviare in una o l’altra direzione a seconda che ci siano più punti al servizio che alla risposta, o viceversa) e sintetizza in un solo numero la qualità della prestazione complessiva.

Equa distribuzione tra servizio e risposta

Non dice però nulla relativamente al dominio nei momenti chiave, tranne quando un giocatore vince con un valore basso del DR, da cui si può dedurre che abbia controllato l’avversario sui punti più caldi.

Per avere una prospettiva bilanciata simile in presenza di rendimenti ad alta leva, possiamo adattare l’indice di leva LR soppesando equamente il dominio nei momenti chiave sia al servizio che alla risposta. Chiamo questa statistica indice di leva bilanciato (Balanced Leverage Ratio o BLR), cioè la media semplice dell’LR nei punti al servizio e dell’LR nei punti alla risposta. Il BLR di solito non si scosta di molto dall’LR, così come spesso otteniamo le stesse informazioni dal DR che dai punti totali. Il BLR di Djokovic nella finale di Wimbledon è stato di 1.11, rispetto a un LR di 1.10. Nelle partite in cui però un numero sproporzionato di punti si giocano sulla racchetta di un giocatore, il BLR fornisce il necessario aggiustamento.

DR corretto per leva

Siamo in grado di registrare rendimenti corretti per leva semplicemente moltiplicando questi due numeri. Ad esempio, prendiamo la vittoria di Stanislas Wawrinka contro Djokovic nella finale degli US Open 2016. Il DR di Wawrinka è stato di 0.90, più alto di quello di Djokovic a Wimbledon 2019 ma difficilmente sufficiente a trionfare. Eppure ha vinto, grazie a un BLR di 1.33, uno dei più alti mai registrati in una finale Slam. Il prodotto tra il DR e il BLR di Wawrinka — che chiameremo DR+ — è pari a 1.20. Lo si può interpretare con la stessa scala di un DR “normale”, dove 1.2 è spesso identificativo di una vittoria con margine ridotto, se non di una al cardiopalma.

Di 167 finali Slam maschili nel Match Charting Project, 14 giocatori hanno vinto nonostante un DR “normale” inferiore a 1.0. Per ciascuno di essi, il BLR era superiore a 1.1, e in 13 delle 14 occorrenze, la forza del BLR del vincitore ha “cancellato” la debolezza del suo DR, nel senso che il DR+ è stato superiore a 1.0. La tabella riepiloga quelle partite, ordinate per DR+ crescente.

Anno  Slam              Vincitore    DR     BLR    DR+  
2019  Wimbledon         Djokovic     0.87   1.11   0.97  
1982  Wimbledon         Connors      0.88   1.20   1.06  
2001  Wimbledon         Ivanisevic   0.95   1.16   1.10  
2008  Wimbledon         Nadal        0.98   1.13   1.10  
2009  Australian Open   Nadal        0.99   1.13   1.12  
1981  Wimbledon         McEnroe      0.99   1.16   1.15  
1992  Wimbledon         Agassi       0.97   1.19   1.16  
1989  US Open           Becker       0.96   1.22   1.18  
1988  US Open           Wilander     0.98   1.21   1.18  
2015  US Open           Djokovic     0.98   1.21   1.18  
2016  US Open           Wawrinka     0.90   1.33   1.20  
1999  Roland Garros     Agassi       0.98   1.25   1.23  
1990  Roland Garros     Gomez        0.94   1.34   1.26  
1991  Australian Open   Becker       0.99   1.30   1.29

Prima finale vinta dal giocatore con il DR+ inferiore

In 167 finali Slam, quella tra Djokovic e Federer è stata la prima vinta dal giocatore con il DR+ più basso (alcuni dei campioni che non compaiono in elenco hanno avuto indici di leva sotto tono e conseguenti DR+ inferiori ai DR, ma nessuno sotto il livello di 1.0). Sebbene Federer è stato più debole nei momenti importanti — in particolare nei tiebreak e quando ha avuto i due match point — il rendimento complessivo in quel tipo di situazione non è stato così scadente come quei pochi memorabili momenti farebbero pensare. È più probabile che un giocatore con un DR di 1.14 e un BLR di 0.90 come quelli di Federer concluda le due settimane di Wimbledon ballando con la campionessa del tabellone femminile.

Sorprendentemente, 1 su 167 potrebbe sottostimare la rarità di un vincitore con un DR+ inferiore a 1.0. Solo una delle partite al meglio dei cinque set nel database del Match Charting Project (su più di 700) possiede quel requisito. Si tratta del controverso quarto turno degli Australian Open 2019 tra Kei Nishikori e Pablo Carreno Busta. Nishikori ha vinto con un DR di 1.06, ma il suo BLR è stato di 0.91, relativamente debole e che ha portato a un DR+ di 0.97. Come per la finale di Wimbledon, anche la partita di Melbourne avrebbe potuto avere un altro vincitore. La fortuna è stata avversa a Carreno Busta non solo per le chiamate arbitrali.

Qual è il significato di tutto questo?

Sappiamo che la finale di Wimbledon è stata in estremo equilibrio, ora abbiamo più numeri che mostrano quanto effettivamente lo sia stata. Sapevamo che Djokovic gioca meglio quando conta di più, ora abbiamo più riferimenti sulla sua maggior bravura, che però non si discosta di un margine insolitamente ampio.

Federer ha vinto cinque dei venti Slam nonostante un BLR nella finale inferiore a 1.0, e altri due con un DR inferiore a 1.14. Non ha mai vinto uno Slam con un DR+ non superiore a 1.03, ma va anche detto che non c’è mai stata una finale Slam che il DR+ ha considerato così ravvicinata. Federer non è la definizione di maestro dei momenti chiave, ma non è poi così malvagio. Avrebbe solamente dovuto portare con sé un po’ di quella dose di domino con cui ha chiuso il secondo set per passaggi più importanti nelle fasi successive.

Se siete anche voi come me, dopo aver letto fino a questo punto non smetterete di farvi domande. Ho riflettuto su alcune che spero di approfondire analogamente. Si può dire che Federer di solito è meno dominante della media nei momenti chiave? (Si). Djokovic è molto più bravo a quel riguardo? (Si). E Nadal? (Anche lui è più bravo). Nadal è davvero migliore, o i suoi numeri sulla leva sono di partenza buoni perché i punti importanti si giocano più spesso sul lato dei vantaggi? (È davvero migliore). Djokovic ha preso le misure a Federer? (Non proprio, a meno che non s’intenda il suo numero di scarpe, allora in quel caso sì). È cambiato tutto dopo che Djokovic ha tirato la famosa risposta? (No).

Rendimenti situazionali

Ci sono anche molti argomenti interessanti che vanno oltre i Grandi Tre. Ho iniziato qualche anno fa a scrivere della leva relativa a sottoinsiemi di partite, spinto dalla semifinale di Wimbledon 2016 tra Federer e Milos Raonic, nella quale Federer ha subito la pressione quando più contava. Come possiamo analizzare la leva media per punti vinti e persi, così riusciamo a stimare l’importanza dei punti in cui un giocatore ha servito un ace, commesso un errore non forzato di rovescio, o scelto di andare a rete.

Le partite sono decise da una combinazione di rendimento complessivo e giocate di alta leva. Le statistiche comunemente disponibili illustrano bene le dinamiche del primo, ma non sono adeguate per fare chiarezza sulle seconde. Il dominio nei momenti chiave è lasciato alle congetture degli opinionisti. Con un insieme di partite in continuo aumento e l’accesso a sempre più dati punto per punto (e quindi a numeri sulla leva per ogni punto e ogni partita), il divario tra le due misure si riduce, consentendoci di quantificare con più precisione il grado in cui il rendimento legato alla specifica situazione incide sulla capacità di ciascun giocatore di vincere la partita.

Roger Federer Wasn’t Clutch, But He Was Almost Clutch Enough

L’effetto generato dalla velocità del servizio di Serena

di Jeff Sackmann // TennisAbstract

Pubblicato il 13 luglio 2019 – Traduzione di Edoardo Salvati

In un articolo su FiveThirtyEight, Tom Perrotta ha evidenziato la relazione tra il rendimento di Serena Williams sulla prima di servizio e la sua probabilità di vincere la partita. Secondo Perrotta, Williams ha vinto solo (solo!) il 74% dei punti sulla prima di servizio nelle due settimane di Wimbledon 2019 (esclusa la finale, n.d.t.), rispetto a un incredibile 87.5% nella vittoria del titolo del 2010. Non è mai riuscita a vincere Wimbledon con meno del 75% di punti vinti sulla prima, e anche quel livello non è di garanzia, visto che l’anno scorso ha raggiunto il 77% perdendo poi in finale.

Ci sono molti fattori che influenzano la percentuale di punti vinti con la prima, tra cui piazzamento e tattica del servizio, oltre a tutti i colpi che chi è al servizio deve giocare immediatamente successivi alla risposta dell’avversaria.

Il più evidente però è rappresentato da un’altra categoria nella quale Williams è spesso stata la migliore, e cioè la velocità del servizio. Nella finale vinta contro Garbine Muguruza nel 2015, la velocità media della prima è stata di 182 km/h (113 mph), la terza partita consecutiva in cui in media era arrivata a 179 km/h (111 mph). Nelle 13 partite successive, ha servito in media a solo (solo!) 171.2 km/h (106.4 mph), non andando mai oltre i 175 km/h (109 mph) in una singola partita.

Quanto è importante?

Sembra corretto ipotizzare che, a parità di condizioni, un servizio più veloce ha maggiore efficacia di uno più lento. Le cose si complicano però perché raramente ci si trova nella parità di condizioni: un servizio esterno è spesso più letale pur richiedendo minore forza pura, è più facile trovare un piazzamento su un servizio poco rischioso e non ho neanche sollevato il tema dell’effetto legato alla rotazione della pallina. Un servizio più veloce non è sempre migliore di uno più lento ma, in media, l’ipotesi di base resta valida.

Per ciascuna delle 23 partite di Williams a Wimbledon per le edizioni 2014, 2015, 2018 e 2019 (non ha giocato il 2017 e non possiedo al momento i dati per il 2016, non chiedetemi il perché…), ho suddiviso i punti sulla prima in quintili, classificandoli sulla base della velocità del servizio, dal più veloce al più lento. Si tratta di una modalità rudimentale che aiuta però a tenere conto delle avversarie e darci una prima sensazione di quanto la velocità del servizio di Williams è in grado di incidere sull’esito dei punti sulla prima.

Quintile       PVS 1^  Media KM/H  
Più veloce     80.6%   188  
2° più veloce  73.7%   180.5  
A metà         79.5%   174  
2° più lento   73.7%   167  
Più lento      74.9%   158

Chiaramente, la velocità del servizio non descrive tutto quello che accade. Allo stesso tempo, sembra che una prima a 188 km/h (117 mph), o anche una a 174 km/h (108 mph), siano meglio di una a 158 km/h (98 mph).

Senza considerare le avversarie

Un altro modo per isolare l’effetto della velocità del servizio è di ignorare l’incidenza che hanno specifiche avversarie e ordinare semplicemente le prime di servizio in funzione della velocità. Nelle 23 partite considerate, 43 prime hanno l’esatta velocità di 161 km/h (100 mph), con una corrispondente percentuale di punti vinti del 72.1%. Sono 33 le prime che raggiungono i 162.5 km/h (101 mph), vincendo il 72.7% dei punti. Sebbene generalmente la percentuale di punti vinti non si muova all’unisono con la velocità della prima, il grafico dell’immagine 1 evidenzia la presenza di una tendenza di fondo.

IMMAGINE 1 – Andamento tra la velocità della prima di Williams a Wimbledon e la percentuale di punti vinti

La correlazione è debole: ad esempio, la percentuale di punti vinti con servizi a 159 km/h (99 mph) e 166 km/h (103 mph) è più alta che a 187 km/h (116 mph) e 188 km/h (117 mph). Si potrebbe attribuirne la ragione alla possibilità che i servizi più lenti sono frutto di una scelta tattica più astuta, che in quelli più veloci il piazzamento è meno preciso, o che è solo cieca fortuna, perché il campione a disposizione per una specifica velocità non è così ampio.

La regola per Williams

Possiamo comunque trarre una conclusione sommaria:

A ogni 3 km/h (2 mph) di velocità in più sulla prima di servizio corrisponde un punto percentuale aggiuntivo nella percentuale di punti vinti con la prima da Williams.

Aggiungiamo questo: solitamente, Williams serve circa il 60% di prime, e circa la metà dei punti totali verranno giocati sul suo servizio. Quindi, 3 km/h di velocità in più valgono 0.6 punti percentuali addizionali dei punti totali vinti da Williams. In una partita equilibrata come la sconfitta del 2014 contro Alize Cornet, nella quale Williams ha servito la prima in media a 167 km/h (104 mph) e vinto esattamente il 50% dei punti giocati, potrebbe diventare un elemento decisivo.

Contestualizzare Williams

Questa regola generale non può essere applicata a tutte le giocatrici (qualche anno fa ho analizzato in modo simile le velocità del servizio dei giocatori e, forse scioccamente, non le ho suddivise per giocatore). Ho applicato lo stesso algoritmo sulle velocità del servizio a Wimbledon delle nove altre giocatrici di cui possiedo dati per almeno 15 partite. L’effetto della velocità varia da “un bel po’” per Johanna Konta a “per niente” nel caso di Venus Williams, con un “non capisco la domanda” per Caroline Wozniacki.

La tabella mostra due numeri per ogni giocatrice. La colonna “ KM/H Agg =” indica l’effetto di 1.6 km/h (1 mph) aggiuntivo sulla percentuale di punti vinti sulla prima, mentre la colonna “KM/H = 1% PVS” indica quanti km/h aggiuntivi sono necessari per aumentare la percentuale di punti vinti al servizio (PVS) di un punto percentuale.

Giocatrice    KM/H Agg =   KM/H = 1% PVS  
Konta         0.89%        1.1  
Kerber        0.56%        1.8  
S. Williams   0.48%        2.1  
Muguruza      0.47%        2.1  
Halep         0.41%        2.5  
Kvitova       0.29%        3.5  
Radwanska     0.28%        3.6  
Azarenka      0.02%        50.9  
V. Williams   0.00%        -  
Wozniacki     -0.40%       - 

Per una prima di servizio efficace (almeno in termini di punti vinti), la velocità del servizio per Konta è importante quasi il doppio di quanto non lo sia per Williams. La media della prima di Konta nella sconfitta ai quarti di finale contro Barbora Strycova è stata di 160.7 km/h (99.9 mph), la più bassa a Wimbledon dalla sconfitta al primo turno nel 2014.

All’estremo opposto troviamo Victoria Azarenka e Venus, per le quali la velocità al servizio non sembra fare troppa differenza (Venus ad esempio eccelle nel letale servizio a uscire, che riesce a trasformare in ace a prescindere dalla velocità). Apparentemente, Wozniacki spinge le avversarie in una situazione di confusione e illogicità, ottenendo risultati migliori con prime di servizio più lente.

Williams contro Halep

Stiamo parlando di un effetto davvero minimo, tale per cui anche l’intervallo tra la prestazione al servizio di Williams nelle sei partite a Wimbledon prima della finale (i 169 km/h di media contro Carla Suarez Navarro) e la finale del 2015 contro Muguruza avrebbe inciso sui punti totali vinti da Williams di circa 2.5 punti percentuali. In nove delle dieci volte in cui Williams e Halep hanno giocato contro, Williams ha sempre vinto grazie ad almeno il 52.5% dei punti totali, e di solito con più del 55%. È un ampio margine di errore o, più precisamente, un ampio margine di lentezza al servizio.

Viceversa, la più recente partita e l’unica dal 2016 è stata anche quella più equilibrata. Halep ha una risposta eccezionale, ma non è immune a servizi potenti: la sua frequenza di punti vinti sulla risposta è influenzata dalla velocità del servizio tanto quanto lo sono le statistiche al servizio per WIlliams. Il divario tra le due nella finale di Wimbledon 2019 potrebbe essere sottile e la velocità del servizio uno dei pochi aspetti su cui Williams ha controllo totale, al fine di indirizzare il risultato in suo favore (Halep ha poi vinto la finale con il punteggio di 6-2 6-2. Williams ha vinto il 59.4% dei punti sulla prima di servizio con il 68.1% di prime in campo e una velocità media di 167 km/h. Ha vinto solo il 41% dei punti totali, n.d.t.)

The Effect of Serena’s Serve Speed

La fortuna del sorteggio: Wimbledon 2019 (donne)

di Chapel Heel // HiddenGameOfTennis

Pubblicato l’1 luglio 2019 – Traduzione di Edoardo Salvati

Come d’abitudine per gli Slam, ho eseguito una simulazione (con la mia variante Elo) di 100.000 configurazioni del tabellone principale, utilizzando lo stesso metodo che gli organizzatori usano per assegnare alle giocatrici la loro posizione. L’ho poi confrontata con la previsione per il torneo su base Elo rispetto al tabellone effettivo.

La tabella mette a confronto la previsione effettiva del tabellone con i risultati dalle simulazioni di rimescolamento, in modo da avere alcune indicazioni sull’accessibilità del tabellone effettivo rispetto alle altre configurazioni. Tonalità di rosso (e arancione) evidenziano la sfortuna della giocatrice. Al contrario, tonalità di verde rappresentano la fortuna ricevuta nel tabellone effettivo, in riferimento a un particolare turno. Il giallo simboleggia neutralità, e si può di fatto ignorare qualsiasi valore superiore o inferiore allo 0.2%.

Come per il tabellone di singolare maschile, per una presentazione più compatta rispetto al passato ho riportato nella tabella solo le teste di serie, e organizzato nella tabella successiva quelle giocatrici fuori dalle teste di serie per le quali c’è stata un’incidenza degna di nota (almeno l’1% di segno positivo o negativo).

I benefici si concentrano interamente nel mezzo del tabellone, mentre tutto lo svantaggio si riversa sui quarti più esterni.

Il tabellone effettivo sembra favorire più di tutte Kiki Bertens, anche se la fortuna per lei arriva fino alle opportunità di semifinale. Petra Kvitova e Karolina Pliskova hanno un vantaggio maggiore fino alle semifinali, e nel caso di Pliskova anche oltre (come se ne avesse effettivamente bisogno dopo aver vinto a Eastbourne). Angelique Kerber è la giocatrice che, in generale, ha avuto più sfortuna, ma è Ashleigh Barty ad aver visto la sua probabilità di finale e di vittoria diminuire più drasticamente in finale e per la vittoria.

IMMAGINE 1 – Confronto tra tabellone effettivo e simulazioni per le teste di serie

Effetti di rilievo su una selezione di giocatrici fuori dalle teste di serie

Non sarebbe male se Margarita Gasparyan (che però ha un secondo turno impegnativo con Elina Svitolina, n.d.t.) e Barbora Strycova (che ha appena vinto al primo turno, n.d.t.) potessero avvantaggiarsi della loro probabilità aggiuntiva, per quanto ridotta, per cercare di arrivare fino ai quarti di finale.

IMMAGINE 2 – Effetti della casualità del sorteggio su alcune non teste di serie

Luck of the Draw: Wimbledon 2019 (Women)