Andreescu, Medvedev e il futuro secondo Elo

di Jeff Sackmann // TennisAbstract

Pubblicato il 10 settembre 2019 – Traduzione di Edoardo Salvati

Con la vittoria agli US Open, che incrementa il bottino del 2019, Bianca Andreescu è finalmente entrata tra le prime 10 della classifica WTA, debuttando al quinto posto. Daniil Medvedev, che durante l’estate ha manipolato l’attenzione del circuito maschile, ha varcato la soglia dei primi 10 solo dopo Wimbledon. Ora occupa la quarta posizione.

Se a una classifica si richiede di predire il futuro, Elo è il sistema migliore. I pronostici fatti con Elo sono significativamente più precisi di quelli che usano i punti classifica. Il primo titolo Premier di Andreescu è arrivato a marzo a Indian Wells, dopo che ha battuto due tra le prime 10, cioè Elina Svitolina in semifinale e Angelique Kerber in finale. La classifica WTA ha reagito facendola salire al 24esimo posto dal numero 60. Già dopo la finale persa a Auckland, Elo vedeva in Andreescu una giocatrice con cui dover fare i conti, mettendola al settimo posto. Dopo altre tre vittorie a Miami, Andreescu è salita tra le prime 5 di Elo.

La prontezza di Elo

Gli algoritmi dietro le classifiche ufficiali impiegano del tempo per accorgersi della presenza di nuove stelle. Elo, invece, reagisce prontamente. Rispetto al metodo di calcolo di ATP e WTA che assegna punti in funzione di un anno di risultati (e in termini di turno raggiunto, non di bravura degli avversari), Elo assegna maggiore importanza a quelli più recenti, con ancora più enfasi per esiti inattesi, come ad esempio sconfitte a sorpresa dei giocatori di vertice.

Gli appassionati sono abituati alla lenta evoluzione della classifica ufficiale, quindi un numero [22] o [15] accanto al nome di Andreescu al Roland Garros e agli US Open non è sembrato fuori luogo. E un giudizio ponderato può avere la sua logica, considerati i passati esempi di giovanissimi che sono rimasti scottati. Elo però ha quasi sempre ragione. Se gli allibratori davano Serena Williams come super favorita nella finale a New York, Elo vedeva in Andreescu la giocatrice più in forma, pronosticandola vincitrice, seppur di poco. Dopo le sette vittorie agli US Open, Elo identifica ora Andreescu come la più forte del circuito, anche se con un margine risicato su Ashleigh Barty. Chi osa non essere d’accordo?

Sulla rampa di lancio

Quando lo scorso ottobre Medvedev ha messo piede tra i primi 10 delle valutazioni Elo per la prima volta, ho messo a confronto i due sistemi di classifica. La maggior parte dei giocatori che guadagna una posizione tra i primi 10 di Elo riesce prima o poi a entrare anche tra i primi 10 della classifica ufficiale, ma Elo è quasi sempre in anticipo. In media, l’algoritmo di Elo seleziona i primi 10 con più di sei mesi di vantaggio sul computer dell’ATP. Medvedev è un buon esempio: ha raggiunto l’ottavo posto di Elo a ottobre 2018, ma gli ci sono voluti altri dieci mesi per avere la stessa posizione nella classifica ufficiale, dopo la finale al Canada Masters.

Andreescu ha colmato il divario più velocemente di Medvedev, nei sei mesi che sono tipicamente richiesti a una giocatrice dall’ingresso tra le prime 10 di Elo a quello nella classifica ufficiale. E non dovrebbe servire molto altro tempo prima di una convergenza perfetta al numero uno delle due classifiche.

Non abbiamo bisogno di Elo per farci dire che Andreescu e Medvedev continueranno presumibilmente a vincere partite ad alto livello. Avendone però riconosciuto l’accuratezza predittiva, vale la pena guardare quali altri giocatori e giocatrici sono sulla rampa di lancio.

Berrettini e Muchova

Dopo gli US Open, la previsione più aggressiva riguarda Matteo Berrettini, che è attualmente al sesto posto. Nella classifica ATP Berrettini è tredicesimo, con una toccata e fuga tra i primi 20 durante l’estate, ed è tra i primi 10 di Elo da metà giugno, quindi ancor prima della semifinale agli US Open. Non solo, ma si trova davanti anche a giocatori giovani ma già avviati come Alexander Zverev e Stefanos Tsitsipas.

In campo femminile, non ci sono sorprese simili tra le prime 10 Elo, il che non significa che ci sia accordo con la classifica WTA. Karolina Muchova, 43esima nonché sua classifica migliore di sempre, è al 23esimo posto di Elo. Anche due veterane e pericoli costanti come Victoria Azarenka e Venus Williams sono confinate fuori dalle prime 40, ma Elo attribuisce loro rispettivamente un 18esimo e 28esimo posto. Da un punto di vista predittivo, la qualità è più importante della quantità, quindi un calendario ridotto non è necessariamente un limite. Elo è ottimista anche su Sofia Kenin, mettendola al 13esimo posto rispetto alla 20esima posizione ufficiale.

Giocatore            Elo   ATP   
Daniil Medvedev        4     4
Matteo Berrettini      6    13
Alexander Zverev       9     6 
Stefanos Tsitsipas    15     7

Giocatrice           Elo   WTA
Bianca Andreescu       1     5
Ashleigh Barty         2     1
Sofia Kenin           13    20
Victoria Azarenka     18    42
Karolina Muchova      23    43
Venus Williams        28    56

Da qui a sei mesi, scommetto che la classifica ufficiale di Berrettini sarà più vicina al sesto posto che al tredicesimo, mentre quella di Muchova più vicina al numero 23 che al 43. Conoscere il futuro è impossibile, ma se si vuole guardare avanti Elo è già li da sei mesi. Occorrerà aspettare per capire se il resto del circuito femminile è in grado di tenere Andreescu lontana dal numero 1 così a lungo.

Andreescu, Medvedev, and the Future According to Elo

I 19 Slam di Nadal, alla maniera di Marcel

di Jeff Sackmann // TennisAbstract

Pubblicato il 9 settembre 2019 – Traduzione di Edoardo Salvati

La distanza si è accorciata. Dopo la vittoria maratona nella finale degli US Open 2019 contro Daniil Medvedev, Rafael Nadal ha raccolto lo Slam numero 19 in carriera, dietro solo ai 20 di Roger Federer. In agguato al terzo posto si trova Novak Djokovic con 16, il favorito agli US Open quest’anno, ritiratosi poi agli ottavi di finale per infortunio.

Appena poche settimane fa, Djokovic appariva come la minaccia più seria per il primo posto di Federer nell’elenco dei vincitori Slam ma, impegnato a riprendersi da una nuova serie di problemi fisici, è Nadal ora ad avere l’abbrivio. Per Federer, che ha compiuto 38 anni a inizio agosto, la prospettiva di aggiungere un altro titolo è sempre più remota.

Recentemente, nel tentativo di prevedere l’evoluzione della classifica Slam, ho ideato un semplice algoritmo, ispirato a Marcel — il sistema di proiezioni del baseball che prende nome della scimmia della famosa serie televisiva “Friends” — così elementare che anche un primate potrebbe usarlo. Le informazioni da considerare sono essenziali: prestazioni nelle semifinali e finali Slam degli ultimi due anni, più l’età. Si scambia ottimizzazione con immediatezza e facilità di comprensione, e i risultati sono incredibilmente affidabili. Per maggiori dettagli sulla metodologia di calcolo e sul rendimento per gli anni passati, potete leggere il precedente articolo.

Risolvete per RN = 19 + x

Prima degli US Open, Marcel sembrava impostato per far arrabbiare il maggior numero di tifosi. Prediceva che, nel corso dei prossimi cinque anni, Djokovic avrebbe vinto quattro Slam, Nadal due e Federer nemmeno uno, lasciando i Grandi Tre in pareggio. Con la conclusione di un altro Slam, le cose sono cambiate. La tabella mostra la nuova previsione, che riflette sia la vittoria di Nadal a New York che un pronostico più roseo per lui dopo aver aggiunto un altro titolo ai risultati più recenti.

Giocatore   Slam  Previsione  Totale  
Nadal       19    3.5         22.5  
Federer     20    0.3         20.3  
Djokovic    16    3.5         19.5

Nadal è ora in corsa per migliorare il totale di almeno tre Slam. Al termine dei cinque anni, avrà forse lasciato Djokovic e Federer nella polvere e ci staremo chiedendo se sarà in grado di raggiungere Serena Williams o anche Margaret Court.

Più previsioni

Questo algoritmo di base consente di generare previsioni di Slam per qualsiasi giocatore che ha raggiunto almeno una semifinale negli ultimi due anni. È importante notare che non cerco di prevedere il totale Slam in carriera, ma solo quanti potrebbero essere vinti nei prossimi cinque anni. Per i Grandi Tre, è ragionevole non preoccuparsi del computo dopo il 2025.
La tabella riepiloga le previsioni attuali per 18 giocatori.

Giocatore       Previsione  
Djokovic        3.5  
Nadal           3.5  
Medvedev        0.8  
Thiem           0.7  
Tsitsipas       0.6  
Berrettini      0.5  
Chung           0.4  
Pouille         0.3  
Edmund          0.3  
Federer         0.3  
Dimitrov        0.1  
Cecchinato      0.1  
Cilic           0.0  
Del Potro       0.0  
Bautista Agut   0.0  
Anderson        0.0  
Nishikori       0.0  
Isner           0.0

La maggior parte di questi giocatori ha solamente una semifinale all’attivo nei due anni passati, ed è l’età a separarli. Sembra logico essere più ottimisti sul futuro negli Slam di Stefanos Tsitsipas (21 anni) che di Roberto Bautista Agut (31), anche se l’algoritmo li pone sullo stesso piano in funzione dei risultati sinora ottenuti, una semifinale negli ultimi 12 mesi.

Cinque anni equivalgono a 20 Slam, e si può notare che la tabella ne tralascia parecchi. Il totale pronosticato è infatti di 10.8 Slam, dando ampio margine di manovra a giocatori che ancora non si sono qualificati, come ad esempio Alexander Zverev e Felix Auger-Aliassime. Sono sicuro che agli US Open 2024 guarderemo alle previsioni di fine 2019 e ci faremo una risata.

Federer manterrà la prima posizione maschile della classifica più santificata nel tennis per almeno quattro mesi. Djokovic sarà probabilmente il favorito agli Australian Open 2020, quindi Federer può godersi almeno nove mesi da unico uomo con 20 Slam. Non serve però un algoritmo, nemmeno il più banale, per identificare il favorito al Roland Garros 2020. Il tennis maschile professionalmente organizzato è rimasto più di un secolo senza un campione con 20 Slam. In meno di un anno, potremmo averne due.

Monkeying Around With Rafael Nadal’s 19 Grand Slams

Ci sei Margaret? Sono io, Serena

di Jeff Sackmann // TennisAbstract

Pubblicato il 6 settembre 2019 – Traduzione di Edoardo Salvati

A Serena Williams mancano solo due partite per vincere lo Slam numero 24 (nella notte Williams si è qualificata per la finale battendo Elina Svitolina con il punteggio di 6-3 6-1, n.d.t.). Deve darle fastidio essere ferma a 23 dall’inizio del 2017, visto che il record di sempre è 24. Williams detiene già il record per l’era Open (a partire dal 1968) con una lunghezza su Steffi Graf, vincitrice di 22 Slam. Ma è Margaret Court davanti a tutti, con appunto 24 Slam tra il 1960 e il 1973.

Non c’è dubbio che Williams sia una delle giocatrici più forti di tutti i tempi, forse la più forte in assoluto. Anche Court è parte della conversazione, insieme ad altre luminarie come Graf, Martina Navratilova e Chris Evert. Nel tennis, confronti tra epoche sono estremamente complicati, perché ogni aspetto del gioco è fondamentalmente cambiato. La tecnica, l’allenamento, l’attrezzatura e il calendario di Williams — tralasciando il benessere economico e lo status! — sarebbero del tutto estranei per una stella degli anni ’60 e ’70 come Court.

La tesi dei tifosi di Williams

L’opinione dei tifosi di Williams sulla posizione che dovrebbe occupare nella classifica di tutti i tempi non subisce le limitazioni legate alla difficoltà del confronto tra epoche. A prescindere dal numero di Slam in bacheca, tre sono le tesi principali su cui i suoi sostenitori fanno affidamento:

  • il livello della competizione è decisamente più alto ora di quanto lo fosse in passato
  • Court ha vinto gli Australian Open 11 volte quando erano il più debole dei quattro Slam
  • Court è una sbruffona antipatica con cui è difficile essere d’accordo

La prima affermazione è probabilmente vera, ma se cerchiamo di portare a termine una comparazione tra epoche, credo che l’unica modalità possibile sia di metterle sullo stesso piano. Non sapremo mai che risultati avrebbe avuto Williams con in mano una raccheta di legno, o come Court si sarebbe adattata alla fisicità del gioco moderno. Si può razionalmente sostenere che le giocatrici attuali siano semplicemente più forti di quelle di due generazioni fa, che a loro volta erano più forti di quelle che le hanno precedute, e così via. Ma l’idea stessa di “più grande di tutti i tempi” presuppone ipotesi diverse da “più grande di tutti i tempi secondo gli standard di oggi”. Per questo ogni epoca verrà trattata allo stesso modo.

La terza affermazione è abbastanza comune, ma temo che il mio database non sia di grande aiuto su quel tipo di discussione. Rimane la numero due, cioè la debolezza relativa degli Australian Open.

La facilità australiana

Court ha vinto gli Australian Open 11 volte, più di qualsiasi altro Slam vinto da una giocatrice. Di per sé, non è un aspetto negativo. Nessuno rinfaccia a Rafael Nadal di aver vinto il Roland Garros 12 volte. All’epoca dei dilettanti, e anche negli anni successivi alla professionalizzazione del tennis, gli Australian Open non erano una tappa obbligatoria per le migliori e i migliori del mondo. Le distanze erano enormi e il torneo non aveva ancora acquisito il prestigio odierno. Si fa presto a concludere quindi che la vittoria a Wimbledon 1963 per Court ha più peso di quella dello stesso anno agli Australian Championships. Molti sono certamente d’accordo nel dover ridurre il valore di quegli Australian Open. Di quanto?

Titoli slam ponderati per difficoltà

Tempo fa ho messo a confronto i candidati al titolo di più forte giocatore della storia in funzione del numero di Slam, corretti per il livello della competizione. Nel tennis attuale, il campo partecipanti è quasi identico da uno Slam all’altro, ma il tabellone può aumentare considerevolmente la difficoltà di vincere un torneo rispetto a un altro. Con la stessa metodologia siamo in grado di confrontare la difficoltà del tabellone e la qualità degli avversari per tornei degli anni ’70 in presenza di una variazione di entrambe. Ad esempio, il cammino di Court alla vittoria degli US Open 1973 fu di difficoltà media, in linea con molte delle vittorie di Williams. La conquista degli Australian Open 1973 ebbe una difficoltà di solo due terzi, cioè fu una delle vittorie più facili di uno Slam nell’era Open.

Ogni epoca allo stesso modo

Non è casuale portare ad esempio le ultime vittorie Slam di Court. Analizzando le prestazioni dagli anni ’70, ci avviciniamo al limite della debolezza di dati storici relativi al tennis. E quasi impossibile stimare l’esatto livello di difficoltà di molti dei titoli di Court, proprio per le poche informazioni a disposizione dell’epoca dei dilettanti. Dovremo invece procedere per approssimazione sulla base di quello che abbiamo.

La ponderazione per difficoltà fa leva sulle valutazioni Elo, che ho calcolato fino al 1972 (pur in possesso di risultati abbastanza completi fino a circa il 1970, serve un po’ di tempo per raccogliere un campione di partite accettabile per ciascun giocatore e per una stabilizzazione delle valutazioni). La tabella riepiloga la difficoltà relativa dei quattro Slam nei primi cinque anni, dal 1972 al 1976.

Slam               Difficoltà  
Australian Open    0.60  
Roland Garros      0.54  
Wimbledon          0.99  
US Open            0.85

Dal 1972 a oggi, la difficoltà media di un titolo Slam è 1.0, con valori più alti per vittorie finali più complicate. Il campo partecipanti non era così agguerrito negli anni ’70, quindi tipicamente uno Slam valeva meno di 1.0. In quei primi cinque anni, notiamo che Wimbledon non si discostava dalla media storica, gli US Open erano leggermente più facili e gli altri due Slam molto più accessibili. Se, come detto, decidiamo di trattare ogni epoca allo stesso modo — escludendo la debolezza del tabellone in Australia — dobbiamo normalizzare queste difficoltà in modo che gli altri tre Slam siano in media 1.0.

Slam              Difficoltà
Australian Open   0.76  
Roland Garros     0.68
Wimbledon         1.25  
US Open           1.07

Estrapolazione all’indietro

Non sappiamo molto della qualità delle avversarie agli Australian Open nel periodo di massimo rendimento di Court. In mancanza di meglio, utilizziamo la media del periodo dal 1972 al 1976, perché è quella che più si avvicina. Così facendo probabilmente si sovrastima la qualità del tabellone australiano rispetto agli altri Slam, ma se vogliamo avvicinarci a definire Williams la più grande di sempre a spese di Court, dovremmo partire da ipotesi più conservative in modo da avere più sicurezza sul risultato finale.

La tabella riepiloga la variazione al totale in carriera di Court applicando il correttivo della normalizzazione.

Slam              Difficoltà  # Slam  Correzione  
Australian Open   0.76        11      8.3  
Roland Garros     0.68        5       3.4  
Wimbledon         1.25        3       3.7  
US Open           1.07        5       5.4  
Totale                        24      20.8

Il medesimo esercizio, ponderare ogni Slam per la difficoltà e normalizzare per epoca, ha conseguenze più lievi sui totali di Williams e Graf. Williams arriva a 23.3 e Graf a 21.9. Non abbiamo materiale a sufficienza per cambiare il punto di vista sui successi di queste due giocatrici. Ed entrambe fanno meglio del totale modificato di Court.

Il ristretto gruppo delle più grandi

Non dimentichiamoci che non è un aggiustamento per epoca. Al contrario, abbiamo ipotizzato per semplicità che tutte le epoche siano uguali, tranne che per il fatto che per diversi anni le giocatrici più forti non sono andate fino in Australia, rendendo quello Slam più facile da vincere degli altri.

Inoltre sono numeri che non negano, come era ovvio, che Court non sia una delle migliori. Anche saltando lo Slam casalingo, si sarebbe comunque ritirata con all’attivo 13 Slam, oltre a una manciata di Slam in doppio e a un lungo elenco di trionfi altrove. Se l’Australia non fosse così distante, probabilmente non avrebbe vinto undici volte, ma otto erano alla portata.

Pur di fronte a tutte le sue vittorie, una volta che stabilita la debolezza del tabellone degli Australian Open, Court cede il primo posto della classifica più santificata nel tennis. Viene quantomeno superata da Williams e Graf. Ricordiamoci che siamo in regime di aggiustamenti conservativi: raccogliendo più dati e scoprendo che dovremmo essere più decisi nel ridurre il valore dei titoli da lei vinti in Australia negli anni ’60, il totale potrebbe posizionarla intorno ai 18 Slam, insieme a Navratilova e Evert.

Non sappiamo ancora se Williams riuscirà a eguagliare o superare i 24 di Court. Anche se dovesse ritirarsi avendone vinti 23, per il livello della competizione attuale — come si vede in ogni Slam ogni anno — merita già di essere in cima alla piramide.

Are You There, Margaret? It’s Me, Serena

Una misura dell’impatto delle palle break

di Jeff Sackmann // TennisAbstract

Pubblicato il 2 gennaio 2019 – Traduzione di Edoardo Salvati

In un precedente articolo, ho esaminato l’effetto della fortuna nei tiebreak. Ho mostrato che se da un lato i giocatori più forti vincono tendenzialmente un numero maggiore di tiebreak, dall’altro non esiste un talento speciale che permette a determinati giocatori un rendimento superiore alla fine del set rispetto ad altri momenti della partita. Di fronte a strisce molto positive, o viceversa molto negative nei tiebreak, dovremmo quindi evitare di assecondare l’invitante ipotesi dell’esistenza di un potere sovrannaturale nei tiebreak e supporre invece che i risultati torneranno in futuro a essere più in linea con la media.

Per le palle break valgono le stesse considerazioni. In una qualsiasi stagione, ci sono giocatori che vincono o perdono palle break in misura sproporzionata, ed è facile ricorrere alla forza mentale come principale spiegazione. Eppure, più spesso di quanto si pensi, quei risultati inusuali scompaiono, e con essi le convincenti teorie su nervi d’acciaio o di crolli sotto pressione che sono state appositamente elaborate.

Per quantificare circostanze di prestazioni migliori o peggiori delle possibilità di ciascun giocatore, ho cercato di esprimere le palle break trasformate in funzione di quelle “attese”, dove l’aspettativa è definita dalla frequenza con cui un giocatore vince i punti alla risposta o PVR (in realtà è leggermente più complicato che considerare la semplice frequenza di PVR di una stagione. Invece, serve prendere la PVR di ogni partita e ponderare le partite sulla base delle palle break concesse).

Palle break trasformate in funzione di quelle attese

Ad esempio, nel 2018 Gael Monfils ha trasformato 146 palle break sulle 317 avute, vale a dire una frequenza del 46.1%. È un valore molto più alto della PVR ponderata del 38.7%. Ha trasformato 23 palle break, o il 19%, più delle attese. Così come per l’analisi sui tiebreak, ho dato un nome a queste statistiche: il valore assoluto è definito come Palle Break Sopra le Attese (PBSA), la frequenza come Rendimento Aggiunto sulle Palle Break (RAPB).

(In media, i giocatori alla risposta vincono qualche palla break in meno dei punti che non sono palle break. Ho abbassato di conseguenza il livello di “attesa” all’1.4%).

Monfils ha rappresentato un’eccezione, l’unico giocatore ad andare oltre il +20 di PBSA, e l’unico con almeno 40 partite e con un PBSA di più del 15%. Poco del passato di Monfils però avrebbe fatto presagire risultati così importanti. Dal 2009 al 2017, ci sono state tre stagioni negative, due anni totalmente neutrali e quattro sopra la media. In quel periodo, Monfils ha convertito palle break più spesso delle attese in misura inferiore all’1%. A questo riguardo, Il successo del 2018 potrebbe essere dovuto a una rinnovata fiducia nelle proprie capacità ma, se la storia è d’insegnamento, non potrà continuare a beneficiare di una combinazione di bravura e fortuna per numeri da primato. La tabella riepiloga le prestazioni migliori e peggiori in termini di PBSA dei giocatori con almeno 20 partite sul circuito maggiore.

Giocatore   PB   Vinte  PBSA   RAPB  
Monfils     317  146    23.4   1.19  
Mcdonald    252  116    19.0   1.20  
Mmoh        129   63    16.9   1.37  
Jaziri      298  134    16.2   1.14  
Herbert     297  126    16.1   1.15  
Mannarino   318  136    14.1   1.12  
Berankis    235  103    13.8   1.15  
Querrey     290  118    13.8   1.13  
Klizan      313  139    13.5   1.11  
Struff      272  118    13.4   1.13  
                                                  
Fucsovics   414  162   -11.5   0.93  
Krajinovic  238   86   -11.8   0.88  
Donskoy     239   79   -11.9   0.87  
Wawrinka    217   66   -11.9   0.85  
Bedene      303  108   -12.9   0.89  
Isner       308   85   -13.0   0.87  
Zverev      347  123   -14.1   0.90  
Cilic       568  209   -18.1   0.92  
Sousa       484  176   -21.6   0.89  
Djokovic    617  246   -21.7   0.92

Impressiona la presenza di Novak Djokovic in fondo all’elenco, tanto scarso o sfortunato quanto Monfils è stato bravo o fortunato. Anche per Djokovic però le cose sono andate un po’ come per Monfils. Dal 2009 al 2017, la RAPB è stata di 0.997 — praticamente neutrale — e ha registrato quasi lo stesso numero di stagioni positive e negative.

Ebbene sì, è casuale

Fornire altri esempi sarebbe solo una ripetizione: il rendimento di un giocatore sulle palle break (a prescindere dalla bravura complessiva alla risposta) è indipendente da un anno con l’altro. Dal 2009 al 2018, ho trovato 700 coppie di stagioni-giocatore consecutive (come il 2017 e il 2018 di Djokovic) in cui la correlazione era sostanzialmente nulla (r^2 = 0.002).
La tabella che segue è ulteriore evidenza di quanto appena detto, perché mostra la RAPB più alta nel 2017 dei dieci giocatori con almeno 20 partite sul circuito maggiore nel 2017 e quella dell’anno successivo (sempre con almeno 20 partite).

Giocatore    RAPB 2017  RAPB 2018  
Dzumhur      1.16       1.05  
Zverev       1.15       1.02  
Kicker       1.15       1.04  
Gojowczyk    1.14       0.92  
Lajovic      1.13       1.04  
Kukushkin    1.13       0.94  
Zverev       1.13       0.90  
Isner        1.12       0.87  
Rublev       1.12       0.96  
Monteiro     1.12       1.17  
MEDIA        1.14       0.99

Solo Thiago Monteiro ha mantenuto un rendimento tale da farlo figurare tra i più forti del circuito. Il 2018 di John Isner è stato così diverso che si è piazzato agli ultimi posti. Complessivamente, cinque dei primi dieci nel 2017 hanno finito il 2018 sotto la media, e i dieci giocatori insieme hanno ottenuto un RAPB appena inferiore alla neutralità. In altre parole, siamo in presenza di una situazione indistinguibile dal caso.

Che prezzo ha la fortuna?

Siamo d’accordo sul fatto che il rendimento attuale sulle palle break non è di alcuna indicazione su quello futuro. Come però ho sottolineato per i tiebreak, proprio questa mancanza predittiva ha un valore.

Il +20 di PBSA di Monfils è stato di aiuto alla causa, consentendogli più vittorie nel 2018 di quelle che avrebbe altrimenti ottenuto. I risultati sulle palle break hanno probabilmente incrementato la classifica e i premi partita. Un ritorno alla neutralità non lo farà uscire dal circuito, ma ipotizzando che serva e risponda come ha fatto l’anno scorso, un PBSA meno scintillante potrebbe danneggiarlo. Di quanto?

Sempre in riferimento ai tiebreak, ho supposto che due tiebreak in più equivalgono a una vittoria extra. Per le palle break è un po’ più complicato: è chiaro che una palla break non ha lo stesso peso di un intero tiebreak, sia perché è un solo punto, sia perché raramente arriva come set point o match point. Inoltre, le palle break sono più cospicue e cifre come il +23 di Monfils o il -21 di Djokovic sono più estreme delle equivalenti prestazioni più inattese nei tiebreak.

Una misura dei punti ad alta leva

L’elemento chiave nella misurazione dell’impatto delle palle break è il concetto generale di probabilità di vittoria, oltre alla nozione più specifica di leva (spesso indicata anche come volatilità o importanza, ma l’idea di fondo è identica). In sintesi, la probabilità di vittoria è la quantificazione della probabilità per un giocatore di vincere la partita in un qualsiasi momento della stessa. La leva è un indice di quanto un singolo punto sia in grado di incidere sulla probabilità di vittoria. Immaginiamo una partita tra due giocatori dello stesso livello.

Prima dell’inizio, entrambi possiedono una probabilità di vittoria del 50%. Se vincere il primo punto fa aumentare la probabilità del giocatore al servizio al 51% o diminuirla al 49% nel caso lo perda, diciamo che la leva del primo punto è del 2%, vale a dire la differenza tra le probabilità di vittoria che derivano dal vincere e perdere il primo punto.

Maggiore è la posta in gioco del punto, più alta la leva associata. Tipicamente, un punto è ben sotto al 5%, ma uno di vera alta pressione, come 5-6 nel tiebreak del terzo set, può avere una leva anche del 50%. La statistica che esprime la probabilità di vittoria è largamente influenzata dal tipo di fattori selezionati, per cui non esiste un’unica misura matematicamente corretta della leva di ogni istante.

Ipotizzare che due giocatori siano dello stesso livello significa stimare che la probabilità di vittoria a inizio partita sia ben diversa del caso in cui uno dei due sia nettamente favorito. Anche queste interpretazioni hanno conseguenze sulla leva di ciascun punto. Su grandi insiemi di partite però, come una stagione intera, riusciamo ad avere un’idea generale del valore delle palle break.

Condizione sufficiente e necessaria

Nella semplice ma ovviamente errata ipotesi che tutti i giocatori siano dello stesso livello, in media la leva di un punto del circuito maschile nel 2018 era del 4.6%, e la leva di una palla break, sempre in media, del 10.5%. È un buon punto di partenza, ma decisamente troppo alto. Se accettiamo che la maggior parte delle partite è tra giocatori di livello diverso, ci rendiamo conto che una qualsiasi palla break non è poi così importante. Se Djokovic ne spreca una contro Monteiro, rimarrà comunque il super favorito.

Un metodo alternativo è quello di supporre che la bravura di un giocatore sia data esattamente dal rendimento in partita. Se Djokovic gioca contro Monteiro e vince l’80% dei punti al servizio, e Monteiro solo il 60%, si potrebbe calcolare la probabilità di vittoria e la leva di ciascun punto. Otterremmo in media una leva del punto del 2.9% e una della palla break del 6.5%.

Anche la seconda ipotesi non è del tutto corretta, ma forse si avvicina più della prima alla situazione effettiva. Non dimenticando che si tratta di un’approssimazione, usiamo una leva della palla break del 7.5%. Significa che, in media, il diverso esito di una palla break incide sulla probabilità di vittoria di un’unica partita del 7.5%. Un altro modo di vederla — quello con più rilevanza per questi calcoli — è che vincere una palla break anziché perderla equivale a vincere il 7.5% (o circa un tredicesimo) di una partita.

Le palle break sono (frazioni di) vittorie

Riprendendo il concetto di Palle Break Sopra le Attese, siamo ora in grado di dire che 13 palle break aggiuntive equivalgono a una vittoria extra. Il +23 di Monfils del 2018 gli ha regalato quasi due vittorie in più in stagione, mentre il -21 di Djokovic gli sarebbe costato, in media, 1.5 partite perse. Tenendo conto della moltitudine di elementi che incidono sulla prestazione all’interno di una partita, è irragionevole pensare che il record di vittorie e sconfitte di ogni giocatore nel 2019 rifletta in modo così preciso e prevedibile queste somme o sottrazioni di partite (anche semplicemente perché è impossibile vincere una partita e mezza). Ma nell’improbabile circostanza di parità di condizioni, dovremmo attenderci che quel vantaggio o quello svantaggio non abbiano seguito nella nuova stagione.

L’intervallo che separa il -21 dal +23 di palle break è un’affidabile rappresentazione della configurazione estrema che può acquisire la fortuna sulle palle break. Dal 2009, solo quattro giocatori hanno avuto stagioni con valori maggiori di +23, tra cui il BPSA più alto in assoluto di +34 di Damir Dzumhur nel 2017 (il quale ha subito pesantemente la sorte avversa l’anno successivo: da un record di 37-24 è passato a uno di 25-31 nel 2018, pur con un fortunato +8 di PBSA). All’estremo opposto, Dominic Thiem ha sofferto per un -28 di palle break sotto le attese nel 2015, L’anno dopo, è salito a -5 e in classifica è andato dalla 19esima alla nona posizione. Nonostante le montagne russe di Dzumhur e Thiem, sembra che l’oscillazione legata all’effetto fortuna sulle palle break sia di circa cinque vittorie, dal -2 al +3 per i giocatori più baciati dalla fortuna.

Non esiste una bravura speciale

Tuttavia, per la maggior parte dei giocatori nella maggior parte delle stagioni, la fortuna sulle palle break è poco più di un arrotondamento. Per quanto sia facile subire il fascino di questi calcoli, è proprio questa la conclusione più significativa. Come non esiste uno speciale fattore tiebreak, non c’è alcun motivo di ritenere che alcuni giocatori siano in qualche modo più bravi di altri a trasformare le palle break. Più forte il gioco alla risposta, più numerose saranno le palle break trasformate. Qualsiasi rendimento che eccede questo assunto rientrerà nella media. E per quei giocatori con un rendimento eccessivamente positivo o negativo sulle palle break, quella regressione avrà probabilmente conseguenze sul record di vittorie e sconfitte, sulla classifica e oltre.

Measuring the Impact of Break Points

Fare previsioni sul migliore di sempre con l’aiuto di una scimmia

di Jeff Sackmann // TennisAbstract

Pubblicato il 3 agosto 2019 – Traduzione di Edoardo Salvati

Dopo la vittoria di Novak Djokovic a Wimbledon, l’attenzione al primato negli Slam è salita alle stelle. Roger Federer è a 20, Rafael Nadal a 18 e Djokovic, ora a 16, è di gran lunga il più forte del mondo sulla superficie dei prossimi due, gli US Open e gli Australian Open. La corsa è assolutamente aperta.

Fare previsioni nel tennis è difficile, anche cercando di pronosticare i risultati delle partite del giorno dopo. Sembra che i giocatori migliorino e peggiorino in modo del tutto casuale, rendendo difficile capire quale sarà la classifica anche a pochi mesi di distanza. Appassionati e tifosi amano perdersi in congetture su chi dei Grandi Tre s’impossesserà della vetta degli Slam, ma troppa incertezza non permette conclusioni definitive.

Si può pensare di costruire una sfera di cristallo con cui analizzare la problematica in modo rigoroso. Prendiamo ad esempio l’età di un giocatore, la probabile durata della carriera, gli eventuali infortuni, il rendimento negli ultimi quattro Slam, la classifica attuale, la bravura degli altri giocatori su ciascuna superficie e altri possibili parametri. Forse si riesce a determinare qualche numero che abbia un senso. E se invece ignorassimo tutto questo, adottando il modello più semplice in assoluto?

Vi presento la scimmia

I patiti di statistiche di baseball hanno familiarità con il sistema di proiezioni Marcel, così chiamato in onore della scimmia nella famosa serie televisiva “Friends”, perché “utilizza meno intelligenza possibile”. Nel caso del baseball, appena tre anni di risultati e una correzione per il fattore età. Non è immune da lacune, e sono evidenti i molti miglioramenti che si potrebbero apportare. Ma, come nel tennis, anche nel baseball le statistiche producono rumore. Per la maggior parte degli scopi, un sistema previsionale “di base” funziona tanto quanto uno più complesso. E, nel corso degli anni, Marcel ha fatto meglio di molti modelli considerevolmente più evoluti.

Applichiamo la logica del mammifero alle previsioni per gli Slam. Per prima cosa, riformulo leggermente la domanda alla ricerca di una risposta più diretta. Invece di prevedere i risultati Slam “in carriera”, mi concentro sulle vittorie per i prossimi cinque anni (includendo, quantomeno a occhio, il cammino completo dei Grandi Tre). Inoltre, nello spirito di Marcel, limito i dati a semifinali, finali e titoli Slam per gli ultimi tre anni, e l’età dei giocatori. Anzi, spengo subito una parte del cervello da scimmia, perché i risultati relativi agli Slam di tre anni fa possiedono scarso potere predittivo. Quindi l’elenco si riduce a due anni di semifinali, finali e titoli Slam, più l’età.

Una buona approssimazione

Il modello che ne consegue è molto valido! Per quei giocatori che hanno raggiunto una semifinale degli ultimi otto Slam, è in grado di prevedere il 40% della variazione nei titoli Slam dei prossimi cinque anni. In assenza di un modello iper-complesso e ottimale, non so esattamente dire dove si posizioni, ma per un orizzonte così lungo prevedere quasi la metà della variazione di risultati Slam giocatore per giocatore è, per me, una buona approssimazione.

Si pensi a tutto ciò che si ignora degli Slam per il 2022, ancor più per il 2024: chi è in attività, chi si è infortunato, chi è migliorato a sufficienza per essere considerato un favorito, quali promesse sono emerse dal nulla, e così via. Voglio dire che anche il modello più perfetto avrebbe molte carenze, quindi non serve stabilire uno standard troppo alto.

Andare dietro alla scimmia

L’algoritmo dei due anni più l’età è così semplice da poter essere eseguito sul retro di una scatola di sigarette (in omaggio al grande fisico Ettore Majorana, n.d.t.). Per il singolo giocatore, si contano le semifinali (vinte o perse), le finali (vinte o perse) e i titoli degli ultimi quattro Slam, e si fa lo stesso per i precedenti quattro. Si considera poi l’età all’inizio dello Slam successivo. Si parte con zero punti e si procede come segue:

  • si aggiungono 15 punti per ogni semifinale degli ultimi quattro Slam
  • si aggiungono 30 punti per ogni finale degli ultimi quattro Slam
  • si aggiungono 90 punti per ogni titolo degli ultimi quattro Slam
  • si aggiungono 6 punti per ogni semifinale dei precedenti quattro Slam
  • si aggiungono 12 punti per ogni finale dei precedenti quattro Slam
  • si aggiungono 36 punti per ogni titolo dei precedenti quattro Slam
  • se il giocatore ha più di 27 anni, si sottraggono 8 punti per ogni anno dopo il 27esimo
  • se il giocatore ha meno di 27 anni, si aggiungono 8 punti per ogni anno fino al 27esimo
  • si divide la somma per 100.

Un test con Djokovic

Finito! Proviamo con Djokovic. Negli ultimi quattro Slam (fino a Wimbledon 2019 incluso), ha vinto tre titoli e raggiunto una semifinale. Dei quattro precedenti, ne ha vinto uno. Agli US Open 2019 avrà 32 anni. Quindi:

  • +60 (15 punti per ognuna delle semifinali negli ultimi quattro Slam)
  • +90 (30 punti per ognuna delle tre finali negli ultimi quattro Slam)
  • +270 (90 punti per ognuno dei tre titoli negli ultimi quattro Slam)
  • +6 (6 punti per la semifinale a Wimbledon 2017)
  • +12 (12 punti per la finale a Wimbledon 2017)
  • +36 (36 punti per il titolo a Wimbledon 2017)
  • -40 (Djokovic ha 32 anni, si sottraggono 8 punti per ognuno dei cinque sopra ai 27).

Sommando, si ottiene 434 che, diviso per 100, genera una previsione di altri 4.34 Slam per Djokovic.

Un nuovo livello di provocazione nella discussione sul più forte di sempre

Avete la mia parola che si tratta di un’analisi totalmente disinteressata. Voglio solo sapere quanto un’accurata previsione Slam di lungo periodo, seppur ridotta all’osso, riesca a essere precisa. Non ho l’intento di farvi perdere i capelli che, temo di dovervi confessare, perderete comunque prima o poi.

Questo è il numero di Slam che il modello prevede per i Grandi Tre tra gli US Open 2019 e Wimbledon 2024:

  • Djokovic, 4.34
  • Nadal, 2.22
  • Federer, 0.26.

Non serve che mostri i calcoli per il passo successivo, ma sapete che non posso esimermi dal farli. Questa è la previsione per il totale in carriera:

  • Djokovic, 20.34
  • Federer, 20.26
  • Nadal, 20.22.

Siccome viviamo in un mondo dove non si vincono frazioni di Slam, abbiamo:

  • Djokovic, 20
  • Federer, 20
  • Nadal, 20

Molto bene…

Torniamo al modello

La previsione di 4.34 Slam per Djokovic è decisamente alta, in linea con un giocatore che ne ha vinti tre degli ultimi quattro. Per ogni anno dal 1971, ho calcolato le previsioni Slam di ciascun giocatore che ha raggiunto una semifinale nei due anni precedenti, un totale di più di 800 previsioni. Solo 14 sono superiori a 4.34, e molte riguardano i Grandi Tre. La tabella riepiloga le prime dieci.

Anno  Giocatore   Età   Previsione   Effettivo     
2008  Federer     26    6.38         5     
2007  Federer     25    5.86         7     
2016  Djokovic    28    5.20         6 *  
2005  Federer     23    4.91         11     
2011  Nadal       24    4.89         5     
2006  Federer     24    4.86         10     
2017  Djokovic    29    4.79         4 *  
2012  Djokovic    24    4.68         8     
1989  Wilander    24    4.65         0     
1988  Lendl       27    4.56         2

* conteggio che potrebbe ancora aumentare

Sono previsioni basate sui dati disponibili all’inizio dell’anno che compare nell’elenco. La prima riga, Federer 2008, si riferisce alla previsione per Federer dei titoli Slam per il periodo dal 2008 al 2012, in funzione del rendimento nel 2006 e 2007 e sull’età agli Australian Open 2008. Se avessi concepito il modello a quel tempo, la previsione si sarebbe attestata intorno alla mezza dozzina di Slam. Federer ne ha vinti cinque.

Ci sarà sempre molto rumore statistico agli estremi di modelli come questi. All’inizio del 2005, l’algoritmo avrebbe assegnato a Federer “solo” cinque dei successivi venti Slam. Invece, ne vinse ben 11. Faccio fatica però a credere che ci fosse stato anche un modello talmente ottimistico da indovinare la doppia cifra. L’edizione 1989 del modello invece sarebbe stata generosa in senso opposto con Mats Wilander, che nel 1988 aveva fatto tre quarti di Slam. Tristemente per lo svedese, un gruppetto di giovanissimi gli passò avanti e non raggiunse più nemmeno una finale.

Diamo uno sguardo anche alle successive dieci previsioni più rosee, e alla stima attuale per Djokovic.

Anno  Giocatore   Età   Previsione   Effettivo     
2010  Federer     28    4.48         2     
1981  Borg        24    4.47         1     
1996  Sampras     24    4.47         6     
1975  Connors     22    4.45         2     

Att.  Djokovic    32    4.34         0 *  

1980  Borg        23    4.28         3     
2013  Djokovic    25    4.24         7     
2009  Federer     27    4.20         4     
1995  Sampras     23    4.16         7     
2009  Nadal       22    4.12         8     
1979  Borg        22    4.09         5

* conteggio che potrebbe ancora aumentare

Di nuovo molto rumore, con risultati tra 0 e 8 Slam. Però, la media delle altre dieci previsioni in elenco è di 4.5 Slam, esattamente in linea con la precedente previsione per Djokovic.

Slam che mancano…

Il modello prevede che i Grandi Tre vincano circa sette dei prossimi venti Slam. Giustamente vi chiederete: e gli altri tredici? La scimmia considera solo i giocatori con una semifinale negli ultimi otto Slam, quindi la somma complessiva non dovrebbe fare venti. Esiste la possibilità che vincitori del 2023 e 2024 non siano ancora nel radar, e molti dei giovani sulla bocca degli opinionisti —come Alexander Zverev, Felix Auger-Aliassime e Daniil Medvedev — non hanno ancora raggiunto una finale Slam. La tabella riepiloga i giocatori per i quali è possibile fare una previsione.

Giocatore         Previsione Slam  
Djokovic          4.34  
Nadal             2.22  
Thiem             0.71  
Tsitsipas         0.63  
H. Chung          0.38  
Pouille           0.31  
Edmund            0.30  
Federer           0.26  
Del Potro         0.19  
Cecchinato        0.06  
----------------  ----  
TOTALE            9.40

* Per gli altri cinque giocatori con una semifinale 
dagli US Open 2017 la previsione di titoli Slam è zero

Sono consapevole che Lucas Pouille e Hyeon Chung non hanno più probabilità di vincere uno Slam di quante ne abbia Federer. Ma sono (relativamente) giovani e il modello riconosce a molti giocatori che hanno raggiunto una semifinale Slam all’inizio della carriera la capacità di gettare le basi sul quel successo.

Oltretutto, ci stiamo perdendo molti Slam. Se la previsione complessiva è corretta, quei giocatori vinceranno meno della metà dei prossimi venti Slam, lasciando almeno dieci titoli a giocatori che ancora devono arrivare a un quarto di finale Slam.

…e il fattore età

Se vi ricordate, ho proceduto a ritroso nelle previsioni per ciascun intervallo di cinque anni fino al 1971-1975. Su 44 anni dall’avvio delle stagioni tra il 1971 e il 2014, il modello tipicamente ha previsto che i giocatori di cui aveva dati — vale a dire quelli con semifinali Slam nei precedenti due anni — avrebbero vinto 13 dei successivi 20 Slam. In realtà, i giocatori nel radar hanno vinto in media 12 Slam nei cinque anni a venire.

È solamente negli ultimi anni che il numero totale di Slam previsti è sceso sotto i 10. La colpa è dell’età: come detto, per correggere per l’età si sottraggono 8 punti (0.08 Slam) per ogni anno oltre i 27. Per Djokovic e Nadal si tratta di una penalizzazione di 0.4 Slam, mentre sono 0.8 gli Slam cancellati dalla futura bacheca di Federer. Accade che il modello prevede il calo di rendimento dei Grandi Tre, e al contempo non ci sono molti giovani (come Pouille e Chung) nell’elenco in grado di compensarlo.

Nuove curve d’invecchiamento

L’interpretazione delle previsioni per i Grandi Tre alla luce degli Slam “mancanti” dipende da un paio di elementi:

  • la curva d’invecchiamento per le mega stelle è cambiata? I 30 sono i nuovi 25, o i 32 i nuovi 27?
  • la nuova generazione di giocatori riuscirà a essere forte abbastanza in fretta da scardinare la presa dei Grandi Tre?

C’è abbondanza di prove a dimostrazione di una modifica della curva d’invecchiamento, dovremmo cioè aspettarci risultati migliori dai trentenni di questa epoca rispetto a quanto accadeva negli anni ’80 e ’90. Questo ridurrebbe gran parte del divario. Ipotizziamo di spostare l’età di massimo picco a 31 anni, quattro in più rispetto alla media maschile di 27 per l’era Open. Così facendo aggiungiamo 0.32 Slam alla previsione di ogni giocatore, probabilmente aumentando di uno il computo previsto per i Grandi Tre. Complessivamente, vorrebbe dire portare il totale della precedente tabella a un po’ più di tre Slam addizionali, avvicinandosi alla media storica di 13 Slam. La variazione di età non sbroglia però la matassa dei Grandi Tre, perché li riguarda allo stesso modo. Solo, essere in parità a 21 Slam diventa leggermente più probabile che esserlo a 20 Slam.

La difficoltà di prevedere il livello di competizione

La seconda domanda è quella più importante, ma anche la meno pronosticabile. Pur risolvendo l’ostica incombenza di arrivare a conoscere il rendimento del singolo giocatore tra tre, quattro o cinque anni (e a volte, come nel caso di Nick Kyrgios, anche domani), rimarremmo comunque con l’ancora più difficile questione di prevedere il livello della competizione.

Nel 2003, la scimmia sarebbe stata convinta che i giocatori di vertice del momento, quelli che avevano raggiunto semifinali Slam nel 2001 e 2002, avrebbero raccolto 13 Slam tra il 2003 e il 2007. Erano 2.5 per Lleyton Hewitt, più uno a testa per Thomas JohanssonAlbert CostaPete SamprasMarat SafinDavid NalbandianJuan Carlos Ferrero. Questi sette giocatori ne hanno poi vinti solo due. L’intero gruppo di venti giocatori meritevoli di previsioni alla vigilia degli Australian Open 2003 ne ha vinti solo 3.

Non riusciremo probabilmente mai a stabilire con esattezza la bravura di quel gruppo rispetto ad altre epoche. La certezza che abbiamo è che nessuno è stato forte quanto Federer tra il 2003 e il 2005 e che, alla fine del periodo di cinque anni, anche Nadal è entrato a dominare la scena (solo Nalbandian era tra i primi 10 in classifica alla fine del 2007). La generazione degli Zverev/Tsitsipas/Auger-Aliassime/etc non raggiungerà l’apice toccato dai Fantastici Quattro, ma l’andamento dei prossimi venti Slam dipenderà più da loro che dalla (relativamente) più prevedibile traiettoria di carriera di Djokovic, Federer e Nadal.

Non ci rimane che un mucchio di incertezze già note ed errori con una parabola più ampia di un rovescio steccato di Federer. Però, rispetto a quanto sappiamo, la vetta della classifica Slam di tutti i tempi diventerà ancora più affollata.

Così parlo la scimmia.

GOAT Races: Forecasting Future Slams With a Monkey

C’è sempre una possibilità, anche per Marie Bouzkova

di Jeff Sackmann // TennisAbstract

Pubblicato il 10 agosto 2019 – Traduzione di Edoardo Salvati

Marie Bouzkova, numero 91 del mondo e passata dalle qualificazioni, ha battuto ai quarti di finale di Toronto la numero 4 Simona Halep, che si è dovuta ritirare per un infortunio alla gamba dopo aver perso il primo set. C’è quindi un asterisco: anche se fossimo pronti ad attribuire più importanza a una singola partita di quella che richiede, non daremmo grande significato a questa.

Si tratta comunque di un risultato di prestigio per la ventunenne della Repubblica Ceca, che ha eliminato la seconda giocatrice tra le prime 10 della settimana, arrivando alla prima semifinale in carriera in un torneo Premier, contro niente di meno che Serena Williams (perdendo però in tre set, dopo aver vinto il primo per 6-1, n.d.t.)

Qualcosa di strano

Era la partita numero 62 del 2019 per Bouzkova, la numero 61 contro una giocatrice in possesso di classifica ufficiale. Ha vinto contro la più forte che abbia incontrato quest’anno, Halep, ma ha perso appena la settimana scorsa contro CoCo Vandeweghe, la numero 636 e l’avversaria con la classifica più bassa.

C’è un altro asterisco: Vandeweghe è al rientro da un infortunio, è sicuramente a un livello più alto di quello attuale e le stranezze del circuito Transition della federazione internazionale non hanno consentito al sistema di classifica di riflettere nel 2019 lo stato dell’arte come in passato. Alcune giocatrici che avrebbero normalmente una classifica molto bassa, come ad esempio la wild card del Kazakistan che Bouzkova ha demolito un paio di settimane fa, non contano.

Rimangono in ogni caso 61 partite, di cui una vittoria contro la giocatrice dalla classifica più alta e una sconfitta contro quella dalla classifica più bassa. Una ricerca nel mio database ha rivelato molte altre simili sorprese. Tornando indietro per meno di dieci anni, fino al 2010, ho trovato 127 giocatrici che hanno ottenuto una combinazione identica di risultati all’interno della stessa stagione, con almeno trenta partite giocate (per coerenza, ho incluso i ritiri quando si era concluso almeno un set).

Se alcune non sono di grande interesse — è il caso ad esempio di Mira Antonitsch che l’anno scorso non ha giocato contro avversarie tra le prime 400 — 63 delle 127 hanno battuto una tra le prime 100, 44 hanno battuto una delle prime 50 e 25 hanno avuto il lusso di una vittoria a sorpresa contro una delle prime 10. Halep è stata la vittima delle prime 10 in ben tre occasioni!

Le limitazioni del sistema ufficiale

Questo fa di Bouzkova la quarta giocatrice in una stagione (quantomeno di otto mesi) ad aver battuto Halep, a non aver giocato contro una giocatrice dalla classifica più alta e ad aver anche perso con la giocatrice più bassa in classifica. Halep non deve rimanerci troppo male, visto che Angelique Kerber è stata dalla parte della sconfitta più alta per cinque volte, di cui quattro nel 2017. Non bene!

La tabella elenca le 25 giocatrici-stagione tra il 2010 e il 2018 che hanno battuto la più alta in classifica e perso dall’avversaria più bassa.

Anno  Giocatrice   Più alta    Class  Più bassa    Class       
2017  Kasatkina    Kerber      1      Kanepi       418      
2018  Hsieh        Halep       1      Gasparyan    410      
2010  Jankovic     Serena      1      Diyas        268      
2010  Clijsters    Wozniacki   1      G-Vidagany   258   *  
2014  Cornet       Serena      1      Townsend     205      
2010  Yakimova     Jankovic    2      Dellacqua    980      
2017  Bouchard     Kerber      2      Duval        896   *  
2017  Vesnina      Kerber      2      Azarenka     683      
2016  Bencic       Kerber      2      Boserup      225      
2014  Rybarikova   Halep       2      Eguchi       183      
2017  Mladenovic   Kerber      2      Andreescu    167   *  
2018  Goerges      Wozniacki   3      Serena       451      
2014  Tomljanovic  Radwanska   3      A Bogdan     308      
2015  Mladenovic   Halep       3      Savchuk      262      
2017  Kerber       Pliskova    4      Stephens     934      
2014  Pavlyu'ova   Radwanska   4      Wozniak      241      
2017  Dodin        Cibulkova   5      Rybarikova   453      
2017  Bellis       Radwanska   6      Azarenka     683      
2018  Buyukakcay   Ostapenko   6      Di Sarra     555      
2017  Sakkari      Wozniacki   6      Potapova     454      
2015  L Davis      Bouchard    7      E Bogdan     527      
2015  Ostapenko    S-Navarro   9      Dushevina    1100  *  
2016  KC Chang     Vinci       10     S Murray     862      
2018  Pera         Konta       10     Hlavackova   825      
2018  Danilovic    Goerges     10     Pegula       620

* 1 avversaria senza classifica

Basta poco per accorgersi che Vandeweghe non è la prima giocatrice con bassa classifica a suscitare una reazione del tipo “si, ma…”. Questo gruppo di avversarie apparentemente deboli è in realtà molto forte visto che contenere giocatrici con una classifica media fuori dalle prime 500. Ci sono stelle come Victoria Azarenka (per due volte) e Serena, oltre a promesse come Bianca Andreescu e Victoria Duval.

Consideriamolo il richiamo quotidiano alle limitazioni della classifica generata dalla WTA, che indica quali giocatrici hanno vinto molte partite nelle ultime 52 settimane, ma non necessariamente chi stia giocando bene.

Divergenze estreme ma non troppo rilevanti

Siamo di fronte ad alcune delle divergenze più estreme tra le posizioni espresse dal sistema ufficiale e la bravura sul campo in uno specifico momento. Non credo che essere in questo elenco abbia particolare rilevanza, tranne forse che le molte presenze di Keber (sia da giocatrice che da scalpo!) siano una sintesi efficace della delusione della sua stagione 2017.

Bouzkova rimarrà in elenco per almeno ancora altri due giorni, visto che Serena è fuori dalle prime 10 e le altre due semifinaliste hanno una classifica più bassa, facendo sì che Halep sia stata l’avversaria più “difficile” (nell’altra semifinale Andreescu ha battuto Sofia Kenin per 6-4 7-6, n.d.t.). E, nonostante la settimana di ottimo tennis, è comprensibile che Bouzkova possa sentirsi disorientata quando dalla parte opposta della rete c’è una giocatrice che ha vinto 23 Slam (per quanto, come visto, pur nella sconfitta Bouzkova ha dominato il primo set, n.d.t.). Una cosa è certa: Bouzkova è indifferente al numero che compare accanto al nome dell’avversaria.

There’s Always a Chance: Marie Bouzkova Edition

Anatomia della prova di forza al servizio di Alex de Minaur

di Jeff Sackmann // TennisAbstract

Pubblicato l’1 agosto 2019 – Traduzione di Edoardo Salvati

Il torneo di Atlanta è solitamente popolato da grandi giocatori al servizio. Tra il 2013 e il 2018, John Isner ha vinto cinque titoli in sei anni, fermato solo da Nick Kyrgios, naturalmente per mano di due tiebreak. Prima dell’avvento di Isner, l’ultimo vincitore è stato Andy Roddick. I campi in cemento sono veloci e il caldo spesso torrido, quelle condizioni che favoriscono una settimana di ace a profusione.

Anche il trionfatore del 2019 si è fatto strada con una prestazione sbalorditiva al servizio, vincendo quattro partite senza mai concedere una palla break e vincendo in ciascuna più del 90% di punti sulla prima. Sono numeri alla Isner che però non appartengono al gigante e nemmeno al suo erede designato, l’altro gigante Reilly Opelka. Il re del servizio quest’anno ad Atlanta è stato il “normalmente alto” (183 cm) lottatore australiano Alex de Minaur.

A differenza di molti dei colleghi, de Minaur non si guadagna da vivere con un servizio bomba. Nelle ultime 52 settimane, sia Inser che Opelka hanno servito ace per un quarto dei punti al servizio. Nello stesso periodo, per l’australiano la frequenza di ace non va oltre un magro 4.5%.

In finale contro Taylor Fritz (e se si esclude il ritiro di Bernard Tomic nei quarti di finale), de Minaur ha ottenuto il massimo in carriera sul circuito maggiore di 14.8%, ma non è riuscito a superare la doppia cifra nel secondo turno contro Bradley Klahn o in semifinale contro Opelka. È stata una dimostrazione del fatto che ci sono diversi modi di vincere punti al servizio senza necessariamente accumulare un ace dopo l’altro.

Primo strike

Il percorso più veloce per la vittoria senza servire ace è attraverso servizi vincenti. Il giocatore al servizio non ha lo stesso livello di controllo sulla frequenza di servizi vincenti rispetto a quello sugli ace. Molti dei servizi più efficaci però sono raggiungibili dal giocatore alla risposta — se non effettivamente rimettibili in campo — e quindi non vengono conteggiati nella colonna degli ace. È proprio in questa categoria che de Minaur ha dominato ad Atlanta.

Secondo le statistiche punto per punto della finale raccolte per il Match Charting Project, Fritz ha rimesso in gioco solo il 57% dei servizi di de Minaur. In più di 1300 partite sul cemento dal 2010 nel database, la media del circuito è del 70% di risposte in campo, e gli avversari di de Minaur tradizionalmente hanno fatto meglio. La frequenza del 43% di servizi vincenti per l’australiano è eccezionalmente alta, e raggiunge il 90esimo percentile del rendimento al servizio. Contro Opelka, de Minaur ha servito solo 5 ace su 93 punti al servizio, ma ben 38 non sono tornati indietro. Stiamo parlando di una frequenza di servizi vincenti del 46%, valida per il 94esimo percentile.

Secondo strike

Quando il servizio non ha funzionato a pieno regime, de Minaur ha ottenuto risultati ancora più importanti. Ad allenatori e commentatori piace parlare della strategia “più uno”, cioè quella di servire potente e trovarsi in posizione per un colpo aggressivo sulla risposta, qualsiasi essa sia. In questo l’australiano ha davvero raggiunto l’eccellenza durante la finale.

Oltre al 43% di servizi vincenti contro Fritz, un altro 26% dei punti al servizio è rientrato nella categoria “più uno”, vale a dire il primo colpo dopo la risposta dell’avversario che porta a un punto diretto. La media del circuito è del 15% e, anche in questo caso, de Minaur non è andato sempre così bene. In 15 partite del 2018 sul cemento di cui abbiamo dati punto per punto, la sua media è stata solo del 12.6%. Il 26% della finale lo pone nel 98esimo percentile tra le partite sul cemento del database del Match Charting Project. Delle 67 partite che hanno avuto una percentuale superiore al 26%, 15 sono state a opera di Roger Federer. La maggior parte dei giocatori non ha mai avuto una giornata così remunerativa nella categoria “più uno”.

Terzo strike

Anche i più forti al servizio si trovano, occasionalmente, di fronte a uno scambio lungo. Nel campione di partite considerate, nel 40% dei punti il giocatore alla risposta sopravvive alla tattica del “più uno” e riesce a mandare avanti lo scambio. Da quel momento c’è maggiore equilibrio, e chi è in risposta vince poco più della metà dei punti (in parte perché scambi da quattro colpi sono più frequenti di scambi da cinque colpi e così via, e perché, per definizione, lo scambio da quattro colpi è vinto dal giocatore alla risposta. Detto in altro modo, una volta esclusi gli scambi da massimo tre colpi, il campione propende in favore del giocatore al servizio, perché gli scambi da cinque colpi rappresentano un numero sproporzionato dei punti rimanenti).

Per come ha servito de Minaur, non si è trovato poi davanti a così tanti scambi lunghi. Il 22% dei punti sul suo servizio contro Fritz e il 29% contro Opelka hanno infatti raggiunto i quattro colpi. Di fronte al tipico giocatore monodimensionale dal servizio bomba, è questo il territorio per il giocatore alla risposta per pareggiare il punteggio. De Minaur è però più noto per i colpi a rimbalzo di quanto lo sia per il servizio. In finale, ha vinto il 58% di questa tipologia di punti, abbastanza per l’83esimo percentile del campione.

Il rendimento di de Minaur sugli scambi più lunghi non ha fatto grande differenza in finale, principalmente perché è stato così efficace nell’evitare che i punti si prolungassero. Aver vinto più della metà degli scambi da molti colpi è un richiamo al fatto che grandi prestazioni al servizio vanno oltre il servizio stesso. In giornata di grazia, anche un giocatore poco sopra ai 180 cm può ottenere dei numeri che lasciano a terra gli Isner e gli Opelka di turno. Non è sempre una questione di ace.

Anatomy of Alex de Minaur’s Serving Masterclass

Federer non è stato dominante nei momenti chiave, ma ci è andato vicino

di Jeff Sackmann // TennisAbstract

Pubblicato il 26 luglio 2019 – Traduzione di Edoardo Salvati

Le statistiche della finale di Wimbledon raccontano una storia senza ombre. Per cinque set, Roger Federer ha fatto molte cose leggermente meglio del suo avversario, Novak Djokovic, che però ha poi vinto di misura perché si è aggiudicato i punti più importanti, un dettaglio che non emerge dai numeri con la stessa nitidezza.

Superando le statistiche tradizionali, possiamo quantificare il dominio nei momenti che fanno la differenza. Un metodo che supera il semplice conteggio delle palle break o dell’individuazione dei passaggi chiave più ovvi in una partita è l’indice di leva per assegnare un valore a ciascun punto, in funzione dell’importanza. Dopo ogni singolo punto della partita, possiamo calcolare una nuova probabilità di vittoria per entrambi i giocatori. Un punto come quello da giocare sul 5-5 in un tiebreak è potenzialmente in grado di alterare la probabilità di vittoria in misura massiccia, mentre così non è per quello sul 40-15 del primo game.

La leva quantifica il potenziale. In media, in una partita al meglio dei cinque set un punto possiede una leva di circa il 4%, ma per i punti più importanti si parla di diverse volte quel valore. Un altro modo per identificare quando un giocatore è predominante è vedere il numero sproporzionato di punti ad alta leva che vince anche di fronte a una prestazione inferiore in quelli a bassa leva.

L’indice di leva

In un recente articolo sulla finale di Wimbledon per l’Economist, ho approfondito ulteriormente il concetto. Djokovic ha vinto meno punti rispetto a Federer, ma quelli che ha vinto hanno contato di più. La leva media dei punti per lui è stata infatti del 7.9%, rispetto al 7.2% di Federer. Possiamo presentare questa differenza sotto forma di indice di leva (Leverage Ratio o LR), dividendo 7.9% per 7.2%, con un risultato di 1.1. Un indice così alto non è insolito. Nelle più di 700 partite Slam maschili del Match Charting Project, l’LR del giocatore più dominante è in media di 1.11. L’eccellenza di Djokovic nei momenti chiave non è stata nemmeno così unica, ma in una partita di quell’equilibrio è bastata a fare la differenza.

Con un indice di leva superiore a 1.0, la vittoria non è comunque garantita. In circa il 30% di queste 700 partite al meglio dei cinque set la vittoria è andata al giocatore che, in media, ha vinto meno punti importanti dell’avversario. Alcune situazioni di vincitori con basso indice di leva quasi rasentano la comicità, come la finale del Roland Garros 2008 in cui Rafael Nadal ha demolito Federer nonostante un LR di 0.77.

Aumento della comprensione

Nelle partite a senso unico non c’è molta leva a disposizione, quindi il numero dei punti vinti ha molta più rilevanza di quando sono stati vinti. Spesso prestazioni non dominanti si traducono in vittorie di partite ancora più equilibrate, come quella di Andy Murray nella semifinale degli US Open 2018 in quattro set contro Nadal nonostante un LR di 0.80, o la super equilibrata semifinale a Wimbledon 2018 in cui Kevin Anderson ha battuto John Isner con un LR di 0.88.

Non serve un foglio di calcolo per capire che le partite di tennis vengono decise da una combinazione di rendimento complessivo e rendimento nei momenti importanti. I numeri che ho citato non portano avanti la nostra comprensione di molto, quantomeno non in modo rigoroso. È questo il prossimo passo.

Indice di leva, ti presento l’indice di leva bilanciato

Coloro che frequentano regolarmente Tennis Abstract hanno familiarità con l’indice di dominio (Dominance Ratio o DR), una statistica inventa da Carl Bialik al fine di riclassificare i punti vinti totali. Il DR si ottiene dalla divisione tra i punti vinti alla risposta e i punti persi al servizio, in modo che il valore medio sia esattamente 1.0. Solitamente, chi vince ha un valore superiore a 1.0 e chi perde un valore inferiore a 1.0.

Nella finale di Wimbledon, il DR di Djokovic è stato di 0.87, estremamente basso per un vincitore, se non addirittura inedito. Il DR compensa gli effetti generati del rendimento al servizio e alla risposta (a differenza dei punti vinti, che possono deviare in una o l’altra direzione a seconda che ci siano più punti al servizio che alla risposta, o viceversa) e sintetizza in un solo numero la qualità della prestazione complessiva.

Equa distribuzione tra servizio e risposta

Non dice però nulla relativamente al dominio nei momenti chiave, tranne quando un giocatore vince con un valore basso del DR, da cui si può dedurre che abbia controllato l’avversario sui punti più caldi.

Per avere una prospettiva bilanciata simile in presenza di rendimenti ad alta leva, possiamo adattare l’indice di leva LR soppesando equamente il dominio nei momenti chiave sia al servizio che alla risposta. Chiamo questa statistica indice di leva bilanciato (Balanced Leverage Ratio o BLR), cioè la media semplice dell’LR nei punti al servizio e dell’LR nei punti alla risposta. Il BLR di solito non si scosta di molto dall’LR, così come spesso otteniamo le stesse informazioni dal DR che dai punti totali. Il BLR di Djokovic nella finale di Wimbledon è stato di 1.11, rispetto a un LR di 1.10. Nelle partite in cui però un numero sproporzionato di punti si giocano sulla racchetta di un giocatore, il BLR fornisce il necessario aggiustamento.

DR corretto per leva

Siamo in grado di registrare rendimenti corretti per leva semplicemente moltiplicando questi due numeri. Ad esempio, prendiamo la vittoria di Stanislas Wawrinka contro Djokovic nella finale degli US Open 2016. Il DR di Wawrinka è stato di 0.90, più alto di quello di Djokovic a Wimbledon 2019 ma difficilmente sufficiente a trionfare. Eppure ha vinto, grazie a un BLR di 1.33, uno dei più alti mai registrati in una finale Slam. Il prodotto tra il DR e il BLR di Wawrinka — che chiameremo DR+ — è pari a 1.20. Lo si può interpretare con la stessa scala di un DR “normale”, dove 1.2 è spesso identificativo di una vittoria con margine ridotto, se non di una al cardiopalma.

Di 167 finali Slam maschili nel Match Charting Project, 14 giocatori hanno vinto nonostante un DR “normale” inferiore a 1.0. Per ciascuno di essi, il BLR era superiore a 1.1, e in 13 delle 14 occorrenze, la forza del BLR del vincitore ha “cancellato” la debolezza del suo DR, nel senso che il DR+ è stato superiore a 1.0. La tabella riepiloga quelle partite, ordinate per DR+ crescente.

Anno  Slam              Vincitore    DR     BLR    DR+  
2019  Wimbledon         Djokovic     0.87   1.11   0.97  
1982  Wimbledon         Connors      0.88   1.20   1.06  
2001  Wimbledon         Ivanisevic   0.95   1.16   1.10  
2008  Wimbledon         Nadal        0.98   1.13   1.10  
2009  Australian Open   Nadal        0.99   1.13   1.12  
1981  Wimbledon         McEnroe      0.99   1.16   1.15  
1992  Wimbledon         Agassi       0.97   1.19   1.16  
1989  US Open           Becker       0.96   1.22   1.18  
1988  US Open           Wilander     0.98   1.21   1.18  
2015  US Open           Djokovic     0.98   1.21   1.18  
2016  US Open           Wawrinka     0.90   1.33   1.20  
1999  Roland Garros     Agassi       0.98   1.25   1.23  
1990  Roland Garros     Gomez        0.94   1.34   1.26  
1991  Australian Open   Becker       0.99   1.30   1.29

Prima finale vinta dal giocatore con il DR+ inferiore

In 167 finali Slam, quella tra Djokovic e Federer è stata la prima vinta dal giocatore con il DR+ più basso (alcuni dei campioni che non compaiono in elenco hanno avuto indici di leva sotto tono e conseguenti DR+ inferiori ai DR, ma nessuno sotto il livello di 1.0). Sebbene Federer è stato più debole nei momenti importanti — in particolare nei tiebreak e quando ha avuto i due match point — il rendimento complessivo in quel tipo di situazione non è stato così scadente come quei pochi memorabili momenti farebbero pensare. È più probabile che un giocatore con un DR di 1.14 e un BLR di 0.90 come quelli di Federer concluda le due settimane di Wimbledon ballando con la campionessa del tabellone femminile.

Sorprendentemente, 1 su 167 potrebbe sottostimare la rarità di un vincitore con un DR+ inferiore a 1.0. Solo una delle partite al meglio dei cinque set nel database del Match Charting Project (su più di 700) possiede quel requisito. Si tratta del controverso quarto turno degli Australian Open 2019 tra Kei Nishikori e Pablo Carreno Busta. Nishikori ha vinto con un DR di 1.06, ma il suo BLR è stato di 0.91, relativamente debole e che ha portato a un DR+ di 0.97. Come per la finale di Wimbledon, anche la partita di Melbourne avrebbe potuto avere un altro vincitore. La fortuna è stata avversa a Carreno Busta non solo per le chiamate arbitrali.

Qual è il significato di tutto questo?

Sappiamo che la finale di Wimbledon è stata in estremo equilibrio, ora abbiamo più numeri che mostrano quanto effettivamente lo sia stata. Sapevamo che Djokovic gioca meglio quando conta di più, ora abbiamo più riferimenti sulla sua maggior bravura, che però non si discosta di un margine insolitamente ampio.

Federer ha vinto cinque dei venti Slam nonostante un BLR nella finale inferiore a 1.0, e altri due con un DR inferiore a 1.14. Non ha mai vinto uno Slam con un DR+ non superiore a 1.03, ma va anche detto che non c’è mai stata una finale Slam che il DR+ ha considerato così ravvicinata. Federer non è la definizione di maestro dei momenti chiave, ma non è poi così malvagio. Avrebbe solamente dovuto portare con sé un po’ di quella dose di domino con cui ha chiuso il secondo set per passaggi più importanti nelle fasi successive.

Se siete anche voi come me, dopo aver letto fino a questo punto non smetterete di farvi domande. Ho riflettuto su alcune che spero di approfondire analogamente. Si può dire che Federer di solito è meno dominante della media nei momenti chiave? (Si). Djokovic è molto più bravo a quel riguardo? (Si). E Nadal? (Anche lui è più bravo). Nadal è davvero migliore, o i suoi numeri sulla leva sono di partenza buoni perché i punti importanti si giocano più spesso sul lato dei vantaggi? (È davvero migliore). Djokovic ha preso le misure a Federer? (Non proprio, a meno che non s’intenda il suo numero di scarpe, allora in quel caso sì). È cambiato tutto dopo che Djokovic ha tirato la famosa risposta? (No).

Rendimenti situazionali

Ci sono anche molti argomenti interessanti che vanno oltre i Grandi Tre. Ho iniziato qualche anno fa a scrivere della leva relativa a sottoinsiemi di partite, spinto dalla semifinale di Wimbledon 2016 tra Federer e Milos Raonic, nella quale Federer ha subito la pressione quando più contava. Come possiamo analizzare la leva media per punti vinti e persi, così riusciamo a stimare l’importanza dei punti in cui un giocatore ha servito un ace, commesso un errore non forzato di rovescio, o scelto di andare a rete.

Le partite sono decise da una combinazione di rendimento complessivo e giocate di alta leva. Le statistiche comunemente disponibili illustrano bene le dinamiche del primo, ma non sono adeguate per fare chiarezza sulle seconde. Il dominio nei momenti chiave è lasciato alle congetture degli opinionisti. Con un insieme di partite in continuo aumento e l’accesso a sempre più dati punto per punto (e quindi a numeri sulla leva per ogni punto e ogni partita), il divario tra le due misure si riduce, consentendoci di quantificare con più precisione il grado in cui il rendimento legato alla specifica situazione incide sulla capacità di ciascun giocatore di vincere la partita.

Roger Federer Wasn’t Clutch, But He Was Almost Clutch Enough

Basta a Federer un rovescio tornato normale?

di Jeff Sackmann // TennisAbstract

Pubblicato il 14 luglio 2019 – Traduzione di Edoardo Salvati

Quando Roger Federer ha battuto di misura Rafael Nadal agli Australian Open 2017, ne ho attribuito la vittoria al suo rovescio. Rientrava da un infortunio che lo aveva tenuto lontano dall’attività professionistica per tutta la seconda parte del 2016 e aveva rafforzato il gioco in quel lato del campo, sviluppando la strategia da adottare contro il rivale di lungo corso. Da quella partita, Federer ha sconfitto Nadal altre cinque volte su sei, a indicazione che questa nuova e più affilata arma è rimasta parte integrante del suo tennis.

Dopo aver sconfitto Nadal nella semifinale di Wimbledon 2019, Federer sembra in splendida forma. A differenza però di due anni fa a Melbourne, la vittoria non è dipesa dal rovescio. Nella finale degli Australian Open, l’elegante rovescio a una mano di Federer aveva contribuito per 11 punti in più di una tipica partita, abbastanza per indirizzare il risultato a suo favore. A Wimbledon, il rovescio non ha fatto paura a Nadal, visto che ha dato a Federer solo un punto in più rispetto alla media. La vittoria è arrivata per Federer con un livello altissimo, ma non dal rovescio.

Il ritorno della Potenza del Rovescio

Questi numeri arrivano da una statistica che ho chiamato Potenza del Rovescio (Backhand Potency o BHP) e che utilizza i dati colpo per colpo del Match Charting Project per isolare l’effetto generato dal singolo colpo di un giocatore.

La formula è semplice e diretta: si somma un punto per un vincente o per un errore forzato dell’avversario, si sottrae un punto per un errore non forzato, si somma mezzo punto per un rovescio che ha portato a un vincente o a un errore dell’avversario nel colpo successivo, e si sottrae mezzo punto per un rovescio che ha portato a un vincente dell’avversario. Si divide il totale per il numero complessivo di rovesci, si moltiplica per 100* e il risultato misura l’effetto netto del rovescio di ciascun giocatore.

In media, un giocatore colpisce 100 rovesci per partita, quindi il passaggio finale della moltiplicazione per 100 fornisce un valore approssimativo a partita. Il BHP conferisce fino a 1.5 “punti” per punti giocati, visto che si sommano sia i vincenti sia i colpi che hanno portato a un vincente.

A quanti punti equivale?

Per tradurre il BHP in punti (o qualsiasi altro indice di potenza come quello del Dritto, Forehand Potency o FHP), si moltiplica perciò per due terzi. Nella finale del 2017, il rovescio di Federer ha raggiunto un BHP di +17, equivalente a circa 11 punti. Nella semifinale di Wimbledon, il BHP è stato solo di +1. Si può quantomeno dire che il rovescio non è stato un colpo debole, cioè quel tipo di commento che avremmo potuto fare quando Federer accumulava vittorie a dismisura nei primi quindici anni di carriera.

Il rendimento in semifinale non è stato un’eccezione. In un confronto anno su anno sulla base dei dati del Match Charting Project (che ammetto essere incompleti), il rovescio del 2019 somiglia molto da vicino a quello mostrato prima dell’infortunio del 2016.

Anni        BHP  
1998-2011   +0.1  
2012        +0.4  
2013        -1.8  
2014        -1.1  
2015        +1.3  
2016        -0.3  
2017        +3.5  
2018        +1.3  
2019        +0.8

Ci sono sempre delle giornate positive, come l’incredibile BHP di +16 contro Kei Nishikori nel quarto di finale a Wimbledon. Mettendo però insieme prestazioni impeccabili e passaggi a vuoto, avversari da cui subisce o che supera più facilmente, condizioni di gioco veloci e lente, il risultato che si ottiene è che con il rovescio Federer non riesce più a raccogliere punti come faceva due anni fa.

Il rovescio contro Djokovic

L’avversario di Federer in finale, Novak Djokovic, è ben noto per la compattezza dei colpi a rimbalzo. Come ha fatto Nadal per diversi anni, anche Djokovic è in grado di mettere a nudo il lato più debole del gioco da fondo di Federer. Ha vinto gli ultimi cinque scontri diretti e nove degli ultimi undici, nella maggior parte dei quali ha tenuto il rovescio di Federer a un BHP negativo.

Anno  Torneo                   Esito   BHP/100  
2018  Parigi Bercy             P       -11.0  
2018  Cincinnati               P       -11.0  
2016  Australian Open          P       -12.6  
2015  Finali di stagione (F)   P       -4.8  
2015  Finali di stagione (RR)  V       +0.7  
2015  US Open                  P       +0.8  
2015  Cincinnati               V       -2.2  
2015  Wimbledon                P       -13.4  
2015  Internazionali d'Italia  P       -12.2  
2015  Indian Wells             P       -5.0  
2015  Dubai                    V       -5.9  
…                                        
2014  Wimbledon                P       -3.1  
2012  Wimbledon                V       +9.6

Di 438 partite con dati punto per punto, il BHP di Federer è sceso sotto il -10 solo 27 volte. Di queste, in nove — e in due delle cinque dal rientro post infortunio di Federer nel 2017 — dall’altra parte della rete c’era Djokovic. Tra l’altro, Djokovic farebbe bene a guardarsi i filmati delle partite in cui Borna Coric ha demolito il rovescio di Federer, cioè le sue due prestazioni peggiori in termini di BHP dall’inizio del 2017 (-20 allo Shanghai Masters 2018 e -19 agli Internazionali d’Italia 2019).

Minimizzare i problemi

Forse è troppo chiedere a Federer di capire come battere Djokovic sul suo stesso terreno. La strategia migliore per lui è minimizzare i problemi attraverso una grande efficienza al servizio e un’esecuzione magistrale con il dritto. In carriera, la media di FHP per Federer è di +9, che però scende a solo +4 contro Djokovic. Nella finale del Cincinnati Masters 2018, Djokovic ha costretto Federer a un imbarazzante -13 di FHP, il peggiore di sempre. E non si è trattato di un caso isolato: quattro dei cinque valori più negativi di FHP nella singola partita sono arrivati per Federer contro Djokovic.

Se Federer vuole il nono titolo a Wimbledon, avrà bisogno di vincere molti punti almeno da un lato, vale a dire con il classico dritto o con il rovescio alla maniera della semifinale del 2012 proprio contro Djokovic. E se con uno riesce a sfondare, con l’altro deve comunque mantenere un livello di tutto rispetto. Nella semifinale contro Nadal il dritto è valso un FHP di +12. Contro un giocatore come Djokovic che difende ancora meglio sulle superfici veloci, Federer dovrà ottenere un risultato simile. Gli si chiede molto, ma del resto una cosa è certa: nessuno potrà lamentarsi che il 21esimo Slam è stato facile da vincere.

Come è andata la finale

Djokovic ha poi vinto la finale con il punteggio di 7-6(5), 1-6, 7-6(4), 4-6, 13-12(3). Come scrive lo stesso Sackmann su Game Theory, il blog dell’Economist, dopo quasi cinque ore di gioco e più di 400 punti, l’esito è stato deciso dall’equivalente nel tennis del lancio della moneta, cioè il tiebreak a sette punti.

Federer ha giocato meglio, servendo più ace, vincendo il 51.7% dei punti e facendo più break dell’avversario. Djokovic dal suo canto ha vinto cinque dei sei punti più importanti, fra tutti i due match point che Federer ha avuto sul servizio. Si è trattato di una partita lotteria, in cui un po’ di fortuna e nervi d’acciaio nei momenti cruciali hanno indirizzato il risultato. Federer non ha di certo tratto beneficio dagli undici errori non forzati commessi nei tre tiebreak, che hanno contribuito a un BHP di -0.8 e un FHP di +2.3, n.d.t.  

Will a Back-To-Normal Federer Backhand Be Good Enough?

6000 partite!

di Jeff Sackmann // TennisAbstract

Pubblicato il 25 luglio 2019 – Traduzione di Edoardo Salvati

Si è trattato di un anno molto prolifico per il Match Charting Project, lo sforzo collaborativo per la raccolta di dati punto per punto delle partite professionistiche di tennis. Dal 2013, più di cento volontari hanno contribuito, passando dalle finali Slam degli anni ’70 alle maratone tra i Fantastici Quattro fino a oscuri Challenger e ITF. Il database che ne risulta non conosce eguali e rappresenta una rara risorsa a disposizione di tutti, in uno sport in cui le informazioni migliori sono di proprietà di tornei, federazioni e società dalle stesse incaricate.

La partita numero 6000 — il quarto di finale a Bucarest tra Kristyna Pliskova e Patricia Maria Tig nonché una delle più di duecento di cui si è occupato Zindaras — arriva a meno di sei mesi dalla numero 5000. In questo periodo, abbiamo aggiunto un gran numero di partite del Roland Garros e di Wimbledon, oltre a tutte le finali dei due circuiti maggiori. Inoltre, è sempre in corso la raccolta di semifinali d’epoca relative alla fine degli anni ’80 e l’inizio degli anni ’90, insieme a tutte le semifinali femminili sempre dal Roland Garros e Wimbledon per cui siamo riusciti a trovare il video (magari c’è qualcuno che può dare una mano per le partite che rimangono).

Una nuova dimensione

I dati che ne emergono — molti dei quali facilmente recuperabili su GitHub — hanno reso possibile affrontare tematiche su una dimensione finora impensabile. Ad esempio, all’avvio di Wimbledon ho approfondito l’evoluzione del gioco a rete, utilizzando statistiche colpo per colpo in quel torneo dall’inizio degli anni ’70. E dopo l’impeccabile prestazione di Simona Halep in finale, John Burn-Murdoch del Financial Times ha utilizzato il Match Charting Project per contestualizzare l’incredibilmente bassa frequenza di errori non forzati.

Sempre più appassionati occasionali scoprono la ricchezza di dati del Match Charting Project. Per ciascuna di queste migliaia di partite, si possono esplorare combinazioni infinite e immediatamente paragonabili alle medie del circuito. Se non vi è mai capitato di dare un’occhiata, vi invito a farlo senza esito. A manifesto della profondità della piattaforma, una partita recentemente aggiunta è la semifinale degli Australian Open 1987 tra Ivan Lendl e Pat Cash. È possibile inoltre valutare statistiche aggregate per specifici giocatori, su pagine come questa per Sloane Stephens.

Se il Match Charting Project ha suscitato la vostra curiosità, è un ottimo momento per unirvi. La mappatura delle partite non richiede una laurea in ingegneria, ma solo attenzione al dettaglio e conoscenza di base del tennis. Aiutano certamente anche un amore per lo sport e la meticolosità, due caratteristiche condivise da molti dei collaboratori più attivi. Ho già parlato dei vantaggi nel collaborare, e se vi sentite pronti per farlo ecco la guida per iniziare.

Lontano dai riflettori ma al centro dell’azione

Anche se il tennis rimane un po’ una landa desolata nel panorama delle statistiche sportive, stiamo continuando a fare progressi. Siamo completamente indipendenti da circuiti e federazioni che spendono somme spropositate per consulenti che sembrano non fare altro che produrre nuovi scintillanti siti con ben pochi dati. Il sito del Match Charting Project non si può proprio definire attraente (per andarci leggeri!), ma è libero dalle dinamiche politiche, dal conflitto di priorità e dalla burocratica lentezza che tiene a freno così larga parte del tennis. Questo nuovo traguardo è l’ultimo richiamo al fatto che spesso il lavoro più interessante si verifica lontano dai riflettori dei palcoscenici ufficiali.

Another Match Charting Project Milestone: 6,000 Matches!