La fortuna del sorteggio: Australian Open 2020 (donne)

di Chapel Heel // HiddenGameOfTennis

Pubblicato il 19 gennaio 2020 – Traduzione di Edoardo Salvati

Come per gli uomini, anche per le donne ho eseguito una simulazione (con la mia variante Elo) di 100.000 configurazioni del tabellone principale, utilizzando lo stesso metodo che gli organizzatori usano per assegnare ai giocatori la loro posizione. L’ho poi confrontata con la previsione per il torneo su base Elo rispetto al tabellone effettivo.

La tabella mette a confronto la previsione effettiva del tabellone con i risultati dalle simulazioni di rimescolamento, in modo da avere alcune indicazioni sull’accessibilità del tabellone effettivo rispetto alle altre configurazioni. Tonalità di rosso (e arancione) evidenziano la sfortuna del giocatore. Al contrario, tonalità di verde rappresentano la fortuna ricevuta nel tabellone effettivo, in riferimento a un particolare turno. Il giallo simboleggia neutralità, e si può di fatto ignorare qualsiasi valore superiore o inferiore allo 0.2%.

Per una presentazione più compatta rispetto al passato, ho riportato nella tabella solo le teste di serie, e organizzato nella tabella successiva quei giocatori fuori dalle teste di serie per i quali c’è stata un’incidenza degna di nota (almeno l’1.0% di segno positivo o negativo).

Tabellone effettivo e simulato a confronto per le teste di serie

Generalmente, si vedono un po’ di tonalità di rosso e di verde nei numeri relativi ai quarti di finale, ma da li in avanti è quasi tutto giallo o sui toni dell’arancione. In questo senso la riga di Naomi Osaka appare particolarmente negativa (che ha superato il primo turno, n.d.t.), all’opposto quella di Serena Williams decisamente positiva (anche lei vincitrice al primo turno, n.d.t.). Forse è la volta buona per Williams di raggiungere il record di Slam di Margaret Court.

IMMAGINE 1 – Confronto tra tabellone effettivo e simulazioni per le teste di serie

Effetti di rilievo su una selezione di giocatrici fuori dalle teste di serie

A Maria Sharapova non era andata bene agli US Open 2019, forse in Australia la fortuna sta cercando di recuperare (ha però perso subito al primo turno, n.d.t.). Caroline Wozniacki invece non ha ricevuto nessun regalo di addio alle competizioni (ma ha superato il primo turno, n.d.t.).

IMMAGINE 2 – Effetti della casualità del sorteggio su alcune non teste di serie

Luck of the Draw: Australian Open 2020 (Women)

La fortuna del sorteggio: Australian Open 2020 (uomini)

di Chapel Heel // HiddenGameOfTennis

Pubblicato il 19 gennaio 2020 – Traduzione di Edoardo Salvati

Come d’abitudine per gli Slam, ho eseguito una simulazione (con la mia variante Elo) di 100.000 configurazioni del tabellone principale, utilizzando lo stesso metodo che gli organizzatori usano per assegnare ai giocatori la loro posizione. L’ho poi confrontata con la previsione per il torneo su base Elo rispetto al tabellone effettivo.

La tabella mette a confronto la previsione effettiva del tabellone con i risultati dalle simulazioni di rimescolamento, in modo da avere alcune indicazioni sull’accessibilità del tabellone effettivo rispetto alle altre configurazioni. Tonalità di rosso (e arancione) evidenziano la sfortuna del giocatore. Al contrario, tonalità di verde rappresentano la fortuna ricevuta nel tabellone effettivo, in riferimento a un particolare turno. Il giallo simboleggia neutralità, e si può di fatto ignorare qualsiasi valore superiore o inferiore allo 0.3%.

Per una presentazione più compatta rispetto al passato, ho riportato nella tabella solo le teste di serie, e organizzato nella tabella successiva quei giocatori fuori dalle teste di serie per i quali c’è stata un’incidenza degna di nota (almeno lo 0.5% di segno positivo o negativo).

Tabellone effettivo e simulato a confronto per le teste di serie

Rispetto a tabelloni casuali, la parte bassa del tabellone principale è più difficile di quella alta. A David Goffin non è andata proprio bene essendo finito nella sezione del giocatore più in forma del momento, Andrey Rublev, che invece è tra i più fortunati, come Matteo Berrettini. Pensavo che la testa di serie numero 8 per Berrettini fosse eccessiva, perché non mi sembra tra i primi otto favoriti, ma so che le teste di serie procedono in automatico. Comunque, ha il tabellone più fortunato tra tutte le teste di serie.

IMMAGINE 1 – Confronto tra tabellone effettivo e simulazioni per le teste di serie

Effetti di rilievo su una selezione di giocatori fuori dalle teste di serie

Kevin Anderson ha giocato abbastanza bene all’ATP Cup. Con un pò di fortuna potrebbe superare un po’ di turni, magari fino agli ottavi. I quarti di finale sembrano troppo ambiziosi. Fresco vincitore del primo torneo, Ugo Humbert non è stato ricompensato con un percorso semplice. Ma non credo farà troppa differenza perché, anche scarico di adrenalina, dovrebbe perdere da John Millman al primo turno.

IMMAGINE 2 – Effetti della casualità del sorteggio su alcune non teste di serie

Luck of the Draw: Australian Open 2020 (Men)

Nadal nelle retrovie

di Chapel Heel // HiddenGameOfTennis

Pubblicato il 10 gennaio 2020 – Traduzione di Edoardo Salvati

(Con aggiornamento al 12 gennaio che considera le ultime due partite di Nadal all’ATP Cup e corregge alcuni errori nelle statistiche di seconda schermata inizialmente presenti sull’app dell’ATP).

Uno degli aspetti su cui più farò attenzione per la stagione 2020 del circuito maggiore è la posizione dei giocatori alla risposta, in particolare se si sistemeranno ancora più lontano dalla linea di fondo di quanto tipicamente già accade. A qualsiasi appassionato di tennis è capitato di vedere una partita in cui il giocatore in procinto di rispondere a un servizio nel lato più vicino all’inquadratura non riesce a essere visibile perché troppo attaccato alla fine del campo. E non solo quando a servire ci sono John Isner o Ivo Karlovic.

Durante la telecronaca della partita tra Rafael Nadal e David Goffin all’ATP Cup, ho sentito Jim Courier affermare che Goffin stava traendo vantaggio dalla posizione estremamente arretrata di Nadal alla risposta grazie a un servizio più lento e angolato. È il classico gioco del gatto e del topo: il giocatore al servizio spara cannonate sulla prima di servizio, il giocatore alla risposta retrocede per avere più tempo, il primo inizia a cercare gli angoli fino a che il secondo non reagisce nuovamente con un’altra mossa. Spesso però è solo teoria, perché molti giocatori non calibrano il servizio in funzione della posizione alla risposta dell’avversario, o perché non riescono a percepirlo nella specifica fase della partita, o perché non sono così efficaci nel servire più lentamente e usare gli angoli.

Davvero i giocatori si mettono ancora più indietro?

Sembrerebbe di si. Siamo però in presenza di un comportamento consolidato o si tende a notarlo di più solo quando succede? Le statistiche di seconda schermata dell’ATP danno indicazione della posizione alla risposta per le partite che beneficiano del sistema di moviola istantanea Hawk-Eye.

Sono tre le forme principali in cui viene fornito il dato: (a) una posizione complessiva o combinata, (b) la posizione alla risposta sulla prima di servizio e (c) la posizione alla risposta sulla seconda di servizio. C’è un’ulteriore suddivisione in intervalli temporali, che induce però in confusione. Per la prima e la seconda di servizio, la seconda schermata ha la categoria “Attuale” e quella “Storico”. La prima, Attuale, fa riferimento alla posizione assunta durante la partita in corso. Non si conosce invece il periodo coperto dalla categoria Storico.

Per la posizione complessiva o combinata, ci sono quattro periodi: “Attuale”, “Storico”, “Anno in corso” e “Anno scorso”. Quest’ultimo periodo non è disponibile per alcuni tra i giocatori di bassa classifica, quindi credo che sia relativo a una determinata stagione nel caso un giocatore non abbia statistiche della stagione precedente su campi con Hawk-Eye nel tabellone principale dei tornei ATP. Possiamo inoltre supporre che con Storico non si intenda solo “la stagione passata”.

Ad esempio, Tallon Griekspoor non aveva alcuna statistica della categoria Anno scorso nelle sue due partite con statistiche di seconda schermata nel 2019, pur avendo dati della categoria Storico per una di quelle. Presumibilmente, Storico non è nemmeno “Alla data di oggi”, perché quella casistica dovrebbe rientrare nella categoria Anno in corso. I giocatori che hanno statistiche sia per Anno in corso che Storico non possiedono gli stessi numeri in entrambe, quindi c’è qualcosa di diverso.

Possibili conclusioni provvisorie

È decisamente difficile individuare una tendenza quando la variabile temporale è così vaga. Possiamo comunque provare a trarre alcune conclusioni provvisorie di carattere generico sulla base di quello che abbiamo.

Dal campione di partite del 2019 ho eliminato quelle che non hanno numeri sulla posizione alla risposta per le categorie Anno in corso e Anno scorso. Purtroppo si perde quasi il 25% dell’insieme, ma rimangono comunque quasi 1400 partite-giocatore. In media, la posizione alla risposta per la categoria Anno in corso (2019) è stata di 1.09m dietro la linea di fondo. In media, la posizione alla risposta per la categoria Anno scorso (2018) è stata di 0.85m dietro la linea di fondo.

Serve sottolineare che le statistiche di seconda schermata erano disponibili per molte meno partite del 2018, quindi qualsiasi numero basato su quei dati rischia di essere limitato dalla dimensione del campione e dalla scelta delle partite.

In altre parole, ho utilizzato i numeri della categoria Anno scorso inclusi nelle statistiche di seconda schermata per il 2019 e non le statistiche di seconda schermata effettive del 2018. Questo perché immagino che l’insieme delle statistiche di seconda schermata per il 2018, catalogate come Anno scorso nelle statistiche del 2019, siano migliori dei calcoli che posso fare sulla categoria Anno scorso utilizzando il guazzabuglio di cifre in giro su internet per il 2018.

Dai 10 ai 20 cm più indietro

Ho adottato la stessa metodologia con le partite-giocatore in possesso di numeri sulla posizione alla risposta sia per Anno in corso che per Storico. In media, la posizione alla risposta per questo insieme (circa 1600 partite-giocatore) nel 2019 è stata di 1.11m dietro la linea di fondo, mentre in media per la categoria Storico era di 1.01m dietro la linea di fondo.

Ho effettuato un’ulteriore scomposizione per posizione alla risposta sulla prima di servizio e sulla seconda. La media della categoria Attuale sulla prima per queste 1700 partite-giocatore è stata di 1.43m dietro la linea di fondo, e la media Storico sulla prima era di 1.25m. Sempre per queste circa 1700 partite-giocatore (ma non esattamente le stesse che per la prima di servizio) la media della categoria Attuale sulla seconda di servizio era di 1.08m, mentre la media Storico era di 0.90m dalla linea di fondo.

Si può in via provvisoria concludere che, complessivamente, la posizione alla risposta si è allontanata in media dalla linea di fondo di una distanza tra i 10 e i 20 cm. Più difficile dire da quando ha avuto inizio questo spostamento.

Ne fa parte anche Nadal?

Nel 2019, le statistiche di seconda schermata non riportavano dati della categoria Anno scorso per Nadal, forse perché nel 2018 non aveva giocato nessuna partita sul cemento nei tornei con Hawk-Eye e con statistiche di seconda schermata. La posizione combinata di Nadal per la categoria Attuale (2019) è stata di 3.23m dietro la linea di fondo, mentre per la Storico era di 3.15m. Sembra però che questo dipenda interamente dalla posizione sulla seconda di servizio.

Sulla prima, la posizione Attuale è stata di 3.53m contro una posizione Storico di 3.60m, a evidenziare che si è avvicinato, anche se di poco, sulla risposta alla prima di servizio, almeno nelle 27 partite del campione del 2019. Per contro, la posizione sulla seconda per la categoria Attuale è stata di 2.73m, rispetto alla categoria Storico di 2.42, una differenza importante.

Fa sorridere il fatto che, in generale, contro Goffin Nadal non stava nelle retrovie. Alla risposta sulla prima era a 1.53m dalla linea di fondo e, sulla seconda, praticamente sulla linea di fondo a 0.08m. Ma si tratta ovviamente solo di medie per la durata della partita. Quando Courier ha commentato sulla strategia di Goffin, Nadal si trovava a ben più di 1.53m dalla linea di fondo, e Goffin ha poi servito una prima lenta a uscire sul lato delle parità.

A Goffin non serviva riconoscere una tendenza, ma semplicemente osservare la posizione di Nadal per quel preciso punto e momento della partita. Perché Goffin non ha una statura da gigante, ma è molto intelligente. È per questo che penso che, se esiste una tendenza, ci si divertirà a vedere come (e se) i giocatori al servizio costringeranno quelli alla risposta a riavvicinarsi alla linea di fondo. Spero solo che non sia con un servizio sottomano.

Il senso di Nadal per l’indietreggiamento

Nell’analisi dei dati di seconda schermata, ho notato un altro aspetto, cioè l’arretramento della posizione alla risposta di Nadal con l’avanzare della partita. Per ciascuna delle 27 partite nei dati di seconda schermata del 2019, e nelle quattro dell’ATP Cup nel 2020, ho confrontato la posizione media di Nadal alla risposta da un set all’altro, e separatamente per prima e seconda di servizio. In media, risponde alla prima di servizio altri 0.25m indietro nel secondo set rispetto al primo. Per la seconda, l’esito è meno accentuato (e più variabile), appena 0.06m più indietro.

Ci sono solo 3 partite andate al terzo set delle 31 considerate, quindi è complicato trarre conclusioni definitive, ma alla risposta sulla prima di servizio nel terzo set Nadal indietreggia di altri 0.15m rispetto al secondo set, mentre sulla seconda va ancora più lontano dalla linea di fondo, spostandosi di ben 0.38m rispetto al secondo set. È un dettaglio da tenere d’occhio.

Ho costruito due grafici per illustrare il concetto. L’immagine 1 si riferisce alla posizione di Nadal sulla prima di servizio, l’immagine 2 sulla seconda. Concentriamoci per un istante solo sui triangoli. Supponiamo che l’asse delle ascisse sia la linea di fondo di un campo, e che i triangoli siano la posizione media alla risposta di Nadal in una partita.

Una rappresentazione visiva

Ogni partita è sulla linea verticale della griglia del grafico. I triangoli blu sono il primo set, i rossi il secondo e, in caso di terzo set, il triangolo è verde. In quasi tutte le partite il triangolo blu (primo set) si trova più in basso (più vicino alla linea di fondo) del triangolo rosso, anche se ho riscontrato più variazioni alla risposta sulla seconda di servizio. La variazione è rappresentata dalla linea frastagliata del grafico, che registra semplicemente la differenza tra la posizione del primo e del secondo set (ignorando il terzo). Se la linea è al di sopra dell’asse delle ascisse, Nadal si è posizionato più indietro nel secondo set di quanto abbia fatto nel primo, e vice versa.

Da ultimo, la colorazione sullo sfondo indica i diversi tornei, quindi il primo blocco mostra che le prime quattro partite sono di un torneo, il secondo che le successive cinque sono di un altro, e così via. La colorazione blu è per il cemento e quella gialla per la terra battuta. Si nota una differenza significativa, particolarmente alla risposta sulla prima, nella posizione di Nadal sul cemento rispetto a quella sulla terra.

IMMAGINE 1 – Posizione media di Nadal alla risposta sulla prima di servizio

IMMAGINE 2 – Posizione media di Nadal alla risposta sulla seconda di servizio

Non c’è un ordine preciso per i tornei, perché non sono grafici che misurano una tendenza temporale ma, se siete curiosi, da sinistra a destra la sequenza è: Indian Wells Masters, Internazionali d’Italia, Madrid Masters, Finali di stagione, Canada Masters, Masters di Parigi Bercy, Monte Carlo Masters e ATP Cup.

Rafa in Retreat

Qualche classifica maschile con i dati del Match Charting Project

di Chapel Heel // HiddenGameOfTennis

Pubblicato il 13 agosto 2019 – Traduzione di Edoardo Salvati

In preparazione a un precedente articolo sulla somiglianza di stili, ho raccolto alcune statistiche dal Match Charting Project per quei giocatori nei primi 150 del mondo (e con almeno 2500 colpi nel database). I numeri si riferiscono a tutte le superfici e si distribuiscono sull’intervallo di tempo delle partite del singolo giocatore presenti nel database.

Credo sia interessante vedere chi è tra i primi 5 e chi tra gli ultimi 5 nelle categorie in esame, anche se di fatto non sono mie statistiche. Naturalmente, la quantità di dati disponibili del Match Charting Project è molto più abbondante, e sulla pagina di ogni giocatore è possibile il confronto con varie altre medie.

Servizio e volée

Si tratta dei tentativi di servizio e volée misurati come percentuale dei punti sul servizio. La media per questo gruppo è del 4.5%, o un tentativo di servizio e volée ogni 22 punti al servizio.

I primi 5 non stupiscono, mentre è sorprendente trovare Karen Khachanov tra gli ultimi. Pensandoci bene, non mi viene in mente un solo tentativo di servizio e volée in una delle sue partite.

Profondità della risposta

Non è un’indicazione presente in ogni partita, anche se sono convinto venga registrata di più ora dell’inizio del progetto. L’indice di profondità della risposta (Return Depth Index o RDI) considera le risposte per cui è indicata la profondità, determina la percentuale dei tre livelli (corta, profonda e molto profonda) e le pondera rispettivamente per 1, 2 e 4. La media del gruppo è di 2.32

Trovo questi risultati molto interessanti. Ho sempre pensato che una risposta più profonda fosse la risposta migliore, ed è certamente così tra i dilettanti. Ma sia Rafael Nadal che Roger Federer sono tra gli ultimi, probabilmente per ragioni diverse. Nadal risponde più angolato, e l’immensa rotazione che imprime alla pallina aggiunge profondità, anche se il colpo non rimbalza vicino alla linea di fondo. Nei numeri di Federer entra la sua preferenza per le risposte di rovescio con un taglio in slice corto.

Discese a rete

Si tratta della percentuale per colpo di discese a rete che non seguono il servizio. La media per questo gruppo è del 3.95%.

Trovare Rirchard Berankis tra i primi 5 è quasi sconvolgente. John Isner, Ivo Karlovic, Nicolas Mahut e altri giocatori di rete completano i primi 10. Ipotizzo che non rientrino tra i primi 5 perché molte delle discese a rete arrivano subito dopo il servizio. È anche interessante notare la scarsa frequenza con cui Gael Monfils cerca di andare a rete durante lo scambio.

Successo a rete

Si tratta della percentuale di punti a rete che il giocatore conclude con un vincente o con un colpo che costringe l’avversario a un errore forzato. La media per questo gruppo è del 69.6%.

Novak Djokovic è spesso criticato per il gioco a rete, ma ottiene grandi risultati. Mi aspettavo Nadal tra i primi e anche Fabio Fognini, ma non pensavo che Filip Krajinovic fosse così bravo. Invece, Sam Querrey e Karlovic, che ero convinto provassero ad andare a rete su ogni colpo, non hanno molto successo. Nel caso di Karlovic può essere l’enorme volume di tentativi ma, con il suo gioco, ha davvero altra scelta?

Variazioni con il dritto

Si tratta del rapporto tra dritti giocati in taglio topspin o piatti e dritti in taglio slice (Forehand Mix o FHMix). Ci si dovrebbe aspettare un numero molto alto, perché la maggior parte dei giocatori non è Monica Niculescu. La media per questo gruppo è di 21.8. Per convertire in percentuale, basta fare 1 – (1/(FHMix +1). In media, il valore è di 95.6% di dritti in topspin o piatti.

Nikoloz Basilashvili è a pieni giri. Quando qualche tempo fa ho analizzato le velocità massime medie per i colpi a rimbalzo, Basilashvili era il più potente sul dritto. Questo spiega il primo posto ora. E comunque colpisce davvero forte.

Variazioni con il rovescio

Il metodo è identico a quanto visto per il dritto, solo che in questo caso i valori sono molto più bassi, perché per la maggior parte dei giocatori c’è già un po’ di slice nel rovescio. La media per questo gruppo è di 6.44, o circa l’86.5% di rovesci in topspin o piatti.

È onesto affermare che Basilashvili non gradisce colpire in slice, o non riesce a giocarli. I tre giocatori i cui nomi balzano alla mente per primi quando si pensa al rovescio in slice hanno valori tra gli ultimi 5 (Karlovic, Steve Johnson, Feliciano Lopez), ma l’indice di Karlovic è scandalosamente basso, con un rovescio piatto poco meno del 5.5% delle volte (non gli ho mai visto colpire in topspin da quel lato).

Tentativi di palla corta

Si tratta della percentuale di palle corte tentate sul numero totale di colpi presenti nel database per il singolo giocatore. La media per questo gruppo è solo dell’1.21%.

Non è certamente una sorpresa trovare Benoit Paire al primo posto. Il suo 3.35% si traduce in un tentativo di palla corta ogni 30 colpi, forse uno ogni cinque scambi o uno a game. Non esiste una categoria per migliori e peggiore nelle “palle corte che non si sarebbero dovute tentare”, ma Paire probabilmente ne farebbe parte. Viceversa, sembra che Gilles Simon colpisca a rimbalzo in topspin in qualsiasi circostanza. Altri giocatori tra gli ultimi % sono battitori liberi come Andrey Rublev e Tomas Berdych (Basilashvili non è rientrato in classifica per pochissimo).

Palle corte riuscite

Anche se di per sé intuitivo, si tratta della percentuale di palle corte tentate che risultano in un vincente o a un errore forzato dell’avversario. La media per questo gruppo è un esiguo 36.1%.

Nonostante la presenza di John Millman negli ultimi 5, e anche nella categoria precedente, non c’è complessivamente una correlazione tra giocatori che tentano molte palle corte e giocatori che sono bravi con la palla corta, e viceversa. Paire è l’esempio da copertina, vista la sua efficacia realizzativa davvero bassa, solo un 26.5%, che lo pone all’undicesimo posto dal basso.

Riuscita dei colpi a rimbalzo a seconda della direzione

Si tratta di cinque diversi indicatori, per il dritto incrociato, il dritto lungolinea, il dritto a uscire, il rovescio incrociato e il rovescio lungolinea. L’indice si calcola come rapporto tra la somma di vincenti ed errori forzati dell’avversario, diviso per errori non forzati.

Dritto incrociato

La media per questo gruppo è di 1.22, vale a dire che, in media, un dritto incrociato ha il 22% di probabilità in più di essere un vincente o un errore forzato dell’avversario che un errore non forzato del giocatore in questione. Mi aspettavo che fosse l’indice più alto delle cinque categorie considerate, dato che il dritto tipicamente è il colpo più facile, ancor di più quello incrociato che supera la rete nel punto più basso. L’ultima colonna mostra che mi sono sbagliato.

Se vi siete mai chiesti come fa Daniel Evans a vincere le partite, ora avete la risposta. Un indice di 2.25 è altissimo. Mi ha sorpreso la presenza di Roberto Bautista Agut, che pensavo finisse nell’elenco del dritto a uscire, ma non in questo.

Dritto lungolinea

La media per questo gruppo è di 1.32, vale a dire che, in media, un dritto lungolinea ha il 32% di probabilità in più di essere un vincente o un errore forzato dell’avversario che un errore non forzato del giocatore in questione. Mi stupisce vedere un valore più alto di quello del dritto incrociato, perché la pallina passa la rete nel suo punto di massima altezza. Ma stiamo parlando di professionisti, quindi è più probabile che il fattore decisivo sia l’effetto sorpresa o il fatto che molti di questi colpi finiscano sul lato del rovescio di un giocatore destrimane in corsa.

Era facile immaginare la presenza di Nadal e Juan Martin Del Potro. Philipp Kohlschreiber è un caso interessante. Ha la tendenza ad angolare il dritto incrociato in modo da spingere l’avversario fuori dal campo, un po’ alla maniera di Nadal, per poi finire con un lungolinea. Nella mia versione più recente dell’articolo sulla somiglianza di stili, Kohlschreiber era il secondo giocatore più simile a Nadal, anche se non così simile.

È curioso che Isner sia tra gli ultimi 5. Cerca di colpire molti dritti lungolinea e, quando ci riesce, di solito vince il punto. Ma ne manda fuori anche parecchi e qui abbiamo la prova numerica. Ottiene buoni risultati con questo colpo circa il 42% delle volte. Normalmente però ci arriva troppo tardi.

Dritto a uscire

La media per questo gruppo è di 1.40, la più alta per i colpi di dritto. Presumo che se sei un professionista in grado di girare intorno al rovescio per colpire un dritto a uscire, ti ritrovi con il vantaggio della parte bassa della rete e del rovescio dell’avversario (se è un destrimane). Il problema ovviamente è mettersi nella giusta posizione.

Se vi aspettavate Del Potro tra i primi 5, come me, non vi preoccupate, è undicesimo e ben sopra la media.

Rovescio incrociato

La media per questo gruppo è solo di 0.72, vale a dire che, in media, un rovescio incrociato ha il 39% di probabilità di essere un errore non forzato che un vincente o un errore forzato dell’avversario.

Ho dovuto in parte modificare i primi 5 per dare più senso alla statistica. Evans e Johnson erano i primi due, ma non avevo praticamente dati, nel caso di Evans perché non ci sono molte partite e per Johnson perché non cerca di colpire vincenti di rovescio o forzare l’avversario a un errore, e quindi raramente sbaglia. Negli ultimi 5, non mi ero reso conto di quanta scarsa efficacia avesse il rovescio incrociato di Jeremy Chardy. È sette volte più probabile che commetta un errore non forzato con questo colpo che produca un vincente o un errore forzato dell’avversario. In termini più concreti, sono 2 vincenti, 5 errori forzati dell’avversario e 43 errori non forzati di Chardy.

Rovescio lungolinea

La media per questo gruppo è di 1.17. È più difficile da colpire di un rovescio incrociato, ma è anche più inatteso. Va sottolineato che i dati a disposizione per questo colpo sono decisamente inferiori a quelli di altri colpi, quindi possono capitare risultati insoliti.

E infatti sono dei primi 5 strani. Ho tolto Marcel Granollers perché era nettamente sopra chiunque ma aveva solo una manciata di colpi tra cui scegliere. Kei Nishikori è diciassettesimo? Penso perché più sono i tentativi per lui, più aumentano gli errori (un po’ come le volée per Karlovic). Alexander Zverev è undicesimo.

Cosa ne è dei giocatori con il rovescio a una mano di cui ci piacciono i rovesci lungolinea? I vari Stanislas Wawrinka, Kohlschreiber, Grigor Dimitrov, Richard Gasquet? Sono rispettivamente 57esimo, 31esimo, 48esimo e 23esimo. Wawrinka e Dimitrov sono sotto la media. O il campione di dati è piccolo, o l’insieme di colpi nel database del Match Charting Project per questi giocatori non è rappresentativo. O ancora, ci ricordiamo solo dei rovesci lungolinea più spettacolari.

Rotazione sul dritto

L’ultima classifica riguarda in realtà dati provenienti da Hawk-Eye. Li avevo raccolti per l’articolo sulla somiglianza di stili senza poi usarli (almeno per il momento). Tralascio quella sul rovescio perché i dati sono poco affidabili e ingannevoli. Ho dovuto escludere anche alcuni giocatori di cui mi mancano completamente dati sulla rotazione sul dritto, perché non hanno giocato su campi coperti da Hawk-Eye, come Pablo Andujar, Dustin Brown, Pablo Cuevas, Lukas Rosol e Casper Ruud. La media per i restanti giocatori è di 2903 giri al minuto.

Mi sembrano posizioni ragionevoli. Spicca Basilashvili al secondo posto tra i primi 5. Come ho detto in precedenza, Basilashvili possiede anche la seconda velocità media più alta di dritto nei dati Hawk-Eye che possiedo. Avete un’idea di quale velocità di esecuzione del movimento e tempismo sono necessari per arrivare contestualmente al secondo posto per numero di giri impressi alla pallina e per velocità media del colpo? Si presume che rotazione e velocità lavorino contro!

Some Random Match Charting Project Leaderboards (ATP)

Il futuro del tennis con un esperimento sul tabellone di Wimbledon 2019

di Chapel Heel // HiddenGameOfTennis

Pubblicato l’1 luglio 2019 – Traduzione di Edoardo Salvati

Sono 29 i giocatori di almeno 32 anni nel tabellone del singolare maschile di Wimbledon 2019. Sono invece 24 le giocatrici di almeno 30 anni nel tabellone del singolare femminile (ho scelto un limite di età più basso perché altrimenti per le donne non avrebbe avuto senso proseguire). Cosa succederebbe se li escludessimo dal torneo? Non rimarrebbero solo gli attuali esponenti della Next Gen, ma si infilerebbero giocatori delle due ondate di Next Gen precedenti, se così si può dire. Sarebbe un’approssimazione di Next Gen.

Forse si riesce ad avere un’idea delle sembianze di uno Slam in assenza di giocatori come Novak Djokovic, Rafael Nadal, Roger Federer, Stanislas Wawrinka, o di giocatrici come Serena Williams e Venus Williams e alcune dell’ultima Next Gen in campo femminile. Mi rendo conto che questi giocatori non si tireranno di certo indietro per sottrarsi posizioni in classifica dopo che i grandi nomi si saranno ritirati, e nuova linfa che ancora deve emergere si farà largo. Diventa quindi solo un passatempo per provare a identificare scenari futuri, non un pronostico puntuale di risultati a venire.

I ragazzi saranno uomini

In campo maschile, si perdono le prime 4 teste di serie (e nove teste di serie in tutto). Ventinove giocatori sono molti da rimpiazzare. Per primo, ho rimesso Borna Coric, anche se non riempiva un posto lasciato scoperto. Poi, ho deciso di non aggiungere Juan Martin Del Potro. Il suo fisico ha almeno due anni in più di quanto indichi la data di nascita, e non c’è alcuna certezza del livello di gioco una volta rientrato sul circuito. Da ultimo, ho richiamato tutti i perdenti del terzo turno di qualificazioni. Mi mancavano ancora 13 giocatori, e ho preso le teste di serie perdenti del secondo turno (ma solo se non eccedevano il limite di età). Con ancora 8 posti vuoti, ho scelto a caso tra gli altri perdenti al secondo turno delle qualificazioni.

Le prime 8 teste di serie sono ora Dominic Thiem, Alexander Zverev, Stefanos Tsitsipas, Kei Nishikori, Karen Khachanov, Daniil Medvedev, Marin Cilic e Coric. Altri da tenere d’occhio: Milos Raonic con la numero 9, Felix Auger-Aliassime con la 12, Denis Shapovalov con la 20, Taylor Fritz con la 25, Frances Tiafoe con la 27 e Nick Kyrgios con la 32.

Proviamo a eseguire 100.000 simulazioni solo con le valutazioni Elo, mischiando le posizioni nel tabellone dopo ogni passaggio. Per avere un termine di paragone, nessun giocatore di questi scenari alternativi ha una probabilità di vincere Wimbledon 2019 più alta del 3%, sulla base delle mie previsioni Elo, e solo uno è già campione Slam (Cilic).

La tabella riepiloga i 20 migliori risultati.

IMMAGINE 1 – Probabilità di progressione nei tabelloni alternativi a Wimbledon 2019

A seguito delle 100.000 simulazioni, la probabilità complessiva di vittoria dei 20 giocatori nell’elenco è dell’88.7%. Per rendersi conto dello spostamento di forze associato alla rimozione dal tabellone dei giocatori con almeno 32 anni, sempre secondo i miei calcoli Elo, il quartetto composto da Djokovic, Federer, Nadal e Kevin Anderson ha una probabilità complessiva di vittoria del 76.6% (Djokovic ha vinto il torneo battendo Federer in finale, che a sua volta aveva sconfitto Nadal in semifinale. Anderson non ha partecipato per infortunio, anche se la sua percentuale di vittoria era del 2.9%, n.d.t.)

Donne che (non) aspettano

È scontato dire che l’effetto sul tabellone femminile non è così drastico. Per quanto il numero di giocatrici che viene escluso è simile a quello dei giocatori, le uniche vere pretendenti a uscire di scena sono Angelique Kerber e Serena (se il limite fosse stato a 29 anni, Petra Kvitova non sarebbe rientrata e, un po’ tirato, anche Victoria Azarenka, ma per questo scopo sarebbe stato troppo restrittivo).

Le prime 4 teste di serie rimangono inalterate. Per le successive 6 teste di serie, ho promosso la giocatrice che seguiva immediatamente in classifica. Ho riempito poi le altre posizioni con lo stesso metodo degli uomini. Si perde in tutto circa il 17% della probabilità di vittoria da questi scenari alternativi, mentre per gli uomini era superiore all’80%, pur con un limite più alto. Le donne perdono certamente la maggior parte delle campionesse Slam, senza Serena, Venus, Kerber, Maria Sharapova e Svetlana Kuznetsova.

La tabella riepiloga i 20 migliori risultati.  

IMMAGINE 2 – Probabilità di progressione nei tabelloni alternativi a Wimbledon 2019

A seguito delle 100.000 simulazioni, la probabilità complessiva di vittoria delle 20 giocatrici nell’elenco è dell’93.9%, ancora più che per gli uomini. Nelle mie previsioni Elo, le stesse giocatrici hanno il 78.6% di probabilità complessiva di vittoria, quindi l’eliminazione della vecchia guardia favorisce il consolidamento della loro ascesa.

Sembrano tutti consapevoli della difficoltà del periodo di transizione in cui si troverà l’ATP quando Djokovic, Federer e Nadal non giocheranno più. Non mi sorprenderebbe se la crescente tensione generata dall’incertezza futura si sia già fatta strada nelle dinamiche politiche dell’ATP, rendendo più acceso lo scontro a cui stiamo assistendo con le dimissioni nel comitato giocatori. È davvero un momento critico per il tennis maschile.

Riprendete l’immagine 1 e leggete i nomi. Fermatevi al primo che, di riflesso, vi porta a mugugnare con dubbio “hmm”. Ora fate lo stesso per le donne. Scommetto che arrivate più in basso. Non è del tutto corretto, perché ci sono sicuramente dei nomi di rilievo anche nella parte finale dell’elenco dei giocatori (Auger Aliassime, Shapovalov, e per alcuni Kyrgios). Tranne forse per tre giocatrici, tra le donne il talento è ben distribuito, e con abbondanza.

NextGen-ish Wimbledon

Il destino delle finaliste di Slam juniores

di Chapel Heel // HiddenGameOfTennis

Pubblicato il 5 luglio 2019 – Traduzione di Edoardo Salvati

Tempo fa, ho scritto della probabilità che un vincitore di Slam juniores raggiunga determinati traguardi da professionista e di quanto tempo possa essergli richiesto. Ho poi fatto la stessa analisi per le vincitrici di Slam juniores e per i finalisti. Quest’ultima puntata è dedicata alle finaliste di Slam juniores.

Come per i ragazzi, ho esaminato tutte le finaliste di Slam juniores dal 1990 e seguito il loro sviluppo nel raggiungimento degli stessi traguardi da professionisti delle vincitrici. Le giocatrici di questa particolare categoria però (e anche le vincitrici a ben vedere), evidenziano caratteristiche inusuali nei primi anni ’90. Ad esempio, alcune erano già tra le prime 200 (a volte anche tra le prime 125) al momento della finale juniores. Una aveva già vinto un torneo sul circuito maggiore. Ho tenuto quelle il cui percorso di crescita si è rivelato istruttivo, eliminando altre del periodo 1990-1992 perché avrebbero alterato eccessivamente i risultati. Sono in totale 10 giocatrici su 244.

Sorelle minori?

Se avete letto l’articolo sui finalisti, sapete già che in carriera ottengono all’incirca la metà del successo dei vincitori di Slam juniores. Vale lo stesso per le finaliste?

La tabella mostra l’età media della finalista di Slam juniores per i quattro tornei, il numero di tornei di singolare vinti sul circuito maggiore, i Premier vinti, gli Slam vinti (al momento) e la mediana dei guadagni in carriera (compreso il doppio, i Challengers, etc), con valori che tengono conto dell’inflazione alla maniera delle altre analisi.

Riprendiamo la stessa tabella per le vincitrici di Slam juniores.

La crescita delle vincitrici di Slam juniores_1 - settesei.it

Come gruppo, le finaliste non fanno bene quanto le vincitrici, ma non se la passano male. Non è certamente un divario così ampio come quello che separa finalisti e vincitori. È interessante notare inoltre che le finaliste, complessivamente, hanno medie e mediane da professioniste migliori dei vincitori di Slam juniores (1.595.380 dollari contro 1.176.503 dollari). Non sono proprio le sorelle minori.

Risalire la classifica

Nel confronto (a eccezione di un paio di categorie in cui il campione si riduce considerevolmente), i vincitori di Slam juniores raggiungono traguardi come primi 200, primi 100, primi 50, primi 20 e primi 5 più spesso dei finalisti. Inoltre è cinque volte più probabile per i vincitori arrivare al numero 1, due volte più probabile vincere un torneo del circuito maggiore e tre volte più probabile vincere uno Slam (anche se, va detto, il campione per il numero 1 e gli Slam è molto ridotto).

In linea con quanto visto, ci sono differenze tra vincitrici e finaliste relativamente a questi traguardi, ma non sono accentuate. Per le vincitrici è un terzo più probabile arrivare al numero 1 o vincere un torneo del circuito maggiore, e solo il 10% più probabile vincere uno Slam.

Durata della crescita

Supponendo che una finalista raggiunga uno di questi traguardi, quanto velocemente ci riesce? Come in precedenza, ho misurato il tempo trascorso in mesi (arrotondato) tra la data della finale di uno Slam juniores per una giocatrice e la data del traguardo raggiunto. Invece di tenerne separati i valori, il grafico dell’immagine 1 mostra le curve complessive di finaliste e vincitrici per ciascun torneo, con il numero di mesi sull’asse delle ordinate.

IMMAGINE 1 – Durata della crescita (in mesi) in aggregato

È un po’ strano che le giocatrici che riescono a entrare nelle prime 10 ci arrivano più velocemente, in media, di quelle che entrano tra le prime 20 (che include anche le prime 10). Principalmente, è dovuto a un paio di eccezioni come Magdalena Rybarikova (finalista a Wimbledon juniores 2006), che ha impiegato 136 mesi, e Barbora Strycova (finalista agli US Open juniores 2002 e vincitrice degli Australian Open juniores 2002 e 2003), che ha impiegato 140 mesi. La crescita delle giocatrici è generalmente più breve di quella dei giocatori, tranne che per il numero 1 che richiede più tempo.

Finestre di crescita

Come per le altre analisi, ho creato un grafico a scatola per le finestre di crescita, aggregando tutti i tornei e tutte le finaliste di Slam juniores. Otteniamo un campione molto rappresentativo delle giocatrici juniores di vertice. La crescita è calcolata dalla prima data di raggiungimento di una finale Slam, a prescindere dall’esito. L’asse delle ordinate riporta il numero di mesi. Le porzioni superiore e inferiore delle linee che si estendono in verticale rappresentano rispettivamente il valore massimo e minimo, escludendo gli estremi. La linea in mezzo alla scatola è la mediana, mentre la “x” interna alla scatola è la media che in questo caso, ironicamente, non ha di fatto alcun valore. Il colore verde esprime il terzo quartile e il blu il secondo quartile. Visto che è preferibile una crescita più rapida, le scatole blu sono migliori delle verdi. I cerchi dal contorno blu indicano i valori estremi.

IMMAGINE 2 – Finestre di crescita

Chi tiene il tempo?

Originariamente, ho creato un grafico per le vincitrici di Slam juniores con le finestre di crescita per vedere chi tra le recenti vincitrici è ancora in corsa per raggiungere determinati traguardi da professionista. Ho poi messo insieme i risultati di recenti vincitrici e finaliste di Slam juniores, così da osservare da vicino la loro progressione rispetto allo storico. Nel caso una giocatrice avesse più di un’apparizione, la tabella ricomprende solo la prima. Per questo possono esserci delle assenze nella seconda colonna.

Utilizzo uno sfondo blu e una “+” se si è sotto la mediana — cioè la giocatrice ha ancora molto tempo — e uno verde con “-“ se si è nel terzo quartile, cioè se il tempo a disposizione è sempre meno ma non ancora in modo irrecuperabile. Lo sfondo è rosso con una “x” grigia se la giocatrice ha mancato il terzo quartile, a indicazione che potrebbe essere arrivato al termine del suo cammino.

Riepilogando, se c’è solo il numero nella cella, la giocatrice è in posizione ottimale. I numeri bianchi su sfondo rosso indicano un passaggio intermedio di crescita più lenta del normale. Le celle blu vanno bene, le verdi non sono granché e quelle rosse senza numeri vanno male.

Seguono altri grafici relativi alle finestre di crescita e al raggiungimento dei traguardi.

IMMAGINE 3 – Tabella riepilogativa della crescita delle finaliste e vincitrici di Slam juniores con codifica tramite colori

Durata della crescita (grafico a violino)

Questi grafici a violino sono una versione più sofisticata del grafico a scatola, con “candele” nel mezzo che mostrano dati interquartili (Q2 e Q3). Si tratta delle finestre di crescita che servono per stabilire la colorazione nel grafico dell’immagine 3. I grafici a violino includono anche diventare la numero 1 del mondo e vincere il primo Slam, ma è per entrambi un campione troppo minuto per farvi affidamento e quindi non compare nella tabella specifica per giocatrice.

Probabilità del raggiungimento di traguardi per torneo (mappa di calore)

Questa mappa di calore evidenzia la probabilità di raggiungimento di determinati traguardi, in funzione del singolo Slam.

Aggiornamento dopo gli US Open juniores 2019

A conclusione degli US Open juniores, con la vittoria di Maria Camila Osorio Serrano contro Alexandra Yepifanova, i principali sviluppi (che si riflettono nel grafico dell’immagine 3) sono:

  • Sofia Kenin ha raggiunto le prime 20 comodamente all’interno della normale finestra di sviluppo
  • Iga Swiatek è entrata tra le prime 50 secondo i tempi previsti
  • la giovanissima coppia di doppio Coco Gauff e Caty McNally ha centrato le prime 125 in tempo
  • Marie Bouzkova e Paula Badosa sono entrate tra le prime 100, ma in ritardo
  • Anna Kalinskaya è entrata tra le prime 125, ma in ritardo
  • si è chiusa la normale finestra di crescita per l’ingresso nelle prime 5 per Belinda Bencic, ma è probabilmente una conclusione affrettata, perché le mancavano solo un paio di partite
  • si è chiusa la normale finestra di crescita per l’ingresso nelle prime 20 per Katerina Siniakova (aveva già perso la finestra delle prime 10 e prime 5 dopo Wimbledon)

Il prossimo aggiornamento sarà a fine stagione. Molto probabilmente Dayana Yastremska e Amanda Anisimova saranno entrate tra le prime 20, Anastasia Potapova e Marie Bouzkova tra le prime 50.

Girls Grand Slam Runners Up

Il destino dei finalisti di Slam juniores

di Chapel Heel // HiddenGameOfTennis

Pubblicato il 14 giugno 2019 – Traduzione di Edoardo Salvati

Tempo fa, ho scritto della probabilità che un vincitore di Slam juniores raggiunga determinati traguardi da professionista e di quanto tempo possa essergli richiesto. Durante la stesura, ero consapevole del fatto che i migliori non vincono sempre ogni torneo che giocano, e che quindi chi diventa campione di Slam juniores non è necessariamente il più forte giovane in circolazione. L’analisi dei vincitori era semplicemente un modo per concentrare la ricerca su un gruppo facilmente definibile che è riuscito a ottenere risultati di prestigio nella fase iniziale della carriera.

Sembra proprio che debba ora occuparmi anche dei finalisti, perché certamente hanno mostrato un talento simile a quello dei vincitori. Può succedere di tutto in una partita, specialmente tra due ragazzi che hanno accettato la sfida di risalire il tabellone di uno Slam juniores per issarsi alla finale.

In questo articolo, ho esaminato tutti i finalisti di Slam juniores dal 1990 e seguito il loro sviluppo nel raggiungimento degli stessi traguardi da professionisti dei vincitori. Molti dei vincitori sono stati anche finalisti in altri tornei Slam (o in altri anni), ma comunque il campione si arricchisce di 81 giocatori.

Vinco subito e non dopo?

La tabella mostra l’età media del finalista di Slam juniores per i quattro tornei, il numero di tornei di singolare vinti sul circuito maggiore, i Master 1000 vinti, gli Slam vinti (al momento) e la mediana dei guadagni in carriera (compreso il doppio, i Challengers, etc), con valori che tengono conto dell’inflazione.

Si potrebbe pensare che un finalista di Slam juniores vinca circa tre eventi del circuito maggiore (267 diviso per 81). Occorre però non dimenticare che più della metà di quei tornei appartengono a soli tre giocatori, cioè Roger Federer, Thomas Enqvist e Juan Carlos Ferrero. Meno di un finalista di Slam juniores su quattro ha vinto un torneo del circuito maggiore. Riprendiamo la stessa tabella per i vincitori di Slam juniores.

La crescita dei vincitori di Slam juniores_1 - settesei.it

È molto interessante notare che, in media, pur partendo da età simile, i vincitori hanno avuto da professionisti un successo quasi doppio di quello dei finalisti. Solo il totale degli Slam vinti è influenzato dal fatto che Federer è stato sia vincitore (Wimbledon) che finalista (US Open) di Slam juniores. Se si eliminano i 20 Slam da entrambi i conteggi, si ottiene un 9-2 in favore dei vincitori.

Comunque non me la passerò male, no?

Nel precedente articolo, ho ipotizzato che per stare a galla sul circuito servono all’incirca 75.000 dollari all’anno, portando la mediana dei guadagni annuali da premi partita intorno ai 45.000 dollari. Dopo aver escluso i guadagni estremi di Federer, Andy Murray, Stanislas Wawrinka, Marin Cilic e Andy Roddick, la probabilità che un campione di Slam juniores guadagni non più di 250.000 dollari in carriera è del 24%.

La prospettiva di guadagno per un finalista di Slam juniores è decisamente lugubre, circa metà di quanto atteso per un vincitore. Si potrebbe pensare a una carriera molto più corta per questi giocatori, ma non è così. Dal momento in cui passano al professionismo a quello in cui non hanno più una classifica ufficiale trascorrono in media dieci anni, una finestra praticamente identica a quella dei vincitori. Guadagni dimezzati sullo stesso orizzonte temporale non allettano nessuno. La situazione è, se possibile, peggiore. Le spese sono relativamente invariate e non metà dei 75.000 dollari stimati. Per giocare a tennis, il finalista mediano di Slam juniores sta probabilmente perdendo soldi.

Risalire la classifica

La tabella che segue mostra la percentuale di finalisti di Slam juniores che raggiungono determinati traguardi una volta diventati professionisti. Le prime colonne si riferiscono a traguardi in termini di classifica, le ultime due a titoli sul circuito maggiore e titoli Slam.

Ecco la stessa tabella per i vincitori di Slam juniores.

La crescita dei vincitori di Slam juniores_2 - settesei.it

Nel confronto (a eccezione di un paio di categorie in cui il campione si riduce considerevolmente), i vincitori di Slam juniores raggiungono quei traguardi più spesso dei finalisti.

Durata della crescita

Siamo in grado di calcolare la probabilità con cui i finalisti di Slam juniores raggiungono determinati traguardi da professionisti, ma non la velocità con cui lo fanno (se mai ci riescono). Ho misurato il tempo trascorso in mesi (arrotondato) tra la data della finale di uno Slam juniores per un giocatore e il raggiungimento di quei traguardi. Il grafico dell’immagine 1 mostra le curve per ciascun torneo con il numero di mesi sull’asse delle ordinate.

IMMAGINE 1 – Durata della crescita (in mesi)

Difficile trovare molte differenze con il grafico dei vincitori. Finalisti e vincitori degli Australian Open e Wimbledon juniores hanno uno sviluppo più lento dei corrispettivi al Roland Garros e agli US Open juniores. Per entrare tra i primi 200, i vincitori impiegano (in media) circa 8 mesi in meno dei finalisti, ma è un divario che si restringe rapidamente spostandosi a destra, tranne che per l’ingresso nei primi 5 o per il numero 1, posizioni sulle quali un giudizio non è affidabile vista la ristrettezza di dati a disposizione. Invece di riportare lo stesso grafico dall’articolo sui vincitori, l’immagine 2 mostra in aggregato le curve di sviluppo per vincitori e finalisti di Slam juniores.

IMMAGINE 2 – Durata della crescita (in mesi) in aggregato

Finestre di crescita

Come per l’analisi iniziale, ho creato un grafico a scatola per le finestre di crescita, aggregando tutti i tornei e tutti i finalisti di Slam juniores. Otteniamo un campione molto rappresentativo dei giocatori juniores di vertice. La crescita è calcolata dalla prima data di raggiungimento di una finale Slam, a prescindere dall’esito. L’asse delle ordinate riporta il numero di mesi. Le porzioni superiore e inferiore delle linee che si estendono in verticale rappresentano rispettivamente il valore massimo e minimo, escludendo gli estremi. La linea in mezzo alla scatola è la mediana, mentre la “x” interna alla scatola è la media che in questo caso, ironicamente, non ha di fatto alcun valore. Il colore verde esprime il terzo quartile e il blu il secondo quartile. Visto che è preferibile una crescita più rapida, le scatole blu sono migliori delle verdi. I cerchi dal contorno blu indicano i valori estremi.

IMMAGINE 3 – Finestre di crescita

Chi tiene il tempo?

Originariamente, ho creato un grafico per i vincitori di Slam juniores con le finestre di crescita per vedere chi tra i recenti vincitori è ancora in corsa per raggiungere determinati traguardi da professionista. I dati aggregati dovrebbero avere un potenziale informativo ancora più alto, perché il numero di giocatori considerati è aumentato dell’80%.
Ho poi messo insieme i risultati di recenti vincitori e finalisti di Slam juniores, così da osservare da vicino la loro progressione rispetto allo storico. Nel caso un giocatore avesse più di un’apparizione (come Lorenzo Musetti, vincitore degli Australian Open juniores 2019 ma già finalista agli US Open juniores 2018), la tabella ricomprende solo la prima. Per questo possono esserci delle assenze nella seconda colonna.

Utilizzo uno sfondo blu e una “+” se si è sotto la mediana — cioè il giocatore ha ancora molto tempo — e uno verde con “-“ se si è nel terzo quartile, cioè se il tempo a disposizione è sempre meno ma non ancora in modo irrecuperabile. Lo sfondo è rosso con una “x” grigia se il giocatore ha mancato il terzo quartile, a indicazione che potrebbe essere arrivato al termine del suo cammino.

Riepilogando, se c’è solo il numero nella cella, il giocatore è in posizione ottimale. I numeri bianchi su sfondo rosso indicano un passaggio intermedio di crescita più lenta del normale. Le celle blu vanno bene, le verdi non sono granché e quelle rosse senza numeri vanno male.

Seguono altri grafici relativi alle finestre di crescita e al raggiungimento dei traguardi.

IMMAGINE 4 – Tabella riepilogativa della crescita dei finalisti e vincitori di Slam juniores con codifica tramite colori

Durata della crescita (grafico a violino)

Questi grafici a violino sono una versione più sofisticata del grafico a scatola, con “candele” nel mezzo che mostrano dati interquartili (Q2 e Q3). Si tratta delle finestre di crescita che servono per stabilire la colorazione nel grafico dell’immagine 4. I grafici a violino includono anche diventare il numero 1 del mondo e vincere il primo Slam, ma è per entrambi un campione troppo minuto per farvi affidamento e quindi non compare nella tabella specifica per giocatore.

Probabilità del raggiungimento di traguardi per torneo (mappa di calore)

Questa mappa di calore evidenzia la probabilità di raggiungimento di determinati traguardi, in funzione del singolo Slam.

Boys Grand Slam Runners Up

La fortuna del sorteggio: US Open 2019 (donne)

di Chapel Heel // HiddenGameOfTennis

Pubblicato il 26 agosto 2019 – Traduzione di Edoardo Salvati

Come per gli uomini, anche per le donne ho eseguito una simulazione (con la mia variante Elo) di 100.000 configurazioni del tabellone principale, utilizzando lo stesso metodo che gli organizzatori usano per assegnare alle giocatrici la loro posizione. L’ho poi confrontata con la previsione per il torneo su base Elo rispetto al tabellone effettivo.

La tabella mette a confronto la previsione effettiva del tabellone con i risultati dalle simulazioni di rimescolamento dell’intero campo partecipanti (a eccezione delle teste di serie numero 1 e 2, naturalmente), in modo da avere alcune indicazioni sull’accessibilità del tabellone effettivo rispetto alle altre configurazioni. Tonalità di rosso (e arancione) evidenziano la sfortuna della giocatrice. Al contrario, tonalità di verde rappresentano la fortuna ricevuta nel tabellone effettivo, in riferimento a un particolare turno. Il giallo simboleggia neutralità, e si può di fatto ignorare qualsiasi valore superiore o inferiore allo 0.2%.

Per una presentazione più compatta rispetto al passato, ho riportato nella tabella solo le teste di serie, e organizzato nella tabella successiva quelle giocatrici fuori dalle teste di serie per le quali c’è stata un’incidenza degna di nota (almeno l’1% di segno positivo o negativo).

Tabellone effettivo e simulato a confronto per le teste di serie

Il quarto di finale di Elina Svitolina ha proprio una brutta faccia (per il momento ha superato facilmente il primo turno contro Whitney Osuigwe, n.d.t.) . Sembra poi che anche Caroline Wozniacki (che ha superato il primo turno contro Yafan Wang, n.d.t.), Aryna Sabalenka (che ha battuto Victoria Azarenka al primo turno, n.d.t.) e Serena Williams siano state penalizzate dal tabellone effettivo, sebbene il sospetto è che sulla cella arancione di Williams al primo turno pesi in qualche modo una valutazione generosa di Elo della bravura di Maria Sharapova (Williams ha vinto infatti con un doppio 6-1, n.d.t.). La campionessa uscente Naomi Osaka ha il percorso più semplice tra le giocatrici con realistiche possibilità di aspirazione al titolo, rispetto a un tabellone casuale (anche se ha faticato al primo turno contro Anna Blinkova, vincendo in tre set dopo due ore e mezzo, n.d.t.).

IMMAGINE 1 – Confronto tra tabellone effettivo e simulazioni per le teste di serie

Effetti di rilievo su una selezione di giocatori fuori dalle teste di serie

Un tabellone più favorevole per Svetlana Kuznetsova con questa metodologia è dovuto in larga parte a rimanenze nella valutazione Elo di uno stato di forma che potrebbe essere scomparso (e così è stato, vista la sconfitta in due set al primo turno contro Kristie Ahn, n.d.t.), oltre ad avere due delle teste di serie più volubili nella sua sezione in Sloane Stephens (che infatti a perso contro Anna Kalinskaya al primo turno, n.d.t.) e Garbine Muguruza (anche lei perdente al primo turno contro Alison Riske, n.d.t.).

Mi sorprende vedere che il dato di Sharapova non sia peggiore, avendo al primo turno una delle tre giocatrici più forti di sempre.

IMMAGINE 2 – Effetti della casualità del sorteggio su alcune non teste di serie

Luck of the Draw US Open 2019 (Women)

La fortuna del sorteggio: US Open 2019 (uomini)

di Chapel Heel // HiddenGameOfTennis

Pubblicato il 26 agosto 2019 – Traduzione di Edoardo Salvati

Come d’abitudine per gli Slam, ho eseguito una simulazione (con la mia variante Elo) di 100.000 configurazioni del tabellone principale, utilizzando lo stesso metodo che gli organizzatori usano per assegnare ai giocatori la loro posizione. L’ho poi confrontata con la previsione per il torneo su base Elo rispetto al tabellone effettivo.

L’immagine 1 mette a confronto la previsione effettiva del tabellone con i risultati dalle simulazioni di rimescolamento, in modo da avere alcune indicazioni sull’accessibilità del tabellone effettivo rispetto alle altre configurazioni. Tonalità di rosso (e arancione) evidenziano la sfortuna del giocatore. Al contrario, tonalità di verde rappresentano la fortuna ricevuta nel tabellone effettivo, in riferimento a un particolare turno. Il giallo simboleggia neutralità, e si può di fatto ignorare qualsiasi valore superiore o inferiore allo 0.2%.

Per una presentazione più compatta rispetto al passato, ho riportato nella tabella solo le teste di serie, e organizzato nell’immagine 2 quei giocatori fuori dalle teste di serie per i quali c’è stata un’incidenza degna di nota (almeno l’1% di segno positivo o negativo).

Tabellone effettivo e simulato a confronto per le teste di serie

Rispetto a tabelloni casuali, la parte alta del tabellone principale è più difficile di quella bassa. Accade spesso quando Novak Djokovic e Roger Federer si ritrovano dallo stesso lato (in quella alto, vista la testa di serie numero 1 di Djokovic) in un torneo che non sia su terra battuta. Ho eseguito la stessa simulazione prima che si conoscessero i qualificati e la strada di Djokovic al quarto di finale non era così in discesa. Kevin Anderson non sarebbe stato l’Anderson da potenziale semifinale e Milos Raonic non sarebbe stato al massimo della forma, ma i ritiro di entrambi ha facilitato, almeno in termini di valutazioni Elo, il tabellone di Djokovic. Le cose per lui poi si complicano, vista la presenza di Federer invece che di Dominic Thiem. Per la stessa ragione, il percorso di Nadal alla finale è verniciato di verde.

Non ci si deve sorprendere dal rosso vivo nel tabellone di Stefanos Tsitsipas, visto che il suo primo turno assomiglia di più a un quarto turno (e in effetti Tsitsipas ha perso in quattro set contro Andrey Rublev, n.d.t.). Rispetto a un tabellone casuale, Kei Nishikori ha il cammino più facile fino ai quarti di finale, ma la possibilità di approfittane è molto legata al recupero dall’indisposizione subita a Cincinnati e al livello di umidità a New York. Anche Daniil Medvedev, il giocatore più “infuocato” in questo periodo, ha un percorso più semplice del previsto. Avrà ancora benzina a sufficienza? (Medvedev ha superato il primo turno in tre set contro Prajnesh Gunneswaran, n.d.t.)

Particolare attenzione va data all’apparente fortuna di Diego Schwartzman fino ai quarti di finale. Elo ignora che al primo turno Schwartzman deve giocare contro Robin Haase, per lui una vera e propria kryptonite, considerato un record negli scontri diretti di 0-5 con una sconfitta su ogni superficie (Schwartzman si è riscattato vincendo in tre set, n.d.t.).

IMMAGINE 1 – Confronto tra tabellone effettivo e simulazioni per le teste di serie

Effetti di rilievo su una selezione di giocatori fuori dalle teste di serie

Non ci sono qui problematiche degne di nota. Il vincitore di Winston Salem Hubert Hurkacz ha il percorso peggiore (perdendo al primo turno contro Jeremy Chardy in cinque set, n.d.t.), mentre Philipp Kohlschreiber riesce (purtroppo) a finire di nuovo in questo elenco (perdendo al primo turno contro Lucas Pouille in quattro set, n.d.t.).

IMMAGINE 2 – Effetti della casualità del sorteggio su alcune non teste di serie

Luck of the Draw: US Open 2019 (Men)

Quali giocatori potrebbero essere più efficienti con il challenge?

di Chapel Heel // HiddenGameOfTennis

Pubblicato il 9 agosto 2019 – Traduzione di Edoardo Salvati

Durante Wimbledon, ho ricevuto una tabella relativa al successo dei giocatori con il challenge nel corso del torneo. La frequenza di Rafael Nadal era molto alta, e una delle persone in copia nella mail ha suggerito che Nadal dovrebbe ricorrere più spesso alla moviola istantanea.

Dall’inizio della stagione, ho segnato le chiamate challenge negli eventi del circuito maggiore dove il sistema è disponibile. Normalmente si tratta dei tornei sul cemento e sull’erba, anche se non tutti lo hanno e in alcuni è solo sui campi principali. Un esempio sorprendente è quello del Miami Masters, in cui le telecamere sono installate in pochi dei campi che ospitano il torneo. Di conseguenza, ci sono molti più dati per quei giocatori il cui calendario prevede poche apparizioni sulla terra battuta. Significa anche che abbiamo più dati per i giocatori di classifica più alta, in virtù del fatto che le loro partite sono più spesso programmate sui campi principali, in cui appunto si trovano le telecamere.

Per questo articolo, ho esaminato i primi 100 della classifica ufficiale. Onde evitare problemi di campionamento, ho eliminato i giocatori con meno di 250 partite giocate su campi dotati di challenge (escluso il Canada Masters). Vorrei sottolineare che non sono dati ufficiali, ma ciò che sono riuscito a raccogliere dalle informazioni fornite ai giornalisti in vari tornei. Potrebbero essere quindi incompleti.

Per quali giocatori è assicurato un futuro da giudici di sedia?

Iniziamo dal caso più semplice, i dieci giocatori con la miglior frequenza di successo (almeno 250 partite). La frequenza media relativa ai dati in mio possesso (di tutti i primi 100) è del 27.0%.

IMMAGINE 1 – Primi dieci giocatori per successo nel challenge, con almeno 250 partite di utilizzo del sistema

Questi sono i peggiori, tra cui alcuni davvero pessimi.

IMMAGINE 2 – Giocatori con al frequenza di successo più bassa nel challenge, con almeno 250 partite di utilizzo

Se pensate come me che l’inesperienza possa essere un fattore critico dell’insuccesso, avete esempi in Andrey Rublev, Denis Shapovalov, Alexander Bublik e Stefanos Tsitsipas. Poi però ci sono Bernard Tomic, Leonardo Mayer, Benoit Paire, Mikhail Kukushkin e Fabio Fognini che, pur essendo ben navigati, hanno un rendimento inferiore alla media. Ammetto che alcuni tra questi hanno comportamenti un po’ eccentrici in campo, ma è comunque difficile individuare una chiara linea di demarcazione tra esperienza e inesperienza nella frequenza di successo con il challenge.

Quali giocatori non si fidano delle chiamate arbitrali?

Dalle tabelle precedenti emerge facilmente il giocatore che più dubita dei giudici: Tsitsipas ha chiamato il challenge 135 volte in stagione. Nessun altro tra i primi 100 è arrivato anche solo in tripla cifra. Non vogliamo però muoverci per numeri assoluti, perché Tsitsipas ha giocato molte partite nel 2019. L’immagine 3 riepiloga i dieci giocatori con la più alta frequenza di chiamata del challenge, per numero di game giocati su campi dotati della moviola.

IMMAGINE 3 – Primi dieci giocatori per ricorso al challenge per numero di game

Tsitipas è comunque tra i primi dieci, ma per poco, e anche in questo caso non compaiono solo i più giovani. Pensavo inoltre di vedere qualche specialista della terra battuta trascinato dall’entusiasmo di avere la possibilità del challenge sul cemento. La maggior parte di loro però non ha superato il limite delle 250 partite ma, ignorandolo, non ho notato un effetto pronunciato per i terraioli. Ad esempio, Marco Cecchinato fa molto uso del challenge (17.1%, con una scarsa frequenza di successo del 13.8% su 170 game), così non è per Pablo Cuevas (8.9%, con una buona frequenza di successo del 37.5% in 180 game).

Quando abbastanza è abbastanza?

Siamo ancora nel novero della curiosità. Quello che vorremmo invece sapere è: il giocatore con un’alta frequenza di successo nel challenge, sfrutta pienamente questa capacità? Chi invece non indovina un challenge, lo usa troppo spesso? Iniziamo dalla seconda domanda.

Notate che nella precedente tabella solo due su dieci hanno una frequenza superiore al 27%, non andando oltre il 28%. Abbiamo quindi un gruppo di giocatori che chiamano il challenge ripetutamente ma che non se la cavano molto bene. In media, la frequenza di utilizzo della moviola per game è dell’11.5%. Fognini è 2.3 deviazioni standard sopra la media. Anche Borna Coric e Paire sono ben fuori dalla norma.

Ho isolato i giocatori sulla base di due criteri: a) una frequenza di successo inferiore al 27% e b) una frequenza di ricorso al challenge maggiore dell’11.5% a game. Mi sono poi chiesto: cosa succede se questi giocatori che usano molto il challenge e non sono bravi nella chiamata frenano l’istinto del challenge per rientrare nella media dell’11.5%? Prima di mostrare i risultati, non dimentichiamo che una chiamata fallita non comporta la perdita del punto. Il punto è già perso (o qualsiasi sia la casistica che ha portato alla chiamata, come ad esempio se una prima di servizio era valida). Quindi lo svantaggio derivante da un eccessivo utilizzo è — sono convinto — inferiore all’opportunità persa di fronte a un sotto utilizzo.

Le conseguenze del challenge

Possono esserci conseguenze intangibili, sia positive che negative, legate all’eccessivo utilizzo. Un challenge inutile o incauto rischia di alterare la concentrazione. Sembra essere questo un aspetto di maggiore preoccupazione per giocatori come Fognini o Paire, la cui concentrazione è erratica di partenza. E sembra allo stesso tempo che abbiano già perso concentrazione e che quindi usino spesso il challenge, o trainati dalla frustrazione o per una specie di pausa di recupero dell’equilibrio emotivo. Quest’ultimo è un esempio di beneficio intangibile quando si usa di più il challenge. Un altro è dato dalla possibilità di spezzare il ritmo dell’avversario. Se è così per la “strategia dei lacci”, non sarebbe sorprendente se Tsitsipas cercasse di fare lo stesso con il challenge.

L’immagine 4 riepiloga i primi dieci giocatori per “challenge sprecati”. Si ottengono dalla differenza tra la frequenza di challenge del giocatore e la frequenza media, moltiplicata per il numero di game giocati su campi dotati di moviola, e poi moltiplicata per l’inverso della frequenza di successo (dopo tutto, riescono a vincere qualche challenge quando lo usano troppo). Ha più senso prendere in considerazione la frequenza di chiamata del challenge, perché è di fatto l’unico dettaglio che sono in grado di controllare. Ci potremmo chiedere cosa succederebbe se fossero semplicemente più bravi a indovinare la chiamata. Ma come fanno a migliorarsi? È una cosa su cui ci si può allenare?

IMMAGINE 4 – Primi dieci giocatori per challenge sprecati

Non ci sono cambiamenti rilevanti dall’elenco dei giocatori a cui piace chiamare il challenge, ma c’è un altro ordine e dei nuovi nomi nella parte bassa. Non penso che il numero dei challenge sprecati abbia grande significato di per sé, visto che non sono punti effettivamente persi, ma sembra indicare che Tsitsipas, Coric e Paire sono i meno efficienti se si tratta di vincere la chiamata e non di alterare il flusso della partita, riprendere fiato, e così via.

L’avidità va bene

È ora il momento del gruppo opposto. Ho isolato i giocatori sulla base di due criteri: a) una frequenza di successo superiore al 27.0% e b) una frequenza di ricorso al challenge inferiore all’11.5% a game. Mi sono poi chiesto: cosa succede se questi giocatori che usano poco il challenge ma sono bravi nella chiamata si rivolgono alla moviola più spesso? Ho usato due frequenze più alte, una pari alla media dell’11.5% e l’altra al 14.6%, cioè una deviazione standard sopra la media.

Perché provare con una frequenza più alta della media come il 14.6%? La mia ipotesi è che, in media per ogni 100 game, ci sono molte chiamate al limite da parte dei giudici che potrebbero essere legittimamente verificate con il challenge, e che non c’è uno specifico giocatore con più chiamate al limite di altri. Con parole diverse, se sei davvero bravo a vincere il challenge, perché aumentare la frequenza di utilizzo solo fino alla media del circuito? Perché non spingersi oltre se ci sono chiamate aggiuntive veramente verificabili con il challenge? Con “veramente verificabili” non intendo l’utilizzo della moviola fine a sé stesso, che ridurrebbe la frequenza di successo.

Il sotto utilizzo potrebbe fare la differenza in partita. Anzi, se ci sono più chiamate veramente verificabili per questi giocatori, non ricorrere al challenge equivale a concedere punti all’avversario (o in alcuni casi a non rigiocare il punto).

Le opportunità perse

L’immagine 5 mostra le opportunità perse (OP) con la frequenza media dell’11.5% e la frequenza di una deviazione standard sopra la media. Le opportunità perse di un giocatore sono date dalla differenza tra la frequenza di challenge e la frequenza media (o una deviazione standard o DS), moltiplicata per il numero di game giocati su campi dotati di moviola, e poi moltiplicata per la frequenza di successo (cioè il numero di queste verifiche addizionali che vincerebbero se, usando di più il challenge, mantenessero la frequenza di successo). Ho esteso il raggio d’azione ai primi quindici perché filtrando per una delle due ultime colonne verrebbero esclusi giocatori che invece rientrerebbero se si filtrasse per l’altra colonna.

IMMAGINE 5 – Primi quindici giocatori per opportunità perse

Sembra proprio che Nadal debba chiamare più spesso il challenge. Se lo usasse con una frequenza del 14.6% invece del 9.2%, avrebbe vinto (teoricamente) 13 punti in più nel 2019 su campi con la moviola. Forse non sono punti che servirebbero molto a Nadal, ma scommetto che Miomir Kecmanovic non disdegnerebbe i 18 in più che gli arriverebbero. Però, più che “dovrebbe usare il challenge più spesso”, dovrebbe essere “potrebbe usare il challenge più spesso con successo”. È possibile che Nadal sia un sotto utilizzatore intenzionale. Non passa inosservata la presenza nell’elenco di giocatori d’esperienza come Nadal, Novak Djokovic, Milos Raonic, Kei Nishikori e Roger Federer [1], che non cercano spesso il challenge per non interrompere il ritmo della partita o la loro concentrazione. Ci sono anche Gael Monfils, Francis Tiafoe e Jo-Wilfried Tsonga, giocatori dal grande servizio a cui piace giocare veloce e che non amano essere interrotti nel flusso della battuta. Per questo tipo di giocatori i punti eventualmente acquisiti con più challenge potrebbero essere compensati, o persi, dall’alterazione dei ritmi di gioco.

Avrete sicuramente notato che quasi la metà dei giocatori che fanno poco uso del challenge è entrata tra i primi 10 almeno una volta e ha monopolizzato le finali Slam di recente memoria.

Note:

[1] Due volte in settimana, prima durante una diretta televisiva e poi su Twitter, un commentatore/giornalista ha dichiarato con enfasi che Federer non ci prende mai con il challenge. È un luogo comune ormai noto, anche se è un po’ strano sentirlo due volte per un torneo in cui Federer è assente. Sfortunatamente, non potrebbe essere più lontano dalla verità. Come si vede dalla tabella, anche se non è al livello di Nadal, Federer è comunque sopra la media del circuito per frequenza di successo e nemmeno nelle ultime posizioni.

Which ATP Players Could Be More Efficient With Their Challenges?