Quantità di gioco e probabilità di vittoria all’avvio della seconda settimana di uno Slam

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 17 febbraio 2020 – Traduzione di Edoardo Salvati

Per raggiungere i quarti di finale agli Australian Open 2020, Dominic Thiem è rimasto in campo per 10 ore e 23 minuti, entrando così nel 20% di tempo più lungo prima di un quarto di finale di uno Slam negli ultimi dieci anni. Nei turni successivi ha accumulato altre ore di gioco, ponendosi all’estremo della distribuzione di questo speciale conteggio.

Nell’analisi che segue, cerco quindi di capire se l’intensità del percorso di Thiem ha contribuito a ridurre la sua probabilità di vittoria del titolo. Pochi giocatori riescono ad arrivare in fondo a uno Slam senza subire affaticamento, ma per alcuni la strada diventa molto più tortuosa.

Le fatiche di Thiem

Negli ultimi tre turni degli Australian Open 2020, Thiem si è trovato proprio in questa situazione. Alla vigilia della sua difficile partita contro Rafael Nadal, il tempo di gioco di Thiem era superiore di 1.3 ore rispetto alla media degli ultimi dieci anni tra i giocatori in un quarto di finale di uno Slam, come rappresentato nell’immagine 1. Alla conclusione della vittoriosa battaglia contro Nadal in quattro set, tra cui tre tiebreak, Thiem era a 14.6 ore, cioè 3.4 ore in più della media.

Un’altra vittoria in quattro set, in semifinale contro Alexander Zverev, ha portato il totale a 18.2 ore, o a 4.5 ore in più della media degli altri semifinalisti di uno Slam. Thiem si è ritrovato nel 3% del monte ore di gioco delle partite che precedono la finale, una posizione non certamente invidiabile contro il sette volte vincitore degli Australian Open Novak Djokovic, il quale invece aveva impiegato solo 12.5 ore.

IMMAGINE 1 – Distribuzione delle ore giocate prima degli ultimi turni di uno Slam maschile nel periodo dal 2011 al 2020. La linea rossa indica il tempo giocato da Thiem agli Australian Open 2020

Possibili conseguenze sull’esito della finale?

Proviamo a elaborare qualche idea con l’esempio fornito da altri giocatori che hanno avuto un percorso accidentato per entrare nella seconda settimana di uno Slam. La tabella a conclusione dell’articolo raccoglie alcune di queste situazioni, tra cui quella di Thiem. Il carico di gioco di Thiem agli Australian Open 2020 è simile a quello di Kevin Anderson a Wimbledon 2019 e di Nadal agli Australian Open 2017. Nessuno di questi giocatori è poi riuscito a vincere il torneo.

Sono però solo degli esempi. E anche se ci fossero molti esempi a mostrare analoga tendenza, staremmo ignorando un interrogativo di fondo. È un grande carico di gioco a contribuire alle sconfitte, o il grande carico di gioco è semplicemente un effetto collaterale di non essere un favorito?

Vogliamo sapere se la grande quantità di gioco incide sul risultato di una partita dopo aver tenuto conto della differenza di bravura tra due giocatori che si scontrano in un qualsiasi turno di uno Slam. Nel linguaggio della regressione, se wij è la probabilità che il giocatore i batte il giocatore j e caricoi è la somma complessiva di gioco del giocatore i, possiamo calcolare l’effetto della quantità di gioco con la seguente formula:

logit(wij) = β0 + β1logit(pij) + β2(caricoi − caricomedio)

dove pij è la previsione di vittoria pre-partita sulla base della bravura dei giocatori e di qualsiasi altro fattore a eccezione del carico di gioco sostenuto durante il torneo. Si tratta di un semplice modello di regressione logistica, in cui la difficoltà maggiore è la scelta di pij, che potrebbe essere data ad esempio dalle quote scommesse. In questo caso utilizzo le mie valutazioni dei giocatori.

Variazioni attese nella probabilità di vittoria

Con gli ultimi dieci anni di quarti di finale e turni successivi a disposizione, ho applicato il modello e osservato la variazione attesa nella probabilità di vittoria di Thiem in ciascuno dei tre turni conclusivi degli Australian Open 2020. La tendenza storica suggerisce che già ai quarti di finale la probabilità di Thiem si era ridotta (un calo in media del 12%) e che la maratona con Nadal l’aveva ulteriormente abbassata. Dalla semifinale in avanti, Thiem aveva una probabilità del 30-35% inferiore rispetto a quella che un giocatore con la sua valutazione avrebbe predetto.

IMMAGINE 2 – Riduzione attesa nella probabilità di vittoria di Thiem agli Australian Open 2020 per il carico di gioco sostenuto (e con un intervallo di confidenza del 90%)

Si può avere la tentazione di ignorare questi risultati pensando che i giocatori hanno poco controllo sulla durata di una partita. Vorrebbe però dire sottostimare la capacità decisionale del giocatore sul livello di offensività da tenere in campo e su come questo incida sul tempo trascorso. Per quei giocatori la cui bravura permette di pensare oltre alla partita successiva, aumentare il livello offensivo quando si arriva a una durata media potrebbe essere una strategia importante per la vittoria finale.

Does greater competition load going into the second week of a Grand Slam hurt a player’s win chances?

Chi può spezzare il monopolio dei Grandi Tre sul tennis mondiale?

di Stephanie Kovalchik // TheConversation

Pubblicato il 19 gennaio 2020 – Traduzione di Edoardo Salvati

Una delle questioni più pungenti per l’appassionato di tennis nel 2020 è vedere se si tratterà di un altro anno dominato dai Grandi Tre, cioè i giocatori più vincenti dell’era Open in Roger Federer, Rafael Nadal e Novak Djokovic. Il loro dominio è ben espresso dai risultati ottenuti nei tornei dello Slam. Dal 2003, anno del primo Slam assoluto di Federer a Wimbledon, se ne sono disputati 68. Di questi, i Grandi Tre ne hanno vinti 55, o circa l’80% (dopo la vittoria di Djokovic agli Australian Open 2020, la percentuale è ora dell’81%, n.d.t.). Federer è al primo posto con 20 Slam, e nessuno tra gli uomini ne ha per ora vinti di più, ma Nadal (19) e Djokovic (17) sono a ridosso. L’aspetto più rimarchevole è la presenza dei Grandi Tre in cima alla classifica del tennis mondiale, nonostante un’età complessiva di 104.8 anni.

Chi tra i Next Gen ha più probabilità di successo

Anche se in molti si aspettano un altro cappotto negli Slam da parte dei Grandi Tre, il finale di stagione 2019 ha lasciato pensare che il regno di Djokovic, Nadal e Federer potrebbe essersi avviato alla sua naturale conclusione. I principali segnali sono arrivati dai risultati di un gruppo di giovani giocatori. Sette di loro, nati dopo il 1990, sono riusciti a vincere contro almeno uno dei Grandi Tre: si parla di Stefanos Tsitsipas, Alexander Zverev, Andrey Rublev, Daniil Medvedev, Dominic Thiem, Nick Kyrgios e Grigor Dimitrov. Anche Matteo Berrettini può essere citato, visto l’ingresso nei primi 8 e la presenza alle Finali di stagione, seppur ancora senza vittorie contro uno dei Grandi Tre.

Uno dei risultati già interessanti dei Next Gen è il record aggregato di 3 vittorie e 2 sconfitte contro i Grandi Tre negli Slam del 2019. Djokovic ha infatti perso contro Thiem al Roland Garros, Federer contro Dimitrov agli US Open e contro Tsitsipas agli Australian Open. Le due sconfitte sono arrivate in altrettante finali e sempre per mano di Nadal: Thiem ha perso al Roland Garros e Medvedev agli US Open. Queste stelle emergenti hanno raggiunto l’apice nell’ultima parte della stagione. Tre Next Gen hanno eliminato i Grandi Tre prima delle semifinali dello Shanghai Masters, solo l’undicesima volta sui 72 Master giocati dal 2011. I semifinalisti a Shanghai, Thiem, Tsitsipas, Medvedev e Berrettini, erano anche i quattro più giovani delle Finali di stagione.

Fare una valutazione in termini di carriera

Vincere uno Slam è il passaggio conclusivo, e il più difficile, per la maturazione di un giocatore della Next Gen. Potrebbe il 2020 rappresentare l’anno della svolta per uno di loro? E chi si trova nella posizione migliore? Un’indicazione arriva dal percorso che ciascuno dei Grandi Tre ha compiuto prima di conquistare uno Slam. Possiamo in questo modo vedere quali dei nuovi campioni sta seguendo una direzione simile.

Le valutazioni dei giocatori, una misura statistica della bravura di un giocatore in qualsiasi momento, sono un ottimo strumento per tracciare l’andamento di una carriera perché sono aggiornate dopo ogni nuovo risultato e corrette per il livello dell’avversario, così da rendere possibile confronti tra generazioni. Attualmente, la maggior parte dei primi 100 ha una valutazione tra i 2000 e i 2300 punti, anche se i Grandi Tre sono decisamente distaccati dagli altri, con valutazioni tra i 2560 e i 2670 punti. All’inizio degli Australian Open, Djokovic aveva la valutazione più alta, anche grazie alla vittoria nell’ATP Cup.

C’è anche qualche elemento in comune

Costruendo un grafico delle valutazioni dei Grandi Tre dall’età di 18 anni fino alla vittoria del primo Slam, possiamo osservare i diversi percorsi intrapresi rispetto a quanto sanno facendo i giocatori della Next Gen (rappresentati dalle linee blu nell’immagine 1).

Nadal è esploso con il primo Roland Garros nel 2005, non avendo ancora compiuto i 19 anni. L’ascesa di Djokovic è stata la seconda più rapida, con il primo Slam agli Australian Open 2008 ad appena 20 anni. Federer è quello ad aver impiegato più tempo, con la vittoria a Wimbledon nel 2003 a due mesi dai 22 anni. Nonostante queste differenze, ci sono alcuni elementi che hanno accomunato le valutazioni dei Grandi Tre nell’avvicinamento al primo Slam. Sei mesi prima della vittoria infatti, avevano una valutazione tra i 2000 e i 2200 punti, cui ha seguito un aumento in quell’intervallo temporale di almeno 100 punti.

IMMAGINE 1 – Confronto tra valutazioni dei Next Gen e valutazioni dei Grandi Tre dal compimento dei 18 anni fino alla vittoria nel primo Slam

Quali sono tra i giovani i più promettenti per il grande salto?

Studiando le stesse traiettorie per i giocatori più promettenti tra quelli nati negli anni ’90, troviamo che tre di loro, Dimitrov, Kyrgios e Thiem, hanno già superato l’età alla quale i Grandi Tre hanno vinto il primo Slam. Tsitsipas e Rublev invece sono gli unici del gruppo ad avere ancora una possibilità di replicare la progressione di uno dei Grandi Tre. L’andamento della valutazione di Tsitsipas è più simile a quello di Djokovic, mentre quello di Rublev segue da vicino, almeno per ora, quello di Federer. Medvedev e Thiem hanno impiegato più tempo per avvicinarsi ai risultati dei Grandi Tre negli Slam, ma un’impennata nella traiettoria della loro valutazione indica che un risultato eclatante potrebbe essere imminente (Thiem ha sfiorato la prima vittoria di uno Slam arrivando in finale agli Australian Open 2020, dopo aver battuto Nadal nei quarti, n.d.t.)

Medvedev

Questo vale specialmente per Medvedev che è il più giovane dei due. Dopo che la sua valutazione si è stabilizzata all’età di 21 anni, come nel caso di Federer, Medvedev è riuscito ad accumulare centinaia di punti in breve tempo, raggiungendo anche la finale degli US Open 2019. Al momento è molto vicino ai 2500 punti, una valutazione simile a quella di Nadal e Djokovic quando hanno vinto il loro primo Slam. La traiettoria della sua valutazione sembra far pensare che la vittoria del primo Slam sia questione di poco tempo (Medvedev ha perso però contro Stanislas Wawrinka agli ottavi a Melbourne, e non può essere considerato il favorito per il Roland Garros, n.d.t.).

Thiem

È uno scenario che si applica anche a Thiem, l’unico altro giocatore tra i primi 8 con una valutazione superiore a 2400 punti. Il suo percorso relativamente più lungo verso il primo titolo Slam potrebbe essere dovuto anche al fatto di essersi trovato a giocare nella stessa epoca di Nadal, l’indiscusso “Re della Terra Battuta”. Their, che è uno specialista della terra, ha perso due finali a Parigi proprio contro Nadal nel 2018 e 2019.

Rublev e Berrettini

Solo di recente Rublev e Berrettini hanno superato la valutazione di 2250 punti, e la loro ascesa recente sorprende per velocità (Rublev ha però perso negli ottavi di finale agli Australian Open 2020 e Berrettini al secondo turno, n.d.t.). Fino a 21 anni, il percorso di Zverev e Kyrgios ha seguito in parallelo quello di Djokovic. Successivamente però, i risultati hanno subito una battuta d’arresto e la speranza di vittoria del primo Slam nel 2020 si è affievolita (in Australia, Zverev è riuscito a giocare per la prima volta una semifinale Slam, mentre Kyrgios ha perso contro Nadal negli ottavi, n.d.t.).

Naturalmente, non esistono percorsi di carriera identici, quindi per principio non si può escludere nessuno dei giocatori della Next Gen da grandezza futura. Se la storia è d’insegnamento, c’è ragione di attendersi un rendimento da vittoria di primo Slam nella stagione in corso anche da Tsitsipas, Medvevdev, Rublev e Berrettini.

Who can break up the ‘Big 3’ monopoly on men’s tennis? Here’s what the numbers say

L’effetto numero 1 o come il successo di Barty potrebbe scuotere il tennis femminile australiano

di Stephanie Kovalchik // TheConversation

Pubblicato il 3 febbraio 2020 – Traduzione di Edoardo Salvati

La vittoria di Sofia Kenin nella semifinale degli Australian Open 2020 ai danni di Ashleigh Barty ha certamente deluso le aspettative dei tifosi australiani. Dopo le premature sconfitte di Serena Williams e Naomi Osaka, le quote davano Barty come favorita. Kenin ha invece battuto anche Garbine Muguruza in finale per vincere il suo primo Slam ad appena 21 anni.

Distratti dall’importanza della conquista di uno Slam, è facile perdere di vista le esternalità positive del rendimento di una giocatrice sulla possibile crescita dello sport nei singoli paesi. Studi hanno concluso che quando una professionista raggiunge il vertice della classifica dominando per lunghi periodi, segue spesso uno sviluppo di talento tennistico nel suo paese di origine. Questo induce a pensare che il movimento femminile australiano potrebbe beneficiare nei prossimi anni della ribalta sulla scena di nuove giocatrici che cercano di replicare i successi di Barty.

Le numero 1 degli ultimi 35 anni

I risultati ottenuti da Barty lo scorso anno sono ragguardevoli, soprattutto considerando che la competizione tra le migliori sembra diventare sempre più intensa con il passare del tempo. Nel corso della sua esplosiva stagione 2019, è stata una presenza schiacciante, vincendo 57 partite su 70 e quattro tornei tra cui il suo primo Slam al Roland Garros e le Finali di stagione in Cina. È inoltre diventata la numero 1 mondiale, la prima australiana a riuscirci da Evonne Goolagong 43 anni fa. Anche dopo la sconfitta in semifinale, il margine su Karolina Pliskova, seconda in classifica, è abbondante.

Negli ultimi 35 anni, hanno raggiunto il primo posto della classifica 25 giocatrici da 14 paesi. Dal 1985 al 2005, il tennis femminile è stato appannaggio degli Stati Uniti, con sette diverse giocatrici che si sono alternate al numero 1. Il Belgio ne ha prodotte due, Francia, Germania, Spagna, Russia e Svizzera una a testa. Dal 2010, 11 giocatrici di 11 paesi hanno raggiunto il numero 1 (anche facilitate dagli alti e bassi della carriera di Williams).

IMMAGINE 1 – Sequenza delle giocatrici al numero 1 della classifica dal 1984

Grazie a giocatrici come Barty, la giapponese Osaka e la rumena Simona Halep, mai come prima la recente diversità al vertice del tennis femminile ha creato modelli emulativi per le aspiranti future professioniste di tutto il mondo. E il passato suggerisce che questo fattore è fondamentale per lo sviluppo del tennis nei paesi più piccoli (come il Belgio e la Serbia ad esempio) che mancano tradizionalmente di un seguito diffuso quanto quello di altri sport, e per il consolidamento di future generazioni di giocatrici in paesi con in cui il tennis è da sempre più radicato (come gli Stati Uniti, l’Australia e alcune nazioni europee).

Come le numero 1 hanno ispirato altre giocatrici nel mondo

Analizzando i sei paesi che, al di fuori degli Stati Uniti, hanno avuto una o più giocatrici al numero 1 dal 1990 al 2010 (in giallo nell’immagine 2), osserviamo diverse incoraggianti tendenze. In primo luogo, si assiste a un aumento delle giocatrici di un paese tra le prime 150 in coincidenza dell’ascesa al vertice di una connazionale o negli anni immediatamente successivi.

Belgio, Russia e Svizzera

In Belgio ad esempio, poco dopo il numero 1 di Kim Clijsters e Justine Henin nei primi anni 2000, altre giocatrici come Yanina Wickmayer e Kirsten Flipkens iniziarono a risalire la classifica. Il periodo di Maria Sharapova al numero 1 dalla seconda metà del 2000 coincise con ottimi risultati da parte delle compatriote Elena Dementieva e Vera Zvonareva e, ancora di più, Dinara Safina, anche lei numero 1 nel 2009.

Anche all’incredibile carriera di Martina Hingis fece seguito lo sviluppo di altre giocatrici svizzere, tra cui l’attuale numero 7 Belinda Bencic, che è stata pure allenata dalla madre di Hingis.

IMMAGINE 2 – Numero di giocatrici tra le prime 150 e le prime 30 per sei paesi con una giocatrice al numero 1 del mondo (il cui periodo è evidenziato in giallo)

Germania e Spagna

Si può anche vedere che due recenti numeri 1, la tedesca Angelique Kerber e la spagnola Muguruza, hanno guadagnato quella posizione quasi esattamente a distanza di 15 anni dall’ultima connazionale. Kerber ha seguito le orme di Steffi Graf, mentre Muguruza è stata preceduta da Arantxa Sanchez.

Stati Uniti

Negli Stati Uniti, molte giocatrici afro-americane, tra cui la quindicenne Cori Gauff, hanno fatto riferimento al successo delle sorelle Williams come motivazione maggiore nella decisione di intraprendere da giovanissime un percorso nel tennis. La pletora di giocatrici afro-americane tra le prime 150 è indicazione della capacità persuasiva dei risultati di Serena e Venus Williams su atlete come Madison Keys, Sloane Stephens, Gauff, Taylor Townsend, Whitney Osuigwe e Sachia Vickery.

Le ricadute positive generate dall’effetto numero 1

In qualsiasi sport, lo sviluppo di talenti in grado di competere ai livelli più alti è un processo complesso che richiede l’allineamento di molteplici fattori, dalla bravura di base delle giocatrici all’appoggio delle famiglie, della comunità, degli allenatori e delle federazioni nazionali.

Anche se il successo delle giocatrici di vertice è solo una variabile dell’equazione, è inserito in un concetto economico ben noto, quello della teoria della goccia (o trickle-down). Applicata allo sport, questa teoria postula che i risultati delle migliori possono arrivare a rappresentare una fonte motivazionale enorme per la base del movimento e spingere più persone a intraprendere quello sport. Nel tennis, l’andamento storico delle statistiche relative alla classifica mostra un chiaro effetto goccia generato dalle giocatrici che ottengono il primo posto, specialmente in quei paesi che non hanno mai avuto o non hanno avuto da decenni una giocatrice al vertice.

Quello che non emerge dalle statistiche è quanto la personalità e l’esempio di una numero 1 incide sullo sviluppo e sulla crescita delle giovanissime connazionali. Se nelle due settimane degli Australian Open si è avuto modo di conoscere meglio Barty, ci si è accorti che il suo gioco è solo parte della sua unicità. Simpatia e forza d’animo di fronte a trionfi e sconfitte la rendono universalmente apprezzabile e ne fanno ulteriore riferimento motivazionale per le giocatrici più giovani. Poche altre si sono probabilmente trovate in una posizione d’influenza così preminente e duratura per il loro paese e nel loro sport.

The No. 1 effect: why Ash Barty’s success could lead to a boom in women’s tennis in Australia

Un’analisi dell’efficacia del sistema di teste di serie

di Peter Ellis // FreeRangeStatistics

Pubblicato il 26 gennaio 2020 – Traduzione di Edoardo Salvati

Ispirato dagli Australian Open 2020, ho deciso di indagare in che modo il sistema di teste di serie e la distribuzione dei giocatori nel tabellone principale incidono sul risultato finale di un torneo. Probabilmente ritornerò sull’argomento, ma l’obiettivo odierno è di analizzare l’impatto dell’assegnazione delle teste di serie sulla probabilità per i più forti di vincere, arrivare in finale, in semifinale o nei quarti di finale.

Metto a confronto i risultati di simulazioni di tornei a eliminazione diretta tra questi giocatori in due tipologie di scenari, da un lato un posizionamento del tutto casuale nel tabellone in assenza di teste di serie, dall’altro l’introduzione di 32 teste di serie come accade nei tornei dello Slam.

L’immagine 1 mostra che la scelta della metodologia determina conseguenze differenti: l’adozione delle teste di serie comporta un aumento concreto della probabilità del migliore di vincere o dei due più forti di arrivare in finale, e ha rilevanza ancora maggiore ai fini della determinazione delle semifinali e dei quarti di finale.

IMMAGINE 1 – Impatto del sistema a teste di serie sul risultato che i migliori possono raggiungere

Distribuzione della bravura dei giocatori

Questo significa che, ad esempio, con 32 giocatori che ricevono una posizione speciale in tabellone grazie alla testa di serie, esiste una probabilità del 22% che in semifinale arriveranno i migliori quattro, rispetto una probabilità di solo il 2% con un tabellone casuale. In una assegnazione casuale, la probabilità di vedere i migliori otto nei quarti di finale è di fatto prossima allo zero, mentre in un tabellone con teste di serie succederà il 3% delle volte (che non è comunque molto spesso, aspetto che però non dovrebbe destare stupore tra coloro che seguono il tennis regolarmente). Di contro, la probabilità che le prime due teste di serie siano in finale è del 42% in un tabellone con teste di serie e solo del 20% in uno casuale.

Va sottolineato che questi risultati dipenderanno dalla distribuzione della bravura dei giocatori nello specifico torneo. All’estremo, se il più forte è in grado di dominare tutti gli altri, la presenza delle teste di serie non farà alcuna differenza per la vittoria finale.

Valori teorici di riferimento

Possiamo calcolare altri valori teorici come limiti di riferimento. Ad esempio, se i primi due giocatori fossero effettivamente invincibili contro chiunque tranne che l’altro, si incontrerebbero in finale il 100% delle volte in un tabellone con teste di serie e il 50% delle volte in un tabellone casuale. Qualsiasi valore inferiore (il 42% e il 20% nel nostro caso) identifica il divario tra un livello “decisamente” alto di questi due giocatori nei confronti degli altri e un livello “infinitamente” alto.

Stephanie Kovalchik ha scritto sulle conseguenze dell’ipotesi di riduzione da 32 a 16 teste di serie negli Slam (che non ha poi avuto seguito), in cui ha mostrato che i risultati sarebbero stati meno esatti rispetto a un sistema a 32 teste di serie, dove per esatto s’intende il raggiungimento del turno atteso da parte del giocatore in funzione della sua classifica.

Serie storica di risultati

Per procedere con l’analisi, ho utilizzato dati sulla bravura effettiva relativa dei giocatori ottenuti grazie al pacchetto {deuce} R codificato da Kovalchik. Mi serviva un intervallo realistico di valori sulla bravura che potessero essere applicati a scontri diretti come in un torneo reale. Ho scelto di concentrarmi su un preciso momento temporale invece di una sfida tra ere che, per esempio, avrebbe messo di fronte Margaret Court e Serena Williams. Onde evitare confusione con l’attualità, ho scelto la stagione femminile del 1990. L’immagine 2 riepiloga le prime 10 a fine 1990 sulla base della loro valutazione Elo.

IMMAGINE 2 – Prime 10 giocatrici per valutazione Elo a fine 1990

Tramite dati raccolti da Jeff Sackmann, Kovalchik fornisce le valutazioni Elo per ciascuna giocatrice per specifico momento temporale. Avevo già parlato di Elo in merito al Backgammon e al calcio australiano. Si tratta di un metodo molto efficace per fare valutazioni di giocatori rispetto all’effettivo rendimento, con il grande vantaggio di poterne derivare probabilità per un qualsiasi ipotetico scontro diretto.

La valutazione è oggetto di aggiustamenti incrementali in funzione della rispondenza tra situazione effettiva e probabilità derivate dalle valutazione Elo alla vigilia della partita. Questo ne fa un’indice utile e con capacità di correzione automatica, e facilmente integrabile in un modello statistico.

Per essere sicuro della corretta conversione delle valutazioni Elo di Kovalchik in probabilità, mi affido alla sua funzione elo_prediction() per la stima della probabilità di vittoria in ciascun accoppiamento. L’immagine 3 illustra mostra la probabilità di battere Steffi Graf da parte di una selezione di giocatrici classificate tra la posizione 2 e la 128 in termini di valutazioni Elo (Graf che, dall’inizio dell’era Open, è la giocatrice che la più alta valutazione assoluta).

IMMAGINE 3 – Probabilità di alcune tra le prime 128 di battere Graf alla fine del 1990

La simulazione dei tabelloni e risultati

Per completare la laboriosa attività di simulazione di tornei tra queste 128 giocatrici, ho scritto una funzione simulate_tournament() il cui principale argomento è una struttura dati di 128 righe di fila che rappresentano il tabellone, come nell’immagine 4.

IMMAGINE 4 – Funzione simulate_tournament()

Questo indica ad esempio che nel primo turno giocato (“round of 128”) Dianne Van Rensburg giocherà contro Carling Basset Seguso nella partita 1 (match 1). L’immagine 5 mostra il risultato filtrando per la partita 1 del secondo turno (“round of 64”)

IMMAGINE 5 – Partite del secondo turno della simulazione

Troviamo quattro giocatrici nella partita 1. Però una tra Van Resnburg e Seguso avrà perso nel primo turno, così come una tra Elna Reinach e Wiltrud Probst. Con un po’ di attenzione, l’oggetto brackets riesce a contenere l’intero tabellone principale, e può essere disegnato in modo che le prime 32 teste di serie siano allocate nei singoli quarti come richiesto da un tabellone a 32 teste di serie. Il resto del codice che ho scritto esegue questa simulazione per i due scenari di tabellone che ho individuato in precedenza.

Arriviamo ai risultati

La tabella riepiloga la distribuzione delle vincitrici. Non sorprende che Graf vinca più simulazioni di torneo di qualsiasi altra, 5454 su 10.000 con un tabellone casuale, e 5913 su 10.000 con un tabellone a 32 teste di serie. Anche in un periodo di dominio totale di Graf, ci sono comunque giocatrici (e non solo alcune tra quelle di vertice) con una probabilità di vittoria diversa da zero. Ed è questo che attrae le persone a seguire il tennis. È interessante come da Monica Seles (a quel tempo al terzo posto delle valutazioni Elo) a scendere, è più probabile che una giocatrice vinca il torneo simulato in un tabellone casuale invece che in uno con le teste di serie.

Vincitrice         Class.  No t.d.s.  32 t.d.s.
Graf               1       5454       5913
Navratilova        2       2089       2219
Seles              3       1064       1018
Sabatini           4       510        418
M.J. Fernandez     5       213        132
Martinez           7       110        66
Sanchez Vicario    6       113        63
Capriati           8       89         42
Maleeva Fragniere  9       66         34
Garrison           10      58         26 

Questo rimanda ai risultati evidenziati dal grafico dell’immagine 1 di inizio articolo. Spero presto di riprendere questa tematica e confrontare i due metodi con l’alternativa proposta da Charles Dodgson in “Lawn Tennis Tournaments. The True Method of Assigning Prizes with a Proof of the Fallacy of the Present Method”. Dodgson, che oltre a essere un matematico e logico trovò il tempo di dare vita a uno dei più importanti personaggi della letteratura inglese (in Alice nel paese delle meraviglie con lo pseudonimo di Lewis Carrol, n.d.t.), scriveva prima della diffusione del concetto di teste di serie. Propose un’alternativa al torneo a eliminazione diretta che a suo dire garantiva l’assegnazione esatta dei primi tre premi ai tre giocatori più forti. Il suo ragionamento però poggiava su una visione non probabilistica del significato di migliore. Certamente meritevole di approfondimento, ma per un’altra occasione.

Analysing the effectiveness of tennis tournament seeding

Passare un turno iniziale negli Slam senza giocare è un vantaggio?

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 24 gennaio 2020 – Traduzione di Edoardo Salvati

Grazie al ritiro pre-partita di Philipp Kohlschreiber, suo avversario di secondo turno, Stefanos Tsitsipas ha raggiunto il terzo turno degli Australian Open 2020 avendo giocato una partita in meno degli altri. Alla vigilia degli ottavi di finale, cerchiamo di capire che tipo di impatto può avere per Tsitsipas giocare una partita in meno nel primo Slam della stagione (Tsitsipas ha poi perso al terzo turno contro Milos Raonic in tre set, n.d.t.).

Se del tabellone principale maschile degli Australian Open vi appassiona il percorso delle stelle emergenti del circuito, Daniil Medvedev e Tsitsipas sono in cima alla lista dei giocatori con il potenziale per dare molto fastidio ai Grandi Tre (anche Medvedev ha poi perso agli ottavi contro Stanislas Wawrinka in cinque set, n.d.t.). In quest’ottica, ci si chiede se il passaggio del secondo turno di Tsitsipas senza aver giocato per via del ritiro di Kohlschreiber farà alcuna differenza per le fasi successive del suo cammino.

Con una probabilità di vittoria attesa dell’81%, non sarebbe stata comunque, almeno sulla carta, una partita difficile. E questo suggerisce che non serviva a Tsitsipas un ritiro per passare il turno, ma ci è certamente arrivato essendo rimasto in campo qualche ora in meno. Un carico di gioco inferiore potrà essere un beneficio o, al contrario, meno tempo trascorso in campo sarà di fatto un ostacolo?

Per trovare una risposta, sarebbe utile riuscire a identificare altri giocatori che, nelle prove Slam, hanno passato un turno iniziale per ritiro e confrontare i risultati con giocatori dello stesso livello che hanno invece dovuto giocare tutti i turni. Ci sono stati sufficienti ritiri nei turni iniziali da ottenere un campione significativo?

Quanti ritiri?

L’immagine 1 mostra la frequenza dei ritiri negli Slam negli ultimi 20 anni. Si osserva che, generalmente, sono eventi rari, con la maggior parte degli Slam senza alcun ritiro nei primi turni. Tuttavia, circa il 20% degli Slam (o uno su cinque) ha avuto, per lo stesso orizzonte, almeno un ritiro di secondo turno. Sono circa 30 casi di giocatori che, durante la prima settimana di gioco in uno Slam, hanno superato il turno per ritiro dell’avversario.

Una considerazione a margine. Vi potreste chiedere come un primo turno possa essere un ritiro. Generalmente, un lucky loser dovrebbe rimpiazzare il giocatore che si ritira al primo turno in modo da giocare la partita. Nel primo turno del Roland Garros 2007, quando Mikhail Youzhny ha superato il turno senza giocare contro Jan Hernych, il ritiro deve essere arrivato troppo tardi da consentire a un altro giocatore di prendere il posto. Di norma, primi turni con ritiri sono estremamente rari.

IMMAGINE 1 – Frequenza di ritiri pre e durante la partita per singolo turno negli Slam maschili dal 2000

Se l’effetto finale di un ritiro è una quantità minore di tempo in campo, dovremmo anche considerare di allargare il campione a quei ritiri che si sono verificati a partita da poco iniziata. Questa nuova casistica di ritiri pre-partita e durante il primo set si verifica almeno 1 volta su 4 nei primi e secondi turni degli Slam. Si triplica così il numero dei giocatori da studiare per possibili effetti di meno gioco sul risultato negli Slam.

Quali tornei hanno avuto quattro o più ritiri in alcune edizioni?

Si tratta del Roland Garros 2014, in cui quattro giocatori si sono ritirati durante il primo set dei loro primi turni. E poi Wimbledon 2013, con due ritiri pre-partita e due ritiri durante il primo set in partite di secondo turno. Una curiosità, Kenny De Schepper ha passato il turno per ritiro in quelle partite in entrambi gli Slam!

Con un campione recente di ritiri pre-partita e nel primo set agli Slam, come possiamo dire se si è trattato di un aspetto positivo o negativo? Una modalità è valutare se quei giocatori hanno fatto meglio delle attese, mediante un confronto tra le vittorie effettive in ciascuno Slam e la somma delle probabilità di vittoria per ogni turno. Se un giocatore ha più vittorie di quanto per lui atteso, questa differenza avrà valore positivo. Altrimenti, in caso di sconfitta nei turni iniziali, sarà negativa. In sostanza, è uno scarto per vittorie di partite nell’evento.

Come per gli scarti in una regressione, ci aspettiamo che la media degli scarti sia zero quando è considerata complessivamente su tutti i giocatori in uno Slam (considerando che le nostre previsioni sono certamente imparziali!). Ma in questo sottoinsieme di giocatori che passano il turno senza giocare o perché l’avversario si ritira a inizio partita non ci sono probabilmente giocatori medi. Anzi, la maggior parte ha una valutazione Elo di più di 2000 punti all’inizio del torneo. Serve quindi metterli a confronto con giocatori con valutazioni altrettanto alte.

Un confronto alla pari

Restringendo il confronto ai giocatori con almeno 2000 punti di valutazione, i grafici che seguono illustrano le risultanze dell’ampiezza tra vittorie effettive e vittorie attese per quei giocatori che hanno superato il turno per ritiro negli Slam degli ultimi venti anni.

Nonostante un campione ridotto, si osserva in media un incremento nella differenza tra vittorie effettive e attese, che corrisponde a un +0.2 partite vinte delle attese in presenza di un ritiro. Due giocatori a distinguersi in questo gruppo sono Wawrinka, con +2.4 vittorie rispetto alle attese agli Australian Open 2014, torneo vinto grazie anche al ritiro di Vasek Pospisil al terzo turno, e Grigor Dimitrov, con +2.2 vittorie rispetto alle attese nella semifinale raggiunta agli US Open 2019 con un ritiro al secondo turno di Borna Coric.

IMMAGINE 2 – Distribuzione di vittorie totali meno vittorie attese negli Slam per giocatori con valutazione di almeno 2000 punti nel periodo dal 2000 al 2019 con o senza un ritiro

Otteniamo un margine abbastanza simile anche allargando il gruppo a includere quei giocatori le cui partite non sono terminate per via del ritiro dell’avversario durante il primo set. In questo caso il guadagno medio è più vicino a +0.3 partite aggiuntive.

IMMAGINE 3 – Distribuzione di vittorie totali meno vittorie attese negli Slam per giocatori con valutazione di almeno 2000 punti nel periodo dal 2000 al 2019 con o senza un ritiro o un ritiro durante il primo set

Se il passato è di qualche indicazione, dopo il ritiro al secondo turno le aspettative riposte su Tsitsipas sono ancora più alte.

Is an Early Walkover an Advantage in a Slam?

La fortuna del sorteggio: Australian Open 2020 (donne)

di Chapel Heel // HiddenGameOfTennis

Pubblicato il 19 gennaio 2020 – Traduzione di Edoardo Salvati

Come per gli uomini, anche per le donne ho eseguito una simulazione (con la mia variante Elo) di 100.000 configurazioni del tabellone principale, utilizzando lo stesso metodo che gli organizzatori usano per assegnare ai giocatori la loro posizione. L’ho poi confrontata con la previsione per il torneo su base Elo rispetto al tabellone effettivo.

La tabella mette a confronto la previsione effettiva del tabellone con i risultati dalle simulazioni di rimescolamento, in modo da avere alcune indicazioni sull’accessibilità del tabellone effettivo rispetto alle altre configurazioni. Tonalità di rosso (e arancione) evidenziano la sfortuna del giocatore. Al contrario, tonalità di verde rappresentano la fortuna ricevuta nel tabellone effettivo, in riferimento a un particolare turno. Il giallo simboleggia neutralità, e si può di fatto ignorare qualsiasi valore superiore o inferiore allo 0.2%.

Per una presentazione più compatta rispetto al passato, ho riportato nella tabella solo le teste di serie, e organizzato nella tabella successiva quei giocatori fuori dalle teste di serie per i quali c’è stata un’incidenza degna di nota (almeno l’1.0% di segno positivo o negativo).

Tabellone effettivo e simulato a confronto per le teste di serie

Generalmente, si vedono un po’ di tonalità di rosso e di verde nei numeri relativi ai quarti di finale, ma da li in avanti è quasi tutto giallo o sui toni dell’arancione. In questo senso la riga di Naomi Osaka appare particolarmente negativa (che ha superato il primo turno, n.d.t.), all’opposto quella di Serena Williams decisamente positiva (anche lei vincitrice al primo turno, n.d.t.). Forse è la volta buona per Williams di raggiungere il record di Slam di Margaret Court.

IMMAGINE 1 – Confronto tra tabellone effettivo e simulazioni per le teste di serie

Effetti di rilievo su una selezione di giocatrici fuori dalle teste di serie

A Maria Sharapova non era andata bene agli US Open 2019, forse in Australia la fortuna sta cercando di recuperare (ha però perso subito al primo turno, n.d.t.). Caroline Wozniacki invece non ha ricevuto nessun regalo di addio alle competizioni (ma ha superato il primo turno, n.d.t.).

IMMAGINE 2 – Effetti della casualità del sorteggio su alcune non teste di serie

Luck of the Draw: Australian Open 2020 (Women)

La fortuna del sorteggio: Australian Open 2020 (uomini)

di Chapel Heel // HiddenGameOfTennis

Pubblicato il 19 gennaio 2020 – Traduzione di Edoardo Salvati

Come d’abitudine per gli Slam, ho eseguito una simulazione (con la mia variante Elo) di 100.000 configurazioni del tabellone principale, utilizzando lo stesso metodo che gli organizzatori usano per assegnare ai giocatori la loro posizione. L’ho poi confrontata con la previsione per il torneo su base Elo rispetto al tabellone effettivo.

La tabella mette a confronto la previsione effettiva del tabellone con i risultati dalle simulazioni di rimescolamento, in modo da avere alcune indicazioni sull’accessibilità del tabellone effettivo rispetto alle altre configurazioni. Tonalità di rosso (e arancione) evidenziano la sfortuna del giocatore. Al contrario, tonalità di verde rappresentano la fortuna ricevuta nel tabellone effettivo, in riferimento a un particolare turno. Il giallo simboleggia neutralità, e si può di fatto ignorare qualsiasi valore superiore o inferiore allo 0.3%.

Per una presentazione più compatta rispetto al passato, ho riportato nella tabella solo le teste di serie, e organizzato nella tabella successiva quei giocatori fuori dalle teste di serie per i quali c’è stata un’incidenza degna di nota (almeno lo 0.5% di segno positivo o negativo).

Tabellone effettivo e simulato a confronto per le teste di serie

Rispetto a tabelloni casuali, la parte bassa del tabellone principale è più difficile di quella alta. A David Goffin non è andata proprio bene essendo finito nella sezione del giocatore più in forma del momento, Andrey Rublev, che invece è tra i più fortunati, come Matteo Berrettini. Pensavo che la testa di serie numero 8 per Berrettini fosse eccessiva, perché non mi sembra tra i primi otto favoriti, ma so che le teste di serie procedono in automatico. Comunque, ha il tabellone più fortunato tra tutte le teste di serie.

IMMAGINE 1 – Confronto tra tabellone effettivo e simulazioni per le teste di serie

Effetti di rilievo su una selezione di giocatori fuori dalle teste di serie

Kevin Anderson ha giocato abbastanza bene all’ATP Cup. Con un pò di fortuna potrebbe superare un po’ di turni, magari fino agli ottavi. I quarti di finale sembrano troppo ambiziosi. Fresco vincitore del primo torneo, Ugo Humbert non è stato ricompensato con un percorso semplice. Ma non credo farà troppa differenza perché, anche scarico di adrenalina, dovrebbe perdere da John Millman al primo turno.

IMMAGINE 2 – Effetti della casualità del sorteggio su alcune non teste di serie

Luck of the Draw: Australian Open 2020 (Men)

I favoriti agli Australian Open 2020

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 17 gennaio 2020 – Traduzione di Edoardo Salvati

Dopo aver visto le favorite per gli Australian Open 2020, a tabellone maschile completo quali sono le probabilità di vittoria dei Grandi Tre per il primo Slam dell’anno? E ci sono altri seri contendenti al titolo?

Con l’avvio delle competizioni, tutti si chiedono quale dei Grandi Tre sarà il primo a vincere uno Slam nel 2020. Sulla base delle mie valutazioni, Novak Djokovic e Rafael Nadal hanno la probabilità più alta, con un leggero margine per Djokovic dopo il solido livello di gioco mostrato durante l’ATP Cup.

I soliti noti

Djokovic ha quasi una probabilità su tre di titolo, Nadal quasi una su quattro, e la finale tra i due è l’esito più probabile. I molti appassionati di tennis che si sono entusiasmati per il secondo set della loro partita all’ATP Cup sono certamente in trepidante attesa a Melbourne per un altro episodio della saga.

La terza posizione di Roger Federer non dovrebbe rappresentare una sorpresa, almeno per i più attenti. Più sorprendente potrebbe invece essere il fatto che la distanza di Federer da Djokovic e Nadal sia così ampia, visto che entrambi hanno più del doppio della probabilità di vincere il torneo. Questo dipende solo in parte dalla valutazione attuale della forma di Federer. Dal lato di Djokovic e con giovani pericolosi come Filip Krajinovic, Hubert Hurkacz, Denis Shapovalov e Matteo Berrettini, la strada di Federer per il titolo è particolarmente in salita.

Alle spalle dei Grandi Tre, la probabilità di vittoria diminuisce vertiginosamente. Non si possono però ignorare le possibilità di un gruppo di giocatori che si sono messi in luce nel 2019, primi fra tutti Daniil Medvedev e Stefanos Tsitsipas che, pur non avendo ancora vinto uno Slam, hanno la probabilità più alta di detronizzare uno dei Grandi Tre.

Non possiamo poi dimenticare di menzionare diversi altri giovani per un risultato di prestigio. Dall’alto verso il basso troviamo Andrey Rublev, Denis Shapovalov (che però ha perso al primo turno, n.d.t.) e Berrettini. Anche Dominic Thiem e Roberto Bautista Agut rientrano tra i favoriti, ma sono convinta che i più giovani tra i possibili primi vincitori di Slam abbiano il vantaggio dell’età dalla loro parte.

Giocatore       Prob. titolo
Djokovic        29.6%
Nadal           26.9%
Federer         12.8%
Medvedev        6.9%
Tsitsipas       5.0%
Rublev          3.9%
Thiem           1.9%
Shapovalov      1.9%
Berrettini      1.3%
Bautista Agut   1.2%

La gioventù che avanza

È incredibile pensare che una probabilità cumulata di quasi il 50% per la vittoria finale tra Djokovic e Nadal sia inferiore a quella che i due avevano lo scorso anno. E non dipende da un loro calo vistoso, quanto dalla crescita degli altri, per alcuni in modo drammatico.

Lo si può osservare nell’andamento delle valutazioni dell’ultimo anno dei primi dieci favoriti. L’aspetto che più colpisce è l’incredibile ascesa dei più giovani dietro ai Grandi Tre, la maggior parte di quali ha guadagnato almeno 100 punti nel corso della passata stagione.

IMMAGINE 1 – Andamento della valutazione dei giocatori nell’ultimo anno

Se davvero esiste un vantaggio psicologico derivante dallo stato di forma, il grafico suggerisce che le aspettative su giocatori come Medvedev, Shapovalov, Berrettini e Rublev dovrebbero essere ancora più alte dell’effettiva previsione di titolo. Perché, tra i primi 10, hanno fatto siglare i miglioramenti più significativi. Anche Tsitsipas è cresciuto naturalmente, solo che un incremento stabile rende la sua evoluzione più insolita rispetto a quella degli altri appartenenti alla Next Gen.

Nonostante abbiano 105 anni insieme, i Grandi Tre continuano a sfidare la ragione e rimanere al vertice del tennis mondiale. Ancora una volta, sono loro a ottenere i favori del pronostico, ma è il primo Slam da qualche tempo a questa parte in cui la probabilità di altri giocatori per la vittoria finale non è un concetto puramente teorico.

Men’s Title Chances for the 2020 Australian Open

Le favorite agli Australian Open 2020

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 17 gennaio 2020 – Traduzione di Edoardo Salvati

Le speranze di una nazione saranno sulle spalle di Ashleigh Barty al via degli Australian Open 2020. Il pronostico suggerisce però che dopo quattro finali Slam consecutive perse, potrebbe essere la volta di Serena Williams.

Con la testa di serie numero uno per lo Slam di casa, Barty sarà probabilmente la giocatrice a sentire la pressione maggiore per la vittoria a Melbourne. Dovrà sfidare anche le previsioni basate su diversi sistemi di valutazione che, nonostante un tabellone teorico più abbordabile da prima della classifica, le assegnano solo una possibilità di titolo su dieci, visto che occupa il quarto posto tra le favorite. Con una probabilità su cinque, Williams non ha il trofeo assicurato, ma è comunque avanti rispetto alle altre contendenti. Queste previsioni non tengono però in considerazione il possibile “effetto finale” che sembra aver colpito Williams, che appunto non ha più vinto uno Slam dagli Australian Open 2017, e dopo aver avuto una figlia.

Serena e poi le altre

La forma di Williams è cresciuta di Slam in Slam, con dimostrazioni di potenza fino alla finale di Wimbledon e degli US Open. Ha inoltre vinto il suo torneo di preparazione a Auckland, un’altra iniezione di fiducia alla vigilia del primo Slam dell’anno. Potremmo assistere a una possibile sfida tra Barty e Williams in semifinale, l’ostacolo più duro per Barty per l’eventuale titolo. La testa di serie numero 8 assegnata a Williams ne sottostima il livello di forma, e la mette in rotta di collisione nei quarti di finale con Naomi Osaka, contro cui ha giocato l’ultima volta nella controversa finale degli US Open 2018.

Karolina Pliskova, anche lei non esente da polemiche, potrebbe essere la giocatrice tra le prime quattro favorite a passare meno osservata. Il fatto però di ritrovarsi dalla parte opposta del tabellone rispetto alle altre tre le ha sicuramente offerto la dose più alta di fortuna.

Giocatrice       Prob. titolo
S. Williams      20.4%
Osaka            13.7%
Kar. Pliskova    11.6%
Barty            9.9%
Sabalenka        4.5%
Halep            4.3%
Keys             4.3%
Kvitova          3.7%
Svitolina        3.7%
Bertens          3.0%

Ci siamo abituati a pensare che, sul circuito femminile, la competizione è così serrata da garantire possibilità di vittoria a chiunque in qualunque torneo. Anche se, rispetto a quanto succede per gli uomini, la probabilità di vittoria si distribuisce in modo più uniforme tra le giocatrici, è interessante vedere quanto abbiano oscillato le loro valutazioni nell’ultimo anno. Per le favorite all’inizio degli Australian Open 2020, si è trattato di un anno movimentato. Williams si è migliorata più di tutte, avendo aggiunto 200 punti alla valutazione del 2019.

Pericolose inversioni di forma

Per le altre, l’andamento più tipico è consistito in una curva piatta nella parte iniziale della stagione, seguita da un incremento deciso a partire da agosto. Barty, Simona Halep ed Elina Svitolina sono le uniche del gruppo ad affacciarsi al primo Slam con una chiara inversione negativa di forma.

IMMAGINE 1 – Andamento della valutazione delle giocatrici nell’ultimo anno

Williams gode dei favori delle statistiche e del livello di gioco più alto dopo la maternità. Se i riflettori puntati su Barty l’aiuteranno a superare la pressione subita nelle finali Slam che ha giocato al rientro sul circuito, potrebbe finalmente raggiungere il record di Margaret Court proprio in Australia.

Women’s Title Chances for the 2020 Australian Open

Nadal nelle retrovie

di Chapel Heel // HiddenGameOfTennis

Pubblicato il 10 gennaio 2020 – Traduzione di Edoardo Salvati

(Con aggiornamento al 12 gennaio che considera le ultime due partite di Nadal all’ATP Cup e corregge alcuni errori nelle statistiche di seconda schermata inizialmente presenti sull’app dell’ATP).

Uno degli aspetti su cui più farò attenzione per la stagione 2020 del circuito maggiore è la posizione dei giocatori alla risposta, in particolare se si sistemeranno ancora più lontano dalla linea di fondo di quanto tipicamente già accade. A qualsiasi appassionato di tennis è capitato di vedere una partita in cui il giocatore in procinto di rispondere a un servizio nel lato più vicino all’inquadratura non riesce a essere visibile perché troppo attaccato alla fine del campo. E non solo quando a servire ci sono John Isner o Ivo Karlovic.

Durante la telecronaca della partita tra Rafael Nadal e David Goffin all’ATP Cup, ho sentito Jim Courier affermare che Goffin stava traendo vantaggio dalla posizione estremamente arretrata di Nadal alla risposta grazie a un servizio più lento e angolato. È il classico gioco del gatto e del topo: il giocatore al servizio spara cannonate sulla prima di servizio, il giocatore alla risposta retrocede per avere più tempo, il primo inizia a cercare gli angoli fino a che il secondo non reagisce nuovamente con un’altra mossa. Spesso però è solo teoria, perché molti giocatori non calibrano il servizio in funzione della posizione alla risposta dell’avversario, o perché non riescono a percepirlo nella specifica fase della partita, o perché non sono così efficaci nel servire più lentamente e usare gli angoli.

Davvero i giocatori si mettono ancora più indietro?

Sembrerebbe di si. Siamo però in presenza di un comportamento consolidato o si tende a notarlo di più solo quando succede? Le statistiche di seconda schermata dell’ATP danno indicazione della posizione alla risposta per le partite che beneficiano del sistema di moviola istantanea Hawk-Eye.

Sono tre le forme principali in cui viene fornito il dato: (a) una posizione complessiva o combinata, (b) la posizione alla risposta sulla prima di servizio e (c) la posizione alla risposta sulla seconda di servizio. C’è un’ulteriore suddivisione in intervalli temporali, che induce però in confusione. Per la prima e la seconda di servizio, la seconda schermata ha la categoria “Attuale” e quella “Storico”. La prima, Attuale, fa riferimento alla posizione assunta durante la partita in corso. Non si conosce invece il periodo coperto dalla categoria Storico.

Per la posizione complessiva o combinata, ci sono quattro periodi: “Attuale”, “Storico”, “Anno in corso” e “Anno scorso”. Quest’ultimo periodo non è disponibile per alcuni tra i giocatori di bassa classifica, quindi credo che sia relativo a una determinata stagione nel caso un giocatore non abbia statistiche della stagione precedente su campi con Hawk-Eye nel tabellone principale dei tornei ATP. Possiamo inoltre supporre che con Storico non si intenda solo “la stagione passata”.

Ad esempio, Tallon Griekspoor non aveva alcuna statistica della categoria Anno scorso nelle sue due partite con statistiche di seconda schermata nel 2019, pur avendo dati della categoria Storico per una di quelle. Presumibilmente, Storico non è nemmeno “Alla data di oggi”, perché quella casistica dovrebbe rientrare nella categoria Anno in corso. I giocatori che hanno statistiche sia per Anno in corso che Storico non possiedono gli stessi numeri in entrambe, quindi c’è qualcosa di diverso.

Possibili conclusioni provvisorie

È decisamente difficile individuare una tendenza quando la variabile temporale è così vaga. Possiamo comunque provare a trarre alcune conclusioni provvisorie di carattere generico sulla base di quello che abbiamo.

Dal campione di partite del 2019 ho eliminato quelle che non hanno numeri sulla posizione alla risposta per le categorie Anno in corso e Anno scorso. Purtroppo si perde quasi il 25% dell’insieme, ma rimangono comunque quasi 1400 partite-giocatore. In media, la posizione alla risposta per la categoria Anno in corso (2019) è stata di 1.09m dietro la linea di fondo. In media, la posizione alla risposta per la categoria Anno scorso (2018) è stata di 0.85m dietro la linea di fondo.

Serve sottolineare che le statistiche di seconda schermata erano disponibili per molte meno partite del 2018, quindi qualsiasi numero basato su quei dati rischia di essere limitato dalla dimensione del campione e dalla scelta delle partite.

In altre parole, ho utilizzato i numeri della categoria Anno scorso inclusi nelle statistiche di seconda schermata per il 2019 e non le statistiche di seconda schermata effettive del 2018. Questo perché immagino che l’insieme delle statistiche di seconda schermata per il 2018, catalogate come Anno scorso nelle statistiche del 2019, siano migliori dei calcoli che posso fare sulla categoria Anno scorso utilizzando il guazzabuglio di cifre in giro su internet per il 2018.

Dai 10 ai 20 cm più indietro

Ho adottato la stessa metodologia con le partite-giocatore in possesso di numeri sulla posizione alla risposta sia per Anno in corso che per Storico. In media, la posizione alla risposta per questo insieme (circa 1600 partite-giocatore) nel 2019 è stata di 1.11m dietro la linea di fondo, mentre in media per la categoria Storico era di 1.01m dietro la linea di fondo.

Ho effettuato un’ulteriore scomposizione per posizione alla risposta sulla prima di servizio e sulla seconda. La media della categoria Attuale sulla prima per queste 1700 partite-giocatore è stata di 1.43m dietro la linea di fondo, e la media Storico sulla prima era di 1.25m. Sempre per queste circa 1700 partite-giocatore (ma non esattamente le stesse che per la prima di servizio) la media della categoria Attuale sulla seconda di servizio era di 1.08m, mentre la media Storico era di 0.90m dalla linea di fondo.

Si può in via provvisoria concludere che, complessivamente, la posizione alla risposta si è allontanata in media dalla linea di fondo di una distanza tra i 10 e i 20 cm. Più difficile dire da quando ha avuto inizio questo spostamento.

Ne fa parte anche Nadal?

Nel 2019, le statistiche di seconda schermata non riportavano dati della categoria Anno scorso per Nadal, forse perché nel 2018 non aveva giocato nessuna partita sul cemento nei tornei con Hawk-Eye e con statistiche di seconda schermata. La posizione combinata di Nadal per la categoria Attuale (2019) è stata di 3.23m dietro la linea di fondo, mentre per la Storico era di 3.15m. Sembra però che questo dipenda interamente dalla posizione sulla seconda di servizio.

Sulla prima, la posizione Attuale è stata di 3.53m contro una posizione Storico di 3.60m, a evidenziare che si è avvicinato, anche se di poco, sulla risposta alla prima di servizio, almeno nelle 27 partite del campione del 2019. Per contro, la posizione sulla seconda per la categoria Attuale è stata di 2.73m, rispetto alla categoria Storico di 2.42, una differenza importante.

Fa sorridere il fatto che, in generale, contro Goffin Nadal non stava nelle retrovie. Alla risposta sulla prima era a 1.53m dalla linea di fondo e, sulla seconda, praticamente sulla linea di fondo a 0.08m. Ma si tratta ovviamente solo di medie per la durata della partita. Quando Courier ha commentato sulla strategia di Goffin, Nadal si trovava a ben più di 1.53m dalla linea di fondo, e Goffin ha poi servito una prima lenta a uscire sul lato delle parità.

A Goffin non serviva riconoscere una tendenza, ma semplicemente osservare la posizione di Nadal per quel preciso punto e momento della partita. Perché Goffin non ha una statura da gigante, ma è molto intelligente. È per questo che penso che, se esiste una tendenza, ci si divertirà a vedere come (e se) i giocatori al servizio costringeranno quelli alla risposta a riavvicinarsi alla linea di fondo. Spero solo che non sia con un servizio sottomano.

Il senso di Nadal per l’indietreggiamento

Nell’analisi dei dati di seconda schermata, ho notato un altro aspetto, cioè l’arretramento della posizione alla risposta di Nadal con l’avanzare della partita. Per ciascuna delle 27 partite nei dati di seconda schermata del 2019, e nelle quattro dell’ATP Cup nel 2020, ho confrontato la posizione media di Nadal alla risposta da un set all’altro, e separatamente per prima e seconda di servizio. In media, risponde alla prima di servizio altri 0.25m indietro nel secondo set rispetto al primo. Per la seconda, l’esito è meno accentuato (e più variabile), appena 0.06m più indietro.

Ci sono solo 3 partite andate al terzo set delle 31 considerate, quindi è complicato trarre conclusioni definitive, ma alla risposta sulla prima di servizio nel terzo set Nadal indietreggia di altri 0.15m rispetto al secondo set, mentre sulla seconda va ancora più lontano dalla linea di fondo, spostandosi di ben 0.38m rispetto al secondo set. È un dettaglio da tenere d’occhio.

Ho costruito due grafici per illustrare il concetto. L’immagine 1 si riferisce alla posizione di Nadal sulla prima di servizio, l’immagine 2 sulla seconda. Concentriamoci per un istante solo sui triangoli. Supponiamo che l’asse delle ascisse sia la linea di fondo di un campo, e che i triangoli siano la posizione media alla risposta di Nadal in una partita.

Una rappresentazione visiva

Ogni partita è sulla linea verticale della griglia del grafico. I triangoli blu sono il primo set, i rossi il secondo e, in caso di terzo set, il triangolo è verde. In quasi tutte le partite il triangolo blu (primo set) si trova più in basso (più vicino alla linea di fondo) del triangolo rosso, anche se ho riscontrato più variazioni alla risposta sulla seconda di servizio. La variazione è rappresentata dalla linea frastagliata del grafico, che registra semplicemente la differenza tra la posizione del primo e del secondo set (ignorando il terzo). Se la linea è al di sopra dell’asse delle ascisse, Nadal si è posizionato più indietro nel secondo set di quanto abbia fatto nel primo, e vice versa.

Da ultimo, la colorazione sullo sfondo indica i diversi tornei, quindi il primo blocco mostra che le prime quattro partite sono di un torneo, il secondo che le successive cinque sono di un altro, e così via. La colorazione blu è per il cemento e quella gialla per la terra battuta. Si nota una differenza significativa, particolarmente alla risposta sulla prima, nella posizione di Nadal sul cemento rispetto a quella sulla terra.

IMMAGINE 1 – Posizione media di Nadal alla risposta sulla prima di servizio

IMMAGINE 2 – Posizione media di Nadal alla risposta sulla seconda di servizio

Non c’è un ordine preciso per i tornei, perché non sono grafici che misurano una tendenza temporale ma, se siete curiosi, da sinistra a destra la sequenza è: Indian Wells Masters, Internazionali d’Italia, Madrid Masters, Finali di stagione, Canada Masters, Masters di Parigi Bercy, Monte Carlo Masters e ATP Cup.

Rafa in Retreat