Il circuito femminile post COVID-19 sta rientrando alla normalità

di Jeff Sackmann // TennisAbstract

Pubblicato il 17 agosto 2020 – Traduzione di Edoardo Salvati

Negli ultimi due tornei femminili, abbiamo assistito a risultati attesi, oltre a qualche sorpresa. Simona Halep, la chiara favorita a Praga, ha portato a casa il titolo nonostante due partite di primo e secondo turno al terzo set. Nell’altro torneo della settimana a Lexington, le cose sono andate diversamente. Serena Williams e Aryna Sabalenka, le più forti nelle rispettive metà del tabellone, hanno raccolto insieme solo tre vittorie, con le quattro semifinaliste fuori dalle teste di serie.

In un precedente articolo ho sottolineato come Palermo, il primo torneo alla ripresa dell’interruzione, era così imprevedibile che per fare pronostici sarebbe stato meglio lanciare una moneta invece che affidarsi a valutazioni (come Elo) sulla bravura delle giocatrici aggiornate a prima della pandemia. Non è la prima volta di un evento con così tante vittorie insolite, ma è indicazione del fatto che il circuito femminile non è ancora tornato alle dinamiche di dominio più classiche.

Con Praga e Lexington abbiamo ora il triplo dei dati con cui lavorare. Inoltre, si potrebbe teorizzare una maggiore prevedibilità, seppur contenuta, per Praga visto che molte delle giocatrici erano impegnate anche a Palermo, vale a dire in possesso di fresca condizione di partita. Pur rimanendo con un campione risicato di 93 partite, ci avviciniamo a una migliore comprensione di come il tradizionale metodo previsionale operi in tempi di incertezza.

Una sequenza Brier altalenante

La statistica che uso per quantificare la prevedibilità — detta in altro modo, la validità delle valutazioni relative allo stato di forma delle giocatrici prima dell’interruzione — si chiama indice di Brier, e tiene conto sia dell’accuratezza grezza (il pronostico ha indovinato la vincitrice) che del livello di confidenza (il pronostico ha ecceduto in sicurezza, ha mancato in fiducia, o è stato semplicemente giusto). Indici di Brier complessivi per il circuito solitamente si aggirano intorno allo 0.21, mentre un valore di 0.25 indica che la previsione non era meglio di un lancio della moneta. Un punteggio più basso segnala una previsione più precisa.

La tabella riepiloga l’indice di Brier per Palermo, Lexington e Praga, insieme alla media dei tre tornei, alla media di tutti i tornei della categoria International (a prescindere dalla superficie) dal 2017 (i valori sono ottenuti sulla base delle mie valutazioni Elo). Ci potremmo aspettare un primo turno diverso, proprio perché le giocatrici sono più “arrugginite”, quindi ho calcolato anche l’indice per i primi turni (Brier R32) per ciascun torneo e le rispettive medie.

Torneo          Brier   Brier R32   
Palermo         0.268   0.295   
Lexington       0.226   0.170   
Praga           0.212   0.247   
Media rientro   0.235   0.237   
Media Intern.   0.217   0.213

Palermo fa eccezione

Come già visto, i risultati di Palermo disattendono le aspettative. Più della metà delle partite si è conclusa con una vittoria a sorpresa (stando alle mie valutazioni Elo), con un primo turno davvero difficile da pronosticare. Poi però non è durata a lungo. Il primo turno di Praga aveva un valore di 0.247, di niente superiore al lancio della moneta, ma la confusione non è andata oltre i primi due giorni. L’indice di Brier totale per il torneo è stato di 0.212, di poco meglio della media degli International. In altre parole, questo gruppo di 32 giocatrici al rientro da una pausa di diversi mesi, ha generato risultati in sostanza esattamente prevedibili come quanto ci saremmo attesi nel mezzo di una stagione regolare.

Più difficile è dare un senso ai numeri di Lexington ma, come per Praga, puntano a un mondo post COVID-19 che non è poi così surreale. Il primo turno ha replicato il copione, con un indice di Brier di 0.170. Degli ultimi 115 tornei International, solo 22 sono stati più prevedibili. L’accuratezza non ha avuto vita lunga, principalmente per la sconfitta di Serena Williams contro Shelby Rogers. Il valore per l’intero torneo è stato di 0.266, meno pronosticabile del solito, ma molto meglio di una previsione casuale e più vicino alla media del circuito di quanto non lo fosse Palermo.

Stime riviste

Sono ancora le prime fasi nel processo valutativo delle attese risposte sulle giocatrici dopo un’interruzione così lunga. Più si giocano tornei, più siamo in grado di vedere se la prevedibilità dei risultati aumenta all’aumentare del numero di partite (forse a Praga era più difficile prevedere il comportamento delle giocatrici che hanno saltato Palermo, con l’ovvia eccezione di Halep).

In questo particolare momento, può succedere qualsiasi cosa. Da un lato, potremmo tornare alle dinamiche di sempre. Dall’altro, le nuove regole che impongono il distanziamento fisico — tra cui l’assenza di pubblico, la vita serale limitata a Netflix, gli asciugamani da andarsi a prendere in autonomia, e modalità di coaching in campo differenti — potrebbero andare a detrimento di alcune e favorire altre. Se così fosse, le valutazioni Elo passeranno per un periodo inedito di aggiustamento per riflettere chi è stata abile a fiorire dopo l’interruzione.

È troppo presto per affermazioni più perentorie su un argomento così importante. Nell’ultima settimana, abbiamo visto pronostici essere palesemente errati (Palermo) o una via di mezzo (Lexington e Praga). Siamo diventati più esperti in merito a tanti cambiamenti accaduti da marzo, ma la metodologia di valutazione delle giocatrici potrebbe rimanere identica in quasi tutto e per tutto.

The Post-Covid WTA is Drifting Back to Normal

Effetti della pandemia nel torneo di Palermo?

di Jeff Sackmann // TennisAbstract

Pubblicato il 10 agosto 2020 – Traduzione di Edoardo Salvati

È più difficile fare previsioni sullo stato di forma di una giocatrice al rientro da un’interruzione che l’ha tenuta lontana da partite ufficiali per quasi sei mesi? Un ritorno del circuito femminile alla quasi normalità con il torneo di Palermo fornisce degli spunti per una possibile risposta.

In un recente articolo ho ipotizzato che fare pronostici sui risultati sarà, per un certo periodo, più complicato del solito, richiedendo degli aggiustamenti al mio algoritmo per le valutazioni Elo. Le 31 partite di tabellone principale che arrivano dalla Sicilia permettono alcune elaborazioni preliminari.

A uno sguardo veloce, i risultati sembrano un po’ strani. Solo due delle otto teste di serie sono arrivate in semifinale, ed è emersa vincitrice Fiona Ferro. Due wild card hanno raggiunto i quarti di finale. Sono circostanze chiaramente anomale per un evento del livello International? In realtà non così tanto, quindi proviamo a stabilire una linea di demarcazione.

L’imprevedibile Palermo

In termini di “prevedibilità”, il mio riferimento è l’indice di Brier, che misura l’accuratezza dei pronostici espressi in percentuale. Va bene ipotizzare una vincitrice, più importante è assegnare una corretta probabilità. Se per 100 partite si afferma che una giocatrice ha il 60% di probabilità di vittoria, dovrebbe allora vincere 60 di quelle cento partite. Se ne vince 90, non si è stati sufficientemente sicuri della sua forma; se ne vince 50, sarebbe stato meglio fare un pronostico lanciando una moneta. L’indice di Brier sintetizza questi concetti con un solo numero, che è più preciso quanto è inferiore. Approssimativamente, le mie previsioni Elo per il circuito maschile e femminile si assestano poco sopra allo 0.2.

Dal 2017 fino a marzo 2020, le 975 partite femminili terminate regolarmente in tornei sulla terra di livello International avevano un indice di Brier complessivo di 0.223. I primi turni erano leggermente più prevedibili, con un punteggio per i trentaduesimi di 0.219. Il torneo di Palermo ha avuto un andamento più altalenante. Le 31 partite di tabellone principale hanno ottenuto un indice di Brier combinato di 0.286. Di altri 32 tornei che ho considerato, solo Praga 2019 aveva un valore più alto, pari a 0.277.

Con un valore di 0.295, il primo turno è stato ancora più imprevedibile. D’altro canto, se si mette insieme un numero più ridotto di partite da uno specifico tabellone con la grande varietà di giocatrici che approdano ai primi turni, molti tornei diventano nella fase iniziale un terno al lotto. 9 tornei su 32 avevano infatti un indice di Brier per il primo turno superiore a 0.250, con quattro di questi con un valore più alto — quindi peggiore — rispetto a Palermo.

L’indice di Brier della vergogna

Ho parlato del valore di 0.250 perché è una sorta di indice di Brier della vergogna. Diciamo che si è nella situazione di prevedere l’esito di una serie di lanci di moneta. La scelta più arguta è di assegnare il 50% di probabilità a ogni lancio. Per quanto noioso come esercizio, una previsione più estrema significa poi che, metà delle volte, ci si è sbagliati ancora di più. Se si fissa la previsione al 50% per una serie di eventi casuali che hanno il 50% di probabilità di accadere, l’indice di Brier sarà…esattamente 0.250.

Un altro modo per vederla è questo: se l’indice di Brier è più alto di 0.250, sarebbe stato meglio prevedere che per ciascuna partita il vincitore aveva il 50% di probabilità di vittoria. Ogni altra previsione più elaborata era inutile.

A Palermo, 17 partite su 31 si sono risolte a favore della giocatrice che la mia formula Elo considerava sfavorita. L’indice di Brier si è piazzato dalla parte della vergogna. E anche il suggerimento del precedente articolo, in cui dicevo di fare previsioni, almeno in parte, più moderate, non ha fatto molta strada. Almeno fino a qui, la migliore strategia sarebbe stata di ignorare del tutto l’algoritmo e iniziare a lanciare la moneta.

Moderare la moderazione

Ciò detto, non sono ancora pronto a buttare via le mie valutazioni Elo (che hanno correttamente previsto la vittoria di Simona Halep a Praga, ma si sono poi sbagliate sul torneo di Lexington, vinto da Jennifer Brady invece che da Aryna Sabalenka). 31 partite sono un campione ridotto e decisamente inadeguato a valutare l’accuratezza di un sistema creato per prevedere l’esito di migliaia di partite in ogni stagione.

Come riferito, Elo ha fatto ancora peggio a Praga nel 2019 ma, siccome non era un torneo che arrivava dopo diversi mesi di interruzione del tennis mondiale, non avrei mai pensato di considerarlo più che una svista.

Questa volta, un’intera settimana di sorprese contro pronostico potrebbe essere ben più di una svista. Pensare che giocatrici e giocatori abbiano l’esatto livello di forma mostrato a marzo probabilmente non è una buona idea, anzi potrebbe essere una pessima idea. L’insieme di partite triplicherà a breve per poi espandersi oltre. Ora come ora, non sarà di aiuto nella scelta dei vincitori, ma avremo presto una rappresentazione migliore di quanto davvero è imprevedibile il tennis post COVID-19.

Did Palermo Show the Signs of a Five-Month Pandemic Layoff?

Elo ai tempi del COVID-19

di Jeff Sackmann // TennisAbstract

Pubblicato il 2 agosto 2020 – Traduzione di Edoardo Salvati

Il tennis è ripartito, ma nessuno sa bene cosa attendersi. Sarà l’imprevedibilità il nuovo paradigma? E questo sia su larga scala — gli US Open 2020 verranno martoriati dal virus? — che nelle situazioni individuali, come ad esempio quali giocatori rientreranno più forti o meno in forma di prima? Lascio agli esperti le considerazioni sul primo aspetto e mi concentro sulla stima del livello di gioco che potranno esprimere giocatori e giocatrici.

Per via delle restrizioni imposte in molti paesi, non c’è professionista che non abbia trascorso almeno cinque mesi lontano da un torneo ufficialmente organizzato dalla ATP, WTA e Federazione internazionale. Per alcuni, come chi non ha giocato nelle settimane precedenti alla chiusura totale o chi ha deciso di non giocare immediatamente alla riapertura, saranno passati sette o otto mesi prima di una partita vera. Le esibizioni hanno in parte colmato quel vuoto, ma non per tutti i giocatori. Stare fermi per metà anno senza competizioni ufficiali rappresenta una lunga interruzione. Dal punto di vista di un analista, è difficile prevedere il rendimento di un giocatore in assenza di dati dagli ultimi sei mesi.

Aumento dell’incertezza

Iniziamo dagli aspetti più evidenti. L’assenza prolungata dal circuito significa che si conosce meno dello stato di forma attuale di un giocatore di quanto non lo si facesse prima della chiusura, quando la maggior parte dei professionisti era impegnata ogni settimana o due. A marzo, le mie valutazioni Elo assegnavano a Dominic Thiem il quinto posto, con un punteggio di circa 2050, mentre David Goffin era al quindicesimo, con circa 1900 punti. Sulla base di quei numeri, in uno scontro diretto Thiem avrebbe avuto una probabilità di vittoria del 70%.

Adesso? Entrambi hanno giocato esibizioni, ma possiamo essere certi che il loro livello sia simile a quello che avevano a marzo? O che sono migliorati o peggiorati nella stessa misura? Penso sia ovvio che non possediamo le stesse certezze. Le previsioni dovrebbero quindi riflettere una diminuzione del grado di confidenza, indirizzandosi su una più candida probabilità da lancio della moneta, vale a dire sul 50%. Sei mesi di sospensione a causa del COVID-19 non sono così drastici, non significa cioè che Thiem non è più il favorito contro Goffin, ma che, rispetto al periodo precedente, il pronostico dovrebbe essere più vicino al 50% di probabilità di vittoria. Magari un 60%? 65%? O 69%? Non riesco a rispondere, almeno, non ancora.

Penalizzazione legata all’assenza (per infortunio)

Le mie valutazioni Elo scontano già una penalizzazione legata all’assenza, di cui ho parlato in questo articolo. L’idea è quella per cui se un giocatore resta lontano dal circuito molto a lungo (di solito per infortunio, ma anche per eventualità come una squalifica, una maternità o altre ragioni), al rientro mostra, nella maggior parte dei casi, un livello di gioco peggiore. È difficile però prevedere di quanto, e ogni giocatore ha un percorso diverso di ritorno alla piena forma.

Ho introdotto quindi una modifica alla formula, sulla base di due componenti:

  • una penalizzazione una tantum in funzione della lunghezza dell’assenza (maggiore la durata, più grande la penalizzazione)
  • un aumento temporaneo del valore del fattore k (l’elemento della formula che determina quanto ciascuna partita incida sulla variazione positiva o negativa del livello di gioco di un giocatore), per riflettere l’incertezza iniziale. Dopo un infortunio, il fattore k aumenta di poco di più del 50%, per poi regredire al valore tipico nell’arco delle venti successive partite.

Non è un infortunio

Fermarsi per sei mesi a causa del coronavirus non è equiparabile a un infortunio (almeno, non per quei giocatori che sono comunque riusciti ad allenarsi per aver evitato il COVID-19 o altre problematiche di salute collegate). L’algoritmo di penalizzazione per infortunio non può quindi essere applicato così come è pensato, ma se ne possono trarre due considerazioni:

  • se generiamo previsioni più vicine al 50% di probabilità abbassando la valutazione di alcuni giocatori, la penalizzazione dovrebbe essere inferiore alla penalizzazione per infortunio (normalmente, per un assenza durante la stagione di otto o nove settimane, la penalizzazione minima per infortunio è di 100 punti Elo).
  • l’aumento temporaneo del fattore k è uno strumento utile per gestire l’incertezza che si accompagna allo stato di forma di un giocatore dopo una lunga interruzione.

Il metodo della penalizzazione per assenza funziona perché è supportato dai dati. Siamo in grado di analizzare centinaia di assenze per infortunio (o per altri fattori) nella storia del tennis moderno e capire come hanno reso i giocatori al loro rientro sul circuito. I numeri che utilizzo nella formula per le valutazioni Elo si basano proprio su questo. Purtroppo però non abbiamo la stessa disponibilità per gli ultimi sei mesi, perché quello che è successo non ha precedenti.

Non la pausa di fine stagione, ma…

La situazione che più si avvicina a un blocco di sei mesi nel flusso di dati relativi al tennis è la pausa di fine stagione a dicembre. Per quanto decisamente più breve e non uguale per tutti, presenta alcune dinamiche molto simili: ci sono giocatori che si cimentano in esibizioni, altri che si riposano in spiaggia, alcuni che approfittano per guarire da infortuni, altri ancora che si allenano duramente per migliorarsi, e così via.

Verifichiamo questa teoria: le prime settimane di ogni stagione dovrebbero essere meno pronosticabili della media. Controllo: è falso! Per gli anni dal 2010 al 2019, ho assegnato un’etichetta a ogni partita rispetto a quante partite i due giocatori avevano giocato fino a quel momento della stagione. Se si trattava della prima partita per entrambi, l’etichetta era il numero 1. Se era la quindicesima per uno e la ventunesima per l’altro, il numero era la media, quindi 18. Ho poi calcolato l’indice di Brier — una misura dell’accuratezza delle previsioni — per le previsioni generate da Elo di tutte le partite con un’etichetta. Minore il valore dell’indice, migliore la previsione. Se avessi ragione, dovremmo vedere l’indice di Brier più alto per le prime partite della stagione, seguito da una diminuzione. Non è esattamente così!

IMMAGINE 1 – Indice di Brier per singola partita del circuito maschile nel periodo dal 2010 al 2019

La linea blu irregolare del grafico mostra l’indice di Brier per ogni partita con etichetta (partita 1, partita 2, partita 23, etc), mentre la linea arancione è una media mobile di cinque partite che punta a rappresentare la tendenza complessiva. Non c’è una differenza enorme durante la stagione (ed è confortante), ma la dinamica di inizio stagione è opposta alla mia ipotesi. Magari per le donne il risultato è più in linea con le mie attese?

IMMAGINE 2 – Indice di Brier per singola partita del circuito femminile nel periodo dal 2010 al 2019

Non sono fortunato nemmeno in questo caso. Anche per le donne la variazione partita per partita nell’accuratezza delle previsioni è abbastanza ridotta, e non ci sono segnali di incertezza di inizio stagione.

Ma non mi fermo qui

Anche se la mia stessa teoria non regge l’evidenza dei fatti, mi aspetto comunque di assistere, alla ripresa successiva alla pandemia, a un paio di mesi imprevedibili. I giocatori sono abituati a gestire la normale interruzione di fine stagione e generalmente efficienti nel usare al meglio il tempo libero. E poi sono due mesi e non cinque o sette. Inoltre, molti altri fattori richiederanno adattamento sul circuito — quantomeno per la conclusione del 2020 — come i pochi spettatori (se ce ne saranno), il protocollo di distanziamento e un calendario in continuo aggiustamento. Alcuni giocatori gestiranno la pressione meglio di altri, ma non è detto che tra questi ci siano necessariamente i più forti.

Per il momento quindi le mie valutazioni Elo terranno conto di una piccola penalizzazione, aumentando temporaneamente il fattore k (più vicino al 69% per Thiem contro Goffin, che al 60%). Non ho ancora finito di scrivere il codice completo, principalmente perché devo considerare due diversi tipi di assenze, COVID-19 da una parte e i canonici infortuni dall’altra, ed è più complesso. Per chi è più interessato, farò qualche modifica prima dell’inizio previsto per il Cincinnati Masters

C’è una risposta giusta

Non ci sono dubbi da queste parole che il mio tentativo di sistemare le valutazioni Elo in modo da riflettere l’interruzione dovuta al COVID-19 procede un po’ al buio. Ma non sarà sempre così! Verso la fine dell’anno, conosceremo la risposta, cioè quanta imprevedibilità avrà caratterizzato i risultati delle prime partite al rientro dalla chiusura. Così come sono riuscito a calcolare gli aggiustamenti da apportare per penalizzazioni e fattore k grazie ai dati storici, potrò fare la stessa cosa per i risultati della seconda parte del 2020.

Più precisamente, sarà possibile creare insiemi di risposte giuste, perché una correzione alla formula Elo restituirà il miglior valore dell’indice di Brier, mentre un’altra rappresenterà con più esattezza il divario tra Novak Djokovic e Rafael Nadal, e così via per i vari spunti d’indagine.
L’aggiustamento finale per la formula Elo ai tempi del COVID-19 non vi aiuterà a vincere più soldi scommettendo sul tennis, ma fornirà una maggiore comprensione di come l’interruzione ha inciso sul livello dei giocatori, e su quanto velocemente sono ritornati alla forma di inizio anno. Ne sapremo un po’ di più sul tennis, anche se la speranza assoluta è di non dover mai più fare uso di questa nuova conoscenza.

Elo, Meet COVID-19

Alcune tra le imprese più sorprendenti nella storia recente degli Slam

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 18 aprile 2020 – Traduzione di Edoardo Salvati

Con molto tempo a disposizione per indugiare nei ricordi legati al tennis, ho pensato che sarebbe stato divertente fare una classifica delle imprese più incredibili negli Slam. A questo proposito, il guadagno ottenuto dal singolo giocatore in termini di valutazione del suo livello di bravura nel corso di un torneo è utile all’identificazione di risultati a sorpresa, in questo caso dagli anni 1990 a oggi.

Effetto sorpresa

Uno degli aspetti più interessanti dei sistemi di valutazione come Elo, basati cioè sulle probabilità, è che incorporano l’effetto sorpresa. L’aggiornamento della valutazione di un giocatore segue temporalmente i suoi risultati ed è di fatto una misura ponderata della prevedibilità o imprevedibilità del risultato. Quando Kevin Anderson ha sconfitto Roger Federer a Wimbledon 2018, alla vigilia della partita aveva solo una probabilità di vittoria su cinque. Si è trattato quindi di una sorpresa che ha dato una grande spinta alla sua valutazione. I sistemi di valutazione operano questi calcoli a ogni partita e per ogni risultato, fornendo così un’istantanea dell’effetto sorpresa consultabile in qualsiasi momento.

Sono variazioni parte del processo di auto-correzione di questo tipo di sistemi di valutazione. In generale, se un sistema è efficace non si lascia sorprendere troppo spesso. Ci sono però occasioni in cui una vittoria fa saltare il banco, pensiamo ad esempio a quella di Lukas Rosol contro Rafael Nadal a Wimbledon 2012. Non capita di frequente di assistere a vittorie a sorpresa di fila perché, se succede, significa che probabilmente si è verificato qualcosa di straordinario.

Possiamo provare a isolare quelle occasioni osservando il guadagno complessivo di punti validi per le valutazioni in un torneo (secondo il mio sistema di valutazioni Elo), dalla prima all’ultima partita giocata. Con le mie valutazioni storiche, che attualmente tornano indietro fino al 1990 per gli uomini e al 1997 per le donne, ho trovato che incrementi di almeno 160 punti rappresentano il 5% superiore dei risultati che sono andati oltre le attese negli Slam. Ci concentriamo quindi su questo 5%.

Uomini

Nel periodo considerato, solo due giocatori a fine di un torneo Slam sono riusciti a far aumentare la propria valutazione di più di 200 punti rispetto a quella iniziale. Il maggior guadagno in assoluto è stato di Gustavo Kuerten con la vittoria del primo Slam al Roland Garros 1997. Fuori dalle teste di serie, ha sorpreso davvero tutti. Anche con i punti guadagnati dopo ogni turno, era comunque il giocatore sfavorito in tutte le partite tranne una che, curiosamente, è stata la semifinale contro Filip Dewulf, sulla carta la partita più facile.

Il secondo posto è occupato da Andrei Medvedev (che non ha parentele con Daniil Medvedev), che ha raggiunto la finale del Roland Garros 1999, che si è poi rivelato anche il miglior risultato in uno Slam. Quella sconfitta è stata la sesta di fila contro Andre Agassi, e deve aver spento definitivamente la volontà di Medvedev nella conquista di un altro Slam.

IMMAGINE 1 – Primo 5% delle imprese più sorprendenti negli Slam maschili dal 1993 al 2020 sulla base del guadagno totale di punti del sistema di valutazione Elo

Nadal al Roland Garros

Prima del dominio di Nadal, ho sempre avuto l’impressione che il Roland Garros fosse tra i quattro Slam quello con i risultati più “strani”. E credo che questa ne sia una conferma. Non solo i due più sorprendenti sono in cima all’elenco, ma ben 8 dei 23 risultati che rientrano nel primo 5% sono di imprese avvenute sulla terra battuta di Parigi. Poi, dal 2005 al 2013, Nadal ha normalizzato la situazione a suo favore. Mi ha incuriosito quindi vedere che la sua vittoria al Roland Garros 2014 rientra tra le sorprese. Anche se Nadal non ha praticamente ottenuto punti dai primi quattro turni, la difficoltà delle vittorie contro David Ferrer, Andy Murray e Novak Djokovic (il quale aveva in quel momento una valutazione complessiva più alta) è stata sufficiente per un guadagno di 166 punti rispetto alla valutazione di inizio torneo.

Anche i nomi più prestigiosi

Ci sono poi anche alcuni dei nomi più prestigiosi del tennis maschile, e si può pensare che siano le loro prime vittorie di uno Slam. Non è così. C’è l’ultima vittoria agli US Open 2002 di Pete Sampras, dopo due anni di assenza dall’albo d’oro negli Slam. Per certi versi simile, c’è la vittoria di Djokovic a Wimbledon 2018, la prima dal Roland Garros 2016, in cui era riuscito a completare tutti i tornei Slam. Sono presenti anche Andre Agassi e Federer, in fasi diverse di rinascita della loro carriera.

Come qualche volta accade, la mancanza di dati può generare storie altrettanto interessanti. Nel caso delle sorprese negli Slam, i dati mancati si riferiscono alla lunga sequenza di risultati secondo pronostico tra la semifinale di Rainer Schuettler a Wimbledon 2008 e la vittoria di Nadal al Roland Garros 2014. Solo il titolo conquistato da Juan Martin Del Potro agli US Open 2009 ha interrotto brevemente le vittorie dei favoriti negli Slam, dando vita al periodo più continuo di risultati prevedibili negli Slam degli ultimi tre decenni.

La storia di Vladimir Voltchkov merita una nota finale. Nel 2000, Voltchkov, un giocatore juniores con poche sortite sul circuito maggiore, arrivò a Wimbledon con una valutazione appena superiore a 1600. Anche ispirato dall’epica del film Il Gladiatore di quello stesso anno, Voltchkov riuscì incredibilmente a sopravvivere ai primi 5 avversari per poi essere eliminato senza patemi da Pete Sampras nella sua unica semifinale Slam.

Donne

Purtroppo le mie valutazioni storiche per il tennis femminile non coprono un periodo così ampio. Però, anche dai soli risultati negli anni 2000 è chiaro che le imprese più sorprendenti hanno seguito dinamiche decisamente diverse da quelle degli uomini. In primo luogo, il Roland Garros compare solo una volta, quando Jelena Ostapenko ha vinto nel 2017 diventando la prima dopo Kuerten ha vincere uno Slam come primo torneo in assoluto del circuito maggiore.

Inoltre, la maggior parte delle sorprese più recenti si sono verificate agli Australian Open (8 delle 22 del grafico). La più inaspettata di questo gruppo è stata la vittoria di Serena Williams nel 2007, a seguito di una serie di infortuni che nel 2006 le avevano fatto saltare gran parte della stagione e retrocedere al numero 139 in classifica.

IMMAGINE 2 – Primo 5% delle imprese più sorprendenti negli Slam femminili dal 1999 al 2020 sulla base del guadagno totale di punti del sistema di valutazione Elo

Kim

Sembra quasi scritto che la vittoria agli US Open 2009 di Kim Clijsters dopo il rientro alle competizioni superi per sorpresa anche la vittoria di Serena nel 2007. Sono infatti le due giocatrici che meglio di tutte hanno gestito maternità e professionismo in momenti diversi della carriera. Se in molti erano convinti che Serena avrebbe vinto uno Slam poco dopo aver partorito, è in realtà Clijsters l’unica a raggiungere quel traguardo. E c’erano buone possibilità che almeno una delle sorelle Williams avrebbe interrotto il cammino di Clijsters, prima Venus negli ottavi di finale, con il 90% di probabilità di vittoria, e poi Serena in semifinale. Dopo solo un mese nel circuito maggiore, con un altro Slam vinto e 300 punti aggiunti alla sua valutazione, è Clijsters a ricevere il premio di impresa più sorprendete negli Slam degli ultimi trent’anni.

Some of the Most Surprising Runs in Recent Grand Slam History

Un’analisi dell’efficacia del sistema di teste di serie

di Peter Ellis // FreeRangeStatistics

Pubblicato il 26 gennaio 2020 – Traduzione di Edoardo Salvati

Ispirato dagli Australian Open 2020, ho deciso di indagare in che modo il sistema di teste di serie e la distribuzione dei giocatori nel tabellone principale incidono sul risultato finale di un torneo. Probabilmente ritornerò sull’argomento, ma l’obiettivo odierno è di analizzare l’impatto dell’assegnazione delle teste di serie sulla probabilità per i più forti di vincere, arrivare in finale, in semifinale o nei quarti di finale.

Metto a confronto i risultati di simulazioni di tornei a eliminazione diretta tra questi giocatori in due tipologie di scenari, da un lato un posizionamento del tutto casuale nel tabellone in assenza di teste di serie, dall’altro l’introduzione di 32 teste di serie come accade nei tornei dello Slam.

L’immagine 1 mostra che la scelta della metodologia determina conseguenze differenti: l’adozione delle teste di serie comporta un aumento concreto della probabilità del migliore di vincere o dei due più forti di arrivare in finale, e ha rilevanza ancora maggiore ai fini della determinazione delle semifinali e dei quarti di finale.

IMMAGINE 1 – Impatto del sistema a teste di serie sul risultato che i migliori possono raggiungere

Distribuzione della bravura dei giocatori

Questo significa che, ad esempio, con 32 giocatori che ricevono una posizione speciale in tabellone grazie alla testa di serie, esiste una probabilità del 22% che in semifinale arriveranno i migliori quattro, rispetto una probabilità di solo il 2% con un tabellone casuale. In una assegnazione casuale, la probabilità di vedere i migliori otto nei quarti di finale è di fatto prossima allo zero, mentre in un tabellone con teste di serie succederà il 3% delle volte (che non è comunque molto spesso, aspetto che però non dovrebbe destare stupore tra coloro che seguono il tennis regolarmente). Di contro, la probabilità che le prime due teste di serie siano in finale è del 42% in un tabellone con teste di serie e solo del 20% in uno casuale.

Va sottolineato che questi risultati dipenderanno dalla distribuzione della bravura dei giocatori nello specifico torneo. All’estremo, se il più forte è in grado di dominare tutti gli altri, la presenza delle teste di serie non farà alcuna differenza per la vittoria finale.

Valori teorici di riferimento

Possiamo calcolare altri valori teorici come limiti di riferimento. Ad esempio, se i primi due giocatori fossero effettivamente invincibili contro chiunque tranne che l’altro, si incontrerebbero in finale il 100% delle volte in un tabellone con teste di serie e il 50% delle volte in un tabellone casuale. Qualsiasi valore inferiore (il 42% e il 20% nel nostro caso) identifica il divario tra un livello “decisamente” alto di questi due giocatori nei confronti degli altri e un livello “infinitamente” alto.

Stephanie Kovalchik ha scritto sulle conseguenze dell’ipotesi di riduzione da 32 a 16 teste di serie negli Slam (che non ha poi avuto seguito), in cui ha mostrato che i risultati sarebbero stati meno esatti rispetto a un sistema a 32 teste di serie, dove per esatto s’intende il raggiungimento del turno atteso da parte del giocatore in funzione della sua classifica.

Serie storica di risultati

Per procedere con l’analisi, ho utilizzato dati sulla bravura effettiva relativa dei giocatori ottenuti grazie al pacchetto {deuce} R codificato da Kovalchik. Mi serviva un intervallo realistico di valori sulla bravura che potessero essere applicati a scontri diretti come in un torneo reale. Ho scelto di concentrarmi su un preciso momento temporale invece di una sfida tra ere che, per esempio, avrebbe messo di fronte Margaret Court e Serena Williams. Onde evitare confusione con l’attualità, ho scelto la stagione femminile del 1990. L’immagine 2 riepiloga le prime 10 a fine 1990 sulla base della loro valutazione Elo.

IMMAGINE 2 – Prime 10 giocatrici per valutazione Elo a fine 1990

Tramite dati raccolti da Jeff Sackmann, Kovalchik fornisce le valutazioni Elo per ciascuna giocatrice per specifico momento temporale. Avevo già parlato di Elo in merito al Backgammon e al calcio australiano. Si tratta di un metodo molto efficace per fare valutazioni di giocatori rispetto all’effettivo rendimento, con il grande vantaggio di poterne derivare probabilità per un qualsiasi ipotetico scontro diretto.

La valutazione è oggetto di aggiustamenti incrementali in funzione della rispondenza tra situazione effettiva e probabilità derivate dalle valutazione Elo alla vigilia della partita. Questo ne fa un’indice utile e con capacità di correzione automatica, e facilmente integrabile in un modello statistico.

Per essere sicuro della corretta conversione delle valutazioni Elo di Kovalchik in probabilità, mi affido alla sua funzione elo_prediction() per la stima della probabilità di vittoria in ciascun accoppiamento. L’immagine 3 illustra mostra la probabilità di battere Steffi Graf da parte di una selezione di giocatrici classificate tra la posizione 2 e la 128 in termini di valutazioni Elo (Graf che, dall’inizio dell’era Open, è la giocatrice che la più alta valutazione assoluta).

IMMAGINE 3 – Probabilità di alcune tra le prime 128 di battere Graf alla fine del 1990

La simulazione dei tabelloni e risultati

Per completare la laboriosa attività di simulazione di tornei tra queste 128 giocatrici, ho scritto una funzione simulate_tournament() il cui principale argomento è una struttura dati di 128 righe di fila che rappresentano il tabellone, come nell’immagine 4.

IMMAGINE 4 – Funzione simulate_tournament()

Questo indica ad esempio che nel primo turno giocato (“round of 128”) Dianne Van Rensburg giocherà contro Carling Basset Seguso nella partita 1 (match 1). L’immagine 5 mostra il risultato filtrando per la partita 1 del secondo turno (“round of 64”)

IMMAGINE 5 – Partite del secondo turno della simulazione

Troviamo quattro giocatrici nella partita 1. Però una tra Van Resnburg e Seguso avrà perso nel primo turno, così come una tra Elna Reinach e Wiltrud Probst. Con un po’ di attenzione, l’oggetto brackets riesce a contenere l’intero tabellone principale, e può essere disegnato in modo che le prime 32 teste di serie siano allocate nei singoli quarti come richiesto da un tabellone a 32 teste di serie. Il resto del codice che ho scritto esegue questa simulazione per i due scenari di tabellone che ho individuato in precedenza.

Arriviamo ai risultati

La tabella riepiloga la distribuzione delle vincitrici. Non sorprende che Graf vinca più simulazioni di torneo di qualsiasi altra, 5454 su 10.000 con un tabellone casuale, e 5913 su 10.000 con un tabellone a 32 teste di serie. Anche in un periodo di dominio totale di Graf, ci sono comunque giocatrici (e non solo alcune tra quelle di vertice) con una probabilità di vittoria diversa da zero. Ed è questo che attrae le persone a seguire il tennis. È interessante come da Monica Seles (a quel tempo al terzo posto delle valutazioni Elo) a scendere, è più probabile che una giocatrice vinca il torneo simulato in un tabellone casuale invece che in uno con le teste di serie.

Vincitrice         Class.  No t.d.s.  32 t.d.s.
Graf               1       5454       5913
Navratilova        2       2089       2219
Seles              3       1064       1018
Sabatini           4       510        418
M.J. Fernandez     5       213        132
Martinez           7       110        66
Sanchez Vicario    6       113        63
Capriati           8       89         42
Maleeva Fragniere  9       66         34
Garrison           10      58         26 

Questo rimanda ai risultati evidenziati dal grafico dell’immagine 1 di inizio articolo. Spero presto di riprendere questa tematica e confrontare i due metodi con l’alternativa proposta da Charles Dodgson in “Lawn Tennis Tournaments. The True Method of Assigning Prizes with a Proof of the Fallacy of the Present Method”. Dodgson, che oltre a essere un matematico e logico trovò il tempo di dare vita a uno dei più importanti personaggi della letteratura inglese (in Alice nel paese delle meraviglie con lo pseudonimo di Lewis Carrol, n.d.t.), scriveva prima della diffusione del concetto di teste di serie. Propose un’alternativa al torneo a eliminazione diretta che a suo dire garantiva l’assegnazione esatta dei primi tre premi ai tre giocatori più forti. Il suo ragionamento però poggiava su una visione non probabilistica del significato di migliore. Certamente meritevole di approfondimento, ma per un’altra occasione.

Analysing the effectiveness of tennis tournament seeding

La fortuna del sorteggio: Australian Open 2020 (donne)

di Chapel Heel // HiddenGameOfTennis

Pubblicato il 19 gennaio 2020 – Traduzione di Edoardo Salvati

Come per gli uomini, anche per le donne ho eseguito una simulazione (con la mia variante Elo) di 100.000 configurazioni del tabellone principale, utilizzando lo stesso metodo che gli organizzatori usano per assegnare ai giocatori la loro posizione. L’ho poi confrontata con la previsione per il torneo su base Elo rispetto al tabellone effettivo.

La tabella mette a confronto la previsione effettiva del tabellone con i risultati dalle simulazioni di rimescolamento, in modo da avere alcune indicazioni sull’accessibilità del tabellone effettivo rispetto alle altre configurazioni. Tonalità di rosso (e arancione) evidenziano la sfortuna del giocatore. Al contrario, tonalità di verde rappresentano la fortuna ricevuta nel tabellone effettivo, in riferimento a un particolare turno. Il giallo simboleggia neutralità, e si può di fatto ignorare qualsiasi valore superiore o inferiore allo 0.2%.

Per una presentazione più compatta rispetto al passato, ho riportato nella tabella solo le teste di serie, e organizzato nella tabella successiva quei giocatori fuori dalle teste di serie per i quali c’è stata un’incidenza degna di nota (almeno l’1.0% di segno positivo o negativo).

Tabellone effettivo e simulato a confronto per le teste di serie

Generalmente, si vedono un po’ di tonalità di rosso e di verde nei numeri relativi ai quarti di finale, ma da li in avanti è quasi tutto giallo o sui toni dell’arancione. In questo senso la riga di Naomi Osaka appare particolarmente negativa (che ha superato il primo turno, n.d.t.), all’opposto quella di Serena Williams decisamente positiva (anche lei vincitrice al primo turno, n.d.t.). Forse è la volta buona per Williams di raggiungere il record di Slam di Margaret Court.

IMMAGINE 1 – Confronto tra tabellone effettivo e simulazioni per le teste di serie

Effetti di rilievo su una selezione di giocatrici fuori dalle teste di serie

A Maria Sharapova non era andata bene agli US Open 2019, forse in Australia la fortuna sta cercando di recuperare (ha però perso subito al primo turno, n.d.t.). Caroline Wozniacki invece non ha ricevuto nessun regalo di addio alle competizioni (ma ha superato il primo turno, n.d.t.).

IMMAGINE 2 – Effetti della casualità del sorteggio su alcune non teste di serie

Luck of the Draw: Australian Open 2020 (Women)

La fortuna del sorteggio: Australian Open 2020 (uomini)

di Chapel Heel // HiddenGameOfTennis

Pubblicato il 19 gennaio 2020 – Traduzione di Edoardo Salvati

Come d’abitudine per gli Slam, ho eseguito una simulazione (con la mia variante Elo) di 100.000 configurazioni del tabellone principale, utilizzando lo stesso metodo che gli organizzatori usano per assegnare ai giocatori la loro posizione. L’ho poi confrontata con la previsione per il torneo su base Elo rispetto al tabellone effettivo.

La tabella mette a confronto la previsione effettiva del tabellone con i risultati dalle simulazioni di rimescolamento, in modo da avere alcune indicazioni sull’accessibilità del tabellone effettivo rispetto alle altre configurazioni. Tonalità di rosso (e arancione) evidenziano la sfortuna del giocatore. Al contrario, tonalità di verde rappresentano la fortuna ricevuta nel tabellone effettivo, in riferimento a un particolare turno. Il giallo simboleggia neutralità, e si può di fatto ignorare qualsiasi valore superiore o inferiore allo 0.3%.

Per una presentazione più compatta rispetto al passato, ho riportato nella tabella solo le teste di serie, e organizzato nella tabella successiva quei giocatori fuori dalle teste di serie per i quali c’è stata un’incidenza degna di nota (almeno lo 0.5% di segno positivo o negativo).

Tabellone effettivo e simulato a confronto per le teste di serie

Rispetto a tabelloni casuali, la parte bassa del tabellone principale è più difficile di quella alta. A David Goffin non è andata proprio bene essendo finito nella sezione del giocatore più in forma del momento, Andrey Rublev, che invece è tra i più fortunati, come Matteo Berrettini. Pensavo che la testa di serie numero 8 per Berrettini fosse eccessiva, perché non mi sembra tra i primi otto favoriti, ma so che le teste di serie procedono in automatico. Comunque, ha il tabellone più fortunato tra tutte le teste di serie.

IMMAGINE 1 – Confronto tra tabellone effettivo e simulazioni per le teste di serie

Effetti di rilievo su una selezione di giocatori fuori dalle teste di serie

Kevin Anderson ha giocato abbastanza bene all’ATP Cup. Con un pò di fortuna potrebbe superare un po’ di turni, magari fino agli ottavi. I quarti di finale sembrano troppo ambiziosi. Fresco vincitore del primo torneo, Ugo Humbert non è stato ricompensato con un percorso semplice. Ma non credo farà troppa differenza perché, anche scarico di adrenalina, dovrebbe perdere da John Millman al primo turno.

IMMAGINE 2 – Effetti della casualità del sorteggio su alcune non teste di serie

Luck of the Draw: Australian Open 2020 (Men)

Chi è la più forte? Alla ricerca della grandezza femminile con le valutazioni Elo

di Jeff Sackmann // TennisAbstract

Pubblicato il 9 gennaio 2020 – Traduzione di Edoardo Salvati

Nell’ultimo podcast, insieme a Carl Bialik e Jeff McFarland si è parlato della posizione di Caroline Wozniacki tra le grandi dell’era Open. È nelle prime 10 per numero di settimane al primo posto, ma ha vinto solo uno Slam. Secondo l’indice Championship Shares di McFarland, entra a malapena tra le prime 30. Alla stessa domanda su Twitter, la maggioranza si è schierata per un posto fuori dalle prime 20:

È sempre difficile mettere a confronto le diverse forme di successo di una giocatrice — le settimane al primo posto, gli Slam vinti e altri titoli — anche senza provare a tenere conto dell’epoca in cui sono state ottenute. Altrettanto complicato è il paragone tra differenti tipologie di carriera. Per più di un decennio, Wozniacki ha dimostrato di essere una costante minaccia al vertice del tennis, rispetto ad altre che hanno vinto più slam ma con un’esplosione di alto livello di gioco concentrata in un tempo molto più ridotto.

Arriva Elo in soccorso

Quanto deve essere forte una giocatrice per essere considerata una “grande”? Non mi aspetto una posizione univoca ma, come vedremo, il consenso non è necessario. Se diamo un’occhiata alle valutazioni Elo del momento, emerge un numero netto che fa al caso nostro. Ci sono sette giocatrici con una valutazione superiore a 2000: Ashleigh BartyNaomi OsakaBianca AndreescuSimona HalepKarolina PliskovaElina Svitolina, e Petra KvitovaAryna Sabalenka non rientra nel gruppo per pochissimo.

Altre 25 giocatrici in attività hanno raggiunto, alla massima forma, una valutazione di almeno 2000, dalle grandi di sempre come Serena Williams e Venus Williams fino a giocatrici con un breve ma intenso periodo di eccellenza, come Alize Cornet e Anastasia Pavlyuchenkova. Dal 1977, 88 giocatrici hanno terminato almeno una stagione con una valutazione Elo di 2000 o più punti, e 60 ci sono riuscite almeno due volte.

I limitati dati a disposizione costringono a partire dal 1977. Non ho risultati completi, o nemmeno qualcosa di simile, per l’inizio e la metà degli anni ’70. Sfortunatamente, questo si traduce nella sottovalutazione di alcune giocatrici la cui carriera è iniziata prima del 1977, come Chris Evert, e in una valutazione ancora più risicata delle grandi del decennio precedente, come Billie Jean King e Margaret Court. Nell’elenco definitivo delle 60 ci sono giocatrici degli ultimi 45 anni che chiunque considera di élite, insieme alla solita dose di sorprese (vi ricordate di Irina Spirlea?). Ne parlerò in dettaglio a breve.

La misura della grandezza

Raggiungere una valutazione Elo di 2000 a fine stagione è un traguardo notevole. Per le più grandi però, si tratta semplicemente dello standard d’ingresso. Serena ha avuto anni con valutazione sopra ai 2400 e Steffi Graf è riuscita a superare 2500. Per ogni stagione, trasformerò la valutazione Elo a fine anno in un “quoziente di grandezza”, facilmente inteso come la differenza tra la valutazione a fine anno e il valore 2000. Nel 2019, Barty ha terminato la stagione con una valutazione di 2123, quindi il suo quoziente di grandezza (QG) è 123.

Per misurare la grandezza di una giocatrice sull’arco della carriera, troviamo tutte le stagioni con una valutazione Elo maggiore di 2000 e le sommiamo. Per Serena, si tratta della somma del quoziente di 20 stagioni singole, un risultato incredibile. Wozniacki ne ha avute nove mentre, per il momento, quelle di Barty sono due. Mi dilungherò più avanti sui motivi di preferenza per questa metodologia e sul significato dei numeri che emergono.

Vediamo prima la classifica. La tabella mostra tutte le giocatrici con almeno due stagioni valide ai fini del computo. La colonna “Stagioni” indica il numero di anni con una valutazione Elo a fine stagione di almeno 2000 punti, mentre la colonna “Max” è la più alta valutazione Elo a fine stagione mai raggiunta dalla giocatrice.

Class Giocatrice                Stagioni  Max   QG  
1     Steffi Graf                     14  2505  4784  
2     Serena Williams                 20  2448  4569  
3     Martina Navratilova             17  2442  4285  
4     Venus Williams                  14  2394  2888  
5     Chris Evert                     14  2293  2878  
6     Lindsay Davenport               12  2353  2744  
7     Monica Seles                    11  2462  2396  
8     Maria Sharapova                 13  2287  2280  
9     Justine Henin                    9  2411  2237  
10    Martina Hingis                   8  2366  1932  
11    Kim Clijsters                    9  2366  1754  
12    Gabriela Sabatini                9  2271  1560  
13    Arantxa Sanchez Vicario         12  2314  1556  
14    Amelie Mauresmo                  6  2279  1113  
15    Victoria Azarenka                9  2261  1082  
16    Jennifer Capriati                8  2214   929  
17    Jana Novotna                     9  2189   848  
18    Conchita Martinez               11  2191   836  
19    Caroline Wozniacki               9  2189   674  
20    Tracy Austin                     5  2214   647  
                                                      
Class Giocatrice                Stagioni  Max    QG  
21    Mary Pierce                      8  2161   637  
22    Elena Dementieva                 9  2140   629  
23    Simona Halep                     7  2108   562  
24    Svetlana Kuznetsova              6  2136   543  
25    Hana Mandlikova                  6  2160   516  
26    Jelena Jankovic                  4  2178   450  
27    Pam Shriver                      5  2160   431  
28    Vera Zvonareva                   5  2117   414  
29    Agnieszka Radwanska              8  2106   399  
30    Ana Ivanovic                     5  2133   393  
31    Petra Kvitova                    6  2132   346  
32    Na Li                            4  2095   310  
33    Anastasia Myskina                4  2164   290  
34    Anke Huber                       6  2072   277  
35    Mary Joe Fernandez               4  2110   274  
36    Nadia Petrova                    6  2094   265  
37    Dinara Safina                    3  2132   240  
38    Andrea Jaeger                    4  2087   237  
39    Angelique Kerber                 4  2109   224  
40    Nicole Vaidisova                 3  2121   222  
                                                      
Class Giocatrice                Stagioni  Max    QG  
41    Manuela Maleeva Fragniere        6  2059   194  
42    Anna Chakvetadze                 2  2107   174  
43    Ashleigh Barty                   2  2123   162  
44    Helena Sukova                    3  2078   150  
45    Jelena Dokic                     2  2110   142  
46    Iva Majoli                       2  2067   119  
47    Elina Svitolina                  3  2052   108  
48    Garbine Muguruza                 2  2061    98  
49    Zina Garrison                    2  2065    96  
50    Samantha Stosur                  3  2061    92  
51    Daniela Hantuchova               2  2050    80  
52    Irina Spirlea                    2  2064    76  
53    Nathalie Tauziat                 3  2041    73  
54    Patty Schnyder                   2  2057    70  
55    Chanda Rubin                     3  2034    68  
56    Marion Bartoli                   2  2033    66  
57    Sandrine Testud                  2  2041    62  
58    Magdalena Maleeva                2  2024    41  
59    Karolina Pliskova                2  2028    37  
60    Dominika Cibulkova               2  2007     7

È possibile che qualche posizione non vi trovi d’accordo. Vale anche per me, non è l’elenco a cui avrei pensato, ma la reazione immediata è che siamo comunque di fronte a un risultato solido nonostante la semplicità dell’algoritmo. In generale, le giocatrici con massimi su più anni sono vicine al vertice, ma solo perché hanno mantenuto eccellenza per gran parte della carriera. Un massimo di diverse stagioni come quello di Conchita Martinez non determina un passaggio automatico alle prime 10.

Da una prospettiva opposta, è un metodo che assegna credito a quelle giocatrici che hanno avuto un rendimento molto alto per periodi temporali limitati. Amelie Mauresmo e Tracy Austin entrano nelle prime 20 con non più di sei stagioni valide, mentre altre con lo stesso numero di anni con un Elo di almeno 2000, vedasi Manuela Maleeva Fragniere, si trovano molto più in basso.

Steffi, Serena e la soglia di 2000

Qual è esattamente il significato della soglia Elo di 2000 punti? Nell’accezione più semplice, è una linea di demarcazione tra giocatrici da considerare e da eliminare (mi spiace, Aryna, arriverà anche il tuo momento). D’interpretazione meno immediata, è un confronto fra stagioni di altissimo livello. Ad esempio, abbiamo visto che il QG di Barty nel 2019 è stato di 123. Con un Elo di 2505, nella stagione 1989 Graf ebbe un QG di 505. La scelta della soglia di 2000 punti implica che la stagione migliore di Graf ha approssimativamente un valore quattro volte quello della stagione migliore di Barty. Non è però una legge fisica. Se cambiassimo la soglia a 1900, il QG di Barty sarebbe 223, rispetto a 605 del migliore QG di Graf. In questo modo, la stagione di Graf varrebbe circa solo tre volte tanto.

Più bassa la soglia, maggior valore attribuiamo alla longevità e minore a stagioni veramente eccezionali. Riducendo la soglia a 1950, Serena prende il posto di Steffi in cima alla classifica (ma, in ogni caso, sono molto vicine). Anche se Williams ha avuto uno dei massimi più alti nella storia del tennis, è la sua longevità a renderla una giocatrice fuori dal comune. Non voglio ritrovarmi a decidere chi tra Serena o Steffi dovrebbe essere al primo posto, perché non è una statistica precisa e, per quanto mi riguarda, è in sostanza un pareggio (e lasciando da parte il discorso sulla differenza tra epoche). Non voglio nemmeno accomodare i parametri per far emergere un risultato invece di un altro.

La posizione di Wozniacki

Arriviamo a Wozniacki, da cui è partito questo articolo. Il quoziente di grandezza la mette al 19esimo posto tra tutte le giocatrici dal 1977, quasi esattamente a metà strada tra la sua posizione nell’elenco delle settimane al numero 1 e quella nella Championship Shares, che attribuisce più peso ai titoli vinti. In possesso di dati migliori per il primo decennio dell’era Open, Wozniacki, in compagnia di altre giocatrici, perderebbe qualche posizione. King, Court e Evonne Goolagong Cawley la farebbero uscire dalle prime 20. Anche Viriginia Wade potrebbe reclamare spazio tra le prime 20. Si potrà sempre discutere sull’esatta posizione di Wozniacki, ma siamo arrivati a un intervallo plausibile per la vincitrice degli Australian Open 2018.

Soluzioni che mirano a ottenere un numero specifico non sono mai perfette, in parte perché dipendono da ipotesi come la soglia Elo di cui si è parlato. Il fatto che producano elenchi che sembrano autorevoli, non significa che possano rappresentare l’ultima parola in merito. Di contro, offrono benefici enormi in discussioni di questo tipo, perché permettono di trovare un accordo su aspetti minori altrimenti irrisolvibili, come il livello della competizione quando si agguanta il primo posto della classifica, la fortuna del tabellone agli Slam vinti e persi, l’impatto del calendario sulla classifica, e via dicendo.

Grazie a una valutazione che incorpora i risultati di tutte le partite contro tutte le avversarie, Elo tiene conto di queste informazioni. Nel confronto tra le grandi di sempre, molti tifosi fanno spesso affidamento a un solo numero, gli Slam vinti. Con il quoziente di grandezza possono fare ora molto meglio.

Who’s the GOAT? Balancing Career and Peak Greatness With Elo Ratings

Un’introduzione all’uso di Elo nel tennis

di Jeff Sackmann // TennisAbstract

Pubblicato il 3 dicembre 2019 – Traduzione di Edoardo Salvati

Elo è il nome di un sistema di valutazioni di giocatori e giocatrici di tennis di qualità superiore rispetto alle formule che determinano le classifiche ufficiali per il circuito maschile e femminile. Da lettori seriali del mio blog o ascoltatori del podcast, ne sarete sicuramente venuti a conoscenza. A meno però di esservi ritrovati a contatto diretto con le valutazioni Elo in precedenza o di aver approfondito personalmente li tema, potreste pensare che sia una sorta di concetto che pertiene la sfera mitologica del tennis. Vale la pena dedicare del tempo a una comprensione più dettagliata del suo funzionamento.

L’algoritmo di base

Il principio sottostante qualsiasi sistema Elo è quello per cui la valutazione di un giocatore è una stima della sua bravura, che è possibile aggiornare dopo ogni partita (o torneo). Se un giocatore vince, la sua valutazione aumenta. Se perde, diminuisce. Dove Elo eccelle, è nel determinare l’ammontare secondo cui la valutazione dovrebbe salire o scendere.

Due sono le variabili principali considerate: quante partite sono già presenti nel sistema (vale a dire, quanta sicurezza abbiamo nella valutazione prima della partita) e la qualità dell’avversario. Riflettendoci bene, queste due variabili sono una buona approssimazione dell’idea che ci siamo già fatti della bravura di un giocatore. Più informazioni possediamo di un giocatore, più difficilmente cambieremo l’opinione che ne abbiamo sulla base di una sola partita.

La sconfitta di Novak Djokovic contro Dominic Thiem nel girone delle Finali di stagione è stata una sorpresa, ma solo il tifoso più apocalittico ha interpretato il risultato come un disastro che avrebbe dovuto modificare la stima della bravura di Djokovic. In modo analogo aggiustiamo l’opinione di un giocatore rispetto alla qualità dell’avversario. Una sconfitta contro Thiem genera delusione, ma una contro Marco Cecchinato, come nei quarti di finale del Roland Garros 2018, è più preoccupante. Il sistema Elo incorpora questo tipo di intuizioni istintive.

L’ampiezza delle valutazioni Elo

Tradizionalmente, all’ingresso nel sistema Elo e prima di accumulare risultati, un giocatore riceve una valutazione di 1500. È un numero completamente arbitrario. Tutto quello che conta è la differenza tra le valutazioni dei giocatori: se assegnassimo di partenza 0, 100 o 888, il risultato finale di quella differenza rimarrebbe il medesimo.

Quando ho iniziato a calcolare le valutazioni Elo, ho mantenuto la tradizione di partire da 1500. Negli anni, ho allargato l’orizzonte ai Challenger (e agli equivalenti tornei nel circuito femminile organizzati dalla Federazione internazionale) e alle qualificazioni del circuito maggiore. In assenza di un correttivo, la scala dell’intero sistema sarebbe stata alterata, generando inevitabile confusione. Quindi, ho sostituito il valore di 1500 con un numero poco superiore a 1200 (in funzione della categoria del torneo e della distinzione tra uomini e donne), così da ottenere una valutazione sostanzialmente identica.

Attualmente, il numero uno e la numero uno del mondo sono Rafael Nadal e Ashleigh Barty, con una valutazione Elo di 2203 per Nadal e 2123 per Barty. Questo è l’intervallo in cui stazionano i migliori, e i fenomeni assoluti spesso si avvicinano a 2500. Secondo la più recente versione del mio algoritmo, il picco di Djokovic è stato di 2470 e quello di Serena Williams di 2473. La quota di 2000 separa con buona precisione le élite dagli altri giocatori. Al momento, sei uomini e sette donne hanno valutazioni così alte. Sedici uomini e diciotto donne hanno valutazioni di almeno 1900. Una valutazione di 1800 equivale grossomodo a un posto tra i primi 50.

Confronto tra epoche e inflazione Elo

Se si riesce ad assegnare un valore Elo massimo a ogni giocatore, viene automatico iniziare a fare confronti tra epoche. Seppur un passatempo divertente, sono convinto che nessun sistema di valutazione dei giocatori di tennis abbia una qualche utilità ai fini di un raffronto tra epoche diverse, neanche Elo. Quello che può fare però è mettere a confronto la bravura di un giocatore rispetto ai suoi avversari.

Nel 1990, Helena Sukova raggiunse un valore di 2123, lo stesso posseduto ora da Barty. Non significa che Sukova era forte al tempo quanto lo è Barty adesso. Significa invece che hanno avuto un rendimento simile contro le rispettive avversarie. Le giocatrici di seconda fascia trent’anni fa erano considerevolmente più deboli, quindi in un certo senso era più facile raggiungere valutazioni molto elevate. Sukova occupava l’undicesima posizione Elo, molto lontana dal 2600 di Steffi Graf.

Questo per dire che Elo non permette un confronto tra epoche a meno di non essere certi che il livello della competizione sia analogo, o a meno di non avere altre idee per gestire quella variabile, un campo minato che ha respinto molti tra coloro che hanno approfondito il tema.

Inflazione e deflazione

Una problematica correlata è il concetto di inflazione o deflazione Elo, che può rendere ancora più complicati confronti tra epoche. Ogni volta che si gioca una partita, vincitore e sconfitto di fatto si “scambiano” alcuni dei loro punti, in modo da lasciare il numero totale dei punti nel sistema inalterato. Quando però un nuovo giocatore fa il suo ingresso, il totale dei punti aumenta. Al ritiro invece, il totale diminuisce.

Sarebbe più facile se addizioni e sottrazioni di punti si equivalessero, in modo da annullarsi, ma per molte competizioni che usano Elo questo non accade. Le addizioni tendono a essere maggiori delle sottrazioni, facendo crescere le valutazioni Elo nel corso del tempo. Non sembra che questo si verifichi con le mie valutazioni, almeno in parte perché ho previsto una penalizzazione per gli infortuni che tengono lontano dal gioco, ma è utile per ricordare che il numero di punti del sistema non è statico, e per ragioni non legate alla bravura dei giocatori di vertice.

Previsioni Elo

Iniziano a essere più chiare le caratteristiche di utilizzo di Elo come sistema che fornisce la valutazione di un giocatore rispetto a quella degli altri. Uno dei principali scopi di qualsiasi sistema di valutazione è la previsione del risultato delle partite, e in questo Elo riesce meglio della maggior parte dei suoi avversari, tra cui anche le classifiche ufficiali dell’ATP e della WTA. L’unico parametro necessario per fare una previsione è la differenza tra la valutazione dei due giocatori, da inserire poi nella seguente formula:

1 – (1 / (1 + (10^((differenza) / 400))))

Se volessimo prevedere una rivincita dell’ultima partita delle Finali di Coppa Davis, dovremmo prendere le valutazioni di Nadal e Denis Shapovalov (2203 e 1947), calcolare la differenza (256) e applicare la formula, ottenendo una probabilità di vittoria per Nadal dell’81.4%. Con la differenza negativa (-256) avremmo ottenuto la speculare probabilità di un risultato a sorpresa per Shapovalov del 18.6%.

La mia versione Elo nel tennis si basa sul formato più classico delle partite, cioè quello al meglio dei tre set. Per le partite al meglio dei cinque set il calcolo si complica, ma per chi fosse interessato ho scritto del codice. Il punto è che occorre un aggiustamento. Dovessero Nadal e Shapovalov giocare contro agli Australian Open 2020, la probabilità di vittoria di Nadal salirebbe all’86.7%.

Elo specifico per superficie

Per la maggior parte degli sport, ci si potrebbe fermare qui. Una partita è una partita, con poche altre variazioni marginali. Nel tennis però, valutazioni e previsioni dovrebbero variare sensibilmente in funzione della superficie.

Ammetto che la mia soluzione è un po’ complicata. Per ogni giocatore, ci sono quattro diverse valutazioni Elo: complessiva, specifica per il cemento (ma senza distinzioni tra campi all’aperto e al chiuso), specifica per la terra battuta e specifica per l’erba. Ad esempio, Thiem ha una valutazione complessiva di 2066, di 1942 sul cemento, di 2031 sulla terra e di 1602 sull’erba (la specificità di superficie in genere abbassa le valutazioni: quella di Thiem sulla terra è al terzo posto del circuito e lo pone un abisso davanti a tutti gli altri giocatori a eccezione di Nadal e Djokovic).

Queste valutazioni specifiche per superficie permettono un confronto tra giocatori ignorando i risultati su tutte le altre superfici. Non è però un esercizio realistico, perché la valutazione relativa alla singola superficie non ha un grande potere predittivo dei risultati delle partite.

Una combinazione di superfici

Una soluzione più opportuna arriva da una combinazione al 50% della valutazione per superficie e di quella complessiva. Se volessimo calcolare le probabilità di Thiem per una partita sulla terra, dovremmo usare una valutazione a metà tra il 2066 complessivo e il 2031 della terra.

Nelle mie valutazioni Elo settimanali, la singola superficie è indicata con “HardRaw” (o Solo Cemento, e così via), mentre le valutazioni combinate con “hElo”, “cElo” e “gElo” (h per hard = cemento, c per clay = terra e g per grass = erba). Non esiste una legge fisica che impone una combinazione al 50%. Qualsiasi correzione fatta all’algoritmo di base di Elo è dettata esclusivamente da logiche funzionali.

All’inizio, pensavo che una combinazione tra valutazione specifica e complessiva fosse appropriata, perché il successo di un giocatore su una superficie è in qualche modo correlato a quello sulle altre. Mi attendevo che la combinazione fosse diversa per singola superficie, magari usando una percentuale più alta della valutazione complessiva nel caso dell’erba, visto il numero ridotto di partite su quella superficie. Alla fine però, dalle mie prove è emerso che il 50% funziona su tutte le superfici.

Senza correzioni

Un sondaggio tra appassionati su quali sono le partite più importanti e di quali tornei — per la classifica, per il dibattito sul più forte di sempre, o per qualsiasi altra questione — potrebbe portare a una lunga e dettagliata lista di fattori che definiscono il concetto di grandezza. Forse sono gli Slam a essere più importanti dei Master o dei Premier, anche se forse questi sono meno rilevanti delle Finali di stagione e delle Olimpiadi, e naturalmente le finali sono fondamentali, pure gli scontri diretti tra determinati giocatori, e così via all’infinito.

Elo fornisce una soluzione. Un coefficiente solitamente chiamato “fattore k” permette di assegnare maggiore peso a determinate partite. È frequente nelle valutazioni Elo di altri sport, ad esempio per le partite dei playoff che hanno un fattore k più alto rispetto a quelle della stagione regolare. Ho sperimentato ogni sorta di valore del fattore k per le partite considerate “importanti”, ma devo ancora trovare un’impostazione del sistema che migliori in modo continuativo la sua capacità di fare previsioni sul risultato di una partita.

La penalizzazione per assenza dal circuito

Esiste un’eccezione. In caso di assenza duratura, diminuisco la valutazione del giocatore, per poi aumentare il fattore k nelle prime partite successive al rientro. Ne avevo già parlato in questo articolo. Si tratta di un’estensione logica del modello Elo, specialmente se si pensa alla tipica disposizione mentale che si ha nei confronti di un giocatore rimasto a lungo lontano dal circuito per infortunio. Non si sa mai bene cosa attendersi quando rientra, se è più forte che mai o se è ancora troppo lento. Magari ritornerà in forma presto o magari non recupererà mai la forma di un tempo. Una lunga assenza solleva molte domande. Raramente chi arriva da un infortunio è a un livello superiore al precedente, mentre in molti fanno peggio, mostrando rendimenti in media inferiori.

È inevitabile quindi che, all’immediato rientro da un infortunio, la stima del livello di un giocatore sia inferiore. Tuttavia, si dovrebbe assegnare un peso maggiore a risultati da subito molto validi, da cui un valore più alto del fattore k, che incorpora nella valutazione di un giocatore la mancanza di fiducia che abbiamo sulle sue condizioni successive al rientro da un infortunio. L’algoritmo si complica, ma la logica è semplice. In sostanza, è solo il tentativo di dare rigore interpretativo ad affermazioni del tipo “non so quanto giocherà bene al rientro, ma lo seguirò attentamente”.

La penalizzazione per assenza ha l’effetto collaterale positivo di bilanciare la naturale tendenza di Elo a un’inflazione nelle valutazioni. Se da un lato ci sono più giocatori che entrano nel sistema di quelli che ne escono, facendo aumentare il numero complessivo dei punti disponibili, la penalizzazione toglie dei punti senza che vengano poi allocati nuovamente agli altri giocatori.

La validazione di Elo e altre misure correttive

Più volte ho detto di aver fatto delle prove, oltre ad aver iniziato l’articolo affermando che Elo è di qualità superiore rispetto alle classifiche ufficiali. Cosa significa esattamente, e perché lo si può dire? Il modo più semplice con cui paragonare sistemi di valutazione è una statistica chiamata “accuratezza”, che conta le previsioni fatte correttamente. Ad esempio, Elo ha predetto il vincitore in 36 delle 50 partite delle Finali di Coppa Davis, per un’accuratezza del 72%. La classifica ATP ha predetto il vincitore (nel senso che il giocatore con la classifica più alta ha vinto la partita) in 30, per un’accuratezza del 60%. L’esperimento è ridotto, ma Elo ha demolito la classifica ufficiale. Ed Elo è considerevolmente migliore quando l’arco temporale copre un’intera stagione.

L’indice di Brier

Per questo scopo è più utile l’indice di Brier, che considera il livello di fiducia riposto in ciascuna previsione. Riprendendo il precedente esempio, Elo assegna a Nadal una probabilità dell’81.4% di battere Shapovalov. Se Nadal effettivamente vince la partita, l’81.4% è una previsione “migliore” diciamo rispetto a una del 65%, ma è “peggiore” di una del 90%. L’indice Brier calcola la media del quadrato della differenza tra la previsione (81.4%) e il risultato (0% o 100% a seconda di chi ha vinto), per tutte le partite in oggetto. Remunera l’impudenza di quelle previsioni che si sono rivelate corrette ma, poiché usa il quadrato della differenza, punisce severamente le previsioni aggressive ma sbagliate.

Un metodo più intuitivo per capire la natura dell’indice di Brier è di ipotizzare che Nadal e Shapovalov giochino 100 partite di fila (o, con più precisione ma meno intuitivamente, ipotizzare che cento identici Nadal giochino in contemporanea contro cento identici Shapovalov). Una previsione dell’81.4% significa che ci si attende che Nadal vinca 81 o 82 delle 100 partite. Se Nadal ne vince poi 90, la previsione non è stata sufficientemente favorevole nei confronti di Nadal. Non avremo mai cento partite di quel tipo in simultanea, abbiamo però migliaia di partite uniche, molte delle quali hanno la stessa previsione, come il 60% di probabilità di vittoria per il favorito. L’indice di Brier aggrega tutte quelle coppie di previsioni-risultati e restituisce un numero indicativo della bontà del nostro operato.

L’accuratezza ha comunque un valore limitato

È difficile prevedere il risultato delle partite di tennis. A prescindere da quanto è sofisticato un sistema, qualsiasi esso sia, sbaglierà comunque moltissime volte. In molti casi, una previsione “corretta” è a malapena meglio che non fare previsioni, se i dati suggeriscono che i due giocatori sono tra loro alla pari. Per questo, l’accuratezza ha un valore limitato: è più importante avere la giusta dose di fiducia che scegliere semplicemente un vincitore.

Tutte queste parole a dire: le mie valutazioni hanno un indice di Brier molto più basso (cioè più preciso) delle previsioni derivanti dalle classifiche del circuito maschile e femminile. Le previsioni fatte con Elo non sono altrettanto puntuali di quelle degli allibratori, altrimenti dedicherei molto più del mio tempo a scommettere che a scrivere di sistemi di valutazione nel tennis.

L’indice di Brier permette inoltre di stabilire se un determinato correttivo — come la combinazione tra superfici, le assenze da infortunio o il tipo di torneo — rappresentano un miglioramento del sistema. La definizione di una penalizzazione per assenza da infortunio riduce l’indice di Brier per l’intero gruppo di previsioni Elo, quindi vale la pena considerarla. Diminuire il fattore k per le partite di primo turno non ha effetti rilevanti, quindi si elimina quella pratica.

Per ulteriore approfondimento

Le mie valutazioni Elo del momento: ATP | WTA

Elo esteso al doppio

…e al doppio misto (in inglese)

Codice per Elo nel tennis (in R, che non ho scritto io)

Una gustosa infarinatura sull’indice di Brier (in inglese).

An Introduction to Tennis Elo

Andreescu, Medvedev e il futuro secondo Elo

di Jeff Sackmann // TennisAbstract

Pubblicato il 10 settembre 2019 – Traduzione di Edoardo Salvati

Con la vittoria agli US Open, che incrementa il bottino del 2019, Bianca Andreescu è finalmente entrata tra le prime 10 della classifica WTA, debuttando al quinto posto. Daniil Medvedev, che durante l’estate ha manipolato l’attenzione del circuito maschile, ha varcato la soglia dei primi 10 solo dopo Wimbledon. Ora occupa la quarta posizione.

Se a una classifica si richiede di predire il futuro, Elo è il sistema migliore. I pronostici fatti con Elo sono significativamente più precisi di quelli che usano i punti classifica. Il primo titolo Premier di Andreescu è arrivato a marzo a Indian Wells, dopo che ha battuto due tra le prime 10, cioè Elina Svitolina in semifinale e Angelique Kerber in finale. La classifica WTA ha reagito facendola salire al 24esimo posto dal numero 60. Già dopo la finale persa a Auckland, Elo vedeva in Andreescu una giocatrice con cui dover fare i conti, mettendola al settimo posto. Dopo altre tre vittorie a Miami, Andreescu è salita tra le prime 5 di Elo.

La prontezza di Elo

Gli algoritmi dietro le classifiche ufficiali impiegano del tempo per accorgersi della presenza di nuove stelle. Elo, invece, reagisce prontamente. Rispetto al metodo di calcolo di ATP e WTA che assegna punti in funzione di un anno di risultati (e in termini di turno raggiunto, non di bravura degli avversari), Elo assegna maggiore importanza a quelli più recenti, con ancora più enfasi per esiti inattesi, come ad esempio sconfitte a sorpresa dei giocatori di vertice.

Gli appassionati sono abituati alla lenta evoluzione della classifica ufficiale, quindi un numero [22] o [15] accanto al nome di Andreescu al Roland Garros e agli US Open non è sembrato fuori luogo. E un giudizio ponderato può avere la sua logica, considerati i passati esempi di giovanissimi che sono rimasti scottati. Elo però ha quasi sempre ragione. Se gli allibratori davano Serena Williams come super favorita nella finale a New York, Elo vedeva in Andreescu la giocatrice più in forma, pronosticandola vincitrice, seppur di poco. Dopo le sette vittorie agli US Open, Elo identifica ora Andreescu come la più forte del circuito, anche se con un margine risicato su Ashleigh Barty. Chi osa non essere d’accordo?

Sulla rampa di lancio

Quando lo scorso ottobre Medvedev ha messo piede tra i primi 10 delle valutazioni Elo per la prima volta, ho messo a confronto i due sistemi di classifica. La maggior parte dei giocatori che guadagna una posizione tra i primi 10 di Elo riesce prima o poi a entrare anche tra i primi 10 della classifica ufficiale, ma Elo è quasi sempre in anticipo. In media, l’algoritmo di Elo seleziona i primi 10 con più di sei mesi di vantaggio sul computer dell’ATP. Medvedev è un buon esempio: ha raggiunto l’ottavo posto di Elo a ottobre 2018, ma gli ci sono voluti altri dieci mesi per avere la stessa posizione nella classifica ufficiale, dopo la finale al Canada Masters.

Andreescu ha colmato il divario più velocemente di Medvedev, nei sei mesi che sono tipicamente richiesti a una giocatrice dall’ingresso tra le prime 10 di Elo a quello nella classifica ufficiale. E non dovrebbe servire molto altro tempo prima di una convergenza perfetta al numero uno delle due classifiche.

Non abbiamo bisogno di Elo per farci dire che Andreescu e Medvedev continueranno presumibilmente a vincere partite ad alto livello. Avendone però riconosciuto l’accuratezza predittiva, vale la pena guardare quali altri giocatori e giocatrici sono sulla rampa di lancio.

Berrettini e Muchova

Dopo gli US Open, la previsione più aggressiva riguarda Matteo Berrettini, che è attualmente al sesto posto. Nella classifica ATP Berrettini è tredicesimo, con una toccata e fuga tra i primi 20 durante l’estate, ed è tra i primi 10 di Elo da metà giugno, quindi ancor prima della semifinale agli US Open. Non solo, ma si trova davanti anche a giocatori giovani ma già avviati come Alexander Zverev e Stefanos Tsitsipas.

In campo femminile, non ci sono sorprese simili tra le prime 10 Elo, il che non significa che ci sia accordo con la classifica WTA. Karolina Muchova, 43esima nonché sua classifica migliore di sempre, è al 23esimo posto di Elo. Anche due veterane e pericoli costanti come Victoria Azarenka e Venus Williams sono confinate fuori dalle prime 40, ma Elo attribuisce loro rispettivamente un 18esimo e 28esimo posto. Da un punto di vista predittivo, la qualità è più importante della quantità, quindi un calendario ridotto non è necessariamente un limite. Elo è ottimista anche su Sofia Kenin, mettendola al 13esimo posto rispetto alla 20esima posizione ufficiale.

Giocatore            Elo   ATP   
Daniil Medvedev        4     4
Matteo Berrettini      6    13
Alexander Zverev       9     6 
Stefanos Tsitsipas    15     7

Giocatrice           Elo   WTA
Bianca Andreescu       1     5
Ashleigh Barty         2     1
Sofia Kenin           13    20
Victoria Azarenka     18    42
Karolina Muchova      23    43
Venus Williams        28    56

Da qui a sei mesi, scommetto che la classifica ufficiale di Berrettini sarà più vicina al sesto posto che al tredicesimo, mentre quella di Muchova più vicina al numero 23 che al 43. Conoscere il futuro è impossibile, ma se si vuole guardare avanti Elo è già li da sei mesi. Occorrerà aspettare per capire se il resto del circuito femminile è in grado di tenere Andreescu lontana dal numero 1 così a lungo.

Andreescu, Medvedev, and the Future According to Elo