Alcune tra le imprese più sorprendenti nella storia recente degli Slam

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 18 aprile 2020 – Traduzione di Edoardo Salvati

Con molto tempo a disposizione per indugiare nei ricordi legati al tennis, ho pensato che sarebbe stato divertente fare una classifica delle imprese più incredibili negli Slam. A questo proposito, il guadagno ottenuto dal singolo giocatore in termini di valutazione del suo livello di bravura nel corso di un torneo è utile all’identificazione di risultati a sorpresa, in questo caso dagli anni 1990 a oggi.

Effetto sorpresa

Uno degli aspetti più interessanti dei sistemi di valutazione come Elo, basati cioè sulle probabilità, è che incorporano l’effetto sorpresa. L’aggiornamento della valutazione di un giocatore segue temporalmente i suoi risultati ed è di fatto una misura ponderata della prevedibilità o imprevedibilità del risultato. Quando Kevin Anderson ha sconfitto Roger Federer a Wimbledon 2018, alla vigilia della partita aveva solo una probabilità di vittoria su cinque. Si è trattato quindi di una sorpresa che ha dato una grande spinta alla sua valutazione. I sistemi di valutazione operano questi calcoli a ogni partita e per ogni risultato, fornendo così un’istantanea dell’effetto sorpresa consultabile in qualsiasi momento.

Sono variazioni parte del processo di auto-correzione di questo tipo di sistemi di valutazione. In generale, se un sistema è efficace non si lascia sorprendere troppo spesso. Ci sono però occasioni in cui una vittoria fa saltare il banco, pensiamo ad esempio a quella di Lukas Rosol contro Rafael Nadal a Wimbledon 2012. Non capita di frequente di assistere a vittorie a sorpresa di fila perché, se succede, significa che probabilmente si è verificato qualcosa di straordinario.

Possiamo provare a isolare quelle occasioni osservando il guadagno complessivo di punti validi per le valutazioni in un torneo (secondo il mio sistema di valutazioni Elo), dalla prima all’ultima partita giocata. Con le mie valutazioni storiche, che attualmente tornano indietro fino al 1990 per gli uomini e al 1997 per le donne, ho trovato che incrementi di almeno 160 punti rappresentano il 5% superiore dei risultati che sono andati oltre le attese negli Slam. Ci concentriamo quindi su questo 5%.

Uomini

Nel periodo considerato, solo due giocatori a fine di un torneo Slam sono riusciti a far aumentare la propria valutazione di più di 200 punti rispetto a quella iniziale. Il maggior guadagno in assoluto è stato di Gustavo Kuerten con la vittoria del primo Slam al Roland Garros 1997. Fuori dalle teste di serie, ha sorpreso davvero tutti. Anche con i punti guadagnati dopo ogni turno, era comunque il giocatore sfavorito in tutte le partite tranne una che, curiosamente, è stata la semifinale contro Filip Dewulf, sulla carta la partita più facile.

Il secondo posto è occupato da Andrei Medvedev (che non ha parentele con Daniil Medvedev), che ha raggiunto la finale del Roland Garros 1999, che si è poi rivelato anche il miglior risultato in uno Slam. Quella sconfitta è stata la sesta di fila contro Andre Agassi, e deve aver spento definitivamente la volontà di Medvedev nella conquista di un altro Slam.

IMMAGINE 1 – Primo 5% delle imprese più sorprendenti negli Slam maschili dal 1993 al 2020 sulla base del guadagno totale di punti del sistema di valutazione Elo

Nadal al Roland Garros

Prima del dominio di Nadal, ho sempre avuto l’impressione che il Roland Garros fosse tra i quattro Slam quello con i risultati più “strani”. E credo che questa ne sia una conferma. Non solo i due più sorprendenti sono in cima all’elenco, ma ben 8 dei 23 risultati che rientrano nel primo 5% sono di imprese avvenute sulla terra battuta di Parigi. Poi, dal 2005 al 2013, Nadal ha normalizzato la situazione a suo favore. Mi ha incuriosito quindi vedere che la sua vittoria al Roland Garros 2014 rientra tra le sorprese. Anche se Nadal non ha praticamente ottenuto punti dai primi quattro turni, la difficoltà delle vittorie contro David Ferrer, Andy Murray e Novak Djokovic (il quale aveva in quel momento una valutazione complessiva più alta) è stata sufficiente per un guadagno di 166 punti rispetto alla valutazione di inizio torneo.

Anche i nomi più prestigiosi

Ci sono poi anche alcuni dei nomi più prestigiosi del tennis maschile, e si può pensare che siano le loro prime vittorie di uno Slam. Non è così. C’è l’ultima vittoria agli US Open 2002 di Pete Sampras, dopo due anni di assenza dall’albo d’oro negli Slam. Per certi versi simile, c’è la vittoria di Djokovic a Wimbledon 2018, la prima dal Roland Garros 2016, in cui era riuscito a completare tutti i tornei Slam. Sono presenti anche Andre Agassi e Federer, in fasi diverse di rinascita della loro carriera.

Come qualche volta accade, la mancanza di dati può generare storie altrettanto interessanti. Nel caso delle sorprese negli Slam, i dati mancati si riferiscono alla lunga sequenza di risultati secondo pronostico tra la semifinale di Rainer Schuettler a Wimbledon 2008 e la vittoria di Nadal al Roland Garros 2014. Solo il titolo conquistato da Juan Martin Del Potro agli US Open 2009 ha interrotto brevemente le vittorie dei favoriti negli Slam, dando vita al periodo più continuo di risultati prevedibili negli Slam degli ultimi tre decenni.

La storia di Vladimir Voltchkov merita una nota finale. Nel 2000, Voltchkov, un giocatore juniores con poche sortite sul circuito maggiore, arrivò a Wimbledon con una valutazione appena superiore a 1600. Anche ispirato dall’epica del film Il Gladiatore di quello stesso anno, Voltchkov riuscì incredibilmente a sopravvivere ai primi 5 avversari per poi essere eliminato senza patemi da Pete Sampras nella sua unica semifinale Slam.

Donne

Purtroppo le mie valutazioni storiche per il tennis femminile non coprono un periodo così ampio. Però, anche dai soli risultati negli anni 2000 è chiaro che le imprese più sorprendenti hanno seguito dinamiche decisamente diverse da quelle degli uomini. In primo luogo, il Roland Garros compare solo una volta, quando Jelena Ostapenko ha vinto nel 2017 diventando la prima dopo Kuerten ha vincere uno Slam come primo torneo in assoluto del circuito maggiore.

Inoltre, la maggior parte delle sorprese più recenti si sono verificate agli Australian Open (8 delle 22 del grafico). La più inaspettata di questo gruppo è stata la vittoria di Serena Williams nel 2007, a seguito di una serie di infortuni che nel 2006 le avevano fatto saltare gran parte della stagione e retrocedere al numero 139 in classifica.

IMMAGINE 2 – Primo 5% delle imprese più sorprendenti negli Slam femminili dal 1999 al 2020 sulla base del guadagno totale di punti del sistema di valutazione Elo

Kim

Sembra quasi scritto che la vittoria agli US Open 2009 di Kim Clijsters dopo il rientro alle competizioni superi per sorpresa anche la vittoria di Serena nel 2007. Sono infatti le due giocatrici che meglio di tutte hanno gestito maternità e professionismo in momenti diversi della carriera. Se in molti erano convinti che Serena avrebbe vinto uno Slam poco dopo aver partorito, è in realtà Clijsters l’unica a raggiungere quel traguardo. E c’erano buone possibilità che almeno una delle sorelle Williams avrebbe interrotto il cammino di Clijsters, prima Venus negli ottavi di finale, con il 90% di probabilità di vittoria, e poi Serena in semifinale. Dopo solo un mese nel circuito maggiore, con un altro Slam vinto e 300 punti aggiunti alla sua valutazione, è Clijsters a ricevere il premio di impresa più sorprendete negli Slam degli ultimi trent’anni.

Some of the Most Surprising Runs in Recent Grand Slam History

Un’analisi dell’efficacia del sistema di teste di serie

di Peter Ellis // FreeRangeStatistics

Pubblicato il 26 gennaio 2020 – Traduzione di Edoardo Salvati

Ispirato dagli Australian Open 2020, ho deciso di indagare in che modo il sistema di teste di serie e la distribuzione dei giocatori nel tabellone principale incidono sul risultato finale di un torneo. Probabilmente ritornerò sull’argomento, ma l’obiettivo odierno è di analizzare l’impatto dell’assegnazione delle teste di serie sulla probabilità per i più forti di vincere, arrivare in finale, in semifinale o nei quarti di finale.

Metto a confronto i risultati di simulazioni di tornei a eliminazione diretta tra questi giocatori in due tipologie di scenari, da un lato un posizionamento del tutto casuale nel tabellone in assenza di teste di serie, dall’altro l’introduzione di 32 teste di serie come accade nei tornei dello Slam.

L’immagine 1 mostra che la scelta della metodologia determina conseguenze differenti: l’adozione delle teste di serie comporta un aumento concreto della probabilità del migliore di vincere o dei due più forti di arrivare in finale, e ha rilevanza ancora maggiore ai fini della determinazione delle semifinali e dei quarti di finale.

IMMAGINE 1 – Impatto del sistema a teste di serie sul risultato che i migliori possono raggiungere

Distribuzione della bravura dei giocatori

Questo significa che, ad esempio, con 32 giocatori che ricevono una posizione speciale in tabellone grazie alla testa di serie, esiste una probabilità del 22% che in semifinale arriveranno i migliori quattro, rispetto una probabilità di solo il 2% con un tabellone casuale. In una assegnazione casuale, la probabilità di vedere i migliori otto nei quarti di finale è di fatto prossima allo zero, mentre in un tabellone con teste di serie succederà il 3% delle volte (che non è comunque molto spesso, aspetto che però non dovrebbe destare stupore tra coloro che seguono il tennis regolarmente). Di contro, la probabilità che le prime due teste di serie siano in finale è del 42% in un tabellone con teste di serie e solo del 20% in uno casuale.

Va sottolineato che questi risultati dipenderanno dalla distribuzione della bravura dei giocatori nello specifico torneo. All’estremo, se il più forte è in grado di dominare tutti gli altri, la presenza delle teste di serie non farà alcuna differenza per la vittoria finale.

Valori teorici di riferimento

Possiamo calcolare altri valori teorici come limiti di riferimento. Ad esempio, se i primi due giocatori fossero effettivamente invincibili contro chiunque tranne che l’altro, si incontrerebbero in finale il 100% delle volte in un tabellone con teste di serie e il 50% delle volte in un tabellone casuale. Qualsiasi valore inferiore (il 42% e il 20% nel nostro caso) identifica il divario tra un livello “decisamente” alto di questi due giocatori nei confronti degli altri e un livello “infinitamente” alto.

Stephanie Kovalchik ha scritto sulle conseguenze dell’ipotesi di riduzione da 32 a 16 teste di serie negli Slam (che non ha poi avuto seguito), in cui ha mostrato che i risultati sarebbero stati meno esatti rispetto a un sistema a 32 teste di serie, dove per esatto s’intende il raggiungimento del turno atteso da parte del giocatore in funzione della sua classifica.

Serie storica di risultati

Per procedere con l’analisi, ho utilizzato dati sulla bravura effettiva relativa dei giocatori ottenuti grazie al pacchetto {deuce} R codificato da Kovalchik. Mi serviva un intervallo realistico di valori sulla bravura che potessero essere applicati a scontri diretti come in un torneo reale. Ho scelto di concentrarmi su un preciso momento temporale invece di una sfida tra ere che, per esempio, avrebbe messo di fronte Margaret Court e Serena Williams. Onde evitare confusione con l’attualità, ho scelto la stagione femminile del 1990. L’immagine 2 riepiloga le prime 10 a fine 1990 sulla base della loro valutazione Elo.

IMMAGINE 2 – Prime 10 giocatrici per valutazione Elo a fine 1990

Tramite dati raccolti da Jeff Sackmann, Kovalchik fornisce le valutazioni Elo per ciascuna giocatrice per specifico momento temporale. Avevo già parlato di Elo in merito al Backgammon e al calcio australiano. Si tratta di un metodo molto efficace per fare valutazioni di giocatori rispetto all’effettivo rendimento, con il grande vantaggio di poterne derivare probabilità per un qualsiasi ipotetico scontro diretto.

La valutazione è oggetto di aggiustamenti incrementali in funzione della rispondenza tra situazione effettiva e probabilità derivate dalle valutazione Elo alla vigilia della partita. Questo ne fa un’indice utile e con capacità di correzione automatica, e facilmente integrabile in un modello statistico.

Per essere sicuro della corretta conversione delle valutazioni Elo di Kovalchik in probabilità, mi affido alla sua funzione elo_prediction() per la stima della probabilità di vittoria in ciascun accoppiamento. L’immagine 3 illustra mostra la probabilità di battere Steffi Graf da parte di una selezione di giocatrici classificate tra la posizione 2 e la 128 in termini di valutazioni Elo (Graf che, dall’inizio dell’era Open, è la giocatrice che la più alta valutazione assoluta).

IMMAGINE 3 – Probabilità di alcune tra le prime 128 di battere Graf alla fine del 1990

La simulazione dei tabelloni e risultati

Per completare la laboriosa attività di simulazione di tornei tra queste 128 giocatrici, ho scritto una funzione simulate_tournament() il cui principale argomento è una struttura dati di 128 righe di fila che rappresentano il tabellone, come nell’immagine 4.

IMMAGINE 4 – Funzione simulate_tournament()

Questo indica ad esempio che nel primo turno giocato (“round of 128”) Dianne Van Rensburg giocherà contro Carling Basset Seguso nella partita 1 (match 1). L’immagine 5 mostra il risultato filtrando per la partita 1 del secondo turno (“round of 64”)

IMMAGINE 5 – Partite del secondo turno della simulazione

Troviamo quattro giocatrici nella partita 1. Però una tra Van Resnburg e Seguso avrà perso nel primo turno, così come una tra Elna Reinach e Wiltrud Probst. Con un po’ di attenzione, l’oggetto brackets riesce a contenere l’intero tabellone principale, e può essere disegnato in modo che le prime 32 teste di serie siano allocate nei singoli quarti come richiesto da un tabellone a 32 teste di serie. Il resto del codice che ho scritto esegue questa simulazione per i due scenari di tabellone che ho individuato in precedenza.

Arriviamo ai risultati

La tabella riepiloga la distribuzione delle vincitrici. Non sorprende che Graf vinca più simulazioni di torneo di qualsiasi altra, 5454 su 10.000 con un tabellone casuale, e 5913 su 10.000 con un tabellone a 32 teste di serie. Anche in un periodo di dominio totale di Graf, ci sono comunque giocatrici (e non solo alcune tra quelle di vertice) con una probabilità di vittoria diversa da zero. Ed è questo che attrae le persone a seguire il tennis. È interessante come da Monica Seles (a quel tempo al terzo posto delle valutazioni Elo) a scendere, è più probabile che una giocatrice vinca il torneo simulato in un tabellone casuale invece che in uno con le teste di serie.

Vincitrice         Class.  No t.d.s.  32 t.d.s.
Graf               1       5454       5913
Navratilova        2       2089       2219
Seles              3       1064       1018
Sabatini           4       510        418
M.J. Fernandez     5       213        132
Martinez           7       110        66
Sanchez Vicario    6       113        63
Capriati           8       89         42
Maleeva Fragniere  9       66         34
Garrison           10      58         26 

Questo rimanda ai risultati evidenziati dal grafico dell’immagine 1 di inizio articolo. Spero presto di riprendere questa tematica e confrontare i due metodi con l’alternativa proposta da Charles Dodgson in “Lawn Tennis Tournaments. The True Method of Assigning Prizes with a Proof of the Fallacy of the Present Method”. Dodgson, che oltre a essere un matematico e logico trovò il tempo di dare vita a uno dei più importanti personaggi della letteratura inglese (in Alice nel paese delle meraviglie con lo pseudonimo di Lewis Carrol, n.d.t.), scriveva prima della diffusione del concetto di teste di serie. Propose un’alternativa al torneo a eliminazione diretta che a suo dire garantiva l’assegnazione esatta dei primi tre premi ai tre giocatori più forti. Il suo ragionamento però poggiava su una visione non probabilistica del significato di migliore. Certamente meritevole di approfondimento, ma per un’altra occasione.

Analysing the effectiveness of tennis tournament seeding

La fortuna del sorteggio: Australian Open 2020 (donne)

di Chapel Heel // HiddenGameOfTennis

Pubblicato il 19 gennaio 2020 – Traduzione di Edoardo Salvati

Come per gli uomini, anche per le donne ho eseguito una simulazione (con la mia variante Elo) di 100.000 configurazioni del tabellone principale, utilizzando lo stesso metodo che gli organizzatori usano per assegnare ai giocatori la loro posizione. L’ho poi confrontata con la previsione per il torneo su base Elo rispetto al tabellone effettivo.

La tabella mette a confronto la previsione effettiva del tabellone con i risultati dalle simulazioni di rimescolamento, in modo da avere alcune indicazioni sull’accessibilità del tabellone effettivo rispetto alle altre configurazioni. Tonalità di rosso (e arancione) evidenziano la sfortuna del giocatore. Al contrario, tonalità di verde rappresentano la fortuna ricevuta nel tabellone effettivo, in riferimento a un particolare turno. Il giallo simboleggia neutralità, e si può di fatto ignorare qualsiasi valore superiore o inferiore allo 0.2%.

Per una presentazione più compatta rispetto al passato, ho riportato nella tabella solo le teste di serie, e organizzato nella tabella successiva quei giocatori fuori dalle teste di serie per i quali c’è stata un’incidenza degna di nota (almeno l’1.0% di segno positivo o negativo).

Tabellone effettivo e simulato a confronto per le teste di serie

Generalmente, si vedono un po’ di tonalità di rosso e di verde nei numeri relativi ai quarti di finale, ma da li in avanti è quasi tutto giallo o sui toni dell’arancione. In questo senso la riga di Naomi Osaka appare particolarmente negativa (che ha superato il primo turno, n.d.t.), all’opposto quella di Serena Williams decisamente positiva (anche lei vincitrice al primo turno, n.d.t.). Forse è la volta buona per Williams di raggiungere il record di Slam di Margaret Court.

IMMAGINE 1 – Confronto tra tabellone effettivo e simulazioni per le teste di serie

Effetti di rilievo su una selezione di giocatrici fuori dalle teste di serie

A Maria Sharapova non era andata bene agli US Open 2019, forse in Australia la fortuna sta cercando di recuperare (ha però perso subito al primo turno, n.d.t.). Caroline Wozniacki invece non ha ricevuto nessun regalo di addio alle competizioni (ma ha superato il primo turno, n.d.t.).

IMMAGINE 2 – Effetti della casualità del sorteggio su alcune non teste di serie

Luck of the Draw: Australian Open 2020 (Women)

La fortuna del sorteggio: Australian Open 2020 (uomini)

di Chapel Heel // HiddenGameOfTennis

Pubblicato il 19 gennaio 2020 – Traduzione di Edoardo Salvati

Come d’abitudine per gli Slam, ho eseguito una simulazione (con la mia variante Elo) di 100.000 configurazioni del tabellone principale, utilizzando lo stesso metodo che gli organizzatori usano per assegnare ai giocatori la loro posizione. L’ho poi confrontata con la previsione per il torneo su base Elo rispetto al tabellone effettivo.

La tabella mette a confronto la previsione effettiva del tabellone con i risultati dalle simulazioni di rimescolamento, in modo da avere alcune indicazioni sull’accessibilità del tabellone effettivo rispetto alle altre configurazioni. Tonalità di rosso (e arancione) evidenziano la sfortuna del giocatore. Al contrario, tonalità di verde rappresentano la fortuna ricevuta nel tabellone effettivo, in riferimento a un particolare turno. Il giallo simboleggia neutralità, e si può di fatto ignorare qualsiasi valore superiore o inferiore allo 0.3%.

Per una presentazione più compatta rispetto al passato, ho riportato nella tabella solo le teste di serie, e organizzato nella tabella successiva quei giocatori fuori dalle teste di serie per i quali c’è stata un’incidenza degna di nota (almeno lo 0.5% di segno positivo o negativo).

Tabellone effettivo e simulato a confronto per le teste di serie

Rispetto a tabelloni casuali, la parte bassa del tabellone principale è più difficile di quella alta. A David Goffin non è andata proprio bene essendo finito nella sezione del giocatore più in forma del momento, Andrey Rublev, che invece è tra i più fortunati, come Matteo Berrettini. Pensavo che la testa di serie numero 8 per Berrettini fosse eccessiva, perché non mi sembra tra i primi otto favoriti, ma so che le teste di serie procedono in automatico. Comunque, ha il tabellone più fortunato tra tutte le teste di serie.

IMMAGINE 1 – Confronto tra tabellone effettivo e simulazioni per le teste di serie

Effetti di rilievo su una selezione di giocatori fuori dalle teste di serie

Kevin Anderson ha giocato abbastanza bene all’ATP Cup. Con un pò di fortuna potrebbe superare un po’ di turni, magari fino agli ottavi. I quarti di finale sembrano troppo ambiziosi. Fresco vincitore del primo torneo, Ugo Humbert non è stato ricompensato con un percorso semplice. Ma non credo farà troppa differenza perché, anche scarico di adrenalina, dovrebbe perdere da John Millman al primo turno.

IMMAGINE 2 – Effetti della casualità del sorteggio su alcune non teste di serie

Luck of the Draw: Australian Open 2020 (Men)

Chi è la più forte? Alla ricerca della grandezza femminile con le valutazioni Elo

di Jeff Sackmann // TennisAbstract

Pubblicato il 9 gennaio 2020 – Traduzione di Edoardo Salvati

Nell’ultimo podcast, insieme a Carl Bialik e Jeff McFarland si è parlato della posizione di Caroline Wozniacki tra le grandi dell’era Open. È nelle prime 10 per numero di settimane al primo posto, ma ha vinto solo uno Slam. Secondo l’indice Championship Shares di McFarland, entra a malapena tra le prime 30. Alla stessa domanda su Twitter, la maggioranza si è schierata per un posto fuori dalle prime 20:

È sempre difficile mettere a confronto le diverse forme di successo di una giocatrice — le settimane al primo posto, gli Slam vinti e altri titoli — anche senza provare a tenere conto dell’epoca in cui sono state ottenute. Altrettanto complicato è il paragone tra differenti tipologie di carriera. Per più di un decennio, Wozniacki ha dimostrato di essere una costante minaccia al vertice del tennis, rispetto ad altre che hanno vinto più slam ma con un’esplosione di alto livello di gioco concentrata in un tempo molto più ridotto.

Arriva Elo in soccorso

Quanto deve essere forte una giocatrice per essere considerata una “grande”? Non mi aspetto una posizione univoca ma, come vedremo, il consenso non è necessario. Se diamo un’occhiata alle valutazioni Elo del momento, emerge un numero netto che fa al caso nostro. Ci sono sette giocatrici con una valutazione superiore a 2000: Ashleigh BartyNaomi OsakaBianca AndreescuSimona HalepKarolina PliskovaElina Svitolina, e Petra KvitovaAryna Sabalenka non rientra nel gruppo per pochissimo.

Altre 25 giocatrici in attività hanno raggiunto, alla massima forma, una valutazione di almeno 2000, dalle grandi di sempre come Serena Williams e Venus Williams fino a giocatrici con un breve ma intenso periodo di eccellenza, come Alize Cornet e Anastasia Pavlyuchenkova. Dal 1977, 88 giocatrici hanno terminato almeno una stagione con una valutazione Elo di 2000 o più punti, e 60 ci sono riuscite almeno due volte.

I limitati dati a disposizione costringono a partire dal 1977. Non ho risultati completi, o nemmeno qualcosa di simile, per l’inizio e la metà degli anni ’70. Sfortunatamente, questo si traduce nella sottovalutazione di alcune giocatrici la cui carriera è iniziata prima del 1977, come Chris Evert, e in una valutazione ancora più risicata delle grandi del decennio precedente, come Billie Jean King e Margaret Court. Nell’elenco definitivo delle 60 ci sono giocatrici degli ultimi 45 anni che chiunque considera di élite, insieme alla solita dose di sorprese (vi ricordate di Irina Spirlea?). Ne parlerò in dettaglio a breve.

La misura della grandezza

Raggiungere una valutazione Elo di 2000 a fine stagione è un traguardo notevole. Per le più grandi però, si tratta semplicemente dello standard d’ingresso. Serena ha avuto anni con valutazione sopra ai 2400 e Steffi Graf è riuscita a superare 2500. Per ogni stagione, trasformerò la valutazione Elo a fine anno in un “quoziente di grandezza”, facilmente inteso come la differenza tra la valutazione a fine anno e il valore 2000. Nel 2019, Barty ha terminato la stagione con una valutazione di 2123, quindi il suo quoziente di grandezza (QG) è 123.

Per misurare la grandezza di una giocatrice sull’arco della carriera, troviamo tutte le stagioni con una valutazione Elo maggiore di 2000 e le sommiamo. Per Serena, si tratta della somma del quoziente di 20 stagioni singole, un risultato incredibile. Wozniacki ne ha avute nove mentre, per il momento, quelle di Barty sono due. Mi dilungherò più avanti sui motivi di preferenza per questa metodologia e sul significato dei numeri che emergono.

Vediamo prima la classifica. La tabella mostra tutte le giocatrici con almeno due stagioni valide ai fini del computo. La colonna “Stagioni” indica il numero di anni con una valutazione Elo a fine stagione di almeno 2000 punti, mentre la colonna “Max” è la più alta valutazione Elo a fine stagione mai raggiunta dalla giocatrice.

Class Giocatrice                Stagioni  Max   QG  
1     Steffi Graf                     14  2505  4784  
2     Serena Williams                 20  2448  4569  
3     Martina Navratilova             17  2442  4285  
4     Venus Williams                  14  2394  2888  
5     Chris Evert                     14  2293  2878  
6     Lindsay Davenport               12  2353  2744  
7     Monica Seles                    11  2462  2396  
8     Maria Sharapova                 13  2287  2280  
9     Justine Henin                    9  2411  2237  
10    Martina Hingis                   8  2366  1932  
11    Kim Clijsters                    9  2366  1754  
12    Gabriela Sabatini                9  2271  1560  
13    Arantxa Sanchez Vicario         12  2314  1556  
14    Amelie Mauresmo                  6  2279  1113  
15    Victoria Azarenka                9  2261  1082  
16    Jennifer Capriati                8  2214   929  
17    Jana Novotna                     9  2189   848  
18    Conchita Martinez               11  2191   836  
19    Caroline Wozniacki               9  2189   674  
20    Tracy Austin                     5  2214   647  
                                                      
Class Giocatrice                Stagioni  Max    QG  
21    Mary Pierce                      8  2161   637  
22    Elena Dementieva                 9  2140   629  
23    Simona Halep                     7  2108   562  
24    Svetlana Kuznetsova              6  2136   543  
25    Hana Mandlikova                  6  2160   516  
26    Jelena Jankovic                  4  2178   450  
27    Pam Shriver                      5  2160   431  
28    Vera Zvonareva                   5  2117   414  
29    Agnieszka Radwanska              8  2106   399  
30    Ana Ivanovic                     5  2133   393  
31    Petra Kvitova                    6  2132   346  
32    Na Li                            4  2095   310  
33    Anastasia Myskina                4  2164   290  
34    Anke Huber                       6  2072   277  
35    Mary Joe Fernandez               4  2110   274  
36    Nadia Petrova                    6  2094   265  
37    Dinara Safina                    3  2132   240  
38    Andrea Jaeger                    4  2087   237  
39    Angelique Kerber                 4  2109   224  
40    Nicole Vaidisova                 3  2121   222  
                                                      
Class Giocatrice                Stagioni  Max    QG  
41    Manuela Maleeva Fragniere        6  2059   194  
42    Anna Chakvetadze                 2  2107   174  
43    Ashleigh Barty                   2  2123   162  
44    Helena Sukova                    3  2078   150  
45    Jelena Dokic                     2  2110   142  
46    Iva Majoli                       2  2067   119  
47    Elina Svitolina                  3  2052   108  
48    Garbine Muguruza                 2  2061    98  
49    Zina Garrison                    2  2065    96  
50    Samantha Stosur                  3  2061    92  
51    Daniela Hantuchova               2  2050    80  
52    Irina Spirlea                    2  2064    76  
53    Nathalie Tauziat                 3  2041    73  
54    Patty Schnyder                   2  2057    70  
55    Chanda Rubin                     3  2034    68  
56    Marion Bartoli                   2  2033    66  
57    Sandrine Testud                  2  2041    62  
58    Magdalena Maleeva                2  2024    41  
59    Karolina Pliskova                2  2028    37  
60    Dominika Cibulkova               2  2007     7

È possibile che qualche posizione non vi trovi d’accordo. Vale anche per me, non è l’elenco a cui avrei pensato, ma la reazione immediata è che siamo comunque di fronte a un risultato solido nonostante la semplicità dell’algoritmo. In generale, le giocatrici con massimi su più anni sono vicine al vertice, ma solo perché hanno mantenuto eccellenza per gran parte della carriera. Un massimo di diverse stagioni come quello di Conchita Martinez non determina un passaggio automatico alle prime 10.

Da una prospettiva opposta, è un metodo che assegna credito a quelle giocatrici che hanno avuto un rendimento molto alto per periodi temporali limitati. Amelie Mauresmo e Tracy Austin entrano nelle prime 20 con non più di sei stagioni valide, mentre altre con lo stesso numero di anni con un Elo di almeno 2000, vedasi Manuela Maleeva Fragniere, si trovano molto più in basso.

Steffi, Serena e la soglia di 2000

Qual è esattamente il significato della soglia Elo di 2000 punti? Nell’accezione più semplice, è una linea di demarcazione tra giocatrici da considerare e da eliminare (mi spiace, Aryna, arriverà anche il tuo momento). D’interpretazione meno immediata, è un confronto fra stagioni di altissimo livello. Ad esempio, abbiamo visto che il QG di Barty nel 2019 è stato di 123. Con un Elo di 2505, nella stagione 1989 Graf ebbe un QG di 505. La scelta della soglia di 2000 punti implica che la stagione migliore di Graf ha approssimativamente un valore quattro volte quello della stagione migliore di Barty. Non è però una legge fisica. Se cambiassimo la soglia a 1900, il QG di Barty sarebbe 223, rispetto a 605 del migliore QG di Graf. In questo modo, la stagione di Graf varrebbe circa solo tre volte tanto.

Più bassa la soglia, maggior valore attribuiamo alla longevità e minore a stagioni veramente eccezionali. Riducendo la soglia a 1950, Serena prende il posto di Steffi in cima alla classifica (ma, in ogni caso, sono molto vicine). Anche se Williams ha avuto uno dei massimi più alti nella storia del tennis, è la sua longevità a renderla una giocatrice fuori dal comune. Non voglio ritrovarmi a decidere chi tra Serena o Steffi dovrebbe essere al primo posto, perché non è una statistica precisa e, per quanto mi riguarda, è in sostanza un pareggio (e lasciando da parte il discorso sulla differenza tra epoche). Non voglio nemmeno accomodare i parametri per far emergere un risultato invece di un altro.

La posizione di Wozniacki

Arriviamo a Wozniacki, da cui è partito questo articolo. Il quoziente di grandezza la mette al 19esimo posto tra tutte le giocatrici dal 1977, quasi esattamente a metà strada tra la sua posizione nell’elenco delle settimane al numero 1 e quella nella Championship Shares, che attribuisce più peso ai titoli vinti. In possesso di dati migliori per il primo decennio dell’era Open, Wozniacki, in compagnia di altre giocatrici, perderebbe qualche posizione. King, Court e Evonne Goolagong Cawley la farebbero uscire dalle prime 20. Anche Viriginia Wade potrebbe reclamare spazio tra le prime 20. Si potrà sempre discutere sull’esatta posizione di Wozniacki, ma siamo arrivati a un intervallo plausibile per la vincitrice degli Australian Open 2018.

Soluzioni che mirano a ottenere un numero specifico non sono mai perfette, in parte perché dipendono da ipotesi come la soglia Elo di cui si è parlato. Il fatto che producano elenchi che sembrano autorevoli, non significa che possano rappresentare l’ultima parola in merito. Di contro, offrono benefici enormi in discussioni di questo tipo, perché permettono di trovare un accordo su aspetti minori altrimenti irrisolvibili, come il livello della competizione quando si agguanta il primo posto della classifica, la fortuna del tabellone agli Slam vinti e persi, l’impatto del calendario sulla classifica, e via dicendo.

Grazie a una valutazione che incorpora i risultati di tutte le partite contro tutte le avversarie, Elo tiene conto di queste informazioni. Nel confronto tra le grandi di sempre, molti tifosi fanno spesso affidamento a un solo numero, gli Slam vinti. Con il quoziente di grandezza possono fare ora molto meglio.

Who’s the GOAT? Balancing Career and Peak Greatness With Elo Ratings

Un’introduzione all’uso di Elo nel tennis

di Jeff Sackmann // TennisAbstract

Pubblicato il 3 dicembre 2019 – Traduzione di Edoardo Salvati

Elo è il nome di un sistema di valutazioni di giocatori e giocatrici di tennis di qualità superiore rispetto alle formule che determinano le classifiche ufficiali per il circuito maschile e femminile. Da lettori seriali del mio blog o ascoltatori del podcast, ne sarete sicuramente venuti a conoscenza. A meno però di esservi ritrovati a contatto diretto con le valutazioni Elo in precedenza o di aver approfondito personalmente li tema, potreste pensare che sia una sorta di concetto che pertiene la sfera mitologica del tennis. Vale la pena dedicare del tempo a una comprensione più dettagliata del suo funzionamento.

L’algoritmo di base

Il principio sottostante qualsiasi sistema Elo è quello per cui la valutazione di un giocatore è una stima della sua bravura, che è possibile aggiornare dopo ogni partita (o torneo). Se un giocatore vince, la sua valutazione aumenta. Se perde, diminuisce. Dove Elo eccelle, è nel determinare l’ammontare secondo cui la valutazione dovrebbe salire o scendere.

Due sono le variabili principali considerate: quante partite sono già presenti nel sistema (vale a dire, quanta sicurezza abbiamo nella valutazione prima della partita) e la qualità dell’avversario. Riflettendoci bene, queste due variabili sono una buona approssimazione dell’idea che ci siamo già fatti della bravura di un giocatore. Più informazioni possediamo di un giocatore, più difficilmente cambieremo l’opinione che ne abbiamo sulla base di una sola partita.

La sconfitta di Novak Djokovic contro Dominic Thiem nel girone delle Finali di stagione è stata una sorpresa, ma solo il tifoso più apocalittico ha interpretato il risultato come un disastro che avrebbe dovuto modificare la stima della bravura di Djokovic. In modo analogo aggiustiamo l’opinione di un giocatore rispetto alla qualità dell’avversario. Una sconfitta contro Thiem genera delusione, ma una contro Marco Cecchinato, come nella semifinale del Roland Garros 2018, è più preoccupante. Il sistema Elo incorpora questo tipo di intuizioni istintive.

L’ampiezza delle valutazioni Elo

Tradizionalmente, all’ingresso nel sistema Elo e prima di accumulare risultati, un giocatore riceve una valutazione di 1500. È un numero completamente arbitrario. Tutto quello che conta è la differenza tra le valutazioni dei giocatori: se assegnassimo di partenza 0, 100 o 888, il risultato finale di quella differenza rimarrebbe il medesimo.

Quando ho iniziato a calcolare le valutazioni Elo, ho mantenuto la tradizione di partire da 1500. Negli anni, ho allargato l’orizzonte ai Challenger (e agli equivalenti tornei nel circuito femminile organizzati dalla Federazione internazionale) e alle qualificazioni del circuito maggiore. In assenza di un correttivo, la scala dell’intero sistema sarebbe stata alterata, generando inevitabile confusione. Quindi, ho sostituito il valore di 1500 con un numero poco superiore a 1200 (in funzione della categoria del torneo e della distinzione tra uomini e donne), così da ottenere una valutazione sostanzialmente identica.

Attualmente, il numero uno e la numero uno del mondo sono Rafael Nadal e Ashleigh Barty, con una valutazione Elo di 2203 per Nadal e 2123 per Barty. Questo è l’intervallo in cui stazionano i migliori, e i fenomeni assoluti spesso si avvicinano a 2500. Secondo la più recente versione del mio algoritmo, il picco di Djokovic è stato di 2470 e quello di Serena Williams di 2473. La quota di 2000 separa con buona precisione le élite dagli altri giocatori. Al momento, sei uomini e sette donne hanno valutazioni così alte. Sedici uomini e diciotto donne hanno valutazioni di almeno 1900. Una valutazione di 1800 equivale grossomodo a un posto tra i primi 50.

Confronto tra epoche e inflazione Elo

Se si riesce ad assegnare un valore Elo massimo a ogni giocatore, viene automatico iniziare a fare confronti tra epoche. Seppur un passatempo divertente, sono convinto che nessun sistema di valutazione dei giocatori di tennis abbia una qualche utilità ai fini di un raffronto tra epoche diverse, neanche Elo. Quello che può fare però è mettere a confronto la bravura di un giocatore rispetto ai suoi avversari.

Nel 1990, Helena Sukova raggiunse un valore di 2123, lo stesso posseduto ora da Barty. Non significa che Sukova era forte al tempo quanto lo è Barty adesso. Significa invece che hanno avuto un rendimento simile contro le rispettive avversarie. Le giocatrici di seconda fascia trent’anni fa erano considerevolmente più deboli, quindi in un certo senso era più facile raggiungere valutazioni molto elevate. Sukova occupava l’undicesima posizione Elo, molto lontana dal 2600 di Steffi Graf.

Questo per dire che Elo non permette un confronto tra epoche a meno di non essere certi che il livello della competizione sia analogo, o a meno di non avere altre idee per gestire quella variabile, un campo minato che ha respinto molti tra coloro che hanno approfondito il tema.

Inflazione e deflazione

Una problematica correlata è il concetto di inflazione o deflazione Elo, che può rendere ancora più complicati confronti tra epoche. Ogni volta che si gioca una partita, vincitore e sconfitto di fatto si “scambiano” alcuni dei loro punti, in modo da lasciare il numero totale dei punti nel sistema inalterato. Quando però un nuovo giocatore fa il suo ingresso, il totale dei punti aumenta. Al ritiro invece, il totale diminuisce.

Sarebbe più facile se addizioni e sottrazioni di punti si equivalessero, in modo da annullarsi, ma per molte competizioni che usano Elo questo non accade. Le addizioni tendono a essere maggiori delle sottrazioni, facendo crescere le valutazioni Elo nel corso del tempo. Non sembra che questo si verifichi con le mie valutazioni, almeno in parte perché ho previsto una penalizzazione per gli infortuni che tengono lontano dal gioco, ma è utile per ricordare che il numero di punti del sistema non è statico, e per ragioni non legate alla bravura dei giocatori di vertice.

Previsioni Elo

Iniziano a essere più chiare le caratteristiche di utilizzo di Elo come sistema che fornisce la valutazione di un giocatore rispetto a quella degli altri. Uno dei principali scopi di qualsiasi sistema di valutazione è la previsione del risultato delle partite, e in questo Elo riesce meglio della maggior parte dei suoi avversari, tra cui anche le classifiche ufficiali dell’ATP e della WTA. L’unico parametro necessario per fare una previsione è la differenza tra la valutazione dei due giocatori, da inserire poi nella seguente formula:

1 – (1 / (1 + (10^((differenza) / 400))))

Se volessimo prevedere una rivincita dell’ultima partita delle Finali di Coppa Davis, dovremmo prendere le valutazioni di Nadal e Denis Shapovalov (2203 e 1947), calcolare la differenza (256) e applicare la formula, ottenendo una probabilità di vittoria per Nadal dell’81.4%. Con la differenza negativa (-256) avremmo ottenuto la speculare probabilità di un risultato a sorpresa per Shapovalov del 18.6%.

La mia versione Elo nel tennis si basa sul formato più classico delle partite, cioè quello al meglio dei tre set. Per le partite al meglio dei cinque set il calcolo si complica, ma per chi fosse interessato ho scritto del codice. Il punto è che occorre un aggiustamento. Dovessero Nadal e Shapovalov giocare contro agli Australian Open 2020, la probabilità di vittoria di Nadal salirebbe all’86.7%.

Elo specifico per superficie

Per la maggior parte degli sport, ci si potrebbe fermare qui. Una partita è una partita, con poche altre variazioni marginali. Nel tennis però, valutazioni e previsioni dovrebbero variare sensibilmente in funzione della superficie.

Ammetto che la mia soluzione è un po’ complicata. Per ogni giocatore, ci sono quattro diverse valutazioni Elo: complessiva, specifica per il cemento (ma senza distinzioni tra campi all’aperto e al chiuso), specifica per la terra battuta e specifica per l’erba. Ad esempio, Thiem ha una valutazione complessiva di 2066, di 1942 sul cemento, di 2031 sulla terra e di 1602 sull’erba (la specificità di superficie in genere abbassa le valutazioni: quella di Thiem sulla terra è al terzo posto del circuito e lo pone un abisso davanti a tutti gli altri giocatori ad eccezione di Nadal e Djokovic).

Queste valutazioni specifiche per superficie permettono un confronto tra giocatori ignorando i risultati su tutte le altre superfici. Non è però un esercizio realistico, perché la valutazione relativa alla singola superficie non ha un grande potere predittivo dei risultati delle partite.

Una combinazione di superfici

Una soluzione più opportuna arriva da una combinazione al 50% della valutazione per superficie e di quella complessiva. Se volessimo calcolare le probabilità di Thiem per una partita sulla terra, dovremmo usare una valutazione a metà tra il 2066 complessivo e il 2031 della terra.

Nelle mie valutazioni Elo settimanali, la singola superficie è indicata con “HardRaw” (o Solo Cemento, e così via), mentre le valutazioni combinate con “hElo”, “cElo” e “gElo” (h per hard = cemento, c per clay = terra e g per grass = erba). Non esiste una legge fisica che impone una combinazione al 50%. Qualsiasi correzione fatta all’algoritmo di base di Elo è dettata esclusivamente da logiche funzionali.

All’inizio, pensavo che una combinazione tra valutazione specifica e complessiva fosse appropriata, perché il successo di un giocatore su una superficie è in qualche modo correlato a quello sulle altre. Mi attendevo che la combinazione fosse diversa per singola superficie, magari usando una percentuale più alta della valutazione complessiva nel caso dell’erba, visto il numero ridotto di partite su quella superficie. Alla fine però, dalle mie prove è emerso che il 50% funziona su tutte le superfici.

Senza correzioni

Un sondaggio tra appassionati su quali sono le partite più importanti e di quali tornei — per la classifica, per il dibattito sul più forte di sempre, o per qualsiasi altra questione — potrebbe portare a una lunga e dettagliata lista di fattori che definiscono il concetto di grandezza. Forse sono gli Slam a essere più importanti dei Master o dei Premier, anche se forse questi sono meno rilevanti delle Finali di stagione e delle Olimpiadi, e naturalmente le finali sono fondamentali, pure gli scontri diretti tra determinati giocatori, e così via all’infinito.

Elo fornisce una soluzione. Un coefficiente solitamente chiamato “fattore k” permette di assegnare maggiore peso a determinate partite. È frequente nelle valutazioni Elo di altri sport, ad esempio per le partite dei playoff che hanno un fattore k più alto rispetto a quelle della stagione regolare. Ho sperimentato ogni sorta di valore del fattore k per le partite considerate “importanti”, ma devo ancora trovare un’impostazione del sistema che migliori in modo continuativo la sua capacità di fare previsioni sul risultato di una partita.

La penalizzazione per assenza dal circuito

Esiste un’eccezione. In caso di assenza duratura, diminuisco la valutazione del giocatore, per poi aumentare il fattore k nelle prime partite successive al rientro. Ne avevo già parlato in questo articolo. Si tratta di un’estensione logica del modello Elo, specialmente se si pensa alla tipica disposizione mentale che si ha nei confronti di un giocatore rimasto a lungo lontano dal circuito per infortunio. Non si sa mai bene cosa attendersi quando rientra, se è più forte che mai o se è ancora troppo lento. Magari ritornerà in forma presto o magari non recupererà mai la forma di un tempo. Una lunga assenza solleva molte domande. Raramente chi arriva da un infortunio è a un livello superiore al precedente, mentre in molti fanno peggio, mostrando rendimenti in media inferiori.

È inevitabile quindi che, all’immediato rientro da un infortunio, la stima del livello di un giocatore sia inferiore. Tuttavia, si dovrebbe assegnare un peso maggiore a risultati da subito molto validi, da cui un valore più alto del fattore k, che incorpora nella valutazione di un giocatore la mancanza di fiducia che abbiamo sulle sue condizioni successive al rientro da un infortunio. L’algoritmo si complica, ma la logica è semplice. In sostanza, è solo il tentativo di dare rigore interpretativo ad affermazioni del tipo “non so quanto giocherà bene al rientro, ma lo seguirò attentamente”.

La penalizzazione per assenza ha l’effetto collaterale positivo di bilanciare la naturale tendenza di Elo a un’inflazione nelle valutazioni. Se da un lato ci sono più giocatori che entrano nel sistema di quelli che ne escono, facendo aumentare il numero complessivo dei punti disponibili, la penalizzazione toglie dei punti senza che vengano poi allocati nuovamente agli altri giocatori.

La validazione di Elo e altre misure correttive

Più volte ho detto di aver fatto delle prove, oltre ad aver iniziato l’articolo affermando che Elo è di qualità superiore rispetto alle classifiche ufficiali. Cosa significa esattamente, e perché lo si può dire? Il modo più semplice con cui paragonare sistemi di valutazione è una statistica chiamata “accuratezza”, che conta le previsioni fatte correttamente. Ad esempio, Elo ha predetto il vincitore in 36 delle 50 partite delle Finali di Coppa Davis, per un’accuratezza del 72%. La classifica ATP ha predetto il vincitore (nel senso che il giocatore con la classifica più alta ha vinto la partita) in 30, per un’accuratezza del 60%. L’esperimento è ridotto, ma Elo ha demolito la classifica ufficiale. Ed Elo è considerevolmente migliore quando l’arco temporale copre un’intera stagione.

L’indice di Brier

Per questo scopo è più utile l’indice di Brier, che considera il livello di fiducia riposto in ciascuna previsione. Riprendendo il precedente esempio, Elo assegna a Nadal una probabilità dell’81.4% di battere Shapovalov. Se Nadal effettivamente vince la partita, l’81.4% è una previsione “migliore” diciamo rispetto a una del 65%, ma è “peggiore” di una del 90%. L’indice Brier calcola la media del quadrato della differenza tra la previsione (81.4%) e il risultato (0% o 100% a seconda di chi ha vinto), per tutte le partite in oggetto. Remunera l’impudenza di quelle previsioni che si sono rivelate corrette ma, poiché usa il quadrato della differenza, punisce severamente le previsioni aggressive ma sbagliate.

Un metodo più intuitivo per capire la natura dell’indice Brier è di ipotizzare che Nadal e Shapovalov giochino 100 partite di fila (o, con più precisione ma meno intuitivamente, ipotizzare che cento identici Nadal giochino in contemporanea contro cento identici Shapovalov). Una previsione dell’81.4% significa che ci si attende che Nadal vinca 81 o 82 delle 100 partite. Se Nadal ne vince poi 90, la previsione non è stata sufficientemente favorevole nei confronti di Nadal. Non avremo mai cento partite di quel tipo in simultanea, abbiamo però migliaia di partite uniche, molte delle quali hanno la stessa previsione, come il 60% di probabilità di vittoria per il favorito. L’indice di Brier aggrega tutte quelle coppie di previsioni-risultati e restituisce un numero indicativo della bontà del nostro operato.

L’accuratezza ha comunque un valore limitato

È difficile prevedere il risultato delle partite di tennis. A prescindere da quanto è sofisticato un sistema, qualsiasi esso sia, sbaglierà comunque moltissime volte. In molti casi, una previsione “corretta” è a malapena meglio che non fare previsioni, se i dati suggeriscono che i due giocatori sono tra loro alla pari. Per questo, l’accuratezza ha un valore limitato: è più importante avere la giusta dose di fiducia che scegliere semplicemente un vincitore.

Tutte queste parole a dire: le mie valutazioni hanno un indice Brier molto più basso (cioè più preciso) delle previsioni derivanti dalle classifiche del circuito maschile e femminile. Le previsioni fatte con Elo non sono altrettanto puntuali di quelle degli allibratori, altrimenti dedicherei molto più del mio tempo a scommettere che a scrivere di sistemi di valutazione nel tennis.

L’indice di Brier permette inoltre di stabilire se un determinato correttivo — come la combinazione tra superfici, le assenze da infortunio o il tipo di torneo — rappresentano un miglioramento del sistema. La definizione di una penalizzazione per assenza da infortunio riduce l’indice Brier per l’intero gruppo di previsioni Elo, quindi vale la pena considerarla. Diminuire il fattore k per le partite di primo turno non ha effetti rilevanti, quindi si elimina quella pratica.

Per ulteriore approfondimento

Le mie valutazioni Elo del momento: ATP | WTA

Elo esteso al doppio

…e al doppio misto (in inglese)

Codice per Elo nel tennis (in R, che non ho scritto io)

Una gustosa infarinatura sull’indice di Brier (in inglese).

An Introduction to Tennis Elo

Andreescu, Medvedev e il futuro secondo Elo

di Jeff Sackmann // TennisAbstract

Pubblicato il 10 settembre 2019 – Traduzione di Edoardo Salvati

Con la vittoria agli US Open, che incrementa il bottino del 2019, Bianca Andreescu è finalmente entrata tra le prime 10 della classifica WTA, debuttando al quinto posto. Daniil Medvedev, che durante l’estate ha manipolato l’attenzione del circuito maschile, ha varcato la soglia dei primi 10 solo dopo Wimbledon. Ora occupa la quarta posizione.

Se a una classifica si richiede di predire il futuro, Elo è il sistema migliore. I pronostici fatti con Elo sono significativamente più precisi di quelli che usano i punti classifica. Il primo titolo Premier di Andreescu è arrivato a marzo a Indian Wells, dopo che ha battuto due tra le prime 10, cioè Elina Svitolina in semifinale e Angelique Kerber in finale. La classifica WTA ha reagito facendola salire al 24esimo posto dal numero 60. Già dopo la finale persa a Auckland, Elo vedeva in Andreescu una giocatrice con cui dover fare i conti, mettendola al settimo posto. Dopo altre tre vittorie a Miami, Andreescu è salita tra le prime 5 di Elo.

La prontezza di Elo

Gli algoritmi dietro le classifiche ufficiali impiegano del tempo per accorgersi della presenza di nuove stelle. Elo, invece, reagisce prontamente. Rispetto al metodo di calcolo di ATP e WTA che assegna punti in funzione di un anno di risultati (e in termini di turno raggiunto, non di bravura degli avversari), Elo assegna maggiore importanza a quelli più recenti, con ancora più enfasi per esiti inattesi, come ad esempio sconfitte a sorpresa dei giocatori di vertice.

Gli appassionati sono abituati alla lenta evoluzione della classifica ufficiale, quindi un numero [22] o [15] accanto al nome di Andreescu al Roland Garros e agli US Open non è sembrato fuori luogo. E un giudizio ponderato può avere la sua logica, considerati i passati esempi di giovanissimi che sono rimasti scottati. Elo però ha quasi sempre ragione. Se gli allibratori davano Serena Williams come super favorita nella finale a New York, Elo vedeva in Andreescu la giocatrice più in forma, pronosticandola vincitrice, seppur di poco. Dopo le sette vittorie agli US Open, Elo identifica ora Andreescu come la più forte del circuito, anche se con un margine risicato su Ashleigh Barty. Chi osa non essere d’accordo?

Sulla rampa di lancio

Quando lo scorso ottobre Medvedev ha messo piede tra i primi 10 delle valutazioni Elo per la prima volta, ho messo a confronto i due sistemi di classifica. La maggior parte dei giocatori che guadagna una posizione tra i primi 10 di Elo riesce prima o poi a entrare anche tra i primi 10 della classifica ufficiale, ma Elo è quasi sempre in anticipo. In media, l’algoritmo di Elo seleziona i primi 10 con più di sei mesi di vantaggio sul computer dell’ATP. Medvedev è un buon esempio: ha raggiunto l’ottavo posto di Elo a ottobre 2018, ma gli ci sono voluti altri dieci mesi per avere la stessa posizione nella classifica ufficiale, dopo la finale al Canada Masters.

Andreescu ha colmato il divario più velocemente di Medvedev, nei sei mesi che sono tipicamente richiesti a una giocatrice dall’ingresso tra le prime 10 di Elo a quello nella classifica ufficiale. E non dovrebbe servire molto altro tempo prima di una convergenza perfetta al numero uno delle due classifiche.

Non abbiamo bisogno di Elo per farci dire che Andreescu e Medvedev continueranno presumibilmente a vincere partite ad alto livello. Avendone però riconosciuto l’accuratezza predittiva, vale la pena guardare quali altri giocatori e giocatrici sono sulla rampa di lancio.

Berrettini e Muchova

Dopo gli US Open, la previsione più aggressiva riguarda Matteo Berrettini, che è attualmente al sesto posto. Nella classifica ATP Berrettini è tredicesimo, con una toccata e fuga tra i primi 20 durante l’estate, ed è tra i primi 10 di Elo da metà giugno, quindi ancor prima della semifinale agli US Open. Non solo, ma si trova davanti anche a giocatori giovani ma già avviati come Alexander Zverev e Stefanos Tsitsipas.

In campo femminile, non ci sono sorprese simili tra le prime 10 Elo, il che non significa che ci sia accordo con la classifica WTA. Karolina Muchova, 43esima nonché sua classifica migliore di sempre, è al 23esimo posto di Elo. Anche due veterane e pericoli costanti come Victoria Azarenka e Venus Williams sono confinate fuori dalle prime 40, ma Elo attribuisce loro rispettivamente un 18esimo e 28esimo posto. Da un punto di vista predittivo, la qualità è più importante della quantità, quindi un calendario ridotto non è necessariamente un limite. Elo è ottimista anche su Sofia Kenin, mettendola al 13esimo posto rispetto alla 20esima posizione ufficiale.

Giocatore            Elo   ATP   
Daniil Medvedev        4     4
Matteo Berrettini      6    13
Alexander Zverev       9     6 
Stefanos Tsitsipas    15     7

Giocatrice           Elo   WTA
Bianca Andreescu       1     5
Ashleigh Barty         2     1
Sofia Kenin           13    20
Victoria Azarenka     18    42
Karolina Muchova      23    43
Venus Williams        28    56

Da qui a sei mesi, scommetto che la classifica ufficiale di Berrettini sarà più vicina al sesto posto che al tredicesimo, mentre quella di Muchova più vicina al numero 23 che al 43. Conoscere il futuro è impossibile, ma se si vuole guardare avanti Elo è già li da sei mesi. Occorrerà aspettare per capire se il resto del circuito femminile è in grado di tenere Andreescu lontana dal numero 1 così a lungo.

Andreescu, Medvedev, and the Future According to Elo

Unicorni nel circuito femminile

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 12 luglio 2019 – Traduzione di Edoardo Salvati

Con l’avvio della trasferta nordamericana di preparazione agli US Open, Ashleigh Barty si presenta nella parte conclusiva del calendario con la valutazione più alta del circuito femminile in singolo e in doppio. Solo Serena Williams, negli ultimi dieci anni, ha mostrato un dominio simultaneo di questa portata in entrambe le specialità.

Il ritorno al vertice di Simona Halep con la vittoria a Wimbledon contro Williams e la conferma del titolo di Novak Djokovic contro Roger Federer, oltre alla semifinale tra Federer e Rafael Nadal, sono temi molto rilevanti, ma continuo a desiderare qualcosa di veramente diverso che metta in discussione l’ordine precostituito del tennis.

Il nuovo che avanza?

L’ascesa di Barty al primo posto della classifica e l’incredibile parabola di Coco Gauff a Wimbledon sono gli esempi più recenti di nuovo che avanza. Possiamo attenderci simili dinamiche per il proseguo della stagione? In cerca di una risposta, ho analizzato le classifiche più recenti delle valutazioni specifiche per il cemento, utilizzando la variazione del margine di vittoria associata alle valutazioni Elo (argomento di cui ho parlato più tecnicamente alla conferenza Mathsport International ad Atene)

Ho ipotizzato che le valutazioni del doppio vengano generate da partite di singolare contro ciascuna avversaria di doppio. Riconosco che è un calcolo un po’ strano, ma penso fornisca comunque una misurazione ragionevole della bravura relativa sulla base delle sole partite di doppio.
L’immagine 1 riepiloga le prime 10 giocatrici di singolare e doppio secondo questo criterio. Cosa si nota?

IMMAGINE 1 – Elenco delle prime 10 giocatrici di singolare e doppio sulla base del margine di vittoria Elo

Mi colpisce la presenza di Barty al primo posto anche nel doppio. Ho pensato quindi che sia un evento raro, vista l’abitudine delle giocatrici di vertice di concentrarsi quasi esclusivamente sul singolare, almeno negli ultimi anni. Mi viene in mente il termine “unicorno” e come sia diventato l’appellativo di riferimento per le start up che raggiungono una valutazione superiore al miliardo di dollari.

Ho trovato degli unicorni nel tennis?

Per verificare la rarità di una contestuale presenza al vertice di singolare e doppio nel tennis femminile moderno, ho considerato il margine di vittoria associato alle valutazioni Elo di tutte le superfici raggiunto da ciascuna giocatrice in singolare e in doppio per ogni anno dal 2003. Ho classificato le giocatrici sulla base della miglior valutazione stagionale e raggruppato le prime 5 per ogni stagione in singolare e in doppio. Ho determinato un numero minimo di 8 partite in doppio per un dato anno, in modo da creare una casistica ampia a sufficienza da ricomprendere singolariste di buon livello che giocano in doppio solo negli Slam ma riescono a superare il primo turno abbastanza spesso.

In poco più di 15 anni, solo 7 giocatrici hanno raggiunto il vertice in singolare e in doppio nella stessa stagione. E solo Serena, oltre a Barty, è arrivata in cima in entrambe le specialità in un qualsiasi momento della carriera. Se avessi potuto procedere a ritroso ancora per qualche anno, è probabile che anche Venus Williams e Lindsay Davenport sarebbero entrate nell’elenco. E, ancora più indietro, Martina Navratilova sarebbe stata un chiaro esempio di unicorno dei primi anni della WTA, un periodo in cui essere forti in singolare e in doppio era forse più frequente.

La rarità di Barty

Tornando ai tempi nostri, mi convinco sempre più che Barty sia una giocatrice speciale. La media di 2467 della sua valutazione massima, sulla base del rendimento alla settimana del 12 luglio 2019, è superata solo dalle stagioni 2009-2010 e 2012-2013 di Serena. Va detto che se Barty è al momento la giocatrice di doppio più forte sul cemento, spetta a Timea Babos la valutazione più alta su tutte le superfici.

IMMAGINE 2 – Giocatrici al vertice del singolare e del doppio nel periodo dal 2003 al 2019

È interessante anche come, dopo il 2010, Victoria Azarenka (di cui Barty è stata compagna di doppio più volte quest’anno) sia l’unica altra giocatrice a raggiungere lo status di unicorno. E delle restanti quattro — Davenport, Dinara Safina, Kim Clijsters e Venus Williams — solo Venus e Safina ci sono riuscite negli ultimi 15 anni.

Senza Serena e Barty, sarebbero state poche le circostanze per la WTA di osservare le più forti singolariste darsi da fare anche in doppio. È un richiamo a quanto i circuiti maschile e femminile sembrino in realtà una raccolta di sotto-circuiti diversi, con alcuni che giocano solo il singolare, alcuni solo il doppio e gli altri un po’ in uno e un po’ nell’altro.

Servono altre condizioni per il successo del doppio

È già di per sé abbastanza curioso che Barty sia diventata la numero 1 in singolare evitando di trattare il doppio come una sorta di sessione di allenamento. Il fatto che questo sia accaduto in un momento in cui il doppio sta generando grande eco, lo rende ancora più avvincente. Alcune delle soddisfazioni maggiori in doppio nel 2019 sono arrivate dal ritorno in campo di Andy Murray al Queens e dal debutto della coppia Murray-Serena nel misto a Wimbledon. Se si pensa anche all’entusiasmo del confronto tra Roger Federer e Serena in doppio alla Hopman Cup, si è portati a credere che il 2019 sia l’anno del doppio.

La triste realtà è che si lega il successo del doppio in larga parte al quasi ritiro in singolare di Murray. E non sono queste le circostanze di cui c’è bisogno perché un giocatore di vertice in singolare si dedichi più spesso al doppio. Però, con la Hopman Cup dal futuro incerto e ulteriori tornei in singolare e di squadra che cercano di farsi strada in calendario, il tennis non lascia troppe opzioni ai giocatori. Già ne si vedono le conseguenze su Barty, costretta al ritiro negli ultimi due tornei di doppio.

Se si trovasse un modo di appoggiare i giocatori e le giocatrici che più promettono di eccellere in singolare e in doppio, gli unicorni nel tennis non sarebbero poi così rari.

Unicorns of the WTA

Quanto è forte Cori Gauff al momento?

di Jeff Sackmann // TennisAbstract

Pubblicato il 7 luglio 2019 – Traduzione di Edoardo Salvati

Cori Gauff, la quindicenne rivelazione di Wimbledon 2019, è al numero 313 della classifica. Ha giocato solo in pochi tornei tra quelli considerati dal sistema di punteggio della WTA. Prima ancora quindi dell’incredibile ascesa a Londra, si sarebbe potuto pensare che la classifica non rispecchiasse le sue potenzialità. Ma di quanto esattamente?

Al momento, Gauff non rientra nell’elenco della mia classifica Elo perché, prima delle qualificazioni di Wimbledon, non aveva superato la soglia minima delle venti partite durante lo scorso anno almeno a livello di ITF $50K. Possedeva comunque una valutazione Elo di 1488, valida per il 194esimo posto tra le giocatrici che hanno giocato a sufficienza per rientrare nelle valutazioni Elo. Quel valore si traduce all’incirca in un 3% di probabilità di una vittoria a sorpresa contro l’attuale numero uno del mondo Ashleigh Barty, e un 10% di probabilità di battere una giocatrice intorno alla ventesima posizione, come ad esempio Donna Vekic. Con così pochi dati a disposizione, sembrava una stima ragionevole delle possibilità di Gauff.

Da quando è iniziato Wimbledon, ha vinto sei partite: tre nelle qualificazioni e tre nel tabellone principale, contro Venus WilliamsMagdalena RybarikovaPolona Hercog. Non male per una giovanissima che in carriera aveva una sola vittoria di qualificazione a uno Slam e una partita di tabellone principale di un torneo del circuito maggiore!

Il 194esimo posto non sembra più rappresentare una fotografia precisa delle reali potenzialità di Gauff. Qualsiasi giocatrice che, passando attraverso le qualificazioni, raggiunge il quarto turno di uno Slam merita che la sua posizione venga aggiornata, a maggior ragione se ne sapevamo così poco fino a due settimane fa. La parte difficile è capire quale aggiustamento apportare: è diventata una giocatrice tra le prime 100, o le prime 50, o anche le prime 20?

Una revisione tramite Elo

L’algoritmo alla base di Elo è un’ottima approssimazione della modalità con cui le persone rivedono la valutazione di una giocatrice. Più dati sono già in nostro possesso di una giocatrice, più limitata sarà la modifica alla sua valutazione dopo una vittoria o una sconfitta. L’ultima giocatrice a battere Hercog era stata Simona Halep, nel torneo di Eastbourne. Abbiamo anni di risultati di Halep ed era la grande favorita in quella partita. Il fatto che abbia poi vinto non altera l’opinione sul suo valore tennistico, se non marginalmente. In termini di Elo, Halep è passata da 2100 punti a 2102, praticamente nulla.

Il caso di Gauff è ben diverso. Alla vigilia del terzo turno contro Hercog, non solo sapevamo pochissimo del suo livello tecnico, ma non era nemmeno chiaro se fosse la favorita. La vittoria ha portato Elo a una modifica significativa della valutazione, da 1713 a 1755, un incremento 21 volte più ampio di quanto beneficiato da Halep dopo aver battuto la stessa avversaria. I 42 punti aggiuntivi le hanno consentito di sopravanzare sedici giocatrici.

La tabella riepiloga la progressione Elo di Gauff, dall’arrivo a Wimbledon fino alla domenica centrale del torneo. A ogni partita segue il valore complessivo Elo (il numero che abbiamo visto finora), il valore Elo specifico per l’erba, e la ponderazione Elo per l’erba, cioè una combinazione paritetica del complessivo e dello specifico, utilizzata per fare previsioni e pronostici. Per ciascuna delle tre valutazioni è mostrata anche la classifica di Gauff rispetto alle giocatrici con almeno 20 partite nelle ultime 52 settimane.

Partita          Compl.  Cl.  Erba  Cl.  Ponderato  Cl.  
Pre-Wimbledon    1488    194  1350  163  1419       187  
b. Bolsova       1540    171  1405  132  1473       155  
b. Ivakhnenko    1566    157  1447  107  1507       131  
b. Minnen        1614    132  1514   57  1564       95  
b. V. Williams   1670    108  1578   40  1624       73  
b. Rybarikova    1713    83   1650   21  1682       41  
b. Hercog        1755    67   1686   17  1721       31

In solo sei partite, Gauff è salita dal 194esimo posto della classifica Elo complessiva al 67esimo. Ai fini del pronostico, la valutazione su erba è passata dal 187esimo al 31esimo posto. Attualmente, la valutazione ponderata di 1721 è più alta di quella di tre altre giocatrici negli ottavi di finale: Karolina MuchovaCarla Suarez Navarro (che ha perso da Serena Williams, n.d.t.), e Shuai Zhang (che ha vinto contro Darya Yastremska, n.d.t.). Ed è indietro a Elise Mertens (che ha perso da Barbora Strycova, n.d.t.) solamente di 20 punti.

Mi stai dicendo che c’è una possibilità?

Sfortunatamente, nessuna di queste giocatrici relativamente deboli sull’erba è l’avversaria di Gauff negli ottavi. Perché invece giocherà contro Halep, la terza migliore rimasta in tabellone (dopo Barty che però ha perso contro Alison Riske, e Karolina Pliskova che ha perso contro Karolina Muchova, n.d.t.) e che ha già raggiunto tre volte i quarti a Wimbledon. La valutazione Elo ponderata di Halep è di 229 punti superiore a quella di Gauff, che vuol dire che la veterana ha una probabilità del 79% di vittoria. Così la pensa anche il mercato delle scommesse, assegnando a Halep una probabilità di vittoria di circa l’80%.

Normalmente, aggiornare le valutazioni Elo durante un torneo non genera conseguenze rilevanti. Sebbene qualunque giocatrice agli ottavi di finale abbia una valutazione più alta rispetto a quella di inizio torneo, la differenza è tipicamente ridotta. Siccome i pronostici si basano sulla differenza tra la valutazione delle due giocatrici, non c’è variazione nel momento in cui la valutazione di entrambe è aumentata all’incirca nella stessa misura.

Da giovanissima e con una esperienza così ridotta, Gauff esce dagli schemi. La sua valutazione Elo di 1488 prima di Wimbledon ha solo due settimane di vita ed è già assolutamente superata rispetto a quanto sappiamo del livello che è in grado di esprimere. Avrà molte opportunità nei prossimi anni per confermare o smentire l’opinione che si ha di lei ma, per il momento, ci sono validi motivi per pensare che faccia parte delle migliori, a pieno titolo anche rispetto ad alcune delle giocatrici più grandi che hanno raggiunto la seconda settimana di Wimbledon (Gauff ha poi perso da Halep per 6-3 6-3, n.d.t.).

How Good is Cori Gauff Right Now?

Identificare chi è sottovalutato attraverso Elo per i circuiti minori

di Jeff Sackmann // TennisAbstract

Pubblicato l’8 gennaio 2019 – Traduzione di Edoardo Salvati

Ho rivisto le mie valutazioni Elo (maschili e femminili) per fare in modo che incorporino con maggiore precisione il rendimento di quei giocatori che trascorrono più tempo sul circuito Challenger e di quelle giocatrici che gravitano nei tornei dei vari livelli ITF (da quest’anno sotto il nuovo nome di World Tennis Tour, n.d.t.). In precedenza, utilizzavo solo le partite del tabellone principale dei tornei del circuito maggiore. Per i giocatori di vertice, la differenza è marginale, perché non solo Novak Djokovic e Simona Halep non giocano partite nei tornei di fascia inferiore, ma è anche raro che affrontino avversari impegnati più spesso in quelle categorie di competizione. Per i giocatori di secondo livello però l’effetto può essere sostanziale.

Il sistema Elo valuta i giocatori in funzione della qualità degli avversari. Un giocatore che ne batte uno bravo con una valutazione alta vedrà la propria valutazione aumentare con decisione. Battendone invece uno debole, la valutazione migliorerà di poco. In sostanza, Elo guarda a ciascun risultato chiedendosi quanto, sulla base dello stesso, è necessario correggere la valutazione precedente. Quando Bianca Andreescu ha battuto Caroline Wozniacki nel torneo di Auckland a inizio stagione, Elo ha reagito alzando la valutazione di Andreescu di un ampio margine, penalizzando contestualmente Wozniacki per una sconfitta più che canonica. Dopo un risultato più prevedibile come la vittoria di Djokovic contro Damir Dzumur a Doha, la valutazione quasi non si sposta.

L’affidabilità di Elo

Comprendere il funzionamento di base del sistema è importante, ma l’aspetto che più mette d’accordo gli appassionati è l’affidabilità. L’algoritmo genera valutazioni dei giocatori più accurate (da cui pronostici più precisi) rispetto alla classifica ufficiale, maschile o femminile, cioè uno degli altri tentativi di valutare i giocatori. Ora, la classifica Elo è disponibile per un ben più ampio numero di giocatori.

Una delle funzioni di Elo per me più utili è la possibilità di identificare quei giocatori la cui classifica ufficiale non riflette ancora l’effettivo stato di forma. Ad esempio, qualche mese fa ho scritto del fatto che Daniil Medvedev ha raggiunto i primi 10 nelle valutazioni Elo, pur non essendoci riuscito nella classifica ufficiale (al momento è 13esimo, suo massimo in carriera, n.d.t.). Per la maggior parte dei giocatori, entrare nei primi 10 della valutazione Elo significa prima o poi replicare l’impresa nella classifica ATP o WTA.

Altri due esempi di attualità sono Aryna Sabalenka e Ashleigh Barty, che Elo considera tra le prime tre giocatrici del circuito senza che siano però nelle prime 10 della classifica ufficiale. Forse è una visione troppo ottimista, e le distanze al vertice sono davvero ridotte, ma è un chiaro segnale che vale la pena tenere d’occhio queste due giocatrici (a controprova della bontà del sistema Elo, a distanza di pochi mesi Sabalenka è la numero 10 del mondo e Barty la numero 2, a seguito della recente vittoria del Roland Garros, n.d.t.).

Giocatori fuori dai primi 100

Ora che siamo in possesso di graduatorie Elo consolidate estese a più giocatori, cerchiamo di andare più a fondo. Per ciascun circuito, individuiamo giocatori e giocatrici al momento fuori dai primi 100 in possesso della valutazione più alta secondo la formula tra le due più sofisticata. Iniziamo dal circuito maschile (la tabella è aggiornata alla settimana del 17 giugno 2019 e differisce da quella della versione originale, n.d.t.).

Giocatore          Class ATP   Val Elo    
Berdych            108         28
Ferrer             135         30
Lopez              113         64
H. Chung           154         70
Kokkinakis         195         74
Pospisil           186         78
Tomic              100         81
Davidovich Fokina  132         83
Harrison           128         84
Baghdatis          136         86
Darcis             228         87
Paul               134         88
Kudla              109         92
Gojowczyk          123         93
Sinner             209         100
Sela               155         101
Majchrzak          114         102
Ymer               120         104
Marterer           173         105
Mahut              144         109

Si fa notare nell’elenco il numero di veterani. Le valutazioni Elo mantengono più a lungo la posizione rispetto alla classifica ufficiale, che tiene conto solo di 52 settimane di risultati. Questo perché, nonostante i continui aggiustamenti di Elo, le prestazioni di maggiore qualità, anche quando risalgono a più di 52 settimane, incidono sulle valutazioni attuali per un po’ di tempo. David Ferrer ha fatto fatica a mantenere uno stato di forma che gli consentisse di competere ai precedenti livelli, ma, secondo Elo, resta comunque molto pericoloso quando scende in campo (Ferrer si è poi ritirato dal professionismo durante il torneo di Madrid, n.d.t.). Per fortuna non ci sono solo veterani. Secondo Elo, giocatori come Thanasi KokkinakisAlejandro Davidovic Fokina, Mikael YmerTommy Paul hanno una valutazione migliore di quanto non dica la loro classifica.

Giocatrici fuori dalle prime 100

Anche nell’elenco femminile ci sono molte veterane, cioè giocatrici che riescono ad avere un rendimento elevato seppur non con la stessa frequenza di una volta (la tabella è aggiornata alla settimana del 17 giugno 2019 e differisce da quella della versione originale, n.d.t.).

Giocatrice     Class WTA  Val Elo     
Makarova       104        55
Rybarikova     141        56
Kuznetsova     102        59
Niculescu      137        74
Bonaventure    114        76
Minnen         126        78
Townsend       118        80
Vikhlyantseva  106        82
Rybakina       111        83
Boulter        125        84
Kostyuk        180        88
Errani         257        90
Kucova         149        101
Stosur         129        102
Begu           113        103
Lepchenko      121        104
Lottner        182        106
Haddad Maia    119        109
Kumkhum        107        112
McHale         109        113

Parte della ragione che impedisce a molte promesse di comparire in elenco è dovuta alla mia decisione di escludere gli ITF $25K. È il caso ad esempio della diciottenne Kaja Juvan (che ha poi perso al primo turno del Roland Garros da Sorana Cirstea dopo essere passata dalle qualificazioni, n.d.t.), che non ha giocato un numero sufficiente di partite sul circuito maggiore per entrare nell’elenco delle valutazioni Elo. L’anno scorso però ha ottenuto un record di 29-7 nei tornei ITF $25K, dove ha vinto anche le ultime 10 partite (nel 2019, al momento il record nella nuova categoria W25+ è di 15-3, n.d.t.).

Un altra problematica è data dal fatto che, solitamente, le più promettenti tra le giocatrici arrivano nelle prime 100 con più rapidità. Un’altra diciottenne, Dayana Yastremska, si è arrampicata in classifica dopo aver vinto a Hong Kong lo scorso autunno. È ora al 36esimo posto della classifica (avendo raggiunto la massima posizione al numero 32) e dopo 13 vittorie contro giocatrici tra le prime 100 nel 2018, Elo ha una valutazione ancora più ottimistica, affidandole il numero 21.

Continuerò ad aggiornare settimanalmente queste valutazioni Elo estese, oltre naturalmente a utilizzarle per ogni torneo del circuito maggiore e del circuito Challenger. Consultatele anche voi!

Identifying Underrated Players With Minor League Elo