Gli effetti della riduzione del numero di teste di serie negli Slam

Adam Coti // PureFreedom

Pubblicato il 18 gennaio 2018 – Traduzione di Edoardo Salvati

Introduzione

Prima dell’inizio degli Australian Open 2019, sembrava che, dopo diciotto anni di stabilità, il numero di teste di serie negli Slam sarebbe stato ridotto della metà, da 32 a 16. In questo modo, le fasi iniziali del torneo avrebbero avuto partite più competitive. In prospettiva storica, sarebbe stato davvero così? Con un ritorno a tabelloni a 16 teste di serie, ci sarebbero state più vittorie a sorpresa nei primi turni? 

L’analisi che segue riguarda 30.408 partite maschili e femminili negli Slam nel periodo dal 1988 al 2017, nella volontà di trovare una risposta. Inoltre, sarebbe utile cercare di capire quanto spesso le teste di serie più alte o giocatori o giocatrici con classifica più alta riescono effettivamente a vincere in qualsiasi delle loro partite Slam. Sulla probabilità di un favorito di vincere incide il turno in cui si gioca la partite? I giocatori favoriti hanno più probabilità di vincere delle giocatrici favorite? Tre tabelle nella parte conclusiva dell’analisi forniscono qualche chiarimento al riguardo. 

La frequenza di vittoria delle teste di serie per turno di gioco

Dal 1988, quando gli Australian Open hanno allargato il tabellone principale a 128 giocatori, fino al Roland Garros 2001, ci sono stati 54 Slam con 16 teste di serie, rispetto ai 66 Slam fino a tutto il 2017 con 32 teste di serie. Per facilitare un confronto più immediato, i risultati di quest’ultimo gruppo sono stati suddivisi in due sottoinsiemi di teste di serie, 1—16 e 17—32.

È importante notare che questi dati rappresentano medie basate sull’esito di tutte le partite negli Slam. Non si considera come è stato ottenuto il passaggio del turno, se da una vittoria o con un ritiro prima o durante la partita. Si tratta semplicemente del calcolo di quanti giocatori di ciascuna categoria sono rimasti dopo ogni turno. 

Tabellone Maschile

IMMAGINE 1 – Prime 16 teste di serie del tabellone maschile rimaste dopo ciascun turno, dal 1988 al 2017

Note:

  • per gli Slam con 16 teste di serie, il campione è composto da 6858 partite, mentre per gli Slam con 32 teste di serie è di 8382 partite
  • in media, un tabellone di 16 teste di serie ha avuto circa una testa di serie vittoriosa in meno dopo il primo e il terzo turno 
  • la discrepanza più ampia è al secondo turno, come mostrato anche dalla distanza maggiore tra le due linee del grafico
  • dal quarto turno in avanti, l’impatto della riduzione delle teste di serie diminuisce gradualmente.

Tabellone Femminile

IMMAGINE 2 – Prime 16 teste di serie del tabellone femminile rimaste dopo ciascun turno, dal 1988 al 2017

Note:

  • per gli Slam con 16 teste di serie, il campione è composto da 6858 partite, mentre per gli Slam con 32 teste di serie è di 8382 partite
  • l’impatto complessivo del numero di teste di serie non è così rilevante come tra gli uomini, come mostrato da una distanza più ravvicinata tra le due linee del grafico 
  • le discrepanze più importanti, e quasi identiche, sono nel terzo e nel quarto turno.

La competitività delle partite degli Slam

In ogni partita di uno Slam, il favorito può essere determinato in modo oggettivo o tramite le teste di serie o in termini di classifica ufficiale. Vale a dire, se giocano due teste di serie, il giocatore con la testa di serie più alta è il favorito. Se invece giocano due giocatori fuori dalle teste di serie, il favorito è quello con la classifica più alta. In ultimo, se una testa di serie gioca contro un giocatore senza testa di serie, il favorito è la testa di serie. 

Sulla base di queste premesse, quanto spesso il giocatore favorito vince poi la partita in uno Slam? Le tabelle che seguono illustrano la tematica per anno, torneo e turno. 

Per Anno

IMMAGINE 3 – Percentuale di vittoria di favoriti e favorite negli Slam per anno, media mobile di tre anni dal 1988 al 2017

Note:

  • per ciascun anno il campione include tutti gli Slam per un totale di 508 partite per il tabellone maschile e per quello femminile 
  • la frequenza di vittoria del favorito e della favorita si è mossa, generalmente, in direzione opposta nell’ultimo decennio
  • per gli uomini, il punto di flesso si è verificato intorno alla fine degli anni ’90, quando a un declino costante del rendimento dei favoriti è seguito l’inizio di una tendenza di stabile risalita.
  • per le donne, nell’ultimo decennio la percentuale di vittoria delle favorite si è attestata su un declino costante.

Per Torneo

IMMAGINE 4 – Percentuale di vittoria di favoriti e favorite negli Slam per torneo, dal 1988 al 2017

Note:

  • per ciascuno Slam, il campione di partite è di 3810 per tabellone maschile e per tabellone femminile
  • per le donne, le favorite vincono più spesso agli US Open, mentre è al Roland Garros che si verifica il maggior numero di vittorie a sorpresa
  • per gli uomini, i favoriti vincono più spesso agli Australian Open, mentre è a Wimbledon che subiscono più sconfitte a sorpresa.

Per turno

IMMAGINE 5 – Percentuale di vittoria di favoriti e favorite negli Slam per turno, dal 1988 al 2017

Note:

  • le favorite vincono con più continuità nei primi turni rispetto agli uomini, anche se poi sono soggette a più sconfitte in semifinale e finale
  • il turno in cui i favoriti vincono più spesso è il quarto, mentre per le donne è il terzo.

Riconoscimenti

La fonte della maggior parte dei dati grezzi utilizzati nell’analisi è il database dei risultati delle partite del circuito maschile compilato e messo a disposizione da Jeff Sackmann. In caso di dati mancanti, ho fatto riferimento al sito ufficiale dell’ATP e della WTA. Chi volesse approfondire, può scaricare il file Microsoft Excel con i dati grezzi che ho raccolto. 

The Effect of Reducing the Number of Seeds at Tennis Majors

Le regole proposte da Charles Dodgson per i tornei di tennis

di Peter Ellis // FreeRangeStatistics

Pubblicato l’1 febbraio 2020 – Traduzione di Edoardo Salvati

In un precedente articolo, ho analizzato l’impatto dell’assegnazione delle teste di serie in un torneo di tennis. Le teste di serie sono uno dei modi per aumentare la probabilità che i giocatori più forti arrivino nelle fasi conclusive di una competizione a eliminazione diretta, portando a esiti più giusti e a maggiori possibilità di riservare gli scontri più entusiasmanti per la fine del torneo. In sostanza, l’obiettivo è ovviare a questo problema:

In un torneo di Lawn Tennis a cui, quasi per caso, mi capitò di assistere tempo fa, fu portato alla mia attenzione l’attuale metodo di assegnazione dei premi dalle lamentele di uno dei giocatori, che era stato battuto (e aveva conseguentemente perso ogni possibilità di vincere un premio) nei turni iniziali, e che aveva dovuto subire l’umiliazione di vedere conquistare il premio del secondo classificato da un altro giocatore, che lui sapeva essere ben inferiore.

L’episodio appena descritto portò Charles Dodgson, illustre matematico del diciannovesimo secolo dell’Università di Oxford, a proporre un’alternativa all’allora in voga sistema di eliminazione diretta senza teste di serie. Il suo trattato sul tema dal titolo “ LAWN TENNIS TOURNAMENTS: The True Method of Assigning Prizes with a Proof of the Fallacy of the Present Method” si trova alla pagina 1082 dell’opera omnia. Naturalmente, Dodgson è più conosciuto al mondo come autore a tempo perso di libri per bambini con lo pseudonimo di Lewis Carroll, le cui opere includono il capolavoro “Le avventure di Alice nel paese delle meraviglie”, “ Attraverso lo specchio e quel che Alice vi trovò”, “La caccia allo Snark” e il giustamente dimenticato “Sylvie e Bruno”.

Gli elementi di base

Ecco gli elementi di base del sistema elaborato da Dodgson, descritto per un torneo a 32 giocatori:

  • viene tenuto un elenco in cui alla fine di ciascuna partita, accanto a ogni nome si scrive il nome del giocatore o dei giocatori che gli sono stati superiori, o in virtù di una vittoria diretta, o perché hanno battuto qualcuno che a sua volta ci è riuscito (vale a dire se A batte B e B batte C, A e B sono entrambi superiori a C). Non appena accanto al nome di un giocatore ce ne sono altri tre a lui superiori, quel giocatore è cancellato dalla lista
  • nella prima giornata di competizioni, c’è solo una partita per giocatore, con i 32 giocatori che sono accoppiati a due a due a formare 16 coppie
  • per il secondo giorno […] i 16 giocatori che hanno vinto la prima partita sono accoppiati tra di loro, così come i 16 che hanno un superiore (coloro che perdono in quest’ultimo gruppo di coppie avranno 3 superiori ciascuno, e verranno quindi eliminati dalla lista). Per tutte le altre partite i giocatori sono accoppiati allo stesso modo, prima quelli che non hanno mai perso, poi quelli con un superiore e così via, cercando di evitare, quanto possibile, di accoppiare due giocatori che hanno un superiore in comune
  • alla metà del terzo giorno, sono rimasti solo due giocatori senza sconfitte […] e questi due hanno una partita da giocare per tutto il quarto giorno
  • alla fine del quarto giorno si conosce il nome del giocatore che ha vinto il primo premio (grazie allo stesso processo di eliminazione usato nel metodo in vigore): i restanti giocatori sono accoppiati secondo le medesime regole, per le due partite da disputare al quinto giorno.

Teoria contro realtà

L’essenza di questo procedimento è che nessun giocatore è eliminato fino a che non è certo che non sia tra i migliori tre, perché gli eliminati hanno almeno tre superiori da cui hanno perso direttamente o che hanno battuto qualcuno che li ha battuti. Così i migliori tre sono in grado di surclassare tutti gli altri.

Un’osservazione interessante è che, secondo le regole di Dodgson, non serve che il numero di giocatori sia in potenza di due, come nel caso di un classico torneo a eliminazione diretta in cui gli organizzatori vogliono evitare situazioni di bye a senso unico.

Dodgson sostiene che la sua proposta dà garanzia di assegnare con accuratezza il primo, secondo e terzo premio ai migliori tre giocatori. Questa si basa però su alcune ipotesi chiave:

  • la superiorità è transitiva, quindi se A è superiore a B e B a C, allora A è superiore a C
  • la superiorità è deterministica, coerente e costante.

Naturalmente, il mondo reale opera con altri canoni. Ci si interroga quindi sulla bontà del metodo di Dodgson nel momento in cui i risultati delle singole partite non sono costanti e sono incoerenti tra loro, in linea con quanto emerso dalle realistiche simulazioni con valutazioni Elo che ho usato in precedenza. Per scoprirlo, ho simulato tornei impostati secondo le regole di Dodgson con le stesse 128 giocatrici di vertice dal 1990 dei tornei più convenzionali della scorsa analisi. Il codice che ho scritto permette di scegliere l’esito di singoli scontri tra giocatrici, da un lato in senso deterministico (cioè la giocatrice con la valutazione più alta ha garanzia di vincere, come nella dimostrazione a 32 giocatori di Dodgson), dall’altro in senso realisticamente probabilistico (la probabilità di vittoria è casuale, ma legata comunque alla valutazione Elo delle due giocatrici).

Risultati

Se le vincitrici sono deterministici, si arriva a un risultato come quello illustrato da Dodgson

Non deve sorprendere che il suo metodo assegni correttamente i premi in un torneo a 32 giocatori con esiti deterministici delle partite, vista la notevole abilità matematica che possedeva. Ero curioso di vedere se avesse funzionato in presenza di molti più partecipanti, e ho trovato che le sue regole (con modifiche minime) identificano nel giusto ordine i tre giocatori, a cui assegnano i primi tre premi, 100 volte su 100 diverse simulazioni.

Anche un torneo a eliminazione diretta con esito deterministico delle partite e con una corretta attribuzione delle teste di serie farà emergere con precisione le quattro migliori giocatrici il 100% delle volte. Credo che Dodgson pensasse che non si potesse fare affidamento su una conoscenza aprioristica del livello dei giocatori, escludendo quindi la possibilità di un torneo con teste di serie. Di sicuro, l’unico confronto che ha fatto è tra il suo metodo e un tabellone senza teste di serie.

È da notare che nel torneo ipotizzato da Dodgson serviranno all’incirca il doppio delle partite (con variazione a seconda dell’efficienza del tabellone, anche se in media nelle mie simulazioni le partite sono state 240) di un torneo a eliminazione diretta (che ha bisogno di 127 partite per 128 giocatori).

I risultati non sono così puntuali nello scenario in cui le vittorie sono realisticamente probabilistiche

In presenza di esiti non deterministici ma dipendenti dal caso e legati alla differenza di bravura associata alle valutazioni Elo, il metodo di Dodgson non è valido quanto avrebbe sperato. Naturalmente, si tratta sempre di un modello realistico. Anche nel periodo di dominio totale, Steffi Graf (la giocatrice con la valutazione massima tra quelle prese in esame per gli anni ’90) poteva comunque avere qualche probabilità di perdere contro altre giocatrici di vertice in una qualsiasi partita, come visto nel grafico che qui ripropongo.

IMMAGINE 1 – Probabilità di alcune giocatrici tra le prime 128 di battere Graf alla fine del 1990 sulla base delle valutazioni Elo

Efficacia delle teste di serie_2 - settesei.it

Il grafico dell’immagine 2 mostra i risultati di una simulazione di 1000 tornei giocati secondo le regole di Dodgson, con realistiche probabilità di vittoria e sconfitta (quindi non solo 1 e 0). Alcune conclusioni che si possono derivare:

  • le giocatrici di vertice vincono il torneo il 57% delle volte
  • il 36% delle volte giocano la finale le prime due giocatrici e il 23% delle volte vince la testa di serie numero 1
  • le prime tre giocatrici vincono i primi tre premi partita nell’ordine giusto solo il 7% delle volte.

Nel modello deterministico di Dodgson, per queste tre casistiche la probabilità è del 100%.

IMMAGINE 2 – Rendimento delle regole proposte da Dodgson in termini di probabilità della prima, seconda e terza giocatrice di finire il torneo nella giusta posizione

L’efficacia delle valutazioni Elo

Nel modello probabilistico, gli esiti del torneo secondo le regole di Dodgson sono simili a quelli di uno a eliminazione diretta con teste di serie, come ho scritto in precedenza. Ad esempio, in un tabellone con teste di serie, Graf, la giocatrice più forte, vinceva il 60% dei tornei e le prime due giocatrici erano in finale il 42% delle volte. È un risultato marginalmente migliore, rispetto a quanto ottenuto con le regole di Dodgson, in circa la metà delle partite, a evidenza dell’efficacia dell’utilizzo di informazioni aprioristiche sulla bravura delle giocatrici per la determinazione delle teste di serie.

Attuazione

Metodologia

Applicare le regole di Dodgson in modo che fossero sostenibili su un più ampio campione di tornei, su esiti casuali di partite e su risultati non coerenti e non transitivi è stato tutt’altro che banale.

Alcune decisioni:

  • per le coppie iniziali di giocatrici (e gli scontri successivi) ho proceduto casualmente anziché in ordine alfabetico secondo il cognome
  • ho abbandonato l’idea di “turno”, concentrandomi invece sulla successiva partita individuale da giocare, mettendo insieme, ove possibile, giocatrici con lo stesso numero di game giocati e di sconfitte
  • ho introdotto un concetto di “giocatrice scomoda” per un qualsiasi momento, vale a dire una giocatrice che ha giocato meno game delle altre e ha il minor numero di avversarie legittime disponibili a parità di sconfitte, evitando rivincite, etc. Trovare una partita per la giocatrice scomoda è diventata la priorità in ogni iterazione della mia simulazione
  • in alcune circostanze, ho dovuto permettere partite tra giocatrici che avevano giocato, a quella data, un diverso numero di game. Esiste probabilmente una soluzione che non richiede di farlo, ma non ho avuto tempo di cercarla

E ancora:

  • non sono riuscito neanche a escogitare un sistema pratico per il requisito “cercando di evitare, quanto possibile, di accoppiare due giocatori che hanno un superiore in comune”. Tranne che per occorrenze insolite, ho escluso le rivincite così da evitare che l’algoritmo si bloccasse
  • con risultati non deterministici e consentendo le rivincite dove inevitabile, sono emerse alcune contraddizioni da gestire con cautela. Ad esempio, una giocatrice può diventare superiore a se stessa (se A è battuta da B e poi B è battuta da A in una rivincita, la futura A è ora superiore alla passata A, un caso che ho evitato di considerare nel conteggio)
  • è possibile che le ultime quattro giocatrici rimaste abbiano 3 superiori ciascuna come risultante di una singola partita verso la fine del torneo, rendendo il piazzamento non chiaro. Di fronte a questa evenienza, ho suddiviso il primo posto ex-aequo, anche se semifinali e finale sarebbero più realistiche
  • allo stesso modo, può succedere che la giocatrice 2 e 3 (delle tre rimanenti) siano eliminate in un solo passaggio. Questo significa nessuna finale e un play-off per definire il secondo posto.

Interessante e valido, ma di difficile adozione

In ogni caso, si è trattato di un esperimento divertente. Sono soddisfatto del buon funzionamento di questo metodo per lo svolgimento di un torneo, anche al costo di dover giocare quasi il doppio delle partite di un torneo a eliminazione diretta. E, tutto sommato, anche con esiti di partite realisticamente incerti e non costanti. Non è ovviamente perfetto come l’ideale mondo deterministico descritto nel trattato originario di Dodgson. Come il precedente elenco di decisioni e insidie mostra, l’analisi però può complicarsi molto facilmente. Ci sono parecchi casi insoliti e al limite su cui non mi sono soffermato in dettaglio.

A mia conoscenza, il metodo di Dodgson non è mai stato usato per determinare il tabellone di un effettivo torneo, anche se ci sono state alcune simulazioni simili a questa. Non sono sicuro di quanto le intenzioni dello stesso Dodgson fossero serie. Sempre nel trattato accenna alla possibilità di eliminare i set nel tennis a favore in un sistema più semplice come “il primo giocatore che vince 14 game, o che va avanti di 9, vince la partita”. Dubito però che si aspettasse ragionevolmente una calorosa accoglienza delle sue proposte. Vale comunque la pena notare che l’autore del trattato è la figura professionale Charles Dodgson, appassionato di matematica ricreativa, e non Lewis Carroll, autore di libri per bambini.

Diciamo che, come per molte altre sue opere, la pubblicazione ha un merito. Non mi sbilancerei però a suggerirne l’adozione integrale per i moderni tornei di tennis.

Analysing the effectiveness of tennis tournament seeding

Un’analisi dell’efficacia del sistema di teste di serie

di Peter Ellis // FreeRangeStatistics

Pubblicato il 26 gennaio 2020 – Traduzione di Edoardo Salvati

Ispirato dagli Australian Open 2020, ho deciso di indagare in che modo il sistema di teste di serie e la distribuzione dei giocatori nel tabellone principale incidono sul risultato finale di un torneo. Probabilmente ritornerò sull’argomento, ma l’obiettivo odierno è di analizzare l’impatto dell’assegnazione delle teste di serie sulla probabilità per i più forti di vincere, arrivare in finale, in semifinale o nei quarti di finale.

Metto a confronto i risultati di simulazioni di tornei a eliminazione diretta tra questi giocatori in due tipologie di scenari, da un lato un posizionamento del tutto casuale nel tabellone in assenza di teste di serie, dall’altro l’introduzione di 32 teste di serie come accade nei tornei dello Slam.

L’immagine 1 mostra che la scelta della metodologia determina conseguenze differenti: l’adozione delle teste di serie comporta un aumento concreto della probabilità del migliore di vincere o dei due più forti di arrivare in finale, e ha rilevanza ancora maggiore ai fini della determinazione delle semifinali e dei quarti di finale.

IMMAGINE 1 – Impatto del sistema a teste di serie sul risultato che i migliori possono raggiungere

Distribuzione della bravura dei giocatori

Questo significa che, ad esempio, con 32 giocatori che ricevono una posizione speciale in tabellone grazie alla testa di serie, esiste una probabilità del 22% che in semifinale arriveranno i migliori quattro, rispetto una probabilità di solo il 2% con un tabellone casuale. In una assegnazione casuale, la probabilità di vedere i migliori otto nei quarti di finale è di fatto prossima allo zero, mentre in un tabellone con teste di serie succederà il 3% delle volte (che non è comunque molto spesso, aspetto che però non dovrebbe destare stupore tra coloro che seguono il tennis regolarmente). Di contro, la probabilità che le prime due teste di serie siano in finale è del 42% in un tabellone con teste di serie e solo del 20% in uno casuale.

Va sottolineato che questi risultati dipenderanno dalla distribuzione della bravura dei giocatori nello specifico torneo. All’estremo, se il più forte è in grado di dominare tutti gli altri, la presenza delle teste di serie non farà alcuna differenza per la vittoria finale.

Valori teorici di riferimento

Possiamo calcolare altri valori teorici come limiti di riferimento. Ad esempio, se i primi due giocatori fossero effettivamente invincibili contro chiunque tranne che l’altro, si incontrerebbero in finale il 100% delle volte in un tabellone con teste di serie e il 50% delle volte in un tabellone casuale. Qualsiasi valore inferiore (il 42% e il 20% nel nostro caso) identifica il divario tra un livello “decisamente” alto di questi due giocatori nei confronti degli altri e un livello “infinitamente” alto.

Stephanie Kovalchik ha scritto sulle conseguenze dell’ipotesi di riduzione da 32 a 16 teste di serie negli Slam (che non ha poi avuto seguito), in cui ha mostrato che i risultati sarebbero stati meno esatti rispetto a un sistema a 32 teste di serie, dove per esatto s’intende il raggiungimento del turno atteso da parte del giocatore in funzione della sua classifica.

Serie storica di risultati

Per procedere con l’analisi, ho utilizzato dati sulla bravura effettiva relativa dei giocatori ottenuti grazie al pacchetto {deuce} R codificato da Kovalchik. Mi serviva un intervallo realistico di valori sulla bravura che potessero essere applicati a scontri diretti come in un torneo reale. Ho scelto di concentrarmi su un preciso momento temporale invece di una sfida tra ere che, per esempio, avrebbe messo di fronte Margaret Court e Serena Williams. Onde evitare confusione con l’attualità, ho scelto la stagione femminile del 1990. L’immagine 2 riepiloga le prime 10 a fine 1990 sulla base della loro valutazione Elo.

IMMAGINE 2 – Prime 10 giocatrici per valutazione Elo a fine 1990

Tramite dati raccolti da Jeff Sackmann, Kovalchik fornisce le valutazioni Elo per ciascuna giocatrice per specifico momento temporale. Avevo già parlato di Elo in merito al Backgammon e al calcio australiano. Si tratta di un metodo molto efficace per fare valutazioni di giocatori rispetto all’effettivo rendimento, con il grande vantaggio di poterne derivare probabilità per un qualsiasi ipotetico scontro diretto.

La valutazione è oggetto di aggiustamenti incrementali in funzione della rispondenza tra situazione effettiva e probabilità derivate dalle valutazione Elo alla vigilia della partita. Questo ne fa un’indice utile e con capacità di correzione automatica, e facilmente integrabile in un modello statistico.

Per essere sicuro della corretta conversione delle valutazioni Elo di Kovalchik in probabilità, mi affido alla sua funzione elo_prediction() per la stima della probabilità di vittoria in ciascun accoppiamento. L’immagine 3 illustra mostra la probabilità di battere Steffi Graf da parte di una selezione di giocatrici classificate tra la posizione 2 e la 128 in termini di valutazioni Elo (Graf che, dall’inizio dell’era Open, è la giocatrice che la più alta valutazione assoluta).

IMMAGINE 3 – Probabilità di alcune tra le prime 128 di battere Graf alla fine del 1990

La simulazione dei tabelloni e risultati

Per completare la laboriosa attività di simulazione di tornei tra queste 128 giocatrici, ho scritto una funzione simulate_tournament() il cui principale argomento è una struttura dati di 128 righe di fila che rappresentano il tabellone, come nell’immagine 4.

IMMAGINE 4 – Funzione simulate_tournament()

Questo indica ad esempio che nel primo turno giocato (“round of 128”) Dianne Van Rensburg giocherà contro Carling Basset Seguso nella partita 1 (match 1). L’immagine 5 mostra il risultato filtrando per la partita 1 del secondo turno (“round of 64”)

IMMAGINE 5 – Partite del secondo turno della simulazione

Troviamo quattro giocatrici nella partita 1. Però una tra Van Resnburg e Seguso avrà perso nel primo turno, così come una tra Elna Reinach e Wiltrud Probst. Con un po’ di attenzione, l’oggetto brackets riesce a contenere l’intero tabellone principale, e può essere disegnato in modo che le prime 32 teste di serie siano allocate nei singoli quarti come richiesto da un tabellone a 32 teste di serie. Il resto del codice che ho scritto esegue questa simulazione per i due scenari di tabellone che ho individuato in precedenza.

Arriviamo ai risultati

La tabella riepiloga la distribuzione delle vincitrici. Non sorprende che Graf vinca più simulazioni di torneo di qualsiasi altra, 5454 su 10.000 con un tabellone casuale, e 5913 su 10.000 con un tabellone a 32 teste di serie. Anche in un periodo di dominio totale di Graf, ci sono comunque giocatrici (e non solo alcune tra quelle di vertice) con una probabilità di vittoria diversa da zero. Ed è questo che attrae le persone a seguire il tennis. È interessante come da Monica Seles (a quel tempo al terzo posto delle valutazioni Elo) a scendere, è più probabile che una giocatrice vinca il torneo simulato in un tabellone casuale invece che in uno con le teste di serie.

Vincitrice         Class.  No t.d.s.  32 t.d.s.
Graf               1       5454       5913
Navratilova        2       2089       2219
Seles              3       1064       1018
Sabatini           4       510        418
M.J. Fernandez     5       213        132
Martinez           7       110        66
Sanchez Vicario    6       113        63
Capriati           8       89         42
Maleeva Fragniere  9       66         34
Garrison           10      58         26 

Questo rimanda ai risultati evidenziati dal grafico dell’immagine 1 di inizio articolo. Spero presto di riprendere questa tematica e confrontare i due metodi con l’alternativa proposta da Charles Dodgson in “Lawn Tennis Tournaments. The True Method of Assigning Prizes with a Proof of the Fallacy of the Present Method”. Dodgson, che oltre a essere un matematico e logico trovò il tempo di dare vita a uno dei più importanti personaggi della letteratura inglese (in Alice nel paese delle meraviglie con lo pseudonimo di Lewis Carrol, n.d.t.), scriveva prima della diffusione del concetto di teste di serie. Propose un’alternativa al torneo a eliminazione diretta che a suo dire garantiva l’assegnazione esatta dei primi tre premi ai tre giocatori più forti. Il suo ragionamento però poggiava su una visione non probabilistica del significato di migliore. Certamente meritevole di approfondimento, ma per un’altra occasione.

Analysing the effectiveness of tennis tournament seeding

Passare un turno iniziale negli Slam senza giocare è un vantaggio?

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 24 gennaio 2020 – Traduzione di Edoardo Salvati

Grazie al ritiro pre-partita di Philipp Kohlschreiber, suo avversario di secondo turno, Stefanos Tsitsipas ha raggiunto il terzo turno degli Australian Open 2020 avendo giocato una partita in meno degli altri. Alla vigilia degli ottavi di finale, cerchiamo di capire che tipo di impatto può avere per Tsitsipas giocare una partita in meno nel primo Slam della stagione (Tsitsipas ha poi perso al terzo turno contro Milos Raonic in tre set, n.d.t.).

Se del tabellone principale maschile degli Australian Open vi appassiona il percorso delle stelle emergenti del circuito, Daniil Medvedev e Tsitsipas sono in cima alla lista dei giocatori con il potenziale per dare molto fastidio ai Grandi Tre (anche Medvedev ha poi perso agli ottavi contro Stanislas Wawrinka in cinque set, n.d.t.). In quest’ottica, ci si chiede se il passaggio del secondo turno di Tsitsipas senza aver giocato per via del ritiro di Kohlschreiber farà alcuna differenza per le fasi successive del suo cammino.

Con una probabilità di vittoria attesa dell’81%, non sarebbe stata comunque, almeno sulla carta, una partita difficile. E questo suggerisce che non serviva a Tsitsipas un ritiro per passare il turno, ma ci è certamente arrivato essendo rimasto in campo qualche ora in meno. Un carico di gioco inferiore potrà essere un beneficio o, al contrario, meno tempo trascorso in campo sarà di fatto un ostacolo?

Per trovare una risposta, sarebbe utile riuscire a identificare altri giocatori che, nelle prove Slam, hanno passato un turno iniziale per ritiro e confrontare i risultati con giocatori dello stesso livello che hanno invece dovuto giocare tutti i turni. Ci sono stati sufficienti ritiri nei turni iniziali da ottenere un campione significativo?

Quanti ritiri?

L’immagine 1 mostra la frequenza dei ritiri negli Slam negli ultimi 20 anni. Si osserva che, generalmente, sono eventi rari, con la maggior parte degli Slam senza alcun ritiro nei primi turni. Tuttavia, circa il 20% degli Slam (o uno su cinque) ha avuto, per lo stesso orizzonte, almeno un ritiro di secondo turno. Sono circa 30 casi di giocatori che, durante la prima settimana di gioco in uno Slam, hanno superato il turno per ritiro dell’avversario.

Una considerazione a margine. Vi potreste chiedere come un primo turno possa essere un ritiro. Generalmente, un lucky loser dovrebbe rimpiazzare il giocatore che si ritira al primo turno in modo da giocare la partita. Nel primo turno del Roland Garros 2007, quando Mikhail Youzhny ha superato il turno senza giocare contro Jan Hernych, il ritiro deve essere arrivato troppo tardi da consentire a un altro giocatore di prendere il posto. Di norma, primi turni con ritiri sono estremamente rari.

IMMAGINE 1 – Frequenza di ritiri pre e durante la partita per singolo turno negli Slam maschili dal 2000

Se l’effetto finale di un ritiro è una quantità minore di tempo in campo, dovremmo anche considerare di allargare il campione a quei ritiri che si sono verificati a partita da poco iniziata. Questa nuova casistica di ritiri pre-partita e durante il primo set si verifica almeno 1 volta su 4 nei primi e secondi turni degli Slam. Si triplica così il numero dei giocatori da studiare per possibili effetti di meno gioco sul risultato negli Slam.

Quali tornei hanno avuto quattro o più ritiri in alcune edizioni?

Si tratta del Roland Garros 2014, in cui quattro giocatori si sono ritirati durante il primo set dei loro primi turni. E poi Wimbledon 2013, con due ritiri pre-partita e due ritiri durante il primo set in partite di secondo turno. Una curiosità, Kenny De Schepper ha passato il turno per ritiro in quelle partite in entrambi gli Slam!

Con un campione recente di ritiri pre-partita e nel primo set agli Slam, come possiamo dire se si è trattato di un aspetto positivo o negativo? Una modalità è valutare se quei giocatori hanno fatto meglio delle attese, mediante un confronto tra le vittorie effettive in ciascuno Slam e la somma delle probabilità di vittoria per ogni turno. Se un giocatore ha più vittorie di quanto per lui atteso, questa differenza avrà valore positivo. Altrimenti, in caso di sconfitta nei turni iniziali, sarà negativa. In sostanza, è uno scarto per vittorie di partite nell’evento.

Come per gli scarti in una regressione, ci aspettiamo che la media degli scarti sia zero quando è considerata complessivamente su tutti i giocatori in uno Slam (considerando che le nostre previsioni sono certamente imparziali!). Ma in questo sottoinsieme di giocatori che passano il turno senza giocare o perché l’avversario si ritira a inizio partita non ci sono probabilmente giocatori medi. Anzi, la maggior parte ha una valutazione Elo di più di 2000 punti all’inizio del torneo. Serve quindi metterli a confronto con giocatori con valutazioni altrettanto alte.

Un confronto alla pari

Restringendo il confronto ai giocatori con almeno 2000 punti di valutazione, i grafici che seguono illustrano le risultanze dell’ampiezza tra vittorie effettive e vittorie attese per quei giocatori che hanno superato il turno per ritiro negli Slam degli ultimi venti anni.

Nonostante un campione ridotto, si osserva in media un incremento nella differenza tra vittorie effettive e attese, che corrisponde a un +0.2 partite vinte delle attese in presenza di un ritiro. Due giocatori a distinguersi in questo gruppo sono Wawrinka, con +2.4 vittorie rispetto alle attese agli Australian Open 2014, torneo vinto grazie anche al ritiro di Vasek Pospisil al terzo turno, e Grigor Dimitrov, con +2.2 vittorie rispetto alle attese nella semifinale raggiunta agli US Open 2019 con un ritiro al secondo turno di Borna Coric.

IMMAGINE 2 – Distribuzione di vittorie totali meno vittorie attese negli Slam per giocatori con valutazione di almeno 2000 punti nel periodo dal 2000 al 2019 con o senza un ritiro

Otteniamo un margine abbastanza simile anche allargando il gruppo a includere quei giocatori le cui partite non sono terminate per via del ritiro dell’avversario durante il primo set. In questo caso il guadagno medio è più vicino a +0.3 partite aggiuntive.

IMMAGINE 3 – Distribuzione di vittorie totali meno vittorie attese negli Slam per giocatori con valutazione di almeno 2000 punti nel periodo dal 2000 al 2019 con o senza un ritiro o un ritiro durante il primo set

Se il passato è di qualche indicazione, dopo il ritiro al secondo turno le aspettative riposte su Tsitsipas sono ancora più alte.

Is an Early Walkover an Advantage in a Slam?

La fortuna del sorteggio: Australian Open 2020 (donne)

di Chapel Heel // HiddenGameOfTennis

Pubblicato il 19 gennaio 2020 – Traduzione di Edoardo Salvati

Come per gli uomini, anche per le donne ho eseguito una simulazione (con la mia variante Elo) di 100.000 configurazioni del tabellone principale, utilizzando lo stesso metodo che gli organizzatori usano per assegnare ai giocatori la loro posizione. L’ho poi confrontata con la previsione per il torneo su base Elo rispetto al tabellone effettivo.

La tabella mette a confronto la previsione effettiva del tabellone con i risultati dalle simulazioni di rimescolamento, in modo da avere alcune indicazioni sull’accessibilità del tabellone effettivo rispetto alle altre configurazioni. Tonalità di rosso (e arancione) evidenziano la sfortuna del giocatore. Al contrario, tonalità di verde rappresentano la fortuna ricevuta nel tabellone effettivo, in riferimento a un particolare turno. Il giallo simboleggia neutralità, e si può di fatto ignorare qualsiasi valore superiore o inferiore allo 0.2%.

Per una presentazione più compatta rispetto al passato, ho riportato nella tabella solo le teste di serie, e organizzato nella tabella successiva quei giocatori fuori dalle teste di serie per i quali c’è stata un’incidenza degna di nota (almeno l’1.0% di segno positivo o negativo).

Tabellone effettivo e simulato a confronto per le teste di serie

Generalmente, si vedono un po’ di tonalità di rosso e di verde nei numeri relativi ai quarti di finale, ma da li in avanti è quasi tutto giallo o sui toni dell’arancione. In questo senso la riga di Naomi Osaka appare particolarmente negativa (che ha superato il primo turno, n.d.t.), all’opposto quella di Serena Williams decisamente positiva (anche lei vincitrice al primo turno, n.d.t.). Forse è la volta buona per Williams di raggiungere il record di Slam di Margaret Court.

IMMAGINE 1 – Confronto tra tabellone effettivo e simulazioni per le teste di serie

Effetti di rilievo su una selezione di giocatrici fuori dalle teste di serie

A Maria Sharapova non era andata bene agli US Open 2019, forse in Australia la fortuna sta cercando di recuperare (ha però perso subito al primo turno, n.d.t.). Caroline Wozniacki invece non ha ricevuto nessun regalo di addio alle competizioni (ma ha superato il primo turno, n.d.t.).

IMMAGINE 2 – Effetti della casualità del sorteggio su alcune non teste di serie

Luck of the Draw: Australian Open 2020 (Women)

La fortuna del sorteggio: Australian Open 2020 (uomini)

di Chapel Heel // HiddenGameOfTennis

Pubblicato il 19 gennaio 2020 – Traduzione di Edoardo Salvati

Come d’abitudine per gli Slam, ho eseguito una simulazione (con la mia variante Elo) di 100.000 configurazioni del tabellone principale, utilizzando lo stesso metodo che gli organizzatori usano per assegnare ai giocatori la loro posizione. L’ho poi confrontata con la previsione per il torneo su base Elo rispetto al tabellone effettivo.

La tabella mette a confronto la previsione effettiva del tabellone con i risultati dalle simulazioni di rimescolamento, in modo da avere alcune indicazioni sull’accessibilità del tabellone effettivo rispetto alle altre configurazioni. Tonalità di rosso (e arancione) evidenziano la sfortuna del giocatore. Al contrario, tonalità di verde rappresentano la fortuna ricevuta nel tabellone effettivo, in riferimento a un particolare turno. Il giallo simboleggia neutralità, e si può di fatto ignorare qualsiasi valore superiore o inferiore allo 0.3%.

Per una presentazione più compatta rispetto al passato, ho riportato nella tabella solo le teste di serie, e organizzato nella tabella successiva quei giocatori fuori dalle teste di serie per i quali c’è stata un’incidenza degna di nota (almeno lo 0.5% di segno positivo o negativo).

Tabellone effettivo e simulato a confronto per le teste di serie

Rispetto a tabelloni casuali, la parte bassa del tabellone principale è più difficile di quella alta. A David Goffin non è andata proprio bene essendo finito nella sezione del giocatore più in forma del momento, Andrey Rublev, che invece è tra i più fortunati, come Matteo Berrettini. Pensavo che la testa di serie numero 8 per Berrettini fosse eccessiva, perché non mi sembra tra i primi otto favoriti, ma so che le teste di serie procedono in automatico. Comunque, ha il tabellone più fortunato tra tutte le teste di serie.

IMMAGINE 1 – Confronto tra tabellone effettivo e simulazioni per le teste di serie

Effetti di rilievo su una selezione di giocatori fuori dalle teste di serie

Kevin Anderson ha giocato abbastanza bene all’ATP Cup. Con un pò di fortuna potrebbe superare un po’ di turni, magari fino agli ottavi. I quarti di finale sembrano troppo ambiziosi. Fresco vincitore del primo torneo, Ugo Humbert non è stato ricompensato con un percorso semplice. Ma non credo farà troppa differenza perché, anche scarico di adrenalina, dovrebbe perdere da John Millman al primo turno.

IMMAGINE 2 – Effetti della casualità del sorteggio su alcune non teste di serie

Luck of the Draw: Australian Open 2020 (Men)

I favoriti agli Australian Open 2020

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 17 gennaio 2020 – Traduzione di Edoardo Salvati

Dopo aver visto le favorite per gli Australian Open 2020, a tabellone maschile completo quali sono le probabilità di vittoria dei Grandi Tre per il primo Slam dell’anno? E ci sono altri seri contendenti al titolo?

Con l’avvio delle competizioni, tutti si chiedono quale dei Grandi Tre sarà il primo a vincere uno Slam nel 2020. Sulla base delle mie valutazioni, Novak Djokovic e Rafael Nadal hanno la probabilità più alta, con un leggero margine per Djokovic dopo il solido livello di gioco mostrato durante l’ATP Cup.

I soliti noti

Djokovic ha quasi una probabilità su tre di titolo, Nadal quasi una su quattro, e la finale tra i due è l’esito più probabile. I molti appassionati di tennis che si sono entusiasmati per il secondo set della loro partita all’ATP Cup sono certamente in trepidante attesa a Melbourne per un altro episodio della saga.

La terza posizione di Roger Federer non dovrebbe rappresentare una sorpresa, almeno per i più attenti. Più sorprendente potrebbe invece essere il fatto che la distanza di Federer da Djokovic e Nadal sia così ampia, visto che entrambi hanno più del doppio della probabilità di vincere il torneo. Questo dipende solo in parte dalla valutazione attuale della forma di Federer. Dal lato di Djokovic e con giovani pericolosi come Filip Krajinovic, Hubert Hurkacz, Denis Shapovalov e Matteo Berrettini, la strada di Federer per il titolo è particolarmente in salita.

Alle spalle dei Grandi Tre, la probabilità di vittoria diminuisce vertiginosamente. Non si possono però ignorare le possibilità di un gruppo di giocatori che si sono messi in luce nel 2019, primi fra tutti Daniil Medvedev e Stefanos Tsitsipas che, pur non avendo ancora vinto uno Slam, hanno la probabilità più alta di detronizzare uno dei Grandi Tre.

Non possiamo poi dimenticare di menzionare diversi altri giovani per un risultato di prestigio. Dall’alto verso il basso troviamo Andrey Rublev, Denis Shapovalov (che però ha perso al primo turno, n.d.t.) e Berrettini. Anche Dominic Thiem e Roberto Bautista Agut rientrano tra i favoriti, ma sono convinta che i più giovani tra i possibili primi vincitori di Slam abbiano il vantaggio dell’età dalla loro parte.

Giocatore       Prob. titolo
Djokovic        29.6%
Nadal           26.9%
Federer         12.8%
Medvedev        6.9%
Tsitsipas       5.0%
Rublev          3.9%
Thiem           1.9%
Shapovalov      1.9%
Berrettini      1.3%
Bautista Agut   1.2%

La gioventù che avanza

È incredibile pensare che una probabilità cumulata di quasi il 50% per la vittoria finale tra Djokovic e Nadal sia inferiore a quella che i due avevano lo scorso anno. E non dipende da un loro calo vistoso, quanto dalla crescita degli altri, per alcuni in modo drammatico.

Lo si può osservare nell’andamento delle valutazioni dell’ultimo anno dei primi dieci favoriti. L’aspetto che più colpisce è l’incredibile ascesa dei più giovani dietro ai Grandi Tre, la maggior parte di quali ha guadagnato almeno 100 punti nel corso della passata stagione.

IMMAGINE 1 – Andamento della valutazione dei giocatori nell’ultimo anno

Se davvero esiste un vantaggio psicologico derivante dallo stato di forma, il grafico suggerisce che le aspettative su giocatori come Medvedev, Shapovalov, Berrettini e Rublev dovrebbero essere ancora più alte dell’effettiva previsione di titolo. Perché, tra i primi 10, hanno fatto siglare i miglioramenti più significativi. Anche Tsitsipas è cresciuto naturalmente, solo che un incremento stabile rende la sua evoluzione più insolita rispetto a quella degli altri appartenenti alla Next Gen.

Nonostante abbiano 105 anni insieme, i Grandi Tre continuano a sfidare la ragione e rimanere al vertice del tennis mondiale. Ancora una volta, sono loro a ottenere i favori del pronostico, ma è il primo Slam da qualche tempo a questa parte in cui la probabilità di altri giocatori per la vittoria finale non è un concetto puramente teorico.

Men’s Title Chances for the 2020 Australian Open

Le favorite agli Australian Open 2020

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 17 gennaio 2020 – Traduzione di Edoardo Salvati

Le speranze di una nazione saranno sulle spalle di Ashleigh Barty al via degli Australian Open 2020. Il pronostico suggerisce però che dopo quattro finali Slam consecutive perse, potrebbe essere la volta di Serena Williams.

Con la testa di serie numero uno per lo Slam di casa, Barty sarà probabilmente la giocatrice a sentire la pressione maggiore per la vittoria a Melbourne. Dovrà sfidare anche le previsioni basate su diversi sistemi di valutazione che, nonostante un tabellone teorico più abbordabile da prima della classifica, le assegnano solo una possibilità di titolo su dieci, visto che occupa il quarto posto tra le favorite. Con una probabilità su cinque, Williams non ha il trofeo assicurato, ma è comunque avanti rispetto alle altre contendenti. Queste previsioni non tengono però in considerazione il possibile “effetto finale” che sembra aver colpito Williams, che appunto non ha più vinto uno Slam dagli Australian Open 2017, e dopo aver avuto una figlia.

Serena e poi le altre

La forma di Williams è cresciuta di Slam in Slam, con dimostrazioni di potenza fino alla finale di Wimbledon e degli US Open. Ha inoltre vinto il suo torneo di preparazione a Auckland, un’altra iniezione di fiducia alla vigilia del primo Slam dell’anno. Potremmo assistere a una possibile sfida tra Barty e Williams in semifinale, l’ostacolo più duro per Barty per l’eventuale titolo. La testa di serie numero 8 assegnata a Williams ne sottostima il livello di forma, e la mette in rotta di collisione nei quarti di finale con Naomi Osaka, contro cui ha giocato l’ultima volta nella controversa finale degli US Open 2018.

Karolina Pliskova, anche lei non esente da polemiche, potrebbe essere la giocatrice tra le prime quattro favorite a passare meno osservata. Il fatto però di ritrovarsi dalla parte opposta del tabellone rispetto alle altre tre le ha sicuramente offerto la dose più alta di fortuna.

Giocatrice       Prob. titolo
S. Williams      20.4%
Osaka            13.7%
Kar. Pliskova    11.6%
Barty            9.9%
Sabalenka        4.5%
Halep            4.3%
Keys             4.3%
Kvitova          3.7%
Svitolina        3.7%
Bertens          3.0%

Ci siamo abituati a pensare che, sul circuito femminile, la competizione è così serrata da garantire possibilità di vittoria a chiunque in qualunque torneo. Anche se, rispetto a quanto succede per gli uomini, la probabilità di vittoria si distribuisce in modo più uniforme tra le giocatrici, è interessante vedere quanto abbiano oscillato le loro valutazioni nell’ultimo anno. Per le favorite all’inizio degli Australian Open 2020, si è trattato di un anno movimentato. Williams si è migliorata più di tutte, avendo aggiunto 200 punti alla valutazione del 2019.

Pericolose inversioni di forma

Per le altre, l’andamento più tipico è consistito in una curva piatta nella parte iniziale della stagione, seguita da un incremento deciso a partire da agosto. Barty, Simona Halep ed Elina Svitolina sono le uniche del gruppo ad affacciarsi al primo Slam con una chiara inversione negativa di forma.

IMMAGINE 1 – Andamento della valutazione delle giocatrici nell’ultimo anno

Williams gode dei favori delle statistiche e del livello di gioco più alto dopo la maternità. Se i riflettori puntati su Barty l’aiuteranno a superare la pressione subita nelle finali Slam che ha giocato al rientro sul circuito, potrebbe finalmente raggiungere il record di Margaret Court proprio in Australia.

Women’s Title Chances for the 2020 Australian Open

Il futuro del tennis con un esperimento sul tabellone di Wimbledon 2019

di Chapel Heel // HiddenGameOfTennis

Pubblicato l’1 luglio 2019 – Traduzione di Edoardo Salvati

Sono 29 i giocatori di almeno 32 anni nel tabellone del singolare maschile di Wimbledon 2019. Sono invece 24 le giocatrici di almeno 30 anni nel tabellone del singolare femminile (ho scelto un limite di età più basso perché altrimenti per le donne non avrebbe avuto senso proseguire). Cosa succederebbe se li escludessimo dal torneo? Non rimarrebbero solo gli attuali esponenti della Next Gen, ma si infilerebbero giocatori delle due ondate di Next Gen precedenti, se così si può dire. Sarebbe un’approssimazione di Next Gen.

Forse si riesce ad avere un’idea delle sembianze di uno Slam in assenza di giocatori come Novak Djokovic, Rafael Nadal, Roger Federer, Stanislas Wawrinka, o di giocatrici come Serena Williams e Venus Williams e alcune dell’ultima Next Gen in campo femminile. Mi rendo conto che questi giocatori non si tireranno di certo indietro per sottrarsi posizioni in classifica dopo che i grandi nomi si saranno ritirati, e nuova linfa che ancora deve emergere si farà largo. Diventa quindi solo un passatempo per provare a identificare scenari futuri, non un pronostico puntuale di risultati a venire.

I ragazzi saranno uomini

In campo maschile, si perdono le prime 4 teste di serie (e nove teste di serie in tutto). Ventinove giocatori sono molti da rimpiazzare. Per primo, ho rimesso Borna Coric, anche se non riempiva un posto lasciato scoperto. Poi, ho deciso di non aggiungere Juan Martin Del Potro. Il suo fisico ha almeno due anni in più di quanto indichi la data di nascita, e non c’è alcuna certezza del livello di gioco una volta rientrato sul circuito. Da ultimo, ho richiamato tutti i perdenti del terzo turno di qualificazioni. Mi mancavano ancora 13 giocatori, e ho preso le teste di serie perdenti del secondo turno (ma solo se non eccedevano il limite di età). Con ancora 8 posti vuoti, ho scelto a caso tra gli altri perdenti al secondo turno delle qualificazioni.

Le prime 8 teste di serie sono ora Dominic Thiem, Alexander Zverev, Stefanos Tsitsipas, Kei Nishikori, Karen Khachanov, Daniil Medvedev, Marin Cilic e Coric. Altri da tenere d’occhio: Milos Raonic con la numero 9, Felix Auger-Aliassime con la 12, Denis Shapovalov con la 20, Taylor Fritz con la 25, Frances Tiafoe con la 27 e Nick Kyrgios con la 32.

Proviamo a eseguire 100.000 simulazioni solo con le valutazioni Elo, mischiando le posizioni nel tabellone dopo ogni passaggio. Per avere un termine di paragone, nessun giocatore di questi scenari alternativi ha una probabilità di vincere Wimbledon 2019 più alta del 3%, sulla base delle mie previsioni Elo, e solo uno è già campione Slam (Cilic).

La tabella riepiloga i 20 migliori risultati.

IMMAGINE 1 – Probabilità di progressione nei tabelloni alternativi a Wimbledon 2019

A seguito delle 100.000 simulazioni, la probabilità complessiva di vittoria dei 20 giocatori nell’elenco è dell’88.7%. Per rendersi conto dello spostamento di forze associato alla rimozione dal tabellone dei giocatori con almeno 32 anni, sempre secondo i miei calcoli Elo, il quartetto composto da Djokovic, Federer, Nadal e Kevin Anderson ha una probabilità complessiva di vittoria del 76.6% (Djokovic ha vinto il torneo battendo Federer in finale, che a sua volta aveva sconfitto Nadal in semifinale. Anderson non ha partecipato per infortunio, anche se la sua percentuale di vittoria era del 2.9%, n.d.t.)

Donne che (non) aspettano

È scontato dire che l’effetto sul tabellone femminile non è così drastico. Per quanto il numero di giocatrici che viene escluso è simile a quello dei giocatori, le uniche vere pretendenti a uscire di scena sono Angelique Kerber e Serena (se il limite fosse stato a 29 anni, Petra Kvitova non sarebbe rientrata e, un po’ tirato, anche Victoria Azarenka, ma per questo scopo sarebbe stato troppo restrittivo).

Le prime 4 teste di serie rimangono inalterate. Per le successive 6 teste di serie, ho promosso la giocatrice che seguiva immediatamente in classifica. Ho riempito poi le altre posizioni con lo stesso metodo degli uomini. Si perde in tutto circa il 17% della probabilità di vittoria da questi scenari alternativi, mentre per gli uomini era superiore all’80%, pur con un limite più alto. Le donne perdono certamente la maggior parte delle campionesse Slam, senza Serena, Venus, Kerber, Maria Sharapova e Svetlana Kuznetsova.

La tabella riepiloga i 20 migliori risultati.  

IMMAGINE 2 – Probabilità di progressione nei tabelloni alternativi a Wimbledon 2019

A seguito delle 100.000 simulazioni, la probabilità complessiva di vittoria delle 20 giocatrici nell’elenco è dell’93.9%, ancora più che per gli uomini. Nelle mie previsioni Elo, le stesse giocatrici hanno il 78.6% di probabilità complessiva di vittoria, quindi l’eliminazione della vecchia guardia favorisce il consolidamento della loro ascesa.

Sembrano tutti consapevoli della difficoltà del periodo di transizione in cui si troverà l’ATP quando Djokovic, Federer e Nadal non giocheranno più. Non mi sorprenderebbe se la crescente tensione generata dall’incertezza futura si sia già fatta strada nelle dinamiche politiche dell’ATP, rendendo più acceso lo scontro a cui stiamo assistendo con le dimissioni nel comitato giocatori. È davvero un momento critico per il tennis maschile.

Riprendete l’immagine 1 e leggete i nomi. Fermatevi al primo che, di riflesso, vi porta a mugugnare con dubbio “hmm”. Ora fate lo stesso per le donne. Scommetto che arrivate più in basso. Non è del tutto corretto, perché ci sono sicuramente dei nomi di rilievo anche nella parte finale dell’elenco dei giocatori (Auger Aliassime, Shapovalov, e per alcuni Kyrgios). Tranne forse per tre giocatrici, tra le donne il talento è ben distribuito, e con abbondanza.

NextGen-ish Wimbledon

La fortuna del sorteggio: US Open 2019 (donne)

di Chapel Heel // HiddenGameOfTennis

Pubblicato il 26 agosto 2019 – Traduzione di Edoardo Salvati

Come per gli uomini, anche per le donne ho eseguito una simulazione (con la mia variante Elo) di 100.000 configurazioni del tabellone principale, utilizzando lo stesso metodo che gli organizzatori usano per assegnare alle giocatrici la loro posizione. L’ho poi confrontata con la previsione per il torneo su base Elo rispetto al tabellone effettivo.

La tabella mette a confronto la previsione effettiva del tabellone con i risultati dalle simulazioni di rimescolamento dell’intero campo partecipanti (a eccezione delle teste di serie numero 1 e 2, naturalmente), in modo da avere alcune indicazioni sull’accessibilità del tabellone effettivo rispetto alle altre configurazioni. Tonalità di rosso (e arancione) evidenziano la sfortuna della giocatrice. Al contrario, tonalità di verde rappresentano la fortuna ricevuta nel tabellone effettivo, in riferimento a un particolare turno. Il giallo simboleggia neutralità, e si può di fatto ignorare qualsiasi valore superiore o inferiore allo 0.2%.

Per una presentazione più compatta rispetto al passato, ho riportato nella tabella solo le teste di serie, e organizzato nella tabella successiva quelle giocatrici fuori dalle teste di serie per le quali c’è stata un’incidenza degna di nota (almeno l’1% di segno positivo o negativo).

Tabellone effettivo e simulato a confronto per le teste di serie

Il quarto di finale di Elina Svitolina ha proprio una brutta faccia (per il momento ha superato facilmente il primo turno contro Whitney Osuigwe, n.d.t.) . Sembra poi che anche Caroline Wozniacki (che ha superato il primo turno contro Yafan Wang, n.d.t.), Aryna Sabalenka (che ha battuto Victoria Azarenka al primo turno, n.d.t.) e Serena Williams siano state penalizzate dal tabellone effettivo, sebbene il sospetto è che sulla cella arancione di Williams al primo turno pesi in qualche modo una valutazione generosa di Elo della bravura di Maria Sharapova (Williams ha vinto infatti con un doppio 6-1, n.d.t.). La campionessa uscente Naomi Osaka ha il percorso più semplice tra le giocatrici con realistiche possibilità di aspirazione al titolo, rispetto a un tabellone casuale (anche se ha faticato al primo turno contro Anna Blinkova, vincendo in tre set dopo due ore e mezzo, n.d.t.).

IMMAGINE 1 – Confronto tra tabellone effettivo e simulazioni per le teste di serie

Effetti di rilievo su una selezione di giocatori fuori dalle teste di serie

Un tabellone più favorevole per Svetlana Kuznetsova con questa metodologia è dovuto in larga parte a rimanenze nella valutazione Elo di uno stato di forma che potrebbe essere scomparso (e così è stato, vista la sconfitta in due set al primo turno contro Kristie Ahn, n.d.t.), oltre ad avere due delle teste di serie più volubili nella sua sezione in Sloane Stephens (che infatti a perso contro Anna Kalinskaya al primo turno, n.d.t.) e Garbine Muguruza (anche lei perdente al primo turno contro Alison Riske, n.d.t.).

Mi sorprende vedere che il dato di Sharapova non sia peggiore, avendo al primo turno una delle tre giocatrici più forti di sempre.

IMMAGINE 2 – Effetti della casualità del sorteggio su alcune non teste di serie

Luck of the Draw US Open 2019 (Women)