Le scelte delle giocatrici dall’angolo del rovescio

di Jeff Sackmann // TennisAbstract

Pubblicato il 4 gennaio 2020 – Traduzione di Edoardo Salvati

Come si comportano i giocatori di fronte a un colpo giocabile sull’angolo del rovescio? Ne ho parlato in un precedente articolo, grazie a molti dati a disposizione. Si tratta di un’analisi che riprendeva un altro approfondimento sull’utilizzo del rovescio lungolinea da parte di entrambi i generi. Non serve aver letto quei due articoli per comprendere i contenuti di questo, ma se è un argomento che vi ispira li troverete probabilmente utili.

Una delle più grandi differenze tra uomini e donne nel tennis professionistico arriva dalle scelte decisionali dall’angolo del rovescio. Voglio illustrare la questione come farebbe un secchione dell’informatica, con gli errori generati del codice che ho scritto per ottenere le tabelle che seguono.

Problemi da secchione

Il primo tentativo per raccogliere numeri aggregati per i giocatori è fallito perché ho trovato che qualcuno non ha mai colpito un rovescio in topspin dall’angolo del rovescio, quantomeno non in una partita del database del Match Charting Project. Il colpevole di quelle divisioni per zero è Samuel Groth. In una manciata di partite nel database, si è sempre affidato al rovescio tagliato, almeno in quei rari casi in cui lo scambio è andato oltre la risposta al servizio.

Mettiamolo a confronto con il problema che mi ha rallentato nella preparazione di questo articolo. Si tratta di Evgeniya Rodina, che in nove partite del database non ha mai colpito un dritto dall’angolo del rovescio. Se hai nel rovescio il tuo colpo migliore, non ha molto senso girare intorno alla pallina per colpire di dritto.

Delle circa 200 giocatrici con almeno cinque partite nel database dal 2010, Rodina è l’unica senza nemmeno un dritto. Non è però un caso così estremo. Ci sono altre 23 giocatrici con meno di 10 dritti in tutte le loro partite del database, tra cui anche Timea Bacsinszky, che ha scelto di giocare il dritto solo quattro volte in 32 partite.

Quando c’è un colpo giocabile sull’angolo del rovescio, giocatori e giocatrici ricorrono a un colpo a rimbalzo non tagliato circa un quinto delle volte. Ma di quei colpi piatti o in topspin, le donne preferiscono il rovescio nel 94% delle volte, mentre gli uomini l’82%. C’è qualche giocatrice che cerca di girare intorno al rovescio, come fanno Samantha Stosur e Polona Hercog, che colpiscono di dritto il 20% delle volte in cui si ritrovano sull’angolo del rovescio.

Ashleigh Barty mostra di applicare una tattica più simile a quella di Roger Federer della maggior parte delle sue colleghe, utilizzando il dritto il 13% delle volte. Ma per molte giocatrici dal dritto potente, come Serena Williams, il rovescio è altrettanto se non più efficace, rendendo controproducente l’idea di girare intorno alla pallina. Williams colpisce di dritto un colpo giocabile sull’angolo del rovescio solo l’1% delle volte.

Decisioni sulla direzione

Che sia un dritto o un rovescio, iniziamo a vedere in dettaglio le scelte di quelle giocatrici. Il Match Charting Project contiene dati colpo su colpo di circa 2900 partite femminili dello scorso decennio, tra cui 365.000 mila istanze di colpo giocabile dall’angolo del rovescio, dove con “giocabile” si fa riferimento a un colpo che la giocatrice ha rimandato in campo o che si è trasformato in un errore non forzato.

La tabella mostra la frequenza con cui le giocatrici colpiscono rovesci e dritti in diverse direzioni dall’angolo del rovescio, con accanto quella dei giocatori (dove I-I, o inside-in, indica il dritto lungolinea a rientrare dopo aver girato intorno alla palla e I-O, o inside-out, lo stesso colpo ma incrociato).

Direzione Rovescio   Freq WTA   Freq ATP  
Lungolinea           17.4%      17.4%  
Al centro            35.2%      29.5%  
Incrociato           47.3%      52.9%  
                                               
Direzione Dritto     Freq WTA   Freq ATP  
Lungolinea (I-I)     35.2%      35.1%  
Al centro            16.2%      12.8%  
Incrociato (I-I)     48.4%      51.8%

Una volta che si è deciso per il dritto o il rovescio, non c’è grande differenza tra uomini e donne. Le giocatrici cercano il centro del campo un po’ più spesso, che potrebbe derivare in parte dal ricorso a rovesci piatti o in topspin da posizioni difensive più di quanto facciano gli uomini. Ho anche l’impressione che le giocatrici di vertice del tennis contemporaneo tendano a caricare il colpo al centro del campo più degli uomini. È un colpo simile per aggressività e rischio a uno direzionato all’angolo del campo. Facendo però distinzione per direzione del colpo, risulta all’apparenza più difensivo. Comunque è una solo una teoria, da verificare in un’altra circostanza.

Probabilità di vincere il punto

Se analizziamo la probabilità di vincere il punto, la questione si fa più interessante. In media, una giocatrice ha il 47.2% di probabilità di vincere il punto di fronte a un colpo giocabile dall’angolo del rovescio (per gli uomini è il 47.7%). Il servizio incide sulla potenza dei colpi diretti all’angolo del rovescio. Se il colpo giocabile è a seguito di una risposta al servizio — presumibilmente quindi più debole del colpo a rimbalzo medio — la probabilità di vincere il punto è del 48.2%. Se invece è al colpo successivo, spesso una combinazione più aggressiva di servizio e primo colpo (quindi il quarto colpo dello scambio), la probabilità di ribattere e di vincere il punto scende al 46.3%. Non è una differenza abissale, ma sottolinea come il contesto è in grado di alterare queste probabilità.

Almeno in media, ciascuna delle diverse scelte che le giocatrici possono fare determina una variazione nella probabilità di vincere il punto. Se la giocatrice opta per il rovescio lungolinea, la probabilità aumenta al 53.0%. Se riesce effettivamente a giocarlo, la probabilità di vincere il punto sale al 68.4%.

La tabella riepiloga la probabilità associata a ogni decisione. La prima colonna rappresenta la probabilità di vincere il punto dopo aver preso la decisione di tirare lo specifico colpo (Dopo Colpo), il 53.0% di cui ho parlato. La seconda colonna è la probabilità dopo aver realizzato il colpo (In Gioco), ad esempio il 68.4% per il rovescio lungolinea.

Colpo     Direzione          Dopo Colpo  In Gioco  
Rovescio  (tutte)            48.5%       55.2%  
Rovescio  Lungolinea         53.0%       68.4%  
Rovescio  Centro             44.6%       48.8%  
Rovescio  Incrociato         49.9%       55.8%  
                                         
Rovescio  (tutte)            56.3%       56.1%  
Rovescio  Lungolinea (I-I)   61.4%       73.7%  
Rovescio  Centro             45.7%       50.3%  
Rovescio  Incrociato (I-O)   56.2%       64.4% 

La differenza tra le due probabilità è molto ampia per i colpi lungolinea, che sono notoriamente ad alto rischio. Per i colpi al centro invece c’è poca differenza, perché in entrambi i casi rimangono quasi sempre in campo. Riguardo alle probabilità con il dritto, va precisato che sono influenzate dal tipo di giocatrice che più spesso sceglie di giocare quel colpo girando intorno alla pallina. E, alla lunga, la distanza percorsa in campo può variare, specialmente con un gioco simile a quello di Rodina, e quindi incidere sulla selezione del colpo.

Raccomandazioni da prendere con cautela

Di fronte a questa tabella, ci si chiede come mai una giocatrice decida di impiegare determinati colpi rispetto ad altri. La probabilità di vincere il punto prima di scegliere un lato o una direzione è del 47.2%, quindi perché andare con un rovescio al centro (44.6%) anziché un dritto a rientrare (61.4%)? Non può dipendere dal timore di sbagliare, perché è già ricompreso nei numeri.

Una ragione ovvia è quella per cui non sempre è possibile tirare il colpo più efficace. Anche i giocatori più offensivi girano intorno al rovescio per colpire di dritto circa un quarto delle volte, a suggerire che sarebbe poco pratico colpire di dritto nel restante 75% delle opportunità. In questo modo si esclude una metà delle scelte che ho messo nell’elenco. E anche una maga del rovescio come Simona Halep non riesce a tirare lungolinea al millimetro a comando.

Le probabilità riflettono cosa accade quando le giocatrici pensavano che quel colpo fosse la migliore opzione a loro disponibile in quel momento. E anche se è capitato che si siano poi sbagliate, siamo estremamente lontani da un esperimento casuale controllato in cui uno scienziato ha chiesto alle giocatrici di giocare un rovescio lungolinea a prescindere dalla natura del colpo che lo precedeva.

Colpi rari

C’è un’altra complicazione che ho già citato: la frequenza di successo per colpi rari, come il dritto a rientrare, è legata al risultato ottenuto dalle giocatrici che hanno tirato proprio quel colpo. Vale a dire, per giocatrici che considerano quei colpi rari un punto di forza. Se è divertente pensare di vedere Monica Niculescu colpire dritti a uscire in topspin in ogni circostanza, quasi certamente la sua probabilità di vittoria non aumenta. Riesci a ottenere brillanti risultati con il dritto se sei in grado di giocarlo come fa Stosur.

Questo non toglie che la tabella ha ragione su un aspetto, e cioè che una scelta difensiva di colpi pesa sulla probabilità di vincere il punto. Per alcune giocatrici è sufficiente rimandare un rovescio dietro l’altro al centro del campo, e per alcune partite non si può fare meglio di così. Ma in presenza di più soluzioni, una propensione più rischiosa è anche più remunerativa.

Giocatrice      Dopo Colpo  Freq R  
Clijsters       53.4%       77.6%  
Li              53.2%       87.5%  
Giorgi          52.9%       93.8%  
Tig             52.1%       66.1%  
Halep           52.1%       83.6%  
Bencic          51.5%       91.7%  
Cibulkova       51.3%       70.1%  
Kudermetova     50.9%       73.9%  
Pegula          50.7%       73.7%  
S.W. Hsieh      50.6%       81.8%  
Yastremska      50.6%       87.6%  
Schmiedlova     50.3%       87.4%  
S. Williams     49.9%       89.2%  
Errani          49.8%       70.0%

A seconda della giocatrice

Concludiamo con uno sguardo su alcune giocatrici. Abbiamo appurato che la giocatrice media ha il 47.2% di probabilità di vincere il punto quando ha un colpo giocabile dall’angolo del rovescio. Anche se è la stessa probabilità di Tsvetana Pironkova, non esiste una giocatrice media. La tabella riepiloga le prime 14 giocatrici con almeno dieci partite nel database, ordinate sulla base della probabilità di vincere il punto da quella posizione. Ho anche aggiunto la frequenza dei rovesci non tagliati.

Sono numeri solo dal 2010 in avanti, quindi non si estendono a tutta la carriera delle prime due giocatrici, Kim Clijsters e Li Na. La loro presenza ha dell’incredibile, visto che le partite nel database non sono un campione casuale ma per la maggior parte scontri al vertice con altre campionesse. Il resto dei nomi è un miscuglio di giocatrici di primissimo livello e regolariste del circuito, battitrici libere del rovescio e fini strateghe.

La tabella che segue si riferisce a quelle giocatrici con la migliore opportunità di vincere il punto dopo aver colpito un dritto dall’angolo del rovescio. Ho imposto il limite minimo a 100 dritti nel database, estraendo circa 50 giocatrici.

Giocatrice        Dopo Colpo   Freq R  
Sharapova         69.0%        4.1%  
Cibulkova         65.1%        10.5%  
Ivanovic          64.7%        11.1%  
Wang              64.4%        8.8%  
Peterson          63.4%        15.2%  
Halep             63.1%        6.8%  
Suarez Navarro    63.0%        7.7%  
Petkovic          62.3%        5.3%  
McHale            61.9%        15.2%  
Sevastova         61.3%        4.2%  
Kvitova           60.8%        4.6%  
Garcia            60.7%        7.5%  
Doi               60.5%        17.0%  
Keys              59.3%        9.3%  
Svitolina         59.1%        3.9%

Maria Sharapova è la Gilles Simon della WTA (una frase che non avrei mai pensato di scrivere!). Entrambi infatti di solito preferiscono colpire di rovescio, ma riescono a essere estremamente efficaci quando usano il dritto. Complimenti a Sharapova per il giudizio che mette quando sceglie colpi offensivi, anche se potrebbe essere che la decisione di non girare più spesso intorno alla pallina per colpire di dritto le costi qualche punto perso (Sharapova si è poi ritirata dalle competizioni a fine febbraio 2020, n.d.t.).

Evoluzione

Come ho scritto per gli uomini, questo è solo un accenno del potenziale tattico di analisi dei dati del Match Charting Project. Un ulteriore sviluppo sarebbe ad esempio un maggiore dettaglio delle opportunità dall’angolo del rovescio (o da qualsiasi punto del campo). La probabilità media di vincere il punto del 47.2% non è certamente sostenibile in presenza di colpi giocabili che originano, ad esempio, come dritti a uscire. Se ci sono situazioni a più alto grado di difficoltà, questi numeri andrebbero visti diversamente.

Se la lettura vi ha spinto fino a qui, devono essere argomenti che vi affascinano. Il Match Charting Project ha accumulato più di 7500 partite, un numero considerevole ma sempre aperto a nuove aggiunte. Ad esempio, molti giocatori e giocatrici emergenti hanno poche partite, così come partite del passato cariche di interesse non sono ancora presenti nel database (tra cui la maggior parte di quelle giocate da Li e Clijsters!). Potete dare una mano e, se vi piace guardare e analizzare il tennis, dovreste proprio farlo.

WTA Decisions From the Backhand Corner

Alcune tra le imprese più sorprendenti nella storia recente degli Slam

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 18 aprile 2020 – Traduzione di Edoardo Salvati

Con molto tempo a disposizione per indugiare nei ricordi legati al tennis, ho pensato che sarebbe stato divertente fare una classifica delle imprese più incredibili negli Slam. A questo proposito, il guadagno ottenuto dal singolo giocatore in termini di valutazione del suo livello di bravura nel corso di un torneo è utile all’identificazione di risultati a sorpresa, in questo caso dagli anni 1990 a oggi.

Effetto sorpresa

Uno degli aspetti più interessanti dei sistemi di valutazione come Elo, basati cioè sulle probabilità, è che incorporano l’effetto sorpresa. L’aggiornamento della valutazione di un giocatore segue temporalmente i suoi risultati ed è di fatto una misura ponderata della prevedibilità o imprevedibilità del risultato. Quando Kevin Anderson ha sconfitto Roger Federer a Wimbledon 2018, alla vigilia della partita aveva solo una probabilità di vittoria su cinque. Si è trattato quindi di una sorpresa che ha dato una grande spinta alla sua valutazione. I sistemi di valutazione operano questi calcoli a ogni partita e per ogni risultato, fornendo così un’istantanea dell’effetto sorpresa consultabile in qualsiasi momento.

Sono variazioni parte del processo di auto-correzione di questo tipo di sistemi di valutazione. In generale, se un sistema è efficace non si lascia sorprendere troppo spesso. Ci sono però occasioni in cui una vittoria fa saltare il banco, pensiamo ad esempio a quella di Lukas Rosol contro Rafael Nadal a Wimbledon 2012. Non capita di frequente di assistere a vittorie a sorpresa di fila perché, se succede, significa che probabilmente si è verificato qualcosa di straordinario.

Possiamo provare a isolare quelle occasioni osservando il guadagno complessivo di punti validi per le valutazioni in un torneo (secondo il mio sistema di valutazioni Elo), dalla prima all’ultima partita giocata. Con le mie valutazioni storiche, che attualmente tornano indietro fino al 1990 per gli uomini e al 1997 per le donne, ho trovato che incrementi di almeno 160 punti rappresentano il 5% superiore dei risultati che sono andati oltre le attese negli Slam. Ci concentriamo quindi su questo 5%.

Uomini

Nel periodo considerato, solo due giocatori a fine di un torneo Slam sono riusciti a far aumentare la propria valutazione di più di 200 punti rispetto a quella iniziale. Il maggior guadagno in assoluto è stato di Gustavo Kuerten con la vittoria del primo Slam al Roland Garros 1997. Fuori dalle teste di serie, ha sorpreso davvero tutti. Anche con i punti guadagnati dopo ogni turno, era comunque il giocatore sfavorito in tutte le partite tranne una che, curiosamente, è stata la semifinale contro Filip Dewulf, sulla carta la partita più facile.

Il secondo posto è occupato da Andrei Medvedev (che non ha parentele con Daniil Medvedev), che ha raggiunto la finale del Roland Garros 1999, che si è poi rivelato anche il miglior risultato in uno Slam. Quella sconfitta è stata la sesta di fila contro Andre Agassi, e deve aver spento definitivamente la volontà di Medvedev nella conquista di un altro Slam.

IMMAGINE 1 – Primo 5% delle imprese più sorprendenti negli Slam maschili dal 1993 al 2020 sulla base del guadagno totale di punti del sistema di valutazione Elo

Nadal al Roland Garros

Prima del dominio di Nadal, ho sempre avuto l’impressione che il Roland Garros fosse tra i quattro Slam quello con i risultati più “strani”. E credo che questa ne sia una conferma. Non solo i due più sorprendenti sono in cima all’elenco, ma ben 8 dei 23 risultati che rientrano nel primo 5% sono di imprese avvenute sulla terra battuta di Parigi. Poi, dal 2005 al 2013, Nadal ha normalizzato la situazione a suo favore. Mi ha incuriosito quindi vedere che la sua vittoria al Roland Garros 2014 rientra tra le sorprese. Anche se Nadal non ha praticamente ottenuto punti dai primi quattro turni, la difficoltà delle vittorie contro David Ferrer, Andy Murray e Novak Djokovic (il quale aveva in quel momento una valutazione complessiva più alta) è stata sufficiente per un guadagno di 166 punti rispetto alla valutazione di inizio torneo.

Anche i nomi più prestigiosi

Ci sono poi anche alcuni dei nomi più prestigiosi del tennis maschile, e si può pensare che siano le loro prime vittorie di uno Slam. Non è così. C’è l’ultima vittoria agli US Open 2002 di Pete Sampras, dopo due anni di assenza dall’albo d’oro negli Slam. Per certi versi simile, c’è la vittoria di Djokovic a Wimbledon 2018, la prima dal Roland Garros 2016, in cui era riuscito a completare tutti i tornei Slam. Sono presenti anche Andre Agassi e Federer, in fasi diverse di rinascita della loro carriera.

Come qualche volta accade, la mancanza di dati può generare storie altrettanto interessanti. Nel caso delle sorprese negli Slam, i dati mancati si riferiscono alla lunga sequenza di risultati secondo pronostico tra la semifinale di Rainer Schuettler a Wimbledon 2008 e la vittoria di Nadal al Roland Garros 2014. Solo il titolo conquistato da Juan Martin Del Potro agli US Open 2009 ha interrotto brevemente le vittorie dei favoriti negli Slam, dando vita al periodo più continuo di risultati prevedibili negli Slam degli ultimi tre decenni.

La storia di Vladimir Voltchkov merita una nota finale. Nel 2000, Voltchkov, un giocatore juniores con poche sortite sul circuito maggiore, arrivò a Wimbledon con una valutazione appena superiore a 1600. Anche ispirato dall’epica del film Il Gladiatore di quello stesso anno, Voltchkov riuscì incredibilmente a sopravvivere ai primi 5 avversari per poi essere eliminato senza patemi da Pete Sampras nella sua unica semifinale Slam.

Donne

Purtroppo le mie valutazioni storiche per il tennis femminile non coprono un periodo così ampio. Però, anche dai soli risultati negli anni 2000 è chiaro che le imprese più sorprendenti hanno seguito dinamiche decisamente diverse da quelle degli uomini. In primo luogo, il Roland Garros compare solo una volta, quando Jelena Ostapenko ha vinto nel 2017 diventando la prima dopo Kuerten ha vincere uno Slam come primo torneo in assoluto del circuito maggiore.

Inoltre, la maggior parte delle sorprese più recenti si sono verificate agli Australian Open (8 delle 22 del grafico). La più inaspettata di questo gruppo è stata la vittoria di Serena Williams nel 2007, a seguito di una serie di infortuni che nel 2006 le avevano fatto saltare gran parte della stagione e retrocedere al numero 139 in classifica.

IMMAGINE 2 – Primo 5% delle imprese più sorprendenti negli Slam femminili dal 1999 al 2020 sulla base del guadagno totale di punti del sistema di valutazione Elo

Kim

Sembra quasi scritto che la vittoria agli US Open 2009 di Kim Clijsters dopo il rientro alle competizioni superi per sorpresa anche la vittoria di Serena nel 2007. Sono infatti le due giocatrici che meglio di tutte hanno gestito maternità e professionismo in momenti diversi della carriera. Se in molti erano convinti che Serena avrebbe vinto uno Slam poco dopo aver partorito, è in realtà Clijsters l’unica a raggiungere quel traguardo. E c’erano buone possibilità che almeno una delle sorelle Williams avrebbe interrotto il cammino di Clijsters, prima Venus negli ottavi di finale, con il 90% di probabilità di vittoria, e poi Serena in semifinale. Dopo solo un mese nel circuito maggiore, con un altro Slam vinto e 300 punti aggiunti alla sua valutazione, è Clijsters a ricevere il premio di impresa più sorprendete negli Slam degli ultimi trent’anni.

Some of the Most Surprising Runs in Recent Grand Slam History

E ora, cosa guardiamo? Edizione femminile

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 27 marzo 2020 – Traduzione di Edoardo Salvati

In un precedente articolo, ho descritto un possibile metodo per ottenere in automatico una classifica delle partite più interessanti sulla base del turno, del margine di game, cioè la differenza di game vinti, e dei game totali giocati. Dopo averlo applicato per le trenta migliori partite Slam maschili dal 1990, è la volta di fare lo stesso per trovare le migliori partite Slam femminili dal 1997.

In breve, la statistica “interessante” ha l’obiettivo di fornire uno strumento per classificare la spettacolarità, competitività e qualità di tutte le partite nella storia del tennis per le quali è possibile avere dettagli specifici sul punteggio. I numeri effettivamente coinvolti nel calcolo sono i game totali, il margine di game e il turno. Per turno s’intende una categoria numerica ponderata che attribuisce l’importanza maggiore alle fasi finali e quella minore alla prima giornata di qualificazione.

Partite lunghe e competitive

Nel caso delle partite femminili, ci si attende una distribuzione meno sbilanciata rispetto al fattore durata, visto che anche negli Slam si gioca al meglio dei tre set. Inoltre, ci si aspetta una più alta densità di partite contestualmente lunghe e competitive (con un margine di game basso). E, di solito, così accade, come dimostra li grafico nell’immagine 1 sulle partite Slam dal 1997. Quasi tutte le partite delle prime 30 sono una deviazione standard sopra alla media per game totale e per margine di game.

IMMAGINE 1 – Distribuzione delle variabili centralizzate e in scala della statistica di interesse delle partite Slam femminili (qualificazioni e tabellone principale) dal 1997 al 2020

La tabella elenca le trenta partite del periodo considerato con l’indice d’interesse più alto, in cui troviamo diverse di quelle giocate recentemente. Ma c’è anche un primo turno degli Australian Open 2001 tra Greta Arn e Jana Nejedly che, con 44 game totali, è il terzo più lungo (per game giocati) della lista.

Sarebbe curioso sapere cosa è successo ma, come per molte partite femminili, e a differenza di quelle maschili, non ci sono video integrali o anche solo dei punti più significativi. È una carenza che andrebbe colmata, servono più filmati di qualità, anche per avere una piacevole distrazione in questi tempi decisamente difficili.  

What Do I Watch Now (Part 2)?

Chi vince e chi perde in caso di sospensione della classifica

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 13 marzo 2020 – Traduzione di Edoardo Salvati

L’annuncio di una sospensione di sei settimane del circuito maschile è solo l’ultimo di una serie di sconvolgimenti del calendario tennistico causati dalla pandemia COVID-19. In assenza di decisioni in merito alla possibilità per i giocatori di conservare la classifica attuale, cerco di capire il possibile impatto di un eventuale scenario in cui, per entrambi i circuiti, la classifica rimane inalterata per un periodo di tempo prolungato.

Con il continuo aumento dei casi di contagio in tutto il mondo e con le drastiche misure necessarie per contenere la diffusione del virus, era inevitabile che le conseguenze ricadessero anche sul tennis. Con la sospensione del circuito maschile che dovrebbe terminare pochi giorni prima dell’avvio del Roland Garros, in programma il 24 maggio 2020, potrebbe essere proprio lo Slam di Parigi il prossimo grande evento sportivo di tennis vittima dell’emergenza.

Raziocinio?

Sia gli organizzatori dell’Indian Wells Master che l’ATP hanno definito queste scelte una “sospensione”, invece di considerarla un’immediata cancellazione. Da un punto di vista finanziario, ha senso mantenere aperta la possibilità dello svolgimento del torneo in altra data, prima di rinunciare definitivamente al potenziale indotto economico associato. Con il passare del tempo però, e con il rinvio di altri tornei, la fattibilità di un deferimento si fa sempre più remota.

Di fronte a una situazione così drammatica, gli organismi decisionali dei due circuiti dovrebbero agire razionalmente e pianificare la gestione di un calendario fortemente accorciato. E uno dei temi più spinosi da affrontare è certamente la classifica dei giocatori.

Al momento sono solo congetture, ma sembra ragionevole ipotizzare che non ci saranno penalizzazioni per i tornei che sono stati cancellati (se così sarà perché non verranno effettivamente recuperati). In questo caso, l’impatto minore arriverebbe dal permettere ai giocatori di conservare la classifica alla viglia di Indian Wells.

Sarebbe una soluzione equa?

Un modo per valutare l’equità di una sospensione della classifica è di verificare quanto le posizioni in classifica variano in un periodo di tempo prolungato. L’immagine 1 mostra il cambiamento in un anno della classifica di quei giocatori che sono entrati almeno tra i primi 250 negli ultimi venti anni. I segmenti rappresentano lo scarto interquartile della variazione rispetto all’età dei giocatori. I grafici sono raggruppati per posizione massima in classifica.

Primi 10

Prendiamo la dinamica associata ai primi 10. Quando sono giovanissimi, il guadagno in classifica è normalmente di qualche centinaio di punti. Tra i venti e i venticinque anni raggiungono e si assestano sul livello di gioco più alto, rendendo quasi nulla la variazione anno su anno. Superati i trent’anni, inizia la fase discendente ed è più probabile assistere a una perdita più sostanziale di posizioni in classifica da un anno all’altro.

IMMAGINE 1 – Stabilità nella classifica maschile con la variazione su un anno delle posizioni dei giocatori, dal 2000 al 2020 (scarto interquartile)

Sono tutte tendenze che si può pensare di prevedere. E, in termini di generale crescita in classifica per fascia di età, l’andamento per i primi 10 è simile a quello di giocatori con una carriera meno ricca di successi: un maggior guadagno di posizioni nei primi anni sul circuito, una progressione stabile tra i venti e i trent’anni, seguita da una fase di declino nella parte finale. Per i giocatori che occupano le parti basse della classifica però, un avanzamento di posizioni nei primi anni non è mai altrettanto importante e nel periodo apicale è più probabile assistere a spostamenti minimi verso l’alto o verso il basso.

Donne

Nonostante parziali differenze nel sistema di assegnazione di punti per la classifica maschile e quella femminile, lo stesso meccanismo si ripete per le giocatrici.

IMMAGINE 2 – Stabilità nella classifica femminile con la variazione su un anno delle posizioni delle giocatrici, dal 2000 al 2020 (scarto interquartile)

Quali sono le implicazioni?

Abbiamo una chiave di lettura su quali giocatori trarrebbero probabilmente maggiori benefici o, viceversa, maggiori svantaggi dalla mancata opportunità di cambiare la loro classifica.

Djokovic e Federer

All’età di 32 anni, il numero 1 del mondo Novak Djokovic è in quell’intervallo della curva in cui rimanere al vertice per lunghi periodi vorrebbe dire andare contro pronostico. I giocatori tra i primi 10 a questo punto della carriera perdono tipicamente dieci di posizioni in un solo anno.

La situazione sarebbe ancora più precaria per i 38 anni di Roger Federer. A quell’età, non sono molti i giocatori a rimanere competitivi ad alto livello e quelli che riescono a non subire infortuni possono comunque attendersi di perdere quindici posizioni in un anno. In realtà, dopo aver compiuto trent’anni, Federer ha perso anche fino a quattordici posizioni in 52 settimane. Dovesse Federer tornare alla ribalta dopo l’operazione al ginocchio, sarebbe doppiamente fortunato in caso di sospensione della classifica.

IMMAGINE 3 – Variazione di classifica nell’arco di 52 settimane per quattro giocatori di vertice, con possibili guadagni e perdite attesi in caso di mancate opportunità nei prossimi mesi

Thiem e Auger-Aliassime

Quando riprenderanno le competizioni, saranno giocatori come Dominic Thiem che si trovano nel pieno della carriera ad aver avuto meno da perdere grazie al mantenimento della posizione attuale.

Sono invece giocatori in ascesa come Felix Auger-Aliassime, al momento il numero 20 del mondo a soli diciannove anni, che subiranno le conseguenze più negative di un’interruzione della classifica. Solitamente, in questo passaggio del loro percorso, giocatori destinati a entrare tra i primi 10 hanno guadagnato tra le 25 e le 150 posizioni della classifica in un solo anno. Ci si può fare un’idea nel grafico dal numero e dalla intensità degli incrementi che Auger-Aliassime ha collezionato, con guadagni annuali anche da 125 fino a 150 posizioni negli ultimi due anni.

Certezze e incertezze

La contrapposizione delle traiettorie di questo gruppo di giocatori obbliga a valutare se una stima della classifica non sarebbe un sistema più equo al momento della ripresa dei circuiti dopo una lunga sospensione. Se ad esempio non si torna a giocare prima di sei mesi, ci aspettiamo davvero che tutti i giocatori e le giocatrici siano in grado di mostrare lo stesso livello della loro attuale classifica?

Non credo che lo faremmo e sapremmo probabilmente chi dovrebbe trovarsi più in alto o più in basso rispetto all’età e alla forma più recente. Di sicuro però giocatori e appassionati non accetterebbero cambiamenti alla classifica che non siano legati a risultati effettivi. Ciò che è meno certo è quanto dovremo aspettare prima di vedere di nuovo delle partite su un campo da tennis.

Winners and Losers of a Rankings Hiatus

Gli effetti della riduzione del numero di teste di serie negli Slam

Adam Coti // PureFreedom

Pubblicato il 18 gennaio 2018 – Traduzione di Edoardo Salvati

Introduzione

Prima dell’inizio degli Australian Open 2019, sembrava che, dopo diciotto anni di stabilità, il numero di teste di serie negli Slam sarebbe stato ridotto della metà, da 32 a 16. In questo modo, le fasi iniziali del torneo avrebbero avuto partite più competitive. In prospettiva storica, sarebbe stato davvero così? Con un ritorno a tabelloni a 16 teste di serie, ci sarebbero state più vittorie a sorpresa nei primi turni? 

L’analisi che segue riguarda 30.408 partite maschili e femminili negli Slam nel periodo dal 1988 al 2017, nella volontà di trovare una risposta. Inoltre, sarebbe utile cercare di capire quanto spesso le teste di serie più alte o giocatori o giocatrici con classifica più alta riescono effettivamente a vincere in qualsiasi delle loro partite Slam. Sulla probabilità di un favorito di vincere incide il turno in cui si gioca la partite? I giocatori favoriti hanno più probabilità di vincere delle giocatrici favorite? Tre tabelle nella parte conclusiva dell’analisi forniscono qualche chiarimento al riguardo. 

La frequenza di vittoria delle teste di serie per turno di gioco

Dal 1988, quando gli Australian Open hanno allargato il tabellone principale a 128 giocatori, fino al Roland Garros 2001, ci sono stati 54 Slam con 16 teste di serie, rispetto ai 66 Slam fino a tutto il 2017 con 32 teste di serie. Per facilitare un confronto più immediato, i risultati di quest’ultimo gruppo sono stati suddivisi in due sottoinsiemi di teste di serie, 1—16 e 17—32.

È importante notare che questi dati rappresentano medie basate sull’esito di tutte le partite negli Slam. Non si considera come è stato ottenuto il passaggio del turno, se da una vittoria o con un ritiro prima o durante la partita. Si tratta semplicemente del calcolo di quanti giocatori di ciascuna categoria sono rimasti dopo ogni turno. 

Tabellone Maschile

IMMAGINE 1 – Prime 16 teste di serie del tabellone maschile rimaste dopo ciascun turno, dal 1988 al 2017

Note:

  • per gli Slam con 16 teste di serie, il campione è composto da 6858 partite, mentre per gli Slam con 32 teste di serie è di 8382 partite
  • in media, un tabellone di 16 teste di serie ha avuto circa una testa di serie vittoriosa in meno dopo il primo e il terzo turno 
  • la discrepanza più ampia è al secondo turno, come mostrato anche dalla distanza maggiore tra le due linee del grafico
  • dal quarto turno in avanti, l’impatto della riduzione delle teste di serie diminuisce gradualmente.

Tabellone Femminile

IMMAGINE 2 – Prime 16 teste di serie del tabellone femminile rimaste dopo ciascun turno, dal 1988 al 2017

Note:

  • per gli Slam con 16 teste di serie, il campione è composto da 6858 partite, mentre per gli Slam con 32 teste di serie è di 8382 partite
  • l’impatto complessivo del numero di teste di serie non è così rilevante come tra gli uomini, come mostrato da una distanza più ravvicinata tra le due linee del grafico 
  • le discrepanze più importanti, e quasi identiche, sono nel terzo e nel quarto turno.

La competitività delle partite degli Slam

In ogni partita di uno Slam, il favorito può essere determinato in modo oggettivo o tramite le teste di serie o in termini di classifica ufficiale. Vale a dire, se giocano due teste di serie, il giocatore con la testa di serie più alta è il favorito. Se invece giocano due giocatori fuori dalle teste di serie, il favorito è quello con la classifica più alta. In ultimo, se una testa di serie gioca contro un giocatore senza testa di serie, il favorito è la testa di serie. 

Sulla base di queste premesse, quanto spesso il giocatore favorito vince poi la partita in uno Slam? Le tabelle che seguono illustrano la tematica per anno, torneo e turno. 

Per Anno

IMMAGINE 3 – Percentuale di vittoria di favoriti e favorite negli Slam per anno, media mobile di tre anni dal 1988 al 2017

Note:

  • per ciascun anno il campione include tutti gli Slam per un totale di 508 partite per il tabellone maschile e per quello femminile 
  • la frequenza di vittoria del favorito e della favorita si è mossa, generalmente, in direzione opposta nell’ultimo decennio
  • per gli uomini, il punto di flesso si è verificato intorno alla fine degli anni ’90, quando a un declino costante del rendimento dei favoriti è seguito l’inizio di una tendenza di stabile risalita.
  • per le donne, nell’ultimo decennio la percentuale di vittoria delle favorite si è attestata su un declino costante.

Per Torneo

IMMAGINE 4 – Percentuale di vittoria di favoriti e favorite negli Slam per torneo, dal 1988 al 2017

Note:

  • per ciascuno Slam, il campione di partite è di 3810 per tabellone maschile e per tabellone femminile
  • per le donne, le favorite vincono più spesso agli US Open, mentre è al Roland Garros che si verifica il maggior numero di vittorie a sorpresa
  • per gli uomini, i favoriti vincono più spesso agli Australian Open, mentre è a Wimbledon che subiscono più sconfitte a sorpresa.

Per turno

IMMAGINE 5 – Percentuale di vittoria di favoriti e favorite negli Slam per turno, dal 1988 al 2017

Note:

  • le favorite vincono con più continuità nei primi turni rispetto agli uomini, anche se poi sono soggette a più sconfitte in semifinale e finale
  • il turno in cui i favoriti vincono più spesso è il quarto, mentre per le donne è il terzo.

Riconoscimenti

La fonte della maggior parte dei dati grezzi utilizzati nell’analisi è il database dei risultati delle partite del circuito maschile compilato e messo a disposizione da Jeff Sackmann. In caso di dati mancanti, ho fatto riferimento al sito ufficiale dell’ATP e della WTA. Chi volesse approfondire, può scaricare il file Microsoft Excel con i dati grezzi che ho raccolto. 

The Effect of Reducing the Number of Seeds at Tennis Majors

Le regole proposte da Charles Dodgson per i tornei di tennis

di Peter Ellis // FreeRangeStatistics

Pubblicato l’1 febbraio 2020 – Traduzione di Edoardo Salvati

In un precedente articolo, ho analizzato l’impatto dell’assegnazione delle teste di serie in un torneo di tennis. Le teste di serie sono uno dei modi per aumentare la probabilità che i giocatori più forti arrivino nelle fasi conclusive di una competizione a eliminazione diretta, portando a esiti più giusti e a maggiori possibilità di riservare gli scontri più entusiasmanti per la fine del torneo. In sostanza, l’obiettivo è ovviare a questo problema:

In un torneo di Lawn Tennis a cui, quasi per caso, mi capitò di assistere tempo fa, fu portato alla mia attenzione l’attuale metodo di assegnazione dei premi dalle lamentele di uno dei giocatori, che era stato battuto (e aveva conseguentemente perso ogni possibilità di vincere un premio) nei turni iniziali, e che aveva dovuto subire l’umiliazione di vedere conquistare il premio del secondo classificato da un altro giocatore, che lui sapeva essere ben inferiore.

L’episodio appena descritto portò Charles Dodgson, illustre matematico del diciannovesimo secolo dell’Università di Oxford, a proporre un’alternativa all’allora in voga sistema di eliminazione diretta senza teste di serie. Il suo trattato sul tema dal titolo “ LAWN TENNIS TOURNAMENTS: The True Method of Assigning Prizes with a Proof of the Fallacy of the Present Method” si trova alla pagina 1082 dell’opera omnia. Naturalmente, Dodgson è più conosciuto al mondo come autore a tempo perso di libri per bambini con lo pseudonimo di Lewis Carroll, le cui opere includono il capolavoro “Le avventure di Alice nel paese delle meraviglie”, “ Attraverso lo specchio e quel che Alice vi trovò”, “La caccia allo Snark” e il giustamente dimenticato “Sylvie e Bruno”.

Gli elementi di base

Ecco gli elementi di base del sistema elaborato da Dodgson, descritto per un torneo a 32 giocatori:

  • viene tenuto un elenco in cui alla fine di ciascuna partita, accanto a ogni nome si scrive il nome del giocatore o dei giocatori che gli sono stati superiori, o in virtù di una vittoria diretta, o perché hanno battuto qualcuno che a sua volta ci è riuscito (vale a dire se A batte B e B batte C, A e B sono entrambi superiori a C). Non appena accanto al nome di un giocatore ce ne sono altri tre a lui superiori, quel giocatore è cancellato dalla lista
  • nella prima giornata di competizioni, c’è solo una partita per giocatore, con i 32 giocatori che sono accoppiati a due a due a formare 16 coppie
  • per il secondo giorno […] i 16 giocatori che hanno vinto la prima partita sono accoppiati tra di loro, così come i 16 che hanno un superiore (coloro che perdono in quest’ultimo gruppo di coppie avranno 3 superiori ciascuno, e verranno quindi eliminati dalla lista). Per tutte le altre partite i giocatori sono accoppiati allo stesso modo, prima quelli che non hanno mai perso, poi quelli con un superiore e così via, cercando di evitare, quanto possibile, di accoppiare due giocatori che hanno un superiore in comune
  • alla metà del terzo giorno, sono rimasti solo due giocatori senza sconfitte […] e questi due hanno una partita da giocare per tutto il quarto giorno
  • alla fine del quarto giorno si conosce il nome del giocatore che ha vinto il primo premio (grazie allo stesso processo di eliminazione usato nel metodo in vigore): i restanti giocatori sono accoppiati secondo le medesime regole, per le due partite da disputare al quinto giorno.

Teoria contro realtà

L’essenza di questo procedimento è che nessun giocatore è eliminato fino a che non è certo che non sia tra i migliori tre, perché gli eliminati hanno almeno tre superiori da cui hanno perso direttamente o che hanno battuto qualcuno che li ha battuti. Così i migliori tre sono in grado di surclassare tutti gli altri.

Un’osservazione interessante è che, secondo le regole di Dodgson, non serve che il numero di giocatori sia in potenza di due, come nel caso di un classico torneo a eliminazione diretta in cui gli organizzatori vogliono evitare situazioni di bye a senso unico.

Dodgson sostiene che la sua proposta dà garanzia di assegnare con accuratezza il primo, secondo e terzo premio ai migliori tre giocatori. Questa si basa però su alcune ipotesi chiave:

  • la superiorità è transitiva, quindi se A è superiore a B e B a C, allora A è superiore a C
  • la superiorità è deterministica, coerente e costante.

Naturalmente, il mondo reale opera con altri canoni. Ci si interroga quindi sulla bontà del metodo di Dodgson nel momento in cui i risultati delle singole partite non sono costanti e sono incoerenti tra loro, in linea con quanto emerso dalle realistiche simulazioni con valutazioni Elo che ho usato in precedenza. Per scoprirlo, ho simulato tornei impostati secondo le regole di Dodgson con le stesse 128 giocatrici di vertice dal 1990 dei tornei più convenzionali della scorsa analisi. Il codice che ho scritto permette di scegliere l’esito di singoli scontri tra giocatrici, da un lato in senso deterministico (cioè la giocatrice con la valutazione più alta ha garanzia di vincere, come nella dimostrazione a 32 giocatori di Dodgson), dall’altro in senso realisticamente probabilistico (la probabilità di vittoria è casuale, ma legata comunque alla valutazione Elo delle due giocatrici).

Risultati

Se le vincitrici sono deterministici, si arriva a un risultato come quello illustrato da Dodgson

Non deve sorprendere che il suo metodo assegni correttamente i premi in un torneo a 32 giocatori con esiti deterministici delle partite, vista la notevole abilità matematica che possedeva. Ero curioso di vedere se avesse funzionato in presenza di molti più partecipanti, e ho trovato che le sue regole (con modifiche minime) identificano nel giusto ordine i tre giocatori, a cui assegnano i primi tre premi, 100 volte su 100 diverse simulazioni.

Anche un torneo a eliminazione diretta con esito deterministico delle partite e con una corretta attribuzione delle teste di serie farà emergere con precisione le quattro migliori giocatrici il 100% delle volte. Credo che Dodgson pensasse che non si potesse fare affidamento su una conoscenza aprioristica del livello dei giocatori, escludendo quindi la possibilità di un torneo con teste di serie. Di sicuro, l’unico confronto che ha fatto è tra il suo metodo e un tabellone senza teste di serie.

È da notare che nel torneo ipotizzato da Dodgson serviranno all’incirca il doppio delle partite (con variazione a seconda dell’efficienza del tabellone, anche se in media nelle mie simulazioni le partite sono state 240) di un torneo a eliminazione diretta (che ha bisogno di 127 partite per 128 giocatori).

I risultati non sono così puntuali nello scenario in cui le vittorie sono realisticamente probabilistiche

In presenza di esiti non deterministici ma dipendenti dal caso e legati alla differenza di bravura associata alle valutazioni Elo, il metodo di Dodgson non è valido quanto avrebbe sperato. Naturalmente, si tratta sempre di un modello realistico. Anche nel periodo di dominio totale, Steffi Graf (la giocatrice con la valutazione massima tra quelle prese in esame per gli anni ’90) poteva comunque avere qualche probabilità di perdere contro altre giocatrici di vertice in una qualsiasi partita, come visto nel grafico che qui ripropongo.

IMMAGINE 1 – Probabilità di alcune giocatrici tra le prime 128 di battere Graf alla fine del 1990 sulla base delle valutazioni Elo

Efficacia delle teste di serie_2 - settesei.it

Il grafico dell’immagine 2 mostra i risultati di una simulazione di 1000 tornei giocati secondo le regole di Dodgson, con realistiche probabilità di vittoria e sconfitta (quindi non solo 1 e 0). Alcune conclusioni che si possono derivare:

  • le giocatrici di vertice vincono il torneo il 57% delle volte
  • il 36% delle volte giocano la finale le prime due giocatrici e il 23% delle volte vince la testa di serie numero 1
  • le prime tre giocatrici vincono i primi tre premi partita nell’ordine giusto solo il 7% delle volte.

Nel modello deterministico di Dodgson, per queste tre casistiche la probabilità è del 100%.

IMMAGINE 2 – Rendimento delle regole proposte da Dodgson in termini di probabilità della prima, seconda e terza giocatrice di finire il torneo nella giusta posizione

L’efficacia delle valutazioni Elo

Nel modello probabilistico, gli esiti del torneo secondo le regole di Dodgson sono simili a quelli di uno a eliminazione diretta con teste di serie, come ho scritto in precedenza. Ad esempio, in un tabellone con teste di serie, Graf, la giocatrice più forte, vinceva il 60% dei tornei e le prime due giocatrici erano in finale il 42% delle volte. È un risultato marginalmente migliore, rispetto a quanto ottenuto con le regole di Dodgson, in circa la metà delle partite, a evidenza dell’efficacia dell’utilizzo di informazioni aprioristiche sulla bravura delle giocatrici per la determinazione delle teste di serie.

Attuazione

Metodologia

Applicare le regole di Dodgson in modo che fossero sostenibili su un più ampio campione di tornei, su esiti casuali di partite e su risultati non coerenti e non transitivi è stato tutt’altro che banale.

Alcune decisioni:

  • per le coppie iniziali di giocatrici (e gli scontri successivi) ho proceduto casualmente anziché in ordine alfabetico secondo il cognome
  • ho abbandonato l’idea di “turno”, concentrandomi invece sulla successiva partita individuale da giocare, mettendo insieme, ove possibile, giocatrici con lo stesso numero di game giocati e di sconfitte
  • ho introdotto un concetto di “giocatrice scomoda” per un qualsiasi momento, vale a dire una giocatrice che ha giocato meno game delle altre e ha il minor numero di avversarie legittime disponibili a parità di sconfitte, evitando rivincite, etc. Trovare una partita per la giocatrice scomoda è diventata la priorità in ogni iterazione della mia simulazione
  • in alcune circostanze, ho dovuto permettere partite tra giocatrici che avevano giocato, a quella data, un diverso numero di game. Esiste probabilmente una soluzione che non richiede di farlo, ma non ho avuto tempo di cercarla

E ancora:

  • non sono riuscito neanche a escogitare un sistema pratico per il requisito “cercando di evitare, quanto possibile, di accoppiare due giocatori che hanno un superiore in comune”. Tranne che per occorrenze insolite, ho escluso le rivincite così da evitare che l’algoritmo si bloccasse
  • con risultati non deterministici e consentendo le rivincite dove inevitabile, sono emerse alcune contraddizioni da gestire con cautela. Ad esempio, una giocatrice può diventare superiore a se stessa (se A è battuta da B e poi B è battuta da A in una rivincita, la futura A è ora superiore alla passata A, un caso che ho evitato di considerare nel conteggio)
  • è possibile che le ultime quattro giocatrici rimaste abbiano 3 superiori ciascuna come risultante di una singola partita verso la fine del torneo, rendendo il piazzamento non chiaro. Di fronte a questa evenienza, ho suddiviso il primo posto ex-aequo, anche se semifinali e finale sarebbero più realistiche
  • allo stesso modo, può succedere che la giocatrice 2 e 3 (delle tre rimanenti) siano eliminate in un solo passaggio. Questo significa nessuna finale e un play-off per definire il secondo posto.

Interessante e valido, ma di difficile adozione

In ogni caso, si è trattato di un esperimento divertente. Sono soddisfatto del buon funzionamento di questo metodo per lo svolgimento di un torneo, anche al costo di dover giocare quasi il doppio delle partite di un torneo a eliminazione diretta. E, tutto sommato, anche con esiti di partite realisticamente incerti e non costanti. Non è ovviamente perfetto come l’ideale mondo deterministico descritto nel trattato originario di Dodgson. Come il precedente elenco di decisioni e insidie mostra, l’analisi però può complicarsi molto facilmente. Ci sono parecchi casi insoliti e al limite su cui non mi sono soffermato in dettaglio.

A mia conoscenza, il metodo di Dodgson non è mai stato usato per determinare il tabellone di un effettivo torneo, anche se ci sono state alcune simulazioni simili a questa. Non sono sicuro di quanto le intenzioni dello stesso Dodgson fossero serie. Sempre nel trattato accenna alla possibilità di eliminare i set nel tennis a favore in un sistema più semplice come “il primo giocatore che vince 14 game, o che va avanti di 9, vince la partita”. Dubito però che si aspettasse ragionevolmente una calorosa accoglienza delle sue proposte. Vale comunque la pena notare che l’autore del trattato è la figura professionale Charles Dodgson, appassionato di matematica ricreativa, e non Lewis Carroll, autore di libri per bambini.

Diciamo che, come per molte altre sue opere, la pubblicazione ha un merito. Non mi sbilancerei però a suggerirne l’adozione integrale per i moderni tornei di tennis.

Analysing the effectiveness of tennis tournament seeding

Punteggi di set più probabili per combinazione di giocatrici al servizio

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 22 febbraio 2020 – Traduzione di Edoardo Salvati

Nel suo rientro al professionismo dopo quasi otto anni, Kim Clijsters ha impressionato per aver costretto Garbine Muguruza al tiebreak del secondo set, nel quale nessuna delle due vinceva più del 60% dei punti al servizio. Mi sono chiesta qual è la probabilità di un tiebreak in questi casi. Nell’analisi che segue, ho utilizzato un semplice modello Monte Carlo per verificare i punteggi di set più probabili per diverse combinazioni di giocatrici al servizio.

Nella prima partita giocata da Clijsters a livello professionistico al Dubai Championships, in molti si sono stupiti del punteggio ottenuto contro una giocatrice che aveva da poco disputato la finale agli Australian Open. Anche se spesso chi è al commento considera il tiebreak un esempio di due giocatrici che hanno avuto un rendimento sostanzialmente identico nel set, ci sono molte situazioni che possono portare a un tiebreak e non tutte soddisfano quella condizione.

Ad esempio, nel secondo set della partita in questione Clijsters e Muguruza sono riuscite in un break per parte, con Clijsters che ha vinto solo il 52% dei punti al servizio rispetto al 59% di Muguruza. Di fronte a quelle statistiche, ho cercato di capire se la fortuna ha in parte aiutato Clijsters a mantenere il set così in equilibrio.

Tutti i possibili punteggi

Mediante la simulazione di un set, ho esaminato la probabilità di tutti i possibili punteggi per diverse combinazioni di giocatrici. Per ciascuna occorrenza, ho ipotizzato una percentuale di punti al servizio costante durante il set. Si tratta di una semplificazione (nel gergo statistico del tennis, l’ipotesi indipendente e identicamente distribuito) che però fornisce una base di partenza utile, oltre a essersi rivelata ragionevolmente rappresentativa della prestazione della maggior parte delle giocatrici in un set qualsiasi.

Il grafico dell’immagine 1 è una mappa di calore dei risultati. Sull’asse dell’ordinate troviamo la bravura al servizio della giocatrice che ha vinto il set, mentre sull’asse delle ascisse il corrispondente livello della giocatrice che ha perso il set. Ciascun pannello corrisponde a un diverso punteggio finale per la giocatrice che perde il set, o alla probabilità di un tiebreak, se lo si raggiunge. La somma di tutte le celle nella stessa posizione della griglia per i sette i pannelli è uguale a 100.

IMMAGINE 1 – Possibile numero di game vinti dalla giocatrice che perde il set per ciascuna combinazione di punti vinti al servizio dalla vincitrice del set (ordinate) e dalla perdente del set (ascisse), in un intervallo dal 55 al 95%

Se incrociamo quindi il 55% sull’asse delle ascisse e il 60% su quello delle ordinate, la probabilità di un tiebreak nel secondo set tra Clijsters e Muguruza a Dubai era solo dell’11%. Con questi numeri era più probabile infatti che Muguruza avrebbe vinto il set per 6-4 6-3.

Come mai?

Spostandosi da sinistra verso destra, la probabilità di un tiebreak aumenta quando le giocatrici hanno un simile rendimento al servizio, quello che nella terminologia di Klaassen e Magnus è un piccolo “malus”. Nella tabella il malus è 0 lungo le diagonali e cresce all’aumentare della distanza dalle diagonali.

L’equilibrio nel rendimento al servizio però non è l’unico aspetto. Il fattore più importante anzi è la bravura complessiva al servizio tra le giocatrici, che può essere sintetizzata con la percentuale combinata di punti vinti al servizio. Sempre per Klaassen e Magnus, si tratta del concetto di “bonus”. Nel secondo set tra Clijsters e Muguruza il bonus era solo di 111, abbastanza basso per giocatrici di quella caratura. Nell’immagine 1, il bonus aumenta spostandosi verso l’alto (per la giocatrice che vince il set) e verso destra (per la giocatrice che lo perde).

A parità di qualsiasi riga del grafico, notiamo che la probabilità di un tiebreak, o in questo caso muoversi verso l’ultimo pannello di destra, aumenta all’aumentare del rendimento al servizio della giocatrice che perde il set. Sarebbe molto sorprendente per una giocatrice con il 95% dei punti vinti al servizio perdere il set ma, dovesse accadere, sarebbe quasi con certezza in un tiebreak.

Dedurre le probabilità dal punteggio

Si può anche procedere per punteggio invece che per prestazione al servizio delle giocatrici. Significa determinare la più probabile combinazione di percentuale di punti vinti al servizio con un punteggio dato del set, ad esempio 6-3. Nel caso di un tiebreak, osserviamo una maggiore concentrazione di probabilità negli alti valori dell’angolo superiore a destra. Le probabilità di quest’intervallo sembrano abbastanza uniformi, a enfasi del fatto che le giocatrici non devono avere un rendimento identico al servizio per arrivare al tiebreak.

IMMAGINE 2 – Possibile percentuale di punti al servizio delle due giocatrici dato un determinato punteggio finale del set. I pannelli da sinistra a destra mostrano i game vinti dalla giocatrice che perde il set

Uno dei motivi per i quali il tennis è uno sport che invita all’analisi statistica è il contenuto informativo che si può apprendere sul possibile risultato di una partita conoscendo solo il rendimento al servizio di una giocatrice contro un’altra. Un solo grafico è in grado di illustrare tutti i possibili esiti di set in una partita di tennis! Ovviamente, si potrebbe anche includere gli effetti generati da ipotesi non indipendenti e identicamente distribuite se sapessimo che alcune giocatrici, ad esempio, sistematicamente cedono alla pressione delle palle break. Spero comunque che sia un riferimento per chi vuole andare oltre il semplice punteggio di una partita.

Which Set Scores Are Most Likely for all Combinations of Servers?

L’effetto numero 1 o come il successo di Barty potrebbe scuotere il tennis femminile australiano

di Stephanie Kovalchik // TheConversation

Pubblicato il 3 febbraio 2020 – Traduzione di Edoardo Salvati

La vittoria di Sofia Kenin nella semifinale degli Australian Open 2020 ai danni di Ashleigh Barty ha certamente deluso le aspettative dei tifosi australiani. Dopo le premature sconfitte di Serena Williams e Naomi Osaka, le quote davano Barty come favorita. Kenin ha invece battuto anche Garbine Muguruza in finale per vincere il suo primo Slam ad appena 21 anni.

Distratti dall’importanza della conquista di uno Slam, è facile perdere di vista le esternalità positive del rendimento di una giocatrice sulla possibile crescita dello sport nei singoli paesi. Studi hanno concluso che quando una professionista raggiunge il vertice della classifica dominando per lunghi periodi, segue spesso uno sviluppo di talento tennistico nel suo paese di origine. Questo induce a pensare che il movimento femminile australiano potrebbe beneficiare nei prossimi anni della ribalta sulla scena di nuove giocatrici che cercano di replicare i successi di Barty.

Le numero 1 degli ultimi 35 anni

I risultati ottenuti da Barty lo scorso anno sono ragguardevoli, soprattutto considerando che la competizione tra le migliori sembra diventare sempre più intensa con il passare del tempo. Nel corso della sua esplosiva stagione 2019, è stata una presenza schiacciante, vincendo 57 partite su 70 e quattro tornei tra cui il suo primo Slam al Roland Garros e le Finali di stagione in Cina. È inoltre diventata la numero 1 mondiale, la prima australiana a riuscirci da Evonne Goolagong 43 anni fa. Anche dopo la sconfitta in semifinale, il margine su Karolina Pliskova, seconda in classifica, è abbondante.

Negli ultimi 35 anni, hanno raggiunto il primo posto della classifica 25 giocatrici da 14 paesi. Dal 1985 al 2005, il tennis femminile è stato appannaggio degli Stati Uniti, con sette diverse giocatrici che si sono alternate al numero 1. Il Belgio ne ha prodotte due, Francia, Germania, Spagna, Russia e Svizzera una a testa. Dal 2010, 11 giocatrici di 11 paesi hanno raggiunto il numero 1 (anche facilitate dagli alti e bassi della carriera di Williams).

IMMAGINE 1 – Sequenza delle giocatrici al numero 1 della classifica dal 1984

Grazie a giocatrici come Barty, la giapponese Osaka e la rumena Simona Halep, mai come prima la recente diversità al vertice del tennis femminile ha creato modelli emulativi per le aspiranti future professioniste di tutto il mondo. E il passato suggerisce che questo fattore è fondamentale per lo sviluppo del tennis nei paesi più piccoli (come il Belgio e la Serbia ad esempio) che mancano tradizionalmente di un seguito diffuso quanto quello di altri sport, e per il consolidamento di future generazioni di giocatrici in paesi con in cui il tennis è da sempre più radicato (come gli Stati Uniti, l’Australia e alcune nazioni europee).

Come le numero 1 hanno ispirato altre giocatrici nel mondo

Analizzando i sei paesi che, al di fuori degli Stati Uniti, hanno avuto una o più giocatrici al numero 1 dal 1990 al 2010 (in giallo nell’immagine 2), osserviamo diverse incoraggianti tendenze. In primo luogo, si assiste a un aumento delle giocatrici di un paese tra le prime 150 in coincidenza dell’ascesa al vertice di una connazionale o negli anni immediatamente successivi.

Belgio, Russia e Svizzera

In Belgio ad esempio, poco dopo il numero 1 di Kim Clijsters e Justine Henin nei primi anni 2000, altre giocatrici come Yanina Wickmayer e Kirsten Flipkens iniziarono a risalire la classifica. Il periodo di Maria Sharapova al numero 1 dalla seconda metà del 2000 coincise con ottimi risultati da parte delle compatriote Elena Dementieva e Vera Zvonareva e, ancora di più, Dinara Safina, anche lei numero 1 nel 2009.

Anche all’incredibile carriera di Martina Hingis fece seguito lo sviluppo di altre giocatrici svizzere, tra cui l’attuale numero 7 Belinda Bencic, che è stata pure allenata dalla madre di Hingis.

IMMAGINE 2 – Numero di giocatrici tra le prime 150 e le prime 30 per sei paesi con una giocatrice al numero 1 del mondo (il cui periodo è evidenziato in giallo)

Germania e Spagna

Si può anche vedere che due recenti numeri 1, la tedesca Angelique Kerber e la spagnola Muguruza, hanno guadagnato quella posizione quasi esattamente a distanza di 15 anni dall’ultima connazionale. Kerber ha seguito le orme di Steffi Graf, mentre Muguruza è stata preceduta da Arantxa Sanchez.

Stati Uniti

Negli Stati Uniti, molte giocatrici afro-americane, tra cui la quindicenne Cori Gauff, hanno fatto riferimento al successo delle sorelle Williams come motivazione maggiore nella decisione di intraprendere da giovanissime un percorso nel tennis. La pletora di giocatrici afro-americane tra le prime 150 è indicazione della capacità persuasiva dei risultati di Serena e Venus Williams su atlete come Madison Keys, Sloane Stephens, Gauff, Taylor Townsend, Whitney Osuigwe e Sachia Vickery.

Le ricadute positive generate dall’effetto numero 1

In qualsiasi sport, lo sviluppo di talenti in grado di competere ai livelli più alti è un processo complesso che richiede l’allineamento di molteplici fattori, dalla bravura di base delle giocatrici all’appoggio delle famiglie, della comunità, degli allenatori e delle federazioni nazionali.

Anche se il successo delle giocatrici di vertice è solo una variabile dell’equazione, è inserito in un concetto economico ben noto, quello della teoria della goccia (o trickle-down). Applicata allo sport, questa teoria postula che i risultati delle migliori possono arrivare a rappresentare una fonte motivazionale enorme per la base del movimento e spingere più persone a intraprendere quello sport. Nel tennis, l’andamento storico delle statistiche relative alla classifica mostra un chiaro effetto goccia generato dalle giocatrici che ottengono il primo posto, specialmente in quei paesi che non hanno mai avuto o non hanno avuto da decenni una giocatrice al vertice.

Quello che non emerge dalle statistiche è quanto la personalità e l’esempio di una numero 1 incide sullo sviluppo e sulla crescita delle giovanissime connazionali. Se nelle due settimane degli Australian Open si è avuto modo di conoscere meglio Barty, ci si è accorti che il suo gioco è solo parte della sua unicità. Simpatia e forza d’animo di fronte a trionfi e sconfitte la rendono universalmente apprezzabile e ne fanno ulteriore riferimento motivazionale per le giocatrici più giovani. Poche altre si sono probabilmente trovate in una posizione d’influenza così preminente e duratura per il loro paese e nel loro sport.

The No. 1 effect: why Ash Barty’s success could lead to a boom in women’s tennis in Australia

Un’analisi dell’efficacia del sistema di teste di serie

di Peter Ellis // FreeRangeStatistics

Pubblicato il 26 gennaio 2020 – Traduzione di Edoardo Salvati

Ispirato dagli Australian Open 2020, ho deciso di indagare in che modo il sistema di teste di serie e la distribuzione dei giocatori nel tabellone principale incidono sul risultato finale di un torneo. Probabilmente ritornerò sull’argomento, ma l’obiettivo odierno è di analizzare l’impatto dell’assegnazione delle teste di serie sulla probabilità per i più forti di vincere, arrivare in finale, in semifinale o nei quarti di finale.

Metto a confronto i risultati di simulazioni di tornei a eliminazione diretta tra questi giocatori in due tipologie di scenari, da un lato un posizionamento del tutto casuale nel tabellone in assenza di teste di serie, dall’altro l’introduzione di 32 teste di serie come accade nei tornei dello Slam.

L’immagine 1 mostra che la scelta della metodologia determina conseguenze differenti: l’adozione delle teste di serie comporta un aumento concreto della probabilità del migliore di vincere o dei due più forti di arrivare in finale, e ha rilevanza ancora maggiore ai fini della determinazione delle semifinali e dei quarti di finale.

IMMAGINE 1 – Impatto del sistema a teste di serie sul risultato che i migliori possono raggiungere

Distribuzione della bravura dei giocatori

Questo significa che, ad esempio, con 32 giocatori che ricevono una posizione speciale in tabellone grazie alla testa di serie, esiste una probabilità del 22% che in semifinale arriveranno i migliori quattro, rispetto una probabilità di solo il 2% con un tabellone casuale. In una assegnazione casuale, la probabilità di vedere i migliori otto nei quarti di finale è di fatto prossima allo zero, mentre in un tabellone con teste di serie succederà il 3% delle volte (che non è comunque molto spesso, aspetto che però non dovrebbe destare stupore tra coloro che seguono il tennis regolarmente). Di contro, la probabilità che le prime due teste di serie siano in finale è del 42% in un tabellone con teste di serie e solo del 20% in uno casuale.

Va sottolineato che questi risultati dipenderanno dalla distribuzione della bravura dei giocatori nello specifico torneo. All’estremo, se il più forte è in grado di dominare tutti gli altri, la presenza delle teste di serie non farà alcuna differenza per la vittoria finale.

Valori teorici di riferimento

Possiamo calcolare altri valori teorici come limiti di riferimento. Ad esempio, se i primi due giocatori fossero effettivamente invincibili contro chiunque tranne che l’altro, si incontrerebbero in finale il 100% delle volte in un tabellone con teste di serie e il 50% delle volte in un tabellone casuale. Qualsiasi valore inferiore (il 42% e il 20% nel nostro caso) identifica il divario tra un livello “decisamente” alto di questi due giocatori nei confronti degli altri e un livello “infinitamente” alto.

Stephanie Kovalchik ha scritto sulle conseguenze dell’ipotesi di riduzione da 32 a 16 teste di serie negli Slam (che non ha poi avuto seguito), in cui ha mostrato che i risultati sarebbero stati meno esatti rispetto a un sistema a 32 teste di serie, dove per esatto s’intende il raggiungimento del turno atteso da parte del giocatore in funzione della sua classifica.

Serie storica di risultati

Per procedere con l’analisi, ho utilizzato dati sulla bravura effettiva relativa dei giocatori ottenuti grazie al pacchetto {deuce} R codificato da Kovalchik. Mi serviva un intervallo realistico di valori sulla bravura che potessero essere applicati a scontri diretti come in un torneo reale. Ho scelto di concentrarmi su un preciso momento temporale invece di una sfida tra ere che, per esempio, avrebbe messo di fronte Margaret Court e Serena Williams. Onde evitare confusione con l’attualità, ho scelto la stagione femminile del 1990. L’immagine 2 riepiloga le prime 10 a fine 1990 sulla base della loro valutazione Elo.

IMMAGINE 2 – Prime 10 giocatrici per valutazione Elo a fine 1990

Tramite dati raccolti da Jeff Sackmann, Kovalchik fornisce le valutazioni Elo per ciascuna giocatrice per specifico momento temporale. Avevo già parlato di Elo in merito al Backgammon e al calcio australiano. Si tratta di un metodo molto efficace per fare valutazioni di giocatori rispetto all’effettivo rendimento, con il grande vantaggio di poterne derivare probabilità per un qualsiasi ipotetico scontro diretto.

La valutazione è oggetto di aggiustamenti incrementali in funzione della rispondenza tra situazione effettiva e probabilità derivate dalle valutazione Elo alla vigilia della partita. Questo ne fa un’indice utile e con capacità di correzione automatica, e facilmente integrabile in un modello statistico.

Per essere sicuro della corretta conversione delle valutazioni Elo di Kovalchik in probabilità, mi affido alla sua funzione elo_prediction() per la stima della probabilità di vittoria in ciascun accoppiamento. L’immagine 3 illustra mostra la probabilità di battere Steffi Graf da parte di una selezione di giocatrici classificate tra la posizione 2 e la 128 in termini di valutazioni Elo (Graf che, dall’inizio dell’era Open, è la giocatrice che la più alta valutazione assoluta).

IMMAGINE 3 – Probabilità di alcune tra le prime 128 di battere Graf alla fine del 1990

La simulazione dei tabelloni e risultati

Per completare la laboriosa attività di simulazione di tornei tra queste 128 giocatrici, ho scritto una funzione simulate_tournament() il cui principale argomento è una struttura dati di 128 righe di fila che rappresentano il tabellone, come nell’immagine 4.

IMMAGINE 4 – Funzione simulate_tournament()

Questo indica ad esempio che nel primo turno giocato (“round of 128”) Dianne Van Rensburg giocherà contro Carling Basset Seguso nella partita 1 (match 1). L’immagine 5 mostra il risultato filtrando per la partita 1 del secondo turno (“round of 64”)

IMMAGINE 5 – Partite del secondo turno della simulazione

Troviamo quattro giocatrici nella partita 1. Però una tra Van Resnburg e Seguso avrà perso nel primo turno, così come una tra Elna Reinach e Wiltrud Probst. Con un po’ di attenzione, l’oggetto brackets riesce a contenere l’intero tabellone principale, e può essere disegnato in modo che le prime 32 teste di serie siano allocate nei singoli quarti come richiesto da un tabellone a 32 teste di serie. Il resto del codice che ho scritto esegue questa simulazione per i due scenari di tabellone che ho individuato in precedenza.

Arriviamo ai risultati

La tabella riepiloga la distribuzione delle vincitrici. Non sorprende che Graf vinca più simulazioni di torneo di qualsiasi altra, 5454 su 10.000 con un tabellone casuale, e 5913 su 10.000 con un tabellone a 32 teste di serie. Anche in un periodo di dominio totale di Graf, ci sono comunque giocatrici (e non solo alcune tra quelle di vertice) con una probabilità di vittoria diversa da zero. Ed è questo che attrae le persone a seguire il tennis. È interessante come da Monica Seles (a quel tempo al terzo posto delle valutazioni Elo) a scendere, è più probabile che una giocatrice vinca il torneo simulato in un tabellone casuale invece che in uno con le teste di serie.

Vincitrice         Class.  No t.d.s.  32 t.d.s.
Graf               1       5454       5913
Navratilova        2       2089       2219
Seles              3       1064       1018
Sabatini           4       510        418
M.J. Fernandez     5       213        132
Martinez           7       110        66
Sanchez Vicario    6       113        63
Capriati           8       89         42
Maleeva Fragniere  9       66         34
Garrison           10      58         26 

Questo rimanda ai risultati evidenziati dal grafico dell’immagine 1 di inizio articolo. Spero presto di riprendere questa tematica e confrontare i due metodi con l’alternativa proposta da Charles Dodgson in “Lawn Tennis Tournaments. The True Method of Assigning Prizes with a Proof of the Fallacy of the Present Method”. Dodgson, che oltre a essere un matematico e logico trovò il tempo di dare vita a uno dei più importanti personaggi della letteratura inglese (in Alice nel paese delle meraviglie con lo pseudonimo di Lewis Carrol, n.d.t.), scriveva prima della diffusione del concetto di teste di serie. Propose un’alternativa al torneo a eliminazione diretta che a suo dire garantiva l’assegnazione esatta dei primi tre premi ai tre giocatori più forti. Il suo ragionamento però poggiava su una visione non probabilistica del significato di migliore. Certamente meritevole di approfondimento, ma per un’altra occasione.

Analysing the effectiveness of tennis tournament seeding

La fortuna del sorteggio: Australian Open 2020 (donne)

di Chapel Heel // HiddenGameOfTennis

Pubblicato il 19 gennaio 2020 – Traduzione di Edoardo Salvati

Come per gli uomini, anche per le donne ho eseguito una simulazione (con la mia variante Elo) di 100.000 configurazioni del tabellone principale, utilizzando lo stesso metodo che gli organizzatori usano per assegnare ai giocatori la loro posizione. L’ho poi confrontata con la previsione per il torneo su base Elo rispetto al tabellone effettivo.

La tabella mette a confronto la previsione effettiva del tabellone con i risultati dalle simulazioni di rimescolamento, in modo da avere alcune indicazioni sull’accessibilità del tabellone effettivo rispetto alle altre configurazioni. Tonalità di rosso (e arancione) evidenziano la sfortuna del giocatore. Al contrario, tonalità di verde rappresentano la fortuna ricevuta nel tabellone effettivo, in riferimento a un particolare turno. Il giallo simboleggia neutralità, e si può di fatto ignorare qualsiasi valore superiore o inferiore allo 0.2%.

Per una presentazione più compatta rispetto al passato, ho riportato nella tabella solo le teste di serie, e organizzato nella tabella successiva quei giocatori fuori dalle teste di serie per i quali c’è stata un’incidenza degna di nota (almeno l’1.0% di segno positivo o negativo).

Tabellone effettivo e simulato a confronto per le teste di serie

Generalmente, si vedono un po’ di tonalità di rosso e di verde nei numeri relativi ai quarti di finale, ma da li in avanti è quasi tutto giallo o sui toni dell’arancione. In questo senso la riga di Naomi Osaka appare particolarmente negativa (che ha superato il primo turno, n.d.t.), all’opposto quella di Serena Williams decisamente positiva (anche lei vincitrice al primo turno, n.d.t.). Forse è la volta buona per Williams di raggiungere il record di Slam di Margaret Court.

IMMAGINE 1 – Confronto tra tabellone effettivo e simulazioni per le teste di serie

Effetti di rilievo su una selezione di giocatrici fuori dalle teste di serie

A Maria Sharapova non era andata bene agli US Open 2019, forse in Australia la fortuna sta cercando di recuperare (ha però perso subito al primo turno, n.d.t.). Caroline Wozniacki invece non ha ricevuto nessun regalo di addio alle competizioni (ma ha superato il primo turno, n.d.t.).

IMMAGINE 2 – Effetti della casualità del sorteggio su alcune non teste di serie

Luck of the Draw: Australian Open 2020 (Women)