L’ipotesi non indipendente e identicamente distribuito nel tennis

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 20 marzo 2020 – Traduzione di Edoardo Salvati

In assenza di sport in campo per cause di forza maggiore, c’è più tempo per gli smanettoni dei numeri per scatenarsi. In questo articolo, cerco di rispondere alla domanda che dovrebbe stare a cuore di qualsiasi analista di tennis: ai giocatori si applica l’ipotesi non indipendente e identicamente distribuito (non iid)? Come si possono misurare le conseguenze relative a una situazione non iid? Perché dovrebbe interessarci? E quali sono stati i giocatori più non iid tra i primi 50 della classifica?

In uno dei rari studi di sport a essere pubblicato sul Journal of the American Statistical Association, i due giganti dell’analisi statistica del tennis Franc Klaassen e Jan Magnus si soffermano sull’ipotesi indipendente e identicamente distribuito (iid) per l’esito dei punti nel tennis. Se vi fosse mai capitato di fare una regressione, avrete già applicato l’ipotesi iid. Per un campione casuale di occorrenze, iid è un punto di partenza comodo e ragionevole. Nella fattispecie tennistica, iid è il modo più semplice per intendere la sequenza di punti in una partita. In sostanza, una volta che si conosce la media di punti vinti al servizio dal giocatore in quella partita si ipotizza che ogni punto al servizio sia una prova Bernoulli con la probabilità dell’esito “successo” pari alla probabilità di punti vinti al servizio del giocatore nella partita.

Da un punto di vista dell’analisi statistica, iid è una manna. Se i giocatori sono iid, allora qualsiasi quesito investigativo come vincere un set, vincere un tiebreak o vincere la partita si riduce a una qualche funzione della probabilità di punti vinti al servizio del giocatore.

Cosa succede però se i giocatori non sono iid?

Beh, la situazione si complica. L’ipotesi non iid vorrebbe dire che, in determinati momenti come ad esempio sul 30-30, i giocatori servono sistematicamente meglio o peggio. Dovremmo conoscere nel dettaglio quelle dinamiche per avere anche una speranza di descrivere le probabilità di risultato durante lo svolgimento di una partita.

Se guardando una partita vi è capitato di pensare che un giocatore ha il braccino o ha ceduto alla pressione, vi stavate esprimendo in termi di effetti non iid. Ci si è abituati ormai a vari cambiamenti di fronte nel corso di una partita che è difficile accettare il postulato per cui i giocatori sono iid. Quella che sembra una striscia vincente, o uno scenario sorprendente, è in realtà in linea con le probabilità associate a una sequenza di Bernoulli.

Se è possibile ricavare un insegnamento dallo studio di Klaassen e Magnus, è che la verità sta nel mezzo. Voglio cioè dire che i giocatori non sono iid, ma gli effetti del loro non iid sono molto più contenuti di quanto si potrebbe pensare. Così ridotti infatti che l’ipotesi iid, in molti casi nel tennis, è una descrizione estremamente veritiera dei risultati effettivi. Anche in presenza di effetti circoscritti, almeno nella media, è comunque possibile che alcuni giocatori mostrino un comportamento non iid più accentuato di altri. Quali sono tra quelli attualmente al vertice i giocatori meno iid in assoluto?

Una misura complessiva degli effetti non iid

Un modo per ottenere una misura complessiva degli effetti non iid in una partita è confrontare i game al servizio concretamente vinti da un giocatore con i servizi vinti in base alle previsioni iid. Chiamiamo g la proporzione di servizi vinti concretamente in una partita. Chiamiamo poi p la proporzione di punti vinti al servizio in una partita dal giocatore in esame e q quella del suo avversario. Date le caratteristiche espresse al servizio durante la partita, possiamo usare una simulazione Monte Carlo per calcolare una proporzione attesa di game vinti come ĝ(p,q).

Per fare un esempio pratico, nell’ultima partita prima della sospensione, Novak Djokovic ha vinto il 90% dei game al servizio, con una percentuale di punti vinti al servizio del 70% contro il 58% di Stefanos Tsitsipas. Inserendo probabilità al servizio del 70% e del 58% nel simulatore iid per una partita al meglio dei tre set, si riesce a determinare la stima dei game vinti al servizio per un grande numero di partite simulate.

Ho eseguito questa simulazione per le partite dal 2018 a oggi per tutti i giocatori tra i primi 50 (qualunque sia il significato attuale della classifica). L’immagine 1 mostra i risultati per tutte le partite, con in blu il non iid medio. I giocatori sono in ordine decrescente dall’alto verso il basso da quello con la media non iid più positiva a quello con la media non iid inferiore. Un effetto positivo qui significa che un giocatore ha vinto più game al servizio di quelli attesi rispetto alla sua percentuale di punti vinti al servizio e in ipotesi iid.

IMMAGINE 1 – Effetti non iid in partita per le partite dal 2018 a oggi per gli attuali primi 50 giocatori

Strategie basate sul servizio bomba

Proprio in cima troviamo tre dei giocatori con il servizio più potente: Reilly Opelka, Nick Kyrgios e John Isner. Quale può essere il motivo? Un’interpretazione è che i giocatori che fanno del servizio un colpo fondamentale lo utilizzano come elemento portante di una o due strategie per risolvere con efficacia i momenti più importanti della partita, come i game al servizio molto combattuti o le fasi conclusive. Potrebbe trattarsi di una modalità a disposizione di un giocatore per incrementare il rendimento nei game vinti al servizio, anche se poi la percentuale media di punti vinti al servizio rimane fondamentalmente invariata.

È interessante la presenza di diversi giocatori tra i primi dieci che non si pensa possiedano un servizio particolarmente forte, come ad esempio Pablo Carreno Busta, Jo Wilfried Tsonga o Denis Shapovalov. L’effetto non iid per loro è inferiore ma potrebbe essere dettato comunque dalla stessa strategia.

Anche se per questi giocatori la percentuale complessiva di punti vinti al servizio non è così alta, in ogni caso nei punti importanti al servizio potrebbero adottare una certa strategia o disposizione mentale che determina una divario misurabile tra previsione iid e previsione non iid.

Il caso di Carreno Busta

Nel caso di Carreno Busta, le tre partite con il massimo effetto iid sono terminate in una sconfitta, con i suoi avversari che hanno ottenuto più del 70% dei punti al servizio. Carreno Busta ha vinto più del 90% dei game al servizio in ognuna di quelle partite a dispetto di una percentuale relativamente bassa di punti vinti al servizio.

C’è stata la sconfitta nel 2019 agli Internazionali d’Italia contro Shapovalov, nella quale Carreno Busta ha vinto +17 punti percentuali di game al servizio rispetto alle attese iid. Come la sconfitta, sempre l’anno scorso, allo Shanghai Masters contro Dominic Thiem, nella quale ha vinto +14 punti percentuali delle attese. E la recente sconfitta a Rotterdam contro Felix Auger-Aliassime, nella quale ha vinto +13 punti percentuali. Sono occorrenze che evidenziano come gli effetti non iid potrebbero spiegare situazioni in cui un giocatore è riuscito a gestire egregiamente la pressione al servizio, ma ha comunque poi perso la partita.

La mentalità del campione

Non mi ha sorpreso vedere i Grandi Tre tra i giocatori più sistematici in termini di iid. Significa cioè che sono stati tra i meno influenzati dal contesto. O, detto in altro modo, sono giocatori che affrontano ogni punto come se avesse la stessa importanza, un aspetto che molti attribuiscono alla mentalità del campione. I lettori più attenti avranno notato che ci sono più giocatori dal lato positivo degli effetti non iid che dal lato negativo. Credo che in parte dipenda dal fatto che, considerati i pochi game al servizio giocati in una partita, soprattutto se una al meglio dei tre set, il risultato è più di tipo discreto con limite superiore di 1.

Una simile impostazione potrebbe tornare utile per altri indicatori di rendimento, oltre ai game vinti al servizio, più sensibili agli effetti non iid. L’elenco dei temi legati all’ipotesi non iid che meritano un approfondimento sembra davvero interminabile e di indubbia ispirazione per futuri articoli.

Are Top ATP Players Non-IID?

Chi vince e chi perde in caso di sospensione della classifica

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 13 marzo 2020 – Traduzione di Edoardo Salvati

L’annuncio di una sospensione di sei settimane del circuito maschile è solo l’ultimo di una serie di sconvolgimenti del calendario tennistico causati dalla pandemia COVID-19. In assenza di decisioni in merito alla possibilità per i giocatori di conservare la classifica attuale, cerco di capire il possibile impatto di un eventuale scenario in cui, per entrambi i circuiti, la classifica rimane inalterata per un periodo di tempo prolungato.

Con il continuo aumento dei casi di contagio in tutto il mondo e con le drastiche misure necessarie per contenere la diffusione del virus, era inevitabile che le conseguenze ricadessero anche sul tennis. Con la sospensione del circuito maschile che dovrebbe terminare pochi giorni prima dell’avvio del Roland Garros, in programma il 24 maggio 2020, potrebbe essere proprio lo Slam di Parigi il prossimo grande evento sportivo di tennis vittima dell’emergenza.

Raziocinio?

Sia gli organizzatori dell’Indian Wells Master che l’ATP hanno definito queste scelte una “sospensione”, invece di considerarla un’immediata cancellazione. Da un punto di vista finanziario, ha senso mantenere aperta la possibilità dello svolgimento del torneo in altra data, prima di rinunciare definitivamente al potenziale indotto economico associato. Con il passare del tempo però, e con il rinvio di altri tornei, la fattibilità di un deferimento si fa sempre più remota.

Di fronte a una situazione così drammatica, gli organismi decisionali dei due circuiti dovrebbero agire razionalmente e pianificare la gestione di un calendario fortemente accorciato. E uno dei temi più spinosi da affrontare è certamente la classifica dei giocatori.

Al momento sono solo congetture, ma sembra ragionevole ipotizzare che non ci saranno penalizzazioni per i tornei che sono stati cancellati (se così sarà perché non verranno effettivamente recuperati). In questo caso, l’impatto minore arriverebbe dal permettere ai giocatori di conservare la classifica alla viglia di Indian Wells.

Sarebbe una soluzione equa?

Un modo per valutare l’equità di una sospensione della classifica è di verificare quanto le posizioni in classifica variano in un periodo di tempo prolungato. L’immagine 1 mostra il cambiamento in un anno della classifica di quei giocatori che sono entrati almeno tra i primi 250 negli ultimi venti anni. I segmenti rappresentano lo scarto interquartile della variazione rispetto all’età dei giocatori. I grafici sono raggruppati per posizione massima in classifica.

Primi 10

Prendiamo la dinamica associata ai primi 10. Quando sono giovanissimi, il guadagno in classifica è normalmente di qualche centinaio di punti. Tra i venti e i venticinque anni raggiungono e si assestano sul livello di gioco più alto, rendendo quasi nulla la variazione anno su anno. Superati i trent’anni, inizia la fase discendente ed è più probabile assistere a una perdita più sostanziale di posizioni in classifica da un anno all’altro.

IMMAGINE 1 – Stabilità nella classifica maschile con la variazione su un anno delle posizioni dei giocatori, dal 2000 al 2020 (scarto interquartile)

Sono tutte tendenze che si può pensare di prevedere. E, in termini di generale crescita in classifica per fascia di età, l’andamento per i primi 10 è simile a quello di giocatori con una carriera meno ricca di successi: un maggior guadagno di posizioni nei primi anni sul circuito, una progressione stabile tra i venti e i trent’anni, seguita da una fase di declino nella parte finale. Per i giocatori che occupano le parti basse della classifica però, un avanzamento di posizioni nei primi anni non è mai altrettanto importante e nel periodo apicale è più probabile assistere a spostamenti minimi verso l’alto o verso il basso.

Donne

Nonostante parziali differenze nel sistema di assegnazione di punti per la classifica maschile e quella femminile, lo stesso meccanismo si ripete per le giocatrici.

IMMAGINE 2 – Stabilità nella classifica femminile con la variazione su un anno delle posizioni delle giocatrici, dal 2000 al 2020 (scarto interquartile)

Quali sono le implicazioni?

Abbiamo una chiave di lettura su quali giocatori trarrebbero probabilmente maggiori benefici o, viceversa, maggiori svantaggi dalla mancata opportunità di cambiare la loro classifica.

Djokovic e Federer

All’età di 32 anni, il numero 1 del mondo Novak Djokovic è in quell’intervallo della curva in cui rimanere al vertice per lunghi periodi vorrebbe dire andare contro pronostico. I giocatori tra i primi 10 a questo punto della carriera perdono tipicamente dieci di posizioni in un solo anno.

La situazione sarebbe ancora più precaria per i 38 anni di Roger Federer. A quell’età, non sono molti i giocatori a rimanere competitivi ad alto livello e quelli che riescono a non subire infortuni possono comunque attendersi di perdere quindici posizioni in un anno. In realtà, dopo aver compiuto trent’anni, Federer ha perso anche fino a quattordici posizioni in 52 settimane. Dovesse Federer tornare alla ribalta dopo l’operazione al ginocchio, sarebbe doppiamente fortunato in caso di sospensione della classifica.

IMMAGINE 3 – Variazione di classifica nell’arco di 52 settimane per quattro giocatori di vertice, con possibili guadagni e perdite attesi in caso di mancate opportunità nei prossimi mesi

Thiem e Auger-Aliassime

Quando riprenderanno le competizioni, saranno giocatori come Dominic Thiem che si trovano nel pieno della carriera ad aver avuto meno da perdere grazie al mantenimento della posizione attuale.

Sono invece giocatori in ascesa come Felix Auger-Aliassime, al momento il numero 20 del mondo a soli diciannove anni, che subiranno le conseguenze più negative di un’interruzione della classifica. Solitamente, in questo passaggio del loro percorso, giocatori destinati a entrare tra i primi 10 hanno guadagnato tra le 25 e le 150 posizioni della classifica in un solo anno. Ci si può fare un’idea nel grafico dal numero e dalla intensità degli incrementi che Auger-Aliassime ha collezionato, con guadagni annuali anche da 125 fino a 150 posizioni negli ultimi due anni.

Certezze e incertezze

La contrapposizione delle traiettorie di questo gruppo di giocatori obbliga a valutare se una stima della classifica non sarebbe un sistema più equo al momento della ripresa dei circuiti dopo una lunga sospensione. Se ad esempio non si torna a giocare prima di sei mesi, ci aspettiamo davvero che tutti i giocatori e le giocatrici siano in grado di mostrare lo stesso livello della loro attuale classifica?

Non credo che lo faremmo e sapremmo probabilmente chi dovrebbe trovarsi più in alto o più in basso rispetto all’età e alla forma più recente. Di sicuro però giocatori e appassionati non accetterebbero cambiamenti alla classifica che non siano legati a risultati effettivi. Ciò che è meno certo è quanto dovremo aspettare prima di vedere di nuovo delle partite su un campo da tennis.

Winners and Losers of a Rankings Hiatus

La corporatura dei primi 100 giocatori ATP nel confronto tra 2000 e 2020

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 22 febbraio 2020 – Traduzione di Edoardo Salvati

In un recente articolo sul Financial Times relativo al dominio del Liverpool nel campionato inglese, John Burn-Murdoch ha creato una visualizzazione dell’altezza e del peso dei giocatori di Premier League, della NBA e della NFL. Mi sono chiesta quindi come la corporatura dell’attuale gruppo di giocatori del circuito maschile si paragoni a quella di professionisti in altri sport e se c’è stato un cambiamento nella struttura fisica dei giocatori di vertice dagli anni 2000 a oggi.

Non ci si deve sorprendere se dall’analisi di Burn-Murdoch (disponibile sul sito del Financial Times a pagamento, n.d.t.) emerge che l’altezza e il peso dei calciatori della Premier League assumono valori decisamente medi rispetto a quelli degli atleti di punta della NBA e della NFL. Ci si può aspettare lo stesso riguardo ai migliori giocatori di tennis?

Una replica per il tennis

Grazie al prezioso aiuto di Martin Ingram, sono riuscita a recuperare i dati pubblicamente disponibili di altezza e peso dei giocatori di vertice di diversi decenni. Il grafico dell’immagine 1 è un tentativo di replicare il confronto fatto da Burn-Murdoch (nella versione originale, è possibile visualizzare il nome di ciascun giocatore puntando il mouse sul grafico, n.d.t.)

IMMAGINE 1 – Confronto tra corporature di una selezione dei primi 100 giocatori della classifica nel 2000 e nel 2020

Per facilitare il paragone, ho aggiunto in questo grafico anche i dati di Cristiano Ronaldo (in rosso), il cui fisico, per quanto un po’ più alto e pesante, sembra essere più in linea con quello dei tennisti moderni di quanto non lo sia con il calciatore medio della Premier League. Da questo unico punto di riferimento risulta chiaro che la costituzione dei tennisti è molto simile a quella dei calciatori e la più confrontabile tra i quattro sport in questione.

Accade spesso di vedere tennisti dare calci a una pallina come farebbe Salah. Pensandoci bene, questo gesto che suscita divertimento è in realtà indicazione della natura del tennis di élite. La maggior parte dei giocatori più forti arriva, e continua a emergere, dall’Europa. Molti sono cresciuti giocando a calcio e alcuni, come Federer, hanno valutato di farne una professione.

Dinamiche biomeccaniche simili

Nonostante quindi le differenze evidenti tra i due sport, la somiglianza della corporatura tra i più forti in entrambi i due mondi suggerisce che le dinamiche biomeccaniche sono più ravvicinate di quanto si possa immaginare. Tornano alla mente quei filmati in cui Novak Djokovic si allena con Ronaldo in preparazione alla nuova stagione, che probabilmente non sono stati solo una mossa di pubbliche relazioni.

Nel confronto tra i primi 100 del 2000 e del 2020, troviamo più somiglianze che differenze, anche se le differenze presenti meritano di essere evidenziate. In primo luogo, tra i migliori del 2000 non c’è traccia di giganti del servizio come John Isner o Ivo Karlovic. Un secondo aspetto che sembra esclusivo dell’era attuale è un numero rilevante di giocatori che mostrano una flessibilità inusuale per la loro altezza, come Andrey Rublev e Alexander Bublik.

Cambiamenti radicali negli stili di gioco possono favorire, per giungere all’apice di quello sport, determinate strutture corporee a scapito di altre. Considerando che l’agilità tende a essere inversamente proporzionale all’altezza, può il successo di giocatori molto alti suggerire che la diffusione del gioco da fondo è stata effettivamente per loro un vantaggio? O il serbatoio di talento dei passati decenni era troppo ridotto da risultare in una distribuzione fortemente sbilanciata verso l’altezza?

Già da una semplice grafico emergono diverse questioni di grande fascino. Sono convinta ora che aggiungere elementi riguardanti una tendenza a grafici antropometrici dei giocatori potrebbe rivelare molto di più sull’evoluzione di uno specifico sport. Spero di continuare a vedere analisi di questo tipo nell’approfondimento statistico sportivo.

Build of Top 100 ATP Players 2000 vs 2020

Punteggi di set più probabili per combinazione di giocatrici al servizio

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 22 febbraio 2020 – Traduzione di Edoardo Salvati

Nel suo rientro al professionismo dopo quasi otto anni, Kim Clijsters ha impressionato per aver costretto Garbine Muguruza al tiebreak del secondo set, nel quale nessuna delle due vinceva più del 60% dei punti al servizio. Mi sono chiesta qual è la probabilità di un tiebreak in questi casi. Nell’analisi che segue, ho utilizzato un semplice modello Monte Carlo per verificare i punteggi di set più probabili per diverse combinazioni di giocatrici al servizio.

Nella prima partita giocata da Clijsters a livello professionistico al Dubai Championships, in molti si sono stupiti del punteggio ottenuto contro una giocatrice che aveva da poco disputato la finale agli Australian Open. Anche se spesso chi è al commento considera il tiebreak un esempio di due giocatrici che hanno avuto un rendimento sostanzialmente identico nel set, ci sono molte situazioni che possono portare a un tiebreak e non tutte soddisfano quella condizione.

Ad esempio, nel secondo set della partita in questione Clijsters e Muguruza sono riuscite in un break per parte, con Clijsters che ha vinto solo il 52% dei punti al servizio rispetto al 59% di Muguruza. Di fronte a quelle statistiche, ho cercato di capire se la fortuna ha in parte aiutato Clijsters a mantenere il set così in equilibrio.

Tutti i possibili punteggi

Mediante la simulazione di un set, ho esaminato la probabilità di tutti i possibili punteggi per diverse combinazioni di giocatrici. Per ciascuna occorrenza, ho ipotizzato una percentuale di punti al servizio costante durante il set. Si tratta di una semplificazione (nel gergo statistico del tennis, l’ipotesi indipendente e identicamente distribuita) che però fornisce una base di partenza utile, oltre a essersi rivelata ragionevolmente rappresentativa della prestazione della maggior parte delle giocatrici in un set qualsiasi.

Il grafico dell’immagine 1 è una mappa di calore dei risultati. Sull’asse dell’ordinate troviamo la bravura al servizio della giocatrice che ha vinto il set, mentre sull’asse delle ascisse il corrispondente livello della giocatrice che ha perso il set. Ciascun pannello corrisponde a un diverso punteggio finale per la giocatrice che perde il set, o alla probabilità di un tiebreak, se lo si raggiunge. La somma di tutte le celle nella stessa posizione della griglia per i sette i pannelli è uguale a 100.

IMMAGINE 1 – Possibile numero di game vinti dalla giocatrice che perde il set per ciascuna combinazione di punti vinti al servizio dalla vincitrice del set (ordinate) e dalla perdente del set (ascisse), in un intervallo dal 55 al 95%

Se incrociamo quindi il 55% sull’asse delle ascisse e il 60% su quello delle ordinate, la probabilità di un tiebreak nel secondo set tra Clijsters e Muguruza a Dubai era solo dell’11%. Con questi numeri era più probabile infatti che Muguruza avrebbe vinto il set per 6-4 6-3.

Come mai?

Spostandosi da sinistra verso destra, la probabilità di un tiebreak aumenta quando le giocatrici hanno un simile rendimento al servizio, quello che nella terminologia di Klaassen e Magnus è un piccolo “malus”. Nella tabella il malus è 0 lungo le diagonali e cresce all’aumentare della distanza dalle diagonali.

L’equilibrio nel rendimento al servizio però non è l’unico aspetto. Il fattore più importante anzi è la bravura complessiva al servizio tra le giocatrici, che può essere sintetizzata con la percentuale combinata di punti vinti al servizio. Sempre per Klaassen e Magnus, si tratta del concetto di “bonus”. Nel secondo set tra Clijsters e Muguruza il bonus era solo di 111, abbastanza basso per giocatrici di quella caratura. Nell’immagine 1, il bonus aumenta spostandosi verso l’alto (per la giocatrice che vince il set) e verso destra (per la giocatrice che lo perde).

A parità di qualsiasi riga del grafico, notiamo che la probabilità di un tiebreak, o in questo caso muoversi verso l’ultimo pannello di destra, aumenta all’aumentare del rendimento al servizio della giocatrice che perde il set. Sarebbe molto sorprendente per una giocatrice con il 95% dei punti vinti al servizio perdere il set ma, dovesse accadere, sarebbe quasi con certezza in un tiebreak.

Dedurre le probabilità dal punteggio

Si può anche procedere per punteggio invece che per prestazione al servizio delle giocatrici. Significa determinare la più probabile combinazione di percentuale di punti vinti al servizio con un punteggio dato del set, ad esempio 6-3. Nel caso di un tiebreak, osserviamo una maggiore concentrazione di probabilità negli alti valori dell’angolo superiore a destra. Le probabilità di quest’intervallo sembrano abbastanza uniformi, a enfasi del fatto che le giocatrici non devono avere un rendimento identico al servizio per arrivare al tiebreak.

IMMAGINE 2 – Possibile percentuale di punti al servizio delle due giocatrici dato un determinato punteggio finale del set. I pannelli da sinistra a destra mostrano i game vinti dalla giocatrice che perde il set

Uno dei motivi per i quali il tennis è uno sport che invita all’analisi statistica è il contenuto informativo che si può apprendere sul possibile risultato di una partita conoscendo solo il rendimento al servizio di una giocatrice contro un’altra. Un solo grafico è in grado di illustrare tutti i possibili esiti di set in una partita di tennis! Ovviamente, si potrebbe anche includere gli effetti generati da ipotesi non indipendenti e identicamente distribuite se sapessimo che alcune giocatrici, ad esempio, sistematicamente cedono alla pressione delle palle break. Spero comunque che sia un riferimento per chi vuole andare oltre il semplice punteggio di una partita.

Which Set Scores Are Most Likely for all Combinations of Servers?

Quantità di gioco e probabilità di vittoria all’avvio della seconda settimana di uno Slam

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 17 febbraio 2020 – Traduzione di Edoardo Salvati

Per raggiungere i quarti di finale agli Australian Open 2020, Dominic Thiem è rimasto in campo per 10 ore e 23 minuti, entrando così nel 20% di tempo più lungo prima di un quarto di finale di uno Slam negli ultimi dieci anni. Nei turni successivi ha accumulato altre ore di gioco, ponendosi all’estremo della distribuzione di questo speciale conteggio.

Nell’analisi che segue, cerco quindi di capire se l’intensità del percorso di Thiem ha contribuito a ridurre la sua probabilità di vittoria del titolo. Pochi giocatori riescono ad arrivare in fondo a uno Slam senza subire affaticamento, ma per alcuni la strada diventa molto più tortuosa.

Le fatiche di Thiem

Negli ultimi tre turni degli Australian Open 2020, Thiem si è trovato proprio in questa situazione. Alla vigilia della sua difficile partita contro Rafael Nadal, il tempo di gioco di Thiem era superiore di 1.3 ore rispetto alla media degli ultimi dieci anni tra i giocatori in un quarto di finale di uno Slam, come rappresentato nell’immagine 1. Alla conclusione della vittoriosa battaglia contro Nadal in quattro set, tra cui tre tiebreak, Thiem era a 14.6 ore, cioè 3.4 ore in più della media.

Un’altra vittoria in quattro set, in semifinale contro Alexander Zverev, ha portato il totale a 18.2 ore, o a 4.5 ore in più della media degli altri semifinalisti di uno Slam. Thiem si è ritrovato nel 3% del monte ore di gioco delle partite che precedono la finale, una posizione non certamente invidiabile contro il sette volte vincitore degli Australian Open Novak Djokovic, il quale invece aveva impiegato solo 12.5 ore.

IMMAGINE 1 – Distribuzione delle ore giocate prima degli ultimi turni di uno Slam maschile nel periodo dal 2011 al 2020. La linea rossa indica il tempo giocato da Thiem agli Australian Open 2020

Possibili conseguenze sull’esito della finale?

Proviamo a elaborare qualche idea con l’esempio fornito da altri giocatori che hanno avuto un percorso accidentato per entrare nella seconda settimana di uno Slam. La tabella a conclusione dell’articolo raccoglie alcune di queste situazioni, tra cui quella di Thiem. Il carico di gioco di Thiem agli Australian Open 2020 è simile a quello di Kevin Anderson a Wimbledon 2019 e di Nadal agli Australian Open 2017. Nessuno di questi giocatori è poi riuscito a vincere il torneo.

Sono però solo degli esempi. E anche se ci fossero molti esempi a mostrare analoga tendenza, staremmo ignorando un interrogativo di fondo. È un grande carico di gioco a contribuire alle sconfitte, o il grande carico di gioco è semplicemente un effetto collaterale di non essere un favorito?

Vogliamo sapere se la grande quantità di gioco incide sul risultato di una partita dopo aver tenuto conto della differenza di bravura tra due giocatori che si scontrano in un qualsiasi turno di uno Slam. Nel linguaggio della regressione, se wij è la probabilità che il giocatore i batte il giocatore j e caricoi è la somma complessiva di gioco del giocatore i, possiamo calcolare l’effetto della quantità di gioco con la seguente formula:

logit(wij) = β0 + β1logit(pij) + β2(caricoi − caricomedio)

dove pij è la previsione di vittoria pre-partita sulla base della bravura dei giocatori e di qualsiasi altro fattore a eccezione del carico di gioco sostenuto durante il torneo. Si tratta di un semplice modello di regressione logistica, in cui la difficoltà maggiore è la scelta di pij, che potrebbe essere data ad esempio dalle quote scommesse. In questo caso utilizzo le mie valutazioni dei giocatori.

Variazioni attese nella probabilità di vittoria

Con gli ultimi dieci anni di quarti di finale e turni successivi a disposizione, ho applicato il modello e osservato la variazione attesa nella probabilità di vittoria di Thiem in ciascuno dei tre turni conclusivi degli Australian Open 2020. La tendenza storica suggerisce che già ai quarti di finale la probabilità di Thiem si era ridotta (un calo in media del 12%) e che la maratona con Nadal l’aveva ulteriormente abbassata. Dalla semifinale in avanti, Thiem aveva una probabilità del 30-35% inferiore rispetto a quella che un giocatore con la sua valutazione avrebbe predetto.

IMMAGINE 2 – Riduzione attesa nella probabilità di vittoria di Thiem agli Australian Open 2020 per il carico di gioco sostenuto (e con un intervallo di confidenza del 90%)

Si può avere la tentazione di ignorare questi risultati pensando che i giocatori hanno poco controllo sulla durata di una partita. Vorrebbe però dire sottostimare la capacità decisionale del giocatore sul livello di offensività da tenere in campo e su come questo incida sul tempo trascorso. Per quei giocatori la cui bravura permette di pensare oltre alla partita successiva, aumentare il livello offensivo quando si arriva a una durata media potrebbe essere una strategia importante per la vittoria finale.

Does greater competition load going into the second week of a Grand Slam hurt a player’s win chances?

Chi può spezzare il monopolio dei Grandi Tre sul tennis mondiale?

di Stephanie Kovalchik // TheConversation

Pubblicato il 19 gennaio 2020 – Traduzione di Edoardo Salvati

Una delle questioni più pungenti per l’appassionato di tennis nel 2020 è vedere se si tratterà di un altro anno dominato dai Grandi Tre, cioè i giocatori più vincenti dell’era Open in Roger Federer, Rafael Nadal e Novak Djokovic. Il loro dominio è ben espresso dai risultati ottenuti nei tornei dello Slam. Dal 2003, anno del primo Slam assoluto di Federer a Wimbledon, se ne sono disputati 68. Di questi, i Grandi Tre ne hanno vinti 55, o circa l’80% (dopo la vittoria di Djokovic agli Australian Open 2020, la percentuale è ora dell’81%, n.d.t.). Federer è al primo posto con 20 Slam, e nessuno tra gli uomini ne ha per ora vinti di più, ma Nadal (19) e Djokovic (17) sono a ridosso. L’aspetto più rimarchevole è la presenza dei Grandi Tre in cima alla classifica del tennis mondiale, nonostante un’età complessiva di 104.8 anni.

Chi tra i Next Gen ha più probabilità di successo

Anche se in molti si aspettano un altro cappotto negli Slam da parte dei Grandi Tre, il finale di stagione 2019 ha lasciato pensare che il regno di Djokovic, Nadal e Federer potrebbe essersi avviato alla sua naturale conclusione. I principali segnali sono arrivati dai risultati di un gruppo di giovani giocatori. Sette di loro, nati dopo il 1990, sono riusciti a vincere contro almeno uno dei Grandi Tre: si parla di Stefanos Tsitsipas, Alexander Zverev, Andrey Rublev, Daniil Medvedev, Dominic Thiem, Nick Kyrgios e Grigor Dimitrov. Anche Matteo Berrettini può essere citato, visto l’ingresso nei primi 8 e la presenza alle Finali di stagione, seppur ancora senza vittorie contro uno dei Grandi Tre.

Uno dei risultati già interessanti dei Next Gen è il record aggregato di 3 vittorie e 2 sconfitte contro i Grandi Tre negli Slam del 2019. Djokovic ha infatti perso contro Thiem al Roland Garros, Federer contro Dimitrov agli US Open e contro Tsitsipas agli Australian Open. Le due sconfitte sono arrivate in altrettante finali e sempre per mano di Nadal: Thiem ha perso al Roland Garros e Medvedev agli US Open. Queste stelle emergenti hanno raggiunto l’apice nell’ultima parte della stagione. Tre Next Gen hanno eliminato i Grandi Tre prima delle semifinali dello Shanghai Masters, solo l’undicesima volta sui 72 Master giocati dal 2011. I semifinalisti a Shanghai, Thiem, Tsitsipas, Medvedev e Berrettini, erano anche i quattro più giovani delle Finali di stagione.

Fare una valutazione in termini di carriera

Vincere uno Slam è il passaggio conclusivo, e il più difficile, per la maturazione di un giocatore della Next Gen. Potrebbe il 2020 rappresentare l’anno della svolta per uno di loro? E chi si trova nella posizione migliore? Un’indicazione arriva dal percorso che ciascuno dei Grandi Tre ha compiuto prima di conquistare uno Slam. Possiamo in questo modo vedere quali dei nuovi campioni sta seguendo una direzione simile.

Le valutazioni dei giocatori, una misura statistica della bravura di un giocatore in qualsiasi momento, sono un ottimo strumento per tracciare l’andamento di una carriera perché sono aggiornate dopo ogni nuovo risultato e corrette per il livello dell’avversario, così da rendere possibile confronti tra generazioni. Attualmente, la maggior parte dei primi 100 ha una valutazione tra i 2000 e i 2300 punti, anche se i Grandi Tre sono decisamente distaccati dagli altri, con valutazioni tra i 2560 e i 2670 punti. All’inizio degli Australian Open, Djokovic aveva la valutazione più alta, anche grazie alla vittoria nell’ATP Cup.

C’è anche qualche elemento in comune

Costruendo un grafico delle valutazioni dei Grandi Tre dall’età di 18 anni fino alla vittoria del primo Slam, possiamo osservare i diversi percorsi intrapresi rispetto a quanto sanno facendo i giocatori della Next Gen (rappresentati dalle linee blu nell’immagine 1).

Nadal è esploso con il primo Roland Garros nel 2005, non avendo ancora compiuto i 19 anni. L’ascesa di Djokovic è stata la seconda più rapida, con il primo Slam agli Australian Open 2008 ad appena 20 anni. Federer è quello ad aver impiegato più tempo, con la vittoria a Wimbledon nel 2003 a due mesi dai 22 anni. Nonostante queste differenze, ci sono alcuni elementi che hanno accomunato le valutazioni dei Grandi Tre nell’avvicinamento al primo Slam. Sei mesi prima della vittoria infatti, avevano una valutazione tra i 2000 e i 2200 punti, cui ha seguito un aumento in quell’intervallo temporale di almeno 100 punti.

IMMAGINE 1 – Confronto tra valutazioni dei Next Gen e valutazioni dei Grandi Tre dal compimento dei 18 anni fino alla vittoria nel primo Slam

Quali sono tra i giovani i più promettenti per il grande salto?

Studiando le stesse traiettorie per i giocatori più promettenti tra quelli nati negli anni ’90, troviamo che tre di loro, Dimitrov, Kyrgios e Thiem, hanno già superato l’età alla quale i Grandi Tre hanno vinto il primo Slam. Tsitsipas e Rublev invece sono gli unici del gruppo ad avere ancora una possibilità di replicare la progressione di uno dei Grandi Tre. L’andamento della valutazione di Tsitsipas è più simile a quello di Djokovic, mentre quello di Rublev segue da vicino, almeno per ora, quello di Federer. Medvedev e Thiem hanno impiegato più tempo per avvicinarsi ai risultati dei Grandi Tre negli Slam, ma un’impennata nella traiettoria della loro valutazione indica che un risultato eclatante potrebbe essere imminente (Thiem ha sfiorato la prima vittoria di uno Slam arrivando in finale agli Australian Open 2020, dopo aver battuto Nadal nei quarti, n.d.t.)

Medvedev

Questo vale specialmente per Medvedev che è il più giovane dei due. Dopo che la sua valutazione si è stabilizzata all’età di 21 anni, come nel caso di Federer, Medvedev è riuscito ad accumulare centinaia di punti in breve tempo, raggiungendo anche la finale degli US Open 2019. Al momento è molto vicino ai 2500 punti, una valutazione simile a quella di Nadal e Djokovic quando hanno vinto il loro primo Slam. La traiettoria della sua valutazione sembra far pensare che la vittoria del primo Slam sia questione di poco tempo (Medvedev ha perso però contro Stanislas Wawrinka agli ottavi a Melbourne, e non può essere considerato il favorito per il Roland Garros, n.d.t.).

Thiem

È uno scenario che si applica anche a Thiem, l’unico altro giocatore tra i primi 8 con una valutazione superiore a 2400 punti. Il suo percorso relativamente più lungo verso il primo titolo Slam potrebbe essere dovuto anche al fatto di essersi trovato a giocare nella stessa epoca di Nadal, l’indiscusso “Re della Terra Battuta”. Their, che è uno specialista della terra, ha perso due finali a Parigi proprio contro Nadal nel 2018 e 2019.

Rublev e Berrettini

Solo di recente Rublev e Berrettini hanno superato la valutazione di 2250 punti, e la loro ascesa recente sorprende per velocità (Rublev ha però perso negli ottavi di finale agli Australian Open 2020 e Berrettini al secondo turno, n.d.t.). Fino a 21 anni, il percorso di Zverev e Kyrgios ha seguito in parallelo quello di Djokovic. Successivamente però, i risultati hanno subito una battuta d’arresto e la speranza di vittoria del primo Slam nel 2020 si è affievolita (in Australia, Zverev è riuscito a giocare per la prima volta una semifinale Slam, mentre Kyrgios ha perso contro Nadal negli ottavi, n.d.t.).

Naturalmente, non esistono percorsi di carriera identici, quindi per principio non si può escludere nessuno dei giocatori della Next Gen da grandezza futura. Se la storia è d’insegnamento, c’è ragione di attendersi un rendimento da vittoria di primo Slam nella stagione in corso anche da Tsitsipas, Medvevdev, Rublev e Berrettini.

Who can break up the ‘Big 3’ monopoly on men’s tennis? Here’s what the numbers say

L’effetto numero 1 o come il successo di Barty potrebbe scuotere il tennis femminile australiano

di Stephanie Kovalchik // TheConversation

Pubblicato il 3 febbraio 2020 – Traduzione di Edoardo Salvati

La vittoria di Sofia Kenin nella semifinale degli Australian Open 2020 ai danni di Ashleigh Barty ha certamente deluso le aspettative dei tifosi australiani. Dopo le premature sconfitte di Serena Williams e Naomi Osaka, le quote davano Barty come favorita. Kenin ha invece battuto anche Garbine Muguruza in finale per vincere il suo primo Slam ad appena 21 anni.

Distratti dall’importanza della conquista di uno Slam, è facile perdere di vista le esternalità positive del rendimento di una giocatrice sulla possibile crescita dello sport nei singoli paesi. Studi hanno concluso che quando una professionista raggiunge il vertice della classifica dominando per lunghi periodi, segue spesso uno sviluppo di talento tennistico nel suo paese di origine. Questo induce a pensare che il movimento femminile australiano potrebbe beneficiare nei prossimi anni della ribalta sulla scena di nuove giocatrici che cercano di replicare i successi di Barty.

Le numero 1 degli ultimi 35 anni

I risultati ottenuti da Barty lo scorso anno sono ragguardevoli, soprattutto considerando che la competizione tra le migliori sembra diventare sempre più intensa con il passare del tempo. Nel corso della sua esplosiva stagione 2019, è stata una presenza schiacciante, vincendo 57 partite su 70 e quattro tornei tra cui il suo primo Slam al Roland Garros e le Finali di stagione in Cina. È inoltre diventata la numero 1 mondiale, la prima australiana a riuscirci da Evonne Goolagong 43 anni fa. Anche dopo la sconfitta in semifinale, il margine su Karolina Pliskova, seconda in classifica, è abbondante.

Negli ultimi 35 anni, hanno raggiunto il primo posto della classifica 25 giocatrici da 14 paesi. Dal 1985 al 2005, il tennis femminile è stato appannaggio degli Stati Uniti, con sette diverse giocatrici che si sono alternate al numero 1. Il Belgio ne ha prodotte due, Francia, Germania, Spagna, Russia e Svizzera una a testa. Dal 2010, 11 giocatrici di 11 paesi hanno raggiunto il numero 1 (anche facilitate dagli alti e bassi della carriera di Williams).

IMMAGINE 1 – Sequenza delle giocatrici al numero 1 della classifica dal 1984

Grazie a giocatrici come Barty, la giapponese Osaka e la rumena Simona Halep, mai come prima la recente diversità al vertice del tennis femminile ha creato modelli emulativi per le aspiranti future professioniste di tutto il mondo. E il passato suggerisce che questo fattore è fondamentale per lo sviluppo del tennis nei paesi più piccoli (come il Belgio e la Serbia ad esempio) che mancano tradizionalmente di un seguito diffuso quanto quello di altri sport, e per il consolidamento di future generazioni di giocatrici in paesi con in cui il tennis è da sempre più radicato (come gli Stati Uniti, l’Australia e alcune nazioni europee).

Come le numero 1 hanno ispirato altre giocatrici nel mondo

Analizzando i sei paesi che, al di fuori degli Stati Uniti, hanno avuto una o più giocatrici al numero 1 dal 1990 al 2010 (in giallo nell’immagine 2), osserviamo diverse incoraggianti tendenze. In primo luogo, si assiste a un aumento delle giocatrici di un paese tra le prime 150 in coincidenza dell’ascesa al vertice di una connazionale o negli anni immediatamente successivi.

Belgio, Russia e Svizzera

In Belgio ad esempio, poco dopo il numero 1 di Kim Clijsters e Justine Henin nei primi anni 2000, altre giocatrici come Yanina Wickmayer e Kirsten Flipkens iniziarono a risalire la classifica. Il periodo di Maria Sharapova al numero 1 dalla seconda metà del 2000 coincise con ottimi risultati da parte delle compatriote Elena Dementieva e Vera Zvonareva e, ancora di più, Dinara Safina, anche lei numero 1 nel 2009.

Anche all’incredibile carriera di Martina Hingis fece seguito lo sviluppo di altre giocatrici svizzere, tra cui l’attuale numero 7 Belinda Bencic, che è stata pure allenata dalla madre di Hingis.

IMMAGINE 2 – Numero di giocatrici tra le prime 150 e le prime 30 per sei paesi con una giocatrice al numero 1 del mondo (il cui periodo è evidenziato in giallo)

Germania e Spagna

Si può anche vedere che due recenti numeri 1, la tedesca Angelique Kerber e la spagnola Muguruza, hanno guadagnato quella posizione quasi esattamente a distanza di 15 anni dall’ultima connazionale. Kerber ha seguito le orme di Steffi Graf, mentre Muguruza è stata preceduta da Arantxa Sanchez.

Stati Uniti

Negli Stati Uniti, molte giocatrici afro-americane, tra cui la quindicenne Cori Gauff, hanno fatto riferimento al successo delle sorelle Williams come motivazione maggiore nella decisione di intraprendere da giovanissime un percorso nel tennis. La pletora di giocatrici afro-americane tra le prime 150 è indicazione della capacità persuasiva dei risultati di Serena e Venus Williams su atlete come Madison Keys, Sloane Stephens, Gauff, Taylor Townsend, Whitney Osuigwe e Sachia Vickery.

Le ricadute positive generate dall’effetto numero 1

In qualsiasi sport, lo sviluppo di talenti in grado di competere ai livelli più alti è un processo complesso che richiede l’allineamento di molteplici fattori, dalla bravura di base delle giocatrici all’appoggio delle famiglie, della comunità, degli allenatori e delle federazioni nazionali.

Anche se il successo delle giocatrici di vertice è solo una variabile dell’equazione, è inserito in un concetto economico ben noto, quello della teoria della goccia (o trickle-down). Applicata allo sport, questa teoria postula che i risultati delle migliori possono arrivare a rappresentare una fonte motivazionale enorme per la base del movimento e spingere più persone a intraprendere quello sport. Nel tennis, l’andamento storico delle statistiche relative alla classifica mostra un chiaro effetto goccia generato dalle giocatrici che ottengono il primo posto, specialmente in quei paesi che non hanno mai avuto o non hanno avuto da decenni una giocatrice al vertice.

Quello che non emerge dalle statistiche è quanto la personalità e l’esempio di una numero 1 incide sullo sviluppo e sulla crescita delle giovanissime connazionali. Se nelle due settimane degli Australian Open si è avuto modo di conoscere meglio Barty, ci si è accorti che il suo gioco è solo parte della sua unicità. Simpatia e forza d’animo di fronte a trionfi e sconfitte la rendono universalmente apprezzabile e ne fanno ulteriore riferimento motivazionale per le giocatrici più giovani. Poche altre si sono probabilmente trovate in una posizione d’influenza così preminente e duratura per il loro paese e nel loro sport.

The No. 1 effect: why Ash Barty’s success could lead to a boom in women’s tennis in Australia

Passare un turno iniziale negli Slam senza giocare è un vantaggio?

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 24 gennaio 2020 – Traduzione di Edoardo Salvati

Grazie al ritiro pre-partita di Philipp Kohlschreiber, suo avversario di secondo turno, Stefanos Tsitsipas ha raggiunto il terzo turno degli Australian Open 2020 avendo giocato una partita in meno degli altri. Alla vigilia degli ottavi di finale, cerchiamo di capire che tipo di impatto può avere per Tsitsipas giocare una partita in meno nel primo Slam della stagione (Tsitsipas ha poi perso al terzo turno contro Milos Raonic in tre set, n.d.t.).

Se del tabellone principale maschile degli Australian Open vi appassiona il percorso delle stelle emergenti del circuito, Daniil Medvedev e Tsitsipas sono in cima alla lista dei giocatori con il potenziale per dare molto fastidio ai Grandi Tre (anche Medvedev ha poi perso agli ottavi contro Stanislas Wawrinka in cinque set, n.d.t.). In quest’ottica, ci si chiede se il passaggio del secondo turno di Tsitsipas senza aver giocato per via del ritiro di Kohlschreiber farà alcuna differenza per le fasi successive del suo cammino.

Con una probabilità di vittoria attesa dell’81%, non sarebbe stata comunque, almeno sulla carta, una partita difficile. E questo suggerisce che non serviva a Tsitsipas un ritiro per passare il turno, ma ci è certamente arrivato essendo rimasto in campo qualche ora in meno. Un carico di gioco inferiore potrà essere un beneficio o, al contrario, meno tempo trascorso in campo sarà di fatto un ostacolo?

Per trovare una risposta, sarebbe utile riuscire a identificare altri giocatori che, nelle prove Slam, hanno passato un turno iniziale per ritiro e confrontare i risultati con giocatori dello stesso livello che hanno invece dovuto giocare tutti i turni. Ci sono stati sufficienti ritiri nei turni iniziali da ottenere un campione significativo?

Quanti ritiri?

L’immagine 1 mostra la frequenza dei ritiri negli Slam negli ultimi 20 anni. Si osserva che, generalmente, sono eventi rari, con la maggior parte degli Slam senza alcun ritiro nei primi turni. Tuttavia, circa il 20% degli Slam (o uno su cinque) ha avuto, per lo stesso orizzonte, almeno un ritiro di secondo turno. Sono circa 30 casi di giocatori che, durante la prima settimana di gioco in uno Slam, hanno superato il turno per ritiro dell’avversario.

Una considerazione a margine. Vi potreste chiedere come un primo turno possa essere un ritiro. Generalmente, un lucky loser dovrebbe rimpiazzare il giocatore che si ritira al primo turno in modo da giocare la partita. Nel primo turno del Roland Garros 2007, quando Mikhail Youzhny ha superato il turno senza giocare contro Jan Hernych, il ritiro deve essere arrivato troppo tardi da consentire a un altro giocatore di prendere il posto. Di norma, primi turni con ritiri sono estremamente rari.

IMMAGINE 1 – Frequenza di ritiri pre e durante la partita per singolo turno negli Slam maschili dal 2000

Se l’effetto finale di un ritiro è una quantità minore di tempo in campo, dovremmo anche considerare di allargare il campione a quei ritiri che si sono verificati a partita da poco iniziata. Questa nuova casistica di ritiri pre-partita e durante il primo set si verifica almeno 1 volta su 4 nei primi e secondi turni degli Slam. Si triplica così il numero dei giocatori da studiare per possibili effetti di meno gioco sul risultato negli Slam.

Quali tornei hanno avuto quattro o più ritiri in alcune edizioni?

Si tratta del Roland Garros 2014, in cui quattro giocatori si sono ritirati durante il primo set dei loro primi turni. E poi Wimbledon 2013, con due ritiri pre-partita e due ritiri durante il primo set in partite di secondo turno. Una curiosità, Kenny De Schepper ha passato il turno per ritiro in quelle partite in entrambi gli Slam!

Con un campione recente di ritiri pre-partita e nel primo set agli Slam, come possiamo dire se si è trattato di un aspetto positivo o negativo? Una modalità è valutare se quei giocatori hanno fatto meglio delle attese, mediante un confronto tra le vittorie effettive in ciascuno Slam e la somma delle probabilità di vittoria per ogni turno. Se un giocatore ha più vittorie di quanto per lui atteso, questa differenza avrà valore positivo. Altrimenti, in caso di sconfitta nei turni iniziali, sarà negativa. In sostanza, è uno scarto per vittorie di partite nell’evento.

Come per gli scarti in una regressione, ci aspettiamo che la media degli scarti sia zero quando è considerata complessivamente su tutti i giocatori in uno Slam (considerando che le nostre previsioni sono certamente imparziali!). Ma in questo sottoinsieme di giocatori che passano il turno senza giocare o perché l’avversario si ritira a inizio partita non ci sono probabilmente giocatori medi. Anzi, la maggior parte ha una valutazione Elo di più di 2000 punti all’inizio del torneo. Serve quindi metterli a confronto con giocatori con valutazioni altrettanto alte.

Un confronto alla pari

Restringendo il confronto ai giocatori con almeno 2000 punti di valutazione, i grafici che seguono illustrano le risultanze dell’ampiezza tra vittorie effettive e vittorie attese per quei giocatori che hanno superato il turno per ritiro negli Slam degli ultimi venti anni.

Nonostante un campione ridotto, si osserva in media un incremento nella differenza tra vittorie effettive e attese, che corrisponde a un +0.2 partite vinte delle attese in presenza di un ritiro. Due giocatori a distinguersi in questo gruppo sono Wawrinka, con +2.4 vittorie rispetto alle attese agli Australian Open 2014, torneo vinto grazie anche al ritiro di Vasek Pospisil al terzo turno, e Grigor Dimitrov, con +2.2 vittorie rispetto alle attese nella semifinale raggiunta agli US Open 2019 con un ritiro al secondo turno di Borna Coric.

IMMAGINE 2 – Distribuzione di vittorie totali meno vittorie attese negli Slam per giocatori con valutazione di almeno 2000 punti nel periodo dal 2000 al 2019 con o senza un ritiro

Otteniamo un margine abbastanza simile anche allargando il gruppo a includere quei giocatori le cui partite non sono terminate per via del ritiro dell’avversario durante il primo set. In questo caso il guadagno medio è più vicino a +0.3 partite aggiuntive.

IMMAGINE 3 – Distribuzione di vittorie totali meno vittorie attese negli Slam per giocatori con valutazione di almeno 2000 punti nel periodo dal 2000 al 2019 con o senza un ritiro o un ritiro durante il primo set

Se il passato è di qualche indicazione, dopo il ritiro al secondo turno le aspettative riposte su Tsitsipas sono ancora più alte.

Is an Early Walkover an Advantage in a Slam?

I favoriti agli Australian Open 2020

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 17 gennaio 2020 – Traduzione di Edoardo Salvati

Dopo aver visto le favorite per gli Australian Open 2020, a tabellone maschile completo quali sono le probabilità di vittoria dei Grandi Tre per il primo Slam dell’anno? E ci sono altri seri contendenti al titolo?

Con l’avvio delle competizioni, tutti si chiedono quale dei Grandi Tre sarà il primo a vincere uno Slam nel 2020. Sulla base delle mie valutazioni, Novak Djokovic e Rafael Nadal hanno la probabilità più alta, con un leggero margine per Djokovic dopo il solido livello di gioco mostrato durante l’ATP Cup.

I soliti noti

Djokovic ha quasi una probabilità su tre di titolo, Nadal quasi una su quattro, e la finale tra i due è l’esito più probabile. I molti appassionati di tennis che si sono entusiasmati per il secondo set della loro partita all’ATP Cup sono certamente in trepidante attesa a Melbourne per un altro episodio della saga.

La terza posizione di Roger Federer non dovrebbe rappresentare una sorpresa, almeno per i più attenti. Più sorprendente potrebbe invece essere il fatto che la distanza di Federer da Djokovic e Nadal sia così ampia, visto che entrambi hanno più del doppio della probabilità di vincere il torneo. Questo dipende solo in parte dalla valutazione attuale della forma di Federer. Dal lato di Djokovic e con giovani pericolosi come Filip Krajinovic, Hubert Hurkacz, Denis Shapovalov e Matteo Berrettini, la strada di Federer per il titolo è particolarmente in salita.

Alle spalle dei Grandi Tre, la probabilità di vittoria diminuisce vertiginosamente. Non si possono però ignorare le possibilità di un gruppo di giocatori che si sono messi in luce nel 2019, primi fra tutti Daniil Medvedev e Stefanos Tsitsipas che, pur non avendo ancora vinto uno Slam, hanno la probabilità più alta di detronizzare uno dei Grandi Tre.

Non possiamo poi dimenticare di menzionare diversi altri giovani per un risultato di prestigio. Dall’alto verso il basso troviamo Andrey Rublev, Denis Shapovalov (che però ha perso al primo turno, n.d.t.) e Berrettini. Anche Dominic Thiem e Roberto Bautista Agut rientrano tra i favoriti, ma sono convinta che i più giovani tra i possibili primi vincitori di Slam abbiano il vantaggio dell’età dalla loro parte.

Giocatore       Prob. titolo
Djokovic        29.6%
Nadal           26.9%
Federer         12.8%
Medvedev        6.9%
Tsitsipas       5.0%
Rublev          3.9%
Thiem           1.9%
Shapovalov      1.9%
Berrettini      1.3%
Bautista Agut   1.2%

La gioventù che avanza

È incredibile pensare che una probabilità cumulata di quasi il 50% per la vittoria finale tra Djokovic e Nadal sia inferiore a quella che i due avevano lo scorso anno. E non dipende da un loro calo vistoso, quanto dalla crescita degli altri, per alcuni in modo drammatico.

Lo si può osservare nell’andamento delle valutazioni dell’ultimo anno dei primi dieci favoriti. L’aspetto che più colpisce è l’incredibile ascesa dei più giovani dietro ai Grandi Tre, la maggior parte di quali ha guadagnato almeno 100 punti nel corso della passata stagione.

IMMAGINE 1 – Andamento della valutazione dei giocatori nell’ultimo anno

Se davvero esiste un vantaggio psicologico derivante dallo stato di forma, il grafico suggerisce che le aspettative su giocatori come Medvedev, Shapovalov, Berrettini e Rublev dovrebbero essere ancora più alte dell’effettiva previsione di titolo. Perché, tra i primi 10, hanno fatto siglare i miglioramenti più significativi. Anche Tsitsipas è cresciuto naturalmente, solo che un incremento stabile rende la sua evoluzione più insolita rispetto a quella degli altri appartenenti alla Next Gen.

Nonostante abbiano 105 anni insieme, i Grandi Tre continuano a sfidare la ragione e rimanere al vertice del tennis mondiale. Ancora una volta, sono loro a ottenere i favori del pronostico, ma è il primo Slam da qualche tempo a questa parte in cui la probabilità di altri giocatori per la vittoria finale non è un concetto puramente teorico.

Men’s Title Chances for the 2020 Australian Open

Le favorite agli Australian Open 2020

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 17 gennaio 2020 – Traduzione di Edoardo Salvati

Le speranze di una nazione saranno sulle spalle di Ashleigh Barty al via degli Australian Open 2020. Il pronostico suggerisce però che dopo quattro finali Slam consecutive perse, potrebbe essere la volta di Serena Williams.

Con la testa di serie numero uno per lo Slam di casa, Barty sarà probabilmente la giocatrice a sentire la pressione maggiore per la vittoria a Melbourne. Dovrà sfidare anche le previsioni basate su diversi sistemi di valutazione che, nonostante un tabellone teorico più abbordabile da prima della classifica, le assegnano solo una possibilità di titolo su dieci, visto che occupa il quarto posto tra le favorite. Con una probabilità su cinque, Williams non ha il trofeo assicurato, ma è comunque avanti rispetto alle altre contendenti. Queste previsioni non tengono però in considerazione il possibile “effetto finale” che sembra aver colpito Williams, che appunto non ha più vinto uno Slam dagli Australian Open 2017, e dopo aver avuto una figlia.

Serena e poi le altre

La forma di Williams è cresciuta di Slam in Slam, con dimostrazioni di potenza fino alla finale di Wimbledon e degli US Open. Ha inoltre vinto il suo torneo di preparazione a Auckland, un’altra iniezione di fiducia alla vigilia del primo Slam dell’anno. Potremmo assistere a una possibile sfida tra Barty e Williams in semifinale, l’ostacolo più duro per Barty per l’eventuale titolo. La testa di serie numero 8 assegnata a Williams ne sottostima il livello di forma, e la mette in rotta di collisione nei quarti di finale con Naomi Osaka, contro cui ha giocato l’ultima volta nella controversa finale degli US Open 2018.

Karolina Pliskova, anche lei non esente da polemiche, potrebbe essere la giocatrice tra le prime quattro favorite a passare meno osservata. Il fatto però di ritrovarsi dalla parte opposta del tabellone rispetto alle altre tre le ha sicuramente offerto la dose più alta di fortuna.

Giocatrice       Prob. titolo
S. Williams      20.4%
Osaka            13.7%
Kar. Pliskova    11.6%
Barty            9.9%
Sabalenka        4.5%
Halep            4.3%
Keys             4.3%
Kvitova          3.7%
Svitolina        3.7%
Bertens          3.0%

Ci siamo abituati a pensare che, sul circuito femminile, la competizione è così serrata da garantire possibilità di vittoria a chiunque in qualunque torneo. Anche se, rispetto a quanto succede per gli uomini, la probabilità di vittoria si distribuisce in modo più uniforme tra le giocatrici, è interessante vedere quanto abbiano oscillato le loro valutazioni nell’ultimo anno. Per le favorite all’inizio degli Australian Open 2020, si è trattato di un anno movimentato. Williams si è migliorata più di tutte, avendo aggiunto 200 punti alla valutazione del 2019.

Pericolose inversioni di forma

Per le altre, l’andamento più tipico è consistito in una curva piatta nella parte iniziale della stagione, seguita da un incremento deciso a partire da agosto. Barty, Simona Halep ed Elina Svitolina sono le uniche del gruppo ad affacciarsi al primo Slam con una chiara inversione negativa di forma.

IMMAGINE 1 – Andamento della valutazione delle giocatrici nell’ultimo anno

Williams gode dei favori delle statistiche e del livello di gioco più alto dopo la maternità. Se i riflettori puntati su Barty l’aiuteranno a superare la pressione subita nelle finali Slam che ha giocato al rientro sul circuito, potrebbe finalmente raggiungere il record di Margaret Court proprio in Australia.

Women’s Title Chances for the 2020 Australian Open