Corridoi e colpi a uscire

di Jeff Sackmann // TennisAbstract

Pubblicato l’11 novembre 2019 – Traduzione di Edoardo Salvati

Le Finali NextGen si giocano su un campo anomalo, nel senso che, dovendo ospitare solo partite di singolare, non possiede le linee che delimitano il corridoio del doppio. Praticamente tutti i tornei della stagione prevedono il tabellone del doppio, e quindi raramente è possibile trovare un campo senza i corridoi. Ci sono state in passato edizioni delle Finali di stagione riservate al singolare, ora però l’esclusiva è delle Finali NextGen.

Si può pensare che il particolare disegno delle linee abbia qualche conseguenza sui giocatori?

Ne ho parlato recentemente con Erik Jonsson, e siamo giunti alla provvisoria conclusione che i professionisti (anche i più giovani di loro), grazie alle migliaia di ore di esperienza di gioco, non dovrebbero sentirsi disorientati in un campo diverso dal solito. Perché però fare congetture quando abbiamo dei dati per un’analisi?

Il database del Match Charting Project, che ho creato per raccogliere statistiche punto per punto di partite ufficiali anche con il prezioso aiuto di volontari, è comprensivo di più dettagli relativi agli errori, sia in termini di natura, cioè forzati e non forzati, che di tipologia, cioè in rete, lunghi, esterni o esterni e lunghi. Le Finali NextGen non hanno destato l’immediato interesse dei volontari, tanto che prima dell’edizione 2019 solo la finale del 2018 era stata inserita, su più di 6600 partite totali. Il 2019 però è diverso, perché abbiamo statistiche di 8 delle 15 partite giocate a Milano la settimana scorsa (un grazie sentito a Carrie, che ha seguito l’intero percorso del finalista Alex De Minaur).

La quantificazione degli errori esterni

Ci interessa la frequenza dei colpi che escono ai lati del campo, un calcolo meno semplice di quanto appaia. Ho deciso di limitarmi ai colpi a rimbalzo, escludendo anche gli errori forzati, quelli in cui il giocatore potrebbe non avere un grande controllo sulla direzione della palla.

Questi sono gli indicatori ipotizzabili per la frequenza degli errori esterni:

  • errori esterni per punto (est./punto)
  • errori esterni per errori non forzati (est./ENF)
  • errori esterni per colpi a rimbalzo “fattibili”, cioè colpi a rimbalzo che sono stati errori non forzati o che sono stati rimessi in gioco (est/. rimbalzo)

Il primo indicatore probabilmente eccede in approssimazione, pur avendo il vantaggio della semplicità. Gli errori esterni per errori non forzati potrebbero essere di aiuto nell’indicare in quale direzione il giocatore è stato più aggressivo. L’ultimo, gli errori esterni per colpi a rimbalzo “fattibili”, è forse la rappresentazione più utile al nostro scopo, perché segnala quanto spesso un giocatore ha tirato un colpo che è uscito a lato.

De Minaur e gli altri

La tabella elenca i numeri di De Minaur per le cinque partite delle Finali NextGen 2019, oltre ai numeri complessivi delle altre 28 partite sul cemento nel database, relative agli ultimi due anni.

             Est./Punto  Est./ENF  Est./Rimbalzo   
NextGen      2.7%        1.5%      21.7%  
Cemento ATP  3.0%        1.4%      21.4%

Almeno per De Minaur, il corridoio non sembra fare troppa differenza. Concentriamoci sul gruppo di giocatori leggermente più ampio. Abbiamo otto partite, vale a dire 16 inserimenti di partita se si considerano i singoli giocatori, tra cui almeno una per ognuno degli otto giocatori che si sono qualificati per Milano. La tabella elenca i tre indici per le partite delle Finali NextGen, insieme agli equivalenti valori per le altre partite sul cemento nel database, relative agli ultimi due anni.

             Est./Punto  Est./ENF  Est./Rimbalzo  
NextGen      3.2%        1.8%      19.5%  
Cemento ATP  3.2%        1.8%      23.1%

Per i primi due indici, non c’è alcun effetto tangibile. Con o senza corridoio, gli errori esterni determinano la fine del 3.2% dei punti, e dell’1.8% del totale degli errori non forzati (il 3.2% è per giocatore, quindi i punti che si sono conclusi con un errore esterno sono il 6.4%). Il terzo indice invece è più interessante. Sul circuito questi giocatori commettono un errore esterno nel 23.1% dei colpi a rimbalzo “fattibili”. Nel campo senza corridoio visto a Milano, lo stesso numero è sceso di più di un settimo, al 19.5%. Contestualmente, la frequenza complessiva di errori non forzati (non solo quindi gli errori esterni) è aumentata rispetto a quanto mostrato dagli stessi giocatori sul cemento in altri eventi.

Acuire la mente

Penso a due possibili spiegazioni per un calo così marcato. Primo, non abbiamo molti dati a disposizione, e magari è solo un caso legato a un campione ridotto. In parte si può far risalire alla prestazione di Ugo Humbert, che non ha commesso nemmeno un errore esterno nell’unica sua partita del database alle Finali NextGen (la frequenza tipica di Humber sugli errori esterni è vicina alla media del circuito). In assenza di molte più partite giocate su campi senza corridoio, e di cui naturalmente dovremmo avere statistiche punto per punto, non si riesce a giungere a conclusioni definitive.

Secondo, potrebbe trattarsi di un effetto concreto legato però a qualche aspetto delle condizioni di gioco di Milano. La mancanza del corridoio, come scritto da @furryyelloballs nel suo tweet, potrebbe davvero “acuire la mente”.

Rispetto ad altre misure innovative sperimentate alle Finali NextGen, il campo dedicato al singolare riceve scarso interesse mediatico. Però, a differenza di modifiche come l’appendi asciugamano o il cronometro al servizio, potrebbe avere una conseguenza reale sul gioco, per quanto limitata.

Tramlines and Wide Groundstrokes

I possibili effetti dell’abolizione della prima di servizio o dei punti ai vantaggi

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 16 agosto 2019 – Traduzione di Edoardo Salvati

Delle numerose proposte sotto esame di modifica al regolamento per ridurre la durata delle partite e rendere il tennis un “prodotto” più attraente, la variazione al formato di gioco in uso negli Slam è la più rilevante. In questo articolo, scritto insieme a Francesco Lisi e Matteo Grigoletto del Dipartimento di Scienze Statistiche dell’Università di Padova, si analizza l’impatto della eliminazione della prima di servizio o dei punti ai vantaggi sulla durata delle partite.

Alla ricerca di partite più corte…

Dopo che la finale di Wimbledon 2019 è stata la prima partita terminata con il tiebreak sul 12-12 al quinto set, in molti si sono interrogati sulla bontà delle nuove regole. Quale sia l’opinione su quello specifico cambiamento, il fatto che nel 2019 ogni prova dello Slam abbia avuto un formato di gioco diverso per il tabellone di singolare maschile è senza dubbio indicazione di quanto il potere decisionale nel tennis è preoccupato dalla durata delle partite.

L’introduzione di nuove regole spazia da modifiche di piccolo cabotaggio, come la limitazione delle interruzioni per assistenza medica o il tempo a disposizione per il riscaldamento pre-partita, a modifiche con più sostanziali, come l’alterazione della struttura dei set e dei tiebreak.

Simon Higson, a capo della comunicazione per l’ATP, ha dichiarato che si è nella fase di aggregazione dei commenti dei vari portatori d’interesse, tra cui giocatori, televisioni, giornalisti, sponsor e pubblico, aggiungendo che non verranno prese decisioni prima di aver portato a termine anche il processo di analisi dei dati.

Per mettere alla prova l’efficacia di alcune di queste regole, l’ATP ha creato una competizione apposita, le Finali Next Gen, con partite giocate al meglio dei cinque set ma con set da 4 game, il tiebreak sul 3-3, senza punteggio ai vantaggi, senza ripetizione se la palla tocca il nastro in battuta e con un cronometro al servizio di 25 secondi. Questo formato, chiamato Fast4, riduce drasticamente la durata delle partite, ma è stato oggetto di critiche perché modifica completamente la struttura tradizionale dei set ed è spesso percepito tanto dai giocatori quanto dal pubblico come “un altro sport”. È possibile quindi introdurre dei cambiamenti che riducano la lunghezza delle partite mantenendo però invariate le caratteristiche portanti del sistema di punteggio?

…senza stravolgere il sistema di punteggio

Credo che, di fondo, ci siano tre possibilità: eliminare i vantaggi, eliminare la seconda di servizio, eliminare entrambi. La logica sottostante è che verrebbe fortemente limitato il dominio del servizio. Per capire meglio il concetto, l’immagine 1 mostra il numero medio di ace a partita per anno, e l’immagine 2 la percentuale media di partite che hanno richiesto uno o più tiebreak per anno nel periodo tra il 1990 e il 2018. La tendenza in questi grafici (misurata dalle curve di regressione non parametriche in rosso) suggerisce che all’aumentare della potenza del servizio è cresciuto anche il numero di game al servizio.

IMMAGINE 1 – Numero medio di ace a partita per anno, ATP

IMMAGINE 2 – Percentuale media di partite con tiebreak all’anno

Difficile stabilire l’impatto di questi cambiamenti, visto che non si giocano al momento partite in cui è introdotta solo una delle due variazioni.

Valutare le ipotesi con l’aiuto delle simulazioni

Possiamo però fare un passo avanti usando le simulazioni, il cui scopo è dimostrare in che modo la probabilità distributiva della durata delle partite cambierebbe in funzione del tipo di modifica. Sia Kovalchik e Ingram (2018) [1] che Lisi e Grigoletto [2] hanno implementato due simulatori per la durata delle partite. Nel secondo simulatore, sono state eseguite simulazioni per 20 mila partite al meglio dei cinque set con il seguente formato di gioco: 1) quello tradizionale, 2) quello tradizionale senza i punti ai vantaggi sul 40-40, 3) quello tradizionale ma con un solo servizio, 4) quello tradizionale senza vantaggi e un solo servizio.

Per ipotizzare una partita con un solo servizio è necessario considerare le conseguenze sul rendimento del giocatore al servizio dell’abolizione della regola della prima e della seconda. Si può prendere a riferimento quanto espresso da Klaassen e Magnus (2014) [3]: un giocatore con un solo servizio è equivalente a un giocatore con due servizi che ha sbagliato il primo. Con un solo servizio, un giocatore dovrebbe quindi usare la sua seconda di servizio, e non una via di mezzo tra una prima e una seconda. Eliminando la prima di servizio, la simulazione utilizza solo dati sul rendimento sulla seconda per stabilire i parametri che determinano i probabili esiti al servizio.

Parametri

La costruzione e impostazione del simulatore richiede le seguenti informazioni: categoria del torneo (Slam, Masters 1000, ATP500, ATP250), superficie, turno, punteggio finale, durata, numero di ace, numero di doppi falli, numero di prime e seconde, numero di prime e seconde valide, percentuale di punti vinti sulla prima e sulla seconda, punti totali vinti, distribuzione della velocità della palla e distribuzione del numero di scambi per ciascun punto. Per quest’ultima variabile i dati arrivano dal Match Charting Project, mentre per la velocità della palla il riferimento è a questo articolo per il dritto e a questo per il rovescio. Tutti gli altri dati sono presi da OnCourt.

Le partite considerate risalgono al periodo da gennaio 2011 a dicembre 2018, con l’esclusione di quelle senza indicazione della durata, delle Olimpiadi, delle Finali Next Gen, dei ritiri pre e durante la partita. Il campione è così composto da 3744 partite al meglio dei cinque set e 16246 al meglio dei tre set.

IMMAGINE 3 – Stima kernel di densità della durata delle partite

L’immagine 3 mostra la stima kernel di densità della distribuzione della durata insieme alla durata media. Le gobbe nella coda di destra di entrambe le distribuzioni sono dovute al numero diverso di set con cui può terminare una partita.

Esiti

La tabella elenca i valori di alcuni specifici quantili, dalla mediana (Q50) al 99.9% (Q999). La durata mediana è di 92 minuti per le partite al meglio dei tre set (media di 98 minuti) e 142 minuti per le partite al meglio dei cinque set (media di 150 minuti).

La tabella che segue elenca gli esiti in termini di durata e probabilità media di partite che durano più di k ore. Si basano su 20 mila partite al meglio dei cinque set. La stima dei parametri del modello ricomprende solo dati dagli Slam.

Emerge che sia il formato senza vantaggi che quello con un solo servizio sono efficaci per ridurre la probabilità che le partite durino più di tre ore, con l’effetto maggiore generato da un solo servizio a disposizione. In dettaglio, la probabilità che una partita al meglio dei cinque set vada oltre le tre ore è di circa il 25% con il formato tradizionale, ma si riduce a circa il 15% con l’abolizione dei vantaggi sul 40-40 e a circa il 10% eliminando un servizio. La riduzione è ancora più marcata se sono introdotte entrambe le modifiche, con la probabilità di più di tre ore che diventa solo del 4.1%. Oltre a essere più brevi, è risaputo che partite con il formato ridotto comportano anche un aumento del numero di vittorie a sorpresa, e quindi dell’incertezza del risultato finale.

Il caso della finale maschile di Wimbledon 2019

Prendiamo ora la finale maschile di Wimbledon 2019, in cui Roger Federer e Novak Djokovic sono rimasti in campo 297 minuti. Sulla base del simulatore, che durata ci saremmo dovuti aspettare per ciascuno dei 4 scenari? È stata eseguita una simulazione su 20 mila partite considerando solo la distribuzione degli scambi sull’erba e le probabilità stimate sulle precedenti partite tra i due. La tabella elenca la durata attesa e la probabilità che la partita superasse le k ore.

Sia nello scenario senza vantaggi che in quello di un solo servizio la durata media non cambia in misura rilevante, ma in entrambi i casi diminuisce con decisione la probabilità di una partita molto lunga. Ad esempio, la probabilità che una partita duri più di quattro ore e mezza è, con le regole di punteggio attuali, dell’1.7%. Pur essendo una probabilità estremamente ridotta, non è comunque del tutto marginale. Con il formato senza vantaggi, si riduce di quasi cinque volte, con quello di un solo servizio di più di quattro volte. Da un punto di vista statistico quindi, sono due cambiamenti i cui effetti non si discostano e la scelta tra i due potrebbe avvenire in funzione della preferenza dei giocatori. Eliminare contestualmente i vantaggi e un servizio sembra invece avere conseguenze eccessive e non è forse così necessaria.

Note:

[1] Kovalchik, S. A., & Ingram, M. (2018) “Estimating the duration of professional tennis matches for varying formats”, Journal of Quantitative Analysis in Sports, 14(1), 13-23

[2] Lisi, F. & Grigoletto, M. (2019) “Modeling and simulating durations of professional tennis matches by resampling match features” (In revisione) 

[3] Klaassen, F., & Magnus, J. R. (2014) “Analyzing Wimbledon: The power of statistics”, Oxford University Press, USA

Possible Effects of Abolishing First Service or Advantage Points

Finali Next Gen Gruppo B, le probabilità delle semifinali

di Chapel Heel // FirstBallIn

Pubblicato il 7 novembre 2018 – Traduzione di Edoardo Salvati

Le probabilità delle semifinali del Gruppo A.

L’ATP ha 9 possibili scenari per le semifinali del Gruppo B delle Finali Next Gen. Come spiegato nell’articolo per il Gruppo A. si tratta dell’insieme di tutte le combinazioni delle partite dell’ultimo giorno del Gruppo B in grado di produrre un esito che conti. Nel Gruppo B, ci sono tre differenti combinazioni di giocatori in grado di arrivare in semifinale.

La tabella riepiloga le probabilità di vincere la partita e il singolo set e le probabilità di una vittoria in tre, quattro o cinque set.

IMMAGINE 1 – Probabilità di vittoria partita / set per il Gruppo B

La tabella che segue mostra la probabilità che ciascuno scenario si verifichi e, nel caso, quali sono i due giocatori che ci si attende si qualifichino come numero 1 e numero 2. Si può notare che Alex De Minaur ha già raggiunto le semifinali, ma non si è ancora assicurato il primo posto del Gruppo B.

IMMAGINE 2 – Scenari Gruppo B

Si possono sommare queste probabilità per vedere chi può arrivare arrivare in semifinale, oltre alla probabilità che si verifichi una delle quattro combinazioni. La tabella riepiloga i risultati.

IMMAGINE 3 – Probabilità di giocatori in semifinale dal Gruppo B

Unendo queste informazioni con quelle del Gruppo A, si ottengono 14 possibili combinazioni per le semifinali, otto delle quali relative al Gruppo B e le restanti sei relative al Gruppo A. Le semifinali più probabili sono Stefanos Tsitsipas (#1 Gruppo A) e Andrey Rublev (#2 Gruppo B), e De Minaur (#1 Gruppo B) e Francis Tiafoe (#2 Gruppo A).

IMMAGINE 4 – Combinazioni semifinali Gruppo A e Gruppo B

Aggiornamento: con tre vittorie e nove set vinti e uno perso, De Minaur è arrivato al primo posto del Gruppo B, seguito da Rublev che, con un record di due vittorie e una sconfitta, si è qualificato per secondo. Le semifinali sono dunque Tsitsipas contro Rublev, e De Minaur contro Jaume Munar, n.d.t.

Milan Singles Group B – The Gory Probabilities

Finali Next Gen Gruppo A, le probabilità delle semifinali

di Chapel Heel // FirstBallIn

Pubblicato il 7 novembre 2018 – Traduzione di Edoardo Salvati

L’ATP ha 11 possibili scenari per le semifinali del Gruppo A delle Finali Next Gen in corso di svolgimento a Milano. Per chiarezza, s’intende l’insieme di tutte le combinazioni delle partite dell’ultimo giorno del Gruppo A in grado di produrre un esito che conti. Naturalmente, non ci sono undici differenti combinazioni di giocatori che possono raggiungere le semifinali dal Gruppo A, perché sono ovviamente solo 4, ma ci sono undici modalità univoche per arrivarci.

Ci sono 11 scenari per quattro combinazioni massime perché molte dipendono dal fatto che un giocatore vinca in tre, quattro o cinque set. Di conseguenza, serve determinare la probabilità di ciascun giocatore di vincere un set.

Possiamo procedere a ritroso stimando in primo luogo la probabilità di vittoria della partita per ogni giocatore. A tal proposito, ho utilizzato da un lato (al 90%) le mie previsioni basate sulle statistiche della singola partita e dall’altro (al 10%) le mie previsioni basate sulle valutazioni Elo specifiche per il cemento.

Con un modello Markov, si può puoi matematicamente ricavare, per ogni giocatore, la probabilità di vittoria di un punto al servizio. Dalla probabilità al servizio, è possibile calcolare la probabilità di vincere un game (nella formula “punto decisivo sulla parità”), da cui la probabilità di vincere un set (breve).

Con queste informazioni, si può ottenere la probabilità che un giocatore vinca la partita finale del girone in tre, quattro o cinque set. La tabella elenca le probabilità, secondo i miei calcoli.

IMMAGINE 1 – Probabilità di vittoria partita / set per il Gruppo A

Partendo da questi numeri, è possibile stimare la probabilità di ciascuno degli 11 scenari ATP. La tabella che segue mostra la probabilità che ciascuno scenario si verifichi e, nel caso, quali sono i due giocatori che ci si attende si qualifichino come numero 1 e numero 2. Si può notare che Stefanos Tsitsipas ha già raggiunto le semifinali, ma non si è ancora assicurato il primo posto del Gruppo A.

IMMAGINE 2 – Scenari Gruppo A

Si possono sommare queste probabilità per vedere chi può arrivare arrivare in semifinale, oltre alla probabilità che si verifichi una delle quattro combinazioni. La tabella riepiloga i risultati.

IMMAGINE 3 – Probabilità di giocatori in semifinale dal Gruppo A

Aggiornamento: con tre vittorie e nove set vinti e uno perso, Tsisipas è arrivato al primo posto del Gruppo A, seguito da Jaume Munar che, con un record di una vittoria e due sconfitte, si è qualificato per migliore percentuale di set vinti (50%), n.d.t.

Milan Singles Group A – The Gory Probabilities