Cosa succede al ritmo di gioco con le nuove regole imposte dalla pandemia

di Jeff Sackmann // TennisAbstract

Pubblicato il 31 agosto 2020 – Traduzione di Edoardo Salvati

La pandemia COVID-19 ha imposto agli organizzatori degli US Open 2020 alcuni cambiamenti sperimentali. Dopo un paio di anni di utilizzo in eventi marginali come le Finali Next Gen, il sistema di chiamata automatica dei colpi tramite Hawk-Eye è stato inserito (nella maggior parte dei campi) al posto dei giudici di linea. Anche un’altra innovazione provata alle Finali Next Gen, cioè che i giocatori si prendono l’asciugamano da soli, è subentrata agli US Open per motivi di distanziamento fisico.

L’assenza di tifosi

Entrambe le novità però impallidiscono al confronto con il cambiamento più grande per il primo Slam nella bolla: l’assenza di tifosi. I più forti hanno finalmente la possibilità di immergersi nell’esperienza che i giocatori che passano dalle qualificazioni, o quelli che frequentano i Challenger, vivono abitualmente: tribune vuote per partite con un’alta posta in palio.

Sono tutte modifiche arrivate poco dopo che, finalmente, gli US Open (e pochi altri tornei) hanno introdotto il cronometro al servizio. Ho scritto fino alla nausea degli effetti del cronometro al servizio, che sulla carta dovrebbe velocizzare il gioco ma che lo ha invece rallentato.

Il problema è che i giudici di sedia avviano il cronometro quando leggono il punteggio al microfono, che non è sempre immediatamente dopo la conclusione del punto precedente. Maggiore il pubblico presente, più ampia è la discrepanza, perché gli spettatori più rumorosi contribuiscono a ritardare la chiamata del punteggio da parte dell’arbitro.

Il ritmo di gioco dovrebbe aumentare senza spettatori, non è così? E anche l’uso di Hawk-Eye, eliminando i challenge, dovrebbe favorire un gioco più rapido. Di contro c’è il tempo che i giocatori impiegano per andare a prendersi l’asciugamano. Sarebbe interessante poter valutare ciascuno di questi fattori separatamente, ma la maggior parte dei dati in possesso arriva da partite che contengono appunto tutti questi cambiamenti.

L’effetto netto

La misura più semplice e diretta del ritmo di gioco è data dai secondi per punto, intesi come il tempo di gioco ufficiale della partita diviso per il totale dei punti. Si tratta di un’approssimazione, perché il tempo ufficiale include i cambi di campo, i timeout medici e qualsiasi altro rallentamento, la cui natura prescinde da quanto serve ai giocatori per prepararsi a servire.

È inoltre una misura che riferisce in parte sulla percentuale di prime (i punti generati da una seconda di servizio richiedono più tempo) e sulla lunghezza degli scambi (scambi più lunghi richiedono più tempo), per quanto questi fattori diventano poi, nella maggior parte dei casi, ininfluenti. Succede così specialmente nel confronto del ritmo di gioco tra un’edizione del torneo e la successiva.

Il grafico mostra i secondi per punto di tutte le partite del tabellone principale di singolare maschile del Cincinnati Masters per ciascun anno a partire dal 2000.

IMMAGINE 1 – Ritmo di gioco per il singolare maschile del Cincinnati Masters

(purtroppo devo considerare solo le partite maschili per mancanza di dati sul tempo di gioco ufficiale delle partite femminili prima del 2016)

Tre deviazioni standard

Nel periodo di riferimento di 21 anni, il tempo medio per punto è appena sotto i 40 secondi e, prima del 2020, la media annuale è andata oltre i 42 secondi solo una volta. Nell’edizione da poco terminata, la media è stata di un tempo enorme di 44.6 secondi per punto, superiore di più di tre deviazioni standard della media per il periodo dal 2000 al 2017 (cioè prima dell’introduzione del cronometro al servizio).

Il ritmo si è abbassato nel corso degli anni per ragioni svincolate dal cronometro al servizio, quindi probabilmente è eccessivo dire che l’effetto della bolla corrisponde a tre deviazioni standard. È chiaro però che l’edizione del 2020 è stata lenta.

Aspetta, non potrebbe essere invece…?

La presenza dei quattro semifinalisti del 2020 era più o meno scontata, quindi si può essere portati a credere che una media di gioco lenta sia in parte dovuta alla combinazione di giocatori che vincono spesso. L’ho pensato anche io, ma non è così (e aiuta tenere a mente che più della metà delle partite di un torneo avvengono nei primi due turni, anche con i bye al primo turno, dando garanzia di un eterogeneo gruppo di giocatori per calcoli come questo, a prescindere da chi avanza poi nel torneo).

Come primo passaggio, ho ricalcolato i secondi per punto del campione di partite escludendo tutte quelle con Novak Djokovic o Rafael Nadal, due giocatori che vincono molto e con un ritmo di gioco notoriamente lento. Non ha fatto molta differenza, e inserire un secondo grafico non avrebbe senso, perché ha lo stesso aspetto dell’Immagine 1.

Un altro metodo è di considerare la media del ritmo di gioco di ogni giocatore in tabellone e confrontare i suoi secondi per punto a Cincinnati con quelli degli altri tornei che ha giocato. Se ogni giocatore avesse giocato a Cincinnati con lo stesso ritmo di gioco della rispettiva media del 2019, la media dei secondi per punto per l’edizione del 2020 sarebbe stata di 41.3. È un valore di un nulla superiore al 41.0 del Cincinnati Masters 2019, e naturalmente ben inferiore agli effettivi 44.6 secondi per punto del 2020. Non si può dunque ritenere responsabile la combinazione di giocatori per la l’infinità lentezza di quest’anno.

Perché?

Spero di non avervi confuso sul fatto che il ritmo di gioco al Cincinnati Masters 2020 è stato molto lento. Sembra ragionevole pensare che anche gli US Open saranno così, perché condizioni e regole sono identiche. La spiegazione più semplice è che i giocatori utilizzano tempo addizionale per andare a prendersi l’asciugamano tra un punto e l’altro. Certamente andare fino al punto in cui si trova l’asciugamano richiede tempo. Ma c’è dell’altro.

Nella tipica media di 40 secondi per punto in un contesto con spettatori (sempre includendo cambi di campo e altri rallentamenti), ci sono molti punti in cui l’arbitro ritarda la chiamata del punteggio e il giocatore al servizio finisce per impiegare più dei 25 secondi permessi da regolamento, senza incorrere in una violazione temporale. Se a Cincinnati la media è vicina ai 45 secondi, devono esserci molti punti come quelli.

Da quello che ho potuto vedere, ci sono sicuramente punti come quelli. In una delle due semifinali, ho notato una circostanza in cui Roberto Bautista Agut è andato oltre i 40 secondi prima di servire. E non è il solo a infrangere la regola: tutti e quattro i semifinalisti (ma anche altri) hanno usato occasionalmente più di 25 secondi. Ironicamente, mi è sembrato che Djokovic fosse il più rapido dei quattro.

Discrezionalità

I giudici di sedia fanno ricorso al loro potere discrezionale e agiscono come se ci fossero spettatori rumorosi sugli spalti. Dopo punti con lunghi scambi, spesso aspettano a chiamare il punteggio. E anche quando lo fanno immediatamente, il cronometro non parte se non dopo che sono passati diversi secondi.

Un esempio clamoroso arriva dalla finale di Lexington, in cui il giudice di sedia ha lasciato ben 17 secondi dopo la fine del punto precedente prima che partisse il conteggio dei 25 secondi. La posizione delle telecamere a New York (sede per quest’anno del torneo di Cincinnati maschile e femminile, n.d.t.) ha reso difficile monitorare le partite di Cincinnati ma, considerata la lunghezza della pausa tra un punto e l’altro e la scarsità di violazioni temporali assegnate, devono esserci stati altri rallentamenti nell’ordine dei 15 o 20 secondi.

Senza spettatori né tantomeno challenge tattici a ritardare la ripresa del gioco, il ritmo, e la sua lentezza, è in controllo del giudice di sedia. Sicuro, prendersi l’asciugamano richiede tempo, ma se il cronometro dei 25 secondi parte immediatamente ed è applicato alla lettera, i giocatori saranno pronti a servire sulla linea di fondo. Così è stato per le Finali Next Gen, con un ritmo generalmente veloce.

Apparentemente però, i giudici di sedia non sembrano dell’idea di attenersi con scrupolo alla velocità di gioco prevista dal regolamento. Sono passati due anni dall’inizio del grande esperimento del cronometro al servizio, e il ritmo di gioco continua a farsi più lento.

What Happens to the Pace of Play Without Fans, Challenges, or Towelkids?

Che valore assegnamo ai tornei Masters o Premier vinti nella bolla?

di Jeff Sackmann // TennisAbstract

Pubblicato il 30 agosto 2020 – Traduzione di Edoardo Salvati

Il tennis è ripartito, ma molti dei più forti sono ancora a casa o vengono eliminati nei turni iniziali del loro primo torneo ufficiale dopo mesi di interruzione. Pur avendo conquistato il titolo da favorito nel Cincinnati Masters (che si è giocato nella sede degli US Open a New York, n.d.t.), Novak Djokovic non ha dovuto affrontare nessun giocatore dei primi 10. Lo stesso è stato per Victoria Azarenka, che ha vinto il Cincinnati Premier grazie anche al ritiro di Naomi Osaka in finale e al fatto di non aver avuto giocatrici tra le prime 10 sul suo cammino.

Dato che la maggior parte delle persone s’interessa solo degli Slam e null’altro, il dibattito sulla necessità di avere un asterisco accanto alle vittorie di questo periodo si è focalizzato sugli US Open. Vista però la facilità del cammino ai due titoli, dovremmo usare un asterisco anche per Cincinnati?

Il numero 35 per Novak, ma non (esattamente) il più facile

In un precedente articolo, ho spiegato perché parlare di asterisco è prematuro, se non del tutto sbagliato. Il campo partecipanti non è ciò che conta, perché il vincitore affronta solo una manciata di giocatori. La presenza di Rafael Nadal, per fare un nome, non ha molto a che fare con la difficoltà della vittoria del titolo a meno che chi vince non ha dovuto battere anche lui. Se gli avversari del vincitore sono molto forti, la strada per il titolo è stata tortuosa. Con avversari relativamente deboli, il percorso è facile. Sottolineo che sto usando “forte” e “debole” in termini teorici. Djokovic ha avuto fortuna a trovare in semifinale e in finale rispettivamente il dodicesimo e trentesimo in classifica. Sulla carta, quindi, il suo percorso sembrava “facile”. In realtà, ha dovuto guadagnarsi con fatica entrambe le vittorie.

Ora sappiamo che i campioni di Cincinnati hanno avuto vita relativamente comoda. Quanto è stato semplice però il loro percorso?

Il campione Masters medio

Ho calcolato la difficoltà della strada al titolo determinando la probabilità che un campione Masters medio su quella superficie batta gli avversari che il vincitore ha dovuto affrontare. Utilizzando il concetto di “campione Masters medio” si smette di considerare il livello di bravura del giocatore che ha effettivamente vinto il torneo per concentrarsi sulla qualità degli avversari.

I numeri che ne emergono variano sensibilmente, dal 2.5% — cioè la probabilità che un campione Masters medio battesse i giocatori affrontati da Jo Wilfried Tsonga per vincere il Canada Masters 2014 — fino al 61.2%, cioè la probabilità che un campione Masters medio battesse i giocatori affrontati da Nikolay Davydenko al Masters di Parigi Bercy 2006.

Per Djokovic, nel Cincinnati Masters il numero è stato del 40.5%. In altre parole, un campione Masters medio sul cemento avrebbe avuto 4 probabilità su 10 di battere i cinque giocatori che Djokovic si è trovato di fronte. Come mostra la tabella, è l’undicesimo titolo Masters per facilità dal 1990.

(P) Titolo   Torneo                Vincitore             
61.2%        2006 Parigi           Davydenko  
50.5%        2012 Parigi           Ferrer       
49.8%        2000 Parigi           Safin        
48.3%        2004 Parigi           Safin        
47.0%        1999 Parigi           Agassi       
44.5%        2013 Shanghai         Djokovic     
43.3%        2002 Madrid           Agassi       
42.9%        2005 Parigi           Berdych      
41.4%        2009 Canada           Murray        
41.3%        2017 Parigi           Sock          
40.5%        2020 Cincinnati       Djokovic     
39.6%        2011 Shanghai         Murray        
39.1%        2019 Canada           Nadal       
37.9%        2008 Inter. d'Italia  Djokovic     
36.2%        2007 Cincinnati       Federer

A meno di non voler mettere in modo permanente un asterisco accanto al Masters di Parigi Bercy, dovremmo smettere di sminuire il titolo di Cincinnati. Sorprende la maggiore facilità del titolo per Djokovic allo Shanghai Masters 2018. Pur avendo dovuto battere due dei primi 10 nei turni conclusivi (Tsonga e Juan Martin del Potro), a quel tempo Elo non li considerava così in forma.

Azarenka: asterisco al quadrato

Fare una valutazione del titolo femminile è più complicato. Parte del problema è nel ridotto numero di tornei della categoria Premier Mandatory, e nel fatto che due tra questi (Indian Wells e Miami) hanno tabelloni decisamente più ampi, diventando molto più difficili da vincere. Un aspetto ancora più rilevante è il ritiro in finale di Osaka, l’avversaria contro cui Azarenka avrebbe dovuto giocare.

Iniziamo dai numeri. Se prendiamo le cinque giocatrici che Azarenka ha battuto e calcoliamo la probabilità che una campionessa Premier media (non solo Premier Mandatory quindi) le batterebbe, il numero è di 20.7%. Se aggiungiamo Osaka, nell’ipotesi in cui Azarenka ha il merito di averla battuta, il numero diventa 7.4%.

Rispetto a quanto visto per gli uomini, si tratta di un buon numero. Ma c’è lo zampino del diavolo, perché la categoria Premier per le donne è in media decisamente più debole di un evento di punta come Cincinnati. La tabella riepiloga la probabilità per il torneo di Cincinnati negli ultimi dodici anni.

20.7%       2020  Azarenka  (rit. Osaka)  
7.4%        2020  Azarenka  (b. Osaka)   
7.3%        2016  Kar. Pliskova             
5.5%        2010  Clijsters                 
5.5%        2012  Na                         
5.3%        2015  S. Williams               
4.5%        2011  Sharapova               
4.3%        2014  S. Williams               
4.2%        2017  Muguruza              
3.9%        2019  Keys                  
2.9%        2013  Azarenka             
2.0%        2009  Jankovic               
1.3%        2018  Bertens

Il 20.7% di probabilità è un numero rispettabile per un tipico evento Premier, e la vittoria di Azarenka a Brisbane 2016 ad esempio, con il 20.8%, aveva un valore praticamente identico. Cincinnati però offre un tabellone costantemente più ostico. Anche tenendo conto della difficoltà di battere Osaka, il cammino di Azarenka è stato il più facile (anche se di poco) a Cincinnati da quando è stata creata la categoria Premier.

Si, no, forse

Voglio ribadire una delle principali conclusioni dall’articolo sull’asterisco accanto agli US Open. Quando si vuole stabilire se un titolo “conta”, non c’è mai una semplice risposta si o no (e questo nell’ipotesi in cui si prende anche solo in considerazione l’idea che un titolo non possa contare). Ben prima che la pandemia creasse enorme scompiglio, c’erano titoli — e anche gli Slam — molto più facili da vincere di altri.

Il titolo di Djokovic si inserisce nel mezzo del tipico intervallo di difficoltà, anche se rimarrà alla storia come uno dei più facili che ha vinto. Per Azarenka, la valutazione non è così immediata, più per il ritiro di Osaka che per la debolezza del campo partecipanti. Nonostante numerose assenze importanti, il livello è stato sufficientemente competitivo da riservare ad Azarenka un percorso al titolo paragonabile con almeno una recente edizione a Cincinnati e molti altri tornei di prima fascia.

Tenendo tutto questo a mente, vi lascio con due previsioni. La prima, è che i vincitori degli US Open avranno un cammino relativamente facile al titolo ma, come per Djokovic, si tratterà di un livello di difficoltà tipico. La seconda: alla fine delle due settimane, desidererete non sentire ma più la parola “asterisco”.

How Should We Value the Masters and Premier Titles in the Bubble?

Mettere un asterisco accanto agli US Open è prematuro, e forse del tutto sbagliato

di Jeff Sackmann // TennisAbstract

Pubblicato il 19 agosto 2020 – Traduzione di Edoardo Salvati

Ci saranno diverse assenze di alto profilo agli US Open 2020. Rafael Nadal ha deciso di non giocare la trasferta in nord America, quest’anno più breve, e Roger Federer non rientrerà prima del 2021 per via dell’infortunio al ginocchio. Anche tra le donne, più della metà delle prime 10 non si presenterà a New York. Un campo partecipanti privo di alcuni dei più forti aumenta la probabilità che i pochi favoriti rimasti, come Novak Djokovic e Serena Williams, aggiungano un altro trofeo Slam alla loro collezione (per Djokovic non sarà più possibile, vista la squalifica ricevuta per aver lanciato la pallina contro la giudice di linea, n.d.t.).

La necessità di assegnare un “asterisco” a questa edizione del torneo è diventato quindi un argomento di conversazione tra opinionisti e per i tifosi più accalorati. L’idea è che, per via di tutte le assenze illustri, questo Slam valga meno degli altri, al punto che la cronistoria dovrebbe riportare la relativa insignificanza del titolo assegnato (nessuno si occupa più delle cronistorie, quindi si parla in effetti di una pagina nel sito degli US Open o un aggiornamento infinito della pagina Wikipedia).

Per quello che ho visto, c’è un errore di fondo. Certamente un campo partecipanti debole rende più facile, sulla carta, la vittoria del torneo. E chi alzerà la coppa non avrà dovuto affrontare Nadal o Ashleigh Barty lungo il percorso. Ma non è il campo partecipanti ciò che conta.

Il campo partecipanti non è ciò che conta

La ripetizione della frase non è casuale, perché è davvero così importante. Il vincitore di uno Slam deve superare sette partite. La difficoltà di aggiudicarsi il titolo dipende quasi interamente dagli avversari in quelle sette partite. Ogni tabellone è composto da 128 giocatori (e giocatrici), ma 120 di loro sono quasi irrilevanti.

Dico quasi perché prevedo varie obiezioni. Ci sono volte in cui una vittoria è cosi dura per la resistenza dell’avversario da indebolire il vincitore nel turno successivo. Prendiamo ad esempio l’edizione 2009 del Madrid Masters, in cui a Nadal sono servite quattro ore per battere Djokovic in semifinale, per poi perdere contro Federer in finale. Potremmo dire che la presenza di Djokovic ha avuto rilevanza, anche se Federer ha vinto il torneo senza giocarci contro.

Sono combinazioni di eventi che accadono, per quanto forse non così tanto come si crede. E anche quando succede, può non necessariamente essere un giocatore di vertice a sfiancare l’avversario in uno dei primi turni.

Distribuzione delle teste di serie

Un altro aspetto è che l’assenza di giocatori ha conseguenze sulla distribuzione delle teste di serie. Ad esempio, Serena è attualmente la numero nove del mondo, una posizione poco invidiabile all’inizio di uno Slam. La testa di serie numero 9 infatti ha in programma un quarto turno con una delle prime otto, e potrebbe dover giocare contro quattro delle prime otto prima di vincere il titolo. Con tutte le assenze, Serena è la testa di serie numero 3, dietro solo a Karolina Pliskova (che però ha perso al secondo turno, n.d.t) e Sofia Kenin (che ha perso al quarto turno, n.d.t.).

Non sono tematiche da escludere a priori. Hanno la loro importanza, limitata però a incidere nel modo in cui il tabellone si riduce fino ai due finalisti. La differenza nell’impegno richiesto da una partita contro la testa di serie numero 3 o la numero 9 potrebbe essere enorme…o potrebbe essere nulla, specialmente se si verificano molte sconfitte pesanti nei primi turni.

La difficoltà è un continuum

Pur dando credito ad alcune delle precedenti obiezioni (o ad altre che non mi sono venute in mente), spero si possa essere d’accordo sul fatto che l’ostacolo più rilevante per un giocatore nella conquista del torneo sono i sette avversari davanti al suo cammino.

Se in media sono giocatori molto forti, diremo che il giocatore ha vinto con un percorso decisamente duro. È il caso di Stanislas Wawrinka agli Australian Open 2014, quando ha battuto sia Djokovic che Nadal all’apice del loro dominio. Se, complessivamente, il livello dei sette avversari non è da far girare la testa, almeno per gli standard previsti da uno Slam, diremo allora che il percorso è stato facile. Ad esempio, sempre agli Australian Open Federer ha vinto il titolo nel 2006 affrontando solo un giocatore dei primi 20 e nessuno dei primi 4.

Siamo in grado di quantificare la difficoltà del percorso in diversi modi. Una metodologia utile è quella di calcolare la probabilità che un campione Slam medio batta quei sette avversari. La differenza tra titolo facile e molto impegnativo è abissale. Tipicamente, un campione Slam medio (vale a dire un giocatore con una valutazione Elo intorno a 2100), avrebbe una probabilità del 3.3% di battere i sette giocatori affrontati da Wawrinka a Melbourne l’anno in cui ha vinto. Solo due percorsi Slam sono stati più difficili nella storia, entrambi di Mats Wilander al Roland Garros, nel 1982 e 1985. A confronto, un campione medio Slam avrebbe avuto il 51% di probabilità di 7 vittorie e 0 sconfitte con il tabellone di Federer agli Australian Open 2006.

Quindici volte più facile!

Il tabellone più facile di uno Slam è quindici volte più facile del tabellone più difficile di uno Slam. Quindici volte! Tra questi due estremi, si possono trovare molti campioni Slam per ogni possibile livello di difficoltà. Il campione Slam medio avrebbe avuto il 10% di probabilità di vincere gli US Open 2011 come ha fatto Djokovic. Lo stesso vale per gli US Open 2012. Il cammino di Andy Murray alla vittoria di Wimbledon 2016 avrebbe dato al campione Slam medio una probabilità del 20%. Il Roland Garros 2018 è stato gestibile per Nadal, perché un campione Slam medio aveva una probabilità del 30% di assicurarsi quelle sette vittorie.

Nulla toglie che tutti quei giocatori meritassero o “non” meritassero il titolo. Federer non ha scelto i suoi avversari nel 2006 a Melbourne più di quanto non potesse fare Wawrinka otto anni dopo. Il trofeo è identico e, in molti importanti dettagli, anche il risultato è identico. Entrambi i campioni svizzeri hanno eliminato tutti gli avversari, che si sono rivelati i giocatori con il rendimento migliore (almeno durante quelle due settimane) tra tutti quelli iscritti al torneo.

Un asterisco per tutti gli Slam

Un altro elemento in comune tra la vittoria di Federer nel 2006 e quella di Wawrinka nel 2014: quasi tutti i più forti del mondo erano in tabellone (con l’eccezione del campione uscente Marat Safin, assente per infortunio nel 2006). Di fatto, il campo partecipanti era lo stesso, ma per vincere il titolo un giocatore ha passeggiato per due settimane, l’altro ha dovuto compiere una delle cavalcate più straordinarie nella seconda settimana di uno Slam nell’era moderna.

C’è un intendimento collettivo tra tifosi che ogni vittoria Slam vale “un punto”. Non deve essere per forza così. Si potrebbero cioè assegnare più “punti Slam” per imprese come quelle di Wawrinka e assegnarne meno a vittorie più facili. La maggior parte delle persone rifiuta questa ipotesi, e ammetto che suona un po’ strana. Non ne sto spingendo un uso generalizzato, per quanto sia un concetto che ho illustrato in precedenza, facendo vedere che gli Slam di Djokovic sono, in media, più impressionanti di quelli di Nadal, che a loro volta sono stati più duri di quelli di Federer.

Una ponderazione degli Slam per il grado di difficoltà determina cambiamenti nella classifica dei più grandi di sempre, insieme alla certezza per me di essere odiato dai tifosi di ciascun giocatore perché ho scritto del codice e riempito di numeri dei file Excel (con premeditazione, lo ammetto). In un certo senso, modificare il conteggio degli Slam in funzione della loro difficoltà significa mettere un asterisco accanto a ognuno di essi. Ai tabelloni più complicati viene riconosciuto il fatto di essere stati difficili, mentre quelli che nel corso del torneo si sono semplificati ricevono un punteggio inferiore, vista la loro facilità. Si tratta di un intervallo di continuità, non una semplice decisione dentro o fuori tra Slam “normali” e Slam “anomali”.

Sarà così anche per il 2020?

I campioni degli US Open 2020 avranno probabilmente avuto un percorso che si trova nella metà più facile di quell’intervallo di continuità. Ma anche un affermazione di questo tipo non è per nulla scontata.

Poniamo che Venus Williams riscopra la forma di una volta e vinca il titolo, battendo la testa di serie numero 3 Serena nei quarti di finale, la testa di serie numero 2 Kenin in semfinale e la testa di serie numero 1 Pliskova in finale (non importa che la vincitrice a sorpresa sia Venus, potrebbe essere anche una giocatrice con classifica inferiore, anche se Venus sembrerebbe la più accreditata) [Venus ha perso al primo turno, n.d.t.]. Una campionessa Slam media batterebbe quelle tre giocatrici in successione circa il 37% delle volte. Il 37% è già una probabilità più bassa di quasi il 20% dei tabelloni Slam femminili degli ultimi 45 anni (la vittoria di Kenin agli Australian Open 2020 aveva una probabilità del 39%).

Il 37% per l’ipotetico titolo di Venus non rappresenta nemmeno l’immagine completa. La probabilità scenderebbe al 26% mettendoci dentro altri quattro turni contro tenniste di esperienza, facendolo diventare più difficile di un terzo dei tabelloni Slam femminili. Se aggiungiamo una o due avversarie delicate tipo Cori Gauff (che ha perso al primo turno, n.d.t.) o Petra Kvitova (che ha perso al quarto turno, n.d.t.), all’improvviso il cammino per la vittoria degli US Open 2020 diventa difficile come un qualsiasi altro Slam.

Le cose sono più semplici quando non si deve battere Djokovic

Lo stesso ragionamento si può applicare al titolo maschile. Stando i numeri, la semplice vittoria a sorpresa contro Djokovic (come se fosse così davvero semplice) è più difficile di quanto sia stato sconfiggere tutti e sette gli avversari di Federer negli Australian Open 2006. Avete letto bene: sei ritiri e una vittoria contro Djokovic non sarebbe comunque lo Slam più facile negli ultimi quindici anni. Aggiungeteci sei vittorie effettive, tra cui un paio contro avversari di spessore, e ottenete un cammino di sette partite che regge il confronto con un tipico Slam non affetto da pandemia.

Ironicamente, il giocatore che potrebbe vincere il titolo con il percorso più debole è proprio Djokovic (che appunto è stato squalificato al quarto turno, n.d.t.). Sarebbe quantomeno inusuale dover mettere un asterisco accanto a qualunque vittoria di Djokovic, ma le cose sono molto più semplici quando non deve battere un giocatore come sé stesso.

Competitività mascherata

Vale la pena ripeterlo, il campo partecipanti non è ciò che conta. Se ci concentriamo sui giocatori presenti a New York invece degli assenti, vediamo che ci sono gli ingredienti necessari per un percorso rispettabile alla vittoria del titolo. Quasi certamente Wilander e Wawrinka possono stare tranquilli, ma è assolutamente possibile che i vincitori avranno affrontato un livello competitivo equivalente a quello di uno Slam medio. Non ne sapremo di più se non verso la fine della seconda settimana. Parlare di asterischi è quindi come minimo prematuro. Poi, sarà probabilmente una questione di opinioni.

US Open Asterisk Talk is Premature. It Might be Flat-Out Wrong

Il circuito femminile post COVID-19 sta rientrando alla normalità

di Jeff Sackmann // TennisAbstract

Pubblicato il 17 agosto 2020 – Traduzione di Edoardo Salvati

Negli ultimi due tornei femminili, abbiamo assistito a risultati attesi, oltre a qualche sorpresa. Simona Halep, la chiara favorita a Praga, ha portato a casa il titolo nonostante due partite di primo e secondo turno al terzo set. Nell’altro torneo della settimana a Lexington, le cose sono andate diversamente. Serena Williams e Aryna Sabalenka, le più forti nelle rispettive metà del tabellone, hanno raccolto insieme solo tre vittorie, con le quattro semifinaliste fuori dalle teste di serie.

In un precedente articolo ho sottolineato come Palermo, il primo torneo alla ripresa dell’interruzione, era così imprevedibile che per fare pronostici sarebbe stato meglio lanciare una moneta invece che affidarsi a valutazioni (come Elo) sulla bravura delle giocatrici aggiornate a prima della pandemia. Non è la prima volta di un evento con così tante vittorie insolite, ma è indicazione del fatto che il circuito femminile non è ancora tornato alle dinamiche di dominio più classiche.

Con Praga e Lexington abbiamo ora il triplo dei dati con cui lavorare. Inoltre, si potrebbe teorizzare una maggiore prevedibilità, seppur contenuta, per Praga visto che molte delle giocatrici erano impegnate anche a Palermo, vale a dire in possesso di fresca condizione di partita. Pur rimanendo con un campione risicato di 93 partite, ci avviciniamo a una migliore comprensione di come il tradizionale metodo previsionale operi in tempi di incertezza.

Una sequenza Brier altalenante

La statistica che uso per quantificare la prevedibilità — detta in altro modo, la validità delle valutazioni relative allo stato di forma delle giocatrici prima dell’interruzione — si chiama indice di Brier, e tiene conto sia dell’accuratezza grezza (il pronostico ha indovinato la vincitrice) che del livello di confidenza (il pronostico ha ecceduto in sicurezza, ha mancato in fiducia, o è stato semplicemente giusto). Indici di Brier complessivi per il circuito solitamente si aggirano intorno allo 0.21, mentre un valore di 0.25 indica che la previsione non era meglio di un lancio della moneta. Un punteggio più basso segnala una previsione più precisa.

La tabella riepiloga l’indice di Brier per Palermo, Lexington e Praga, insieme alla media dei tre tornei, alla media di tutti i tornei della categoria International (a prescindere dalla superficie) dal 2017 (i valori sono ottenuti sulla base delle mie valutazioni Elo). Ci potremmo aspettare un primo turno diverso, proprio perché le giocatrici sono più “arrugginite”, quindi ho calcolato anche l’indice per i primi turni (Brier R32) per ciascun torneo e le rispettive medie.

Torneo          Brier   Brier R32   
Palermo         0.268   0.295   
Lexington       0.226   0.170   
Praga           0.212   0.247   
Media rientro   0.235   0.237   
Media Intern.   0.217   0.213

Palermo fa eccezione

Come già visto, i risultati di Palermo disattendono le aspettative. Più della metà delle partite si è conclusa con una vittoria a sorpresa (stando alle mie valutazioni Elo), con un primo turno davvero difficile da pronosticare. Poi però non è durata a lungo. Il primo turno di Praga aveva un valore di 0.247, di niente superiore al lancio della moneta, ma la confusione non è andata oltre i primi due giorni. L’indice di Brier totale per il torneo è stato di 0.212, di poco meglio della media degli International. In altre parole, questo gruppo di 32 giocatrici al rientro da una pausa di diversi mesi, ha generato risultati in sostanza esattamente prevedibili come quanto ci saremmo attesi nel mezzo di una stagione regolare.

Più difficile è dare un senso ai numeri di Lexington ma, come per Praga, puntano a un mondo post COVID-19 che non è poi così surreale. Il primo turno ha replicato il copione, con un indice di Brier di 0.170. Degli ultimi 115 tornei International, solo 22 sono stati più prevedibili. L’accuratezza non ha avuto vita lunga, principalmente per la sconfitta di Serena Williams contro Shelby Rogers. Il valore per l’intero torneo è stato di 0.266, meno pronosticabile del solito, ma molto meglio di una previsione casuale e più vicino alla media del circuito di quanto non lo fosse Palermo.

Stime riviste

Sono ancora le prime fasi nel processo valutativo delle attese risposte sulle giocatrici dopo un’interruzione così lunga. Più si giocano tornei, più siamo in grado di vedere se la prevedibilità dei risultati aumenta all’aumentare del numero di partite (forse a Praga era più difficile prevedere il comportamento delle giocatrici che hanno saltato Palermo, con l’ovvia eccezione di Halep).

In questo particolare momento, può succedere qualsiasi cosa. Da un lato, potremmo tornare alle dinamiche di sempre. Dall’altro, le nuove regole che impongono il distanziamento fisico — tra cui l’assenza di pubblico, la vita serale limitata a Netflix, gli asciugamani da andarsi a prendere in autonomia, e modalità di coaching in campo differenti — potrebbero andare a detrimento di alcune e favorire altre. Se così fosse, le valutazioni Elo passeranno per un periodo inedito di aggiustamento per riflettere chi è stata abile a fiorire dopo l’interruzione.

È troppo presto per affermazioni più perentorie su un argomento così importante. Nell’ultima settimana, abbiamo visto pronostici essere palesemente errati (Palermo) o una via di mezzo (Lexington e Praga). Siamo diventati più esperti in merito a tanti cambiamenti accaduti da marzo, ma la metodologia di valutazione delle giocatrici potrebbe rimanere identica in quasi tutto e per tutto.

The Post-Covid WTA is Drifting Back to Normal

Il sospetto che Venus e Serena debbano giocare contro troppo spesso è fondato?

di Jeff Sackmann // TennisAbstract

Pubblicato il 12 agosto 2020 – Traduzione di Edoardo Salvati

Nel torneo di Lexington di questi giorni, la testa di serie numero 1 Serena Williams affronterà al secondo turno la sorella, Venus Williams (Serena ha vinto con il punteggio di 3-6 6-3 6-4, n.d.t.). Sono due delle giocatrici più forti di ogni epoca e si sono ritrovate contro in ben nove finali Slam. Suscita inevitabilmente scalpore quindi vederle dalla stessa parte del tabellone a giocare in un martedì qualsiasi.

Sembra però che ultimamente le loro strade si incontrino sempre molto prima delle fasi finali di un torneo. Le tre partite dalla finale degli Australian Open 2017 a oggi sono state nei trentaduesimi, tra cui quella agli Internazionali d’Italia nel 2019 che non si è giocata per il ritiro di Serena. Non più una forza dominante, Venus è spesso anche fuori dalle teste di serie, quindi, almeno sulla carta, può capitare in qualsiasi torneo che le sorelle siano vicine di tabellone.

È normale che succeda così spesso?

L’irruzione di Serena e Venus sulla scena mondiale del tennis non è stata accolta con favore universale, per usare un eufemismo. Se si ha un debole per le teorie complottistiche, ogni sorteggio di tabellone rappresenta un’opportunità per mettere in atto scorrettezze più o meno velate. È possibile che all’inizio dell’era Williams, organizzatori razzisti o in altro modo fuorviati volessero evitare una finale tutta in famiglia. O, in periodo più recente, i grandi capi di un torneo, consapevoli che Venus difficilmente arriverà in finale, manipolano il tabellone in modo da rendere più probabile una partita tra sorelle che faccia notizia. 

Sono sicuro che la maggior parte dei sorteggi è condotta nella massima trasparenza, ma è anche un processo sufficientemente opaco da esporsi a facili sospetti. Altrettanto facile è cadere in generalizzazioni errate che si basano su dati insufficienti. Vediamo cosa ci dicono i numeri.

150 tornei!

Quello di Lexington è il 150esimo torneo con la partecipazione sia di Serena che di Venus [1]. Si tratta della partita numero 31, oltre a un ritiro per parte. In 13 tornei su 150, le sorelle erano le prime due teste di serie o la numero 3 e la numero 4. Questo esclude qualsiasi trucco nel tabellone, perché un’eventuale partita tra loro poteva accadere solo in finale. E così è stato 4 volte su quei 13 tornei. 

Qual è la probabilità? Ho analizzato i rimanenti 137 tornei per vedere il turno in cui hanno effettivamente giocato contro o avrebbero potuto farlo. Ai fini dell’analisi di un tabellone, fondamentalmente non c’è differenza. Ad esempio, Serena e Venus sono finite nella stessa metà del tabellone 73 volte su 137, un po’ più delle 68 o 69 volte che ci saremmo aspettati. 

Viste le rispettive teste di serie, avevano la possibilità di finire nello stesso quarto 116 volte, e così è successo per 28 volte, solo una in meno delle 29 volte previste da una frequenza esatta di una volta su quattro. Più piccola la sezione di tabellone, minore il numero di tornei in cui la testa di serie di Serena e Venus poteva farle incontrare.

Ho conteggiato il numero di tornei con una possibile partita in uno specifico turno o prima di quel turno, e poi il numero di tornei in cui il tabellone ha effettivamente portato a quella partita, a prescindere dalla presenza di una o entrambe le sorelle in quel turno. La tabella riepiloga i risultati, insieme alla probabilità associata alle partite concretamente giocate. 

Sezione         Possibile  Effettivo  Probabilità 
Stessa metà     137        73         25%  
Quarti          116        28         62%  
Ottavi          85         17         3%  
Sedicesimi      64         5          37%  
Trentaduesimi   42         1          74%

C’è il 25% di probabilità che Serena e Venus sarebbero state nella stessa metà di tabellone rispetto a tutte le volte in carriera in cui sono state nella stessa metà. C’è un po’ di sfortuna, ma niente di trascendentale. Identico ragionamento per lo stesso quarto, così come per partite nelle fasi di avvio del torneo che le avrebbe fatte scontrare nei trentaduesimi o nei sessantaquattresimi di finale.   

Dubbi sugli ottavi?

Rimane un solo numero di cui parlare, uno che fa alzare il sopracciglio. Su 85 occasioni, almeno una delle due era fuori dalle prime otto teste di serie, così da rendere possibile una partita nei sedicesimi o anche prima. In una simulazione di tabelloni casuali, ci aspetteremmo 10 o 11 sezioni in cui si sarebbero potute scontrare così presto nel torneo. Invece, è successo ben 17 volte!

Una probabilità del 3% di tante partite “anticipate” non è così malvagia come sembra. Ho cercato di illustrarvi il procedimento nel modo in cui l’ho concepito. Mi sono chiesto se Serena e Venus si fossero incontrate più spesso di quanto affidato alla casualità, ma non avevo un turno specifico in mente. Come abbiamo visto, sono arrivato a un po’ di numeri, e uno su cinque desta sospetti. Si potrebbe concepire una teoria a spiegazione del fatto che per loro i sedicesimi sono diversi dagli altri turni (come la mia sulla partita infrasettimanale che cattura l’attenzione dei media). Di fronte a così tanti numeri però, era molto più probabile che arrivassimo a una percentuale estrema semplicemente per caso.

Una pallottola spuntata

Abbiamo fatto vedere che esiste la possibilità di tabelloni non del tutto casuali, ma a fatica riusciamo a dimostrarlo. Un problema, che si sarebbe potuto ipotizzare già da subito, è legato al fatto che alcuni tabelloni non sono sicuramente manipolati, probabilmente la maggior parte. Anche se lo fossero, non ci sarebbe ragione per gli organizzatori di alterare la posizione di Serena o Venus. E se proprio lo facessero, preferirebbero una finale interamente Williams, modificando quindi il loro piazzamento in senso opposto a quello che stiamo cercando di far emergere.  

Se siete alla ricerca della teoria complottistica, ho per voi un piccolo campione. Dall’inizio del 2018, Venus e Serena hanno giocato nello stesso torneo 15 volte, e la testa di serie (o sua la mancanza) ha fatto sì che capitassero nello stesso ottavo 14 volte. Di queste 14, cinque volte erano posizionate in modo da potersi incontrare nei sedicesimi o prima ancora. Esiste solo il 2% di probabilità che questo accada…senza nemmeno considerare che sto analizzando qualsiasi sottoinsieme di partite per trovare una qualche tendenza (probabilmente fittizia). Se non altro, il dato di 5 volte su 14 spiega perché sembra che Serena e Venus continuino a finire nella stessa sezione del tabellone, almeno ultimamente. È perché così succede! 

Per arrivare a una conclusione generale, si è trattato di molto rumore per nulla (non so neanche se queste teorie esistono, forse ne ho inventata una per poi passare un intero pomeriggio a smontarla). È possibile che ci siano alcuni organizzatori impegnati a manipolare i sorteggi…servirebbe un’attività investigativa di tutt’altro tipo per darne credito a questa ipotesi. 

Nel peggiore degli scenari, avremo altre partite tra Serena e Venus. Non un buon affare per la più grande delle due sorelle, certamente un trattamento di lusso per gli appassionati di tennis.

Note:

[1] O così credo. Non ho dei dati super precisi per i primi anni di carriera delle Williams, e ho dovuto integrare con un lavoro da amanuense. La loro pagina su Tennis Abstract non riposta la Grand Slam Cup 1999, che ho comunque considerato in questo articolo. Ai fini di considerazioni statistiche, non ha troppa importanza se il totale è 148 o 151, ma se serve un’ufficializzazione o una torta di festeggiamento, sarebbe meglio controllare due volte. 

Are Tournament Draws Giving Us Suspiciously Many Venus-Serena Clashes?

Effetti della pandemia nel torneo di Palermo?

di Jeff Sackmann // TennisAbstract

Pubblicato il 10 agosto 2020 – Traduzione di Edoardo Salvati

È più difficile fare previsioni sullo stato di forma di una giocatrice al rientro da un’interruzione che l’ha tenuta lontana da partite ufficiali per quasi sei mesi? Un ritorno del circuito femminile alla quasi normalità con il torneo di Palermo fornisce degli spunti per una possibile risposta.

In un recente articolo ho ipotizzato che fare pronostici sui risultati sarà, per un certo periodo, più complicato del solito, richiedendo degli aggiustamenti al mio algoritmo per le valutazioni Elo. Le 31 partite di tabellone principale che arrivano dalla Sicilia permettono alcune elaborazioni preliminari.

A uno sguardo veloce, i risultati sembrano un po’ strani. Solo due delle otto teste di serie sono arrivate in semifinale, ed è emersa vincitrice Fiona Ferro. Due wild card hanno raggiunto i quarti di finale. Sono circostanze chiaramente anomale per un evento del livello International? In realtà non così tanto, quindi proviamo a stabilire una linea di demarcazione.

L’imprevedibile Palermo

In termini di “prevedibilità”, il mio riferimento è l’indice di Brier, che misura l’accuratezza dei pronostici espressi in percentuale. Va bene ipotizzare una vincitrice, più importante è assegnare una corretta probabilità. Se per 100 partite si afferma che una giocatrice ha il 60% di probabilità di vittoria, dovrebbe allora vincere 60 di quelle cento partite. Se ne vince 90, non si è stati sufficientemente sicuri della sua forma; se ne vince 50, sarebbe stato meglio fare un pronostico lanciando una moneta. L’indice di Brier sintetizza questi concetti con un solo numero, che è più preciso quanto è inferiore. Approssimativamente, le mie previsioni Elo per il circuito maschile e femminile si assestano poco sopra allo 0.2.

Dal 2017 fino a marzo 2020, le 975 partite femminili terminate regolarmente in tornei sulla terra di livello International avevano un indice di Brier complessivo di 0.223. I primi turni erano leggermente più prevedibili, con un punteggio per i trentaduesimi di 0.219. Il torneo di Palermo ha avuto un andamento più altalenante. Le 31 partite di tabellone principale hanno ottenuto un indice di Brier combinato di 0.286. Di altri 32 tornei che ho considerato, solo Praga 2019 aveva un valore più alto, pari a 0.277.

Con un valore di 0.295, il primo turno è stato ancora più imprevedibile. D’altro canto, se si mette insieme un numero più ridotto di partite da uno specifico tabellone con la grande varietà di giocatrici che approdano ai primi turni, molti tornei diventano nella fase iniziale un terno al lotto. 9 tornei su 32 avevano infatti un indice di Brier per il primo turno superiore a 0.250, con quattro di questi con un valore più alto — quindi peggiore — rispetto a Palermo.

L’indice di Brier della vergogna

Ho parlato del valore di 0.250 perché è una sorta di indice di Brier della vergogna. Diciamo che si è nella situazione di prevedere l’esito di una serie di lanci di moneta. La scelta più arguta è di assegnare il 50% di probabilità a ogni lancio. Per quanto noioso come esercizio, una previsione più estrema significa poi che, metà delle volte, ci si è sbagliati ancora di più. Se si fissa la previsione al 50% per una serie di eventi casuali che hanno il 50% di probabilità di accadere, l’indice di Brier sarà…esattamente 0.250.

Un altro modo per vederla è questo: se l’indice di Brier è più alto di 0.250, sarebbe stato meglio prevedere che per ciascuna partita il vincitore aveva il 50% di probabilità di vittoria. Ogni altra previsione più elaborata era inutile.

A Palermo, 17 partite su 31 si sono risolte a favore della giocatrice che la mia formula Elo considerava sfavorita. L’indice di Brier si è piazzato dalla parte della vergogna. E anche il suggerimento del precedente articolo, in cui dicevo di fare previsioni, almeno in parte, più moderate, non ha fatto molta strada. Almeno fino a qui, la migliore strategia sarebbe stata di ignorare del tutto l’algoritmo e iniziare a lanciare la moneta.

Moderare la moderazione

Ciò detto, non sono ancora pronto a buttare via le mie valutazioni Elo (che hanno correttamente previsto la vittoria di Simona Halep a Praga, ma si sono poi sbagliate sul torneo di Lexington, vinto da Jennifer Brady invece che da Aryna Sabalenka). 31 partite sono un campione ridotto e decisamente inadeguato a valutare l’accuratezza di un sistema creato per prevedere l’esito di migliaia di partite in ogni stagione.

Come riferito, Elo ha fatto ancora peggio a Praga nel 2019 ma, siccome non era un torneo che arrivava dopo diversi mesi di interruzione del tennis mondiale, non avrei mai pensato di considerarlo più che una svista.

Questa volta, un’intera settimana di sorprese contro pronostico potrebbe essere ben più di una svista. Pensare che giocatrici e giocatori abbiano l’esatto livello di forma mostrato a marzo probabilmente non è una buona idea, anzi potrebbe essere una pessima idea. L’insieme di partite triplicherà a breve per poi espandersi oltre. Ora come ora, non sarà di aiuto nella scelta dei vincitori, ma avremo presto una rappresentazione migliore di quanto davvero è imprevedibile il tennis post COVID-19.

Did Palermo Show the Signs of a Five-Month Pandemic Layoff?

Elo ai tempi del COVID-19

di Jeff Sackmann // TennisAbstract

Pubblicato il 2 agosto 2020 – Traduzione di Edoardo Salvati

Il tennis è ripartito, ma nessuno sa bene cosa attendersi. Sarà l’imprevedibilità il nuovo paradigma? E questo sia su larga scala — gli US Open 2020 verranno martoriati dal virus? — che nelle situazioni individuali, come ad esempio quali giocatori rientreranno più forti o meno in forma di prima? Lascio agli esperti le considerazioni sul primo aspetto e mi concentro sulla stima del livello di gioco che potranno esprimere giocatori e giocatrici.

Per via delle restrizioni imposte in molti paesi, non c’è professionista che non abbia trascorso almeno cinque mesi lontano da un torneo ufficialmente organizzato dalla ATP, WTA e Federazione internazionale. Per alcuni, come chi non ha giocato nelle settimane precedenti alla chiusura totale o chi ha deciso di non giocare immediatamente alla riapertura, saranno passati sette o otto mesi prima di una partita vera. Le esibizioni hanno in parte colmato quel vuoto, ma non per tutti i giocatori. Stare fermi per metà anno senza competizioni ufficiali rappresenta una lunga interruzione. Dal punto di vista di un analista, è difficile prevedere il rendimento di un giocatore in assenza di dati dagli ultimi sei mesi.

Aumento dell’incertezza

Iniziamo dagli aspetti più evidenti. L’assenza prolungata dal circuito significa che si conosce meno dello stato di forma attuale di un giocatore di quanto non lo si facesse prima della chiusura, quando la maggior parte dei professionisti era impegnata ogni settimana o due. A marzo, le mie valutazioni Elo assegnavano a Dominic Thiem il quinto posto, con un punteggio di circa 2050, mentre David Goffin era al quindicesimo, con circa 1900 punti. Sulla base di quei numeri, in uno scontro diretto Thiem avrebbe avuto una probabilità di vittoria del 70%.

Adesso? Entrambi hanno giocato esibizioni, ma possiamo essere certi che il loro livello sia simile a quello che avevano a marzo? O che sono migliorati o peggiorati nella stessa misura? Penso sia ovvio che non possediamo le stesse certezze. Le previsioni dovrebbero quindi riflettere una diminuzione del grado di confidenza, indirizzandosi su una più candida probabilità da lancio della moneta, vale a dire sul 50%. Sei mesi di sospensione a causa del COVID-19 non sono così drastici, non significa cioè che Thiem non è più il favorito contro Goffin, ma che, rispetto al periodo precedente, il pronostico dovrebbe essere più vicino al 50% di probabilità di vittoria. Magari un 60%? 65%? O 69%? Non riesco a rispondere, almeno, non ancora.

Penalizzazione legata all’assenza (per infortunio)

Le mie valutazioni Elo scontano già una penalizzazione legata all’assenza, di cui ho parlato in questo articolo. L’idea è quella per cui se un giocatore resta lontano dal circuito molto a lungo (di solito per infortunio, ma anche per eventualità come una squalifica, una maternità o altre ragioni), al rientro mostra, nella maggior parte dei casi, un livello di gioco peggiore. È difficile però prevedere di quanto, e ogni giocatore ha un percorso diverso di ritorno alla piena forma.

Ho introdotto quindi una modifica alla formula, sulla base di due componenti:

  • una penalizzazione una tantum in funzione della lunghezza dell’assenza (maggiore la durata, più grande la penalizzazione)
  • un aumento temporaneo del valore del fattore k (l’elemento della formula che determina quanto ciascuna partita incida sulla variazione positiva o negativa del livello di gioco di un giocatore), per riflettere l’incertezza iniziale. Dopo un infortunio, il fattore k aumenta di poco di più del 50%, per poi regredire al valore tipico nell’arco delle venti successive partite.

Non è un infortunio

Fermarsi per sei mesi a causa del coronavirus non è equiparabile a un infortunio (almeno, non per quei giocatori che sono comunque riusciti ad allenarsi per aver evitato il COVID-19 o altre problematiche di salute collegate). L’algoritmo di penalizzazione per infortunio non può quindi essere applicato così come è pensato, ma se ne possono trarre due considerazioni:

  • se generiamo previsioni più vicine al 50% di probabilità abbassando la valutazione di alcuni giocatori, la penalizzazione dovrebbe essere inferiore alla penalizzazione per infortunio (normalmente, per un assenza durante la stagione di otto o nove settimane, la penalizzazione minima per infortunio è di 100 punti Elo).
  • l’aumento temporaneo del fattore k è uno strumento utile per gestire l’incertezza che si accompagna allo stato di forma di un giocatore dopo una lunga interruzione.

Il metodo della penalizzazione per assenza funziona perché è supportato dai dati. Siamo in grado di analizzare centinaia di assenze per infortunio (o per altri fattori) nella storia del tennis moderno e capire come hanno reso i giocatori al loro rientro sul circuito. I numeri che utilizzo nella formula per le valutazioni Elo si basano proprio su questo. Purtroppo però non abbiamo la stessa disponibilità per gli ultimi sei mesi, perché quello che è successo non ha precedenti.

Non la pausa di fine stagione, ma…

La situazione che più si avvicina a un blocco di sei mesi nel flusso di dati relativi al tennis è la pausa di fine stagione a dicembre. Per quanto decisamente più breve e non uguale per tutti, presenta alcune dinamiche molto simili: ci sono giocatori che si cimentano in esibizioni, altri che si riposano in spiaggia, alcuni che approfittano per guarire da infortuni, altri ancora che si allenano duramente per migliorarsi, e così via.

Verifichiamo questa teoria: le prime settimane di ogni stagione dovrebbero essere meno pronosticabili della media. Controllo: è falso! Per gli anni dal 2010 al 2019, ho assegnato un’etichetta a ogni partita rispetto a quante partite i due giocatori avevano giocato fino a quel momento della stagione. Se si trattava della prima partita per entrambi, l’etichetta era il numero 1. Se era la quindicesima per uno e la ventunesima per l’altro, il numero era la media, quindi 18. Ho poi calcolato l’indice di Brier — una misura dell’accuratezza delle previsioni — per le previsioni generate da Elo di tutte le partite con un’etichetta. Minore il valore dell’indice, migliore la previsione. Se avessi ragione, dovremmo vedere l’indice di Brier più alto per le prime partite della stagione, seguito da una diminuzione. Non è esattamente così!

IMMAGINE 1 – Indice di Brier per singola partita del circuito maschile nel periodo dal 2010 al 2019

La linea blu irregolare del grafico mostra l’indice di Brier per ogni partita con etichetta (partita 1, partita 2, partita 23, etc), mentre la linea arancione è una media mobile di cinque partite che punta a rappresentare la tendenza complessiva. Non c’è una differenza enorme durante la stagione (ed è confortante), ma la dinamica di inizio stagione è opposta alla mia ipotesi. Magari per le donne il risultato è più in linea con le mie attese?

IMMAGINE 2 – Indice di Brier per singola partita del circuito femminile nel periodo dal 2010 al 2019

Non sono fortunato nemmeno in questo caso. Anche per le donne la variazione partita per partita nell’accuratezza delle previsioni è abbastanza ridotta, e non ci sono segnali di incertezza di inizio stagione.

Ma non mi fermo qui

Anche se la mia stessa teoria non regge l’evidenza dei fatti, mi aspetto comunque di assistere, alla ripresa successiva alla pandemia, a un paio di mesi imprevedibili. I giocatori sono abituati a gestire la normale interruzione di fine stagione e generalmente efficienti nel usare al meglio il tempo libero. E poi sono due mesi e non cinque o sette. Inoltre, molti altri fattori richiederanno adattamento sul circuito — quantomeno per la conclusione del 2020 — come i pochi spettatori (se ce ne saranno), il protocollo di distanziamento e un calendario in continuo aggiustamento. Alcuni giocatori gestiranno la pressione meglio di altri, ma non è detto che tra questi ci siano necessariamente i più forti.

Per il momento quindi le mie valutazioni Elo terranno conto di una piccola penalizzazione, aumentando temporaneamente il fattore k (più vicino al 69% per Thiem contro Goffin, che al 60%). Non ho ancora finito di scrivere il codice completo, principalmente perché devo considerare due diversi tipi di assenze, COVID-19 da una parte e i canonici infortuni dall’altra, ed è più complesso. Per chi è più interessato, farò qualche modifica prima dell’inizio previsto per il Cincinnati Masters

C’è una risposta giusta

Non ci sono dubbi da queste parole che il mio tentativo di sistemare le valutazioni Elo in modo da riflettere l’interruzione dovuta al COVID-19 procede un po’ al buio. Ma non sarà sempre così! Verso la fine dell’anno, conosceremo la risposta, cioè quanta imprevedibilità avrà caratterizzato i risultati delle prime partite al rientro dalla chiusura. Così come sono riuscito a calcolare gli aggiustamenti da apportare per penalizzazioni e fattore k grazie ai dati storici, potrò fare la stessa cosa per i risultati della seconda parte del 2020.

Più precisamente, sarà possibile creare insiemi di risposte giuste, perché una correzione alla formula Elo restituirà il miglior valore dell’indice di Brier, mentre un’altra rappresenterà con più esattezza il divario tra Novak Djokovic e Rafael Nadal, e così via per i vari spunti d’indagine.
L’aggiustamento finale per la formula Elo ai tempi del COVID-19 non vi aiuterà a vincere più soldi scommettendo sul tennis, ma fornirà una maggiore comprensione di come l’interruzione ha inciso sul livello dei giocatori, e su quanto velocemente sono ritornati alla forma di inizio anno. Ne sapremo un po’ di più sul tennis, anche se la speranza assoluta è di non dover mai più fare uso di questa nuova conoscenza.

Elo, Meet COVID-19

Vincere due finali nella stessa edizione è un evento raro

di Peter Wetz // TennisAbstract

Pubblicato il 13 luglio 2020 – Traduzione di Edoardo Salvati

Nel paradosso di un dibattito comunque acceso nel mondo del tennis anche in assenza di risultati da partite ufficiali, ho pensato che fosse una buona opportunità approfittare dell’isolamento forzato per una secca analisi statistica dalla lista degli articoli che voglio ancora scrivere.

Nel giugno 2019, Feliciano Lopez ha dovuto terminare cinque partite in due giorni. Non perché è passato da un torneo all’altro come fece un appena ventiduenne Jo Wilfried Tsonga nel 2007, ma perché è riuscito ad arrivare in fondo sia nel tabellone di singolare che in quello di doppio, sull’erba del Queen’s Club. E ha poi vinto entrambi i titoli.

Le quattro partite di singolare sono andate tutte al terzo set, e Lopez non ha avuto troppo tempo per festeggiare dopo la finale, visto l’immediato successivo impegno nel doppio. La scelta di giocare con un Andy Murray in recupero dal lungo infortunio sembra essere stata azzeccata, visto che il record migliore di Murray negli scontri diretti è di 11-0 proprio contro Lopez. In questo modo, Lopez si è garantito di evitare di incontrare Murray in doppio dall’altra parte del campo. Una strategia inusuale, e probabilmente non la prima considerazione alla base di quella decisione, ma che comunque ha funzionato.

Non ci sono i più i McEnroe di una volta

Vincere due finali nella stessa edizione di un torneo è abbastanza frequente sul circuito Challenger. Non è così per il circuito maggiore, visto anche che i giocatori più forti spesso non prendono nemmeno in considerazione il doppio. Ma quanto è davvero un evento raro? E la tendenza è cambiata nel corso degli anni? Gli appassionati di lungo corso ricordano sicuramente che John McEnroe ha vinto in doppio (77 titoli) praticamente quanto in singolare (78). Un totale più modesto per Roger Federer (6 titoli) e Rafael Nadal (11) impallidisce al confronto, anche se Nadal è un doppista eccezionale (e Federer ha vinto la medaglia d’oro alle Olimpiadi di Pechino 2008 in coppia con Stanislas Wawrinka, n.d.t.).

La tabella riepiloga le vittorie in singolare e in doppio allo stesso torneo dal 2005.

Anno  Torneo           Giocatore     (Compagno)
2005  Dusseldorf       Haas          (Waske)
2005  Halle            Federer       (Allegro)
2005  Basilea          Gonzalez      (Calleri)
2006  Vina del Mar     Acasuso       (Prieto)
2007  Chennai          Malisse       (D. Norman)
2007  Delray Beach     Malisse       (Armando)
2007  Monaco           Kohlschreiber (Youzhny)
2007  Dusseldorf       Calleri       (Chela)
2008  Monte Carlo      Nadal         (Robredo)
2008  Dusseldorf       Soderling     (Lindstedt)
2009  Costa Do Sauipe  Robredo       (Granollers)
2009  San Jose         Stepanek      (Haas)
2009  Newport          Ram           (Kerr)
2010  Memphis          Querrey       (Isner)
2010  Marsiglia        Llodra        (Benneteau)
2010  Bucharest        Chela         (Kubot)
2011  Tokyo            A.Murray      (J. Murray)
2012  Zagabria         Youzhny       (Baghdatis)
2013  Newport          Mahut         (Roger Vasselin)
2014  Newport          Hewitt        (Guccione)
2017  Montpellier      A. Zverev     (M. Zverev)
2018  Gstaad           Berrettini    (Bracciali)
2019  Londra           Lopez         (A. Murray)

Colpiscono due aspetti. Per prima cosa, dal 2011 la doppietta si è verificata poco meno di una volta a stagione. Negli anni precedenti invece, è successo in diversi tornei, tranne che nel 2006. In secondo luogo, l’unico giocatore a vincere entrambi i tabelloni a un torneo Masters è Nadal a Monte Carlo, nel 2008.

È ovvio, e non a caso anche un argomento frequente tra patiti di tennis, che ormai i singolaristi di vertice degnano il doppio di scarsa attenzione, certamente all’opposto di quanto facessero McEnroe e colleghi. Una spiegazione è che il doppio moderno si è evoluto al punto da aver assunto caratteristiche molto diverse dal singolare. E, per riuscire a tenere il passo, i singolaristi dovrebbero modificare le tecniche di allenamento, elemento che potrebbe danneggiare i risultati in singolare. In poche parole, la tesi è che il doppio è diventato per i singolaristi troppo “difficile”.

Guardiamo un po’ di numeri

I grafici che seguono mostrano la composizione dei tabelloni dalla stagione 2000, con la percentuale di giocatori iscritti al singolare e al doppio dello stesso torneo per tre diverse categorie (T = tutti, M = Masters 1000, S = Slam). L’immagine 1 riporta i dati per i primi 50 giocatori di singolare, mentre l’immagine 2 per i primi 10 singolaristi.

IMMAGINE 1 – Giocatori tra i primi 50 di singolare iscritti al singolare e al doppio nello stesso torneo

Dal primo grafico non emergono considerazioni sconvolgenti, ma si confermano abitudini abbastanza consolidate per i primi 50 singolaristi negli ultimi 20 anni, per tutte le categorie di tornei. Dal 2000, a prescindere dalla categoria, tra il 41% e il 47% dei primi 50 del mondo ha giocato sia il singolare che il doppio allo stesso torneo [1].

Una storia diversa

IMMAGINE 2 – Giocatori tra i primi 10 di singolare iscritti al singolare e al doppio nello stesso torneo

I numeri del secondo grafico per i primi 10 singolaristi raccontano una storia completamente diversa. Senza tener conto della categoria, i giocatori tra i primi 10 iscritti anche al doppio sono scesi nel periodo di riferimento dal 35% al 22%. Così si è verificato anche nel caso specifico dei Masters 1000, per quanto è interessante notare che la percentuale è comunque più alta del numero complessivo. La spiegazione più probabile arriva dai premi partita per il doppio negli eventi Masters, il cui ammontare è considerevolmente più alto di quello degli altri tornei del circuito. Spesso poi gli organizzatori hanno disponibilità finanziarie per convincere i più forti a giocare anche al doppio in modo da, ma è solo una mia ipotesi, vendere più biglietti o aumentare gli spettatori anche nei turni iniziali. Esempio tipico è l’Indian Wells Masters, noto per avere ogni anno un doppio costellato di campioni.

È negli Slam però in cui si registra la diminuzione più drastica di partecipazione dei primi 10. Se tra il 2000 e il 2004 almeno un quinto dei giocatori di vertice si impegnava anche nel doppio, negli ultimi cinque anni solo uno su 183 giocatori tra i primi 10 si è iscritto al doppio. Quel giocatore è proprio il mio connazionale Dominic Thiem, che ha giocato il doppio agli US Open 2016 da numero 10 in singolare, in coppia con l’altro austriaco Tristan Samuel Weissborn.

Non ci sono risposte definitive

Come per molte analisi, anche in questa è difficile arrivare a una risposta definitiva. I numeri però aiutano a comprendere la dimensione del fenomeno e teorizzare sulle possibili cause. Che il doppio sia diventato una competizione sempre più specializzata è sicuramente vero. Allo stesso tempo, i numeri suggeriscono che i singolaristi di vertice ricercano il massimo guadagno, quindi si orientano sul singolare, non sul doppio. Se oggi ci fosse in circolazione un giocatore in stile McEnroe (come potrebbe essere Nadal), non riuscirebbe a giocare doppi a sufficienza per arrivare a circa 80 tornei vinti.

Tuttavia, è difficile dire cosa è arrivato prima: il declino dei singolaristi che si dedicano al doppio per ragioni di natura principalmente finanziaria o la consapevolezza che è molto complicato arrivare al livello dei più forti specialisti di doppio?

Rimane una certezza: se TennisTV fosse esistita a quel tempo, avrebbe trasmesso molte più partite di doppio di quanto non faccia ora.

Note:

[1] Esiste la possibilità che alcuni giocatori avrebbero voluto iscriversi anche al tabellone del doppio di un torneo, ma non hanno potuto per diversi motivi tra cui una classifica troppo bassa. Penso però che, ai fini dell’analisi, sia un’occorrenza marginale, se non nulla.

The Rarity of Winning Two Titles at One Tournament

Il valore delle carte nella UTS

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 21 giugno 2020 – Traduzione di Edoardo Salvati

La UTS, o Ultimate Tennis Showdown, è una nuova competizione creata da Patrick Mouratoglou con l’intento di rendere il tennis appassionante anche per i giovanissimi. Al suo debutto nel mese di giugno, è stato da subito chiaro che la principale fonte d’ispirazione sono gli e-sport, vista la presenza di elementi tipici dei videogiochi come le carte UTS.

Si tratta di opportunità a disposizione del singolo giocatore per modificare il valore di alcuni punti, aumentando la possibilità di acquisire un vantaggio strategico. Non sembra però che, almeno finora, i giocatori abbiano imparato a usare le carte nel migliore dei modi. In questa analisi, introduco un metodo per la stima del valore atteso di ciascuna carta UTS, oltre a una classifica sulla base dei risultati ottenuti.

Valore aggiunto atteso

Tra i cambiamenti radicali alle regole tradizionali del tennis, ci sono due delle quattro possibili carte UTS che i giocatori ricevono e che possono usare in qualsiasi quarto (cioè il set di questo formato). Le carte sono assegnate arbitrariamente prima dell’inizio di ogni quarto e allo stesso modo l’algoritmo decide per quanti punti possono essere giocate. Di seguito, ipotizzo una durata di due punti, in linea con la durata che si è verificata più frequentemente nelle partite.

Le quattro carte hanno il potere di cambiare il numero di punti che un giocatore può guadagnare, da un lato associando una ricompensa più alta alla vittoria di determinati scambi, dall’altro modificando il vantaggio di aver vinto il punto. Anche se ogni carta ha regole differenti, è possibile determinarne la resa con valutazione analoga, richiamando il concetto di valore aggiunto atteso (VAA). Il valore atteso è in questo caso definito come i punti attesi che un giocatore guadagnerà alla fine dei due punti in cui viene utilizzata la carta. Il valore aggiunto atteso è dato semplicemente dalla differenza di valore tra lo scenario in cui la carta è giocata e quello in cui non è giocata.

Steal Serve

La prima carta in esame è Steal Serve. Di solito, nella UTS il quarto si gioca come un tiebreak, con l’alternanza di due punti al servizio. Grazie alla carta Steal Serve, un giocatore può servire quattro volte consecutivamente, vale a dire il doppio delle volte rispetto a quando è alla risposta. È quindi la carta a stabilire chi serve e chi riceve. Il VAA si traduce qui nella differenza della vittoria del punto, P(Vittoria), tra quando si è al servizio e quando si è alla risposta:

VAA = 2 * P(Vittoria|Servizio) – 2 * P(Vittoria|Risposta)

Naturalmente, è un valore che oscilla in funzione dalla specifica bravura al servizio e alla risposta dei giocatori. Nel circuito maggiore, in media un giocatore vince il 65% dei punti al servizio. Se si trovano di fronte due giocatori che ben si combinano tra loro, la Steal Serve avrebbe un VAA di +0.60.

-1 Serve

C’è un’altra carta che incide direttamente sul servizio e si chiama -1 Serve, o senza la seconda di servizio. Usando questa carta si costringe l’avversario a giocare senza la protezione aggiuntiva fornita da un’eventuale seconda di servizio. Assegnare un valore a questa carta richiede tenere in considerazione il comportamento dell’avversario. Se adotta una posizione del tutto razionale (e si tratta di un’ipotesi non di poco conto all’interno di un’esibizione), gioca il servizio alla stregua di una seconda. In questo caso, il VAA della carta si riduce alla differenza tra la vittoria del punto alla risposta di fronte a una seconda di servizio e la vittoria del punto nella situazione canonica di due servizi:

VAA = 2 * P(Vittoria|Risposta seconda) – 2 * P(Vittoria|Risposta)

Guardando le statistiche dei punti vinti alla risposta sulla seconda di servizio, possiamo farci un’idea del vantaggio che potrebbe avere il giocatore medio. Sul circuito maggiore, la percentuale è del 48%. Rispetto a un valore medio del 35% di vittoria del punto alla risposta in presenza di due servizi, arriviamo a un VAA di +0.26.

Win In 3 Shots Max

Le altre due carte si distinguono perché non danno indicazione su quale sia il giocatore al servizio o alla risposta, aumentando il livello di complicazione della strategia. Consideriamo per prima la carta Win In 3 Shots Max. Con questa carta, la pressione si sposta sull’avversario, che è costretto a vincere i successivi due punti in non più di tre colpi. Il vantaggio deriva dal quel sottoinsieme di punti che l’avversario vince ma solo dopo uno scambio lungo. Se ipotizziamo che il numero di colpi è di fatto indipendente dal giocatore al servizio, il VAA può essere calcolato come segue:

VAA = 2(1-P(Vittoria|Risposta))* P(termina in > 3 colpi)

Se invece la carta è giocata con l’avversario alla risposta (e quindi chi serve gioca la carta), la formula diventa:

VAA = 2(1-P(Vittoria|Servizio))* P(termina in > 3 colpi)

Nonostante i proclami di alcuni sedicenti esperti di numeri, la maggior parte dei punti nel tennis termina dopo non più di tre colpi. Anzi, quasi il 70% dei punti è così corto. Questo suggerisce un VAA di +0.39 quando è al servizio l’avversario e di +0.21 quando è alla risposta. È un vantaggio in entrambi i casi, ma sarebbe meglio giocare la carta quando l’avversario è al servizio, perché è un modo efficace per annullare parte del vantaggio che ha un giocatore in quella situazione.

Winners Count x 3

Questa forse è la carta più interessante. Si chiama Winners Count x 3, ed è l’unica delle quattro in grado di alterare il valore di un punto nel sistema di punteggio. Il valore però cambia solo quando un giocatore vince il punto con un colpo che è chiaramente un vincente. Se ci poniamo nella stessa assunzione, cioè di una probabilità di chiusura del punto con un vincente che è indipendente da chi è al servizio, allora una ragionevole stima del VAA della carta è data da:

VAA = 2*3*P(Vittoria|Servizio)* P(vincente)

nel caso in cui la carta è usata dal giocatore al servizio. Nel caso in cui invece la carta è usata da chi è alla risposta, il calcolo è:

VAA = 2*3*P(Vittoria|Risposta)* P(vincente)

Negli Slam, i tornei di cui abbiamo più statistiche riguardo ai vincenti, il 30% dei punti termina in modo chiaro con un vincente. Questo suggerisce un VAA in media di +1.17 quando il giocatore è al servizio e di +0.63 quando è alla risposta.

Classifica

Grazie a quesi numeri di riepilogo legati a statistiche medie per giocatori professionisti, siamo in grado di disporre le quattro carte UTS considerate in ordine di importanza in funzione della contesto di gioco.

Carta UTS             Quando?       VAA
Winners Count x 3     Servizio      +1.17
Winners Count x 3     Risposta      +0.63
Steal Serve           Servizio      +0.60
Win in 3 Shots Max    Risposta      +0.39
-1 Serve              Risposta      +0.26
Win in 3 Shots Max    Servizio      +0.21

La carta Winners Count x 3 è quella con il valore maggiore, a prescindere dallo scenario, anche se come l’ha giocata Matteo Berrettini contro David Goffin, quando Berrettini era alla risposta, è stato evidentemente un errore strategico (e Goffin non si è fatto mancare l’occasione di prenderlo un po’ in giro nel collegamento in cuffia).

Al secondo posto per capacità di indirizzare il punteggio in favore del giocatore che ne ha disposizione c’è la carta Steal Serve. Da qui in avanti, la differenza si riduce sensibilmente. Visto che però le carte hanno tutte un valore aggiunto positivo, avrebbe comunque senso per i giocatori usarle sempre nel singolo quarto.

È ragionevole pensare che sono numeri che vanno bene in media per qualsiasi accostamento di giocatori. Per una partita specifica servirebbero invece statistiche relative agli scontri diretti per poter stimare con precisione il valore aggiunto delle carte. Per quanto, anche in presenza di variabilità da partita a partita, sarei sorpresa se la classifica di queste carte cambiasse in modo radicale.

Dovesse la UTS farsi strada tra gli appassionati, sarà materiale interessante per analisi future.

How to Game the UTS Cards

Perdere di proposito: un modello

di Jeff Sackmann // TennisAbstract

Pubblicato il 20 giugno 2020 – Traduzione di Edoardo Salvati

C’è una semplice logica che spinge a giocare deliberatamente senza il massimo impegno o perdere volutamente gli scambi in una o più fasi della partita. Se si è indietro nel punteggio già dall’inizio del primo set, si può pensare di rilassarsi fino alla sua conclusione. Probabilmente sarebbe stato un set perso in ogni caso e aver alzato il piede dall’acceleratore per qualche game può concedere riposo fisico e mentale utile nel proseguo della partita. 

Alla fine di questo articolo, avremo idee più chiare su quanto deve essere preziosa quella riserva addizionale di energia da giustificare una strategia in cui si perdono punti appositamente. Prima di arrivarci però, serve fare qualche altro passaggio. 

Lo scenario

Facciamo degli esempi con numeri concreti. Prendete due giocatori dello stesso livello, ciascuno in grado di vincere il 70% dei punti al servizio. Si può trattare di giocatori con un servizio potente, anche se non mono-dimensionali, e su una superficie ragionevolmente veloce. Vincere sette punti al servizio su dieci significa che nove game al servizio su dieci sono a favore di chi serve. In questa ipotetica partita quindi, i break sono una rarità.   

Ipotizziamo ora che il primo set si apra proprio con uno di quegli sparuti break. Dato che il 90% dei game seguono il servizio, il giocatore avanti nel punteggio ha portato la sua probabilità di vincere il set all’83%. Di base, il giocatore rimasto indietro si trova di fronte a due opzioni per riequilibrare il set:

  • continuare a giocare con il rendimento abituale, nonostante la scarsa probabilità di vincere
  • prendersela comoda, perché il set probabilmente è andato. 

Le strategie

Se il giocatore non molla la presa, chi conduce nel punteggio ha una probabilità dell’83% di vincere il set. Se entrambi mantengono quel livello di gioco per la durata di una partita al meglio dei cinque set, si parla della probabilità del 62% di vincere la partita. Il che si traduce in una probabilità del 38% di vittoria per il giocatore che ha deciso di continuare a giocare (ho preso il caso di una partita al meglio dei cinque set perché ha durata maggiore, dando più probabilità a chi perde il primo set di recuperare. In questo modo la strategia di impegno non massimo ha più senso). 

Per una valutazione del secondo scenario, quello in cui il giocatore rinuncia a tentare di vincere il set, dobbiamo procedere con altre ipotesi. Quanto gioca male un giocatore che sta perdendo di proposito? È probabile che non siate d’accordo con la mia stima di costi e benefici di rinuncia al singolo punto, e non c’è problema. Anche io non ne sono troppo convinto e ha poca importanza per le conclusioni di questo ragionamento. Considerate questi numeri come una delle possibili dimostrazioni del modello. 

Diciamo che, non appena il giocatore indietro nel punteggio decide di rilassarsi, il rendimento diventa il seguente:

  • 20% di punti vinti alla risposta (invece del 30%)
  • 65% di punti vinti al servizio (invece del 70%).

Non è affatto una buona prestazione, pensiamo a un Nick Kyrgios che non ha voglia di stare in campo. Indietro di un break dopo il primo game e con un tennis svogliato, la probabilità del giocatore di recuperare e vincere il set è solo dell’1.3%. Sto semplificando oltremodo, sopratutto perché un giocatore può sempre decidere di tornare a pieno regime nel mezzo del set, magari se arriva a trovarsi sul 15-30 o anche 15-40 con l’avversario al servizio. Si tratta comunque di un modello, e sto cercando di non renderlo troppo complesso.

Il compromesso

Sulla base delle ipotesi precedenti, il giocatore in questione ha di fatto deciso di diminuire la probabilità di vittoria del set dal 17% a poco sopra l’1%. Se preservare energie non dà benefici effettivi e poi entrambi ritornano all’inizio del set successivo a tenere il servizio il 90% delle volte, la probabilità di vittoria della partita del giocatore che si è fermato volutamente è scesa dal 38% al 32%. 

È chiaro però che c’è dell’altro. Un giocatore che volutamente preserva energie anche con conseguenze negative immediate, lo fa nell’idea di ottenere un vantaggio in un secondo momento. Semplificando ulteriormente, ipotizziamo che il giocatore perda il primo set. Queste sono le probabilità di vincere la partita in funzione di alcuni possibili rendimenti di gioco successivi alla fase in cui non ha giocato al massimo: 

  • 70% di punti vinti al servizio (PVS), 30% di punti vinti alla risposta (PVR) — 31.3% (nessun beneficio dal perdere volutamente)
  • 71% PVS, 32% PVR — 46.3%
  • 72% PVS, 34% PVR — 61.9%
  • 73% PVS, 36% PVR — 75.8%
  • 74% PVS, 38% PVR — 93.3%.

Se ci ricordiamo che il giocatore ha solo il 38% di vincere la partita dopo aver subito il break nel game iniziale, il secondo scenario, in cui il livello di gioco sale al 71% di PVS e 32% di PVR, rappresenta un miglioramento. Lo si noterebbe però a malapena su una partita di altri tre o quattro set. Se infatti si andasse avanti per altri 200 punti, vorrebbe dire vincerne 103 anziché 100. Se preservare energie si traduce in più punti ancora, allora si configura come una strategia davvero efficace. 

Complicazioni

Ovviamente, non è mai tutto così facile. Il giocatore in vantaggio potrebbe accorgersi che l’avversario ha rallentato e quindi rallentare a sua volta. Il giocatore che sceglie di alzare il piede potrebbe fare poi molta fatica a riportare il gioco ai livelli usuali (o migliori) a comando. Alcuni punti sono più importanti di altri, quindi la differenza tra 100 e 103 punti potrebbe non contare. La maggior parte delle partite sul circuito sono al meglio dei tre set, e perdere di proposito il primo in un formato più breve è un rischio enorme. 

Non dovremmo però lasciarci condizionare nella ricerca del valore generato da uno sforzo ridotto. Anche se è una pratica molto meno frequente di un tempo, sicuramente ci sono dei vantaggi nel preservare energia. E quell’energia deve avere un valore per il resto della partita, giusto? Proprio non so dire se equivale a un punto su cento o a molto più o molto meno di quello, ma è certamente possibile che, in alcune situazioni, abbia un valore. 

Gli esempi di cui si è discusso mostrano che il valore di quell’energia addizionale non deve essere così sostanziale da rendere l’abbandono volontario di un alto livello di gioco una tattica plausibile. I margini ridotti che spesso determinano l’esito di una partita di tennis raramente lasciano capire quando un giocatore sta traendo vantaggio dal preservare energie. Allo stesso modo, quei margini significano anche che una piccola freccia in più nella faretra può avere un senso. 

Il codice dell’analisi è disponibile qui.

Tanking: A Model