Possibili (e parziali) soluzioni alle Finali di Coppa Davis

di Sébastien Rannaud // TennisAbstract

Pubblicato il 2 dicembre 2019 – Traduzione di Edoardo Salvati

Il nuovo formato delle Finali di Coppa Davis ha generato molte critiche tra appassionati e addetti ai lavori, che hanno manifestato perplessità sull’atmosfera, sul tifo a senso unico per la Spagna, il paese ospitante, sull’orribile sito internet e app telefonica, sulla mancanza di copertura televisiva e sulla programmazione fino a tarda notte.

La controversia maggiore però ha riguardato un aspetto più recondito, cioè il ritiro pre-partita del Canada nel doppio contro gli Stati Uniti, quando ormai il risultato della sfida era acquisito. Come mai? Gli organizzatori hanno concesso agli Stati Uniti una vittoria per 6-0 6-0, migliorandone le percentuali di classifica nel Gruppo F e andando quindi a incrementare le probabilità di qualifica per la fase a eliminazione diretta come una delle due migliori seconde classificate nei gironi all’italiana.

Per determinare la graduatoria tra finaliste dei gironi, sono stati utilizzati i seguenti criteri:

  • più alta percentuale di partite vinte
  • più alta percentuale di set vinti
  • più alta percentuale di game vinti
  • la posizione nella classifica della Davis Cup al lunedì della settimana delle Finali.

Con il doppio 6-0 gli Stati Uniti hanno evidentemente beneficiato in relazione ai primi tre criteri. Altri tornei che usano questa logica, come le Finali di stagione ATP e WTA, non prevedono i ritiri pre-partita, grazie alla presenza del giocatore sostitutivo in caso di infortuni. Le Finali di Coppa Davis sono un mondo a parte, fondamentalmente per via del doppio ininfluente negli scontri del girone all’italiana. Non ci sono incentivi sportivi o finanziari a giocare e vincere quella partita nel caso di avvenuta qualificazione ai quarti di finale, come appunto accaduto al Canada prima del doppio contro gli Stati Uniti.

Strane coercizioni

Un formato così contorto è dovuto a due aspetti principali. In primo luogo, partecipano alle Finali di Coppa Davis 18 nazioni. Perché un numero così causale quando la fase eliminatoria riguarda solo 8 nazioni? L’unica possibile soluzione è assegnare wild card alle squadre finaliste per completare il tabellone, da cui la complicata procedura di spareggio. Il secondo aspetto è la durata del torneo di sette giorni. Gli organizzatori (il Kosmos Group e la Federazione internazionale) preferirebbero un periodo più lungo di due settimane ma, almeno per il momento, sette giorni è il massimo che sono riusciti a ottenere, considerando anche la posizione non proprio ideale in calendario.

Se servono tre turni nella fase a eliminazione diretta (i quarti, le semifinali e la finale), il tempo a disposizione per il girone all’italiana è risicato, e questo spiega i gruppi ridotti a tre squadre che giocano solo due scontri. Così poche partite comportano inevitabilmente l’attivazione delle regole di spareggio, rendendo ogni partita, tra cui tutti i doppi, molto importante. È per questo che quando una squadra decide di non giocare il doppio, devono esserci regole che impediscono alla nazione che ne trae beneficio un vantaggio eccessivo sulle seconde classificate degli altri gruppi.

Alle numerose critiche sollevate su più fronti riguardo a questa rilevante imperfezione del formato, sono seguite poche proposte di soluzione. Analizziamo alcuni possibili correttivi verificando se trovano efficace applicazione nei limiti imposti dal torneo.

Un primo insieme di interventi: modifiche al doppio ininfluente

Ipotizziamo che sia concesso dagli organizzatori di saltare tutti i doppi che non hanno più rilevanza. In alcuni casi, tifosi e spettatori comprerebbero biglietti solo per due partite, non più tre. I prezzi dovrebbero quindi essere in qualche modo rivisti per riflettere questa possibilità, così da mostrare equità e rispetto nei confronti di chi si reca a vedere le partite allo stadio.

Scenario A:

  • Il formato è identico (18 squadre, tre turni a eliminazione diretta)
  • Regola per il doppio ininfluente: ritiro pre-partita della squadra che si è già qualificata. La squadra che vince prende 1 punto, ma la partita non conta in termini di percentuale di partite vinte, di percentuale di set vinti e di percentuale di game vinti.

La squadra che ha perso le due partite di singolare non ha la possibilità di giocare il doppio e recuperare le scarse percentuali derivanti dalle sconfitte, mentre la squadra che si è qualificata viene premiata conservando percentuali quasi perfette. È un sistema che si basa sui risultati conseguiti, quindi lascia poco margine di lamentela sulla non correttezza per la squadra perdente, specialmente se si considera che ha poi più tempo per risposare e prepararsi alla sfida decisiva del giorno dopo contro l’altro paese dello stesso gruppo.

Scenario B:

  • Il formato è identico (18 squadre, tre turni a eliminazione diretta)
  • Regola per il doppio ininfluente: ritiro pre-partita della squadra che si è già qualificata. La squadra che vince prende 1 punto ma con il punteggio di 6-4, 4-6, 6-4 valido ai fini della percentuale di partite vinte, della percentuale di set vinti e della percentuale di game vinti.

Prendiamo il caso delle due partite di singolare perse senza vincere un set. La squadra che beneficia dal ritiro passa dallo 0% di set vinti al 29%. Sembra più ragionevole e meno estremo di un punteggio a tavolino di 6-0 6-0.

Scenario C:

  • Il formato è identico (18 squadre, tre turni a eliminazione diretta)
  • Regola per il doppio ininfluente: il doppio deve essere giocato. I due vincitori riceveranno un premio partita aggiuntivo (100.000 dollari)

Si può ragionevolmente supporre che la squadra che si è già qualificata manderà in campo per il doppio i giocatori di “rincalzo”, che hanno un incentivo finanziario notevole per cercare di strappare una vittoria, anche alle 4 della mattina, visto che cifre così ragguardevoli sono rare per i tornei di doppio. Con pochi doppi irrilevanti a ogni edizione delle Finali di Coppa Davis, non sarebbe uno sforzo troppo oneroso per gli organizzatori.

Più soluzioni: 16 squadre

Scenario D:

  • Girone all’italiana: 16 squadre divise in quattro gruppi, con tre scontri a squadra
  • 8 squadre si qualificano per la fase a eliminazione diretta di tre turni (quarti, semifinali, finale)
  • Regola per il doppio ininfluente: la squadra che vince prende 1 punto, ma la partita non conta in termini di percentuale di partite vinte, di percentuale di set vinti e di percentuale di game vinti.

Con tre scontri nel girone all’italiana, è probabile che il doppio ininfluente arriverà solo nel terzo e ultimo scontro, quando cioè si saranno già giocate tra le sei e le otto partite (tra singolari e doppi). Il peso di una partita ininfluente non sarebbe maggiore di un settimo (il 14.2%) del totale delle partite giocate durante il girone all’italiana, ed è meno rilevante di quanto accada con l’attuale formato, in cui la partita che non si gioca ha un peso di un sesto (il 16.7%). Inoltre, con gruppi di quattro paesi, tutte le squadre potrebbero sfidarsi in contemporanea, in modo che alcune inizierebbero la partita di doppio senza la certezza di essersi qualificate per i quarti di finale.

Sfortunatamente, non c’è possibilità che questo scenario si verifichi all’interno dei sette giorni dedicati al torneo, perché vorrebbe dire che entrambi i finalisti giocherebbero sei sfide in sette giorni, o dalle 12 alle 18 partite. Non è un ritmo sostenibile, specialmente per paesi come il Canada e la Russia, che quest’anno di fatto hanno schierato solo due giocatori chiave. E non avrà il consenso di élite come Rafael Nadal e Novak Djokovic, che potrebbero arrivare dalle Finali di stagione terminate la settimana precedente avendo giocato fino a cinque partite.

Scenario E:

  • Girone all’italiana: 16 squadre divise in quattro gruppi, con tre sfide a squadra
  • 4 squadre si qualificano per la fase a eliminazione diretta di due turni (semifinali e finale)
  • Regola per il doppio ininfluente: la squadra che vince prende 1 punto, ma la partita non conta in termini di percentuale di partite vinte, di percentuale di set vinti e di percentuale di game vinti.

Riducendo la fase a eliminazione diretta, si torna a un numero più abbordabile di cinque sfide in sette giorni. Il vantaggio sta nel fatto che il doppio ininfluente avrebbe ancora meno importanza dello Scenario D, perché si qualificano alla fase a eliminazione diretta solo le vincitrici dei rispettivi gruppi. L’attuale procedura di spareggio non avrebbe applicazione, perché probabilmente la vincitrice del gruppo si qualificherebbe già per numero di sfide vinte e di partite vinte.

Compromessi

In ogni caso, sistemando una problematica se ne solleva un’altra.
In primo luogo, la fase a eliminazione diretta ha più presa sui tifosi delle partite del girone all’italiana. Ci sono volte in cui l’ultima sfida ha le caratteristiche di una partita a eliminazione diretta ma, in media, c’è meno pathos. Questo conduce alla seconda problematica: le squadre al terzo o quarto posto prima della sfida finale del girone all’italiana potrebbero essere già matematicamente fuori dalla qualificazione. Ci si potrebbe trovare anche con un’ultima sfida totalmente irrilevante tra la terza e la quarta, un’ipotesi che si spera non debba mai verificarsi.

Anche se il doppio ininfluente sarebbe improbabile, il rischio potenziale è enorme. Si fatica a pensare alla tristezza di una partita a orario notturno, specialmente in uno stadio neutro per entrambe le squadre e con sparuti tifosi presenti. Kosmos Group e la Federazione internazionale si aspetterebbero di contare sulla professionalità di entrambe le squadre, almeno nei confronti delle poche centinaia di tifosi che sono comunque andati a vedere la partita. Ma anche uno scambio da 84 colpi non riuscirebbe a risollevare le sorti di uno spettacolo deprimente.

Incentivi

L’unica soluzione arriverebbe da un incentivo alle squadre coinvolte nei doppi irrilevanti. In un torneo a 16 squadre, potrebbe ad esempio essere la qualificazione automatica per la finalista alle Finali di Coppa Davis dell’anno successivo (oltre alle quattro vincitrici dei gruppi). Le squadre in lotta per il terzo posto avrebbero il vantaggio di giocare in casa nella sfida di qualificazione di marzo. Le ultime del gruppo avrebbero la trasferta in marzo o verrebbero declassate in una fascia inferiore nelle zone di suddivisione della Coppa Davis. Se c’è una posta in palio, i doppi ininfluenti riuscirebbero a mantenere almeno un po’ di interesse.

Per Kosmos Group e per la Federazione internazionale, ridurre le partecipanti da 18 a 16 sarebbe molto più complicato che modificare le regole di spareggio. Con tutti i problemi riscontrati nella prima edizione, la regola per il doppio ininfluente non è quasi sicuramente in cima alla lista delle priorità. Però, di fronte all’inazione, squadre come il Canada o l’Australia sfrutterebbero la scappatoia e, prima o poi, una squadra avanzerà ai quarti di finale in virtù di un 6-0 6-0 nel doppio ininfluente, generando una reazione mediatica da incubo per gli organizzatori, oltre a infliggere una punizione dura da sopportare per la squadra che subisce la decisione.

Lo sport è avvincente solo se i tifosi percepiscono imparzialità, quantomeno a un livello minimo. Le Finali di Coppa Davis hanno evitato il disastro quest’anno, lasciando però che il formato fosse messo in discussione dagli appassionati più solleciti. La speranza è che, nei prossimi 12 mesi, venga trovata una soluzione.

How to (Partly) Fix the Davis Cup Finals

Un’analisi preliminare del rovescio lungolinea

di Jeff Sackmann // TennisAbstract

Pubblicato il 13 dicembre 2019 – Traduzione di Edoardo Salvati

Eseguito nei modi e nei tempi giusti, il rovescio lungolinea è uno dei colpi più devastanti nel tennis. Che valore possiede e quali sono i giocatori che ne ottengono il massimo rendimento? Sono domande sorprendentemente complicate, per cui non possiedo ancora risposte affidabili. Determinare però la frequenza con cui un giocatore ricorre al rovescio lungolinea e ottiene il punto con quel colpo è già di per sé affascinante.

Il Match Charting Project offre molti dati per analizzare simili tattiche, poiché raccoglie informazioni sulla tipologia e sulla direzione di ciascun colpo. In uno scambio tra destrimani, un rovescio lungolinea è di semplice identificazione: un rovescio dal lato del rovescio verso il lato del dritto dell’avversario. Solo per il decennio in corso, il Match Charting Project ha individuato quasi 100.000 rovesci lungolinea, distribuiti più o meno equamente tra partite maschili e femminili.

Riusciamo però anche farci un’idea più generale identificando le opportunità di colpire un rovescio lungolinea, cioè quelle in cui un giocatore potrebbe scegliere di cercare un’altra direzione o usare un colpo totalmente differente. Un giocatore che colpisce spesso con il taglio o gira intorno al rovescio per colpire di dritto, può magari dedicare moltissimi dei suoi rovesci al lungolinea, ma quei rovesci lungolinea non rappresenteranno una grossa proporzione delle opportunità complessive dal quel lato di campo.

Le opportunità di colpire un rovescio lungolinea

Iniziamo proprio da quelle opportunità. La tabella mostra tre frequenze per i due circuiti, relativamente alle partite di cui abbiamo dati punto per punto dal 2010 a oggi. La prima frequenza è la percentuale di opportunità sul lato del rovescio che sono effettivamente diventate rovesci (per lo scopo di quest’analisi, non considero i rovesci tagliati, che possono essere difficili da gestire ma sono tutt’altro colpo. Ho escluso anche le risposte al servizio, perché possiedono complicazioni specifiche). La seconda frequenza è la percentuale di opportunità che sono diventate rovesci lungolinea, e la terza è la combinazione delle prime due, vale a dire la percentuale di rovesci dal lato del rovescio che sono diventati lungolinea.

Circuito  Rov./Opp   Rov. LL/Opp   Rov. LL/Tutti Rov  
ATP       63.7%      11.1%         17.4%  
WTA       73.6%      12.8%         17.4% 

È molto più probabile che le donne colpiscano un rovescio non tagliato dal lato del rovescio di quanto facciano gli uomini, e ci sono due ragioni per questo. La prima è che gli uomini, in media, colpiscono più rovesci tagliati, principalmente per via di alcuni giocatori che colpiscono molti rovesci tagliati, alzando appunto la media. La seconda è che più probabilmente gli uomini gireranno intorno al rovescio per tirare un dritto da quel lato. Siccome gli uomini colpiscono meno rovesci in assoluto, colpiscono anche meno rovesci lungolinea come porzione del totale di colpi da quel lato. Però, se decidono di colpire di rovescio, uomini e donne vanno per il lungolinea con la medesima frequenza, il 17.4%, all’incirca un rovescio su sei.

L’esito dei rovesci lungolinea

Vediamo l’esito di quei rovesci lungolinea. La tabella riporta numeri aggregati relativi all’ATP e alla WTA e mostra la percentuale di lungolinea che si trasformano in vincenti (tra cui colpi che forzano un errore dell’avversario/a), la percentuale degli errori non forzati e la percentuale che porta al motivo ultimo dello scambio, cioè vincere il punto.

Sia gli uomini che le donne hanno un rapporto “positivo” tra vincenti ed errori non forzati. Le donne però ottengono più vincenti e commetto più errori (e vedremo, al riguardo, che sono numeri incredibilmente aggressivi). Inoltre, sia uomini che donne terminano in media il punto più frequentemente con rovesci lungolinea rispetto ad altri colpi, sia considerando tutti i colpi che tutti i rovesci. In media, con il rovescio non tagliato, considerato da ogni posizione e per tutte le direzioni, si ottiene approssimativamente un 10% di vincenti e un 10% di errori non forzati.

La percentuale di punti vinti non appare enorme, il 51.6% per gli uomini e il 52.4% per le donne. Sono però cifre che ribaltano la tipica aspettativa che si ha al rovescio. I rovesci si verificano più spesso da posizioni difensive, quindi è leggermente più probabile che appartengano a punti persi che a punti vinti. Per questo i corrispondenti numeri per i rovesci sono tutti al di sotto del 50%.

Questo è un ottimo esempio della difficoltà associata all’analisi di un colpo: i rovesci lungolinea determinano più punti vinti perché parte di una tattica migliore, o perché vengono colpiti più spesso di fronte a colpi deboli dell’avversario? Probabilmente è una combinazione di entrambi gli aspetti, ma con prevalenza dell’ultimo.

Una breve parentesi sui mancini

Prima di vedere i risultati per alcuni giocatori, voglio illustrare un interessante confronto tra mancini e destrimani. Più di una volta ho sostenuto che i mancini devono imparare a giocare “al contrario”, perché i loro avversari sono in maggioranza destrimani. Mentre due destrimani possono scambiarsi cannonate di dritto incrociato, un mancino raramente ha la stessa possibilità. Di conseguenza, i mancini si allenano più a lungo su colpi inusuali, come colpi a rimbalzo a uscire e i rovesci lungolinea. Almeno, questa è la mia teoria.

Nemmeno a dirsi, i mancini colpiscono molti più rovesci lungolinea dei colleghi destrimani, i quali vanno lungolinea nel 16.9% dei rovesci dal lato del rovescio, rispetto al 21.4% dei mancini. Rafael Nadal è buona parte della spiegazione, visto che sono sue molte delle partite con dati punto per punto e che va di rovescio lungolinea il 24.4% delle volte, più di quasi tutti gli altri giocatori (un altro mancino, Martin Klizan, è uno dei pochi con numeri più estremi, il 25.2%). Rimane comunque una differenza di diversi punti percentuali anche non considerando Nadal.

Non è però una legge fisica universale. Le donne mostrano, in aggregato, una tendenza opposta. Le destrimane usano il rovescio lungolinea il 17.6% delle volte, mentre le mancine il 15.8%. Ci sono alcune giocatrici dello stampo di Nadal e Klizan, come Lucie Safarova (26.3%) ed Ekaterina Makarova (26.1%). In generale, sono le più aggressive, a prescindere dalla mano, a utilizzare più spesso il rovescio lungolinea. Jelena Ostapenko arriva al 27% e Dayana Yastremska costringe a estendere l’asse delle ordinate, con una frequenza del 33%.

Il compromesso del rovescio lungolinea

Ho parlato della grande difficoltà di valutare le tattiche di gioco in termini di selezione dei colpi. La misura più importante di qualsiasi strategia è data dalla vittoria di più punti. Se giocare più lungolinea non fa aumentare la frequenza di punti vinti, perché un giocatore o una giocatrice dovrebbero fare quella scelta? Se però più lungolinea si traducono in più punti vinti, allora vale la pena pensare di giocarne di più, che significa andare alla ricerca di opportunità da posizioni più complicate, cioè in sostanza vincere punti con una frequenza leggermente inferiore. Portando il ragionamento all’estremo, una tattica migliore non porterà a più punti vinti di quella meno efficace di cui prende il posto.

Se si pensa inoltre all’ovvia considerazione che ogni giocatore ha caratteristiche e preferenze diverse da quelle degli altri, si ottiene che non esiste una forte relazione tra la frequenza di rovesci lungolinea e la loro efficacia, intesa come punti vinti, quando vengono colpiti.

Non correlazioni

Esiste una leggerissima correlazione negativa (per uomini e donne) tra la frequenza con cui un giocatore colpisce rovesci lungolinea e il numero di rovesci lungolinea vincenti, a suggerire che ci sono poche opportunità per andare a colpo sicuro su un vincente. Per le donne, non c’è però relazione tra la frequenza di rovesci lungolinea e la frequenza di punti vinti. C’è invece un’eccezione, per quanto minore, in questo lungo elenco di elementi tra loro senza relazione. Per gli uomini, si assiste a una debole correlazione negativa (r^2 = 0.13) tra la frequenza di rovesci lungolinea e la frequenza di punti vinti.

È un risultato in linea con l’intuizione descritta in precedenza, cioè che se un giocatore ricerca quella tattica più spesso, otterrà esiti peggiori, non perché gioca effettivamente male, ma perché la sceglie in situazioni più rischiose. Il giocatore che ricorre al rovescio lungolinea il 10% delle volte ha una posizione conservativa, chi lo fa nel 25% dei casi si trova in qualche circostanza con un colpo dalla percentuale realizzativa davvero risicata.

Il rovescio lungolinea di specifici giocatori

Potremmo quindi concludere, seppur con estrema cautela, che un giocatore che vince un’alta percentuale di punti con il rovescio lungolinea dovrebbe usarlo più spesso. La tabella mostra 25 dei giocatori più in vista, ordinati per la frequenza con cui colpiscono un rovescio lungolinea.

Giocatore      Rov. LL/Rov.  Vinc%   ENF%    Pti Vinti%  
Nadal          24.5%         12.1%   11.1%   54.7%  
Isner          22.0%         23.2%   27.3%   38.2%  
Djokovic       21.2%         16.7%   16.1%   54.2%  
Tsonga         21.0%         20.6%   27.7%   45.8%  
Shapovalov     20.5%         20.1%   23.5%   49.1%  
Wawrinka       19.1%         28.8%   26.8%   51.4%  
Nishikori      18.8%         27.7%   19.1%   56.7%  
Thiem          18.4%         28.5%   28.2%   51.6%  
Fognini        18.3%         20.4%   23.8%   49.3%  
Goffin         18.2%         23.5%   23.8%   49.5%  
Federer        18.2%         25.5%   21.0%   53.2%  
Dimitrov       17.7%         27.4%   23.6%   50.5%  
Kyrgios        17.7%         19.5%   23.5%   44.4%  
Murray         16.8%         21.7%   16.5%   54.2%  
Gasquet        16.6%         33.5%   23.1%   55.2%  
Del Potro      15.5%         24.6%   15.7%   52.2%  
A. Zverev      15.3%         32.5%   19.0%   56.1%  
Monfils        14.3%         25.9%   17.6%   54.7%  
Medvedev       14.3%         17.0%   16.9%   49.6%  
Ferrer         14.2%         16.9%   18.1%   48.0%  
Tsitsipas      14.1%         24.3%   22.9%   49.3%  
Coric          13.6%         29.3%   24.1%   55.4%  
Anderson       13.3%         25.3%   24.9%   45.9%  
Bautista Agut  10.4%         17.3%   20.2%   46.3%  
Schwartzman    10.3%         32.5%   22.3%   55.7%

Se non altro, questi numeri evidenziano che ci sono molteplici modi per vincere una partita. Nadal colpisce molti rovesci lungolinea, ma raramente comportano la fine del punto. Poco più giù nella lista, troviamo giocatori che concludono il punto con un rovescio lungolinea più del doppio delle volte. Nella parte bassa è pieno di giocatori che non vincono molti punti con il rovescio lungolinea ma tra cui troviamo Diego Schwartzman e Borna Coric, due che sono estremamente efficaci nelle rare occasioni in cui cercano questo colpo più difficile.

Il rovescio lungolinea di specifiche giocatrici

Non troviamo una correlazione simile per le donne a livello di circuito, che non significa che le strategie di tutte le giocatrici siano ottimali. La tabella mostra le stesse statistiche per 25 delle giocatrici più in vista.

Giocatrice      Rov. LL/Rov.  Vinc%   ENF%    Pti Vinti%  
Yastremska      33.7%         27.4%   24.7%   54.8%  
Ostapenko       27.1%         35.0%   33.6%   51.0%  
S. Williams     25.2%         28.3%   19.6%   57.4%  
Bencic          21.6%         28.1%   14.6%   59.1%  
Sabalenka       21.2%         38.7%   25.5%   57.1%  
Keys            20.4%         27.7%   39.9%   46.7%  
Halep           20.1%         25.3%   21.7%   55.8%  
V. Williams     19.2%         26.1%   19.7%   49.7%  
Andreescu       19.2%         22.6%   17.9%   59.7%  
Azarenka        19.1%         25.9%   16.2%   57.3%  
Kar. Pliskova   18.9%         26.6%   23.1%   51.6%  
Muguruza        18.1%         28.2%   18.9%   57.5%  
Sharapova       18.0%         27.1%   21.4%   53.2%  
Osaka           17.9%         28.2%   27.7%   48.6%  
Konta           16.1%         33.4%   29.9%   53.6%  
Kvitova         15.8%         30.9%   24.0%   54.0%  
Wozniacki       15.6%         25.5%   15.9%   56.8%  
Stephens        15.1%         25.9%   26.4%   53.2%  
Bertens         14.7%         21.6%   21.7%   49.0%  
Niculescu       13.2%         29.7%   14.7%   62.9%  
Kerber          13.2%         26.7%   18.5%   56.2%  
Barty           13.1%         26.9%   29.0%   50.6%  
Vondrousova     11.5%         29.8%   18.5%   52.3%  
Suarez Navarro  10.9%         33.1%   25.8%   55.9%  
Svitolina       10.2%         27.6%   20.5%   53.9%

Un esempio eclatante è quello di Belinda Bencic, che colpisce più rovesci lungolinea di quasi tutte le giocatrici dell’elenco ed è una delle più efficaci nel vincere il punto in quel modo. Facile lasciarsi sedurre dall’ipotesi che, nell’applicare questa tattica, stia sprecando qualche opportunità. All’estremo opposto Ostapenko e Madison Keys sono decisamente aggressive, commettendo tanti errori quasi quanti sono i vincenti e, nel caso di Keys, vincendo molto meno della metà di quei punti.

Si tratta solo di un’analisi preliminare del rovescio lungolinea. Valutare una strategia è difficile, quantificare gli effetti di un singolo colpo all’interno della strategia è ancora più complesso. E lo si può fare solo partendo dalla definizione di alcuni concetti di base, dalla scelta di statistiche utili e dal cercare i primi indizi di una correlazione che potrebbe esistere (o che probabilmente non esiste). Il percorso è molto lungo, ma abbiamo fatto un piccolo passo in avanti.

A First Look at the Down-the-Line Backhand

Un’introduzione all’uso di Elo nel tennis

di Jeff Sackmann // TennisAbstract

Pubblicato il 3 dicembre 2019 – Traduzione di Edoardo Salvati

Elo è il nome di un sistema di valutazioni di giocatori e giocatrici di tennis di qualità superiore rispetto alle formule che determinano le classifiche ufficiali per il circuito maschile e femminile. Da lettori seriali del mio blog o ascoltatori del podcast, ne sarete sicuramente venuti a conoscenza. A meno però di esservi ritrovati a contatto diretto con le valutazioni Elo in precedenza o di aver approfondito personalmente li tema, potreste pensare che sia una sorta di concetto che pertiene la sfera mitologica del tennis. Vale la pena dedicare del tempo a una comprensione più dettagliata del suo funzionamento.

L’algoritmo di base

Il principio sottostante qualsiasi sistema Elo è quello per cui la valutazione di un giocatore è una stima della sua bravura, che è possibile aggiornare dopo ogni partita (o torneo). Se un giocatore vince, la sua valutazione aumenta. Se perde, diminuisce. Dove Elo eccelle, è nel determinare l’ammontare secondo cui la valutazione dovrebbe salire o scendere.

Due sono le variabili principali considerate: quante partite sono già presenti nel sistema (vale a dire, quanta sicurezza abbiamo nella valutazione prima della partita) e la qualità dell’avversario. Riflettendoci bene, queste due variabili sono una buona approssimazione dell’idea che ci siamo già fatti della bravura di un giocatore. Più informazioni possediamo di un giocatore, più difficilmente cambieremo l’opinione che ne abbiamo sulla base di una sola partita.

La sconfitta di Novak Djokovic contro Dominic Thiem nel girone delle Finali di stagione è stata una sorpresa, ma solo il tifoso più apocalittico ha interpretato il risultato come un disastro che avrebbe dovuto modificare la stima della bravura di Djokovic. In modo analogo aggiustiamo l’opinione di un giocatore rispetto alla qualità dell’avversario. Una sconfitta contro Thiem genera delusione, ma una contro Marco Cecchinato, come nei quarti di finale del Roland Garros 2018, è più preoccupante. Il sistema Elo incorpora questo tipo di intuizioni istintive.

L’ampiezza delle valutazioni Elo

Tradizionalmente, all’ingresso nel sistema Elo e prima di accumulare risultati, un giocatore riceve una valutazione di 1500. È un numero completamente arbitrario. Tutto quello che conta è la differenza tra le valutazioni dei giocatori: se assegnassimo di partenza 0, 100 o 888, il risultato finale di quella differenza rimarrebbe il medesimo.

Quando ho iniziato a calcolare le valutazioni Elo, ho mantenuto la tradizione di partire da 1500. Negli anni, ho allargato l’orizzonte ai Challenger (e agli equivalenti tornei nel circuito femminile organizzati dalla Federazione internazionale) e alle qualificazioni del circuito maggiore. In assenza di un correttivo, la scala dell’intero sistema sarebbe stata alterata, generando inevitabile confusione. Quindi, ho sostituito il valore di 1500 con un numero poco superiore a 1200 (in funzione della categoria del torneo e della distinzione tra uomini e donne), così da ottenere una valutazione sostanzialmente identica.

Attualmente, il numero uno e la numero uno del mondo sono Rafael Nadal e Ashleigh Barty, con una valutazione Elo di 2203 per Nadal e 2123 per Barty. Questo è l’intervallo in cui stazionano i migliori, e i fenomeni assoluti spesso si avvicinano a 2500. Secondo la più recente versione del mio algoritmo, il picco di Djokovic è stato di 2470 e quello di Serena Williams di 2473. La quota di 2000 separa con buona precisione le élite dagli altri giocatori. Al momento, sei uomini e sette donne hanno valutazioni così alte. Sedici uomini e diciotto donne hanno valutazioni di almeno 1900. Una valutazione di 1800 equivale grossomodo a un posto tra i primi 50.

Confronto tra epoche e inflazione Elo

Se si riesce ad assegnare un valore Elo massimo a ogni giocatore, viene automatico iniziare a fare confronti tra epoche. Seppur un passatempo divertente, sono convinto che nessun sistema di valutazione dei giocatori di tennis abbia una qualche utilità ai fini di un raffronto tra epoche diverse, neanche Elo. Quello che può fare però è mettere a confronto la bravura di un giocatore rispetto ai suoi avversari.

Nel 1990, Helena Sukova raggiunse un valore di 2123, lo stesso posseduto ora da Barty. Non significa che Sukova era forte al tempo quanto lo è Barty adesso. Significa invece che hanno avuto un rendimento simile contro le rispettive avversarie. Le giocatrici di seconda fascia trent’anni fa erano considerevolmente più deboli, quindi in un certo senso era più facile raggiungere valutazioni molto elevate. Sukova occupava l’undicesima posizione Elo, molto lontana dal 2600 di Steffi Graf.

Questo per dire che Elo non permette un confronto tra epoche a meno di non essere certi che il livello della competizione sia analogo, o a meno di non avere altre idee per gestire quella variabile, un campo minato che ha respinto molti tra coloro che hanno approfondito il tema.

Inflazione e deflazione

Una problematica correlata è il concetto di inflazione o deflazione Elo, che può rendere ancora più complicati confronti tra epoche. Ogni volta che si gioca una partita, vincitore e sconfitto di fatto si “scambiano” alcuni dei loro punti, in modo da lasciare il numero totale dei punti nel sistema inalterato. Quando però un nuovo giocatore fa il suo ingresso, il totale dei punti aumenta. Al ritiro invece, il totale diminuisce.

Sarebbe più facile se addizioni e sottrazioni di punti si equivalessero, in modo da annullarsi, ma per molte competizioni che usano Elo questo non accade. Le addizioni tendono a essere maggiori delle sottrazioni, facendo crescere le valutazioni Elo nel corso del tempo. Non sembra che questo si verifichi con le mie valutazioni, almeno in parte perché ho previsto una penalizzazione per gli infortuni che tengono lontano dal gioco, ma è utile per ricordare che il numero di punti del sistema non è statico, e per ragioni non legate alla bravura dei giocatori di vertice.

Previsioni Elo

Iniziano a essere più chiare le caratteristiche di utilizzo di Elo come sistema che fornisce la valutazione di un giocatore rispetto a quella degli altri. Uno dei principali scopi di qualsiasi sistema di valutazione è la previsione del risultato delle partite, e in questo Elo riesce meglio della maggior parte dei suoi avversari, tra cui anche le classifiche ufficiali dell’ATP e della WTA. L’unico parametro necessario per fare una previsione è la differenza tra la valutazione dei due giocatori, da inserire poi nella seguente formula:

1 – (1 / (1 + (10^((differenza) / 400))))

Se volessimo prevedere una rivincita dell’ultima partita delle Finali di Coppa Davis, dovremmo prendere le valutazioni di Nadal e Denis Shapovalov (2203 e 1947), calcolare la differenza (256) e applicare la formula, ottenendo una probabilità di vittoria per Nadal dell’81.4%. Con la differenza negativa (-256) avremmo ottenuto la speculare probabilità di un risultato a sorpresa per Shapovalov del 18.6%.

La mia versione Elo nel tennis si basa sul formato più classico delle partite, cioè quello al meglio dei tre set. Per le partite al meglio dei cinque set il calcolo si complica, ma per chi fosse interessato ho scritto del codice. Il punto è che occorre un aggiustamento. Dovessero Nadal e Shapovalov giocare contro agli Australian Open 2020, la probabilità di vittoria di Nadal salirebbe all’86.7%.

Elo specifico per superficie

Per la maggior parte degli sport, ci si potrebbe fermare qui. Una partita è una partita, con poche altre variazioni marginali. Nel tennis però, valutazioni e previsioni dovrebbero variare sensibilmente in funzione della superficie.

Ammetto che la mia soluzione è un po’ complicata. Per ogni giocatore, ci sono quattro diverse valutazioni Elo: complessiva, specifica per il cemento (ma senza distinzioni tra campi all’aperto e al chiuso), specifica per la terra battuta e specifica per l’erba. Ad esempio, Thiem ha una valutazione complessiva di 2066, di 1942 sul cemento, di 2031 sulla terra e di 1602 sull’erba (la specificità di superficie in genere abbassa le valutazioni: quella di Thiem sulla terra è al terzo posto del circuito e lo pone un abisso davanti a tutti gli altri giocatori a eccezione di Nadal e Djokovic).

Queste valutazioni specifiche per superficie permettono un confronto tra giocatori ignorando i risultati su tutte le altre superfici. Non è però un esercizio realistico, perché la valutazione relativa alla singola superficie non ha un grande potere predittivo dei risultati delle partite.

Una combinazione di superfici

Una soluzione più opportuna arriva da una combinazione al 50% della valutazione per superficie e di quella complessiva. Se volessimo calcolare le probabilità di Thiem per una partita sulla terra, dovremmo usare una valutazione a metà tra il 2066 complessivo e il 2031 della terra.

Nelle mie valutazioni Elo settimanali, la singola superficie è indicata con “HardRaw” (o Solo Cemento, e così via), mentre le valutazioni combinate con “hElo”, “cElo” e “gElo” (h per hard = cemento, c per clay = terra e g per grass = erba). Non esiste una legge fisica che impone una combinazione al 50%. Qualsiasi correzione fatta all’algoritmo di base di Elo è dettata esclusivamente da logiche funzionali.

All’inizio, pensavo che una combinazione tra valutazione specifica e complessiva fosse appropriata, perché il successo di un giocatore su una superficie è in qualche modo correlato a quello sulle altre. Mi attendevo che la combinazione fosse diversa per singola superficie, magari usando una percentuale più alta della valutazione complessiva nel caso dell’erba, visto il numero ridotto di partite su quella superficie. Alla fine però, dalle mie prove è emerso che il 50% funziona su tutte le superfici.

Senza correzioni

Un sondaggio tra appassionati su quali sono le partite più importanti e di quali tornei — per la classifica, per il dibattito sul più forte di sempre, o per qualsiasi altra questione — potrebbe portare a una lunga e dettagliata lista di fattori che definiscono il concetto di grandezza. Forse sono gli Slam a essere più importanti dei Master o dei Premier, anche se forse questi sono meno rilevanti delle Finali di stagione e delle Olimpiadi, e naturalmente le finali sono fondamentali, pure gli scontri diretti tra determinati giocatori, e così via all’infinito.

Elo fornisce una soluzione. Un coefficiente solitamente chiamato “fattore k” permette di assegnare maggiore peso a determinate partite. È frequente nelle valutazioni Elo di altri sport, ad esempio per le partite dei playoff che hanno un fattore k più alto rispetto a quelle della stagione regolare. Ho sperimentato ogni sorta di valore del fattore k per le partite considerate “importanti”, ma devo ancora trovare un’impostazione del sistema che migliori in modo continuativo la sua capacità di fare previsioni sul risultato di una partita.

La penalizzazione per assenza dal circuito

Esiste un’eccezione. In caso di assenza duratura, diminuisco la valutazione del giocatore, per poi aumentare il fattore k nelle prime partite successive al rientro. Ne avevo già parlato in questo articolo. Si tratta di un’estensione logica del modello Elo, specialmente se si pensa alla tipica disposizione mentale che si ha nei confronti di un giocatore rimasto a lungo lontano dal circuito per infortunio. Non si sa mai bene cosa attendersi quando rientra, se è più forte che mai o se è ancora troppo lento. Magari ritornerà in forma presto o magari non recupererà mai la forma di un tempo. Una lunga assenza solleva molte domande. Raramente chi arriva da un infortunio è a un livello superiore al precedente, mentre in molti fanno peggio, mostrando rendimenti in media inferiori.

È inevitabile quindi che, all’immediato rientro da un infortunio, la stima del livello di un giocatore sia inferiore. Tuttavia, si dovrebbe assegnare un peso maggiore a risultati da subito molto validi, da cui un valore più alto del fattore k, che incorpora nella valutazione di un giocatore la mancanza di fiducia che abbiamo sulle sue condizioni successive al rientro da un infortunio. L’algoritmo si complica, ma la logica è semplice. In sostanza, è solo il tentativo di dare rigore interpretativo ad affermazioni del tipo “non so quanto giocherà bene al rientro, ma lo seguirò attentamente”.

La penalizzazione per assenza ha l’effetto collaterale positivo di bilanciare la naturale tendenza di Elo a un’inflazione nelle valutazioni. Se da un lato ci sono più giocatori che entrano nel sistema di quelli che ne escono, facendo aumentare il numero complessivo dei punti disponibili, la penalizzazione toglie dei punti senza che vengano poi allocati nuovamente agli altri giocatori.

La validazione di Elo e altre misure correttive

Più volte ho detto di aver fatto delle prove, oltre ad aver iniziato l’articolo affermando che Elo è di qualità superiore rispetto alle classifiche ufficiali. Cosa significa esattamente, e perché lo si può dire? Il modo più semplice con cui paragonare sistemi di valutazione è una statistica chiamata “accuratezza”, che conta le previsioni fatte correttamente. Ad esempio, Elo ha predetto il vincitore in 36 delle 50 partite delle Finali di Coppa Davis, per un’accuratezza del 72%. La classifica ATP ha predetto il vincitore (nel senso che il giocatore con la classifica più alta ha vinto la partita) in 30, per un’accuratezza del 60%. L’esperimento è ridotto, ma Elo ha demolito la classifica ufficiale. Ed Elo è considerevolmente migliore quando l’arco temporale copre un’intera stagione.

L’indice di Brier

Per questo scopo è più utile l’indice di Brier, che considera il livello di fiducia riposto in ciascuna previsione. Riprendendo il precedente esempio, Elo assegna a Nadal una probabilità dell’81.4% di battere Shapovalov. Se Nadal effettivamente vince la partita, l’81.4% è una previsione “migliore” diciamo rispetto a una del 65%, ma è “peggiore” di una del 90%. L’indice Brier calcola la media del quadrato della differenza tra la previsione (81.4%) e il risultato (0% o 100% a seconda di chi ha vinto), per tutte le partite in oggetto. Remunera l’impudenza di quelle previsioni che si sono rivelate corrette ma, poiché usa il quadrato della differenza, punisce severamente le previsioni aggressive ma sbagliate.

Un metodo più intuitivo per capire la natura dell’indice di Brier è di ipotizzare che Nadal e Shapovalov giochino 100 partite di fila (o, con più precisione ma meno intuitivamente, ipotizzare che cento identici Nadal giochino in contemporanea contro cento identici Shapovalov). Una previsione dell’81.4% significa che ci si attende che Nadal vinca 81 o 82 delle 100 partite. Se Nadal ne vince poi 90, la previsione non è stata sufficientemente favorevole nei confronti di Nadal. Non avremo mai cento partite di quel tipo in simultanea, abbiamo però migliaia di partite uniche, molte delle quali hanno la stessa previsione, come il 60% di probabilità di vittoria per il favorito. L’indice di Brier aggrega tutte quelle coppie di previsioni-risultati e restituisce un numero indicativo della bontà del nostro operato.

L’accuratezza ha comunque un valore limitato

È difficile prevedere il risultato delle partite di tennis. A prescindere da quanto è sofisticato un sistema, qualsiasi esso sia, sbaglierà comunque moltissime volte. In molti casi, una previsione “corretta” è a malapena meglio che non fare previsioni, se i dati suggeriscono che i due giocatori sono tra loro alla pari. Per questo, l’accuratezza ha un valore limitato: è più importante avere la giusta dose di fiducia che scegliere semplicemente un vincitore.

Tutte queste parole a dire: le mie valutazioni hanno un indice di Brier molto più basso (cioè più preciso) delle previsioni derivanti dalle classifiche del circuito maschile e femminile. Le previsioni fatte con Elo non sono altrettanto puntuali di quelle degli allibratori, altrimenti dedicherei molto più del mio tempo a scommettere che a scrivere di sistemi di valutazione nel tennis.

L’indice di Brier permette inoltre di stabilire se un determinato correttivo — come la combinazione tra superfici, le assenze da infortunio o il tipo di torneo — rappresentano un miglioramento del sistema. La definizione di una penalizzazione per assenza da infortunio riduce l’indice di Brier per l’intero gruppo di previsioni Elo, quindi vale la pena considerarla. Diminuire il fattore k per le partite di primo turno non ha effetti rilevanti, quindi si elimina quella pratica.

Per ulteriore approfondimento

Le mie valutazioni Elo del momento: ATP | WTA

Elo esteso al doppio

…e al doppio misto (in inglese)

Codice per Elo nel tennis (in R, che non ho scritto io)

Una gustosa infarinatura sull’indice di Brier (in inglese).

An Introduction to Tennis Elo

I problemi del circuito femminile che 4 milioni di dollari non risolvono

di Paul Timmons // mytennisadventures

Pubblicato il 4 novembre 2019 – Traduzione di Edoardo Salvati

Non appena Ashleigh Barty ha terminato le foto di rito con il trofeo delle Finali di stagione WTA, una vittoria che conclude un anno decisamente positivo per la simpaticissima australiana, l’attenzione si è inevitabilmente spostata sulla generosità dell’assegno che ha ricevuto in dote. Per chi non lo sapesse, si tratta di 4.42 milioni di dollari, una somma che fa impallidire qualsiasi premio partita precedentemente assegnato in un torneo professionistico di tennis, maschile o femminile.

Quasi immediatamente, i sostenitori della WTA travestiti da giornalisti hanno definito l’evento uno spartiacque nella storia del tennis femminile e dello sport femminile in generale. È un’affermazione perentoria che merita di essere approfondita, anche se non sorprende sapere che i suoi fautori non intendono discuterne il merito, probabilmente perché è un ragionamento dalla logica debole.

Perché questa opinione?

Torniamo indietro nel tempo. Non serve spostarsi decenni o di qualche anno, basta il gennaio scorso, quando Serena Williams ha perorato la causa della parità di guadagni in tutti i tornei presso i colleghi maschi. Vale la pena chiarire che gli Slam e i tornei congiunti più importanti offrono già montepremi identici. Per la maggior parte del calendario però, uomini e donne viaggiano per giocare in diverse città del mondo, in eventi più piccoli e meno prestigiosi: è qui che esiste la disparità, ed è presumibilmente quella a cui Williams faceva riferimento.

È parsa una richiesta strana in quel momento, e piuttosto illogica. L’ATP e la WTA operano come entità separate, con la facoltà di sottoscrivere accordi specifici per i diritti televisivi, per le sponsorizzazioni e la copertura mediatica. Sono presenti in paesi e città diverse, e così via. Semplicemente, il desiderio di Williams non è realizzabile nell’attuale struttura, aspetto di cui è di sicuro a conoscenza.

Per certi versi però, la sua argomentazione aveva un senso, era solo diretta alle persone sbagliate. La domanda dovrebbe essere posta ai dirigenti della WTA, sul perché il tennis femminile è rimasto indietro. I numeri che seguono illustrano la gravità del problema.

La gravità della situazione

Dei 55 tornei del circuito maggiore femminile, 32 sono gli International (la categoria inferiore). Di questi, 30 partono da un montepremi di 250 mila dollari. A confronto, nel circuito maggiore maschile 39 tornei su 62 sono della fascia più bassa (gli ATP 250), anche se il montepremi ha un livello di partenza di 589.680 dollari, decisamente più alto. Di conseguenza, un giocatore che vince un torneo 250 guadagna come minimo 90.990 dollari, mentre il finalista guadagna 49.205 dollari. La vincitrice di un International vince 43.000 dollari. Inizia a vedersi la differenza.

Alla luce di tutto questo, quanto dovremmo esaltare l’assegno ricevuto da Barty per un valore di 100 volte superiore a quello di una tipica vittoria in un International? Oltre a rappresentare già un aumento enorme rispetto ai 2.360.000 dollari vinti da Elina Svitolina nell’edizione 2018.

È davvero motivo di festeggiamenti? Possibile. Ma quali siano gli effetti di lungo termine ed i benefici, se ve ne sono, è oggetto di dibattito. Le Finali di stagione hanno dato alla WTA l’occasione per farsi vanto di un accordo che ha generato un premio partita più alto di quello degli uomini. Allora è questo di cui stiamo parlando?

Servono spiegazioni

Per me, in sostanza, la questione torna sul commento di un impiegato della WTA, che ne ha parlato in termini di: “che momento per il tennis femminile”. Ci spieghino i cambiamenti che porterà, quali vantaggi arriveranno e come inciderà sull’evoluzione dello sport. Perché da fuori vedo solo un torneo che ha reso le giocatrici ricche ancora più ricche. E non riesco proprio a immaginare come questo si traduca in più soldi di cui chi occupa i gradini più bassi della scala gerarchica ha un disperato bisogno. Sarei contento di essere smentito, ma temo che commenti sensazionalistici rimangano appunto tali.

Da ultimo, mi preme sottolineare che ho già affrontato il tema della disparità tra circuiti nelle categorie inferiori e, considerando il tono delle mie parole odierne, è giusto far sapere che dal prossimo anno l’ATP aumenterà il rimborso delle spese di viaggio a 4000 dollari per i giocatori classificati dal 151 al 400, mentre i doppisti riceveranno 2000 euro. Anche se solitamente è la Federazione internazionale a incaricarsi dei tornei a cui partecipa la maggioranza delle giocatrici classificate dal 151 al 400, è un altro esempio della cura superiore che l’ATP dedica ai giocatori (per quanto ci sia ancora molto da fare) rispetto al trattamento riservato dalla WTA o dalla Federazione internazionale.

Come è andato il torneo?

Sotto diversi punti di vista, l’ammontare vinto da Barty ha eclissato le pecche di un torneo con tutti gli ingredienti per un disastro. Gli infortuni possono colpire in qualsiasi momento, ma una combinazione di stanchezza di fine stagione e lentezza della superficie è destinata a creare inevitabilmente molti grattacapi. L’inabilità di generare il tutto esaurito ha poi reso l’atmosfera tetra.

Nella sua infinità saggezza, la WTA ha rifiutato il corteggiamento di Manchester e Praga — due città in cui i biglietti sarebbero andati a ruba per ogni sessione di gioco — attratta dal denaro di un mercato che non ha mai veramente spinto il tennis come sport. Giocatrici di altissimo livello si sono così ritrovate a competere in un contesto immeritevole del loro talento. È un sollievo pensare quindi che la WTA abbia preso l’impegno di trovare una soluzione a Shenzhen per i prossimi nove anni. Buona fortuna, perché ce ne vorrà molta.

In conclusione, molti complimenti a Barty, ma non esaltiamoci per la magnanimità della sua vincita. È una distrazione dalle problematiche di fondo che affliggono il circuito femminile, non solo in Cina.

Scratch Beneath The Surface

La probabilità di doppi decisivi nella nuova Coppa Davis

di Jeff Sackmann // TennisAbstract

Pubblicato il 28 novembre 2019 – Traduzione di Edoardo Salvati

Nel nuovo formato della Coppa Davis, ci sono tre partite per ogni sfida tra nazioni, due di singolare e una di doppio. Si giocano per primi i singolari, rendendo quindi possibile che il doppio perda di valore, cioè sia ininfluente sul risultato finale. 

Gli organizzatori delle Finali di Coppa Davis hanno provato a dare più peso al doppio, utilizzando criteri di spareggio (basati sul numero di set e game vinti) per determinare chi, durante la fase a gironi, si qualifica per quella a eliminazione diretta. Se è servito a mantenere interesse iniziale per i doppi irrilevanti, verso la fine dei gironi le squadre matematicamente qualificate non hanno avuto alcun incentivo a giocare il doppio.

In questo modo il Canada ha regalato il punto agli Stati Uniti con un ritiro pre-partita e l’Australia si è ritirata dopo un solo game giocato. Probabilmente era inevitabile, ma non è di certo auspicabile. Si presume che qualunque appassionato di tennis ne desideri sempre di più, e partite interrotte o non giocate potrebbero gettare scompiglio per lo spareggio.  

Sono molti i modi possibili per un ripensamento dell’evento, talmente tanti che evito di approfondirli in questa sede. Siccome i doppi irrilevanti sono inevitabili, vorrei invece analizzare quanto spesso dovremmo aspettarci che si verificano e, considerando che si verificheranno, se effettivamente è un aspetto che mette il doppio in secondo piano rispetto al singolare. 

Doppi ancora vivi

Lo spunto arriva da una domanda per il podcast della settimana scorsa:

La scelta più estrema riguardo ai doppi irrilevanti è semplicemente quella di non giocarli del tutto. Se si optasse per questa soluzione, a quanti doppi assisteremmo? Nelle Finali di Davis Cup a Madrid, ci sono state 25 sfide: 18 nella fase a gironi e 7 in quella a eliminazione diretta. In 12 sfide il doppio è stato determinante: 7 nelle 18 sfide dei gironi e 5 nelle 7 sfide dell’eliminazione diretta. Sulla base della metodologia proposta nel tweet, è all’incirca quanto ci saremmo attesi che accadesse. In media (per entrambe le fasi), una sfida aveva il 43% di arrivare al doppio decisivo, lasciando intendere che 11 partite di doppio sarebbero state importanti. 

La tabella elenca le 25 sfide, insieme alla probabilità di una vittoria a testa nelle prime due partite di singolare. L’ultima colonna indica se il doppio è stato decisivo. Le valutazioni Elo non sono state particolarmente efficaci nel predire quale sfida avrebbe portato a un doppio decisivo, anche se forniscono una buona stima di quanto spesso il doppio farebbe la differenza.

Sfida                 Prob. doppio   Giocato? 
Semi: GBR vs ESP      56.2%          SI  
Quarti: SRB vs RUS    54.3%          SI  
Semi: RUS vs CAN      53.3%          SI  
RR: FRA vs SRB        52.5%          NO  
RR: ARG vs GER        51.6%          NO  
RR: USA vs CAN        51.4%          NO  
RR: ITA vs CAN        50.0%          NO  
Quarti: GBR vs GER    50.0%          NO  
RR: GBR vs KAZ        49.8%          SI  
RR: ESP vs RUS        49.4%          SI  
Quarti: AUS vs CAN    49.4%          SI  
RR: USA vs ITA        48.7%          SI  
RR: BEL vs AUS        46.1%          NO  
RR: KAZ vs NED        46.0%          SI  
RR: CRO vs RUS        45.7%          NO  
RR: GER vs CHI        44.2%          SI  
RR: ARG vs CHI        43.6%          NO  
RR: FRA vs JPN        43.4%          SI  
Finale: CAN vs ESP    40.8%          NO  
RR: GBR vs NED        37.5%          SI  
RR: BEL vs COL        36.2%          NO  
Quarti: ARG vs ESP    34.6%          SI  
RR: SRB vs JPN        26.1%          NO  
RR: AUS vs COL        10.4%          NO  
RR: CRO vs ESP        7.3%           NO

Solo in pochi casi la vittoria in entrambi i singolari era quasi garantita. Anche in presenza di un tabellone molto lungo di 18 squadre, la maggior parte delle rappresentative è riuscita a schierare due solidi giocatori di singolare, e solo poche avevano il lusso di più di un giocatore di élite. 

Dieci anni di storia

Non si è trattato di pura casualità. Ho verificato tutte le sfide del World Group di Coppa Davis (tralasciando i playoff) dal 2010 al 2018 per identificare i due giocatori migliori di ciascuna squadra. Attraverso le loro valutazioni Elo al momento della partita e declinate sul nuovo formato al meglio dei tre set (anziché al meglio dei cinque), ho stimato quanto spesso saremmo di fronte a un doppio decisivo. In quelle 135 sfide, la probabilità media di un doppio decisivo è del 41%, di poco inferiore alla frequenza dell’edizione appena terminata. Escludendo un radicale rovesciamento gerarchico nella geografia del tennis mondiale, abbiamo una valida approssimazione di quanto frequentemente una squadra vince le prime due partite nel nuovo formato della Coppa Davis.

Quanto conta il doppio?

Quando il doppio ha un valore, è decisamente rilevante. Ogni partita di singolare ha la capacità di incidere in modo sostanziale sulla probabilità di ciascuna squadra di vincere la sfida, ma se il doppio entra in gioco, ha un’incidenza totale. Pensiamone in termini di leva, un concetto che solitamente applico a cambiamenti di punteggio durante la partita. Ipotizziamo due squadre equamente competitive e consideriamo la probabilità di vittoria in ogni passaggio del processo. Ogni squadra ha il 50% di probabilità di vincere ogni partita della sfida, che significa:

  • ogni squadra ha il 50% di probabilità di vincere la sfida
  • la squadra che vince la prima partita avrà il 75% di probabilità di vincere la sfida
  • in caso di parità dopo le prime due partite, ogni squadra avrà ancora una volta il 50% di probabilità di vincere la sfida.  

Prendiamo ora la leva di ciascuna partita dalla prospettiva della squadra A:

  • se vince la prima partita, la probabilità di vincere la sfida sale al 75%, altrimenti scende al 25%. Si tratta di un valore di leva del 75% – 25% = 50%
  • supponiamo che vinca la prima partita. Se vince anche la seconda, vince la sfida, una probabilità cioè del 100%. Se perde, scende al 50%. Di nuovo, è un valore di leva del 100% – 50% = 50% (se perde la prima partita, i calcoli sono identici, solo con probabilità del 50% e 0% invece di 100% e 50%) 
  • in presenza di un doppio decisivo, le probabilità all’inizio della partita di vincere la sfida sono del 50%. Con la vittoria del doppio, la probabilità raggiunge il 100%. Perdendo il doppio, la probabilità diventa dello 0%. È un valore di leva del 100% – 0% = 100%.  

Teoria e realtà

Potreste pensare che sia un ragionamento eccessivamente formale e convoluto, ed è difficile darvi torto. Il punto è che, con due squadre equivalenti, il doppio diventa due volte più decisivo. In molti altri sport succede che vi siano giocatori che non vengono coinvolti in tutte le fasi di gioco, subentrando nei momenti critici. Nel baseball ad esempio, con alcuni lanciatori chiamati a chiudere la partita solo in situazioni molto equilibrate. Oppure i kicker nella NFL, che partecipano a poche azioni della partita, ma con la possibilità di segnare molti punti. 

Per i parametri del mio campione d’indagine, il doppio avrà rilevanza esattamente il 50% delle volte, ed è due volte più importante di ognuna delle partite di singolare. Non funziona proprio così nel mondo reale, visto che il doppio è decisivo poco più del 40% delle volte. Però, quando poi il doppio diventa decisivo, ha sempre conseguenze da tutto o niente. Detto altrimenti, ha un valore di leva del 100%. 

Sono d’accordo nel non giocare i doppi irrilevanti. Non sarebbe una decisione che incontra il favore dei doppisti, e temo scatenerebbe le ire dei puristi della Davis. Pensando però alla posta in gioco, la reazione sarebbe più mitigata. In una formula da 16 o 18 squadre, l’equilibrio è sufficientemente distribuito da rendere necessario il doppio quasi nella metà delle volte. E quando si gioca il doppio, gli spesso dimenticati specialisti si trovano in una partita che è, letteralmente!, due volte più decisiva dei singolari che generano il massimo seguito di pubblico.  

The Likelihood of Live Doubles Rubber in the New Davis Cup

La velocità di ciascuna superficie, edizione 2019

di Jeff Sackmann // TennisAbstract

Pubblicato il 27 novembre 2019 – Traduzione di Edoardo Salvati

Se ne parla continuamente, e ne ho scritto molto in passato…eppure, strano a dirsi, non pubblico statistiche complete sulla velocità della superficie da tre anni. È ora di porre rimedio.

Se siete interessati alla spiegazione approfondita del funzionamento di questi numeri, con le limitazioni del caso, e di altri dettagli, invito alla lettura della mia analisi originaria. Segue qui una breve delucidazione. Assegno un valore a ciascuna superficie di gioco sul circuito maggiore maschile utilizzando la frequenza di ace come sintesi delle caratteristiche della superficie in questione.

Naturalmente, la frequenza di ace non può dare una rappresentazione completa ma, come vedremo, è un ottimo primo, o anche secondo, ordine di approssimazione. Per ogni torneo, verifico la frequenza di ace di tutte le partite, tenendo conto del giocatore al servizio e alla risposta in ciascuna di esse (la frequenza di ace nelle partite di John Isner sarà alta, ma questo non vuol dire necessariamente che la superficie è veloce).

Parlo di “velocità di gioco” perché la frequenza di ace dipende da un ampio insieme di variabili (temperatura, umidità, palline, etc) che, interamente considerate, forniscono indicazione sul modo in cui il campo incide sul gioco, ma che non hanno nulla di inerente la composizione fisica della superficie.

Facilità di calcolo e comprensione

I principali vantaggi di questa metodologia risiedono nella facilità di comprensione (più ace = valore più alto!) e nel fatto che è sufficiente un numero di dati anche ridotto, dati che sono disponibili per ogni partita maschile dai primi anni ’90. Il Court Pace Index e altre metriche basate sulla moviola istantanea Hawk-Eye possono sicuramente arricchire il ragionamento. Richiedono però pacchetti analitici molto più sofisticati, che federazioni e tornei non intendono di certo condividere con appassionati di rango minore come lo siamo noi.

La superficie media del circuito ha un valore di 1.0. Solitamente, la variazione tra tornei del circuito va dallo 0.50 dei campi in terra lenta all’1.50 dei campi in cemento veloci o in erba. La tabella mostra i valori di velocità per il periodo dal 2017 al 2019 di tutti i tornei in calendario nella stagione 2019, tra cui anche le Finali di Coppa Davis.

Torneo 2019         Superficie    % Ace  2019  2018  2017  
Chengdu             Cemento       14.8%  1.57  1.05  1.16  
Antalya             Erba          14.6%  1.47  1.25  1.74  
Finali di stagione  Cemento       11.7%  1.31  1.12  0.75  
Marsiglia           Cemento       11.7%  1.29  1.21  1.34  
Newport             Erba          12.7%  1.27  0.87  0.76  
Australian Open     Cemento       12.9%  1.27  1.16  1.14  
Brisbane            Cemento       13.3%  1.26  1.35  0.99  
Atlanta             Cemento       14.3%  1.25  1.01  0.86  
Shanghai            Cemento       13.0%  1.24  1.17  1.53  
San Paolo           Terra          9.8%  1.24  0.89  0.92  
Halle               Erba          12.8%  1.23  1.16  1.18  
Stoccarda           Erba          14.5%  1.23  1.42  1.27  
Sofia               Cemento       11.1%  1.21  1.14  1.33  
Anversa             Cemento       11.2%  1.21  1.25  1.06  
Finali Coppa Davis  Cemento       11.9%  1.20              
Metz                Cemento       13.5%  1.20  1.51  1.34  
Parigi Bercy        Cemento       11.9%  1.19  1.06  1.03  
Montpellier         Cemento       13.4%  1.17  1.13  1.11  
Vienna              Cemento       11.4%  1.16  1.16  0.98  
New York            Cemento       17.0%  1.16  1.05        
                                                        
Torneo 2019         Superficie    % Ace  2019  2018  2017  
Winston Salem       Cemento       12.1%  1.15  1.01  1.07  
Basilea             Cemento       14.2%  1.14  1.03  0.77  
Pechino             Cemento       11.6%  1.12  1.03  0.91  
Washington          Cemento       15.5%  1.11  0.99  1.11  
Mosca               Cemento       13.5%  1.11  1.21  1.45  
Delray Beach        Cemento       13.9%  1.10  0.98  0.97  
Doha                Cemento       10.0%  1.10  0.88  1.02  
S. Pietroburgo      Cemento        8.4%  1.09  1.13  0.80  
Stoccolma           Cemento       11.2%  1.08  1.03  1.05  
Tokyo               Cemento       11.6%  1.08  1.34  1.18  
Queen's Club        Erba          12.8%  1.07  1.25  1.20  
Auckland            Cemento       10.7%  1.06  1.17  1.11  
Pune                Cemento       14.8%  1.05  0.99        
Cincinnati          Cemento       11.6%  1.04  0.98  1.22  
Canada              Cemento       10.8%  1.03  1.17  0.97  
Dubai               Cemento        8.4%  1.02  1.04  0.91  
Eastbourne          Erba          13.2%  0.99  0.94  1.00  
Wimbledon           Erba          10.5%  0.99  1.14  1.03  
Sydney              Cemento        9.3%  0.98  1.25  1.10  
Zhuhai              Cemento        6.9%  0.97              
                                                        
Torneo 2019         Superficie    % Ace  2019  2018  2017  
Marrakech           Terra          8.4%  0.97  0.62  0.77  
US Open             Cemento       10.2%  0.97  0.98  0.96  
s'Hertogenbosch     Erba          10.2%  0.95  0.99  0.89  
Cordoba             Terra          6.9%  0.94              
Rotterdam           Cemento        8.0%  0.90  1.13  1.09  
Lione               Terra          9.9%  0.90  0.89  0.85  
Gstaad              Terra          5.6%  0.88  1.16  0.92  
Acapulco            Cemento       11.1%  0.86  1.03  0.92  
Miami               Cemento        9.5%  0.86  0.78  0.84  
Los Cabos           Cemento        6.5%  0.85  0.80  1.28  
Ginevra             Terra          6.6%  0.81  1.04  0.85  
Bastad              Terra          7.1%  0.80  0.72  0.88  
Kitzbuhel           Terra          6.3%  0.77  0.84  1.02  
Amburgo             Terra          7.7%  0.76  0.69  1.02  
Indian Wells        Cemento        7.6%  0.76  0.84  1.03  
Houston             Terra          9.2%  0.75  0.81  0.94  
Madrid              Terra          7.0%  0.71  0.84  0.89  
Roland Garros       Terra          7.0%  0.71  0.72  0.76  
Internaz. d'Italia  Terra          7.0%  0.69  0.69  0.85  
Monaco              Terra          7.0%  0.67  0.74  0.99  
                                                        
Torneo 2019         Superficie    % Ace  2019  2018  2017  
Umago               Terra          5.6%  0.65  0.78  0.61  
Rio de Janeiro      Terra          5.9%  0.63  0.71  0.68  
Budapest            Terra          7.0%  0.62  0.62  0.59  
Barcellona          Terra          5.6%  0.59  0.57  0.55  
Estoril             Terra          4.7%  0.54  0.58  0.53  
Buenos Aires        Terra          3.9%  0.52  0.65  0.88  
Monte Carlo         Terra          4.7%  0.50  0.56  0.50

Le Finali di stagione sono state tra le più veloci degli ultimi anni. I valori per il periodo dal 2014 al 2016 sono stati di 0.89 e 1.06, facendo supporre che finalmente gli organizzatori si sono decisi a fare un vero campo in cemento o che 15 partite sono un campione poco rappresentativo (e poi non sono l’esempio ideale, e lo stesso vale per i tornei con tabelloni a 28 e 32 giocatori).

Le Finali di Coppa Davis sono state più simili a un tipico campo coperto in cemento. All’estremo opposto, Indian Wells è stato un evento particolarmente lento quest’anno, anche rispetto ai suoi abituali standard quasi da terra battuta. Almeno per alcuni tornei, la convergenza fra velocità di superficie sembra essersi ridotta.

The Speed of Every Surface, 2019 Edition

Chi ha reso di più sotto pressione negli Slam 2019?

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 19 novembre 2019 – Traduzione di Edoardo Salvati

In un precedente articolo ho esaminato quali giocatori hanno subito le situazioni di maggiore pressione negli Slam 2019. È il momento dell’ovvia domanda successiva. Chi ha reso di più sotto pressione?

Esistono diversi modi per analizzare la pressione e il rendimento dei giocatori sotto pressione. Se si parla in termini di vittoria finale, sono i giocatori che vincono più punti ad alta pressione quelli che poi si aggiudicano la partita 99 volte su 100. Sulla base della frequenza di punti pressione vinti (FPPV) quali sono i giocatori che hanno surclassato gli avversari con continuità?

Circuito maschile

L’immagine 1 mostra il grafico del differenziale della FPPV totale (FPPV rispetto all’avversario) sull’asse delle ordinate rispetto alla media per gli Slam 2019. Si nota una chiara correlazione positiva tra queste due misure, favorita dalla struttura a eliminazione singola dei tornei.

Difficile ignorare l’evidente dominio di quattro giocatori in questa stagione di Slam: Daniil Medvedev, Roger Federer, Novak Djokovic e Rafael Nadal. Djokovic ha un leggero margine su Nadal nel rendimento medio sotto pressione nonostante due vittorie in meno. Federer è più dietro e sorprende che non sia riuscito a tenere Medvedev a maggiore distanza pur con 7 vittorie in più nel totale.

Guardando più a fondo emergono altre considerazioni interessanti, come il vantaggio di Dominic Thiem su Fabio Fognini, anche se entrambi hanno ottenuto 7 vittorie e 4 sconfitte. Troviamo poi nel gruppo anche il giovane Alexei Popyrin accanto a nomi già affermati come Alex De Minaur, Stefanos Tsitsipas e Matteo Berrettini. Sul 2% di differenziale medio di FPPV di Alexander Zverev hanno inciso molto le sue 10 vittorie e 4 sconfitte, rimane tuttavia chiaro quanto ancora ha da fare per chiudere il divario da Medvedev.

IMMAGINE 1 – Frequenza di punti pressione vinti negli Slam 2019 per il circuito maschile

Circuito femminile

Per quanto riguarda le donne, Serena Williams gravita in una personale stratosfera in termini di dominio delle avversarie in situazione di pressione, un aspetto quantomeno curioso considerando che non ha vinto nessun titolo Slam nel 2019 (e così anche nel 2018). Forse è un segnale evidente del fatto che il rendimento in finale è diventato una specie di barriera.

È affascinante notare come i due giocatori che si sono divisi gli Slam nel 2019 abbiano anche i valori totali e medi della FPPV più estremi, mentre per le vincitrici la connessione tra titolo e FPPV è molto più complessa, non solo quindi nel caso di Williams. Ashleigh Barty, campionessa del Roland Garros, e Simona Halep, campionessa di Wimbledon, sono due tra le prime cinque per FPPV, affiancate da Johanna Konta ed Elise Mertens, che però non sono arrivate nemmeno in finale.

IMMAGINE 2 – Frequenza di punti pressione vinti negli Slam 2019 per il circuito femminile

Per Naomi Osaka e Bianca Andreescu, sorpassate da diverse giocatrici per rendimento sotto pressione negli Slam del 2019, la spiegazione è ancora più complicata. Andreescu ha saltato quasi tutta la parte centrale della stagione per infortunio, tornando poi prepotentemente durante la trasferta americana per conquistare gli US Open.

Il caso di Osaka

Osaka è un punto interrogativo. Se nelle statistiche sulla pressione viene quasi affiancata da giocatrici meno navigate come Amanda Anisimova, è possibile che Osaka, faticando a imporsi su avversarie tecnicamente inferiori, non stia rendendo giustizia alla qualità del suo gioco.

Per contro, il folto numero di giocatrici raggruppate intorno alle vincitrici Slam 2019 è ulteriore prova dell’alto livello competitivo del circuito femminile. Se trarre vantaggio dai momenti di maggiore pressione è un requisito per vincere uno Slam, sembra proprio che nel 2020 ci sarà spazio per nomi nuovi nell’albo d’oro dei quattro tornei più illustri della stagione.

Who Felt the Pressure the Most at the 2019 Grand Slams?

Chi ha subito di più la pressione negli Slam 2019?

di Stephanie Kovalchik // StatsOnTheT

Pubblicato l’11 novembre 2019 – Traduzione di Edoardo Salvati

Quali sono i giocatori che negli Slam della stagione 2019 hanno dovuto affrontare le maggiori sfide e che hanno ottenuto di più in situazioni di massima pressione?

La gestione delle fasi calde di partite equilibrate nei tornei più importanti è un indicatore della personalità tennistica di un giocatore. Di quali giocatori la personalità è stata messa maggiormente alla prova negli Slam del 2019?

Possiamo farci un’idea esaminando la pressione media in partita durante gli Slam. Ne ho parlato approfonditamente in passato ma, in breve, la pressione di ciascun punto è semplicemente la leva del punto stesso (o l’importanza del punto). I giocatori con una pressione media più alta sono quelli che hanno giocato set più duri e più spesso hanno concluso partite al quarto o quinto set.

Circuito maschile

Il grafico dell’immagine 1 mostra la pressione media negli Slam per il circuito maschile rispetto al numero totale delle partite giocate, che fa vedere anche quali sono i giocatori che hanno raggiunto le fasi finali dei quattro tornei. Sono riportati solo quelli nel 20% superiore delle partite giocate, in modo da concentrarsi su chi ha avuto più successo.

IMMAGINE 1 – Pressione negli Slam 2019 per il circuito maschile

Il primo aspetto che si nota è la correlazione negativa tra la pressione media e il numero totale di partite giocate. È ragionevole che sia cosi, se si considera che il numero totale delle partite è direttamente collegato alla bravura del giocatore. I più forti hanno solitamente turni iniziali più abbordabili, facendo diminuire la loro pressione media.

Suscitano particolare interesse in questo caso quei giocatori con una pressione insolitamente alta a parità di numero di partite giocate. Prendiamo ad esempio Daniil Medvedev, che ha subìto la pressione media più alta tra i giocatori con un totale di 15 partite negli Slam del 2019. La sua pressione media dell’1.9% per punto è stata più comune per giocatori tra le 12 e 14 partite giocate.

Un altro giocatore a distinguersi è Stanislas Wawrinka che, con una media del 2.2%, entra tra i primi 5 per pressione più alta. Ha però molte più partite totali giocate rispetto a quei giocatori. Stefanos Tsitsipas e Marin Cilic sono in una situazione simile: giocatori molto abili che si sono però ritrovati a dover gestire partite più complicate di quanto la loro bravura avrebbe predetto.

Circuito femminile

In campo femminile, la correlazione negativa è ancora più accentuata, in quanto il formato al meglio dei tre set rende più consuete circostanze di alta pressione.

IMMAGINE 2 – Pressione negli Slam 2019 per il circuito femminile

Due delle giocatrici che emergono in questo gruppo sono Karolina Pliskova e Naomi Osaka, entrambe con pressione maggiore della media per il numero di partite giocate. Anche Bianca Andreescu è un po’ una sorpresa, per quanto sulla sua campagna negli Slam hanno inciso gli infortuni, costringendola a ritirarsi dal Roland Garros e saltare completamente Wimbledon.

È curioso osservare un raggruppamento più ampio di giocatrici con una pressione media inferiore alle attese. Ad esempio Petra Kvitova, il cui numero totale di partite avrebbe dovuto prevedere per lei una pressione media più vicina al 2.7% o 2.8%. Un valore effettivo del 2.4% può essere attribuito a un dominio dei primi turni, specialmente agli Australian Open, contro sconfitte premature negli altri Slam, come gli US Open. Potrebbe quindi essere un segnale di giocatrice con più alti e bassi in stagione di altre.

Penso che queste statistiche relative alla pressione evidenzino punti di vista differenti sulle sfide che giocatori e giocatrici hanno affrontato nei tornei di peso e siano di riflessione per affrontare la prossima stagione. Sarà affascinante vedere come giocatori tipo Wawrinka o Pliskova, che sono riusciti a gestire con efficacia momenti di pressione maggiore della media, faranno affidamento su quell’esperienza come traino per la stagione 2020.

Who Felt the Pressure the Most at the 2019 Grand Slams?

Corridoi e colpi a lato

di Jeff Sackmann // TennisAbstract

Pubblicato l’11 novembre 2019 – Traduzione di Edoardo Salvati

Le Finali NextGen si giocano su un campo anomalo, nel senso che, dovendo ospitare solo partite di singolare, non possiede le linee che delimitano il corridoio del doppio. Praticamente tutti i tornei della stagione prevedono il tabellone del doppio, e quindi raramente è possibile trovare un campo senza i corridoi. Ci sono state in passato edizioni delle Finali di stagione riservate al singolare, ora però l’esclusiva è delle Finali NextGen.

Si può pensare che il particolare disegno delle linee abbia qualche conseguenza sui giocatori?

Ne ho parlato recentemente con Erik Jonsson, e siamo giunti alla provvisoria conclusione che i professionisti (anche i più giovani di loro), grazie alle migliaia di ore di esperienza di gioco, non dovrebbero sentirsi disorientati in un campo diverso dal solito. Perché però fare congetture quando abbiamo dei dati per un’analisi?

Il database del Match Charting Project, che ho creato per raccogliere statistiche punto per punto di partite ufficiali anche con il prezioso aiuto di volontari, è comprensivo di più dettagli relativi agli errori, sia in termini di natura, cioè forzati e non forzati, che di tipologia, cioè in rete, lunghi, esterni o esterni e lunghi. Le Finali NextGen non hanno destato l’immediato interesse dei volontari, tanto che prima dell’edizione 2019 solo la finale del 2018 era stata inserita, su più di 6600 partite totali. Il 2019 però è diverso, perché abbiamo statistiche di 8 delle 15 partite giocate a Milano la settimana scorsa (un grazie sentito a Carrie, che ha seguito l’intero percorso del finalista Alex De Minaur).

La quantificazione degli errori esterni

Ci interessa la frequenza dei colpi che escono ai lati del campo, un calcolo meno semplice di quanto appaia. Ho deciso di limitarmi ai colpi a rimbalzo, escludendo anche gli errori forzati, quelli in cui il giocatore potrebbe non avere un grande controllo sulla direzione della palla.

Questi sono gli indicatori ipotizzabili per la frequenza degli errori esterni:

  • errori esterni per punto (est./punto)
  • errori esterni per errori non forzati (est./ENF)
  • errori esterni per colpi a rimbalzo “fattibili”, cioè colpi a rimbalzo che sono stati errori non forzati o che sono stati rimessi in gioco (est/. rimbalzo)

Il primo indicatore probabilmente eccede in approssimazione, pur avendo il vantaggio della semplicità. Gli errori esterni per errori non forzati potrebbero essere di aiuto nell’indicare in quale direzione il giocatore è stato più aggressivo. L’ultimo, gli errori esterni per colpi a rimbalzo “fattibili”, è forse la rappresentazione più utile al nostro scopo, perché segnala quanto spesso un giocatore ha tirato un colpo che è uscito a lato.

De Minaur e gli altri

La tabella elenca i numeri di De Minaur per le cinque partite delle Finali NextGen 2019, oltre ai numeri complessivi delle altre 28 partite sul cemento nel database, relative agli ultimi due anni.

             Est./Punto  Est./ENF  Est./Rimbalzo   
NextGen      2.7%        1.5%      21.7%  
Cemento ATP  3.0%        1.4%      21.4%

Almeno per De Minaur, il corridoio non sembra fare troppa differenza. Concentriamoci sul gruppo di giocatori leggermente più ampio. Abbiamo otto partite, vale a dire 16 inserimenti di partita se si considerano i singoli giocatori, tra cui almeno una per ognuno degli otto giocatori che si sono qualificati per Milano. La tabella elenca i tre indici per le partite delle Finali NextGen, insieme agli equivalenti valori per le altre partite sul cemento nel database, relative agli ultimi due anni.

             Est./Punto  Est./ENF  Est./Rimbalzo  
NextGen      3.2%        1.8%      19.5%  
Cemento ATP  3.2%        1.8%      23.1%

Per i primi due indici, non c’è alcun effetto tangibile. Con o senza corridoio, gli errori esterni determinano la fine del 3.2% dei punti, e dell’1.8% del totale degli errori non forzati (il 3.2% è per giocatore, quindi i punti che si sono conclusi con un errore esterno sono il 6.4%). Il terzo indice invece è più interessante. Sul circuito questi giocatori commettono un errore esterno nel 23.1% dei colpi a rimbalzo “fattibili”. Nel campo senza corridoio visto a Milano, lo stesso numero è sceso di più di un settimo, al 19.5%. Contestualmente, la frequenza complessiva di errori non forzati (non solo quindi gli errori esterni) è aumentata rispetto a quanto mostrato dagli stessi giocatori sul cemento in altri eventi.

Acuire la mente

Penso a due possibili spiegazioni per un calo così marcato. Primo, non abbiamo molti dati a disposizione, e magari è solo un caso legato a un campione ridotto. In parte si può far risalire alla prestazione di Ugo Humbert, che non ha commesso nemmeno un errore esterno nell’unica sua partita del database alle Finali NextGen (la frequenza tipica di Humber sugli errori esterni è vicina alla media del circuito). In assenza di molte più partite giocate su campi senza corridoio, e di cui naturalmente dovremmo avere statistiche punto per punto, non si riesce a giungere a conclusioni definitive.

Secondo, potrebbe trattarsi di un effetto concreto legato però a qualche aspetto delle condizioni di gioco di Milano. La mancanza del corridoio, come scritto da @furryyelloballs nel suo tweet, potrebbe davvero “acuire la mente”.

Rispetto ad altre misure innovative sperimentate alle Finali NextGen, il campo dedicato al singolare riceve scarso interesse mediatico. Però, a differenza di modifiche come l’appendi asciugamano o il cronometro al servizio, potrebbe avere una conseguenza reale sul gioco, per quanto limitata.

Tramlines and Wide Groundstrokes

Stili di gioco e risultati a sorpresa

di Jeff Sackmann // TennisAbstract

Pubblicato il 14 gennaio 2019 – Traduzione di Edoardo Salvati

Durante un podcast con Carl Bialik, ho confessato una teoria che mi ronza in testa da tempo, e cioè che le vittorie a sorpresa sono più probabili in presenza di stili contrastanti di gioco. La logica è piuttosto semplice. Se ci sono due ribattitori, è probabile che il più forte vinca. Se ci sono invece due cannonieri del servizio, il migliore dei due non dovrebbe avere problemi. Ma se un cannoniere affronta un ribattitore beh…può succedere di tutto.

Abbiamo visto Rafael Nadal fare fatica contro giocatori come John Isner e Dustin Brown, così come un grande servizio essere neutralizzato dal suo opposto, ad esempio le sei sconfitte di Marin Cilic contro Gilles Simon a fronte di una sola vittoria. Ci sono comunque vittorie a sorpresa anche nello scontro di stili di gioco simili ma, come per tutte le ipotesi non sottoposte a prova empirica, anche questa ha il suo fascino e non è da scartare in partenza.

Serve una verifica approfondita

Al primo turno degli Australian Open 2019 Reilly Opelka ha battuto Isner. Difficile trovare due stili più affini e, da veterano, Isner aveva tutti i favori del pronostico nel perfetto caso di quel tipo di partita che mi aspetto già delineata, tranne che poi finisce per vincere lo sfavorito. Hanno giocato quattro tiebreak e ci sono stati solo due break, ma Opelka non ha nemmeno dovuto attivare la nuova regola del super-tiebreak al quinto set. Pur trattandosi di una sola partita, il suggerimento implicito che ne deriva è di fare una verifica più approfondita della mia idea.

Dopo un paio di ore di analisi, la teoria può vantare ora una prova ufficiale, e ho scoperto che non è esente da difetti. Fortunatamente, non si tratta solo di un altra battuta d’arresto. Lo stile di gioco è effettivamente correlato alla probabilità di un risultato a sorpresa, semplicemente non nel modo che mi ero immaginato.

Una misura della pronosticabilità

Voglio spiegare in dettaglio il test e poi illustrare gli esiti. Ho utilizzato i dati del Match Charting Project per calcolare l’Indice di Offensività di ciascun giocatore con almeno dieci partite nel database dal 2010. In sintesi, l’Indice di Offensività è la percentuale di colpi che terminano il punto (tramite un vincente, un errore non forzato o un errore forzato commesso dall’avversario) e si comporta da approssimazione dello stile di gioco. Otteniamo così 106 giocatori, da conservatori tipo Simon e Yoshihito Nishioka con Indice di Offensività del 13% a i battitori liberi come Brown e Ivo Karlovic, con indici intorno al 30%. Li ho poi suddivisi in quartili (per numero di partite, non numero di giocatori, con ogni quartile che contiene tra i 21 e 31 giocatori), in modo da vedere come in generale uno stile di gioco si comporta con un altro.

La divisione in quartili

Questi sono i gruppi:

(l’Indice di Offensività mette insieme due aspetti: grande servizio/grande potenza di colpi e aggressività tattica. Isner non è sempre iper aggressivo, ma per via della sua altezza e del talento al servizio, è in grado di terminare i punti così frequentemente che, statisticamente, sembra essere estremamente aggressivo. Quindi, parlerò allo stesso modo di “cannonieri” e “giocatori offensivi”, anche se in realtà ci sono molte differenze tra i due gruppi).

Un campione di 11 mila partite

Concentrandomi su questi 106 giocatori, ho trovato poco più di 11 mila partite da esaminare e le ho divise in insiemi sulla base del quartile di appartenenza dei due giocatori. Ciascuno dei dieci possibili sottoinsiemi di partite, come Q1 contro Q2 o Q4 contro Q4, contiene almeno 400 elementi.

Per ogni partita, ho stabilito la probabilità di vittoria del favorito con le valutazioni Elo corrette per superficie, in modo da ottenere pronostici pre-partita che, seppur non accurati quanto quelli degli allibratori, sono altrettanto affidabili. Questi pronostici permettono di stabilire se determinati gruppi sono più pronosticabili di altri. Se su 100 partite in cui il favorito ha una probabilità di vittoria del 60%, il favorito ne vince 70, diremo che il risultato è più pronosticabile delle attese. Se ne vince solo 50, il risultato è stato meno prevedibile.

Addio mia bella teoria

Per le partite in ciascuno dei dieci sottoinsiemi quartile contro quartile, ho calcolato la probabilità media di vittoria del favorito (“Probabilità Favorito”, confrontandola con la frequenza con cui il favorito ha effettivamente vinto (“% Vittoria Favorito”). La tabella mostra i risultati insieme al rapporto tra quei due numeri (“Indice”). Un indice di 1.0 significa che le partite del sottoinsieme sono pronosticabili esattamente quanto ci si attende che lo siano. Un indice più alto significa che il favorito è stato ancora più forte del pronostico, mentre un indice inferiore manifesta più vittorie a sorpresa delle attese.

Partite
Quartili
Numero
Partite
Probabilità
Favorito
% Vittoria
Favorito
Indice
Q1 vs Q141271.1%75.2%1.06
Q1 vs Q2107269.5%70.6%1.02
Q1 vs Q3138269.7%68.6%0.98
Q1 vs Q4118769.7%70.0%1.00
Q2 vs Q261270.2%69.9%1.00
Q2 vs Q3161668.8%67.8%0.99
Q2 vs Q4143468.8%67.4%0.98
Q3 vs Q388666.7%60.3%0.90
Q3 vs Q4168567.3%66.8%0.99
Q4 vs Q479167.1%61.2%0.91

Emerge un risultato impressionante: il valore più alto, che identifica il gruppo di partite più pronosticabili, arriva dalla coppia di giocatori più conservativi. Viceversa, il valore più basso, che identifica il gruppo di partite con più vittorie a sorpresa, arriva dalla coppia di giocatori più offensivi.

Prima di analizzare le correlazioni, facciamo un’altra verifica. I migliori non sono equamente distribuiti tra quartili, visto che nel Q1 ci sono due dei Fantastici Quattro. Per i più forti e per le partite più sbilanciate è più complicato calcolare con precisione pronostici basati sulle valutazioni Elo, che sono la colonna portante di questo procedimento.

Restringiamo il perimetro

Per questo motivo occorre prestare attenzione quando i giocatori di vertice potrebbero influenzare il risultato finale dell’analisi. Proviamo quindi a vedere gli stessi numeri relativi però solo a quelle partite in cui il favorito ha una probabilità di vittoria che va dal 50 al 70%, escludendo così molti degli scontri tra i giocatori di vertice e tutte le loro partite con pronostico a senso unico.

Partite
Quartili
Numero
Partite
Probabilità
Favorito
% Vittoria
Favorito
Indice
Q1 vs Q119659.5%62.8%1.05
Q1 vs Q260459.8%60.6%1.01
Q1 vs Q373159.7%58.1%0.97
Q1 vs Q466359.9%60.6%1.01
Q2 vs Q232259.0%54.7%0.93
Q2 vs Q393159.8%59.8%1.00
Q2 vs Q482259.7%57.2%0.96
Q3 vs Q354459.5%55.0%0.92
Q3 vs Q4102459.5%58.2%0.98
Q4 vs Q449359.3%55.0%0.93

Si elimina circa il 40% del campione, ma le dinamiche di pronosticabilità rimango in generale le stesse. Sia nel campione complessivo che in quello ridotto del 50-70% di probabilità per il favorito, la correlazione più solida che ho trovato è stato l’Indice di pronosticabilità e il quartile dei giocatori meno offensivi. In altre parole, è probabile che un ribattitore abbia risultati più prevedibili di un giocatore più aggressivo, a prescindere che l’avversario sia un cannoniere del servizio, un altro ribattitore o un giocatore che si pone a metà tra queste due tipologie.

Torniamo ai fondamentali

La mia teoria iniziale è chiaramente sbagliata. Mi aspettavo di trovare che le partite Q1 contro Q1 fossero più pronosticabili della media, e ho avuto ragione. Secondo questa logica, mi aspettavo che anche le partite Q4 contro Q4 andassero in quella direzione mentre accoppiamenti come Q1 contro Q4 fossero più soggetti a risultati a sorpresa. Sarebbe stato meglio che il gatto del mio avesse fatto pronostici per mio conto.

Si trova invece che partite con giocatori più aggressivi portano più probabilmente a esiti contro pronostico. Non è la scoperta del secolo, ed è una conclusione che avrei dovuto intuire. I grandi servitori tengono il servizio più facilmente e fanno break meno frequentemente, così che le loro partite finiscono con punteggi più ravvicinati, lasciando spazio a un ruolo maggiore da parte della fortuna specialmente quando set e partite sono decise da tiebreak.

Starete a questo punto pensando che ho buttato via il mio pomeriggio e la vostra attenzione per giungere a un esito scontato e poco degno di nota. Sono d’accordo, non è particolarmente eccitante proclamare che la fortuna ha un ruolo più incisivo con i cannonieri del servizio. C’è comunque una scoperta utile, e anche sorprendente, nascosta tra le righe.

Potenziale esponenziale di vittoria a sorpresa

Sappiamo che i giocatori in assoluto mono-dimensionali subiscono più di altri gli alti e bassi della fortuna, per via dei margini risicati del tiebreak. Per un giocatore che raramente strappa il servizio all’avversario, nessuna partita ha garanzia di vittoria. Per un giocatore che raramente subisce un break, nessun avversario è impossibile da battere. Però, mi sarei aspettato che la non pronosticabilità dei cannonieri fosse già incorporata nei pronostici delle partite, tramite la loro valutazione Elo. Se un giocatore ha risultati insolitamente casuali, ci attendiamo che la sua valutazione si muova verso la media del circuito. Questo è uno dei motivi per cui è molto difficile per i giocatori con una risposta debole arrivare in cima alla classifica.

Le cose però non sono come sembrano. Per i cannonieri del servizio, le valutazioni Elo, guidate dalla casualità, ottengono risultati quasi perfetti nella previsione delle partite contro i ribattitori, e hanno un leggero eccesso di confidenza contro avversari con uno stile di gioco più a metà strada nei quartili Q2 e Q3. Quando si affrontano tra di loro invece, i risultati a sorpresa sono all’ordine del giorno. Quella frazione di risultati così volatili, le partite piene di tiebreak in presenza di due cannonieri, rappresenta solo una parte della valutazione di questo tipo di giocatori.

Siamo abituati a vedere esiti imprevedibili legati ai giocatori più aggressivi, per via del grande servizio, del rendimento erratico alla risposta e degli scambi corti. L’analisi di oggi aumenta la conoscenza sulla frequenza con cui questo accade o non accade. Contro i ribattitori, la situazione non è poi così difficile da pronosticare. Quando però si ritrovano due cannonieri del servizio, ci aspettiamo l’inatteso, e il risultato diventa ancora più imprevedibile.

What I Should’ve Known About Playing Styles and Upsets