Una breve spiegazione sull’arrivo in volata alla Laver Cup

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 24 settembre 2019 – Traduzione di Edoardo Salvati

Nella terza edizione della Laver Cup, il Resto del Mondo si è avvicinato — come mai era riuscito — a battere l’Europa, che ancora una volta ha dimostrato di essere una potenza. Indietro nel punteggio per 5-7 al termine della seconda giornata, con la vittoria delle prime due partite della terza giornata il Resto del Mondo ha ristabilito l’equilibrio lasciando l’esito della sfida incerto fino all’ultimo. La situazione non sembrava chiara per i telecronisti, aperti alla possibilità di una tredicesima partita tra le due squadre. Vediamo perché non sarebbe potuto accadere e quali condizioni si sarebbero invece dovute verificare per arrivare alla partita decisiva.

La Laver Cup non ha una lunga tradizione, quindi parlare di tendenze può non avere molto senso. Abbandonando temporaneamente i rigidi dettami statistici, è curioso notare che il Resto del Mondo si è migliorato o ha eguagliato sé stesso al termine della seconda giornata in ciascuno dei tre anni. Gli 11 punti vinti in Svizzera sono a oggi il bottino più ampio. Escludendo la conquista del trofeo, il Resto del Mondo potrebbe superare questo traguardo con 12 punti alla fine delle partite della terza giornata forzando la sfida conclusiva, uno scenario che però non si è mai verificato.

Forzare la partita decisiva

Alcuni dei commenti televisivi hanno lasciato intendere che si sarebbe comunque sempre potuti arrivare alla partita decisiva. Non è la prima inesattezza numerica sentita durante una telecronaca, ma si è portati a pensare che la semplice addizione multipli di 3 al punteggio del Resto del Mondo alla fine della seconda giornata avrebbe evitato un errore di quel tipo.

Gli affezionati lettori di questo blog non avranno alcun problema nel realizzare che ci sono solo una manciata di punteggi dalle partite della seconda giornata che possono generare una parità di 12-12 dopo la dodicesima partita della terza giornata. E cioè:

  • 0-12
  • 3-9
  • 6-6
  • 9-3
  • 12-0

Meno immediato è capire quanto probabile fosse ciascuno di essi a Ginevra. Tenendo conto delle valutazioni specifiche per il cemento dei giocatori scelti per il singolare e il doppio nella prima e seconda giornata, il grafico dell’immagine 1 mostra tutte le combinazioni di punteggio possibili per il Resto del Mondo alla fine della seconda giornata, con la relativa probabilità.

Complessivamente, la probabilità che il Resto del Mondo fosse su uno dei cinque punteggi che avrebbe condotto a una partita decisiva era del 33%. Il più probabile era il 3-9, con il Resto del Mondo senza i favori del pronostico in tutti i singolari ma favorito in tutti i doppi.

È interessante notare che il punteggio effettivamente raggiunto (5-7) era, con il 17%, appena meno probabile del 3-9 su cui si sarebbero potuti trovare. Sicuramente la prima vittoria in singolare di Jack Sock (contro Fabio Fognini per 6-1 7-6, n.d.t.) per il Resto del Mondo deve essere tra le più grandi sorprese della competizione.

IMMAGINE 1 – Probabilità attesa per ogni combinazione di punteggio del Resto del Mondo alla fine della seconda giornata, sulla base di 50.000 simulazioni di risultato dalle partite effettive della prima e seconda giornata

Recuperare dallo 0-12?

Quando il Resto del Mondo ci riproverà a Boston, nella quarta edizione della Laver Cup nel 2020, guarderò con attenzione se saranno in grado di fare meglio di 5 punti dopo la seconda giornata e di 11 dopo la terza.

E spero di essere ancora in salute quando una delle due squadre recupererà uno svantaggio di 0-12 per giocarsi tutto nella partita finale. Con i giocatori presenti quest’anno, sarebbe successo solo in 6 delle 50.000 simulazioni della competizione. Temo ci sarà un po’ da aspettare per questo scenario. Per la prima partita decisiva invece, l’anno prossimo potrebbe essere quello giusto.

A Short Explainer on Getting to a Laver Cup Decider

Verso una nuova distribuzione d’età bimodale agli US Open

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 6 settembre 2019 – Traduzione di Edoardo Salvati

Con due giocatori e due giocatrici di età inferiore ai 23 anni nelle semifinali degli US Open, stiamo assistendo alla prima ondata di una nuova dominante generazione negli Slam?

È da diverso tempo ormai che la presa di potere dei trentenni è l’argomento più dibattuto nel tennis. C’è estrema familiarità relativa alle statistiche sulla predominanza di giocatori con almeno 30 anni nelle fasi finali degli Slam, statistiche generate in larga parte (anche se non totalmente) dai Grandi Tre tra gli uomini e da Serena Williams tra le donne.

Se la generazione di giocatori nati all’inizio degli anni ’90 ha quasi perso le speranze di rubare uno Slam dalla bacheca dei Grandi Tre, gli US Open 2019 sono stati palcoscenico dei primi forti segnali che la generazione immediatamente successiva — cioè i giocatori nati a metà o verso la fine degli anni ’90 — farà di tutto per interrompere la siccità di titoli.

Matteo Berrettini, 23 anni, ha perso in semifinale contro Rafael Nadal e Daniil Medvedev, anche lui ventitreenne, è riuscito a fare meglio di un turno, dovendosi però poi arrendere al quinto set sempre contro Nadal in finale. Fosse uno dei due riuscito nel risultato a sorpresa, per la prima volta dopo undici Slam si sarebbe avuto un vincitore diverso da Novak Djokovic, Roger Federer o Nadal. E sarebbe stata la prima volta di un giocatore sotto i 23 anni a vincere uno Slam da quando Djokovic ha conquistato gli Australian Open 2011.

Uomini

Già comunque arrivare nei quarti di finale è stata un’impresa ragguardevole. Ne è prova il confronto tra la distribuzione d’età dell’edizione 2019 e quella delle edizioni passate: spiccano due evidenti mode a 23 anni e 33 anni. Serve tornare indietro fino al 2003 per trovare una situazione in cui il valore dell’età era polarizzato così in basso e così in alto allo stesso tempo. Quell’anno infatti Andre Agassi (33) raggiunse la semifinale, Younes El Aynaoui (32) perse ai quarti di finale e un gruppo di ventunenni ottenne un risultato simile o migliore, tra cui Guillermo Coria, David Nalbandian e Andy Roddick, che vinse poi il torneo.

IMMAGINE 1 – Composizione dell’età di giocatori e giocatrici che hanno raggiunto i quarti di finale degli US Open nel periodo dal 2000 al 2019

Donne

Tra le donne, si è già osservato un ciclo simile. Il più recente divario tra mode è stato agli US Open 2015, probabilmente una delle edizioni più strane del tabellone di singolare femminile, a partire dalla sconfitta inattesa di Williams contro Roberta Vinci, oltre alla finale tutta italiana tra la stessa Vinci (32) e Flavia Pennetta (33). Viste le peculiarità del 2015, forse è meglio guardare al 2014 come inizio del cambiamento arrivato a maturazione nel 2019. È stato l’anno infatti in cui Belinda Bencic ha raggiunto i quarti di finale a 17 anni.

Ora ventiduenne, Bencic nel 2019 ha perso la semifinale con un’altra giovanissima, Bianca Andreescu (19), vincitrice poi del torneo contro Williams, che ha rappresentato chiaramente un’eccezione in termini di età. Il 2019 infatti è il primo anno dal 2011 in cui solo una giocatrice sopra i 30 anni ha raggiunto i quarti di finale.

Tra gli uomini invece sono cinque le edizioni consecutive in cui 3 o 4 dei giocatori nei quarti di finale hanno avuto almeno trent’anni. Si dovesse verificare un andamento che rispecchia quanto accaduto tra le donne, quel tipo di sequenza sarà solo un ricordo del passato.

Ages at the US Open are Getting Bimodal, Again

Chi ha un vantaggio alla vigilia degli US Open?

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 24 agosto 2019 – Traduzione di Edoardo Salvati

Con l’ultimo Slam dell’anno ai blocchi di partenza, è il momento adatto per interrogarsi sulla bravura relativa del campo partecipanti e su quali giocatori e giocatrici si sono allenati più intensamente nell’anno passato per migliorare il vantaggio competitivo sul cemento.

Prendiamo spesso a riferimento la trasferta nordamericana di luglio e agosto come segnale premonitore di cosa potrà accadere gli US Open. Se il Cincinnati Masters (l’ultimo Master prima degli US Open) fosse di qualche indicazione — con la vittoria di Daniil Medvedev contro David Goffin — sarebbe proprio che dal tabellone principale di New York bisogna aspettarsi l’inaspettato.

Medvedev…infuocato

In russo, la parola “fuoco” si scrive “Пожар” e si pronuncia prozhar. È così che chiamerò Medvedev per le prossime due settimane, Пожар-Medvedev, visto che è riuscito ad arrivare in finale in tutti i tornei sul cemento che ha giocato della US Open Series, sconfiggendo anche Novak Djokovic in semifinale a Cincinnati. Questa striscia vincente gli ha permesso di entrare tra i giocatori che più si sono migliorati sulla superficie nelle precedenti 52 settimane. Meglio ancora, tra i quindici giocatori con la valutazione più alta all’inizio degli US Open, (Пожар) Medvedev ha ottenuto il secondo posto per punti guadagnati (+307), appena dietro ai 323 punti di Albert Ramos.

IMMAGINE 1 – Variazione nelle valutazioni specifiche per cemento tra il 2018 e il 2019 per quei giocatori con una valutazione attuale di almeno 2100 punti. In giallo i giocatori con un guadagno di almeno 200 punti

Un salto di 300 o più punti nelle valutazioni da un anno all’altro è raro, specialmente tra giocatori che già si esprimono ad altissimo livello. Negli ultimi 20 anni, i cinque giocatori che più si sono migliorati prima degli US Open sono nomi ben noti. Solo uno di essi però poi si è spinto avanti nel torneo (Guillermo Coria, con il quarto di finale nel 2003). Siamo quindi indotti a pensare che la regressione di rendimento verso la media, o il possibile affaticamento da un numero di partite nei tornei di preparazione superiore a quello inizialmente ipotizzato, agiscano da contrappeso alla fiducia che questi giocatori possono aver acquisito.

La corsa di Kenin e Andreescu

In campo femminile, il rimescolamento nelle valutazioni è per certi versi più interessante rispetto a quanto visto per gli uomini. In linea con gli ultimi anni negli Slam femminili, ci si aspettava che pochi punti separassero le favorite per la vittoria. Nessuno però probabilmente pensava che due delle più forti contendenti, Sofia Kenin e Bianca Andreescu, scalassero le valutazioni così velocemente.

Esattamente un anno fa, Kenin aveva 350 punti in meno. Se non fosse impressionante a sufficienza, il guadagno di Andreescu è stato ancora più clamoroso. In soli 12 mesi, la fenomenale canadese ha migliorato di circa 600 punti. Siamo di fronte a un vero salto dimensionale: per avere un riferimento, sono 100 punti in più anche del miracoloso rientro di Kim Clijsters al professionismo tra il 2009 e 2010.

IMMAGINE 2 – Variazione nelle valutazioni specifiche per cemento tra il 2018 e il 2019 per quelle giocatrici con una valutazione attuale di almeno 2100 punti. In rosso le giocatrici con un guadagno di almeno 200 punti

Per molti dei giovani giocatori e giocatrici del Nord America è l’occasione perfetta per innalzare il livello di gioco. Se a queste dinamiche uniamo la crescita di Coco Gauff, il titolo di Madison Keys a Cincinnati e il ritorno al vertice di Serena Williams, il tifo per i rappresentanti del continente americano non avrà soste.

Who Has the Momentum Going into the US Open?

Una statistica per le partite assolutamente da non perdere

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 9 agosto 2019 – Traduzione di Edoardo Salvati

Per l’appassionato di tennis, la scelta di quale partita guardare in un qualsiasi torneo è spesso fonte di grattacapo. In questo articolo, cerco di determinare quanto una partita è imperdibile in funzione della sua qualità e competitività, ricorrendo alle valutazioni dei giocatori.

Molte volte in passato, o anche per la trasferta nordamericana in corso, l’abbondante offerta di partite televisive vi avrà certamente posto di fronte a un bivio. Conoscete il motivo della scelta che avete fatto? Avete optato per la partita in programma sul campo più importante? Per il giocatore con la classifica più alta? O avete seguito il vostro istinto sulla partita che pensavate sarebbe stata più equilibrata?

Specialmente nei primi turni di eventi congiunti tra donne e uomini, il timore di rimanere lontani dal centro dell’azione è una delle circostanze che genera più ansia per il vero seguace di tennis. Naturalmente, la possibilità di cambiare canale per una o l’altra partita ci convince che, in fondo, prendere una decisione non è obbligatorio. Ma non è questo il modo di mantenere viva la passione.

Dove sarà l’esperienza visiva più emozionante?

Forse è solo perché sto invecchiando, ma mi capita spesso di desiderare che la scelta sulla partita da guardare fosse più semplice. O che avessi almeno modo di prevedere dove sarà l’esperienza visiva più emozionante in qualsiasi istante. Di solito, faccio riferimento alle quotazioni assegnate dagli allibratori alle partite in programma, così da avere un’idea di quelle il cui esito finale è considerato più incerto. Mi accorgo però poi che la mia propensione non è sempre per la partita più combattuta. Complessivamente, anche la qualità è un fattore chiave. E sarei disposta ad accettare quote meno favorevoli se il livello di gioco di entrambi i giocatori rimanesse ragionevolmente alto.

Ne ho parlato a lungo con Martin Ingram, già ospite del blog, che condivide l’ossessione per interrogativi di questo tipo e che riesce sempre a trovare una soluzione ingegnosa alla maggior parte dei problemi prima che a me venga in mente. Siamo d’accordo sul fatto che competitività e qualità non sono elementi sufficienti a far decollare una grande partita (stili differenti e scontri diretti sono altri due, ad esempio), ma certamente permettono di pescare nel mucchio con buona probabilità di riuscita.

L’idea di base è di arrivare a una statistica che unisca una misura della qualità e della competitività. In termini matematici:

Partita imperdibile = Competitività + Qualità

Visto che le valutazioni dei giocatori sono il sistema principale per misurarne la bravura relativa, possiamo prenderle a riferimento sia in termini di abilità complessiva (la qualità) che in termini di divario di capacità tra un giocatore e l’altro (competitività).

Qualità

Per definire la qualità, basta la semplice somma delle valutazioni dei giocatori. È un concetto simile a quello del “bonus” secondo la descrizione di Klaasen e Magnus. L’immagine 1 mostra la distribuzione della qualità per le partite del circuito maggiore nel 2019. Pur con una media leggermente più alta per gli uomini, in entrambi i casi assistiamo a un’importante deviazione verso destra. Quella coda, il gruppo di partite con valore maggiore di 5000, racchiude gli scontri di più alta qualità della stagione.

IMMAGINE 1 – Distribuzione della qualità per le partite dei due circuiti maggiori nel 2019

Competitività

Nella sostanza, la competitività invece si riduce al divario tra le valutazioni dei giocatori. Questo è il “malus” nel linguaggio di Klaasen e Magnus. Anzi, la differenza di valutazioni è l’unica quantità veramente casuale nei pronostici sia con Elo che con altri sistemi di previsioni basati sulla comparazione tra giocatori.

IMMAGINE 2 – Distribuzione della competitività per le partite dei due circuiti maggiori nel 2019

La distribuzione di competitività nell’immagine 2 mostra scarsa differenza tra i due circuiti. Inoltre, la pesante deviazione verso destra segnala che è più tipico trovarsi di fronte a una partita molto equilibrata che a una a senso unico. Staremmo parlando di uno sport molto più interessante se la distribuzione non esibisse questo tipo di distorsione.

Da un lato, abbiamo molte partite di qualità ma pochissime di massima qualità, mentre dall’altro sono minori le partite competitive ma è relativamente più frequente che una partita sia competitiva di quanto sia a senso unico. In presenza di proprietà tra loro opposte, come riusciamo a mettere insieme queste due misure?

Un solo numero

Un’idea è quella di concentrarsi sulla qualità, prevedendo però una penalizzazione in funzione della scarsa competitività. Si esprime la competitività come la probabilità di vittoria attesa per il giocatore più forte, per poi quantificare la probabilità di vittoria attesa rispetto alla partita più competitiva (quella in cui la probabilità di vittoria è del 50%).

Partita imperdibile = (Qualità – Media)*(1-(p(v)-0.5))

In questo modo, il valore delle partite con qualità sopra la media è ridotto in proporzione della distanza in punti percentuali da una partita equilibrata. Possiamo verificare in concreto il funzionamento di questo approccio guardando alle prime dieci partite imperdibili del 2019 per uomini e donne. Anche se l’obiettivo dichiarato è di stabilire il livello di qualità tra partite della stessa settimana e turno di gioco, possiamo comunque ricavare una prima impressione della validità della statistica.

Il predominio dei Grandi Tre tra gli uomini e quello di Simona Halep, Serena Williams e Ashleigh Barty tra le donne suggerisce che siamo sulla buona strada. In retrospettiva, un paio di partite non hanno mantenuto il carico d’interesse atteso alla vigilia, fra tutte la finale maschile degli Australian Open e la finale femminile di Wimbledon.

Naturalmente, non ho la pretesa che la statistica per le partite assolutamente da non perdere qui introdotta incontri un favore universale. Sono convinta però che fondendo i due ingredienti chiave di una partita in un solo numero, si ha a disposizione un valido strumento per scegliere cosa vedere in televisione o analizzare a ritroso quali sono state le partite che hanno confermato o disatteso le aspettative riposte.

A Stat for Must-See Matches

Unicorni nel circuito femminile

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 12 luglio 2019 – Traduzione di Edoardo Salvati

Con l’avvio della trasferta nordamericana di preparazione agli US Open, Ashleigh Barty si presenta nella parte conclusiva del calendario con la valutazione più alta del circuito femminile in singolo e in doppio. Solo Serena Williams, negli ultimi dieci anni, ha mostrato un dominio simultaneo di questa portata in entrambe le specialità.

Il ritorno al vertice di Simona Halep con la vittoria a Wimbledon contro Williams e la conferma del titolo di Novak Djokovic contro Roger Federer, oltre alla semifinale tra Federer e Rafael Nadal, sono temi molto rilevanti, ma continuo a desiderare qualcosa di veramente diverso che metta in discussione l’ordine precostituito del tennis.

Il nuovo che avanza?

L’ascesa di Barty al primo posto della classifica e l’incredibile parabola di Coco Gauff a Wimbledon sono gli esempi più recenti di nuovo che avanza. Possiamo attenderci simili dinamiche per il proseguo della stagione? In cerca di una risposta, ho analizzato le classifiche più recenti delle valutazioni specifiche per il cemento, utilizzando la variazione del margine di vittoria associata alle valutazioni Elo (argomento di cui ho parlato più tecnicamente alla conferenza Mathsport International ad Atene)

Ho ipotizzato che le valutazioni del doppio vengano generate da partite di singolare contro ciascuna avversaria di doppio. Riconosco che è un calcolo un po’ strano, ma penso fornisca comunque una misurazione ragionevole della bravura relativa sulla base delle sole partite di doppio.
L’immagine 1 riepiloga le prime 10 giocatrici di singolare e doppio secondo questo criterio. Cosa si nota?

IMMAGINE 1 – Elenco delle prime 10 giocatrici di singolare e doppio sulla base del margine di vittoria Elo

Mi colpisce la presenza di Barty al primo posto anche nel doppio. Ho pensato quindi che sia un evento raro, vista l’abitudine delle giocatrici di vertice di concentrarsi quasi esclusivamente sul singolare, almeno negli ultimi anni. Mi viene in mente il termine “unicorno” e come sia diventato l’appellativo di riferimento per le start up che raggiungono una valutazione superiore al miliardo di dollari.

Ho trovato degli unicorni nel tennis?

Per verificare la rarità di una contestuale presenza al vertice di singolare e doppio nel tennis femminile moderno, ho considerato il margine di vittoria associato alle valutazioni Elo di tutte le superfici raggiunto da ciascuna giocatrice in singolare e in doppio per ogni anno dal 2003. Ho classificato le giocatrici sulla base della miglior valutazione stagionale e raggruppato le prime 5 per ogni stagione in singolare e in doppio. Ho determinato un numero minimo di 8 partite in doppio per un dato anno, in modo da creare una casistica ampia a sufficienza da ricomprendere singolariste di buon livello che giocano in doppio solo negli Slam ma riescono a superare il primo turno abbastanza spesso.

In poco più di 15 anni, solo 7 giocatrici hanno raggiunto il vertice in singolare e in doppio nella stessa stagione. E solo Serena, oltre a Barty, è arrivata in cima in entrambe le specialità in un qualsiasi momento della carriera. Se avessi potuto procedere a ritroso ancora per qualche anno, è probabile che anche Venus Williams e Lindsay Davenport sarebbero entrate nell’elenco. E, ancora più indietro, Martina Navratilova sarebbe stata un chiaro esempio di unicorno dei primi anni della WTA, un periodo in cui essere forti in singolare e in doppio era forse più frequente.

La rarità di Barty

Tornando ai tempi nostri, mi convinco sempre più che Barty sia una giocatrice speciale. La media di 2467 della sua valutazione massima, sulla base del rendimento alla settimana del 12 luglio 2019, è superata solo dalle stagioni 2009-2010 e 2012-2013 di Serena. Va detto che se Barty è al momento la giocatrice di doppio più forte sul cemento, spetta a Timea Babos la valutazione più alta su tutte le superfici.

IMMAGINE 2 – Giocatrici al vertice del singolare e del doppio nel periodo dal 2003 al 2019

È interessante anche come, dopo il 2010, Victoria Azarenka (di cui Barty è stata compagna di doppio più volte quest’anno) sia l’unica altra giocatrice a raggiungere lo status di unicorno. E delle restanti quattro — Davenport, Dinara Safina, Kim Clijsters e Venus Williams — solo Venus e Safina ci sono riuscite negli ultimi 15 anni.

Senza Serena e Barty, sarebbero state poche le circostanze per la WTA di osservare le più forti singolariste darsi da fare anche in doppio. È un richiamo a quanto i circuiti maschile e femminile sembrino in realtà una raccolta di sotto-circuiti diversi, con alcuni che giocano solo il singolare, alcuni solo il doppio e gli altri un po’ in uno e un po’ nell’altro.

Servono altre condizioni per il successo del doppio

È già di per sé abbastanza curioso che Barty sia diventata la numero 1 in singolare evitando di trattare il doppio come una sorta di sessione di allenamento. Il fatto che questo sia accaduto in un momento in cui il doppio sta generando grande eco, lo rende ancora più avvincente. Alcune delle soddisfazioni maggiori in doppio nel 2019 sono arrivate dal ritorno in campo di Andy Murray al Queens e dal debutto della coppia Murray-Serena nel misto a Wimbledon. Se si pensa anche all’entusiasmo del confronto tra Roger Federer e Serena in doppio alla Hopman Cup, si è portati a credere che il 2019 sia l’anno del doppio.

La triste realtà è che si lega il successo del doppio in larga parte al quasi ritiro in singolare di Murray. E non sono queste le circostanze di cui c’è bisogno perché un giocatore di vertice in singolare si dedichi più spesso al doppio. Però, con la Hopman Cup dal futuro incerto e ulteriori tornei in singolare e di squadra che cercano di farsi strada in calendario, il tennis non lascia troppe opzioni ai giocatori. Già ne si vedono le conseguenze su Barty, costretta al ritiro negli ultimi due tornei di doppio.

Se si trovasse un modo di appoggiare i giocatori e le giocatrici che più promettono di eccellere in singolare e in doppio, gli unicorni nel tennis non sarebbero poi così rari.

Unicorns of the WTA

Come Ashleigh Barty è diventata la più forte del mondo

di Stephanie Kovalchik // OnTheT (su TheConversation)

Pubblicato il 26 giugno 2019 – Traduzione di Edoardo Salvati

Ashleigh Barty è diventata una celebrità del tennis mondiale. Dopo aver vinto il primo titolo Slam al Roland Garros 2019, la giovane stella australiana ha aggiunto un altro importante traguardo in carriera, il numero uno della classifica mondiale WTA. Almeno da un punto di vista dell’ufficialità, è la più forte giocatrice del mondo. Barty è diventata solo la 27esima donna nella storia del tennis ad arrivare in cima alla classifica e la seconda australiana dopo Evonne Goolagong Cawley 43 anni fa.

Con appena 166 cm di altezza, poco per gli standard del tennis moderno, e un sorriso da ragazza della porta accanto, in pochi avrebbero pensato che Barty possedesse i requisiti per issarsi fino ai massimi livelli dello sport. Chi però ci ha giocato contro o ha seguito la sua evoluzione da vicino, può testimoniare sul fatto che Barty è una giocatrice speciale. Questo è emerso con chiarezza anche in un recente sondaggio sul New York Times che ha coinvolto 20 professionisti, allenatori e analisti, nel quale ammirazione e rispetto per la tecnica di Barty hanno trovato riscontro unanime.

Tra le giocatrici contemporanee, gli esperti considerano il rovescio tagliato e il gioco a rete di Barty come i migliori in assoluto. Aggiungono anche che solo Serena Williams può tenerle testa in termini di efficacia della seconda di servizio e che quando si parla di tocco e sensibilità complessive, in poche la superano.

Bravura tecnica e acume tattico

La mole di numeri che abbiamo analizzato con il Game Insight Group di Tennis Australia, la federazione australiana, conferma le opinioni espresse nell’articolo del New York Times. Utilizzando alcuni dei dati più completi a disposizione nel tennis, tra cui le informazioni derivanti dalla tracciatura continua del movimento della pallina e dei giocatori durante la partita, il Game Insight Group ha sviluppato un insieme di statistiche di rendimento che prendono il nome di Player DNA, con l’obiettivo di comprendere tecnica e atteggiamento dei giocatori.

Il Player DNA di Barty rivela una giocatrice dalla notevole combinazione di punti di forza: perfetta tecnica d’insieme, incredible agilità, resistenza fisica e mentale fuori dal comune. Secondo le statistiche del Game Insight Group, tra le giocatrici che hanno partecipato agli Slam negli ultimi anni, la valutazione tecnica di Barty raggiunge — su un massimo punteggio possibile di 100 — l’89.0 al servizio, l’86.3 sul dritto e il 90.9 sul rovescio. In quanto a bravura tecnica complessiva, Barty è saldamente tra le prime dieci giocatrici in attività, a dimostrazione che pur essendo il rovescio il colpo maestro, può comunque fare affidamento su un ampio arsenale in qualsiasi situazione.

I numeri del Player DNA evidenziano anche un acume tattico che rende il gioco di Barty eccezionale. Nel tennis contemporaneo, il controllo dello spazio e del ritmo dello scambio è un fattore chiave per il successo. Barty ottiene un punteggio dell’88.5 in uno degli indici più importanti in questo senso, cioè il “controllo del campo”, che misura l’efficacia di una giocatrice nella conquista del punto da una posizione di campo più vantaggiosa. In poche hanno valori più alti, e questo è controprova dell’abilità fuori dal comune di Barty di sfruttare al meglio opportunità strategiche negli scambi.

Agilità e resistenza

La bravura tecnico-tattica di Barty è favorita da un’agilità rimarchevole che le permette di muoversi con facilità e solidità in ogni zona del campo. Il 93.9 nella statistica sull’agilità del Player DNA ne fa il suo attributo fisico più preponderante. È la qualità degli spostamenti che ha permesso a Barty di essere una delle pochissime giocatrici di questa era a trovarsi contemporaneamente al primo posto della classifica di singolare e di doppio, avendo vinto Slam di entrambi i tabelloni.

Quasi identica all’agilità è la resistenza di Barty, con un 91.1 secondo le statistiche del Game Insight Group. Solo nel 2019, ha giocato 13 partite al terzo set, di cui due nella cavalcata alla vittoria del Roland Garros, con un record di nove vittorie e tre sconfitte. Vincere costantemente in circostanze di massima richiesta fisica presuppone anche una grande tenuta mentale. La necessità di possedere fisico e mente è diventata sempre più pressante, visto che l’espansione geografica e d’intensità del circuito non sembra avere interruzioni. Ulteriore conferma di come una giocatrice delle caratteristiche di Barty abbia prosperato in questo tipo di contesto.

I vantaggi di una pausa dal tennis

È una coincidenza non casuale che nell’anno in cui Barty diventa per la prima volta la numero uno del mondo viene pubblicato “Range”, il libro di David Epstein sul valore di un’impostazione generalista nella ricerca dell’eccellenza (rispetto alla iper-specializzazione che è stata così a lungo il riferimento). Qualcuno nel mondo del tennis avrebbe potuto interpretare la decisione di Barty di prendere una pausa a diciotto anni per giocare nella Big Bash League — proprio quando la carriera di una tennista sta per decollare — come l’avvio della fase di declino.

Con il senno di poi, quell’interruzione sembra aver avuto un effetto esattamente contrario. E, come sostiene Epstein, per una valida ragione. Così come Roger Federer, che durante l’adolescenza si è dedicato a diversi sport, l’esperienza di Barty con il cricket è stata parte essenziale nell’acquisizione di versatilità, maturità e creatività, che l’hanno distanziata dalla maggior parte delle colleghe. È diventata la tennista di oggi proprio perché ha voluto inseguire altri interessi a inizio carriera, non perché si è dedicata esclusivamente al tennis.

Pur di fronte a notorietà e preminenza, Barty conserva umiltà e piacevolezza di spirito, in campo e fuori. I tifosi australiani conoscono meglio di tutti la delusione che può scaturire quando soldi, notorietà social e immaturità adolescenziale collidono nello sport d’élite. Che Barty sia riuscita a mantenere integrità e rimanere fedele ai suoi valori durante la corsa alla vetta è ragguardevole. Quali siano i futuri successi, oltre che per le prodezze tennistiche Barty si è certamente guadagnata l’ammirazione del pubblico anche per la reputazione.

The numbers game: how Ash Barty became the world’s best female tennis player

Un semplice classificatore di stili di gioco alla prova

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 17 aprile 2019 – Traduzione di Edoardo Salvati

Qualsiasi indicatore di stile di gioco ha valenza in funzione della capacità di informare su un determinato giocatore più della sua bravura complessiva. Se applichiamo questa linea di giudizio a categorie di stili di gioco derivate da statistiche di base della partita, cosa otteniamo? 

Nell’ultimo di una serie di articoli sugli stili di gioco, cerco di capire se queste categorie sono in grado di migliorare la previsione sull’esito di una partita. Le statistiche in questione sono solo quattro – frequenza di ace e doppi falli, differenza nelle percentuali di punti vinti sulla prima e sulla seconda di servizio, durata media degli scambi – e sono quanto di meglio disponibile in termini aggregati per misurare determinati aspetti della prestazione di un giocatore che vanno oltre le qualità oggettive.  

In precedenza, ho valutato le conseguenze (o effetti) per i giocatori che hanno partecipato agli Slam su ognuna di queste statistiche e trovato che, tramite algoritmo k-means, 10 raggruppamenti erano una scelta ragionevole al fine di ridurre la varianza infragruppo. Ma come possono diventare utili? Se riteniamo che il confronto di stili abbia un peso, allora dovremmo attenderci che questi raggruppamenti migliorino le nostre aspettative per il risultato di almeno alcuni di questi scontri tra stili di gioco. 

È davvero così? Un po’ di statistica..

Per mettere alla prova lo scontro tra stili di gioco, dobbiamo partire dalla previsione di base di nostra scelta. Nel mio caso, la previsione fa uso delle valutazioni dei giocatori specifiche per superficie ed è determinata dalla differenza fra valutazioni tra il giocatore i e il giocatore j, che possiamo denominare Dij.

Ipotizziamo ora che anche la singola partita abbia una categoria di stile. Se il giocatore i appartiene a un raggruppamento di stile ki e il giocatore i a un gruppo di stile kj, e Jkè un vettore a K-elementi con valore 1 nel k-esimo posto e valore zero in tutti gli altri, possiamo assegnare un effetto stile per quella specifica partita, ϕ(ki, kj) definito come J′kiΦJkj, per una matrice K per K di parametri di stile Φ.

Il modello logistico che determina l’effetto stile è: 

log(pij/(1 − pij)) = βDij + ϕ(ki, kj).

Considerato che l’effetto ϕ(ki, kj) dovrebbe avere un effetto complementare per il giocatore j, cioè ϕ(ki, kj) = − ϕ(ki, kj), adattiamo il modello solo in termini del triangolo inferiore di Φ, dove ki kj. Con K = 10, risultano 55 effetti stile.  

Adattamento

Ho adattato il modello logistico appena descritto a tutte le partite (tra i giocatori che hanno partecipato agli Slam) almeno di livello Challenger tra il 2014 e il 2017. Ho poi applicato l’effetto stile per correggere la previsione di base per le partite giocate nel 2018. Dei 55 effetti stile delle partite oggetto del test, 19 hanno mostrato un miglioramento nella funzione di classificazione log-loss delle previsioni. Come si vede dal grafico dell’immagine 1 però, si tratta di un miglioramento ridotto se non per alcuni scontri tra giocatori. 

IMMAGINE 1 – Scontri di stile di gioco che migliorano la previsione delle partite del circuito maschile

In assenza di un contesto, sono scontri che hanno poco significato. Possiamo dare un’interpretazione a questi risultati analizzando specifici accostamenti giocatore-avversario che rientrano in ognuno dei gruppi più significativi, per osservare come la correzione generata dallo stile modifichi la previsione di quelle determinate partite.  

Raggruppamento 6 contro 7

L’immagine 2 mostra un campione degli scontri tra giocatori appartenenti al raggruppamento 6:7, quello con il maggior miglioramento predittivo di tutti gli scontri di stile.

Tre dei giocatori del raggruppamento 6 sono Ernests Gulbis, Feliciano Lopez e Jeremy Chardy. La caratteristica distintiva è un servizio più potente della media, una seconda più accurata della media, una differenza più ridotta della media tra punti vinti sulla prima e sulla seconda e una velocità di gioco superiore alla media.

IMMAGINE 2 – Esempi di scontri tra giocatori dal raggruppamento di stile 6:7

Nel raggruppamento di stile 7 invece, ci sono giocatori con un servizio meno potente, una maggiore frequenza di doppi falli, una differenza più ampia tra punti vinti sulla prima e sulla seconda e con un gioco caratterizzato da scambi più lunghi. Tra questi, Kei Nishikori, Rogerio Dutra Silva e Novak Djokovic.

L’effetto stile nello scontro tra questo raggruppamento e quello precedente non è favorevole a giocatori come Gulbis, Lopez e Chardy. La previsione di base infatti subisce un aggiustamento verso il basso, e più spesso sembra essere stata questa la direzione corretta.

Raggruppamento 6 contro 8

Il raggruppamento di stile 8 ha una marcata somiglianza con il 7, ma si distingue per una prima di servizio in media più potente e minori rischi con la seconda. Troviamo giocatori come Denis Istomin, Filip Krajinovic, e Philipp Kohlschreiber. È interessante notare che gli aspetti in comune dei raggruppamenti 7 e 8 generino uno scontro altrettanto forte con i giocatori del raggruppamento 6, a cui possiamo aggiungere Gilles Muller.

IMMAGINE 3 – Esempi di scontri tra giocatori dal raggruppamento di stile 6:8

In questo caso gli scontri determinano, in generale, una minore correzione verso il basso. Gli esempi suggeriscono comunque un rendimento peggiore più frequente per i giocatori del raggruppamento 6 contro quelli del raggruppamento 8.

Raggruppamento 5 contro 10

Lo scontro successivo è tra i giocatori del raggruppamento di stile 5 e quelli del raggruppamento 10, al terzo posto per miglioramento predittivo delle partite del campione testato. I giocatori del raggruppamento 5 si mettono in mostra per avere una differenza di rendimento ridotta tra la prima e la seconda senza però servire molti ace. Rappresentano anche il secondo gruppo dal ritmo di gioco più lento sul circuito. Tre giocatori in questa categoria di stile sono Jordan Thompson, Pablo Cuevas e Juan Martin Del Potro.

Il raggruppamento 10 è diametralmente opposto al 5, con un’alta frequenza di ace, un divario più ampio della media nel rendimento tra la prima e la seconda e uno dei ritmi di gioco più rapidi del circuito. Troviamo giocatori come Fabio Fognini, David Goffin e Mackenzie McDonald.

Il campione di partite dell’immagine 4 mostra che il raggruppamento 5 subisce le maggiori conseguenze quando si scontra con lo stile aggressivo e velocizzato dei giocatori del raggruppamento 10.

IMMAGINE 4 – Esempi di scontri tra giocatori dal raggruppamento di stile 5:10

Conclusioni

Emergono alcuni risultati positivi da una prima analisi del valore predittivo di categorie di stile basate sull’aggregazione delle più semplici statistiche di una partita. Almeno una parte degli scontri esaminati fa vedere un guadagno effettivo in termini di aspettative, e suggerisce che è possibile raggruppare i giocatori in funzione dello stile con un certo grado di ragionevolezza. Sarebbe interessante studiare come l’aggiunta di altri dettagli legati ai giocatori – ad esempio l’altezza, la mano dominante, il tipo di rovescio – contribuisca a migliorare i risultati. Da quanto osservato sinora, sembra che sia la giusta direzione per affrontare agli scontri diretti con un nuovo metodo d’indagine.

Putting a Basic Playing Style Classifier to the Test

Salite e discese nelle prime settimane di terra battuta

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 26 aprile 2019 – Traduzione di Edoardo Salvati

Dopo le prime settimane sulla terra battuta europea, quali sono i giocatori e le giocatrici che si sono fatti notare e quali invece sono rimasti nelle retrovie? Vediamo i venti che più hanno fatto aumentare e diminuire il loro valore sulla terra. 

Con l’avvicinarsi della fine del mese, sono diversi i tornei sulla terra di entrambi i circuiti da cui ricavare prestazioni inattese o rendimenti negativi. Sulla base della variazione del margine di vittoria associato alla valutazione Elo specifica per la terra per i primi 23 giorni di aprile, ho classificato i dieci giocatori e giocatrici con il maggior guadagno e i dieci giocatori e giocatrici che più hanno faticato a tenere il passo.  

Uomini

Benoit Paire si prende il primo posto con un guadagno totale di +100 punti di valutazione Elo specifica, soprattutto grazie alla vittoria a sorpresa a Marrakech, in cui ha battuto Jaume Munar e Jo-Wilfried Tsonga. Oltre a Paire, tra i giocatori con la classifica più alta nei dieci che più si sono migliorati troviamo Fabio Fognini, il cui titolo a Monte Carlo, battendo Rafael Nadal in semifinale, gli ha fatto guadagnare +91 punti. C’è poi il connazionale Lorenzo Sonego, che ha superato almeno tre turni sia a Marrakech che a Monte Carlo.

IMMAGINE 1 – Variazioni nella valutazione Elo specifica per la terra tra gli uomini

L’ultimo e terzultimo posto dei peggiori è occupato rispettivamente da Mischa Zverev e Alexander Zverev, alimentando, specialmente per Alexander, i dubbi sulle possibilità di titolo al Roland Garros.

Donne

Anche se sono poche le giocatrici a essere scese in campo nei primi eventi sulla terra battuta del circuito, qualche nome conosciuto compare tra le dieci con la maggiore variazione Elo specifica. Dopo gli ottimi risultati sul cemento, Belinda Bencic e Amanda Anisimova stanno facendo vedere di essere in forma anche sulla terra.

IMMAGINE 2 – Variazioni nella valutazione Elo specifica per la terra tra le donne

Non ci sono grosse sorprese tra le giocatrici che hanno fatto peggio al momento sulla terra, e questo lascia intendere di potersi aspettare molte contendenti per la vittoria finale al Roland Garros.

Early Ups and Downs on Clay

Di nuovo sull’uso delle statistiche della partita per classificare gli stili di gioco

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 12 aprile 2019 – Traduzione di Edoardo Salvati

In un precedente articolo, ho cercato di capire se statistiche di base della partita, come ace e minuti giocati per punto, potrebbero essere d’aiuto nella descrizione dello stile di gioco. Oggi, approfondisco le caratteristiche delle tipologie di stili ed esamino i raggruppamenti di stili di gioco che ne emergono.  

La volta scorsa ho fatto un piccolo esperimento con le ripercussioni dagli scontri diretti di due giocatori per verificarne il potenziale di determinazione di tipologie di stili di gioco tra loro differenti. Le ripercussioni analizzate erano la frequenza di ace e i minuti giocati per punto di un giocatore rispetto a quelli di un giocatore medio, stimati mediante modello gerarchico con ripercussioni da scontri diretti casuali. I risultati erano promettenti, con raggruppamenti in grado di separare, ad esempio, giocatori dal servizio notoriamente dominante da giocatori estremamente solidi in difesa. 

Probabilmente però, ace e durata dei punti non riescono a descrivere tutte le declinazioni degli stili di gioco come potrebbero fare le statistiche della partita. Dopo altre riflessioni e commenti di analisti di tennis su Twitter, ho deciso di includere i seguenti aspetti.

Frequenza di doppi falli

Dovrebbe far emergere quei giocatori che rischiano molto al servizio e quelli che invece non reggono la pressione. 

Differenza tra punti vinti sulla prima e sulla seconda di servizio

Per la maggior parte dei giocatori, ci si aspetta che il numero di punti vinti al servizio diminuisca quando devono servire la seconda. Stabilire quanta differenza ci sia tra le due situazioni potrebbe evidenziare particolari tecniche sulla seconda di servizio o quanto la capacità di attacco sia legata alla forza bruta del servizio.  

Differenza tra punti vinti sulla prima e alla risposta

Se i punti vinti sulla prima sono una misura della bravura complessiva al servizio – come summa della tecnica stessa al servizio, della tattica sul terzo colpo e della capacità di scambio – e se i punti vinti alla risposta lo sono dell’acume difensivo, la differenza dovrebbe allora aiutare a determinare il bilanciamento di un giocatore tra abilità in attacco e in difesa. 

Pur avendo considerato anche altri indicatori come il rapporto tra vincenti ed errori o la frequenza degli approcci a rete, sarebbe stato complicato trovare dati per più anni al di fuori degli Slam. Pensando inoltre alla scarsa frequenza dei punti a rete e alla variabilità nelle classificazione degli errori da un torneo all’altro, credo che l’affidabilità delle ripercussioni dagli scontri diretti avrebbe valore limitato se riferita alle sole partite degli Slam. Per il momento, quindi, le ho messe da parte.  

Correlazione tra caratteristiche

Prima di procedere con l’algoritmo di raggruppamento, dobbiamo capire il significato di queste caratteristiche e di come si rapportano alle altre. In tal senso, si può utilizzare un grafico di accoppiamento. L’immagine 1 mostra i risultati per i giocatori del circuito e per quelli che hanno giocato negli Slam per tutte le partite dal 2017 a oggi, in assenza di distinzione tra superfici. 

Tutte le ripercussioni sono su scala standardizzata, in modo da risultare centrate intorno allo zero e in un intervallo da -5 a +5, nella maggior parte dei casi. Ci sono diverse coppie che possiedono una correlazione positiva forte o moderata. La più solida è quella tra la frequenza di ace e la differenza tra punti vinti sulla prima e alla risposta, a indicazione del fatto che un servizio dominante potrebbe generare valori sopra la media per quest’ultimo indicatore. Vista la vicinanza di relazione tra queste due caratteristiche, escludo la differenza tra punti vinti sulla prima e alla risposta in modo da non ottenere una rappresentazione eccessiva dello stile associato a un servizio dominante. 

IMMAGINE 1 – Correlazione tra varie statistiche della partita per i giocatori del circuito maggiore

È interessante notare una correlazione simile tra la frequenza di doppi falli e la differenza tra punti vinti sulla prima e sulla seconda di servizio ma non con la differenza tra punti vinti sulla prima e alla risposta. Questo suggerisce che la frequenza di doppi falli può fornire indicazioni sulle scelte decisionali e sulla strategia in presenza di una seconda di servizio, che non verrebbero parimenti evidenziate da nessuna delle altre caratteristiche. Come ci si poteva attendere, data l’enfasi della maggior parte delle caratteristiche su aspetti del servizio, la durata dei punti possiede una correlazione nulla o negativa con il resto delle caratteristiche dello stile.

Identificazione dei raggruppamenti

Con qualche elemento in più, possiamo ora raggruppare i giocatori tramite algoritmo k-means, come fatto in precedenza. Il totale entro la somma dei quadrati identifica in 10 gruppi una scelta ragionevole per questo campione di giocatori. 

In presenza di quattro sole caratteristiche, la differenza di stile tra i raggruppamenti è facilmente visualizzata da un grafico a coordinate parallele, come nell’immagine 3. Ciascun colore rappresenta un raggruppamento di riferimento, e le linee più spesse la media del gruppo specifico di quel colore. Un dettaglio che emerge da subito è la rimarchevole variazione tra raggruppamenti per quanto riguarda la differenza tra punti vinti sulla prima e sulla seconda, vale a dire la variabile che più di tutte contribuisce a separare i raggruppamenti. All’opposto, la durata dei punti è quella in cui la distanza tra i raggruppamenti è minima.

IMMAGINE 2 – Raggruppamento tramite algoritmo k-means

IMMAGINE 3 – Raggruppamento di stili rispetto alla differenza nelle caratteristiche individuate

Utilità pratica

Il campione contiene più di 250 giocatori, rendendo difficile mostrare in modo compatto il raggruppamento di stile di ciascun giocatore. Possiamo selezionare i tre giocatori più rappresentativi per ogni raggruppamento mediante le ripercussioni da scontri diretti più adiacenti al centro geometrico del raggruppamento cui appartengono, come mostrato dalla tabella. La percentuale di giocatori che rientra in ciascun raggruppamento va dal 3% al 15%, con il raggruppamento 3 a essere il meno frequente e il raggruppamento 8 il più comune. 

L’utilità pratica di questi raggruppamenti è legata al loro potere predittivo. Se possono dare delucidazioni in termini di rendimento dei giocatori ai fini del risultato di una partita, rendimento che non sia già espresso dalla bravura complessiva (come valorizzata dalla classifica ufficiale o dalle valutazioni Elo), significa che esiste la speranza per rendere le ripercussioni da scontri diretti un fattore senza che siano legate al bilancio di vittorie e sconfitte, ma allo stile di gioco. Sarà questo l’argomento chiave del mio prossimo articolo sulla tematica.

More Exploration on Using Match Stats to Classify Playing Styles

Cosa possono dire le statistiche della partita sugli stili di gioco?

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 5 aprile 2019 – Traduzione di Edoardo Salvati

La conclusione più ovvia di un paio di miei recenti articoli sulle ripercussioni degli scontri diretti è probabilmente nota a tutti: possono esistere degli effetti, ma buona fortuna nel trovarli. Con campioni di dati così ridotti per la maggior parte degli scontri diretti, serve un modo per raggruppare giocatori “simili” tra loro. In questo articolo, cerco di capire se sia possibile creare categorie di giocatori in funzione dello stile di gioco, utilizzando statistiche di base della partita.

Quando Roger Federer ha giocato contro John Isner nella finale del Miami Masters 2019, in molti sono rimasti sorpresi nel ricordare che era la loro prima partita del circuito maggiore dal 2015. Tuttavia, che vi siano partite poco frequenti tra i giocatori di vertice è più una regola che un’eccezione, uno degli aspetti negativi della struttura del tennis professionistico (anche se, opinione personale, non sono coì attratta dal pensiero di avere Isner così spesso in finale).

Scontri diretti sporadici sono anche uno dei crucci degli analisti di tennis. Siamo spesso allettati dall’idea che una partita tra due specifici giocatori possa dare un impulso extra ai nostri modelli di rendimento, per poi ritrovarci in difficoltà ad applicare un metodo affidabile per misurare effetti così elusivi.

Raggruppamento per somiglianza

“Guadagnare forza prendendo a prestito” è una nozione diffusa in statistica e fa riferimento al concetto che si possa acquisire maggiore conoscenza di un certo tipo di informazione se la si osserva tramite informazioni a essa affini. È un po’ come quando, in presenza di membri della stessa famiglia, ci si rende conto che sono quel naso o quel mento a renderli distintivi rispetto alle altre persone. Raggruppare dati simili in statistica può avere il medesimo fine, aiutare cioè a capire più chiaramente quali sono gli elementi caratteristici di una fattispecie oggetto di analisi. Le ripercussioni degli scontri diretti hanno bisogno esattamente di questo tipo di soluzione.

Se raggruppare è davvero una questione di mettere insieme giocatori tra loro simili, dobbiamo avere a disposizione una modalità di misurazione della somiglianza. Cosa vuol dire che due giocatori sono simili? Beh, può avere molti significati. Ma se lo scopo è comprendere le ripercussioni degli scontri diretti, allora serve concentrare l’attenzione su quei giocatori con uno stile di gioco affine. La difficoltà risiede però nell’incertezza della quantificazione dello stile. Come per molte delle tematiche più interessanti sul rendimento nel tennis, anche dello stile è nota l’esistenza ma non il modo in cui misurarlo.

Idealmente, lo stile dovrebbe considerare la selezione di colpi di un giocatore e l’esito di ciascun tipo di colpo. Pur trattandosi di aspetti basilari, non è facile analizzarli con i dati pubblicamente disponibili, almeno non con continuità per la maggior parte dei giocatori di vertice.

Il contributo delle statistiche di base

Statistiche di base come la percentuale di prime in campo o i punti vinti alla risposta, etc, sono invece le informazioni più dettagliate che si riescono a ottenere per moltissime partite dei professionisti. A prima vista, possono sembrare di utilizzo limitato nella definizione di uno stile. Del resto, sono più direttamente collegate alla bravura relativa di un giocatore rispetto all’avversario in quello specifico giorno. Sarebbe però eccessivamente affrettato ignorare il loro contributo nella categorizzazione dello stile? Penso di sì. In fondo, contengono alcuni parametri, gli ace o doppi falli ad esempio, che sono il prodotto della tecnica al servizio e della propensione al rischio di un giocatore, e di cui chi è al servizio dovrebbe essere in controllo. Anche la durata di una partita è un’altra statistica che, in teoria, ha un collegamento diretto con la tendenza di un giocatore a rimanere nello scambio.

Come esperimento di partenza, ho verificato cosa si possa ricavare, in termini di somiglianza, dalla frequenza di ace e dai minuti giocati per singolo punto. Visto che siamo interessati al comportamento di un giocatore a prescindere dall’avversario, ho utilizzato un modello combinato per calcolare una frequenza media per ciascun giocatore su ogni superficie per le partite giocate dal 2017. Ho delimitato il campione a quei giocatori con almeno due apparizioni negli Slam, così da avere un gruppo che ha affrontato avversari simili in quell’intervallo temporale.

L’immagine 1 mostra i risultati per i giocatori del circuito maggiore. Si fa immediatamente notare l’assenza di una forte correlazione tra le ripercussioni di ace e minuti di gioco. Ero convinta che i giocatori con una media di ace per punti serviti più alta giocassero anche molto rapidamente. Per quanto sia questa la tendenza generale, la relazione è decisamente modesta.

IMMAGINE 1 – Correlazione tra ripercussioni di ace e minuti di gioco

Gli effetti più estremi

Ho evidenziato il 2% degli effetti più estremi. Nella parte in cui vi è un’alta frequenza di ace, emergono i soliti sospetti: Isner, Reilly Opelka e Ivo Karlovic, ad esempio. È una conferma che le ripercussioni generate dalla frequenza di ace sembrano funzionare più in termini di potenza complessiva che di semplice efficacia complessiva del servizio nel far vincere punti. Così succede a Rafael Nadal, che ha una frequenza di ace più bassa della media nonostante sia uno dei più bravi a vincere punti al servizio. Yoshihito Nishioka è all’estremo opposto. Con un’altezza di 174 cm, Nishioka è molto più basso del giocatore medio di uno Slam, e questo potrebbe essere il motivo della sua posizione nel grafico.

Per quanto riguarda le ripercussioni generate dai minuti giocati, è degna di nota la presenza di Nadal, Andy Murray e Novak Djokovic tra i giocatori con la maggiore durata per punto. È in linea con la loro caratterizzazione di fondisti dello scambio. Dal lato opposto, giocatori con un ritmo insolitamente veloce ma non tra i più potenti al servizio includono Dustin Brown e Florian Mayer. Potrebbero essere esempi di giocatori con uno stile aggressivo ma senza un servizio dominante.

Sei gruppi distinti

I casi estremi mettono in evidenza alcuni giocatori che sono più simili a determinati altri. Si può affrontare la questione procedendo per raggruppamento. Iniziamo semplicemente considerando cosa emergerebbe con un raggruppamento tramite algoritmo k-means sulle ripercussioni da scontri diretti sul cemento. La tendenza dell’errore all’interno del gruppo indica che una suddivisione in sei gruppi è il metodo meno complicato per organizzare i dati al fine di avvicinarsi alla varianza infragruppo più ridotta possibile.

IMMAGINE 2 – Raggruppamento tramite algoritmo k-means

L’immagine 3 mostra invece come quei gruppi si rapporterebbero alle ripercussioni generate dalla frequenza di ace e dai minuti giocati. Si vedono gruppi ben distinti che potremmo facilmente etichettare in modo separato, per la loro specifica combinazione di servizio intimidatorio e ritmo di gioco intenso.

IMMAGINE 3 – Rapporto tra raggruppamenti e ripercussioni di frequenza ace e minuti giocati

Conclusioni

Due attributi non sono sufficienti a esprimere tutte le sfaccettature di stile desiderate. È solo un piccolo esperimento, ma con alto potenziale. Siamo in grado di poter classificare tutte le declinazioni di stile solo dalle statistiche di base di una partita? Probabilmente no. Siamo in grado di classificare declinazioni di stile principali? Forse. O meglio, sono più convinta che ci sia possibilità di quanto non lo fossi prima di arrivare a questi risultati. Nella stima delle ripercussioni da scontri diretti, c’è ancora speranza per una metodologia fondata sullo stile.

What Can Match Stats Tell Us About Playing Styles?