Una statistica per le partite assolutamente da non perdere

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 9 agosto 2019 – Traduzione di Edoardo Salvati

Per l’appassionato di tennis, la scelta di quale partita guardare in un qualsiasi torneo è spesso fonte di grattacapo. In questo articolo, cerco di determinare quanto una partita è imperdibile in funzione della sua qualità e competitività, ricorrendo alle valutazioni dei giocatori.

Molte volte in passato, o anche per la trasferta nordamericana in corso, l’abbondante offerta di partite televisive vi avrà certamente posto di fronte a un bivio. Conoscete il motivo della scelta che avete fatto? Avete optato per la partita in programma sul campo più importante? Per il giocatore con la classifica più alta? O avete seguito il vostro istinto sulla partita che pensavate sarebbe stata più equilibrata?

Specialmente nei primi turni di eventi congiunti tra donne e uomini, il timore di rimanere lontani dal centro dell’azione è una delle circostanze che genera più ansia per il vero seguace di tennis. Naturalmente, la possibilità di cambiare canale per una o l’altra partita ci convince che, in fondo, prendere una decisione non è obbligatorio. Ma non è questo il modo di mantenere viva la passione.

Dove sarà l’esperienza visiva più emozionante?

Forse è solo perché sto invecchiando, ma mi capita spesso di desiderare che la scelta sulla partita da guardare fosse più semplice. O che avessi almeno modo di prevedere dove sarà l’esperienza visiva più emozionante in qualsiasi istante. Di solito, faccio riferimento alle quotazioni assegnate dagli allibratori alle partite in programma, così da avere un’idea di quelle il cui esito finale è considerato più incerto. Mi accorgo però poi che la mia propensione non è sempre per la partita più combattuta. Complessivamente, anche la qualità è un fattore chiave. E sarei disposta ad accettare quote meno favorevoli se il livello di gioco di entrambi i giocatori rimanesse ragionevolmente alto.

Ne ho parlato a lungo con Martin Ingram, già ospite del blog, che condivide l’ossessione per interrogativi di questo tipo e che riesce sempre a trovare una soluzione ingegnosa alla maggior parte dei problemi prima che a me venga in mente. Siamo d’accordo sul fatto che competitività e qualità non sono elementi sufficienti a far decollare una grande partita (stili differenti e scontri diretti sono altri due, ad esempio), ma certamente permettono di pescare nel mucchio con buona probabilità di riuscita.

L’idea di base è di arrivare a una statistica che unisca una misura della qualità e della competitività. In termini matematici:

Partita imperdibile = Competitività + Qualità

Visto che le valutazioni dei giocatori sono il sistema principale per misurarne la bravura relativa, possiamo prenderle a riferimento sia in termini di abilità complessiva (la qualità) che in termini di divario di capacità tra un giocatore e l’altro (competitività).

Qualità

Per definire la qualità, basta la semplice somma delle valutazioni dei giocatori. È un concetto simile a quello del “bonus” secondo la descrizione di Klaasen e Magnus. L’immagine 1 mostra la distribuzione della qualità per le partite del circuito maggiore nel 2019. Pur con una media leggermente più alta per gli uomini, in entrambi i casi assistiamo a un’importante deviazione verso destra. Quella coda, il gruppo di partite con valore maggiore di 5000, racchiude gli scontri di più alta qualità della stagione.

IMMAGINE 1 – Distribuzione della qualità per le partite dei due circuiti maggiori nel 2019

Competitività

Nella sostanza, la competitività invece si riduce al divario tra le valutazioni dei giocatori. Questo è il “malus” nel linguaggio di Klaasen e Magnus. Anzi, la differenza di valutazioni è l’unica quantità veramente casuale nei pronostici sia con Elo che con altri sistemi di previsioni basati sulla comparazione tra giocatori.

IMMAGINE 2 – Distribuzione della competitività per le partite dei due circuiti maggiori nel 2019

La distribuzione di competitività nell’immagine 2 mostra scarsa differenza tra i due circuiti. Inoltre, la pesante deviazione verso destra segnala che è più tipico trovarsi di fronte a una partita molto equilibrata che a una a senso unico. Staremmo parlando di uno sport molto più interessante se la distribuzione non esibisse questo tipo di distorsione.

Da un lato, abbiamo molte partite di qualità ma pochissime di massima qualità, mentre dall’altro sono minori le partite competitive ma è relativamente più frequente che una partita sia competitiva di quanto sia a senso unico. In presenza di proprietà tra loro opposte, come riusciamo a mettere insieme queste due misure?

Un solo numero

Un’idea è quella di concentrarsi sulla qualità, prevedendo però una penalizzazione in funzione della scarsa competitività. Si esprime la competitività come la probabilità di vittoria attesa per il giocatore più forte, per poi quantificare la probabilità di vittoria attesa rispetto alla partita più competitiva (quella in cui la probabilità di vittoria è del 50%).

Partita imperdibile = (Qualità – Media)*(1-(p(v)-0.5))

In questo modo, il valore delle partite con qualità sopra la media è ridotto in proporzione della distanza in punti percentuali da una partita equilibrata. Possiamo verificare in concreto il funzionamento di questo approccio guardando alle prime dieci partite imperdibili del 2019 per uomini e donne. Anche se l’obiettivo dichiarato è di stabilire il livello di qualità tra partite della stessa settimana e turno di gioco, possiamo comunque ricavare una prima impressione della validità della statistica.

Il predominio dei Grandi Tre tra gli uomini e quello di Simona Halep, Serena Williams e Ashleigh Barty tra le donne suggerisce che siamo sulla buona strada. In retrospettiva, un paio di partite non hanno mantenuto il carico d’interesse atteso alla vigilia, fra tutte la finale maschile degli Australian Open e la finale femminile di Wimbledon.

Naturalmente, non ho la pretesa che la statistica per le partite assolutamente da non perdere qui introdotta incontri un favore universale. Sono convinta però che fondendo i due ingredienti chiave di una partita in un solo numero, si ha a disposizione un valido strumento per scegliere cosa vedere in televisione o analizzare a ritroso quali sono state le partite che hanno confermato o disatteso le aspettative riposte.

A Stat for Must-See Matches

Federer non è stato dominante nei momenti chiave, ma ci è andato vicino

di Jeff Sackmann // TennisAbstract

Pubblicato il 26 luglio 2019 – Traduzione di Edoardo Salvati

Le statistiche della finale di Wimbledon raccontano una storia senza ombre. Per cinque set, Roger Federer ha fatto molte cose leggermente meglio del suo avversario, Novak Djokovic, che però ha poi vinto di misura perché si è aggiudicato i punti più importanti, un dettaglio che non emerge dai numeri con la stessa nitidezza.

Superando le statistiche tradizionali, possiamo quantificare il dominio nei momenti che fanno la differenza. Un metodo che supera il semplice conteggio delle palle break o dell’individuazione dei passaggi chiave più ovvi in una partita è l’indice di leva per assegnare un valore a ciascun punto, in funzione dell’importanza. Dopo ogni singolo punto della partita, possiamo calcolare una nuova probabilità di vittoria per entrambi i giocatori. Un punto come quello da giocare sul 5-5 in un tiebreak è potenzialmente in grado di alterare la probabilità di vittoria in misura massiccia, mentre così non è per quello sul 40-15 del primo game.

La leva quantifica il potenziale. In media, in una partita al meglio dei cinque set un punto possiede una leva di circa il 4%, ma per i punti più importanti si parla di diverse volte quel valore. Un altro modo per identificare quando un giocatore è predominante è vedere il numero sproporzionato di punti ad alta leva che vince anche di fronte a una prestazione inferiore in quelli a bassa leva.

L’indice di leva

In un recente articolo sulla finale di Wimbledon per l’Economist, ho approfondito ulteriormente il concetto. Djokovic ha vinto meno punti rispetto a Federer, ma quelli che ha vinto hanno contato di più. La leva media dei punti per lui è stata infatti del 7.9%, rispetto al 7.2% di Federer. Possiamo presentare questa differenza sotto forma di indice di leva (Leverage Ratio o LR), dividendo 7.9% per 7.2%, con un risultato di 1.1. Un indice così alto non è insolito. Nelle più di 700 partite Slam maschili del Match Charting Project, l’LR del giocatore più dominante è in media di 1.11. L’eccellenza di Djokovic nei momenti chiave non è stata nemmeno così unica, ma in una partita di quell’equilibrio è bastata a fare la differenza.

Con un indice di leva superiore a 1.0, la vittoria non è comunque garantita. In circa il 30% di queste 700 partite al meglio dei cinque set la vittoria è andata al giocatore che, in media, ha vinto meno punti importanti dell’avversario. Alcune situazioni di vincitori con basso indice di leva quasi rasentano la comicità, come la finale del Roland Garros 2008 in cui Rafael Nadal ha demolito Federer nonostante un LR di 0.77.

Aumento della comprensione

Nelle partite a senso unico non c’è molta leva a disposizione, quindi il numero dei punti vinti ha molta più rilevanza di quando sono stati vinti. Spesso prestazioni non dominanti si traducono in vittorie di partite ancora più equilibrate, come quella di Andy Murray nella semifinale degli US Open 2018 in quattro set contro Nadal nonostante un LR di 0.80, o la super equilibrata semifinale a Wimbledon 2018 in cui Kevin Anderson ha battuto John Isner con un LR di 0.88.

Non serve un foglio di calcolo per capire che le partite di tennis vengono decise da una combinazione di rendimento complessivo e rendimento nei momenti importanti. I numeri che ho citato non portano avanti la nostra comprensione di molto, quantomeno non in modo rigoroso. È questo il prossimo passo.

Indice di leva, ti presento l’indice di leva bilanciato

Coloro che frequentano regolarmente Tennis Abstract hanno familiarità con l’indice di dominio (Dominance Ratio o DR), una statistica inventa da Carl Bialik al fine di riclassificare i punti vinti totali. Il DR si ottiene dalla divisione tra i punti vinti alla risposta e i punti persi al servizio, in modo che il valore medio sia esattamente 1.0. Solitamente, chi vince ha un valore superiore a 1.0 e chi perde un valore inferiore a 1.0.

Nella finale di Wimbledon, il DR di Djokovic è stato di 0.87, estremamente basso per un vincitore, se non addirittura inedito. Il DR compensa gli effetti generati del rendimento al servizio e alla risposta (a differenza dei punti vinti, che possono deviare in una o l’altra direzione a seconda che ci siano più punti al servizio che alla risposta, o viceversa) e sintetizza in un solo numero la qualità della prestazione complessiva.

Equa distribuzione tra servizio e risposta

Non dice però nulla relativamente al dominio nei momenti chiave, tranne quando un giocatore vince con un valore basso del DR, da cui si può dedurre che abbia controllato l’avversario sui punti più caldi.

Per avere una prospettiva bilanciata simile in presenza di rendimenti ad alta leva, possiamo adattare l’indice di leva LR soppesando equamente il dominio nei momenti chiave sia al servizio che alla risposta. Chiamo questa statistica indice di leva bilanciato (Balanced Leverage Ratio o BLR), cioè la media semplice dell’LR nei punti al servizio e dell’LR nei punti alla risposta. Il BLR di solito non si scosta di molto dall’LR, così come spesso otteniamo le stesse informazioni dal DR che dai punti totali. Il BLR di Djokovic nella finale di Wimbledon è stato di 1.11, rispetto a un LR di 1.10. Nelle partite in cui però un numero sproporzionato di punti si giocano sulla racchetta di un giocatore, il BLR fornisce il necessario aggiustamento.

DR corretto per leva

Siamo in grado di registrare rendimenti corretti per leva semplicemente moltiplicando questi due numeri. Ad esempio, prendiamo la vittoria di Stanislas Wawrinka contro Djokovic nella finale degli US Open 2016. Il DR di Wawrinka è stato di 0.90, più alto di quello di Djokovic a Wimbledon 2019 ma difficilmente sufficiente a trionfare. Eppure ha vinto, grazie a un BLR di 1.33, uno dei più alti mai registrati in una finale Slam. Il prodotto tra il DR e il BLR di Wawrinka — che chiameremo DR+ — è pari a 1.20. Lo si può interpretare con la stessa scala di un DR “normale”, dove 1.2 è spesso identificativo di una vittoria con margine ridotto, se non di una al cardiopalma.

Di 167 finali Slam maschili nel Match Charting Project, 14 giocatori hanno vinto nonostante un DR “normale” inferiore a 1.0. Per ciascuno di essi, il BLR era superiore a 1.1, e in 13 delle 14 occorrenze, la forza del BLR del vincitore ha “cancellato” la debolezza del suo DR, nel senso che il DR+ è stato superiore a 1.0. La tabella riepiloga quelle partite, ordinate per DR+ crescente.

Anno  Slam              Vincitore    DR     BLR    DR+  
2019  Wimbledon         Djokovic     0.87   1.11   0.97  
1982  Wimbledon         Connors      0.88   1.20   1.06  
2001  Wimbledon         Ivanisevic   0.95   1.16   1.10  
2008  Wimbledon         Nadal        0.98   1.13   1.10  
2009  Australian Open   Nadal        0.99   1.13   1.12  
1981  Wimbledon         McEnroe      0.99   1.16   1.15  
1992  Wimbledon         Agassi       0.97   1.19   1.16  
1989  US Open           Becker       0.96   1.22   1.18  
1988  US Open           Wilander     0.98   1.21   1.18  
2015  US Open           Djokovic     0.98   1.21   1.18  
2016  US Open           Wawrinka     0.90   1.33   1.20  
1999  Roland Garros     Agassi       0.98   1.25   1.23  
1990  Roland Garros     Gomez        0.94   1.34   1.26  
1991  Australian Open   Becker       0.99   1.30   1.29

Prima finale vinta dal giocatore con il DR+ inferiore

In 167 finali Slam, quella tra Djokovic e Federer è stata la prima vinta dal giocatore con il DR+ più basso (alcuni dei campioni che non compaiono in elenco hanno avuto indici di leva sotto tono e conseguenti DR+ inferiori ai DR, ma nessuno sotto il livello di 1.0). Sebbene Federer è stato più debole nei momenti importanti — in particolare nei tiebreak e quando ha avuto i due match point — il rendimento complessivo in quel tipo di situazione non è stato così scadente come quei pochi memorabili momenti farebbero pensare. È più probabile che un giocatore con un DR di 1.14 e un BLR di 0.90 come quelli di Federer concluda le due settimane di Wimbledon ballando con la campionessa del tabellone femminile.

Sorprendentemente, 1 su 167 potrebbe sottostimare la rarità di un vincitore con un DR+ inferiore a 1.0. Solo una delle partite al meglio dei cinque set nel database del Match Charting Project (su più di 700) possiede quel requisito. Si tratta del controverso quarto turno degli Australian Open 2019 tra Kei Nishikori e Pablo Carreno Busta. Nishikori ha vinto con un DR di 1.06, ma il suo BLR è stato di 0.91, relativamente debole e che ha portato a un DR+ di 0.97. Come per la finale di Wimbledon, anche la partita di Melbourne avrebbe potuto avere un altro vincitore. La fortuna è stata avversa a Carreno Busta non solo per le chiamate arbitrali.

Qual è il significato di tutto questo?

Sappiamo che la finale di Wimbledon è stata in estremo equilibrio, ora abbiamo più numeri che mostrano quanto effettivamente lo sia stata. Sapevamo che Djokovic gioca meglio quando conta di più, ora abbiamo più riferimenti sulla sua maggior bravura, che però non si discosta di un margine insolitamente ampio.

Federer ha vinto cinque dei venti Slam nonostante un BLR nella finale inferiore a 1.0, e altri due con un DR inferiore a 1.14. Non ha mai vinto uno Slam con un DR+ non superiore a 1.03, ma va anche detto che non c’è mai stata una finale Slam che il DR+ ha considerato così ravvicinata. Federer non è la definizione di maestro dei momenti chiave, ma non è poi così malvagio. Avrebbe solamente dovuto portare con sé un po’ di quella dose di domino con cui ha chiuso il secondo set per passaggi più importanti nelle fasi successive.

Se siete anche voi come me, dopo aver letto fino a questo punto non smetterete di farvi domande. Ho riflettuto su alcune che spero di approfondire analogamente. Si può dire che Federer di solito è meno dominante della media nei momenti chiave? (Si). Djokovic è molto più bravo a quel riguardo? (Si). E Nadal? (Anche lui è più bravo). Nadal è davvero migliore, o i suoi numeri sulla leva sono di partenza buoni perché i punti importanti si giocano più spesso sul lato dei vantaggi? (È davvero migliore). Djokovic ha preso le misure a Federer? (Non proprio, a meno che non s’intenda il suo numero di scarpe, allora in quel caso sì). È cambiato tutto dopo che Djokovic ha tirato la famosa risposta? (No).

Rendimenti situazionali

Ci sono anche molti argomenti interessanti che vanno oltre i Grandi Tre. Ho iniziato qualche anno fa a scrivere della leva relativa a sottoinsiemi di partite, spinto dalla semifinale di Wimbledon 2016 tra Federer e Milos Raonic, nella quale Federer ha subito la pressione quando più contava. Come possiamo analizzare la leva media per punti vinti e persi, così riusciamo a stimare l’importanza dei punti in cui un giocatore ha servito un ace, commesso un errore non forzato di rovescio, o scelto di andare a rete.

Le partite sono decise da una combinazione di rendimento complessivo e giocate di alta leva. Le statistiche comunemente disponibili illustrano bene le dinamiche del primo, ma non sono adeguate per fare chiarezza sulle seconde. Il dominio nei momenti chiave è lasciato alle congetture degli opinionisti. Con un insieme di partite in continuo aumento e l’accesso a sempre più dati punto per punto (e quindi a numeri sulla leva per ogni punto e ogni partita), il divario tra le due misure si riduce, consentendoci di quantificare con più precisione il grado in cui il rendimento legato alla specifica situazione incide sulla capacità di ciascun giocatore di vincere la partita.

Roger Federer Wasn’t Clutch, But He Was Almost Clutch Enough

L’effetto generato dalla velocità del servizio di Serena

di Jeff Sackmann // TennisAbstract

Pubblicato il 13 luglio 2019 – Traduzione di Edoardo Salvati

In un articolo su FiveThirtyEight, Tom Perrotta ha evidenziato la relazione tra il rendimento di Serena Williams sulla prima di servizio e la sua probabilità di vincere la partita. Secondo Perrotta, Williams ha vinto solo (solo!) il 74% dei punti sulla prima di servizio nelle due settimane di Wimbledon 2019 (esclusa la finale, n.d.t.), rispetto a un incredibile 87.5% nella vittoria del titolo del 2010. Non è mai riuscita a vincere Wimbledon con meno del 75% di punti vinti sulla prima, e anche quel livello non è di garanzia, visto che l’anno scorso ha raggiunto il 77% perdendo poi in finale.

Ci sono molti fattori che influenzano la percentuale di punti vinti con la prima, tra cui piazzamento e tattica del servizio, oltre a tutti i colpi che chi è al servizio deve giocare immediatamente successivi alla risposta dell’avversaria.

Il più evidente però è rappresentato da un’altra categoria nella quale Williams è spesso stata la migliore, e cioè la velocità del servizio. Nella finale vinta contro Garbine Muguruza nel 2015, la velocità media della prima è stata di 182 km/h (113 mph), la terza partita consecutiva in cui in media era arrivata a 179 km/h (111 mph). Nelle 13 partite successive, ha servito in media a solo (solo!) 171.2 km/h (106.4 mph), non andando mai oltre i 175 km/h (109 mph) in una singola partita.

Quanto è importante?

Sembra corretto ipotizzare che, a parità di condizioni, un servizio più veloce ha maggiore efficacia di uno più lento. Le cose si complicano però perché raramente ci si trova nella parità di condizioni: un servizio esterno è spesso più letale pur richiedendo minore forza pura, è più facile trovare un piazzamento su un servizio poco rischioso e non ho neanche sollevato il tema dell’effetto legato alla rotazione della pallina. Un servizio più veloce non è sempre migliore di uno più lento ma, in media, l’ipotesi di base resta valida.

Per ciascuna delle 23 partite di Williams a Wimbledon per le edizioni 2014, 2015, 2018 e 2019 (non ha giocato il 2017 e non possiedo al momento i dati per il 2016, non chiedetemi il perché…), ho suddiviso i punti sulla prima in quintili, classificandoli sulla base della velocità del servizio, dal più veloce al più lento. Si tratta di una modalità rudimentale che aiuta però a tenere conto delle avversarie e darci una prima sensazione di quanto la velocità del servizio di Williams è in grado di incidere sull’esito dei punti sulla prima.

Quintile       PVS 1^  Media KM/H  
Più veloce     80.6%   188  
2° più veloce  73.7%   180.5  
A metà         79.5%   174  
2° più lento   73.7%   167  
Più lento      74.9%   158

Chiaramente, la velocità del servizio non descrive tutto quello che accade. Allo stesso tempo, sembra che una prima a 188 km/h (117 mph), o anche una a 174 km/h (108 mph), siano meglio di una a 158 km/h (98 mph).

Senza considerare le avversarie

Un altro modo per isolare l’effetto della velocità del servizio è di ignorare l’incidenza che hanno specifiche avversarie e ordinare semplicemente le prime di servizio in funzione della velocità. Nelle 23 partite considerate, 43 prime hanno l’esatta velocità di 161 km/h (100 mph), con una corrispondente percentuale di punti vinti del 72.1%. Sono 33 le prime che raggiungono i 162.5 km/h (101 mph), vincendo il 72.7% dei punti. Sebbene generalmente la percentuale di punti vinti non si muova all’unisono con la velocità della prima, il grafico dell’immagine 1 evidenzia la presenza di una tendenza di fondo.

IMMAGINE 1 – Andamento tra la velocità della prima di Williams a Wimbledon e la percentuale di punti vinti

La correlazione è debole: ad esempio, la percentuale di punti vinti con servizi a 159 km/h (99 mph) e 166 km/h (103 mph) è più alta che a 187 km/h (116 mph) e 188 km/h (117 mph). Si potrebbe attribuirne la ragione alla possibilità che i servizi più lenti sono frutto di una scelta tattica più astuta, che in quelli più veloci il piazzamento è meno preciso, o che è solo cieca fortuna, perché il campione a disposizione per una specifica velocità non è così ampio.

La regola per Williams

Possiamo comunque trarre una conclusione sommaria:

A ogni 3 km/h (2 mph) di velocità in più sulla prima di servizio corrisponde un punto percentuale aggiuntivo nella percentuale di punti vinti con la prima da Williams.

Aggiungiamo questo: solitamente, Williams serve circa il 60% di prime, e circa la metà dei punti totali verranno giocati sul suo servizio. Quindi, 3 km/h di velocità in più valgono 0.6 punti percentuali addizionali dei punti totali vinti da Williams. In una partita equilibrata come la sconfitta del 2014 contro Alize Cornet, nella quale Williams ha servito la prima in media a 167 km/h (104 mph) e vinto esattamente il 50% dei punti giocati, potrebbe diventare un elemento decisivo.

Contestualizzare Williams

Questa regola generale non può essere applicata a tutte le giocatrici (qualche anno fa ho analizzato in modo simile le velocità del servizio dei giocatori e, forse scioccamente, non le ho suddivise per giocatore). Ho applicato lo stesso algoritmo sulle velocità del servizio a Wimbledon delle nove altre giocatrici di cui possiedo dati per almeno 15 partite. L’effetto della velocità varia da “un bel po’” per Johanna Konta a “per niente” nel caso di Venus Williams, con un “non capisco la domanda” per Caroline Wozniacki.

La tabella mostra due numeri per ogni giocatrice. La colonna “ KM/H Agg =” indica l’effetto di 1.6 km/h (1 mph) aggiuntivo sulla percentuale di punti vinti sulla prima, mentre la colonna “KM/H = 1% PVS” indica quanti km/h aggiuntivi sono necessari per aumentare la percentuale di punti vinti al servizio (PVS) di un punto percentuale.

Giocatrice    KM/H Agg =   KM/H = 1% PVS  
Konta         0.89%        1.1  
Kerber        0.56%        1.8  
S. Williams   0.48%        2.1  
Muguruza      0.47%        2.1  
Halep         0.41%        2.5  
Kvitova       0.29%        3.5  
Radwanska     0.28%        3.6  
Azarenka      0.02%        50.9  
V. Williams   0.00%        -  
Wozniacki     -0.40%       - 

Per una prima di servizio efficace (almeno in termini di punti vinti), la velocità del servizio per Konta è importante quasi il doppio di quanto non lo sia per Williams. La media della prima di Konta nella sconfitta ai quarti di finale contro Barbora Strycova è stata di 160.7 km/h (99.9 mph), la più bassa a Wimbledon dalla sconfitta al primo turno nel 2014.

All’estremo opposto troviamo Victoria Azarenka e Venus, per le quali la velocità al servizio non sembra fare troppa differenza (Venus ad esempio eccelle nel letale servizio a uscire, che riesce a trasformare in ace a prescindere dalla velocità). Apparentemente, Wozniacki spinge le avversarie in una situazione di confusione e illogicità, ottenendo risultati migliori con prime di servizio più lente.

Williams contro Halep

Stiamo parlando di un effetto davvero minimo, tale per cui anche l’intervallo tra la prestazione al servizio di Williams nelle sei partite a Wimbledon prima della finale (i 169 km/h di media contro Carla Suarez Navarro) e la finale del 2015 contro Muguruza avrebbe inciso sui punti totali vinti da Williams di circa 2.5 punti percentuali. In nove delle dieci volte in cui Williams e Halep hanno giocato contro, Williams ha sempre vinto grazie ad almeno il 52.5% dei punti totali, e di solito con più del 55%. È un ampio margine di errore o, più precisamente, un ampio margine di lentezza al servizio.

Viceversa, la più recente partita e l’unica dal 2016 è stata anche quella più equilibrata. Halep ha una risposta eccezionale, ma non è immune a servizi potenti: la sua frequenza di punti vinti sulla risposta è influenzata dalla velocità del servizio tanto quanto lo sono le statistiche al servizio per WIlliams. Il divario tra le due nella finale di Wimbledon 2019 potrebbe essere sottile e la velocità del servizio uno dei pochi aspetti su cui Williams ha controllo totale, al fine di indirizzare il risultato in suo favore (Halep ha poi vinto la finale con il punteggio di 6-2 6-2. Williams ha vinto il 59.4% dei punti sulla prima di servizio con il 68.1% di prime in campo e una velocità media di 167 km/h. Ha vinto solo il 41% dei punti totali, n.d.t.)

The Effect of Serena’s Serve Speed

La fortuna del sorteggio: Wimbledon 2019 (donne)

di Chapel Heel // HiddenGameOfTennis

Pubblicato l’1 luglio 2019 – Traduzione di Edoardo Salvati

Come d’abitudine per gli Slam, ho eseguito una simulazione (con la mia variante Elo) di 100.000 configurazioni del tabellone principale, utilizzando lo stesso metodo che gli organizzatori usano per assegnare ai giocatori la loro posizione. L’ho poi confrontata con la previsione per il torneo su base Elo rispetto al tabellone effettivo.

La tabella mette a confronto la previsione effettiva del tabellone con i risultati dalle simulazioni di rimescolamento, in modo da avere alcune indicazioni sull’accessibilità del tabellone effettivo rispetto alle altre configurazioni. Tonalità di rosso (e arancione) evidenziano la sfortuna della giocatrice. Al contrario, tonalità di verde rappresentano la fortuna ricevuta nel tabellone effettivo, in riferimento a un particolare turno. Il giallo simboleggia neutralità, e si può di fatto ignorare qualsiasi valore superiore o inferiore allo 0.2%.

Come per il tabellone di singolare maschile, per una presentazione più compatta rispetto al passato ho riportato nella tabella solo le teste di serie, e organizzato nella tabella successiva quelle giocatrici fuori dalle teste di serie per le quali c’è stata un’incidenza degna di nota (almeno l’1% di segno positivo o negativo).

I benefici si concentrano interamente nel mezzo del tabellone, mentre tutto lo svantaggio si riversa sui quarti più esterni.

Il tabellone effettivo sembra favorire più di tutte Kiki Bertens, anche se la fortuna per lei arriva fino alle opportunità di semifinale. Petra Kvitova e Karolina Pliskova hanno un vantaggio maggiore fino alle semifinali, e nel caso di Pliskova anche oltre (come se ne avesse effettivamente bisogno dopo aver vinto a Eastbourne). Angelique Kerber è la giocatrice che, in generale, ha avuto più sfortuna, ma è Ashleigh Barty ad aver visto la sua probabilità di finale e di vittoria diminuire più drasticamente in finale e per la vittoria.

IMMAGINE 1 – Confronto tra tabellone effettivo e simulazioni per le teste di serie

Effetti di rilievo su una selezione di giocatori fuori dalle teste di serie

Non sarebbe male se Margarita Gasparyan (che però ha un secondo turno impegnativo con Elina Svitolina, n.d.t.) e Barbora Strycova (che ha appena vinto al primo turno, n.d.t.) potessero avvantaggiarsi della loro probabilità aggiuntiva, per quanto ridotta, per cercare di arrivare fino ai quarti di finale.

IMMAGINE 2 – Effetti della casualità del sorteggio su alcune non teste di serie

Luck of the Draw: Wimbledon 2019 (Women)

La fortuna del sorteggio: Wimbledon 2019 (uomini)

di Chapel Heel // HiddenGameOfTennis

Pubblicato l’1 luglio 2019 – Traduzione di Edoardo Salvati

Come d’abitudine per gli Slam, ho eseguito una simulazione (con la mia variante Elo) di 100.000 configurazioni del tabellone principale, utilizzando lo stesso metodo che gli organizzatori usano per assegnare ai giocatori la loro posizione. L’ho poi confrontata con la previsione per il torneo su base Elo rispetto al tabellone effettivo.

La tabella mette a confronto la previsione effettiva del tabellone con i risultati dalle simulazioni di rimescolamento, in modo da avere alcune indicazioni sull’accessibilità del tabellone effettivo rispetto alle altre configurazioni. Tonalità di rosso (e arancione) evidenziano la sfortuna del giocatore. Al contrario, tonalità di verde rappresentano la fortuna ricevuta nel tabellone effettivo, in riferimento a un particolare turno. Il giallo simboleggia neutralità, e si può di fatto ignorare qualsiasi valore superiore o inferiore allo 0.2%.

Per una presentazione più compatta rispetto al passato, ho riportato nella tabella solo le teste di serie, e organizzato nella tabella successiva quei giocatori fuori dalle teste di serie per i quali c’è stata un’incidenza degna di nota (almeno l’1% di segno positivo o negativo).

Si è discusso molto prima del sorteggio sull’assegnazione a Nadal della testa di serie numero 3 rispetto alla 2, come da classifica ufficiale. Ho parlato degli effetti di questa scelta in un altro articolo. Il sorteggio non lo favorisce fino ai quarti di finale, ma per i turni successivi è sostanzialmente neutro. E non è niente a confronto dello svantaggio subito da Felix Auger-Aliassime. Milos Raonic invece ha ricevuto una spinta sostanziale fino alle semifinale e forse il suo percorso è proprio quello che servirebbe ad Alexander Zverev per raggiungere le fasi finali di uno Slam (che per non smentirsi ha perso al primo turno in quattro set contro Jiri Vesely, n.d.t.).

IMMAGINE 1 – Confronto tra tabellone effettivo e simulazioni per le teste di serie

Effetti di rilievo su una selezione di giocatori fuori dalle teste di serie

Sono Nick Kyrgios e Grigor Dimitrov i giocatori non testa di serie a subire maggiore penalizzazione dalla casualità del sorteggio, quando un po’ di fortuna avrebbe fatto loro comodo. Sono stati invece John Millman e Marton Fucsovics a ricevere maggior beneficio.

IMMAGINE 2 – Effetti della casualità del sorteggio su alcune non teste di serie

Luck of the Draw: Wimbledon 2019 (Men)

La fortuna del sorteggio: Roland Garros 2019 (uomini)

di Chapel Heel // HiddenGameOfTennis

Pubblicato il 3 giugno 2019 – Traduzione di Edoardo Salvati

Come d’abitudine per gli Slam, ho eseguito una simulazione (con la mia variante Elo) di 100.000 configurazioni del tabellone principale, utilizzando lo stesso metodo che assegna ai giocatori la loro posizione in quello ufficiale. L’ho poi confrontata con la previsione per il torneo su base Elo rispetto al tabellone effettivo.

La trasferta al Roland Garros mi ha impedito di procedere prima con quest’analisi. Mi dispiace riuscire a farlo solo a pochi giorni dalla conclusione del torneo.

Come per le donne, anche in questo caso viene messa a confronto la previsione effettiva del tabellone con i risultati dalle simulazioni di rimescolamento, in modo da avere alcune indicazioni sull’accessibilità del tabellone effettivo rispetto alle altre configurazioni. Tonalità di rosso (e arancione) evidenziano la sfortuna del giocatore. Al contrario, tonalità di verde rappresentano la fortuna ricevuta nel tabellone effettivo, in riferimento a un particolare turno. Il giallo simboleggia neutralità, e si può di fatto ignorare qualsiasi valore superiore o inferiore all’1%.

Si è detto molto, a tabellone completo, del facile cammino di Rafael Nadal verso il dodicesimo titolo, ma come al solito si è anche esagerato. La differenza tra quella effettiva e centomila altre possibili versioni rientra nel margine di errore. In realtà è più semplice il percorso di Novak Djokovic, sempre relativamente ad altri scenari, anche se non in modo significativo.

Mi sorprende invece l’esito legato a Roger Federer che, tra i giocatori di vertice, è quello a subire la sorte peggiore. Se si riferisse alla sola finale e alle possibilità di vittoria lo capirei, perché dopotutto si è trovato dal lato di Nadal. E questo è di per sé peggiorativo per chiunque aspiri al trofeo. Ma il suo tabellone è leggermente più difficile già per arrivare ai quarti e alla semifinale. Temo che dipenda in larga parte dalla presenza di Matteo Berrettini e Diego Schwartzman, entrambi con solide valutazioni Elo specifiche per la terra, anche se in pochi li considererebbero una minaccia reale (hanno perso infatti al secondo turno, n.d.t.)

Sorteggio Roland Garros Uomini_1 - settesei.it

Dominano le prime cinque teste di serie

Ammetto di aver pensato che il tabellone di Dominic Thiem fosse il più complicato tra le prime quattro teste di serie. In questa simulazione ha invece il migliore, in parte perché ha evitato il quarto di Nadal. E questo illustra (secondo me) uno dei problemi attuali del tennis maschile: è difficile trovare un giocatore qualsiasi fuori dalle prime cinque teste di serie che abbia anche la minima possibilità di vincere uno Slam. Nelle mie previsioni con valutazioni Elo, i primi cinque raggiungono in aggregato l’84.4% di probabilità di vittoria. È per questo che, onestamente, il loro cammino sembra sempre facile quando si guarda il tabellone da vicino.

Luck of the Draw: Roland Garros 2019 (Men)

La fortuna del sorteggio: Roland Garros 2019 (donne)

di Chapel Heel // HiddenGameOfTennis

Pubblicato il 3 giugno 2019 – Traduzione di Edoardo Salvati

Negli ultimi due anni, ho eseguito simulazioni di variazioni del tabellone principale per gli Slam maschili per verificare quanto un giocatore sia stato fortunato o sfortunato nel tabellone effettivo, rispetto ad altre 100.000 possibili configurazioni dello stesso. È la prima volta che applico l‘analisi al tabellone femminile.

Viene messa a confronto la previsione effettiva del tabellone con i risultati dalle simulazioni di rimescolamento, in modo da avere alcune indicazioni sull’accessibilità del tabellone effettivo rispetto alle altre configurazioni. Tonalità di rosso (e arancione) evidenziano la sfortuna della giocatrice. Al contrario, tonalità di verde rappresentano la fortuna ricevuta nel tabellone effettivo, in riferimento a un particolare turno. Il giallo simboleggia neutralità, e si può di fatto ignorare qualsiasi valore superiore o inferiore all’1%.

Osaka e Serena, sorte opposta

A differenza del tabellone maschile, nel quale cinque giocatori hanno più dell’84% di probabilità aggregata di vittoria finale, in campo femminile la situazione è molto più aperta.

Mi interessava vedere due aspetti. Un rimescolamento del tabellone avrebbe mostrato maggiore variazione tra quelli effettivi e le nuove configurazioni? Non avendo le giocatrici di “vertice” una vittoria attesa così alta in termini di probabilità, si possono esporre più facilmente a una sconfitta a sorpresa, o a un percorso più semplice.

Viceversa, ci sarebbe stata molta meno variazione? In presenza di maggiore equiparazione tra le giocatrici, il rimescolamento del tabellone ha conseguenze minori, con peso inferiore legato al nome dell’avversaria.

A quanto pare è più probabile la prima ipotesi, ma certamente non siamo nel caos totale. L’incidenza è all’incirca sullo stesso numero di giocatrici di quanto emerso dal confronto per il tabellone maschile, anche se in questo caso la variazione percentuale è più marcata.

È andata peggio a Naomi Osaka (e anche Elina Svitolina non è stata fortunata), mentre Serena Williams ha avuto il tabellone più facile (presumendo però di avere una Williams in forma e non una Williams che non ha avuto grandi possibilità di giocare a livello competitivo quest’anno). In ogni caso, tutte e tre hanno perso prima dei quarti di finale.

Luck of the Draw: Roland Garros 2019 (Women)

Una storia dei tabelloni femminili al Roland Garros in cui chiunque poteva vincere

di Jeff Sackmann // TennisAbstract

Pubblicato il 21 maggio 2019 – Traduzione di Edoardo Salvati

Negli ultimi anni, si è parlato molto della “profondità” del tennis femminile. Dopo che al termine degli Australian Open 2017 Serena Williams è andata in maternità, nessuna giocatrice è emersa come forza dominante del circuito. Nell’episodio numero 62 del Podcast di Tennis Abstract, ho affermato che l’imminente edizione del Roland Garros dà la sensazione di essere aperta a qualsiasi vincitrice, specialmente dopo aver visto la finale degli Internazionali d’Italia tra Karolina Pliskova e Johanna Konta, due giocatrici dalla destrezza relativa sulla terra battuta.

Alla fine della registrazione, ho generato delle previsioni per il torneo con l’utilizzo delle valutazioni Elo specifiche per superficie, su un campo partecipanti costituito dalle prime 128 della classifica mondiale (il tabellone effettivo sarà diverso, ma le qualificate e le wild card tipicamente non hanno grande influenza sul risultato finale).

La campionessa in carica Simona Halep è la prima favorita, con una probabilità del 22.2% di difendere il titolo. Segue Petra Kvitova, appena sopra al 10%, con Kiki Bertens al terzo posto e poco sotto la doppia cifra. Ci sono poi altre due giocatrici con il 5% di probabilità di vittoria, cinque con almeno il 3% e altre nove con l’1%. Si tratta di un totale di 19 giocatrici [1] con almeno 1 probabilità su 100, tra cui due non certamente favorite come Anett Kontaveit e Petra Martic.

Maria Sakkari, vincitrice del torneo di Rabat e semifinalista agli Internazionali d’Italia, è al 20esimo posto, a un passo dall’1%. Non c’è molta separazione tra le giocatrici in cima all’elenco, e quando il sorteggio avrà assegnato fortune e sfortune l’ordine sarà senza dubbio un altro.

L’impressione è che possa vincere chiunque

Questo è ancor più vero se lo si paragona al Roland Garros di trent’anni fa, con una Steffi Graf inarrivabile al 68% di probabilità di vittoria, e tra le sole cinque giocatrici con più dell’1% di probabilità (le divinità del tennis hanno preso in giro questa previsione retrospettiva, perché Arantxa Sanchez Vicario portò la sua probabilità dell’1.5% a inizio torneo fino alla vittoria).

Il nutrito gruppo delle diciannove con almeno l’1% di probabilità è in effetti uno sviluppo molto recente. Nei precedenti trent’anni, le giocatrici con almeno l’1% di probabilità di vittoria sono state in media 11.5 e solo in tre occasioni si è arrivati a 19, due delle quali nel 2017 e 2018 (l’altra è stata nel 2010, con l’incredibile numero di 23 giocatrici con almeno l’1% e nessuna di loro con più del 13% di probabilità di vittoria). Non più tardi del 2004, solo 8 giocatrici potevano manifestare tanto ottimismo prima dell’avvio del torneo.

La seconda soglia di favorite, giocatrici con una probabilità di vittoria non superiore all’1%, è l’aspetto più caratteristico dei recenti tabelloni del Roland Garros, e rafforza la convinzione che di questi tempi il tennis femminile sia particolarmente equilibrato. Se Kontaveit, testa di serie 17, non sembra una possibile vincitrice, è però senza dubbio una candidata più concreta di quanto lo fossero 15 anni fa giocatrici con una testa di serie simile.

È cambiato il dominio al vertice

Restringendo l’attenzione a soglie di probabilità più alte, come il 3% o il 5%, l’era attuale si distingue di meno. Dal 1989 al 2018, il classico tabellone aveva 6.5 giocatrici con almeno il 3% di probabilità e 4.8 giocatrici con almeno il 5%. Quello del 2019 include 10 giocatrici nella prima soglia e 5 – all’incirca la media storica – nella seconda. Solo l’esercito delle giocatrici da 1% separa il tabellone di quest’anno da, ad esempio, il 1997, quando in nove avevano almeno il 3% di probabilità, di cui sette al 5% o più.

È cambiato invece il predominio delle giocatrici in cima all’elenco. Negli ultimi tre decenni, in media la favorita arrivava a Parigi con una probabilità su tre di vittoria. Nelle tre edizioni da primatista, Halep non è andata oltre il 23%. La tabella mostra le dieci favorite “più deboli” per le edizioni dal 1989 al 2019.

Anno  Favorita       Probabilità     
2010  V. Williams    12.9%     
2018  Halep          19.1%  *  
2011  Wozniacki      22.0%     
2019  Halep          22.2%     
2017  Halep          23.0%     
2006  Henin          23.3%  *  
2005  Henin          23.4%  *  
2012  Azarenka       24.1%     
2008  Sharapova      24.5%     
2009  Safina         24.7%

* Vittoria del torneo

Tradizionalmente, il Roland Garros fa pensare che il campo partecipanti femminile sia molto equilibrato, anche quando in effetti non è stato così. La favorita ha poi vinto solo 8 delle ultime 30 edizioni, una frequenza del 27% che quasi potrebbe rientrare nel precedente elenco. Sanchez Vicario ha vinto due volte avendo meno del 2% di probabilità. Il titolo di Anastasia Myskina nel 2004 aveva una probabilità dello 0.8%, mentre nel 2017 Jelena Ostapenko era la 27esima favorita, dietro Mona BarthelKaterina Siniakova, con una probabilità dello 0.4%.

Le sorprese quindi sono sempre state parte integrante di Parigi. In assenza di una giocatrice dominante in cima al tabellone e con il numero “1” vicino al nome, le altre si sono finalmente avvicinate. Nessuna ha una probabilità così convincente da pensare di avere già la vittoria in tasca, e un’impressionante pletora di contendenti ha ragione di sperare in due settimane di magia.

Note:

[1] L’elenco completo delle “favorite” ordinate per probabilità di vittoria: Halep, Kvitova, Bertens, Pliskova, Ashleigh BartyAngelique KerberElina SvitolinaCaroline WozniackiGarbine MuguruzaNaomi OsakaSloane StephensMarketa VondrousovaMadison Keys, Konta, Serena, Kontaveit, Caroline GarciaVictoria Azarenka e Martic.

A History of Wide-Open French Open Women’s Draws

Cosa possono dire le statistiche della partita sugli stili di gioco?

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 5 aprile 2019 – Traduzione di Edoardo Salvati

La conclusione più ovvia di un paio di miei recenti articoli sulle ripercussioni degli scontri diretti è probabilmente nota a tutti: possono esistere degli effetti, ma buona fortuna nel trovarli. Con campioni di dati così ridotti per la maggior parte degli scontri diretti, serve un modo per raggruppare giocatori “simili” tra loro. In questo articolo, cerco di capire se sia possibile creare categorie di giocatori in funzione dello stile di gioco, utilizzando statistiche di base della partita.

Quando Roger Federer ha giocato contro John Isner nella finale del Miami Masters 2019, in molti sono rimasti sorpresi nel ricordare che era la loro prima partita del circuito maggiore dal 2015. Tuttavia, che vi siano partite poco frequenti tra i giocatori di vertice è più una regola che un’eccezione, uno degli aspetti negativi della struttura del tennis professionistico (anche se, opinione personale, non sono coì attratta dal pensiero di avere Isner così spesso in finale).

Scontri diretti sporadici sono anche uno dei crucci degli analisti di tennis. Siamo spesso allettati dall’idea che una partita tra due specifici giocatori possa dare un impulso extra ai nostri modelli di rendimento, per poi ritrovarci in difficoltà ad applicare un metodo affidabile per misurare effetti così elusivi.

Raggruppamento per somiglianza

“Guadagnare forza prendendo a prestito” è una nozione diffusa in statistica e fa riferimento al concetto che si possa acquisire maggiore conoscenza di un certo tipo di informazione se la si osserva tramite informazioni a essa affini. È un po’ come quando, in presenza di membri della stessa famiglia, ci si rende conto che sono quel naso o quel mento a renderli distintivi rispetto alle altre persone. Raggruppare dati simili in statistica può avere il medesimo fine, aiutare cioè a capire più chiaramente quali sono gli elementi caratteristici di una fattispecie oggetto di analisi. Le ripercussioni degli scontri diretti hanno bisogno esattamente di questo tipo di soluzione.

Se raggruppare è davvero una questione di mettere insieme giocatori tra loro simili, dobbiamo avere a disposizione una modalità di misurazione della somiglianza. Cosa vuol dire che due giocatori sono simili? Beh, può avere molti significati. Ma se lo scopo è comprendere le ripercussioni degli scontri diretti, allora serve concentrare l’attenzione su quei giocatori con uno stile di gioco affine. La difficoltà risiede però nell’incertezza della quantificazione dello stile. Come per molte delle tematiche più interessanti sul rendimento nel tennis, anche dello stile è nota l’esistenza ma non il modo in cui misurarlo.

Idealmente, lo stile dovrebbe considerare la selezione di colpi di un giocatore e l’esito di ciascun tipo di colpo. Pur trattandosi di aspetti basilari, non è facile analizzarli con i dati pubblicamente disponibili, almeno non con continuità per la maggior parte dei giocatori di vertice.

Il contributo delle statistiche di base

Statistiche di base come la percentuale di prime in campo o i punti vinti alla risposta, etc, sono invece le informazioni più dettagliate che si riescono a ottenere per moltissime partite dei professionisti. A prima vista, possono sembrare di utilizzo limitato nella definizione di uno stile. Del resto, sono più direttamente collegate alla bravura relativa di un giocatore rispetto all’avversario in quello specifico giorno. Sarebbe però eccessivamente affrettato ignorare il loro contributo nella categorizzazione dello stile? Penso di sì. In fondo, contengono alcuni parametri, gli ace o doppi falli ad esempio, che sono il prodotto della tecnica al servizio e della propensione al rischio di un giocatore, e di cui chi è al servizio dovrebbe essere in controllo. Anche la durata di una partita è un’altra statistica che, in teoria, ha un collegamento diretto con la tendenza di un giocatore a rimanere nello scambio.

Come esperimento di partenza, ho verificato cosa si possa ricavare, in termini di somiglianza, dalla frequenza di ace e dai minuti giocati per singolo punto. Visto che siamo interessati al comportamento di un giocatore a prescindere dall’avversario, ho utilizzato un modello combinato per calcolare una frequenza media per ciascun giocatore su ogni superficie per le partite giocate dal 2017. Ho delimitato il campione a quei giocatori con almeno due apparizioni negli Slam, così da avere un gruppo che ha affrontato avversari simili in quell’intervallo temporale.

L’immagine 1 mostra i risultati per i giocatori del circuito maggiore. Si fa immediatamente notare l’assenza di una forte correlazione tra le ripercussioni di ace e minuti di gioco. Ero convinta che i giocatori con una media di ace per punti serviti più alta giocassero anche molto rapidamente. Per quanto sia questa la tendenza generale, la relazione è decisamente modesta.

IMMAGINE 1 – Correlazione tra ripercussioni di ace e minuti di gioco

Gli effetti più estremi

Ho evidenziato il 2% degli effetti più estremi. Nella parte in cui vi è un’alta frequenza di ace, emergono i soliti sospetti: Isner, Reilly Opelka e Ivo Karlovic, ad esempio. È una conferma che le ripercussioni generate dalla frequenza di ace sembrano funzionare più in termini di potenza complessiva che di semplice efficacia complessiva del servizio nel far vincere punti. Così succede a Rafael Nadal, che ha una frequenza di ace più bassa della media nonostante sia uno dei più bravi a vincere punti al servizio. Yoshihito Nishioka è all’estremo opposto. Con un’altezza di 174 cm, Nishioka è molto più basso del giocatore medio di uno Slam, e questo potrebbe essere il motivo della sua posizione nel grafico.

Per quanto riguarda le ripercussioni generate dai minuti giocati, è degna di nota la presenza di Nadal, Andy Murray e Novak Djokovic tra i giocatori con la maggiore durata per punto. È in linea con la loro caratterizzazione di fondisti dello scambio. Dal lato opposto, giocatori con un ritmo insolitamente veloce ma non tra i più potenti al servizio includono Dustin Brown e Florian Mayer. Potrebbero essere esempi di giocatori con uno stile aggressivo ma senza un servizio dominante.

Sei gruppi distinti

I casi estremi mettono in evidenza alcuni giocatori che sono più simili a determinati altri. Si può affrontare la questione procedendo per raggruppamento. Iniziamo semplicemente considerando cosa emergerebbe con un raggruppamento tramite algoritmo k-means sulle ripercussioni da scontri diretti sul cemento. La tendenza dell’errore all’interno del gruppo indica che una suddivisione in sei gruppi è il metodo meno complicato per organizzare i dati al fine di avvicinarsi alla varianza infragruppo più ridotta possibile.

IMMAGINE 2 – Raggruppamento tramite algoritmo k-means

L’immagine 3 mostra invece come quei gruppi si rapporterebbero alle ripercussioni generate dalla frequenza di ace e dai minuti giocati. Si vedono gruppi ben distinti che potremmo facilmente etichettare in modo separato, per la loro specifica combinazione di servizio intimidatorio e ritmo di gioco intenso.

IMMAGINE 3 – Rapporto tra raggruppamenti e ripercussioni di frequenza ace e minuti giocati

Conclusioni

Due attributi non sono sufficienti a esprimere tutte le sfaccettature di stile desiderate. È solo un piccolo esperimento, ma con alto potenziale. Siamo in grado di poter classificare tutte le declinazioni di stile solo dalle statistiche di base di una partita? Probabilmente no. Siamo in grado di classificare declinazioni di stile principali? Forse. O meglio, sono più convinta che ci sia possibilità di quanto non lo fossi prima di arrivare a questi risultati. Nella stima delle ripercussioni da scontri diretti, c’è ancora speranza per una metodologia fondata sullo stile.

What Can Match Stats Tell Us About Playing Styles?

Le ripercussioni degli scontri diretti in campo femminile

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 22 marzo 2019 – Traduzione di Edoardo Salvati

Se avete sempre pensato che la rivalità a senso unico tra Serena Williams e Maria Sharapova non ha eguali, beh..è così! Nella storia recente del tennis femminile però, non è quella dalle ripercussioni maggiori.

In un precedente articolo, ho analizzato una metodologia basata su un modello combinato per stimare risultati a sorpresa degli scontri diretti. L’obiettivo era individuare quali tra questi specifici accoppiamenti di giocatori aveva prodotto l’esito più contrario alle attese sulla base della bravura complessiva dei giocatori, su ciascuna superficie e alla data della partita.

Voglio ora applicare lo stesso procedimento per le giocatrici, concentrandomi sulle partite giocate dal 2010 a oggi in tornei almeno di categoria $125K. L’immagine 1 mostra le cento maggiori ripercussioni degli scontri diretti nel periodo considerato del campione di partite femminili. La giocatrice a beneficiare dell’effetto generato dagli scontri diretti è il primo dei due nomi che compaiono nell’asse delle ordinate. Bolle più grandi riflettono l’accuratezza della stima (maggiore la grandezza, maggiore la certezza che l’effetto sia concreto).

Emerge immediatamente l’accoppiamento al secondo posto, quello appunto del dominio di Williams contro Sharapova, una rivalità ormai notoriamente così a senso unico da richiedere una squalifica per doping e una sensazionalistica autobiografia per ravvivarla. Williams ha vinto 19 delle 21 partite che hanno giocato. Tra il 2010 e l’ultima partita completa nel 2016, sono state 14 le vittorie consecutive di Williams.

Come mai questa rivalità non occupa la prima posizione, visti i numeri?

La ragione è da cercare negli elementi che determinano sorpresa nel risultato di uno scontro diretto. È semplicemente il record di vittorie e sconfitte? No, perché se questo parametro fosse sufficiente, potremmo essere fuorviati dal concludere che nessuno si aspettava di vedere un record di 13-1 tra Roger Federer e Ivo Karlovic. La sorpresa quindi deve tenere conto delle attese di risultato che precedono la partita e, per rientrare nell’elenco degli scontri diretti più straordinari, dobbiamo essere in presenza di risultati che vanno ripetutamente contro le attese.

Questo rende la rivalità tra Williams e Sharapova interessante perché, almeno in termini di valutazione Elo specifica per superficie, ci si attendeva da Williams che vincesse tutte le ultime 14 partite (dal 2010 in avanti), per la maggior parte delle quali la probabilità di vittoria oscillava tra il 55 e il 75%. L’ultima sorprendente vittoria di Williams è stata la semifinale a Wimbledon 2015, mentre le due più sorprendenti sono state sulla terra battuta di Madrid consecutivamente nel 2012 e 2013.

Se interamente considerate, le probabilità di vittoria di Williams in queste 14 partite avrebbero dovuto dirci che 9 vittorie sarebbero state perfettamente in linea con le attese. Ma, vincendole tutte e quattordici, l’assoluto domino di Williams ha fatto sembrare le già rosee previsioni di allora eccessivamente pessimistiche.

IMMAGINE 1 – Cento maggiori ripercussioni degli scontri diretti almeno livello $125K

Cibulkova, Kuznetsova e il caso di Radwanska

Il primo posto è occupato da due giocatrici a cui nemmeno i più patiti di tennis avrebbero pensato. Si tratta dello scontro diretto tra Dominika Cibulkova e Svetlana Kuznetsova. Nelle sei volte in cui hanno giocato tra il 2010 e il 2016, Kuznetsova era sempre la favorita, e negli anni 2010 e 2011 anche con ampio margine. Nonostante questo, Cibulkova è riuscita a essere vittoriosa ogni volta. Visto che le valutazioni standard hanno sempre sbagliato, sembra essere questa una prova schiacciante dell’esistenza di un contrasto di stili di qualche tipo.

Si fa notare la ricorrente presenza di diverse giocatrici tra le prime 10 più importanti ripercussioni degli scontri diretti. Kuznetsova è anche al terzo posto, nell’accoppiamento con Agnieszka Radwanska, in questo caso però i risultati sono in suo favore. Sam Stosur, Julia Georges, Ana Ivanovic e Caroline Wozniacki compaiono due volte, ed è solo Goerges a essere stata considerata favorita in entrambe le occasioni.

Nell’elenco delle prime 100 ripercussioni, ci sono molte giocatrici il cui stile di gioco sembra prestarsi a entrare in conflitto con quello delle colleghe, Radwanska fra tutte, apparendo in ben 14 diversi scontri diretti. Ora non più in attività, Radwanska era nota per un possedere una grande varietà di colpi, una versatilità che sembra abbia reso molto più complicato pronosticare i suoi risultati attraverso valutazioni standard.

Seppur nessuna delle altre si avvicina alla frequenza di Radwanska negli scontri diretti, ci sono alcuni nomi che ricorrono con continuità. Stosur ed Ekaterina Makarova compaiono otto volte, Anastasia Pavlyuchenkova sette e Petra Kvitova sei. Come riscontrato per gli uomini, la correzione per le ripercussioni degli scontri diretti non incide sul rendimento predittivo all’interno di una stagione completa.

Due ragioni di non incidenza sul rendimento predittivo

La ragione è duplice. Da un lato, la rarità di accoppiamenti con uno storico composto da molti scontri diretti. Nel 2018, solo una partita su sei a livello di tornei International o superiore ha coinvolto giocatrici che avevano già giocato almeno altre due volte dal 2010.

Dall’altro lato, la maggior parte dei risultati degli scontri diretti ha una buona concordanza con la bravura complessiva di entrambe le giocatrici. Delle più di 4000 ripercussioni degli scontri diretti stimate nel campione di partite femminili, solo il 30% ha avuto un effetto che indicherebbe di uno spostamento della previsione standard superiore al 10%.

Per quanto l’impatto totale della correzione degli scontri diretti non è così rimarchevole, è comunque interessante vedere come l’accostamento di specifiche giocatrici e di loro avversarie potrebbe avere incidenza sulle attese in merito al risultato finale. Prendendo a riferimento il 2018, verifichiamo il miglioramento predittivo con la correzione degli scontri diretti per le partite giocate durante la stagione.

I risultati più precisi si sarebbero ottenuti con Elina Svitolina, considerando quanto ha giocato nel 2018 e le ripercussioni degli scontri diretti cui si è trovata di fronte. Alcuni dei miglioramenti predittivi di maggiore entità sarebbero arrivati dalle partite contro Wozniaki, Angelique Kerber e Darya Kasatkina. La tabella mostra che, in totale, quelle correzioni avrebbero restituito circa sette previsioni più corrette rispetto al modello transitivo standard.

Anche per Simona Halep le previsioni avrebbero ricevuto un simile incremento di precisione, che sarebbe arrivato nel suo caso contro avversarie come Naomi Osaka, Angelique Kerber e Caroline Garcia. Ma ci sarebbero state anche correzioni in negativo contro Wozniacki e Svitolina, contro le quali Halep storicamente non ha scontri diretti favorevoli (2 vittorie e 5 sconfitte contro la prima e 3 vittorie e 4 sconfitte contro la seconda, n.d.t.).

Conclusioni

Miglioramenti predittivi nel corso di una stagione diminuiscono sensibilmente dopo queste giocatrici. E questo rinforza la conclusione che dovremmo essere scettici di fronte a interpretazioni assolute degli scontri diretti come forma più rappresentativa del tipo di rendimento che una giocatrice avrà nei confronti di una determinata avversaria.

La realtà è che la sequenza di scontri diretti tra giocatrici di bravura analoga è un indicatore molto più affidabile. A parte qualche scontro diretto, tutti gli altri sono costituiti da un numero di partite eccessivamente ridotto e sparso nel tempo da fornire sostanziale assistenza nello sviscerare le peculiarità di uno specifico accoppiamento giocatrice-avversaria.

WTA Head-to-Head Effects