C’è sempre una possibilità, anche per Marie Bouzkova

di Jeff Sackmann // TennisAbstract

Pubblicato il 10 agosto 2019 – Traduzione di Edoardo Salvati

Marie Bouzkova, numero 91 del mondo e passata dalle qualificazioni, ha battuto ai quarti di finale di Toronto la numero 4 Simona Halep, che si è dovuta ritirare per un infortunio alla gamba dopo aver perso il primo set. C’è quindi un asterisco: anche se fossimo pronti ad attribuire più importanza a una singola partita di quella che richiede, non daremmo grande significato a questa.

Si tratta comunque di un risultato di prestigio per la ventunenne della Repubblica Ceca, che ha eliminato la seconda giocatrice tra le prime 10 della settimana, arrivando alla prima semifinale in carriera in un torneo Premier, contro niente di meno che Serena Williams (perdendo però in tre set, dopo aver vinto il primo per 6-1, n.d.t.)

Qualcosa di strano

Era la partita numero 62 del 2019 per Bouzkova, la numero 61 contro una giocatrice in possesso di classifica ufficiale. Ha vinto contro la più forte che abbia incontrato quest’anno, Halep, ma ha perso appena la settimana scorsa contro CoCo Vandeweghe, la numero 636 e l’avversaria con la classifica più bassa.

C’è un altro asterisco: Vandeweghe è al rientro da un infortunio, è sicuramente a un livello più alto di quello attuale e le stranezze del circuito Transition della federazione internazionale non hanno consentito al sistema di classifica di riflettere nel 2019 lo stato dell’arte come in passato. Alcune giocatrici che avrebbero normalmente una classifica molto bassa, come ad esempio la wild card del Kazakistan che Bouzkova ha demolito un paio di settimane fa, non contano.

Rimangono in ogni caso 61 partite, di cui una vittoria contro la giocatrice dalla classifica più alta e una sconfitta contro quella dalla classifica più bassa. Una ricerca nel mio database ha rivelato molte altre simili sorprese. Tornando indietro per meno di dieci anni, fino al 2010, ho trovato 127 giocatrici che hanno ottenuto una combinazione identica di risultati all’interno della stessa stagione, con almeno trenta partite giocate (per coerenza, ho incluso i ritiri quando si era concluso almeno un set).

Se alcune non sono di grande interesse — è il caso ad esempio di Mira Antonitsch che l’anno scorso non ha giocato contro avversarie tra le prime 400 — 63 delle 127 hanno battuto una tra le prime 100, 44 hanno battuto una delle prime 50 e 25 hanno avuto il lusso di una vittoria a sorpresa contro una delle prime 10. Halep è stata la vittima delle prime 10 in ben tre occasioni!

Le limitazioni del sistema ufficiale

Questo fa di Bouzkova la quarta giocatrice in una stagione (quantomeno di otto mesi) ad aver battuto Halep, a non aver giocato contro una giocatrice dalla classifica più alta e ad aver anche perso con la giocatrice più bassa in classifica. Halep non deve rimanerci troppo male, visto che Angelique Kerber è stata dalla parte della sconfitta più alta per cinque volte, di cui quattro nel 2017. Non bene!

La tabella elenca le 25 giocatrici-stagione tra il 2010 e il 2018 che hanno battuto la più alta in classifica e perso dall’avversaria più bassa.

Anno  Giocatrice   Più alta    Class  Più bassa    Class       
2017  Kasatkina    Kerber      1      Kanepi       418      
2018  Hsieh        Halep       1      Gasparyan    410      
2010  Jankovic     Serena      1      Diyas        268      
2010  Clijsters    Wozniacki   1      G-Vidagany   258   *  
2014  Cornet       Serena      1      Townsend     205      
2010  Yakimova     Jankovic    2      Dellacqua    980      
2017  Bouchard     Kerber      2      Duval        896   *  
2017  Vesnina      Kerber      2      Azarenka     683      
2016  Bencic       Kerber      2      Boserup      225      
2014  Rybarikova   Halep       2      Eguchi       183      
2017  Mladenovic   Kerber      2      Andreescu    167   *  
2018  Goerges      Wozniacki   3      Serena       451      
2014  Tomljanovic  Radwanska   3      A Bogdan     308      
2015  Mladenovic   Halep       3      Savchuk      262      
2017  Kerber       Pliskova    4      Stephens     934      
2014  Pavlyu'ova   Radwanska   4      Wozniak      241      
2017  Dodin        Cibulkova   5      Rybarikova   453      
2017  Bellis       Radwanska   6      Azarenka     683      
2018  Buyukakcay   Ostapenko   6      Di Sarra     555      
2017  Sakkari      Wozniacki   6      Potapova     454      
2015  L Davis      Bouchard    7      E Bogdan     527      
2015  Ostapenko    S-Navarro   9      Dushevina    1100  *  
2016  KC Chang     Vinci       10     S Murray     862      
2018  Pera         Konta       10     Hlavackova   825      
2018  Danilovic    Goerges     10     Pegula       620

* 1 avversaria senza classifica

Basta poco per accorgersi che Vandeweghe non è la prima giocatrice con bassa classifica a suscitare una reazione del tipo “si, ma…”. Questo gruppo di avversarie apparentemente deboli è in realtà molto forte visto che contenere giocatrici con una classifica media fuori dalle prime 500. Ci sono stelle come Victoria Azarenka (per due volte) e Serena, oltre a promesse come Bianca Andreescu e Victoria Duval.

Consideriamolo il richiamo quotidiano alle limitazioni della classifica generata dalla WTA, che indica quali giocatrici hanno vinto molte partite nelle ultime 52 settimane, ma non necessariamente chi stia giocando bene.

Divergenze estreme ma non troppo rilevanti

Siamo di fronte ad alcune delle divergenze più estreme tra le posizioni espresse dal sistema ufficiale e la bravura sul campo in uno specifico momento. Non credo che essere in questo elenco abbia particolare rilevanza, tranne forse che le molte presenze di Keber (sia da giocatrice che da scalpo!) siano una sintesi efficace della delusione della sua stagione 2017.

Bouzkova rimarrà in elenco per almeno ancora altri due giorni, visto che Serena è fuori dalle prime 10 e le altre due semifinaliste hanno una classifica più bassa, facendo sì che Halep sia stata l’avversaria più “difficile” (nell’altra semifinale Andreescu ha battuto Sofia Kenin per 6-4 7-6, n.d.t.). E, nonostante la settimana di ottimo tennis, è comprensibile che Bouzkova possa sentirsi disorientata quando dalla parte opposta della rete c’è una giocatrice che ha vinto 23 Slam (per quanto, come visto, pur nella sconfitta Bouzkova ha dominato il primo set, n.d.t.). Una cosa è certa: Bouzkova è indifferente al numero che compare accanto al nome dell’avversaria.

There’s Always a Chance: Marie Bouzkova Edition

Lasciate che Bernie si tenga i soldi

di Jeff Sackmann // TennisAbstract

Pubblicato il 4 luglio 2019 – Traduzione di Edoardo Salvati

L’altro giorno, Bernard Tomic ha perso al primo turno di Wimbledon contro Jo-Wilfried Tsonga. Non mi sorprende: avevo previsto per Tsonga un 64% di probabilità di vittoria, senza nemmeno tener conto della salute non proprio ferrea di Tomic, costretto a ritirarsi a partita in corso per due volte nelle ultime sei settimane.

La partita tra i due ha immediatamente fatto notizia, ma per le ragioni sbagliate. Tomic è caduto in disonore raccogliendo solo sette game in una partita che è durata 58 minuti, la più breve a Wimbledon da quando nel 2004 Roger Federer ha battuto Alejandro Falla in 54 minuti.

L’All England Club ha reagito annunciando che Tomic perderà il premio partita a lui spettante, ufficialmente perché “non ha reso al livello dello standard professionale richiesto”.

Veloce ma non sufficientemente furioso

Non so se Tomic abbia reso al livello dello standard professionale richiesto, perché non esiste una definizione precisa di “standard professionale”. Ho l’impressione che sia una combinazione dei seguenti elementi:

  • il giocatore ha perso malamente
  • il giocatore ha la reputazione di perdere di proposito
  • la partita ha ricevuto molta attenzione e quindi dobbiamo far vedere di prendere provvedimenti.

Quello che so invece è che gli organizzatori di Wimbledon si sono fissati sul numero sbagliato. Vero, 58 minuti sono una partita in tre set incredibilmente veloce. Ma Tomic — anche quando è in palla ed esprime il meglio — è probabilmente il giocatore più veloce sul circuito, spesso iniziando a servire non appena ha ricevuto la pallina dal raccattapalle. Anche Tsonga ha un ritmo veloce. Nessuno dei due è particolarmente forte alla risposta e su una superficie veloce quello di Tsonga è un servizio devastante, quindi i punti sarebbero stati comunque brevi.

Una statistica più appropriata è rappresentata dal numero dei punti giocati, in questo caso 125, che, rispetto alla durata, non generano scalpore da prima pagina.

Ovunque, multe!

A un tratto, la partita tra Tomic e Tsonga non è più così speciale. Dal 2000, ci sono state altre 77 partite di Slam che hanno richiesto non più di 125 punti, quasi esattamente una partita per Slam. Nell’elenco troviamo due quarti di finale, tre semifinali e la finale degli Australian Open 2003, nella quale Andre Agassi si è sbarazzato di Rainer Schuettler in 76 minuti e dopo 123 punti. Se allarghiamo l’analisi a partite con non più di 130 punti, ne aggiungiamo altre 45, tra cui entrambe le semifinali degli Australian Open 2019.

Più semplicemente, non è inusuale per una partita Slam maschile essere decisa nell’arco di 125 punti. E anche giocatori molto forti a volte perdono così rapidamente. Ma non lo si nota più di tanto perché, in genere, per fare 125 punti occorre un’ora e 21 minuti di gioco.

Ci sono ovviamente molte partite a senso unico anche in campo femminile. 125 punti totali sono più o meno 42 a set, quindi la “linea Tomic” è a circa 83 o 84 punti nelle partite al meglio dei 3 set. Dal 2003, ci sono state 235 partite di singolare femminile con non più di 83 punti, tra cui cinque solo al Roland Garros 2019 (ironicamente, la sconfitta di Anna Tatishvili contro Maria Sakkari, che aveva comportato a sua volta la prima multa di questo genere, era durata 93 punti e 56 minuti, 28 a set).  

Reazionario

Queste considerazioni non implicano che Tomic abbia fatto il massimo nel primo turno, o che “meriti” le 45.000 sterline da un punto di vista etico. Se i giudici arbitro del torneo avessero l’abitudine di visionare tutte le partite di primo turno e togliere il premio partita al giocatore che si è mostrato più apatico, è chiaro che Tomic diventa probabilmente il candidato numero uno a Wimbledon 2019.

Ma non funziona così. La regola dello “standard professionale” non è quasi mai chiamata in causa. Se Tomic avesse sprecato più tempo tra un punto e l’altro per far andare la partita sopra all’ora di gioco, o se il colpevole fosse stato un giocatore dal passato con meno alti e bassi, non saremmo qui a discuterne.

E se l’All England Club si concentrassero sulla giusta statistica, cioè la quantità di tennis giocato e non quanto tempo è servito, lo stile rapido e distaccato di Tomic passerebbe inosservato. Dopo tutto, c’è un altro australiano distaccato, volubile e con un gioco alla risposta scadente che merita la nostra attenzione (e cioè Nick Kyrgios, che ha poi perso al secondo turno in appena più di tre ore di gioco contro Rafael Nadal, n.d.t.).

Let Bernie Keep His Money

Roger Federer, vincitore della lotteria

di Jeff Sackmann // TennisAbstract

Pubblicato il 16 maggio 2019 – Traduzione di Edoardo Salvati

Battendo Borna Coric nel terzo turno degli Internazionali d’Italia a Roma con il punteggio di 2-6 6-4 7-6(7), Roger Federer ha generato statistiche davvero insolite. I suoi 95 punti vinti contro i 107 di Coric equivalgono a un percentuale di punti vinti sul totale (PVT) del 47%, non inedita per il giocatore che vince, ma ai limiti delle effettive possibilità. L’indice di dominio (Dominance Ratio o DR) di Federer – cioè il rapporto tra i punti vinti alla risposta e quelli persi al servizio – è di 0.78, con 1.0 che rappresenta una situazione in cui i punti sono equamente distribuiti. Ha vinto solo 24 volte in carriera con un DR inferiore a 1.0, ed era la prima dal 2015. Occorrenze di questo tipo vengono spesso definite come “partite lotteria”, perché sul risultato incide più fortuna del solito.

Non solo Federer ha vinto con una PVT minore del 50% e un DR inferiore a 1.0, ma in ciascuno dei set ha ottenuto numeri ancora più bassi. Ha vinto 23 punti su 55 (41.8%) nel primo, 31 su 64 (48.4%) nel secondo e 41 su 83 (49.4%) nel terzo. Avendo perso malamente il primo set, c’è da aspettarsi un totale così ridotto. Spesso però, numeri scadenti per un’intera partita arrivano da un rendimento mediocre in un set, come può essere per un punteggio di 7-6 1-6 7-6. Coric ha giocato meglio di Federer, almeno in parte, in tutti e tre i set.

Un evento raro

Il vostro sospetto di essere di fronte a un evento raro è fondato. Solo il 4.5% delle partite del circuito maggiore finisce a favore del giocatore che ha vinto meno punti, e solo il 7.2% di quelle in cui il vincitore ha un DR inferiore a 1.0. Solitamente c’è sovrapposizione, ma non sempre. Circa il 4% delle partite sono vinte da un giocatore con una PVT minore al 50% e un DR inferiore a 1.0. Ed è ancora più facile che i singoli set siano vinti dal giocatore che ha fatto più punti. Solo il 2.4% dei set è vinto dal giocatore che ha perso più punti. La frequenza con cui il DR è minore di 1.0 è del 7.4%, circa la stessa che dell’intera partita.

Esiste però un precedente – esattamente uno! – dell’impresa di Federer, vale a dire vincere una partita con una PVT minore del 50% e un DR inferiore a 1.0 in ognuno dei tre set. Stiamo parlando di un singolo episodio in un database con più di 17.000 partite punto per punto del circuito maggiore dal 2010. Inevitabilmente, c’è lo zampino di John Isner.

Ma c’è Isner, come sempre

Nel torneo di Memphis 2017, Isner ha perso il quarto di finale contro Donald Young per 7-6 3-6 7-6. Young ha vinto solo il 46.9% dei punti totali, con un DR di 0.66, entrambi valori che un giocatore che vince la partita difficilmente potrà mai abbassare. Come Federer, Young è andato vicino nei set che ha vinto, con un 49.3% dei punti totali sia nel primo che nel terzo set. Salvando otto palle break su nove e resistendo al servizio di Isner nel tiebreak, Young ha avuto la meglio di un avversario statisticamente superiore.

La vittoria di Federer contro Coric non ha fatto grande leva sul rendimento sulle palle break, anche se i tifosi apprezzeranno la confortante trasformazione di due opportunità su quattro. Si è detto molto della ridotta efficacia di Federer in quel tipo di partite: a fronte di 24 vittorie con un DR inferiore a 1.0, ha subito 49 sconfitte con un DR superiore a 1.0. E spesso la colpa ricade sulle palle break sprecate. Se i giocatori dal servizio dominante tendono a giocare spesso partite equilibrate, Federer è riuscito a vincerne molte senza fare affidamento su quelle in cui la fortuna ha un ruolo preponderante.

Con un posto assicurato nelle pagine più illustri del libro dei record, Federer si sta mettendo in mostra anche nei capitoli più oscuri. Dopo averci deliziato con vittorie a senso unico, finalmente ha portato a casa una partita in cui le statistiche puntavano nella direzione opposta.

Roger Federer, Lottery Winner

Questi giocatori sono simili tra loro?

di Chapel Heel // FirstBallIn

Pubblicato il 10 ottobre 2018 – Traduzione di Edoardo Salvati

Mentre ero alle prese con un’altra indagine che ha richiesto l’estrazione di statistiche cumulate per il circuito maschile, mi sono fermato a riflettere sull’esistenza di due giocatori simili tra loro, o se tutti invece sono diversi nel loro talento, distinguendosi cioè per bravura in determinate aree di gioco. Ci saranno sicuramente molti modi per scoprirlo ma, non essendo l’obiettivo di partenza, volevo comunque usare i dati che avevo già raccolto.

Si tratta di statistiche aggregate dei primi 200 giocatori (alla data del 10 luglio 2018) sul cemento negli ultimi due anni e mezzo, contro avversari la cui classifica non supera il numero 300. Ho eliminato 11 giocatori con meno di 150 game al servizio, perché non sufficientemente rappresentativi in quel tipo d’intervallo.

La costruzione dei sottoinsiemi

Ho suddiviso i giocatori in sottoinsiemi rispetto a ciascuna delle sette seguenti statistiche espresse in percentuale: ace, doppi falli, prime in campo, punti vinti con la prima, punti vinti con la seconda, punti vinti alla risposta sulla prima, punti vinti alla risposta sulla seconda. Ho denominato i sottoinsiemi con lettere comprese tra la A la F e ripartito i giocatori in funzione del loro rendimento rispetto alle statistiche considerate:

  • il sottoinsieme A per giocatori con una deviazione standard dalla media maggiore di 1.5
  • il B con una tra 1.5 e 0.5
  • il C con una tra 0.5 e -0.5
  • il D con una tra -0.5 e -1.5
  • e il sottoinsieme F per giocatori con una deviazione standard dalla media maggiore di -1.5

(in molti dei sottoinsiemi, le statistiche dei giocatori non sono distribuite secondo una normale, quindi non abbiamo una gaussiana dalla forma simmetrica. In particolare, la percentuale di ace, di doppi falli, di prime in campo e di punti vinti alla risposta sulla seconda sono decisamente non lineari. Quello della percentuale di ace è un caso limite vista la presenza di un numero straordinario di artisti dell’ace, e solo Yoshihito Nishioka è incredibilmente peggiore della media).

In tutte le categorie tranne la percentuale di doppi falli, i valori più alti hanno determinato una A e quelli più bassi una F.

L’associazione dei sottoinsiemi

Con un metodo decisamente elementare, ho accostato le lettere che definiscono i sottoinsiemi per verificare eventuali somiglianze tra giocatori in termini di stile o rendimento. Ad esempio, John Isner rientra nella A per tutte le categorie relative al servizio, tranne le B nella percentuale di doppi falli, e nella F per le due categorie alla risposta. Seguendo il precedente ordine, Isner diventa ABAAAFF. Ci sono altri giocatori tra i primi 200 con una sequenza di ABAAAFF sul cemento? Nessuno!

Anzi, di 189 giocatori, solo 10 hanno la stessa sequenza di un altro giocatore e non ci sono tre giocatori che ne condividano una. La tabella elenca i giocatori con una sequenza in comune (tra parentesi).

Fritz - Bedene (BBDBCCC)
Tiafoe - Mayer (CCCCBCC)
Munar - Medvedev (CCCCCBB)
Mahut - Cuevas (CCCCCCD)
Millman - Nishikori (DBCCBBB)
Kohlschreiber - Kecmanovic (DBCCBCC)
Maden - Simon (DBCDCBA)
Jung - Ito (DCBDDBC)
Fabbiano - Albot (DCBFCBB)
Schwartzman - Majchrzak (DCCDCBA)

Degli strani accoppiamenti, eh? Se si includessero parametri come l’altezza o l’età, la maggior parte di questi giocatori verrebbe immediatamente separata. Non penso che quello di John Millman e Kei Nishikori sia un accostamento terribile in termini di stile, anche se è chiaro che non possiedono lo stesso talento (o, almeno, lo stesso rendimento). La coppia formata da Jaume Munar e Daniil Medvedev è assurda.

Parte della ragione di accoppiamenti così inusuali è legata alla presenza di soli cinque sottoinsiemi. Questo determina che un giocatore possa condividere il sottoinsieme di una determinata statistica con un altro giocatore, rispetto al quale però abbia poi un rendimento significativamente migliore, o peggiore. È un circuito dai margini ridotti. Ad esempio, Aljaz Bedene e Taylor Fritz sono molto ravvicinati in tutte le statistiche tranne una, i punti vinti alla risposta sulla prima, nella quale Bedene ha un valore più alto di 1.3% (pur rimanendo nello stesso sottoinsieme). Può sembrare poco, ma è una differenza importante dal punto di vista dei risultati. Non lo è però nello stile, anche se si trovano in due momenti della carriera decisamente diversi.

Normalizzare per il livello di competizione

Un aspetto più importante che spiega la stranezza di questi accoppiamenti è la differenza nel tipo di competizione affrontata. In altre parole, le statistiche della partita sono modellate non solo dalla bravura di un giocatore ma anche da quella dell’avversario. Prendiamo di nuovo Bedene e Fritz. Per quanto abbiano in ogni sottoinsieme un rendimento simile (solitamente, molto simile) la classifica media degli avversari di Bedene sul cemento negli ultimi due anni e mezzo è circa 88, contro 114 per gli avversari di Fritz. La classifica non è la definizione ultima della qualità di un avversario, ma tra 88 e 114 c’è una differenza notevole. Tranne che per Jung – Ito, il divario tra classifiche degli avversari in ciascuna coppia è enorme, con la massima distanza in Schwartzman – Majchrzak e Kohlschreiber – Kecmanovic.

Sarebbe interessante poter normalizzare le statistiche per verificarne il valore contro un avversario comune, per poi ricreare i sottoinsiemi e ripartire nuovamente i giocatori. Nessuno dei modi in cui ipotizzo si possa fare questo passaggio è di facile applicazione, ma ho proceduto ai fini di quest’analisi come segue.

Tipicamente, quando si vuole normalizzare una statistica nello sport, si considera il contesto di riferimento (nel baseball ad esempio, è il caso degli stadi o dei campionati, specialmente nel confronto fra epoche). Nel tennis, estrapolare il contesto è abbastanza difficile. Si può iniziare considerando solo una specifica superficie, sorge poi però il problema del “campionato” inteso in senso più ampio. Sulla carta, le partite riguardano avversari dell’intero universo tennistico.

Combinazioni uniche di giocatori

Nella realtà, per ciascuna finestra temporale, ogni giocatore affronta una combinazione unica di colleghi. Un campione di dati che include le partite dei primi 200 solo contro i primi 300 è di aiuto, ma in due anni e mezzo sul cemento, ogni giocatore dei primi 200 con un numero di partite rilevanti su questa superficie gioca all’incirca contro 50 giocatori dei primi 300, spesso molti di meno. Detto altrimenti, ogni giocatore fa un campionato a sé con un livello di qualità differente.

Il metodo di normalizzazione quindi (almeno per ora) è di stabilire gli avversari di un giocatore nei due anni e mezzo di partite sul cemento, calcolare la loro media cumulata (ponderata) in ciascuna statistica contro i primi 300 e confrontarla con la relativa media complessiva per i primi 200. Dovremmo così arrivare a conoscere il grado di bravura dell’universo di avversari di un giocatore – relativamente alla media per ciascuna statistica dei primi 200 – le cui variazioni positive o negative dalla media complessiva servono per correggere i valori della specifica statistica per il giocatore che stiamo studiando.

Ad esempio, se l’universo di avversari di Fritz è migliore della media nella percentuale di punti vinti alla risposta sulla prima di servizio, possiamo aumentare la sua percentuale di punti vinti sulla prima (la corrispondente statistica) a simulazione di quanto avrebbe ottenuto contro un avversario medio.

Opposizione tra statistiche

In questa sede ho tralasciato la percentuale di doppi falli e le prime in campo. Sono infatti entrambe statistiche su cui dovrebbe incidere la bravura alla risposta dell’avversario ma, a differenza degli altri cinque sottoinsiemi, non esiste una statistica direttamente opposta da rendere il calcolo relativamente agile. Alla percentuale di ace si oppone la percentuale di ace dell’avversario, alla percentuale di punti vinti sulla prima o sulla seconda si oppone la percentuale di punti vinti alla risposta sulla prima o sulla seconda dell’avversario, alla percentuale di punti vinti alla risposta sulla prima o sulla seconda si oppone la percentuale di punti vinti sulla prima o sulla seconda dell’avversario. Non so dire quantitativamente quanto la bravura dell’avversario alla risposta incida sulla percentuale di doppi falli e di prime in campo.

Dopo aver ricostruito i sottoinsiemi con le statistiche normalizzate, si ottengono 11 accoppiamenti di giocatori simili, tra cui un’occorrenza di tre giocatori simili tra loro, come mostrato nella tabella (tra parentesi, la sequenza).

Kecmanovic - Donskoy (CBCCBDC)
Smyczek - Fratangelo (CBCDCCC)
Fritz - Lacko - Seppi (CBDBCCC)
Kudla - Munar (CCCCCCB)
Tiafoe - Mayer (CCCCCCC)
Rosol - Barrere (CCCCDDC)
Novak - Mmoh (CDBDDCC)
Carreno Busta - Pella (DBBDBCB)
Maden - Mannarino (DBCDCBB)
Dzumhur - Albot (DCBFCBB)
Basilashvili - Koepfer (DDCDCCC)

Ammetto di non conoscere così bene tutti questi giocatori da poter dire ad esempio se Barrere ha uno stile in realtà dissimile a quello di Rosol ma, generalmente, la normalizzazione restituisce un elenco molto più ragionevole del precedente. Anzi, ci sono un paio di accostamenti davvero validi, tra cui Smyczek – Fratangelo, Fritz – Lacko – Seppi, Kudla – Munar e Novak – Mmoh. Non sembrano esserci coppie apertamente prive di senso, anche se Basilashvili è indirizzato verso il divorzio da Koepfer.

Noterete che solo una coppia sopravvive alla normalizzazione, cioè quella formata da Frances Tiafoe e Leonardo Mayer. Continua a essere strano saperli accostati in questo modo, ma le loro statistiche normalizzate sono più vicine di quelle non normalizzate, quindi non dipende solo dal fatto che rientrano nel sottoinsieme medio in tutte le statistiche considerate.

Indici di somiglianza

Spesso ho desiderato creare indici di somiglianza alla Bill James, trovando la difficoltà scoraggiante. Quelli di James per i giocatori baseball erano abbastanza chiari perché basati su statistiche non normalizzate. Lo stesso metodo nel tennis richiederebbe solo un aggiustamento dei punti associati alle differenze tra giocatori in varie statistiche. Ritengo però che non sia un sistema efficace. Ricordo di aver generato (molti anni fa) un foglio di calcolo che usava statistiche dei giocatori di baseball normalizzate per epoca e stadio, per poi applicare gli indici di somiglianza.

È invitante fare lo stesso nel tennis, ma la parte relativa alla normalizzazione è ben più complicata, per le ragioni di cui ho parlato. Essenzialmente, ogni giocatore è nel suo personale campionato. E il procedimento qui usato, molto noioso nonostante la semplicità, si riferisce solo a due anni e mezzo di partite, non alla durata di una carriera. Ma si può continuare a sognare.

Are these ATP players similar?

La giocatrice di tennis più prevedibile

di Jeff Sackmann // TennisAbstract

Pubblicato il 12 aprile 2019 – Traduzione di Edoardo Salvati

Caroline Wozniacki è una donna di abitudini. In otto game al servizio nella vittoria di primo turno contro Laura Siegemund a Charleston la settimana scorsa, ha replicato una sequenza ben precisa: servizio esterno sul primo punto, al centro sul secondo, al centro sul terzo ed esterno sul quarto. Se si escludono due prime sbagliate non definibili come “esterne” o “al centro”, si tratta complessivamente di trenta punti, sui quali Wozniacki ha sempre servito nella direzione a lei più congeniale. Dal quinto punto di ciascun game, la scelta è stata più casuale.

Non è niente di nuovo per la danese ex numero 1 del mondo. Contro Monica Niculescu al terzo turno a Miami, ha giocato undici game al servizio. Nei primi quattro punti di ciascuno, ha imposto la stessa sequenza, cioè esterno, al centro, al centro, esterno. Quarantaquattro punti al servizio e nessuna sbandata dalla rotta maestra della prima. Il Match Charting Project ha raccolto dati per più di 2600 partite femminili, e nessun’altra giocatrice ha mai servito per una partita intera senza alcuna variazione nella direzione dei primi quattro punti del game. Wozniacki lo ha fatto in diciassette partite.

Una misura della prevedibilità al servizio

Vediamo quanto Wozniacki si discosta dalle avversarie nell’essere così estrema in termini di ripetitività. Ho classificato ogni prima di servizio come “esterna” o “al corpo”. Il Match Charting Project prevede tre direzioni (esterna, al corpo, al centro) e nel caso un servizio sia codificato “al corpo”, ho utilizzato il primo colpo della giocatrice alla risposta come indicazione della direzione al servizio. Non è un metodo perfetto, perché alcune giocatrici, su un servizio debole, possono girare intorno alla pallina, ma è un’ottima approssimazione. Ho escluso servizi al corpo che non hanno avuto risposta o che non sono terminati in campo. La tabella riepiloga la percentuale con cui Wozniacki ha servito esterno in ogni punto di più di mille game di servizio di cui abbiamo dati punto per punto.

Punto     % Sv esterno   
Primo 82.8%
Secondo 17.4%
Terzo 16.7%
Quarto 78.5%
Quinto 52.3%
Sesto 46.8%
Parità 48.0%
Vantaggi 50.6%

Prevedibilità della prima di servizio o PPS

Wozniacki sceglie di modificare la direzione della prima di servizio nei primi quattro punti una volta ogni cinque servizi. Se riportiamo le prime quattro percentuali (82.8%, 17.4%, 16.7% e 78.5%) alla frequenza con la quale Wozniacki serve nella direzione preferita (82.8%, 82.6%, 83.3% e 78.5%), si ottiene una media – che chiamerò Prevedibilità della Prima di Servizio (o PPS) – dell’81.8%. Solo altre due giocatrici con almeno dieci partite nel database, cioè Kateryna Kozlova e Justine Henin, superano il 70%, e la ripetitività di Henin ha più a che fare con la sua perseveranza nella ricerca del servizio al centro in qualsiasi situazione.

Incredibilmente, i numeri complessivi di Wozniacki non lasciano trasparire quanto effettivamente ricorra a quella sequenza nella strategia di gioco attuale. Nel Match Charting Project ci sono 52 sue partite dall’inizio del 2017, e da quel sottoinsieme più recente si ricava una PPS del 94.0%. Ho il sospetto che sia un valore così estremo a dare una migliore rappresentazione delle dinamiche al servizio di Wozniacki, perché la recente varietà di partite è più ampia e include anche avversarie più deboli. Quello del Match Charting Project non è un campione casuale, e le partite più datate tendono anche a essere state giocate contro avversarie di alto profilo.

Le colleghe di Wozniacki non proprio colleghe

Analizziamo altre giocatrici con una prevedibilità superiore alla media. La mediana della giocatrice con almeno dieci partite nel Match Charting Project è rappresentata da una PPS di circa il 58%, vale a dire che la giocatrice potrebbe avere preferenza per una specifica direzione o servire spesso sul rovescio di una destrimane, ma in generale modifica regolarmente le proprie scelte al servizio. La tabella riepiloga le venti giocatrici con la più bassa variazione. Per ciascuna, è mostrata la frequenza di un servizio esterno in ognuno dei primi quattro punti del game, la PPS dei primi quattro punti (1-4), e la PPS per i punti dal quinto in avanti (5+).

Giocatrice      1°   2°   3°   4°   PPS (1-4)  PPS (5+)   
Wozniacki 83% 17% 17% 79% 82% 52%
Kozlova 60% 35% 10% 73% 72% 64%
Henin 38% 11% 57% 25% 71% 66%
Vikhlyantseva 92% 46% 38% 63% 68% 54%
Petkovic 74% 72% 36% 38% 68% 58%
Vondrousova 15% 63% 30% 54% 68% 68%
Brengle 82% 67% 53% 68% 67% 56%
Clijsters 86% 32% 61% 52% 67% 56%
Stephens 76% 21% 53% 46% 65% 62%
Voegele 71% 35% 59% 34% 65% 60%

Giocatrice 1° 2° 3° 4° PPS (1-4) PPS (5+)
Dementieva 76% 54% 71% 60% 65% 60%
Dodin 58% 14% 43% 43% 65% 64%
Li Na 28% 33% 52% 33% 65% 56%
Kerber 43% 78% 56% 67% 65% 64%
Doi 21% 60% 64% 56% 65% 63%
Vandeweghe 35% 35% 62% 66% 65% 55%
A. Beck 59% 24% 45% 33% 64% 61%
Sanchez Vicario 43% 77% 42% 65% 64% 64%
Buzarnescu 19% 39% 58% 46% 64% 59%
Sevastova 73% 58% 37% 60% 64% 55%

Solo due, Kozlova e Natalia Vikhlyantseva, seguono l’orientamento di fondo di Wozniacki con la combinazione esterno/al centro/al centro/esterno. Molte delle giocatrici, come Henin, preferiscono servizi esterni o al centro in tutti i punti, altre, come Andrea Petkovic e Coco Vandeweghe, optano spesso per un tipo di servizio nei primi due punti e uno diverso nei due successivi.

Assenza di tendenze distintive

È difficile estrapolare delle tendenze distintive da queste scelte, specialmente perché molte giocatrici sono più vicine al livello mediano di prevedibilità di quanto non lo siano alla continuità quasi maniacale di Wozniacki. L’ultima colonna, la PPS per i punti dal quinto in avanti, illustra un altro aspetto dell’unicità di Wozniacki. Dopo aver seguito fedelmente la solita sequenza nei primi quattro punti, la selezione passa a circa un 50% di servizi esterni e al centro, anche nelle partite più estreme del periodo dal 2017 a oggi.

Molte delle giocatrici dell’elenco non adottano questa strategia. Ad esempio, Angelique Kerber ha un’enfasi marcata per il servizio esterno sul lato dei vantaggi a game inoltrato quasi simile a quella di Wozniacki. Serve esterno con la prima più dell’80% delle volte sul 40-30 o 30-40, e il 73% delle volte sul AD-40 o sul 40-AD. Anche Henin rimane incollata al suo servizio preferito sui punti a maggiore importanza.

Equilibrio

Quale sia la ragione, Wozniacki ha fiducia sul funzionamento di una tattica con la quale si trova a proprio agio o è sicura che non le si ritorca contro. E non è nemmeno un segreto, visto che ci ho fatto caso dopo che l’allenatore di Siegemund l’ha evidenziata alla sua giocatrice in un cambio di campo durante la partita a Charleston.

Nel tennis, decisioni come queste sono all’ordine del giorno: quando seguire una strategia e quanto discostarsene affinché non diventi troppo prevedibile per l’avversaria. Nel podcast di questa settimana, con Carl Bialik ci siamo chiesti quanto spesso una giocatrice (o un giocatore) avrebbe bisogno di utilizzare un servizio dal basso per costringere l’avversaria a essere fuori posizione alla risposta. Se l’esempio di Wozniacki è di qualche indicazione, la risposta è: non molto spesso. Il semplice fatto che Wozniacki avrebbe potuto servire comunque in un’altra direzione era ragione apparentemente sufficiente da impedire a Niculescu o Siegemund di attaccare la prima, anche se Wozniacki avesse mantenuto la selezione dei servizi dal primo all’ultimo game della partita.

Conclusioni

Sono consapevole che sto lasciando in sospeso molte questioni. Wozniacki vince più punti con la prima se adotta una maggiore variazione? La sua seconda segue dinamiche simili? Fa leva sull’esito dei primi quattro punti come aiuto decisionale per la direzione del servizio nei punti successivi? Ci sono giocatrici diverse dalle altre che la costringono a essere più imprevedibile, come Madison Keys nella finale del torneo di Charleston grazie a una tattica aggressiva alla risposta?

Rimanete sintonizzati, potrei trovare qualche risposta. Nel frattempo, spero che vi sia del divertimento aggiuntivo alla prossima partita di Wozniacki che vi capiterà di guardare, conoscendo in anticipo la direzione del servizio. Magari, sarà quella rara volta in cui la giocatrice di tennis più prevedibile è partita per la tangente.

Grazie a Kees per i dati punto per punto della partita contro Siegemund e per la segnalazione della conversazione in campo con l’allenatore, da cui è nata l’idea per questo articolo.

The Most Predictable Woman in Tennis

Around the Net, numero 8

di Jeff Sackmann // TennisAbstract

Pubblicato il 14 aprile 2019 – Traduzione di Edoardo Salvati

Around the Net è il nuovo appuntamento settimanale di @tennisabstract per rilanciare contenuti analitici di tennis apparsi in varie modalità su internet. Dell’abbondanza di stimoli disponibili nella versione originale, @setteseitennis propone una sintesi. Il numero 7.

Articoli tradotti in italiano

Dati

  • Match Charting Project: il database è aumentato di più di 75 partite nelle ultime due settimane, da 5439 a 5517. Abbiamo aggiunto molte altre semifinali Slam maschili e femminili degli anni ’90, alcune finali femminili d’annata dei tornei di Hilton Head e Berlino, oltre alla solita sfilza di partite dai tornei più recenti di entrambi i circuiti.
  • Un’analisi della rotazione imposta alla pallina durante il Miami Masters (twitter.com/Vestige_du_jour)

Spallinature

  • Al torneo ITF di Sunderland, Tara Moore ha recuperato da uno svantaggio di 0-6, 0-5, 30-40 vincendo il secondo set al tiebreak e chiudendo la partita 6-3 al terzo.
  • Incredibilmente, nella storia del tennis femminile esiste un recupero ancora più improbabile. Nelle qualificazioni degli US Open 1983, Barbi Bramblett perdeva 0-6, 0-5, 0-40 contro Ann Hulbert. Riuscì poi ad annullare 18 match point e vincere la partita per 0-6 7-5 6-3.
  • Rispetto al recupero di Moore, la maggior parte delle stranezze che accadono sul circuito femminile passa quasi inosservata. Ma c’e n’è pronta un’altra. Nel torneo di Charleston, dopo aver perso il primo set 0-6, Kaia Kanepi ha recuperato contro Elise Mertens per vincere 0-6 6-0 7-5, la prima volta dal 2000 che una qualsiasi partita (compresi i tornei ITF) finisce con quello specifico punteggio.

Around the Net, Issue 8

Around the Net, numero 7

di Jeff Sackmann // TennisAbstract

Pubblicato il 31 marzo 2019 – Traduzione di Edoardo Salvati

Around the Net è il nuovo appuntamento settimanale di @tennisabstract per rilanciare contenuti analitici di tennis apparsi in varie modalità su internet. Dell’abbondanza di stimoli disponibili nella versione originale, @setteseitennis propone una sintesi. Il numero 6.

Articoli tradotti in italiano

Dati

  • Match Charting Project: il database è aumentato di più di 60 partite nell’ultima settimana, da 5376 a 5439. Abbiamo aggiunto quasi tutte le finali femminili a Miami dal 1989 al 1996 e molte semifinali Slam maschili e femminili. Naturalmente, ci sono anche molte partite dal torneo di Miami appena concluso, tra cui le semifinali e la finale femminile.
  • Ho aggiornato la pagina GitHub del Match Charting Project.

Spallinature

  • Se Roger Federer può finalmente diventare il primo giocatore a vincere due titoli in stagione (come è riuscito poi a fare battendo John Isner in finale con il punteggio di 6-1 6-4, n.d.t.), tra le giocatrici nessuna ha vinto più di un torneo. A Miami, Ashleigh Barty è diventata la 14esima campionessa in altrettanti eventi del circuito maggiore.
  • Per arrivare in finale, Federer ha dovuto battere un giocatore più giovane di quindici anni. Anzi, in entrambe le semifinali, la differenza di età è stata di almeno un decennio e mezzo. È la prima volta che accade tra gli uomini dal 1979. Ci si è andati più vicini il mese scorso a Dubai, con le semifinali tra Federer e Borna Coric e tra Gael Monfils e Stefanos Tsitsipas, entrambe con una differenza di almeno 11.9 anni.
  • A proposito di semifinali insolite, i fratelli Bryan hanno battuto la coppia Kubot/Melo con il punteggio di 7-6(7) 6-7(8) [14‑12], praticamente la partita più lunga che si riesce ad avere nelle limitazioni imposte dal format attuale, senza game ai vantaggi e il super-tiebreak nel set decisivo (i Bryan hanno poi vinto anche il torneo, n.d.t.). Sono stati giocati 187 punti. Anche di fronte alla difficoltà di reperire statistiche per il doppio, possiedo un insieme ragionevolmente completo di partite dal 2017. In quel periodo, una partita di 187 punti è la più lunga che si sia mai verificata. Ce n’è stata un’altra da 187 punti nel 2018 e una maratona da 186 nel 2017.
  • Grazie in parte ai risultati al Miami Masters, Felix Auger Aliassime ha vinto le sue prime cinque partite in carriera contro giocatori tra i primi 20, un’impresa assolutamente inedita. Mario Ancic ha vinto le prime tre, Auger Aliassime è l’unico ad averne vinte di più. Dopo la sconfitta in semifinale contro Isner, il suo record è diventato 5-1, ma non ha perso la possibilità di estenderlo. Nessuno ha infatti vinto più di sette delle prime dieci partite contro i primi 20, un traguardo raggiunto solo da Gustavo Kuerten e Andrei Medvedev.

Around the Net, Issue 7

Around the Net, numero 6

di Jeff Sackmann // TennisAbstract

Pubblicato il 24 marzo 2019 – Traduzione di Edoardo Salvati

Around the Net è il nuovo appuntamento settimanale di @tennisabstract per rilanciare contenuti analitici di tennis apparsi in varie modalità su internet. Dell’abbondanza di stimoli disponibili nella versione originale, @setteseitennis propone una sintesi. Il numero 5.

Articoli tradotti in italiano

Dati

Match Charting Project: il database è aumentato di 50 partite nell’ultima settimana, da 5326 a 5376. Abbiamo aggiunto molte finali femminili a Miami, tra cui quella in famiglia tra le sorelle Williams nel 1999, molte altre partite femminili e maschili dall’Indian Wells Master appena concluso e dal torneo di Miami (Masters e Premier Mandatory) in corso e un po’ di partite storiche, compresa la finale femminile a Wimbledon 1973 e la finale femminile alle Olimpiadi di Pechino 2008.

Spallinature

  • Siamo ancora in attesa di un pluri-vincitore per la stagione in corso. In campo maschile, 19 giocatori hanno alzato il trofeo in altrettanti tornei, un nuovo record.
  • Non potrà essere Dominic Thiem il giocatore a interrompere questa striscia, almeno non a Miami, vista la sconfitta al secondo turno (la sua prima partita) contro Hubert Hurkacz. Dal 2010, Thiem è il primo vincitore di Indian Wells che non riesce a vincere neanche una partita a Miami. In quell’anno infatti Ivan Ljubicic aveva perso contro Benjamin Becker. Thiem non è in brutta compagnia, perché gli altri nomi sono quelli di Novak Djokovic, Lleyton Hewitt e Alex Corretja.
  • In linea teorica, è concepibile invece che a farlo possa essere Reilly Opelka, che ha battuto Diego Schwartzman nonostante nel primo set abbia servito meno ace dell’avversario. Non ne ha infatti servito nemmeno uno, solo la sua seconda partita sul circuito maggiore in cui meno del 10% dei punti al servizio sono stati ace (l’altra è il primo turno contro Tommy Haas a Houston 2017, e in carriera la frequenza è del 22.3%).
  • Kei Nishikori non è più il re dei set decisivi. Dopo aver perso al terzo set contro Dusan Lajovic nella prima partita a Miami, è ora Djokovic in cima alla classifica della percentuale di vittoria nei set decisivi.
  • Naomi Osaka ha vinto il primo set del terzo turno contro Su-Wei Hsieh, per poi perdere i successivi due e la partita. Dal 2016, è la prima volta che Osaka non riesce a vincere dopo aver conquistato il primo set, una striscia di cui ho parlato in un precedente articolo. Le sarebbero mancate altre 156 partite prima di arrivare al record di Chris Evert!

Around the Net, Issue 6

Around the Net, numero 5

di Jeff Sackmann // TennisAbstract

Pubblicato il 17 marzo 2019 – Traduzione di Edoardo Salvati

Around the Net è il nuovo appuntamento settimanale di @tennisabstract per rilanciare contenuti analitici di tennis apparsi in varie modalità su internet. Dell’abbondanza di stimoli disponibili nella versione originale, @setteseitennis propone una sintesi. Il numero 4.

Articoli tradotti in italiano

Dati

  • Match Charting Project: il database è aumentato di 70 partite nell’ultima settimana, da 5256 a 5326. Abbiamo aggiunto moltissime partite maschili e femminili dell’Indian Wells Masters, qualche altra semifinale di Wimbledon degli anni ’90 (protagonista Boris Becker) ma, soprattutto, tre finali femminili del Roland Garros a lungo ricercate. Abbiamo finalmente completato tutte le finali Slam maschili e femminili del Roland Garros dal 1980.

Spallinature

  • Belinda Bencic continua ad accumulare vittorie contro le prime 10 della classifica e, nonostante la sconfitta in semifinale a Indian Wells da Angelique Kerber (battuta a sua volta da Bianca Andreescu, n.d.t.), il suo record si è mantenuto sopra la parità, con 19 vittorie e 16 sconfitte. Si tratta di un risultato di cui poche possono vantarsi, anche tra giocatrici che consideriamo di élite.
  • Sara Errani ha commesso lo strabiliante numero di 57 doppi falli nelle ultime quattro partite, tra cui 22 contro Irina Camelia Begu nel primo turno di Guadalajara. Eppure, le ha vinte tutte! 57 doppi falli sono più del totale commesso in tutta la stagione 2017 o in quella 2018.
  • La Next Gen femminile sta emergendo rapidamente. La sedicenne Clara Tauson ha vinto il torneo ITF $60K di Shenzen, e la quindicenne Dasha Lopatetskaya ha vinto il quinto torneo da professionista. Altre tre giovanissime hanno vinto tornei ITF in settimana e altre due sono arrivate in finale.
  • Battendo Novak Djokovic, Philipp Kohlschreiber è diventato il quarto giocatore più vecchio di sempre a eliminare il numero 1 della classifica mondiale.
  • Ivo Karlovic ha festeggiato i 40 anni compiuti tre settimane vincendo tre partite a Indian Wells, la prima volta dal 2011 (sempre a Indian Wells) in cui ha vinto almeno tre partite in un Master.

Around the Net, Issue 5

Around the Net, numero 4

di Jeff Sackmann // TennisAbstract

Pubblicato il 9 marzo 2019 – Traduzione di Edoardo Salvati

Around the Net è il nuovo appuntamento settimanale di @tennisabstract per rilanciare contenuti analitici di tennis apparsi in varie modalità su internet. Dell’abbondanza di stimoli disponibili nella versione originale, @setteseitennis propone una sintesi. Il numero 3.

Articoli tradotti in italiano

Dati

  • Match Charting Project: il database è aumentato di più di 60 partite nell’ultima settimana, da 5194 a 5256. Abbiamo completato tutte le finali femminili di Indian Wells fino al 2004, insieme a quelle del 1999 e 2000. Abbiamo aggiunto tutte le finali dei tornei della settimana scorsa, le ultime quattro partite di Nick Kyrgios nella vittoria di Acapulco, e un’altra manciata di semifinali Slam di Pete Sampras.
  • I video più ricercati: ci manca davvero poco per completare alcuni speciali insiemi di partite, ma non riusciamo a trovare il video di alcune partite chiave. Aiutateci per favore!

Spallinature

  • Laslo Djere è la testa di serie numero 30 all’Indian Wells Masters 2019. È solo la seconda volta dall’introduzione dei Master 1000 obbligatori a seguito della riorganizzazione dei tornei maschili intorno al 2000 che una wild card riceve una testa di serie in un Master 1000 obbligatorio. Djere non ha mai vinto una partita a livello Master e ha vinto solo quattro partite sul cemento in tornei del circuito maggiore (Djere ha poi superato il primo turno battendo Guido Andreozzi per 6-3 6-4 e deve giocare il secondo turno contro un lucky loser, con la concreta possibilità quindi di arrivare almeno al terzo turno, n.d.t.).
  • Anche Donald Young ha ricevuto una wild card per il tabellone principale, la sua 29esima per il tabellone di un torneo del circuito maggiore, e la quarta a Indian Wells, dopo aver avuto la prima ben quattordici anni fa.
  • Sempre a Indian Wells, la numero 104 della classifica femminile Stefanie Voegele ha battuto a sorpresa la testa di serie numero 4 Sloane Stephens. Forse sorpresa non è esattamente la parola giusta, visto che Voegele ha vinto quattro volte su cinque contro Stephens, e tutte le vittorie tranne una sono arrivate dopo che Stephens è entrata tra le prime 15.
  • I numeri dei 100 titoli di Roger Federer: dove ha vinto di più? Chi ha battuto di più? (bbc.com)

Around the Net, Issue 4