Tendenze al servizio sulle palle break nel circuito maschile

di Jeff Sackmann // TennisAbstract

Pubblicato il 7 febbraio 2019 – Traduzione di Edoardo Salvati

Nei momenti di maggiore pressione, ogni giocatore fa ricorso al servizio preferito, quello che ritiene dare più garanzie. Allo stesso tempo, l’avversario è in grado di identificare la ripetitività delle dinamiche al servizio, quindi nessun giocatore può essere troppo prevedibile al riguardo. Affidiamoci ai numeri per vedere le direzioni di scelta, l’efficacia realizzativa e le indicazioni dai risultati che ne derivano in termini di strategie al servizio nel circuito maschile.

Nello specifico, analizziamo le prime sul lato dei vantaggi, e la direzione del servizio sulle palle break. Ai nostri fini, concentriamoci su 43 giocatori, vale a dire quelli con almeno 20 partite dal 2010 a oggi inserite nel database del Match Charting Project. Per ciascuno, abbiamo almeno 85 palle break sul lato dei vantaggi, oltre a più di 800 punti sempre sul lato dei vantaggi che non sono palle break (ho escluso i punti del tiebreak, perché seppur molti sono ad alta pressione, la dinamica è meno facile da comprendere). Per la maggior parte dei giocatori i dati a disposizione sono ben più abbondanti, tra cui quasi 1000 palle break sul lato dei vantaggi sia per Novak Djokovic che per Rafael Nadal.

Prima domanda: qual è il servizio preferito sulle palle break?

In media, i 43 giocatori del campione hanno servito il 20% in più di prime esterne rispetto alle prime al centro (anche i servizi al corpo sono rilevanti, ma compongono poco meno del 10% del totale delle prime, e confrontare due opzioni è decisamente più semplice che confrontarne tre).

La differenza del 20% non è così ampia quanto sembri, visto che sui punti che non sono palle break sul lato dei vantaggi la decisione è per il servizio esterno circa il 10% più spesso. Pur rimanendo il servizio esterno la scelta classica, è solo poco più frequente che su altri punti sul lato dei vantaggi.

Le medie del circuito non danno una rappresentazione completa, guardiamo quindi le individualità. La tabella riepiloga i dieci giocatori che più scelgono una determinata direzione con la prima di servizio sul lato dei vantaggi quando si trovano a fronteggiare una palla break.

Giocatore          PB Esterno/Centro   
Kohlschreiber 2.58
Cuevas 2.46
Shapovalov 1.94
Nadal 1.87
Sock 1.84
Goffin 1.78
Kyrgios 1.69
Dolgopolov 1.66
Thiem 1.64
Carreno Busta 1.58

Simon 0.94
De Minaur 0.94
Monfils 0.90
F. Lopez 0.83
Berdych 0.83
Khachanov 0.82
Ferrer 0.81
Fognini 0.77
Schwartzman 0.69
Coric 0.67

Forse anche voi non siete stupiti dalla presenza di Nadal quasi in cima all’elenco. La combinazione di Nadal e Denis Shapovalov sembrerebbe informare che tutti i mancini seguono la stessa dinamica, anche se poi Feliciano Lopez demolisce l’ipotesi in quanto uno dei giocatori che più preferisce il servizio al centro sulle palle break. Gli altri due mancini del campione, Adrian Mannarino e Fernando Verdasco, hanno servito esternamente più della media, quindi forse è Lopez il “diverso” del gruppo. Senza molti dati su altri mancini attivi in questo periodo, è difficile poterlo dire con certezza.

Seconda domanda: Cosa succede sulle palle break sul lato dei vantaggi rispetto agli altri punti?

Abbiamo già visto che la preferenza è per l’utilizzo del servizio esterno circa il 10% più spesso del servizio centrale in situazioni di altri punti sul lato dei vantaggi. La differenza raddoppia sulle palle break. C’è una facile spiegazione a variazioni di entità modesta come queste: la maggior parte dei giocatori serve esterno un po’ meglio sul lato dei vantaggi e, quando la pressione aumenta, è più probabile che si affidi all’opzione più sicura.

Per alcuni però, non c’è nulla di modesto. Philipp Kohlschreiber ad esempio serve esterno in ogni occasione sulle palle break, più spesso di qualsiasi altro giocatore del campione. Eppure sugli altri punti sempre sul lato dei vantaggi, la sua selezione è quasi al 50%. È una differenza significativa in termini di tendenze tra palle break e altri punti. Non è l’unico. Borna Coric si comporta in modo simile (anche se meno estremo) nella direzione opposta, scegliendo quasi equamente nei servizi sul lato dei vantaggi in circostanze d’importanza relativa, per poi servire continuamente al centro di fronte alle palle break.

Cambio tattica

La tabella che segue mostra i giocatori che cambiano tattica in modo più deciso sulle palle break. Le prime due colonne identificano il rapporto tra servizi esterni (E) e centrali (C) sulle palle break e su altri punti sul lato dei vantaggi. La colonna più a destra mostra l’indice tra quei due valori. In cima all’elenco troviamo giocatori come Kohlschreiber, che, sotto pressione, serve esterno. In fondo all’elenco troviamo invece giocatori come Coric. Ho inserito i primi dieci per ogni direzione, oltre a tre dei Fantastici Quattro che non rientrano in nessuna delle due categorie. Djokovic ad esempio non lascia che la circostanza modifichi le sue scelte, almeno a questo proposito.

Giocatore       PB E/C     Altri E/C    PB E/Altri   
Kohlschreiber 2.58 1.04 2.49
Kyrgios 1.69 0.74 2.28
Del Potro 1.52 0.81 1.87
Sock 1.84 1.05 1.75
Cuevas 2.46 1.50 1.64
Anderson 1.18 0.74 1.59
Goffin 1.78 1.13 1.58
Isner 1.43 0.91 1.58
Dimitrov 1.41 0.94 1.49
Thiem 1.64 1.11 1.48

Murray 1.19 0.86 1.39
Nadal 1.87 1.51 1.24
Djokovic 1.20 1.16 1.03

Wawrinka 0.99 1.15 0.87
Bautista Agut 1.38 1.60 0.86
Fognini 0.77 0.91 0.85
Federer 1.08 1.35 0.80
Paire 1.36 1.73 0.78
Mannarino 1.45 1.86 0.78
Schwartzman 0.69 0.89 0.78
F. Lopez 0.83 1.09 0.76
Coric 0.67 0.97 0.69
Khachanov 0.82 1.25 0.66

Sempre nella zona alta dell’elenco troviamo alcuni dei giocatori che meglio servono nel circuito maggiore. In generale, molti preferiscono servire esterno sul lato di vantaggi per poi scegliere quella direzione con frequenza ancora superiore in situazioni di pressione. Con questa tattica si spiega perché alcuni ottengano (non sempre) rendimenti migliori sulle palle break e nei tiebreak. Nick Kyrgios ad esempio ha un servizio letale in tutte le direzioni, ma all’esterno sul lato dei vantaggi è ancora più forte. Complessivamente, vince il 78.8% delle prime di servizio esterne sul lato dei vantaggi, contro il 75.8% con le prime al centro. “Conservando” il servizio esterno per i momenti più critici, Kyrgios riesce a difendere più palle break di quanto la sua efficacia al servizio sul lato dei vantaggi suggerirebbe. La stessa teoria è valida per i tiebreak, nei quali i giocatori potrebbero usare il servizio preferito più spesso.

Terza domanda: queste tattiche potrebbero essere migliorate?

Parto sempre dall’assunto che i giocatori sanno quello che fanno. Se Kyrgios serve al centro la maggior parte delle volte e va esterno più spesso sulle palle break, probabilmente non è frutto del caso. C’è una regola del pollice immediata per verificare se chi serve ha scelto in modo ottimale, descritta qualche anno fa dal mio compagno di podcast Carl Bialik:

Se il tuo servizio al centro è meglio di quello esterno, servi più spesso al centro. Ma non servire al centro il 100% delle volte perché se lo fai, l’avversario ne è consapevole e si mette a metà del campo in attesa del servizio al centro invece di preoccuparsi anche della traiettoria esterna. Quanto spesso dovresti servire al centro? Esattamente quanto è necessario a renderlo efficace allo stesso modo del servizio esterno, ma non più di così. Se il tasso di rendimento su scelte diverse è a sua volta diverso, non stai servendo in modo ottimale.

Ad esempio, di fronte a una palla break sul lato dei vantaggi, Kyrgios vince il 79.7% delle prime di servizio esterne e il 76.1% delle prime al centro. Secondo la logica di Bialik derivata dalla teoria dei giochi, Kyrgios dovrebbe andare esterno ancora più spesso. La percentuale di punti vinti scenderà leggermente per la maggiore prevedibilità, ma il risultato medio di tutti i servizi sulle palle break aumenterà, perché alcuni servizi al centro saranno sostituiti da servizi esterni più redditizi.

Divario tra percentuali di punti vinti

In media, per i 43 giocatori del campione c’è un divario del 4% sulle palle break tra la percentuale di punti vinti con il servizio esterno e con quello al centro. In parte è probabilmente dovuta a rumore statistico. Sono solo 94 i servizi di Alexandr Dolgopolov sulle palle break, quindi il suo divario del 15% non è così affidabile. Però divari di quel tipo compaiono anche per quei giocatori con molti più dati a disposizione.

La tabella che segue riepiloga i dieci giocatori del campione con più palle break fronteggiate. La terza colonna “PB E/C” mostra quanto abbiano preferito il servizio esterno sulle palle break. Le due colonne successive mostrano la percentuale di punti vinti con la prima sulle palle break nelle due direzioni principali. L’ultima colonna mostra, sempre in termini percentuali, la differenza tra le percentuali vincenti. Più il divario si riduce verso lo 0%, più si è trovata la strategia ottimale.

Giocatore    PB    PB E/C  % PT E  % PT C   Divario   
Djokovic 973 1.20 73.1% 72.9% 0.3%
Nadal 971 1.87 67.3% 76.7% 12.2%
Federer 865 1.08 77.1% 77.1% 0.0%
Murray 730 1.19 71.1% 72.2% 1.6%
A. Zverev 493 1.04 72.4% 76.6% 5.5%
Wawrinka 379 0.99 72.7% 71.9% 1.2%
Nishikori 366 1.18 59.5% 69.6% 14.5%
Ferrer 347 0.81 59.7% 63.7% 6.2%
Schwartzman 338 0.69 72.2% 67.8% 6.5%
Thiem 294 1.64 71.8% 73.9% 2.8%

Djokovic, Roger FedererAndy MurrayStanislas Wawrinka si avvicinano alla tattica più efficace, non è così per Nadal, il quale adora il servizio esterno sulle palle break pur ottenendo molta più fortuna con la prima al centro. Richiamo però sempre la premessa per cui i giocatori conoscono il loro mestiere, soprattuto se si parla di Nadal, le cui strategie di gioco hanno condotto a risultati di massimo rilievo.

Nadal fa storia a sé

L’oggetto di quest’analisi sono le prime di servizio. In generale, la frequenza con cui i giocatori mettono in campo la prima è circa la stessa a prescindere dalla direzione. Sul lato dei vantaggi, è più probabile che entri una prima al centro che una esterna. Nadal però fa storia a sé. Il suo servizio esterno non è particolarmente letale, ma è la fotografia dell’affidabilità. La prima esterna sul lato dei vantaggi è in campo il 77.8% delle volte, rispetto a un semplice 59.5% al centro. Il servizio al centro è efficace quando entra, ma non è ragione sufficiente per provarlo più spesso.

Nishikori e la teoria dei giochi

La stessa logica non può venire in soccorso di Kei Nishikori, che ha un divario ancora più marcato di quello di Nadal, salvando circa il 70% delle palle break con un servizio centrale ma solo il 60% con uno esterno. Quasi sicuramente non è dovuto alla fortuna: ipotizzando 180 servizi in ciascuna direzione e una media di punti vinti di circa il 65%, le possibilità che entrambi i numeri siano almeno di cinque punti percentuali sopra o sotto la media è di circa il 18%. La probabilità che siano entrambi così estremi è di circa il 3.5%, da cui una probabilità che siano estremi in direzioni opposte inferiore al 2%, cioè 1 su 50.

Come Nadal, Nishikori è uno dei pochi giocatori che serve molto più spesso in una direzione che nell’altra. Rispetto a Nadal però, la discrepanza tra le prime in campo è molto più pronunciata! Nelle 366 palle break delle partite a disposizione, Nishikori ha servito in campo una prima esterna per il 48.8% delle volte e una prima al centro per il 62.8% delle volte. Più prime in campo al centro quindi per lui e una maggiore probabilità di vincere il punto che ne consegue. Nishikori deve servire molte più prime al centro di fronte alle palle break. Così facendo infatti, la percentuale di punti vinti specifica per quella direzione diminuirà visto che gli avversari scopriranno quella tendenza più accentuata, ma è probabile che l’esito complessivo migliori.

Conclusioni

Anche al livello più semplice, i giocatori dovrebbero avere consapevolezza delle tendenze al servizio degli avversari, che sia tramite voci di corridoio, osservazione avanzata o dati come quelli del Match Charting Project.

All’aumentare della complessità di analisi, abbiamo visto il potenziale espressivo dei dati, capaci di evidenziare come alcuni giocatori stiano rinunciando a convertire palle break. La maggior parte dei giocatori di élite ha sviluppato una padronanza intuitiva della teoria degli giochi. A volte però, anche l’intuizione dei più forti può sbagliare.

Break Point Serve Tendencies on the ATP Tour

I match point di Simona Halep

di Jeff Sackmann // TennisAbstract

Pubblicato il 21 agosto 2018 – Traduzione di Edoardo Salvati

Nel tiebreak del secondo set della finale del torneo di Cincinnati 2018, Simona Halep ha avuto un match point contro Kiki Bertens. Non è riuscita a vincere il punto, poi Bertens ha fatto suo il tiebreak, aggiudicandosi anche il terzo set e il titolo.

Si è trattato di un déjà vu un po’ doloroso per i tifosi di Halep, memori della sconfitta al terzo turno di Wimbledon contro Su Wei Hsieh, a seguito di un match point sprecato.

Halep non gode di una reputazione favorevole nel chiudere le partite, non solo nei match point ma anche nei set point e, più in generale, nei game al servizio quando si decide il set o la partita. Valutare complessivamente la sua abilità nel vincere le partite va oltre le ambizioni di un solo articolo, ma possiamo iniziare ad analizzare il rendimento in un contesto più ridotto – nello specifico i match point – e confrontarlo con quello del resto del circuito maggiore.

Match point e nuove occasioni di chiusura

Partiamo dalle basi. Per qualsiasi giocatrice, raggiungere il match point è (ovviamente!) un ottimo segno del fatto che vincerà la partita. Su circa 16.000 partite femminili dal 2011 per le quali possiedo dati in sequenza punto per punto, le giocatrici che hanno avuto un match point hanno poi vinto la partita in poco più del 97% dei casi.

Non significa necessariamente che hanno chiuso al primo tentativo, o anche nel game o set della prima opportunità, ma pure in presenza di difficoltà di trasformazione del match point sono riuscite a generare nuove occasioni per terminare la partita.

Se vogliamo trovare le prove della debolezza di Halep in questo ambito di gioco, dobbiamo guardare altrove. Tra la fine del 2011 e la Rogers Cup a Montreal in agosto, Halep ha vinto 250 delle 251 partite in cui ha avuto un match point tra quelle di cui possiedo dati in sequenza punto per punto (ne ho per la maggior parte delle partite di Halep, e me ne mancano in modo casuale. Lo stesso vale praticamente per tutte le altre giocatrici. Alcuni dati sono disponibili qui, spero di aggiornali presto con il 2017 e 2018). Vale ha dire che, con l’eccezione di Wimbledon contro Hsieh, non ha mai perso una partita in cui ha avuto almeno un match point.

Non è un risultato che si distingue se lo si confronta con quello delle giocatrici più forti. Tra le cinquanta donne con almeno cento partite con un match point a favore, cinque – Serena WilliamsVictoria AzarenkaAndrea PetkovicEkaterina Makarova e  Elena Vesnina – hanno sempre trasformato un match point, se non proprio al primo tentativo (anche qui mancano alcune partite, ciò non toglie che in un campione casuale di 259 partite, Williams non ha mai perso).

Prima della finale di Cincinnati, Halep era in compagnia di otto giocatrici – tra le altre Petra KvitovaMaria SharapovaAna Ivanovic – ad aver perso una sola partita dopo un match point a favore.

Rendimenti in situazioni di gioco

Non è un caso vedere i nomi più dominanti del tennis femminile nelle zone alte della lista. È vero, le migliori sono quelle che più probabilmente convertiranno il match point ma, altrettanto importante, sono anche quelle con più probabilità di ottenere diverse occasioni per chiudere la partita.

A tiebreak avanzato un errore può rappresentare la sentenza definitiva, ma la maggior parte delle volte in cui Halep, Williams o giocatrici di quel livello mancano di cogliere un’opportunità, sono avanti nel punteggio magari di un set e un break, e quindi in posizione ideale per generarne di successive.

Questo porta a un’altra domanda: che rendimento hanno sul match point le giocatrici? La pressione del momento determina meno punti vinti rispetto a quelli al servizio o alla risposta in cui non si è sul match point? O fattori di natura diversa, come il vantaggio psicologico o il tifo del pubblico, spingono le giocatrici a fare ancora meglio?

A quanto pare non esiste una sola spiegazione; i risultati divergono, seppur di poco, a seconda che il match point a favore sia al servizio o alla risposta. È leggermente meno probabile per una giocatrice vincere il punto quando è al servizio per chiudere la partita, rispetto al suo rendimento al servizio fino a quel punto.

Non è una differenza sostanziale – quasi un 3% in meno nella frequenza di punti vinti al servizio – ma si mantiene costante in molti anni di risultati del circuito femminile. A un punto dalla partita ma sul game alla risposta, l’effetto match point non si verifica. La frequenza dei punti vinti alla risposta rimane invariata a prescindere da una possibile imminente stretta di mano.

Quasi tutte le giocatrici sono vicine alla neutralità

I match point sono quasi parimenti distribuiti tra servizio e risposta: sul circuito femminile circa il 55% arrivano al servizio, con il rimanente 45% alla risposta. Considerando quindi una diminuzione del 3% nel rendimento al servizio ma una situazione immutata alla risposta, le giocatrici vincono all’incirca l’1.5% di punti in meno sul match point che in altri momenti della partita.

Una giocatrice che replica quasi alla perfezione questa tendenza è Caroline Wozniacki, che in 271 partite con almeno un match point e 474 match point effettivi, ha vinto quei match point con una frequenza inferiore dell’1.7% rispetto agli altri punti.

Se analizziamo punti singoli, alcune delle giocatrici che quasi sempre vincono partite con match point a favore non fanno molto meglio della media. Ad esempio, Sharapova vince match point con una frequenza inferiore dell’1.2% rispetto agli altri punti, mentre per Azarenka scende all’1.4%. Dominika Cibulkova ha vinto 198 delle 201 partite con match point nel mio campione di dati, nonostante la frequenza di conversione sia scesa di un incredibile 7%.

Halep però non rientra nella categoria. Nelle 251 partite con match point a favore ha avuto 420 match point singoli, che ha vinto con una frequenza del 4.4% più alta degli altri punti nello stesso insieme di partite.

In poche riescono meglio, anche se alcune con ampio margine, come Kvitova con il +9.0% e Vesnina con il +13.9%. La grande maggioranza delle giocatrici è a qualche punto percentuale dalla neutralità, vincendo cioè match point – al servizio o alla risposta – circa nella stessa misura degli altri punti.

Risultati casuali

Questi numeri comunicano solo una cosa, e cioè quello che è successo in passato. Si è tentati di usarli per fare previsioni, o magari scommettere cifre importanti la prossima volta che a Vesnina manca un punto per la vittoria. Ma quando la maggior parte delle giocatrici è così vicina alla neutralità, serve tenere in mente che molte delle risultanze potrebbero essere del tutto casuali.

Se esistono dinamiche ricorrenti in situazioni di match point, dovremmo essere in grado di identificarle dai dati a disposizione. Ad esempio, potremmo accorgerci che Kvitova trasforma match point con una frequenza alta in ogni singola stagione.

Per ovviare al problema generato dai totali della singola stagione che a volte costituiscono un campione eccessivamente ridotto, ho adottato un metodo differente.

Ho suddiviso in modo casuale in due gruppi distinti le partite di quelle giocatrici che hanno avuto almeno 60 partite con match point, e confrontato il rendimento sui match point con la frequenza di successo negli altri punti.

Se si trattasse di un effettivo talento, ci dovremmo attendere una distribuzione quasi identica in ciascuno dei due gruppi casuali, vale dire meglio o peggio della media nei match point in entrambi i gruppi.

Purtroppo, per questa popolazione di 80 giocatrici con abbastanza match point, non c’è alcun tipo di correlazione. Se le giocatrici manifestano tendenze durevoli e prevedibili di prestazioni superiori o inferiori nelle opportunità di chiusura della partita, o si tratta di variazioni impercettibili o non reggono il passare del tempo.

Previsioni intelligenti

È il classico riscontro associato a specifiche situazioni nel tennis. Il nostro iperattivo cervello in cerca di modelli interpretativi trova più semplice identificare percorsi validi solo all’apparenza. In generale però, le giocatrici vincono punti con la stessa frequenza a prescindere dal contesto.

Nel medio periodo, come i cinque anni rappresentati dai dati punto per punto del mio campione, emergono alcune giocatrici, come Kvitova, Vesnina e, in misura minore, Halep. Ma i risultati passati difficilmente sono garanzia di un determinato comportamento di fronte a match point di partite future.

La previsione più intelligente dell’esito di futuri match point per qualsiasi giocatrice è che si comporterà esattamente allo stesso modo che sugli altri punti. È una conclusione decisamente noiosa. Per fortuna, le circostanze in cui viene giocato un match point sono di solito già per loro natura sufficientemente eccitanti.

Simona Halep’s Match Points

Due macchine da servizi, zero tiebreak

di Jeff Sackmann // TennisAbstract

Pubblicato il 3 settembre 2018 – Traduzione di Edoardo Salvati

I molti risultati contro pronostico agli US Open 2018 (non da ultima la sconfitta di Roger Federer al quarto turno per mano di John Millman, n.d.t.) non reggono il confronto con il sorprendente andamento della partita tra John Isner e Milos Raonic, valida per un posto nei quarti di finale. Inser ha vinto con il punteggio di 3-6 6-3 6-4 3-6 6-2, perdendo il servizio due volte e conquistando quello di Raonic quattro volte. In poche altre occasioni il tiebreak era cosa certa, eppure i due giocatori dalla statura fuori scala non lo hanno nemmeno sfiorato.

Nei cinque precedenti incontri, è stato più probabile per Isner e Ranoic arrivare a due tiebreak che a uno solo, e si è trattato per la maggior parte di partite al meglio dei tre set, non il format al meglio dei cinque set degli Slam. Nei 13 set giocati, 9 sono andati al tiebreak.

Nel 2017, il 45% dei set giocati da Isner sono stati dei tiebreak, mentre per Raonic quasi il 25%. Tra tutti e due, hanno giocato la partita più lunga della storia del tennis, la semifinale più lunga di uno Slam e la partita più lunga alle Olimpiadi. Sono davvero insuperabili nel tenere il servizio e davvero deboli a fare il break.

Grandi speranze

La probabilità che Isner e Raonic giochino un tiebreak dipende da alcune ipotesi di base. Se Raonic servisse come ha fatto nelle 52 settimane precedenti, la sua percentuale di punti vinti al servizio (PVS) sarebbe del 72.8%, che equivale a tenere il servizio il 93% delle volte. Se usiamo la PVS di Isner effettiva della partita di 74.3%, siamo di fronte al servizio tenuto il 94.4% delle volte. Se usiamo invece l’incredibile PVS di Isner di 76.5% derivante dalle altre partite contro Raonic, abbiamo un corrispondente servizio tenuto del 96%. Sembrano tutti valori molto alti ma, come vedremo, le differenze esistenti finiscono per incidere non poco sulla probabilità.

Ipotesi

Farò i calcoli in funzione di tre categorie di ipotesi:

  1. gli scontri diretti. In cinque partite (quattro su cemento e la quinta a Wimbledon 2018), Isner ha vinto il 76.5% dei punti al servizio, contro il 71.4% di Raonic. Significa tenere il servizio rispettivamente il 96.0% e il 91.7% delle volte.
  2. le ultime 52 settimane (corrette). Su tutte le superfici e dagli US Open 2017, Isner ha vinto il 73.6% dei punti al servizio, contro il 72.8% di Raonic. Sono numeri però ottenuti in presenza di un avversario medio. Entrambi, e specialmente Isner, hanno un gioco alla risposta inferiore alla media. Se correggiamo la PVS di ciascuno per la frequenza di punti vinti alla risposta (PVR) si ottiene il 75.5% per Isner e il 78.5% per Raonic. In termini di partita giocata, corrispondono a servizi tenuti rispettivamente per il 95.3% e il 97.1%.
  3. il quarto turno a Flushing Meadow. Isner ha vinto il 74.3% dei punti al servizio e Raonic il 68.8%. Con questi numeri non arriviamo a un pronostico reale, visto che naturalmente non avremmo potuto conoscerli prima del loro accadimento. Ma forse, componendo ogni singolo granello di informazione a disposizione in modo molto arguto, ci saremmo potuti avvicinare a un numero realistico. Sono percentuali che si traducono nel 94.4% di servizi tenuti per Isner e nell’88.5% per Raonic.

Non abbastanza tiebreak

A quanto pare, le agenzie di scommessa davano la probabilità di almeno un tiebreak al 95%. Questo è in linea con le mie previsioni, anche se le specifiche ipotesi influenzano il risultato in modo rilevante.

Ho calcolato qualche probabilità per ogni categoria di ipotesi. La prima, “p(No brk),” è la probabilità che i due giocatori tengano il servizio per 12 game. Non è l’unico modo per arrivare al tiebreak, ma ricomprende la maggior parte delle possibilità. La seconda, “p(TB)” è il risultato di una simulazione Monte Carlo per far vedere la probabilità che un set qualsiasi finisca al tiebreak. La terza, “eTB”, rappresenta il numero atteso di tiebreak sapendo che Isner e Raonic giocheranno cinque set. L’ultima, “p(1+ TB)” è la probabilità che la partita abbia almeno un tiebreak in cinque set.

Visto il tennis espresso dai due giganti durante la partita, non è impensabile che non siano mai andati sul 6-6. Considerato che il gioco alla risposta di Isner ha in larga parte determinato un calo della PVS di Raonic al di sotto del 70%, ogni set aveva “solo” una probabilità del 41.2% di un tiebreak, e c’era un 7% di probabilità che un punteggio al quinto set non ne contenesse neanche uno. Le altre due categorie di ipotesi, però, indicano quel tipo di certezza nel tiebreak che si riscontra anche nelle quote degli allibratori…e di chiunque altro abbia mai visto giocare Isner e Raonic.

Conclusioni

Forse l’aspetto più strano della vicenda è che, in sei precedenti partite agli US Open 2018, Isner e Raonic hanno giocato complessivamente sette tiebreak, almeno uno in cinque delle sei partite, prima di spegnere gli entusiasmi nello scontro diretto. Conoscendo Isner, si tratta di una distrazione, e sicuramente ci regalerà uno o due tiebreak nel quarto di finale contro Juan Martin Del Potro (Isner ha poi perso 7-6 (5) 3-6 6-7 (4) 2-6, con un tiebreak vinto e uno perso, n.d.t.).

Al termine del torneo, le sue partite molto probabilmente avranno almeno uno o due tiebreak nel punteggio…tranne che contro l’altra macchina da servizi a nome Raonic. Deve essere questo il motivo per cui continuiamo a seguire il tennis: ogni partita ha il potenziale per sorprenderci, anche se in fondo è una che non ci interessava guardare.

Two Servebots and Zero Tiebreaks

Nadal ha quasi perso un set contro Ferrer?

di Jeff Sackmann // TennisAbstract

Pubblicato il 31 agosto 2018 – Traduzione di Edoardo Salvati

Gli dei del sorteggio non sono stati molto accondiscendenti con David Ferrer, facendogli trovare Rafael Nadal come avversario di primo turno della sua ultima apparizione in un torneo Slam. Ferrer ha faticato tutto l’anno e nessuno si aspettava che potesse davvero migliorare il bilancio di 6 vittorie e 24 sconfitte degli scontri diretti con Nadal.

E, infatti, non ci è riuscito, essendo stato costretto a ritirarsi a metà del secondo set per un infortunio al polpaccio. Prima di abbandonare gli US Open 2018 ha però fatto tremare Nadal, almeno un po’.

Nadal ha vinto il primo set 6-3, ma l’andamento del secondo è stato più altalenante. Nel game iniziale Ferrer ha strappato il servizio di Nadal a zero, Nadal ha immediatamente fatto il contro break e, qualche minuto dopo, Ferrer ha di nuovo fatto il break per andare avanti 3-2 e servizio.

Ha poi mantenuto il break di vantaggio fino a che la condizione fisica glielo ha consentito. Avanti 4-3 e con il servizio a disposizione dopo il cambio di campo, era a soli due game di servizio dal pareggiare la partita.

Semantica e probabilità

Questo significa che Nadal ha “quasi” perso il set? Pur non capendo i motivi che spingono le persone su internet a discutere di un tema come questo, adoro le domande probabilistiche. Se poi ci si sovrappone la semantica (la semantica!), allora diventa ancora più interessante.

Abbandoniamo per il momento la scelta delle parole e riformuliamo la domanda: tralasciando l’infortunio, qual era la probabilità di Ferrer di vincere il set? In ipotesi di parità di condizioni tra i due giocatori, è un semplice assunto da mettere alla prova del mio modello di probabilità: in un baleno si trova che dal 4*-3 Ferrer aveva circa l’85% di probabilità di vincere il set.

Forse sto andando troppo veloce, perché mi giunge già la sonora lamentela dei tifosi di Nadal sul fatto che i due giocatori non sono esattamente uguali tra loro. Nei 102 punti che i due spagnoli hanno giocato fino al ritiro, Ferrer ne ha vinti il 38% alla risposta e Nadal il 47%. In una partita al meglio dei cinque set, sono frequenze che portano Nadal ad avere il 93% di probabilità di vincere la partita.

Forse non è ancora una percentuale sufficientemente alta, ma siamo nell’intervallo giusto. Utilizzando quei dati, la probabilità di Ferrer di mantenere il vantaggio e vincere il secondo set si riduce drasticamente al 57.5%. Se vinci a malapena la metà dei punti al servizio, la probabilità di tenere due turni di servizio è inferiore al lancio della moneta. Per vincere il set è più probabile che Ferrer avrebbe dovuto fare un altro break o aggiudicarsi il tiebreak.

È una differenza decisamente rilevante rispetto alle due ipotesi iniziali: l’85% sembra abbastanza valido da rientrare nel “quasi” (anche se secondo uno studio il “quasi” ha un significato definibile da almeno il 90% di probabilità), per il 57.5% non è così.

Non siamo ancora a una conclusione definitiva. Il modello di probabilità di vittoria ignora totalmente il concetto di striscia. La formula non prevede infatti eventuali passaggi di buon o cattivo gioco, nessun calo di motivazione o di raccolta di energia addizionale per concludere un set.

Dati da partite reali

Non penso che nulla di tutto ciò si verifichi in modo sistematico, ma è comunque difficile dirimere la controversia in un senso o nell’altro. Se è possibile quindi beneficiare di dati da partite reali, bisogna farne tesoro.

E questo è proprio il caso. Iniziamo da Nadal. Dal 2011, ho trovato 69 set in cui Nadal era alla risposta sotto di un break sul 4-3 (è probabile che ce ne siano di più, perché il campione di dati a disposizione non è completo, ma le partite mancanti sono per la maggior parte casuali, quindi 69 dovrebbe essere un numero rappresentativo degli ultimi anni). Di quei 69, Nadal ha rimontato per poi vincere in 21 set, quasi esattamente il 30%.

Il gioco di Ferrer è stato più solido di quello degli avversari di Nadal (aiuta il fatto che Ferrer si è trovato contro Nadal solo una volta, mentre gli avversari di Nadal hanno dovuto giocarci tutte le volte considerate). Ho trovato 122 set in cui Ferrer serviva in vantaggio 4-3 e avanti di un break. Ha finito per vincere il set 109 volte, circa l’89%.

L’89% è certamente un numero troppo alto per lo scopo di quest’analisi: non solo Ferrer era, in media, un giocatore migliore dal 2012 a oggi rispetto a quanto non lo sia ora, ma ha anche sfruttato l’aver affrontato avversari più deboli di quelli di Nadal in quasi tutti i 122 set. L’89% è un limite superiore abbondantemente ottimistico, non lontano dal teorico 85% da cui siamo partiti.

Pur prendendo la media dei risultati effettivi di Nadal e Ferrer – circa il 90% di chiusura del set per Ferrer e il 70% per gli avversari di Nadal – parlare di 80% è ancora troppo fuori bersaglio. Come abbiamo visto, i numeri di Ferrer si riferiscono a una sua versione più forte, mentre Nadal è ancora vicino ai livelli mostrati negli ultimi cinque anni. Anche l’80% quindi significa una sovrastima della probabilità di Nadal di perdere il set.

Si rimane con un intervallo compreso tra il 57%, valore che ipotizza che Nadal avrebbe continuato a vincere circa la metà dei punti alla risposta, e l’80%, basato sull’esperienza derivante dal campo per entrambi i giocatori negli ultimi anni.

Conclusioni

Qualsiasi dato a cui si può giungere è, in definitiva, influenzato dall’opinione che abbiamo sul livello di gioco di Ferrer al momento, che non è in forma come poteva esserlo anche due anni fa ma, al tempo stesso, è abbastanza efficace da portarsi a soli due game dal vincere il set contro il numero 1 del mondo.

Serve un lavoro più dettagliato per arrivare a una stima più precisa e, anche in quel caso, comunque saremmo vincolati dallo stabilire la bravura attuale di Ferrer e il suo livello nello specifico set. Così come con la parola “quasi” ci si può riferire a un insieme di probabilità, allo stesso modo mi accontento di concludere utilizzando il mio di insieme.

Tutto considerato, si può pensare di restringere la probabilità al 65-70%, o a due su tre. È abbastanza probabile che Ferrer avrebbe vinto il secondo set contro la sua nemesi, ma non era per nulla scontato…o meglio, secondo la comune accezione della parola, non era “quasi” scontato.

Did Rafael Nadal Almost Lose a Set to David Ferrer?

Sull’uso delle statistiche del Match Charting Project: Pouille vs Khachanov (parte 2)

di Chapel Heel // FirstBallIn

Pubblicato il 10 aprile 2018 – Traduzione di Edoardo Salvati

Nella prima di quest’analisi in due parti, ho identificato alcune statistiche chiave dalla finale di Marsiglia 2018 tra Lucas Pouille e Karen Khachanov, persa da Pouille in tre set.

Ho poi proposto un piano d’azione in sei punti che Pouille avrebbe potuto attuare nella rivincita al secondo turno di Dubai di qualche giorno dopo. Pouille ha vinto quella seconda partita in tre set (sempre sul cemento).

Vediamo se qualcuno di quei punti si è rivelato un fattore nella seconda partita. Premetto di dover confessare una probabile inconscia tendenza a collegare i dati dalla seconda partita a quelli generati dalla prima partita. Per questa ragione ho scritto l’articolo sulla prima partita senza aver tenuto in conto i dati della seconda.

Mi sono anche ripromesso, da un lato, di non modificare nessuna considerazione espressa in precedenza (a meno di errori obiettivamente macroscopici) dopo aver esaminato i dati della seconda partita e, dall’altro, di scrivere della seconda partita anche se nessuna conclusione può essere ricondotta a quanto emerso dalla prima partita.

Cosa mostrano le statistiche del secondo turno di Dubai (seconda partita)?

Iniziamo guardando gli stessi valori selezionati nella prima parte

Sul servizio, Khachanov ha avuto il 31% tra ace, servizi con risposte che non sono finite in campo ed errori forzati alla risposta (sempre un buon rendimento ma non così alto come nella prima partita). Ha servito solo il 59% di prime però, ben inferiore alla prima partita, che rappresenta un deciso cambiamento in favore di Pouille.

Ci saremmo aspettati un qualche tipo di regressione da parte di Khachanov, magari anche attribuibile alla posizione di Pouille alla risposta nella seconda partita, o semplicemente un’idea più chiara di quest’ultimo sul modo di servire dell’avversario.

Gli errori che Khachanov ha forzato alla risposta sono stati in realtà più numerosi di quelli della prima partita. La differenza maggiore è nella percentuale di ace, rientrata nella norma, a suggerire che la regressione al servizio sembra essere stata il fattore dominante.

Nella seconda partita Pouille ha servito la prima di servizio esterna sul lato delle parità molto più frequentemente, mantenendo all’incirca lo stessa combinazione di servizi al centro e all’esterno sul lato dei vantaggi, nonostante nella prima partita una percentuale del 94% di punti vinti con il servizio esterno sul lato dei vantaggi.

La strategia al servizio non ha funzionato

C’è però una ragione per questo: nella seconda partita, sembra che Pouille abbia smesso di servire esterno sul lato dei vantaggi perché vinceva meno della metà dei punti con quella soluzione, un risultato opposto rispetto alla prima partita.

Forse il ridotto campione di punti della prima partita era ingannevole o forse Pouille non riusciva a servire nella seconda partita con la stessa efficacia sul lato dei vantaggi. O forse Khachanov se n’era accorto. Oppure tutte e tre le spiegazioni.

Nella seconda partita Pouille ha servito la prima con il 65%, decisamente meglio del 59% della prima partita. Ha vinto però il 74% dei punti sulla prima (rispetto al 78% della prima partita) e il 55% dei punti sulla seconda (rispetto al 51% della prima partita). È quindi un esito neutro. L’aumento nella percentuale di prime, molto più alta della media di Pouille, è stata bilanciata dalla vittoria di meno punti sulla prima.

Può trattarsi di una specifica scelta strategica di Pouille, ma non ha funzionato per il meglio. Nella seconda partita, Pouille ha vinto il 29% dei punti sul servizio di Khachanov in situazione di parità (compreso il 30-30), percentuale identica rispetto alla prima partita.

La concentrazione

Ha anche vinto 7 punti su 8 sulle parità (compreso il 30-30) sul suo servizio, rispetto al 58% della prima partita. La maggioranza dei punti vinti arriva sul 40-40, invece che sul 30-30, quindi non è chiaro se sia dovuto a un aumento della concentrazione sui punti importanti.

Nel primo articolo, ho ipotizzato che la concentrazione sia automaticamente alta sul 40-40, come dovrebbe esserlo sui punti di chiusura del game. Ma forse non lo è, forse è riposta così tanta attenzione sul 40-40 da non averla allo stesso modo sul punto precedente.

Questo spiegherebbe anche l’idea di Brad Gilbert di un vantaggio nell’avere massima concentrazione ogni qualvolta un giocatore è a due punti dalla conquista del game. Ad ogni modo, nella seconda partita Pouille ha vinto più punti sul 40-40 che sul 30-30.

Nella seconda partita, Khachanov ha servito molto di più esterno sul lato delle parità e molto di più al corpo sul lato dei vantaggi. Nella prima partita la combinazione di servizi era più equilibrata sul lato delle parità e con più servizi al centro sul lato dei vantaggi. Nella seconda partita è in sostanza passato da al corpo-parità a esterno-parità e da centrale-vantaggi a al corpo-vantaggi.

Questo elemento non rientrava per Pouille nel piano d’azione dalla prima partita, perché si trattava di differenze non così evidenti, ma avevo suggerito che il successo di Khachanov con la combinazione centrale-vantaggi poteva essere un aspetto da sfruttare.

Invece, sembra che Khachanov abbia deliberatamente mischiato le carte cercando di togliere spazio a Pouille con il servizio al corpo, anziché continuare a enfatizzare il servizio centrale-vantaggi. È più importante cambiare strategia o fare affidamento sulle posizioni di forza ottenute in una recente partita?

La risposta di Pouille come fattore chiave

Nella seconda partita, Pouille ha vinto il 48% dei punti sulla seconda di servizio di Khachanov, rimettendo la palla in gioco nel 96% dei casi, un aumento consistente, rispettivamente, dal 25% e 82% della prima partita.

Potrebbe essere stato il fattore determinante della vittoria di Pouille, perché si è tradotto in 8 risposte in campo in più sulla seconda e 9 punti in più vinti sulla seconda di servizio, in una partita sostanzialmente equilibrata punto per punto.

Pouille ha vinto il 70% dei punti a rete su 10 discese. Non ha mai per fatto servizio e volée nella seconda partita e ha giocato 4 colpi d’approccio. Pur sempre un valido rendimento, ma non paragonabile agli 11 punti vinti su 12 della prima partita.

In effetti, con meno servizi e volée nella seconda partita si è trovato a rete meno spesso: o non prestava altrettanta attenzione (come suggerito nel mio piano d’azione) o Khachanov non gli permetteva di farlo così facilmente.

Nella seconda partita, negli scambi di almeno quattro colpi la percentuale di vittoria di Khachanov sul servizio è stata del 43%, in aumento dal 32% della prima partita, con gli scambi che sono andati oltre il quarto colpo il 20% in più rispetto alla prima partita. La mia strategia per Pouille quindi di allungare lo scambio sul servizio dell’avversario ha comportato un esito peggiore.

Proseguiamo con il chiederci se ci sono stati altri evidenti chiavi di successo che hanno inciso significativamente sulla seconda partita ma che non erano un fattore nella prima partita

Quasi facendo il contrario del consiglio di “servire più spesso esterno sul lato dei vantaggi” Pouille ha aumentato notevolmente la sua percentuale di punti vinti servendo al centro sul lato delle parità.

In generale, il risultato finale è stato deciso dagli scambi più lunghi e meno dai punti vinti con ace o servizi con risposte che non sono finite in campo o errori forzati alla risposta. I dati raccolti dalle partite non mostrano un vantaggio evidente negli scambi lunghi per uno dei due giocatori.

Selezione dei colpi

Nella seconda partita, Pouille ha indirizzato al centro molti più colpi a rimbalzo, specialmente con il dritto, e anche più colpi a uscire. Complessivamente, nella prima partita ha giocato incrociato il 46% delle volte contro il 36% della seconda partita.

Sono andato a rivedere i dati della prima partita per calcolare la percentuale di dritti colpiti da Khachanov come vincenti o come errori forzati indotti per vedere se Pouille stesse subendo malamente da quel lato. Chiamiamoli “vincenti di dritto”: il 22% dei dritti di Khachanov sono stati vincenti nella prima partita contro il 13% nella seconda partita.

Pouille o l’allenatore hanno visto che Khachanov era più efficace con il dritto e quindi hanno deciso di dargli meno angolo con cui lavorare nella seconda partita. I rovesci di Khachanov sono stati vincenti con percentuale del 12% nella prima partita rispetto all’8% nella seconda partita, ma il campione è più limitato rispetto ai dritti, quindi esito a trarre delle conclusioni definitive.

È interessante notare come Khachanov, in entrambe le partite, abbia optato per la stessa identica selezione di colpi incrociati, al centro, lungolinea e a uscire, anche se ha colpito più rovesci lungolinea nella seconda partita.

Ed è ancora più interessante il fatto che Pouille abbia ottenuto il 28% di vincenti di dritto al centro nella prima partita, più alta rispetto a quella di Khachanov. Eppure Khachanov non ha colpito più volte al centro nella seconda partita, mentre Pouille è riuscito a mantenere praticamente la percentuale di vincenti di dritto al centro (26%). In altre parole, Pouille ha modificato il suo gioco, Khachanov non lo ha fatto.

Considerazioni finali

È stata una buona idea quella di ripromettermi di commentare la seconda partita a prescindere dalla possibilità che ci fossero considerazioni non riconducibili a quanto emerso dalla prima partita. Volevo inizialmente chiamare questa sezione “Conclusioni”, prima di realizzare che non sono riuscito a trovarne neanche una, almeno non definitive.

Sembra che nella seconda partita Pouille sia riuscito a risolvere alcuni punti deboli emersi nella prima partita. Ha servito una percentuale di prime più alta, anche se questo poi non si è tramutato in un vantaggio.

Ha giocato meglio sulle parità (compreso il 30-30), ma è difficile capire se sia più per una maggiore concentrazione o per un campione ridotto di analisi. Ha rimesso in gioco molte più risposte sulla seconda di Khachanov, vincendone una proporzione molto più ampia, un fattore chiave per il risultato finale a suo favore.

Per contro, Pouille non ha provato ad andare a rete più spesso e qualsiasi ipotesi di servire più volte esterno sul lato dei vantaggi ha incontrato opposizione inflessibile da parte del suo avversario.

È interessante anche che sia Pouille che l’allenatore abbiano ritenuto che sarebbe stato utile togliere un po’ di angolo a Khachanov colpendo a rimbalzo al centro più frequentemente, un aspetto che non mi è parso ovvio riguardando a freddo i dati della mappatura.

È complicato trarre conclusioni

Forse perché non possiedo ancora un referenza per stabilire quale sia una percentuale alta di colpi vincenti su un lato o sull’altro del campo, impedendomi di procedere automaticamente con questo tipo di analisi.

Ebbene sì, è complicata.

L’unica conclusione davvero definitiva a cui forse si può giungere è che il solo modo a disposizione – mia o di chiunque altro – per migliorare nell’esame di dati granulari è quello di continuare a raccoglierli e studiarli.

Prima o poi arriverà su questa strada una persona più intelligente di me in grado di creare algoritmi per individuare tendenze non evidenti all’occhio umano.

Pouille v. Khachanov: Drilling Down on Match Stats (Part 2)

Sull’uso delle statistiche del Match Charting Project: Pouille vs Khachanov (parte 1)

di Chapel Heel // FirstBallIn

Pubblicato il 12 marzo 2018 – Traduzione di Edoardo Salvati

Lucas Pouille e Karen Khachanov hanno giocato la finale del torneo di Marsiglia 2018 (vinta da Khachanov in tre set) e, un paio di giorni più tardi, si sono trovati contro nel secondo turno di Dubai (vinto questa volta da Pouille, sempre in tre set).

Avendo mappato entrambe le partite per il Match Charting Project, ho pensato che fosse interessante analizzarne le statistiche, vista la prossimità temporale e il fatto che si siano giocate sulla stessa superficie.

È la prima volta che mi cimento in questa pratica e la quantità di informazioni a disposizione è letteralmente travolgente. Penso sia impossibile, almeno per un essere umano, esaminare i dati di ciascun punto.

Nello sforzo quindi di limitare lo scopo dell’analisi – di fatto una soluzione di comodo per capacità di elaborazione limitate come quelle del mio cervello – ho scelto di procedere in modo più diretto.

Il punto di vista di Pouille

Ho iniziato cioè con i dati della prima partita esclusivamente dal punto di vista di Pouille (o del suo allenatore). L’obiettivo era individuare alcuni valori che mi sembra emergessero sugli altri come aspetti più funzionali al gioco di Pouille e, viceversa, trovare quelli che non lo erano.

Nel fare questo volevo capire se Pouille (in campo) e l’allenatore (dagli spalti) se ne accorgessero intuitivamente o se servisse necessariamente un’approfondimento con dati granulari. O se comunque l’analisi della partita potesse beneficiare significativamente di dati punto per punto.

Volevo sapere inoltre se questo tipo di analisi potesse incidere sul modo in cui Pouille avrebbe affrontato la successiva partita contro Khachanov e se, una volta giocato e vinto il secondo turno a Dubai, ha in effetti messo in pratica (a sua insaputa rispetto all’analisi naturalmente) parte delle risultanze.

Anche se si tratta solo dell’idiomatica punta dell’iceberg, è comunque un’analisi lunga. Ho raccolto quindi i dati salienti dalla prima partita e le possibili azioni da intraprendere per la seconda partita in questo articolo. I dati salienti della seconda partita e il raffronto con la prima saranno descritti nel prossimo articolo.

Statistiche dalla finale di Marsiglia (prima partita)

Riflessioni dal punto di vista di Pouille:

*Khachanov ha servito con il 20% di ace e un altro 18% di servizi ha generato risposte che non sono finite in campo o che hanno determinato errori forzati. Ha inoltre servito con il 69% di prime. Sicuramente è un risultato straordinario, non necessariamente in grado di replicare in futuro.

*Invece io sulla prima ho servito con una buona combinazione di servizi esterni e al centro. Khachanov ha vinto il 30% delle risposte sui miei servizi al centro ma solo il 17% di quelli esterni. Con il 94% dei punti vinti, sono stato particolarmente efficace servendo esterno sul lato dei vantaggi.

*Ho vinto il 78% dei punti giocati sulla mia prima ma solo il 51% dei punti sulla seconda. Ho servito la prima con il 59%.

*Khachanov ha dominato su situazioni di punteggio di parità, vincendo tutti i punti sul suo servizio e il 42% sul mio. È da notare a questo proposito che il Match Charting Project considera il 30-30 come una parità, visto che servono solo due punti consecutivi per poi vincere il game.

*Sul lato dei vantaggi, Khachanov ha servito più volte centralmente di quanto abbia fatto verso l’esterno, ma ha vinto una percentuale più alta di punti in questo secondo caso.

*Io ho vinto solo il 26% dei punti sulla seconda di servizio di Khachanov e ho risposto mettendo la pallina in campo per l’82%. Non ha fatto ace sulla seconda di servizio e mi ha costretto solo una volta all’errore forzato, quindi gli altri errori dipendono esclusivamente da me.

*A rete, ho vinto 11 punti su 12.

*Per Khachanov, la percentuale di punti vinti sul servizio è scesa al 32% nei punti che sono andati oltre i quattro colpi, occorrenza che si è verificata solo il 31% delle volte sul suo servizio.

A mio giudizio, questi sono gli aspetti che più risaltano a un’osservazione immediata, ma ci sono decine di altre conclusioni che si potrebbero evincere dai dati a disposizione.

Giocatori e allenatori sono in grado di riconoscere questi dettagli della partita?

Sia Pouille che il suo allenatore hanno quasi certamente intuito che Khachanov stesse servendo con un rendimento così alto da non essere probabilmente replicabile nella seconda partita. Non sono necessari molti numeri per comprenderlo.

Sia Pouille che il suo allenatore hanno quasi certamente intuito l’efficacia del servizio esterno sul lato dei vantaggi, ma senza aver visto i dati è più difficile rendersi conto della portata di questa strategia.

Sia Pouille che il suo allenatore potrebbero non essere eccessivamente preoccupati dalla percentuale di prime di servizio, considerando che dall’inizio del 2017 sul cemento in media Pouille ha servito solo con il 57%.

Come accade per la maggior parte dei tifosi, è probabile che giocatori e allenatori prestino più attenzione a vincere le palle break che i punti sulla parità o sul 30-30.

Nel suo libro Winning Ugly, Brad Gilbert sottolinea come i giocatori debbano alzare il livello di concentrazione ogni volta che il punteggio arriva a due punti dalla chiusura del game. I dati del Match Charting Project possono dare sostegno a questa necessità con maggiore chiarezza.

L’importanza dei dati per fornire risposte

Visto che la preferenza di Khachanov per i servizi al centro non è così marcata, senza dati specifici sulla partita sia Pouille che il suo allenatore potrebbero non rendersene conto. E senza dati è più difficile capire di quanto il livello di Pouille in risposta alla seconda di servizio di Khachanov sia stato scadente, pur avendone sensazione dal campo.

Sia Pouille che il suo allenatore hanno probabilmente visto che scendere a rete è stato molto importante.

Dubito invece che entrambi i giocatori e allenatori abbiano cercato una strategia ottimale di durata dello scambio sul servizio di uno o dell’altro. Sospetto invece che dal lato di Pouille pensino che scambi più lunghi siano per lui un vantaggio.

Però Pouille è un giocatore d’attacco, quindi è probabile che non vogliano che gli scambi si protraggano a lungo (i dati dalla prima partita non mostrano in media uno specifico vantaggio per Pouille sugli scambi lunghi). Quando si dovrebbe quindi avere degli scambi più lunghi? I dati possono fornire in questo senso una risposta.

In uno dei podcast più recenti su TennisAbstract, Jeff Sackmann e Carl Bialik hanno parlato di quali dati possano essere più utili per giocatori e allenatori, senza però raggiungere una conclusione definitiva. Ho suggerito che – per molte delle analisi punto per punto che ho elencato – giocatore e allenatore abbiano già sensazione di quanto stia accadendo.

In ogni caso i dati granulari mantengono la loro rilevanza perché: a) il dato numerico è una verifica empirica della sensazione (ne parlo a breve); b) i numeri possono rappresentare una sorta di elenco specifico degli aspetti su cui allenarsi (chiedetevi se vedete regolarmente allenatori prendere nota durante la partita); c) la quantificazione di questi elementi può essere utile a determinare l’importanza relativa delle azioni correttive da intraprendere per un giocatore e ad assegnarne priorità in fase d’intervento.

Riguardo al rendersi conto di quanto stesse accadendo, si è trattato di una finale molto equilibrata, con dispendio di emozioni, con punti per la classifica e premi partita in palio, tutti fattori di disturbo per un’analisi in tempo reale.

Inoltre, la memoria tende a svanire nelle ore successive, sopratutto in caso di sconfitta. Avere a disposizione dati punto per punto permette di riflettere a lucido o di cogliere aspetti che, al momento, sono sfuggiti.

Trasformare l’analisi punto per punto della prima partita in un piano d’azione

Abbiamo dunque alcuni indicatori punto per punto dalla prima partita, in parte evidenti a un osservatore attento, in parte intuibili senza però comprenderne la grandezza e che in parte potremmo definire “nascosti” (in realtà molti indicatori probabilmente rientrano in questo gruppo, visto che io non sono ovviamente in grado di trovarli tutti).

Come ha dichiarato spesso Paul Annacone, sono poche le nozioni che un giocatore può fare proprie e applicare tra una partita e l’altra. È per questo che il suo metodo prevede uno o due (o anche tre) suggerimenti su cui concentrarsi in ogni partita, in funzione di chi sta allenando.

Essendo questo più un esercizio teorico per vedere quello che Pouille può fare e che ha poi effettivamente introdotto nella partita successiva, non serve essere così limitanti.

I sei punti del piano

Ho scelto comunque di riassumere un piano d’azione in sei punti, che elenco senza particolare ordine:

  1. Pouille dovrebbe modificare la sua selezione di servizi e usare più spesso il servizio esterno, specialmente sul lato dei vantaggi, nel quale ha avuto una percentuale di punti vinti straordinariamente alta;
  2. vista la disparità tra percentuale di punti vinti con la prima e con la seconda di servizio, può avere senso tenere più prime in campo, evitando però di generare una diminuzione significativa nella percentuale di punti vinti con la prima;
  3. Pouille dovrebbe rimettere in gioco un numero maggiore di seconde di servizio di Khachanov. Forse è stato troppo aggressivo nella prima partita, aspetto che ha determinato errori non forzati con più frequenza;
  4. Pouille deve continuare nel gioco offensivo, perché a rete ha un vantaggio netto;
  5. Pouille dovrebbe cercare di allungare gli scambi sul servizio di Khachanov, senza smarrire però il piglio offensivo. Parte di questa strategia consiste nell’anticipare la risposta al servizio esterno sul lato dei vantaggi, dato l’alto rendimento ottenuto da Khachanov in quella fattispecie;
  6. Pouille dovrebbe alzare il livello di concentrazione in situazioni di punteggio sul 30-30 o sulla parità.

Se dovessi fare leva solo su tre dei sei punti del piano di azione, sceglierei probabilmente l’1, il 3 e il 4, perché sono i più chiari e i più facili per un giocatore da ricordare e applicare in campo.

I punti 2, 5 e 6 possono risultare troppo esoterici, o troppo legati alla necessità di trovare condizioni ottimali. Ad esempio, nel punto 2 si può ipotizzare che un allenatore dica di servire più prime, ma per riuscirci Pouille potrebbe dover diminuire velocità o profondità del colpo – soprattutto perché la sua percentuale di prime è storicamente bassa – comportando una riduzione della percentuale di punti vinti con la prima.

Il punto 6 merita di essere approfondito. Ho la sensazione che un professionista del circuito sia già molto concentrato su un punteggio di parità. Quindi, a mio avviso, la strategia di aumentare l’attenzione sul 30-30 è più importante.

Sebbene Pouille non abbia avuto un buon rendimento sulle parità rispetto alle attese (perdendole tutte sul servizio di Khachanov e vincendone solo il 58% sul proprio servizio), ha vinto 4 punti su 6 sul 30-30 sul proprio servizio.

Si può comunque dire che avrebbe dovuto concentrarsi di più sul 30-30 e servizio Khachanov, ma questo si è verificato solo quattro volte e con Khachanov in particolare stato di grazia al servizio. Il vero punto debole di Pouille è stato sul 40-40, ma si tratta in ogni caso di un campione di dati ridotto.

Nella seconda parte

Nel prossimo articolo adotterò la stessa metodologia per la seconda partita iniziando con il confronto tra le statistiche sin qui esaminate e le medesime derivanti della seconda partita.

Cercando poi di vedere quali dei punti al piano d’azione possano essere stati eventualmente un fattore chiave per Pouille nel ribaltare l’esito della partita. Infine, determinando quale diversa statistica della seconda partita possa aver fatto la differenza ai fini della vittoria.

Pouille v. Khachanov: Drilling Down on Match Stats (Part 1)

Strisce degne di nota dalla stagione ATP 2017

di Peter Wetz // TennisAbstract

Pubblicato il 3 marzo 2018 – Traduzione di Edoardo Salvati

Grazie al recente aggiornamento dei database relativi al circuito maschile e femminile alla pagina GitHub di Jeff Sackmann, possiamo dare uno sguardo alla strisce più significative della stagione ATP 2017, in particolare quelle relative alle partite e ai tiebreak vinti e persi.

Strisce vincenti

Iniziamo con le partite vinte.

Giocatore   Partite   Inizio   Fine     
Nadal       17        17 apr   15 mag   
Nadal       16        28 ago   09 ott   
Federer     16        19 giu   07 ago   
Federer     13        09 ott   13 nov   
Federer     12        06 mar   20 mar   
A. Zverev   10        31 lug   07 ago   
Nadal       10        29 mag   03 lug   
Wawrinka    10        22 mag   29 mag   
Dimitrov    10        02 gen   16 gen

Si osserva come, in termini di strisce vincenti, la stagione sia stata dominata da Roger Federer e Rafael Nadal. La striscia di 17 vittorie di Nadal, interrotta dalla sconfitta contro Dominic Thiem nei quarti di finale degli Internazionali d’Italia, è l’unica che comprende tre tornei di fila vinti. Oltre a Nadal e Federer, solo Alexander Zverev ha vinto due tornei in successione.

Strisce perdenti

Se si guarda invece alla meno onorevole categoria di strisce perdenti, si pensa immediatamente a due nomi, quelli di Vincent Spadea e Donald Young. Il primo detiene il record di 21 partite perse consecutivamente sul circuito maggiore (non è conteggiata la sconfitta contro Rainer Schüttler alla World Team Cup di Dusseldorf nel 1999), mentre Young ha una delle strisce perdenti più lunghe, 17 partite, degli ultimi anni.

Nel 2017, nessun giocatore si è avvicinato a questi traguardi negativi, ma ci sono stati alcuni momenti in cui sembrava che si fosse dimenticato come vincere una partita. La tabella elenca tutti i giocatori con almeno 8 partite perse consecutivamente.

Giocatore   Partite   Inizio   Fine     
Cuevas      10        29 mag   23 ott
Marterer    10        06 feb   28 ago
Lorenzi     8         28 ago   30 ott
Jaziri      8         20 mar   03 lug
Medvedev    8         31 lug   09 ott
Tsitsipas   8         13 feb   02 ott

In merito alla striscia di 10 sconfitte di Maximilian Marterer, va sottolineata la sua stagione molto buona sul circuito Challenger, nel quale – tra una sconfitta e l’altra sul circuito maggiore – ha ottenuto risultati di rilievo in vari tornei.

Deve comunque essere frustrante perdere a ogni primo turno del tabellone principale dopo aver superato le qualificazioni, come è successo nel suo caso per sette delle dieci sconfitte in tornei del circuito maggiore (le altre tre sono arrivate dopo che Marterer aveva ricevuto una wild card). Per Pablo Cuevas invece, l’altro giocatore ad aver perso dieci partite di fila nel 2017, la striscia di sconfitte proviene da soli tornei del circuito maggiore.

Tiebreak

Si è parlato altre volte delle vittorie nei tiebreak, e una delle conclusioni è stata che in passato tre giocatori – Federer, Nadal e John Isner – sono andati stabilmente oltre le aspettative. L’elenco dei tiebreak vinti consecutivamente nel 2017 lo conferma, come si osserva nella tabella.

Giocatore   Tiebreak   Inizio   Fine     
Isner       11         15 mag   29 mag
Federer     8          19 giu   07 ago
Federer     8          06 mar   20 mar 
(Molti)     7

La striscia di Isner comprende due circostanze in cui ha vinto il tiebreak ma ha poi perso la partita, mentre in quella di Federer il tiebreak ha sempre contribuito alla vittoria finale. La lista di tiebreak consecutivi persi invece vede Lucas Pouille al primo posto con 12, appena uno in meno dei 13 persi di fila da Robin Haase, un record degli ultimi anni (a un solo tiebreak dai 14 di Graham Stilwell e Colin Dibley, striscia negativa collezionata negli anni ’70, n.d.t.).

Giocatore   Tiebreak   Inizio   Fine     
Pouille     12         03 mar   09 ott
Mayer       11         02 gen   03 lug 
Lajovic     8          06 mar   24 lug

Ritiri

Da ultimo, anche Nick Kyrgios si è fatto notare nel 2017 diventando il primo giocatore ad aver perso tre partite di fila per ritiro.

Data     Torneo         Avversario   Risultato
31 lug   Washington     Sandgren     3-6 0-3 Rit
03 lug   Wimbledon      Herbert      3-6 4-6 Rit
19 giu   Queen's Club   Young        6-7(3) 0-0 Rit

Doppio

Ci sono spunti interessanti anche nelle strisce della stagione 2018. I compagni di doppio Oliver Marach e Mate Pavic hanno iniziato con 17 vittorie consecutive, tra cui tre titoli, perdendo poi la finale di Rotterdam da Pierre-Hugues Herbert e Nicolas Mahut.

Se si considera anche la Coppa Davis, la striscia di Marach sale a 18 partite, grazie alla vittoria per l’Austria a febbraio in coppia con Philipp Oswald. Pur nella difficoltà di reperire dati relativi alle partite di doppio, si può affermare con un certo grado di sicurezza che Marach e Pavic avranno un posto di prim’ordine nell’annuario delle strisce vincenti del circuito maschile per il 2018.

ATP Streaks of 2017

I 22 miti del tennis di Klaassen & Magnus – Mito 22 (sull’effetto scoraggiamento)

di Stephanie Kovalchik // OnTheT

Pubblicato il 6 agosto 2016 – Traduzione di Edoardo Salvati

Un’analisi del Mito 21 e di tutti i 22 Miti di Klaassen e Magnus.

Con l’attenzione del mondo sportivo rivolta alle Olimpiadi di Rio 2016, un piccolo gruppo di instancabili statistici di sport si è ritrovato ai Joint Statistical Meetings di Chicago per confrontarsi sulle più recenti evoluzioni nel campo dell’analisi statistica sportiva.

Durante la mia permanenza, ho avuto la fortuna di partecipare a un seminario dal titolo “Convogliare lo straordinario potere delle statistiche sportive”, organizzato da Michael Lopez dello Skidmore College – e famoso per il suo account Twitter @StatsByLopez – e presieduto da Michael Schuckers della St. Lawrence University.

Gli altri partecipanti erano Brian Macdonald, uno statistico dei Florida Panthers della NHL; Dennis Lock, che elabora numeri per i Miami Dolphins della NFL; e Dan Cervone, attualmente parte del gruppo Ricerca XY e che diventerà data scientist per gli LA Dodgers della MLB.

Intervenendo come sola rappresentate di uno sport individuale, mi è stato chiesto di spiegare cosa rende l’analisi statistica unica rispetto a quella applicata agli sport di squadra. Ho risposto dicendo che, da un lato, è un tipo di analisi più facile perché, coinvolgendo meno giocatori, determinare il contributo del singolo agli esiti della partita è meno complesso.

Dall’altro, sport individuali come il tennis, il golf o i tuffi, prevedono tipicamente più momenti di pausa all’interno del gioco, nei quali l’atleta si prepara per l’azione successiva ed è lasciato ai suoi pensieri. Anzi, l’80% di una partita di tennis è occupato da questi momenti di pausa dall’azione (che potrebbe spingere a chiedersi come mai si è pagato così tanto il biglietto di un torneo dello Slam!). 

L’impostazione mentale 

Cosa c’entra il momento di pausa di uno sport individuale con le statistiche? Credo che la risposta sia, semplicemente, che non lo sappiamo. Quanto i pensieri di un giocatore, la routine mentale e, in generale, l’attitudine in campo incidano sul rendimento è una domanda aperta.

La diversa impostazione mentale di giocatori come Ivan Lendl o Fabio Fognini suggerisce che l’atteggiamento interiore non solo esiste ma fa anche la differenza. Le statistiche sportive però hanno solo da poco iniziato a fare progressi nel valutare l’aspetto mentale del gioco. 

È un argomento questo che si inserisce perfettamente nel mito conclusivo dei 22 che Klaassen e Magnus hanno affrontato. Nel quale si interrogano sulla possibilità che una mancata opportunità di break crei un effetto scoraggiamento per i giocatori al servizio nel game immediatamente successivo. Se dopo un’opportunità di break mancata il rendimento è sistematicamente negativo, si può pensare che sia uno dei modi in cui l’atteggiamento interiore influisce sulla prestazione di un giocatore.

Mito 22: “Dopo aver mancato una o più palle break, aumenta la probabilità di subire il break nel game successivo”

Come nella maggior parte delle analisi che abbiamo visto occupandoci dei miti di Analyzing Wimbledon, per testare le loro teorie i due autori preferiscono utilizzare un modello di base che ricomprenda sia la differenza che la somma delle classifiche del giocatore al servizio e alla risposta, come strumento per controllare la bravura dei giocatori.

Per verificare la teoria dello scoraggiamento del Mito 22, il modello di base viene ampliato per includere un indicatore dell’opportunità mancata nel game precedente. L’opportunità mancata è definita dalle palle break non trasformate nel game precedente dal giocatore al servizio in quel momento.

Applicando questo modello a un campione di partite di Wimbledon, Klaassen e Magnus non hanno trovato evidenza di un effetto scoraggiamento per gli uomini, mentre significativo è stato l’effetto trovato per le donne, soggette a una diminuzione media della probabilità di vincere un punto al servizio del 4% dopo aver mancato il break.

Una rivisitazione del Mito 22

Oltre a includere più tornei nell’analisi, ero interessata anche a verificare quali risultati sarebbero emersi applicando la metodologia statistica del matching.

Visto che le opportunità di break mancate potrebbero essere più frequenti per alcuni tipi di giocatori rispetto ad altri, si potrebbe verificare uno squilibrio in termini di bravura dei giocatori nel confronto tra i game al servizio dopo un’opportunità di break mancata e tutti gli altri game al servizio.

Nel timore che un modello regressivo basato sulla classifica non riesca a tenere adeguatamente conto dell’effetto di selezione, volevo appunto affrontare la questione utilizzando la metodologia del matching. 

La tabella riepiloga la base dati da cui sono partita. I numeri si riferiscono ai game al servizio di diverse migliaia di partite degli ultimi cinque anni per gli uomini e per le donne.

Le prime due colonne di entrambi i circuiti (‘Mancate’ e ‘Percentuale’) rappresentano la distribuzione delle opportunità di break precedenti ai game al servizio che il giocatore al servizio ha poi perso, mentre le ultime due colonne (‘Break’ e ‘Percentuale’) rappresentano la distribuzione dei game alla risposta che precedono quelli al servizio in cui non ci sono break.

Si osserva come le opportunità di break siano più frequenti per i giocatori che riescono a tenere il servizio più spesso, a indicazione dell’effetto generato dalla bravura del giocatore. Si osserva anche una probabilità superiore al 10% di due o più break. 

Effetto dose nello scoraggiamento

Per testare il Mito 22 con la metodologia del matching, ho iniziato trovando tutti quei game in cui un giocatore ha avuto opportunità di break che non ha però trasformato (la popolazione “trattata”, cioè quella su cui stimare gli effetti del trattamento).

Successivamente, ho trovato un equivalente game alla risposta per lo stesso giocatore nella stessa partita, in cui non ha mai avuto opportunità di break (la popolazione “non trattata”, cioè quella che permette di verificare gli effetti del trattamento sulla popolazione trattata).

In questo modo, per ogni opportunità di break mancata ho individuato un equivalente game alla risposta nella stessa partita che servisse da parametro di controllo. 

Considerate le soglie di opportunità di break come espresse in tabella, ho cercato di capire se ci fosse un effetto dose nello scoraggiamento. In altre parole, se lo scoraggiamento crescesse all’aumentare delle opportunità di break mancate.

Quindi se un giocatore che non ha sfruttato cinque opportunità di break riesca a tenere il servizio successivo con ancora meno probabilità rispetto ad aver sprecato una sola opportunità di break. Per trovare una risposta ho applicato lo stesso tipo di analisi su differenti soglie di palle break (ad esempio almeno una, almeno due, etc).

Altri elementi di analisi

Ci sono altri due aspetti che rendono la mia analisi diversa dall’approccio adottato da Klaassen e Magnus. In primo luogo, mi interessa valutare la vittoria del game successivo al servizio, non solamente vincere dei punti nel medesimo game.

Sebbene una riduzione del numero di punti vinti al servizio implichi una contestuale diminuzione nella vittoria del game al servizio, ritengo che abbia più senso analizzare direttamente la probabilità di tenere il servizio, visto che si tratta della questione di fondo del Mito 22.

In secondo luogo, considero anche l’effetto che la trasformazione di un’opportunità di break genera sul tenere il turno di servizio successivo, così da valutare se esista un effetto incoraggiamento simmetrico legato ai break ottenuti. 

Quali sono stati i risultati per il circuito maschile?

L’immagine 1 mostra la percentuale con cui i giocatori nel gruppo di controllo hanno tenuto il servizio dopo diversi tipi di game alla risposta (nella versione originale è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.).

In generale, si osserva la media più bassa per game al servizio che seguono game alla risposta in cui  il giocatore non ha mai avuto un’opportunità di break.

Troviamo poi a aumento generalizzato nella probabilità di tenere il servizio dopo un’opportunità di break non sfruttata, circa un punto percentuale in grandezza rispetto alla situazione di assenza di opportunità di break.

È curioso perché è la direzione opposta dell’effetto previsto dalla teoria dello scoraggiamento, visto che sembra che i giocatori tengano con un po’ più di facilità il servizio dopo aver sprecato un’opportunità di break.

IMMAGINE 1 – Effetti generati da opportunità di break mancate e convertite per il circuito maschile

L’ultimo insieme di punti è quello dei game al servizio dopo aver convertito un’opportunità di break, nel quale si nota una probabilità ancora più alta di tenere il servizio (in media, due punti percentuali), anche se gli intervalli di confidenza si sovrappongono all’aumentare della soglia delle palle break da 1 a 4 e la dimensione il campione di game al servizio diminuisce.

Pur in presenza di una tendenza generale con anche una sola opportunità di break, sembra riscontrarsi una dinamica incrementale nell’effetto al crescere del numero di opportunità di break.

Per il circuito femminile?

Le dinamiche sono significativamente diverse. Esiste una differenza meno accentuata tra i game alla risposta senza opportunità di break e quelli con una o più palle break non trasformate. Però, l’effetto va in direzione negativa, a segnalare un limitato ma continuativo effetto scoraggiamento.

Per i servizi tenuti dopo aver ottenuto il break, il risultato è opposto: come per gli uomini, anche per le donne è in genere più probabile tenere il servizio. Le differenze nelle medie sono però più ridotte rispetto a quanto trovato per gli uomini e anche l’evidenza di un effetto dose è meno chiara.

IMMAGINE 2 – Effetti generati da opportunità di break mancate e convertite per il circuito femminile

Riepilogo

La rivisitazione dell’ultimo dei 22 miti di Klaassen e Magnus ha fornito altri esempi di come il rendimento di un giocatore possa o non possa essere influenzato dal punteggio.

Nel caso in esame, un’analisi comparativa ha evidenziato che – contrariamente all’opinione comune – gli uomini cercano di tenere il servizio con maggiore determinazione dopo aver mancato un’opportunità di break, e cercano con ancora più determinazione di mantenere il vantaggio dopo aver ottenuto il break.

Per le donne non si sono manifestate le stesse caratteristiche. Come già riscontrato da i due autori, le giocatrici mostrano di essere scoraggiate dall’aver mancato l’opportunità di break in misura maggiore. Allo stesso tempo, strappare il servizio sembra conferire un vantaggio psicologico meno pronunciato nel tenere il successivo game al servizio.

Se si può trarre un insegnamento dalla rivisitazione dei miti di Klaassen e Magnus è quello di non accettare mai come verità rivelata – in assenza di una solida validazione numerica – la saggezza popolare tennistica.

Esempi su esempi hanno mostrato che in molti casi le risultanze sono contrarie all’opinione diffusa. Contestualmente, si è visto che i risultati raggiunti possono essere legati ai dati a disposizione e alle metodologie per analizzarli.

Conclusioni

Sono tutte motivazioni per spingere nuovi analisti o ricercatori a rivolgere l’attenzione al tennis e unirsi ai tentativi di migliorare le metodologie e la qualità e disponibilità dei dati utilizzati. 

Spero che il ciclo dei 22 Miti di Klaassen e Magnus su StatsOnTheT abbia contribuito nel suo piccolo a raggiungere l’obiettivo.

Klaassen & Magnus’s 22 Myths of Tennis— Myth 22

Valori di riferimento nell’analisi punto per punto

di Jeff Sackmann // TennisAbstract

Pubblicato il 17 gennaio 2017 – Traduzione di Edoardo Salvati

In un precedente articolo ho illustrato una possibile futura configurazione delle statistiche relative agli errori. Un ampio spettro di statistiche avanzate in molteplici sport, dal baseball all’hockey su ghiaccio – e progressivamente anche nel tennis – segue lo stesso algoritmo di base:

  1. raggruppare gli eventi (colpi, opportunità e qualsiasi altro) in categorie;
  2. determinale livelli attesi di prestazione o rendimento – solitamente medie del circuito – per ogni categoria;
  3. confrontare i giocatori (o i game o i tornei specifici) con quei livelli attesi di prestazione.

Il primo passaggio è di gran lunga il più complicato, perché la suddivisione in categorie dipende in larga parte dai dati a disposizione.

Nel baseball ad esempio, le statistiche di media difensiva avevano inizialmente poco margine di analisi oltre al numero di ribattute, che invece oggi possono essere raggruppate in funzione della posizione esatta, dell’angolo di lancio, della velocità di uscita dalla mazza e altro ancora.

Avere più dati non rende il compito necessariamente più facile, considerando la varietà di metodi di classificazione potenzialmente utilizzabili.

L’algoritmo che ho creato

Uno scenario simile si presenterà nel tennis se e quando, nel tempo, i dati raccolti da Hawk-Eye (o un sistema analogo) verranno resi di pubblico dominio. Per il momento, chi è interessato a fare analisi ha comunque molto materiale, in particolare i più di 1.6 milioni di colpi (a oggi più di 2 milioni, n.d.t.) raccolti grazie al Match Charting Project.

La sequenza di codifica dei colpi che ho creato per il Match Charting Project rende un passaggio dell’algoritmo relativamente immediato, perché è un sistema che classifica i colpi in due modi principali: il tipo (dritto, rovescio, rovescio tagliato, volée di dritto, etc) e la direzione (al centro o verso l’angolo destro o sinistro).

Pur tralasciando molti dettagli (profondità, velocità, rotazione, etc) si tratta del maggior numero di dati che ci si può aspettare un valutatore riesca a raccogliere in tempo reale sulla partita.

Per fare un esempio, si possono usare i dati del Match Charting Project per calcolare la media degli errori non forzati nel circuito maschile quando un giocatore prova a colpire un dritto incrociato, per poi confrontare tutti gli altri giocatori rispetto a quel valore di riferimento.

La media del circuito è del 10%, la frequenza di errori non forzati di Novak Djokovic è del 7% e quella di John Isner è del 17%. Naturalmente, non ci si può limitare a questo nel confronto tra efficacia di dritti incrociati. Se in media un giocatore del circuito ottiene un vincente dal 7% di dritti incrociati, la frequenza di Djokovic è solo del 6%, mentre quella di Isner è del 16%.

Serve una prospettiva più allargata

È necessario quindi adottare una prospettiva più allargata. Invece dei singoli colpi, credo sia di maggiore interesse analizzare le opportunità di colpo. Anziché domandarsi cosa succeda quando un giocatore è nella posizione di giocare un determinato colpo, dovremmo cercare di capire cosa accada quando quello stesso giocatore ha la possibilità di tirare un determinato colpo in una specifica zona del campo.

Questo diventa particolarmente importante se si vuole superare il fraintendimento che risiede nella distinzione tra errori forzati e non forzati (così come quello della linea di separazione tra errori e vincenti dell’avversario, frutto della stessa vicinanza interpretativa per cui i vincenti sono semplicemente colpi così ben piazzati che l’avversario non riesce nemmeno a commettere un errore forzato).

Nell’esempio con Djokovic e Isner, il denominatore era “dritti in una specifica zona del campo che il giocatore aveva una ragionevole opportunità di rimettere in gioco”, vale a dire vincenti ed errori non forzati di dritto.

In questo caso non stiamo confrontando grandezze omogenee: a parità di opportunità, Djokovic riuscirà ad arrivare su più palline, commettendo forse errori non forzati quando nella medesima circostanza considereremmo errori forzati quelli di Isner.

Esiti delle opportunità di colpo

Per esattezza, con opportunità di colpo intendo quelle definite dalla decisione di gioco presa dall’avversario, a prescindere da come il giocatore stesso riesca a replicare o se riesca anche solo ad arrivare con la racchetta sulla pallina. Ad esempio, ipotizzando che entrambi i giocatori siano destrimani, nel disegno è evidenziato un dritto incrociato.

Il giocatore A è quello che gioca il dritto e offre al giocatore B un’opportunità di colpo. Questa è una delle varie classificazioni degli esiti che potrebbero derivarne, con – tra parentesi – le abbreviazioni che ho utilizzato anche nei grafici a seguire:

  • il giocatore B non riesce a raggiungere la pallina, determinando un vincente per il giocatore A (vs V);
  • il giocatore B raggiunge la pallina, ma commette un errore forzato (EF);
  • il giocatore B commette un errore non forzato (ENF);
  • il giocatore B rimette la pallina in gioco ma finisce per perdere il turno (pi-P);
  • il giocatore B rimette la pallina in gioco, presenta al giocatore A un colpo “giocabile” e finisce per vincere il punto (pi-V);
  • il giocatore B costringe il giocatore A a commettere un errore forzato (EF ind);
  • il giocatore B colpisce un vincente (V).

Come sempre, per ogni dato denominatore si potrebbero individuare varie categorie, magari unendo errori forzati e non forzati, o scomponendo ulteriormente la tipologia “in gioco” per identificare se il giocatore si è posizionato in modo da concludere il punto velocemente. Ancora, si potrebbero analizzare categorie completamente differenti, come la selezione del colpo.

Le categorie sopra elencate forniscono comunque una valida idea generale di come i giocatori si comportino di fronte a opportunità differenti e come quelle opportunità siano di fatto diverse l’una dall’altra.

I grafici a seguire mostrano – mantenendo le sigle dell’esempio precedente – gli esiti per il giocatore B basati sui colpi del giocatore A, raggruppati solo per tipologia di colpo.

IMMAGINE 1 – Esiti di opportunità di colpo suddivisi per tipologia

Gli esiti sono messi uno sopra all’altro dal peggiore al migliore. In basso troviamo la percentuale di vincenti del giocatore A (vs V), cioè quelle opportunità in cui il giocatore B – dal cui punto di vista stiamo facendo l’analisi – non è riuscito nemmeno a raggiungere la pallina. In alto troviamo la percentuale dei vincenti (V) colpiti dal giocatore B di fronte all’opportunità di colpo.

Come ci si poteva attendere, i dritti presentano le opportunità più difficili: il 5.7% diventa un vincente e un altro 4.6% risulta in errori forzati. I giocatori sono in grado di convertire quelle opportunità in punti vinti solo il 42.3% delle volte, rispetto al 46.3% di fronte a un rovescio, al 52.5% di fronte a un rovescio tagliato o (in chip) e al 56.3% di fronte a un dritto tagliato.

Il grafico si basa su circa 347 mila colpi, cioè tutte le opportunità da fondo (esclusi i servizi, che necessitano di trattamento separato) che sono emerse in più di 1000 partite tra due destrimani presenti nel database.

Naturalmente, esistono numerosissime altre variabili per distinguere ulteriormente quei colpi del semplice raggruppamento per tipologia. L’immagine 2 mostra gli esiti delle opportunità di colpo in vari momenti dello scambio quando il giocatore A colpisce un dritto.

IMMAGINE 2 – Esiti di opportunità di colpo in vari momenti dello scambio

La colonna più a sinistra può essere letta come l’insieme dei risultati delle “opportunità di giocare un terzo colpo”, vale a dire esiti quando la risposta al servizio è un dritto. Anche in questo caso i numeri sono in linea con le attese: il momento migliore per giocare un vincente con un dritto è il terzo colpo, nella tattica chiamata “servizio più uno”.

Lo si può vedere in altro modo nella colonna adiacente, che rappresenta le opportunità di giocare un quarto colpo. Se l’avversario gioca un dritto in campo come primo colpo dopo il servizio nella tattica “servizio più uno”, c’è una probabilità del 10% che il giocatore non riesca nemmeno a raggiungere la pallina. In media, la probabilità di un giocatore di vincere il punto da quella posizione è solo del 38.4%.

Dopo il terzo e quarto colpo, ho suddiviso le opportunità in quelle a disposizione del giocatore al servizio (quinto colpo, settimo colpo e così via) e in quelle a disposizione del giocatore alla risposta (sesto, ottavo colpo, etc). Come si osserva, dal quinto colpo in avanti non c’è molta differenza, quantomeno di fronte a un dritto.

Esaminiamo un’ulteriore grafico: gli esiti delle opportunità di colpo quando l’avversario gioca un dritto in varie direzioni (sempre in una partita tra destrimani).

IMMAGINE 3 – Esiti di opportunità di colpo per dritto giocato in varie direzioni

C’è poca differenza tra i due angoli, ed è evidente che sia più semplice approfittare di una opportunità di colpo al centro del campo rispetto a ciascuno dei due angoli.

È interessante notare come di fronte a un dritto rimesso in gioco – a prescindere da dove sia mirato – il giocatore medio abbia una probabilità inferiore al 50% di vincere il punto.

Siamo in presenza di un’occorrenza di effetto (o distorsione) di selezione generante confusione e che occasionalmente si verifica nelle statistiche di tennis: visto che una percentuale importante di colpi è rappresentata da errori, il giocatore che ha colpito la pallina in campo è temporaneamente in una situazione di vantaggio.

Passi successivi

Se vi steste domandando quale sia il senso di tutto questo, posso capire (e apprezzo il fatto che abbiate letto sin qui nonostante i vostri dubbi). Senza prima arrivare all’analisi di situazioni molto più specifiche – e forse nemmeno in quel caso – queste medie del circuito non sono più che curiosità.

Mostrare che un dritto ha più efficacia che un rovescio tagliato o che tirare agli angoli del campo è più produttivo che mirare al centro certamente non rivoluziona l’analisi statistica nel tennis.

In definitiva, queste medie sono solo uno strumento per quantificare con maggiore dovizia il rendimento di determinati giocatori.

L’esplorazione di algoritmi come questo, unita all’incremento dei dati raccolti con il Match Charting Project (che ha da poco superato le 3600 partite totali, n.d.t.), permetterà di conoscere meglio le dinamiche di gioco dei migliori del mondo, e quali aspetti li rendano così tanto più bravi di tutti gli altri.

Benchmarks for Shot-by-Shot Analysis

La potenza analitica di un punto per mille

di Jeff Sackmann // TennisAbstract

Pubblicato il 5 dicembre 2017 – Traduzione di Edoardo Salvati

In un precedente articolo, ho introdotto un metodo per stilare una classifica della bravura nello smash. Ho espresso i risultati in “scala 100”, vale a dire il numero di punti che un giocatore potrebbe attendersi di vincere o perdere, rispetto alla media del circuito, in funzione della sua abilità nel colpire quello specifico colpo.

I numeri emersi erano molto piccoli: i calcoli hanno mostrato che è Jo-Wilfried Tsonga ad avere lo smash migliore, un colpo che per lui vale 0.17 punti per 100 punti sopra la media e 0.27 punti per 100 punti in più del giocatore con lo smash peggiore nel campione analizzato, cioè Pablo Cuevas.

La scarto di 0.27 per 100 punti tra lo smash migliore e il peggiore è un’indicazione di massima di quanto la qualità di uno smash possa fare la differenza. Si tratta di una frequenza che si traduce all’incirca in un punto ogni 370.

È molto poco e, considerando che la maggior parte dei giocatori staziona intorno alla media anziché trovarsi nelle vicinanze di uno dei due estremi, il tipico effetto generato dalla qualità di uno smash è ancora più ridotto.

Quanto vale un punto?

Tuttavia, è difficile intuire quanto effettivamente valga un punto. Normalmente, un singolo punto, o anche cinque punti, non faranno più di tanto la differenza. D’altro canto però, ci sono molte partite talmente equilibrate per cui un punto o due possono orientare il risultato in una o nell’altra direzione.

Se un giocatore fosse in grado di perfezionare il suo smash nella preparazione tra una stagione e l’altra e raggiungere il livelli di Tsonga, quale contribuito darebbero quei 0.17 punti per 100 punti alle sue vittorie totali? E per la classifica?

Una volta deciso di indagare sul tema, è un problema relativamente chiaro da affrontare. Durante una stagione, i giocatori migliori vincono più punti dei loro avversarsi, ovviamente. Il margine però non è così scontato.

Nel 2017, nessun giocatore ha vinto più punti più spesso di quanto abbia fatto Rafael Nadal, con il 55.7% delle volte. È un valore più alto di meno di sette punti percentuali del peggior giocatore tra i primi 50, Paolo Lorenzi, che ha vinto il 49.1% dei punti giocati. Quasi la metà dei primi 50, 22 per l’esattezza, ha vinto tra il 49.0% e il 51.0% dei punti totali, e un altro 15% di giocatori si è posizionato tra il 51.0% e il 52.0%.

Sistemare la statistica dei punti totali vinti

Questi numeri portano leggermente fuori strada, solo leggermente però. La statistica dei punti totali vinti (PTV) tende a raggruppare i giocatori nella zona molto vicina al 50% perché si trovano ad affrontare quello che, per altri sport, chiameremmo un calendario sbilanciato.

Infatti, se un giocatore vince solitamente deve giocare il turno successivo contro un avversario più forte; se vince ancora, c’è un avversario ancora più forte che lo attende.

Questo significa che la differenza di 6.6% tra Nadal e Lorenzi è più ampia di quanto sembri. Se Lorenzi avesse incontrato lo stesso insieme di avversari di Nadal, non sarebbe riuscito a vincere il 49.1% dei punti.

È possibile però trovare una soluzione. In un articolo di qualche mese fa, ho introdotto un algoritmo che analizzava i punti vinti alla risposta ponderati per avversario, mettendo a confronto i risultati di ogni coppia di giocatori in partite di equivalente difficoltà (un’analisi che richiamava l’attenzione sull’improvvisa ascesa del mago alla risposta Diego Schwartzman).

L’avversario generico e il giocatore di rimpiazzo

Pur non sapendo esattamente cosa accadrebbe se Lorenzi avesse giocato contro gli stessi identici avversari di Nadal, possiamo usare questa metodologia basata sul “generico” avversario come approssimazione.

Troviamo che la differenza tra il primo giocatore, Nadal, e il 50esimo della classifica, Lorenzi, è di circa dieci punti percentuali. Tenendo costante al 55.7% la frequenza di punti vinti da Nadal, Lorenzi raggiunge il 46.2%, un valore che appare più neutro. Molti giocatori rimangono nel gruppo compreso tra 49% e 51% ma, quando si tiene conto della tendenza naturale del tennis a compensare le vittorie di un giocatore con le successive sconfitte, la differenza complessiva è maggiore.

La differenza di dieci punti percentuali non varia anche allargando il numero di giocatori a 71, vale a dire tutti quelli che hanno giocato almeno 35 partite sul circuito maggiore nel 2017. Lorenzi resta in fondo all’elenco, qualche posizione sopra a Mikhail Youzhny, la cui frequenza di punti vinti del 45.7% lo mette all’ultimo posto, esattamente dieci punti percentuali sotto Nadal.

Riflettiamo sul significato. In una classica partita maschile, per ogni cento punti giocati, solo dieci sono davvero incerti. Non in senso letterale naturalmente: ci sono moltissime partite in cui un giocatore vince almeno il 60% dei punti totali.

In media però, ci si può attendere che anche il giocatore più debole tra quelli regolarmente nel circuito vinca 45 punti su 100. Nella statistica sportiva di squadra, si parla in termini analoghi di “livello di rimpiazzo”, cioè l’abilità di un tipico giocatore dei campionati minori svincolato da contratto – e quindi immediatamente impiegabile come sostituto – o di un giocatore della panchina.

Non mi piace troppo mutuare il concetto di livello di rimpiazzo, perché in uno sport individuale è impossibile sostituire davvero un giocatore con un altro. Genericamente parlando però, è un buon metodo di paragone: come un battitore dei campionati minori potrebbe colpire con .230 di media realizzativa (rispetto allo .000) nelle leghe maggiori, così un giocatore ATP vincerà il 45% dei punti, non lo 0%.

Punti verso vittorie

Nella statistica sportiva di squadra, è frequente associare un determinato numero di segnature, goal o punti a una vittoria. Ragionare in termini di vittorie è un buon modo per valutare i giocatori.

Se si è in grado di stabilire che un portiere più forte vale due vittorie in più rispetto a quello attualmente nella rosa, è evidente il suo contributo alla squadra. Ancora una volta, è richiesta un po’ d’immaginazione per applicarlo al tennis, ma è un punto di partenza per iniziare a riflettere in modo analogo.

Un’altra stranezza del tennis è quella per cui non solo i giocatori affrontano avversari di livello ben diverso tra loro, ma giocano anche un numero di partite che può variare considerevolmente. I primi 50 a fine stagione 2017 hanno giocato dalle 35 alle 80 partite.

In parte è dovuto agli infortuni, ma la causa maggiore è di tipo strutturale: più partite vinci, più giochi. Nadal ha gestito il suo calendario iscrivendosi solamente a qualche torneo non obbligatorio, eppure solo David Goffin ha giocato più partite di lui.

Abbiamo quindi un altra stranezza da considerare, che possiamo gestire ipotizzando del tutto fittiziamente che una stagione di tennis sia lunga esattamente 50 partite. Il record di vittorie-sconfitte di Nadal è stato nel 2017 di 67-11; rapportato a una stagione da 50 partite, diventa circa 43-7.

Siamo ora pronti ad analizzare la relazione tra punti e vittorie. Per punti s’intende la frequenza di punti totali vinti aggiustata per avversario affrontato, e le vittorie sono il numero di partite vinte nell’ipotetica stagione da 50.

È una relazione piuttosto forte (r^2 = 0.75), per quanto non perfetta. Roger Federer ha vinto partite a una frequenza più alta di quella di Nadal, ma in termini di punti totali vinti per avversari affrontati, Nadal lo ha surclassato, con il 55.7% contro il 53.5% di Federer. E come visto, Lorenzi è in fondo al campione di 71 giocatori, nonostante sia riuscito a rimanere intorno alla 40esima posizione della classifica.

Fortuna, bravura nei momenti che contano e qualche altra circostanza favorevole rendono imperfetta la relazione punti verso vittorie, ma è comunque un valido indicatore.

Non servono troppi punti per aumentare le vittorie totali di un giocatore. L’aumento di solo 0.367 punti per 100 punti si traduce in una vittoria in più sulle 50 partite stagionali giocate. La media punti giocati a stagione è di 8000, quindi sono 29 punti in più ad anno.

Le conclusioni sull’analisi dello smash migliore assumono una nuova luce: la differenza di 0.27 punti per 100 punti tra i due estremi è sembrata ininfluente, ma ora ci si accorge che vale quasi una vittoria di una stagione da 50 partite.

Vittorie verso posizioni in classifica

Quello che conta davvero però nel tennis, la sua valuta di scambio universalmente riconosciuta, non solo le vittorie ma la posizione nella classifica generale. Anche la relazione tra vittorie e posizione in classifica è forte ma imperfetta (r^2 = 0.63).

Come osservato, i giocatori di media classifica sono molto vicini in termini di punti totali vinti, con molti di loro che si aggirano sul livello del 50%, anche quando il dato è corretto per la tipologia di avversari.

Anche il numero di vittorie non è di grande aiuto per creare separazione tra questi giocatori: in media, un aumento di 0.26 vittorie per 50 partite equivale a una posizione in classifica. Detto in altro modo, se un giocatore vince una partita in più, la sua classifica migliorerà di quattro posizioni.

Serve ricordare che non sono postulati scolpiti nella roccia quando si considerano situazioni reali, dipende infatti anche quando e dove sono conseguite quelle vittorie addizionali. Il corrispondente incremento di classifica potrebbe variare da nessuna fino a trenta posizioni.

Conoscendo le caratteristiche di una tipica vittoria però possiamo meglio comprendere l’impatto di ciascuna vittoria marginale e, per estensione, il valore del vincere dei punti aggiuntivi.

Un punto per mille

Se mettiamo insieme queste due relazioni, otteniamo una nuova regola del pollice comoda anche da un punto di vista numerico. Se l’aumento di una posizione in classifica richiede 0.26 vittorie addizionali ogni 50 partite, e una vittoria aggiuntiva richiede 0.376 punti extra per 100 punti, un rapido giro di calcolatrice dimostra che una posizione in classifica equivale a circa 0.095 punti per 100 punti. Arrotondando a 0.1 per 100 punti, siamo nell’ordine di un punto per 1000 punti.

Un punto addizionale per mille punti è una quantità minuscola, quel tipo di differenza che mai sogneremmo di notare a occhio nudo. Tornei vengono vinti regolarmente senza che un giocatore arrivi a dover giocare così tanti punti. Anche per Goffin – che ha servito o risposto più di dodici mila volte quest’anno – si parla di circa una dozzina di punti.

Ripensiamo però a tutti quei giocatori raggruppati tra il 49% e il 52% dei punti vinti totali; anche una volta che si è corretto per la tipologia di avversari, tre di loro hanno terminato il 2017 con lo stesso valore di 50.4%, separati da meno di un punto per mille.

La zona della classifica in cui un punto per mille non rappresenta più che un errore di arrotondamento sono le posizioni di vertice massimo. Di solito, un giocatore emerge dal gruppo e i pochi che sono in cima si distanziano da tutti gli altri.

Il 2017 non è stato diverso: la differenza corretta per avversario tra Nadal e Federer è stata di un incredibile 2.2% (22 punti per mille punti), mentre il successivo 2.2% fa scendere da Federer fino a tutti i primi 10. Il 2.2% che segue, che si estende all’intervallo tra il 51.1% e il 48.9%, ricomprende altri venti giocatori che, in media, sono separati tra loro da un punto per mille.

Se un giocatore cercasse di migliorare la sua classifica dalla 30esima posizione alla 20esima, il percorso sarebbe abbastanza lineare; dalla quinta alla terza posizione invece sarebbe molto meno prevedibile, e probabilmente più difficoltoso.

Conclusioni

Se tutto questo sembra inutilmente astruso, posso solo riferirmi ai risultati emersi dall’analisi sullo smash.

Ora sappiamo che la variazione di capacità tra giocatori regolarmente attivi sul circuito maggiore nel colpire lo smash vale circa tre posizioni in classifica. Si pensi a cosa voglia dire arrivare a simili conclusioni per dritti, rovesci, discese a rete…roba che scotta!

Anche se la strada da percorrere è ancora lunga, questo approccio permette di misurare l’impatto di specifici colpi – e magari anche di tattiche – e trasformare quell’impatto in termini di posizioni in classifica, la valuta di riferimento nel tennis.

The Power of One Point Per Thousand