Il più grande archivio italiano di analisi statistiche sul tennis professionistico. Parte di Tennis Abstract

Il più grande archivio italiano di analisi statistiche sul tennis professionistico. Parte di Tennis Abstract

L’immersione di Infosys in piscina

ULTIMI ARTICOLI

È tornata la discesa a rete?

Pubblicato il 2 ottobre 2020 su StatsOnTheT - Traduzione di Edoardo Salvati // Se guardando il Roland Garros 2020...

Venti non vuol dire sempre venti

Pubblicato il 12 ottobre 2020 su TennisAbstract - Traduzione di Edoardo Salvati // C’è sempre più traffico in cima...

La fortuna del sorteggio: Roland Garros 2020 (donne)

Pubblicato il 25 settembre 2020 su HiddenGameOfTennis - Traduzione di Edoardo Salvati // Come per gli uomini, anche per...

La fortuna del sorteggio: Roland Garros 2020 (uomini)

Pubblicato il 25 settembre 2020 su HiddenGameOfTennis - Traduzione di Edoardo Salvati // Da diversi anni ormai eseguo simulazioni...

Cosa succede al ritmo di gioco con le nuove regole imposte dalla pandemia

Pubblicato il 31 agosto 2020 su TennisAbstract - Traduzione di Edoardo Salvati // La pandemia COVID-19 ha imposto agli...

Che valore assegnamo ai tornei Masters o Premier vinti nella bolla?

Pubblicato il 30 agosto 2020 su TennisAbstract - Traduzione di Edoardo Salvati // Il tennis è ripartito, ma molti...

Mettere un asterisco accanto agli US Open è prematuro, e forse del tutto sbagliato

Pubblicato il 19 agosto 2020 su TennisAbstract - Traduzione di Edoardo Salvati // Ci saranno diverse assenze di alto...

Il circuito femminile post COVID-19 sta rientrando alla normalità

Pubblicato il 17 agosto 2020 su TennisAbstract - Traduzione di Edoardo Salvati // Negli ultimi due tornei femminili, abbiamo...

Il sospetto che Venus e Serena debbano giocare contro troppo spesso è fondato?

Pubblicato il 12 agosto 2020 su TennisAbstract - Traduzione di Edoardo Salvati // Nel torneo di Lexington di questi...

Effetti della pandemia nel torneo di Palermo?

Pubblicato il 10 agosto 2020 su TennisAbstract - Traduzione di Edoardo Salvati // È più difficile fare previsioni sullo...

ULTIMI ARTICOLI

Pubblicato il 7 agosto 2019 su HiddenGameOfTennis – Traduzione di Edoardo Salvati

// Il riferimento è a un articolo sul sito dell’ATP che ha la pretesa di fornirci questo tipo di indicazione: “Un’immersione in profondità di Infosys ATP Insights sui primi 50 giocatori che, dall’inizio del 2019, fanno il break dal punteggio di 40-0 e servizio per il l’avversario, rivela che da questo abisso in media si ottiene il break solo nell’1.38% dei casi (84/6027)”. Questa statistica è definita la “più dura nel tennis”. Viene poi presentata la seguente tabella.   

IMMAGINE 1 – Game vinti alla risposta dal 40-0 per l’avversario, dall’inizio del 2019

Un’immersione in profondità nei dati, ma senza dati

Lasciando stare se è per davvero la “statistica più dura nel tennis”, sono sicuro che si riesce a trovare qualche evento nel tennis meno probabile dell’1.38%. Il primo che mi viene in mente è per una giocatrice di vincere 23 titoli Slam, il secondo è di vincere un set dal punteggio di 0-5 e alla risposta. E molti altri.  

Vediamo invece se Infosys ha in realtà svelato qualcosa di interessante in riferimento a questi recuperi impossibili. Dimentichiamoci del singolo giocatore per un momento. Dimentichiamoci anche di qualsiasi dato punto per punto delle partite effettivamente giocate nel 2019. Sappiamo che in media un giocatore vince, in una partita del tabellone principale di un torneo del circuito maggiore, circa il 62.5% dei punti al servizio. Senza fare ricerche specifiche, inserendo questo valore in un modello Markov otteniamo che il giocatore al servizio ha, all’inizio del game, il 78.5% di probabilità di tenere il servizio. Detto altrimenti, anche sullo 0-0, il generico giocatore alla risposta ha solo il 21.5% di probabilità di fare il break.  

Serve della matematica aggiuntiva (ugh) o un foglio di calcolo orribilmente contorto come il mio (ebbene sì!), o ancora un codice Python dalla pagina GitHub di Jeff Sackmann (per andare sul sicuro), per sapere che sul 15-0 la probabilità del generico giocatore al servizio scende al 12.4%. Sul 30-0, la stessa probabilità è solo del 5.5%, mentre sul 40-0 e dell’1.40%. Suona familiare? Riprendiamo l’estratto dal paragrafo iniziale. Senza “svelare” alcun dato dalle partite giocate, siamo in grado di giungere alla probabilità media di ottenere il break dal punteggio di 40-0 sul servizio dell’avversario. 

Che ne è dei giocatori della tabella?

La tabella ordina i giocatori sulla base del numero di game vinti da un punteggio di 40-0 sul servizio dell’avversario. Alcuni dei numeri sembrano seriamente impressionanti, in particolare sapendo che il break arriva solo l’1.4% delle volte contro un giocatore medio al servizio. Però, molti dei giocatori in elenco sono colpitori eccezionali alla risposta, cioè faranno il break più spesso in una qualsiasi situazione. 

Per capire se Infosys è arrivata a conclusioni inedite — e con questo intendo chiedermi: è una statistica da cui possiamo dedurre informazioni in più su un giocatore che non avremmo potuto derivare semplicemente dalla bravura alla risposta? — nella tabella che segue ho aggiunto una colonna. Si tratta della percentuale di break attesi dal punteggio di 40-0, in funzione della percentuale di punti vinti al servizio dell’avversario. 

IMMAGINE 2 – Percentuale di break attesi dal 40-0 in funzione dei punti vinti al servizio dall’avversario

Voglio essere chiaro. Non sto implicando che ci sia qualcosa di sbagliato in questo elenco o che lo siano i calcoli. Dopo tutto, sono recuperi realmente accaduti. Tuttavia, voglio capire se quelle percentuali di vittoria sottintendono l’esistenza di un talento speciale nel ribaltare il risultato dal 40-0, o se sono percentuali di vittoria che ci si attende rispetto alla bravura alla risposta dei giocatori in esame.   

La risposta è “forse” relativamente ai primi cinque, i cui risultati sono andati oltre le aspettative per più di quanto avremmo ipotizzato dalla casualità, e “probabilmente no” per i restanti cinque. 

Perché “forse” per i primi cinque? 

Non possiamo stabilire se sia un talento che supera la bravura alla risposta di ciascuno dei cinque senza sapere se è ripetibile su molteplici periodi di tempo. La bravura alla risposta è ripetibile, non lo è generalmente fare più break di quanto atteso. Siamo in presenza di un’eccezione, sebbene esigua? Ho molti dubbi al riguardo, ma mi piacerebbe essere smentito.  

Infosys ha tutti i dati a disposizione, e sarebbe stato quindi utile vedere se gli stessi nomi avessero fatto la loro apparizione anche nel 2018 e 2017 (suppongo che nessuno abbia pensato di verificarlo, che è un altro modo per dire che spero che non ci sia stato qualcuno che abbia guardato gli altri anni e omesso i valori perché non in linea con la tesi principale).  

Abbiamo invece un’immersione in piscina che presenta conclusioni in modo più definitivo di quanto probabilmente lo siano. L’ATP dovrebbe esigere di più dal suo fornitore di dati. ◼︎

Infosys “Deep Dives” Into a Shallow Pool

DELLO STESSO AUTORE

Idee rubate al golf: il consolidamento

Pubblicato il 9 giugno 2018 su HiddenGameOfTennis - Traduzione di Edoardo Salvati // Il secondo articolo della serie.

Sara Errani sull’orlo del precipizio

Pubblicato il 17 maggio 2019 su HiddenGameOfTennis - Traduzione di Edoardo Salvati // Nella prima partita degli Internazionali d’Italia, il...

Il fattore campo nel tennis, parte 3 (le conclusioni)

Pubblicato il 26 settembre 2015 su HiddenGameOfTennis - Traduzione di Edoardo Salvati // Nella parte 1 di questa serie, ho...

Sulla scelta di una mina vagante a Wimbledon

Pubblicato il 2 luglio 2017 su HiddenGameOfTennis - Traduzione di Edoardo Salvati // Solitamente, l’idea della mina vagante in un...

Il problema è nella velocità della prima di Zverev?

Pubblicato il 2 luglio 2019 su HiddenGameOfTennis - Traduzione di Edoardo Salvati // Dopo la sconfitta di Alexander Zverev al primo...

Finali Next Gen Gruppo A, le probabilità delle semifinali

Pubblicato il 7 novembre 2018 su HiddenGameOfTennis - Traduzione di Edoardo Salvati // L’ATP ha 11 possibili scenari per le...

Qualche classifica maschile con i dati del Match Charting Project

Pubblicato il 13 agosto 2019 su HiddenGameOfTennis - Traduzione di Edoardo Salvati // In preparazione a un precedente articolo...

Questi giocatori sono simili tra loro?

Pubblicato il 10 ottobre 2018 su HiddenGameOfTennis - Traduzione di Edoardo Salvati // Mentre ero alle prese con un’altra indagine...

Sull’erba i mancini fanno meglio?

Pubblicato il 2 luglio 2015 su HiddenGameOfTennis - Traduzione di Edoardo Salvati // Durante la partita di secondo turno tra...

Un confronto tra i tornei sulla terra battuta della stagione 2018

Pubblicato il 13 agosto 2018 su HiddenGameOfTennis - Traduzione di Edoardo Salvati // In un precedente articolo, ho analizzato alcuni...