Il più grande archivio italiano di analisi statistiche sul tennis professionistico. Parte di Tennis Abstract

Il più grande archivio italiano di analisi statistiche sul tennis professionistico. Parte di Tennis Abstract

I 22 miti del tennis di Klaassen & Magnus – Mito 1 (sull’indipendenza dei punti)

ULTIMI ARTICOLI

È tornata la discesa a rete?

Pubblicato il 2 ottobre 2020 su StatsOnTheT - Traduzione di Edoardo Salvati // Se guardando il Roland Garros 2020...

Venti non vuol dire sempre venti

Pubblicato il 12 ottobre 2020 su TennisAbstract - Traduzione di Edoardo Salvati // C’è sempre più traffico in cima...

La fortuna del sorteggio: Roland Garros 2020 (donne)

Pubblicato il 25 settembre 2020 su HiddenGameOfTennis - Traduzione di Edoardo Salvati // Come per gli uomini, anche per...

La fortuna del sorteggio: Roland Garros 2020 (uomini)

Pubblicato il 25 settembre 2020 su HiddenGameOfTennis - Traduzione di Edoardo Salvati // Da diversi anni ormai eseguo simulazioni...

Cosa succede al ritmo di gioco con le nuove regole imposte dalla pandemia

Pubblicato il 31 agosto 2020 su TennisAbstract - Traduzione di Edoardo Salvati // La pandemia COVID-19 ha imposto agli...

Che valore assegnamo ai tornei Masters o Premier vinti nella bolla?

Pubblicato il 30 agosto 2020 su TennisAbstract - Traduzione di Edoardo Salvati // Il tennis è ripartito, ma molti...

Mettere un asterisco accanto agli US Open è prematuro, e forse del tutto sbagliato

Pubblicato il 19 agosto 2020 su TennisAbstract - Traduzione di Edoardo Salvati // Ci saranno diverse assenze di alto...

Il circuito femminile post COVID-19 sta rientrando alla normalità

Pubblicato il 17 agosto 2020 su TennisAbstract - Traduzione di Edoardo Salvati // Negli ultimi due tornei femminili, abbiamo...

Il sospetto che Venus e Serena debbano giocare contro troppo spesso è fondato?

Pubblicato il 12 agosto 2020 su TennisAbstract - Traduzione di Edoardo Salvati // Nel torneo di Lexington di questi...

Effetti della pandemia nel torneo di Palermo?

Pubblicato il 10 agosto 2020 su TennisAbstract - Traduzione di Edoardo Salvati // È più difficile fare previsioni sullo...

ULTIMI ARTICOLI

Pubblicato il 14 febbraio 2016 su StatsOnTheT – Traduzione di Edoardo Salvati

// I libri di statistiche sul tennis sono talmente rari che si nota immediatamente quando ne appare uno.

Klaassen, Magnus, Wimbledon

Tra le più recenti di queste misteriose creature vi è Analyzing Wimbledon di Franc Klaassen e Jan Magnus. Pur ricoprendo primari incarichi in dipartimenti di studi economici, Klaassen e Magnus hanno scritto alcune delle più erudite analisi matematiche sul tennis. Analyzing Wimbledon è una raccolta dei risultati prodotti dalla loro lunga collaborazione, riassunta in un elenco di 22 miti legati al tennis. Lo stile è molto più leggero di un testo accademico (per quanto, nella sua essenza, sempre abbastanza tecnico) ed è una lettura obbligata per qualsiasi appassionato di tennis mosso da curiosità investigativa.

Come suggerisce il titolo, Analyzing Wimbledon utilizza dati relativi solo al più prestigioso dei tornei dello Slam e in larga parte dei primi anni novanta. Credo che sia una scelta dettata dalla convenienza, o forse i due autori hanno un debole per il gioco sull’erba (e potrebbero dover ringraziare il connazionale Richard Krajicek per questo). Quale la ragione, ci si chiede in che modo i risultati ottenuti con i dati di Wimbledon negli anni ’90 possano essere applicati all’attuale era del gioco da fondo sviluppato principalmente su campi in cemento e in terra.

L’obiettivo è quello di dedicare a ognuno dei 22 miti di Klaassen e Magnus uno (o più) articoli che ne rivisitino il contenuto e provare a vedere, nel caso i dati pubblicamente disponibili lo consentano, se i risultati degli anni ’90 possano andare bene anche per il gioco di oggi. Iniziamo con il Mito 1.

Mito 1: “Vincere un punto al servizio è un processo di tipo iid”

Il primo mito è probabilmente uno dei più impegnativi da affrontare, ma anche quello che ha senso analizzare da subito perché ha ripercussioni su molti dei successivi. La sigla “iid” fa parte del gergo statistico ed è l’abbreviazione di indipendente e identicamente distribuito. In riferimento a vincere un punto al servizio, dire che il risultato del punto è “iid” significa effettivamente affermare che ogni servizio è come il lancio di una moneta con probabilità associate a un certo giocatore o a una specifica partita. Perché un lancio di moneta? L’ipotesi è che il risultato di un punto non influenzi quello di un altro e la probabilità di vincerlo o di perderlo resti sempre la medesima.

Se il mito 1 è vero, vorrebbe dire che i giocatori giocano ogni punto praticamente allo stesso modo. Quindi non ci sarebbe un vantaggio psicologico (violazione dell’indipendenza) o il subire la pressione (violazione della probabilità di vittoria costante). In altre parole, per giocare in modalità iid un giocatore dovrebbe mostrare un livello assoluto di imperturbabilità che anche Bjorn Borg avrebbe trovato difficile da raggiungere.

Tre modi di violazione della veridicità del mito

Credo che molti appassionati di tennis sospettino che il Mito 1 sia sbagliato. Ci sono tre modi per i quali potrebbe esserlo: i punti potrebbero essere dipendenti, i punti potrebbero essere distribuiti differentemente, o entrambe le caratteristiche. Cosa hanno concluso quindi Klaassen e Magnus e come lo hanno fatto? Per testare l’indipendenza dei punti, i due autori hanno verificato se vincere il punto precedente influenzasse le probabilità di vincere il successivo. Utilizzando una regressione con i dati delle edizioni di Wimbledon degli anni ’90, hanno trovato che la vittoria del punto precedente era associata a un aumento della probabilità che il giocatore al servizio vincesse il punto successivo. E questo è il primo colpo inferto al modello iid.

Per testare la distribuzione costante dei punti, Klaassen e Magnus hanno fatto un simile test di associazione, questa volta utilizzando i punti più importanti (secondo la misurazione dell’importanza di un punto formulata da Carl Morris). Nuovamente, hanno trovato che i giocatori subivano i punti più importanti giocando con minore efficacia all’aumentare della pressione. Questo risultato ci porta a concludere che la modalità di gioco iid probabilmente non è stata una rappresentazione veritiera del tennis giocato in passato. Strike numero 2!

Le deviazioni da iid però sono sufficientemente significative?

Klaassen e Magnus pensano che non lo siano perché in passato, quando hanno ipotizzato che i giocatori o le giocatrici giocassero secondo la modalità iid, il modello iid ha restituito una buona approssimazione della frequenza di vincita di un punto al servizio.

Questo sembra sorprendente, considerando quanto spesso si parli di aspetto mentale nel tennis. Se il modello iid è un’ottima approssimazione della realtà, esso suggerirebbe che l’aspetto mentale non è un fattore così rilevante ai fini del risultato di una partita. Le conclusioni di Klaassen e Magnus possono essere corrette? E si applicano al tennis moderno?

Rivisitare il Mito 1 rispetto al tennis moderno

Non è difficile affrontare il Mito 1. Con un campione sufficientemente grande di punti e un numero di situazioni tennistiche altrettanto ampio (ad esempio tiebreak, punti sul 30-30, primi punti di un game, etc.) è sempre possibile trovare circostanze di una partita nelle quali la probabilità di vincita sul servizio subisce un cambiamento statisticamente significativo. Più importante e interessante però diventa la rilevanza pratica di questo cambiamento, che ci dice se qualsiasi differenza riscontrata sia in effetti sufficientemente importante da suggerire un possibile diverso risultato per un game, un set o per la partita, rispetto a ipotizzare di base che l’andamento seguirà il modello iid.

Per una semplice analisi dei due aspetti del Mito 1 (indipendenza da un lato e identica distribuzione dall’altro) si può considerare:

  • come i giocatori moderni siano influenzati dal risultato del punto precedente
  • come i giocatori gestiscano la pressione sui punti più importanti.

L’immagine 1 mostra l’influenza che il risultato del punto precedente ha avuto sui giocatori nei tornei Slam 2015, per 150.000 punti giocati (nella versione originale è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). Si nota come per i giocatori ATP e per le giocatrici WTA esista evidenza di un leggero vantaggio psicologico derivante dall’aver vinto il punto precedente: un po’ di mano calda, se così si può dire.

Le differenze per uomini e donne

In entrambi i circuiti, questa spinta equivale a una differenza di 1 punto percentuale, quindi la probabilità di vincere il punto al servizio dopo aver vinto il punto precedente è l’1% maggiore che se il punto precedente fosse stato perso. Nel tennis moderno, i punti non sembrano comportarsi indipendentemente.

IMMAGINE 1 – Influenza del risultato del punto precedente nei tornei Slam 2015

km_1

Per il test successivo, quello dei punti più importanti, utilizziamo le palle break per definire gli scenari in cui la pressione è maggiore. L’immagine 2 mostra come i giocatori siano meno efficaci nel momento in cui devono fronteggiare una palla break rispetto ad altri punti. La differenza osservata è stata del 2.5% per i giocatori ATP e dell’1% per le giocatrici WTA. Queste suggerisce che, nel tennis moderno, i punti non sono nemmeno identicamente distribuiti.

IMMAGINE 2 – Gestione della pressione sui punti più importanti nei tornei Slam 2015

km_2

Rimane aperto l’interrogativo sulla significatività di queste differenze.

Quanto è rilevante lo scostamento di uno o due punti percentuali nella capacita di vincere al servizio?

Nel caso di un singolo punto, probabilmente poco o nulla, ma quando si considerano tutti i punti che vengono giocati in una partita, la deviazione cumulativa potrebbe diventare rilevante. Se si è davvero interessati a comprendere le differenze che influenzano il risultato finale di una partita, un valido campo d’indagine è l’analisi del differenziale nelle prestazioni al servizio tra vincitori e sconfitti delle partite degli Slam.

L’immagine 3 mostra questo confronto ed evidenzia come la separazione tra le due categorie sia stata in media di 10 punti percentuali per entrambi i circuiti. Questo assegna alle deviazioni iid considerate (ma in nessun modo esaustive) circa il 20% dell’importanza della differenza che determina il vincitore e lo sconfitto in una partita: non una differenza imponente, ma neanche una su cui soprassedere.

IMMAGINE 3 – Differenza nei punti vinti tra vincitore e sconfitto di una partita

km_3

Questa è una semplice rivisitazione del Mito 1 del libro di Klaassen e Magnus. Non ho tenuto conto di altri effetti dinamici o di come il cambiamento nella difficoltà dei colpi potrebbe spiegare alcune delle variazioni osservate nelle prestazioni al servizio.

Almeno a un primo sguardo, sembra che le deviazioni dal modello iid potrebbero essere più significative per il tennis attuale che per quello di vent’anni fa. Ma questo non toglie certamente validità al modello stesso. ◼︎

Klaassen & Magnus’s 22 Myths of Tennis— Myth 1

DELLO STESSO AUTORE

I 22 miti del tennis di Klaassen & Magnus – Mito 12 (sulla competitività del tennis maschile rispetto a quello femminile)

Pubblicato il 21 maggio 2016 su StatsOnTheT - Traduzione di Edoardo Salvati // Un’analisi del Mito 11.

Una visualizzazione della qualità dei colpi

Pubblicato il 20 ottobre 2017 su StatsOnTheT - Traduzione di Edoardo Salvati // Se si potesse misurare la qualità di...

Il movimento analitico del tennis celebra il linguaggio R a Cape Town

Pubblicato il 18 marzo 2018 su StatsOnTheT - Traduzione di Edoardo Salvati // Mentre all’Indian Wells Masters andava in scena...

Djokovic torna numero 1, ma non ha smesso di salire

Pubblicato il 2 novembre 2018 su StatsOnTheT - Traduzione di Edoardo Salvati // Non si è quasi parlato di altro...

I 22 miti del tennis di Klaassen & Magnus – Mito 7 (sul doppio fallo)

Pubblicato il 19 aprile 2016 su StatsOnTheT - Traduzione di Edoardo Salvati // Un’analisi del Mito 6.

I 22 miti del tennis di Klaassen & Magnus – Mito 5 (ancora sull’importanza dei punti)

Pubblicato il 4 aprile 2016 su StatsOnTheT - Traduzione di Edoardo Salvati // Un’analisi del Mito 4.

Le serie conseguenze che subiscono i giocatori più forti di fronte a troppo tennis

Pubblicato il 19 gennaio 2018 su TheConversation - Traduzione di Edoardo Salvati // In molti guardavano agli Australian Open...

Di nuovo sull’uso delle statistiche della partita per classificare gli stili di gioco

Pubblicato il 12 aprile 2019 su StatsOnTheT - Traduzione di Edoardo Salvati // In un precedente articolo, ho cercato di...

I giocatori migliori al servizio e alla risposta nel 2017

Pubblicato il 2 dicembre 2017 su StatsOnTheT - Traduzione di Edoardo Salvati // Qual è stato il miglior giocatore al...

Chi è migliorato di più tra le teste di serie del Roland Garros 2018

Pubblicato il 26 maggio 2018 su StatsOnTheT - Traduzione di Edoardo Salvati // Con l’inizio del secondo Slam della stagione,...