Il più grande archivio italiano di analisi statistiche sul tennis professionistico. Parte di Tennis Abstract

Probabilmente il più grande archivio italiano di analisi statistiche sul tennis professionistico. Parte di Tennis Abstract

I 22 miti del tennis di Klaassen & Magnus – Mito 1 (sull’indipendenza dei punti)

ULTIMI ARTICOLI

ULTIMI ARTICOLI

Pubblicato il 14 febbraio 2016 su StatsOnTheT – Traduzione di Edoardo Salvati

// I libri di statistiche sul tennis sono talmente rari che si nota immediatamente quando ne appare uno.

Klaassen, Magnus, Wimbledon

Tra le più recenti di queste misteriose creature vi è Analyzing Wimbledon di Franc Klaassen e Jan Magnus. Pur ricoprendo primari incarichi in dipartimenti di studi economici, Klaassen e Magnus hanno scritto alcune delle più erudite analisi matematiche sul tennis. Analyzing Wimbledon è una raccolta dei risultati prodotti dalla loro lunga collaborazione, riassunta in un elenco di 22 miti legati al tennis. Lo stile è molto più leggero di un testo accademico (per quanto, nella sua essenza, sempre abbastanza tecnico) ed è una lettura obbligata per qualsiasi appassionato di tennis mosso da curiosità investigativa.

Come suggerisce il titolo, Analyzing Wimbledon utilizza dati relativi solo al più prestigioso dei tornei dello Slam e in larga parte dei primi anni novanta. Credo che sia una scelta dettata dalla convenienza, o forse i due autori hanno un debole per il gioco sull’erba (e potrebbero dover ringraziare il connazionale Richard Krajicek per questo). Quale la ragione, ci si chiede in che modo i risultati ottenuti con i dati di Wimbledon negli anni ’90 possano essere applicati all’attuale era del gioco da fondo sviluppato principalmente su campi in cemento e in terra.

L’obiettivo è quello di dedicare a ognuno dei 22 miti di Klaassen e Magnus uno (o più) articoli che ne rivisitino il contenuto e provare a vedere, nel caso i dati pubblicamente disponibili lo consentano, se i risultati degli anni ’90 possano andare bene anche per il gioco di oggi. Iniziamo con il Mito 1.

Mito 1: “Vincere un punto al servizio è un processo di tipo iid”

Il primo mito è probabilmente uno dei più impegnativi da affrontare, ma anche quello che ha senso analizzare da subito perché ha ripercussioni su molti dei successivi. La sigla “iid” fa parte del gergo statistico ed è l’abbreviazione di indipendente e identicamente distribuito. In riferimento a vincere un punto al servizio, dire che il risultato del punto è “iid” significa effettivamente affermare che ogni servizio è come il lancio di una moneta con probabilità associate a un certo giocatore o a una specifica partita. Perché un lancio di moneta? L’ipotesi è che il risultato di un punto non influenzi quello di un altro e la probabilità di vincerlo o di perderlo resti sempre la medesima.

Se il mito 1 è vero, vorrebbe dire che i giocatori giocano ogni punto praticamente allo stesso modo. Quindi non ci sarebbe un vantaggio psicologico (violazione dell’indipendenza) o il subire la pressione (violazione della probabilità di vittoria costante). In altre parole, per giocare in modalità iid un giocatore dovrebbe mostrare un livello assoluto di imperturbabilità che anche Bjorn Borg avrebbe trovato difficile da raggiungere.

Tre modi di violazione della veridicità del mito

Credo che molti appassionati di tennis sospettino che il Mito 1 sia sbagliato. Ci sono tre modi per i quali potrebbe esserlo: i punti potrebbero essere dipendenti, i punti potrebbero essere distribuiti differentemente, o entrambe le caratteristiche. Cosa hanno concluso quindi Klaassen e Magnus e come lo hanno fatto? Per testare l’indipendenza dei punti, i due autori hanno verificato se vincere il punto precedente influenzasse le probabilità di vincere il successivo. Utilizzando una regressione con i dati delle edizioni di Wimbledon degli anni ’90, hanno trovato che la vittoria del punto precedente era associata a un aumento della probabilità che il giocatore al servizio vincesse il punto successivo. E questo è il primo colpo inferto al modello iid.

Per testare la distribuzione costante dei punti, Klaassen e Magnus hanno fatto un simile test di associazione, questa volta utilizzando i punti più importanti (secondo la misurazione dell’importanza di un punto formulata da Carl Morris). Nuovamente, hanno trovato che i giocatori subivano i punti più importanti giocando con minore efficacia all’aumentare della pressione. Questo risultato ci porta a concludere che la modalità di gioco iid probabilmente non è stata una rappresentazione veritiera del tennis giocato in passato. Strike numero 2!

Le deviazioni da iid però sono sufficientemente significative?

Klaassen e Magnus pensano che non lo siano perché in passato, quando hanno ipotizzato che i giocatori o le giocatrici giocassero secondo la modalità iid, il modello iid ha restituito una buona approssimazione della frequenza di vincita di un punto al servizio.

Questo sembra sorprendente, considerando quanto spesso si parli di aspetto mentale nel tennis. Se il modello iid è un’ottima approssimazione della realtà, esso suggerirebbe che l’aspetto mentale non è un fattore così rilevante ai fini del risultato di una partita. Le conclusioni di Klaassen e Magnus possono essere corrette? E si applicano al tennis moderno?

Rivisitare il Mito 1 rispetto al tennis moderno

Non è difficile affrontare il Mito 1. Con un campione sufficientemente grande di punti e un numero di situazioni tennistiche altrettanto ampio (ad esempio tiebreak, punti sul 30-30, primi punti di un game, etc.) è sempre possibile trovare circostanze di una partita nelle quali la probabilità di vincita sul servizio subisce un cambiamento statisticamente significativo. Più importante e interessante però diventa la rilevanza pratica di questo cambiamento, che ci dice se qualsiasi differenza riscontrata sia in effetti sufficientemente importante da suggerire un possibile diverso risultato per un game, un set o per la partita, rispetto a ipotizzare di base che l’andamento seguirà il modello iid.

Per una semplice analisi dei due aspetti del Mito 1 (indipendenza da un lato e identica distribuzione dall’altro) si può considerare:

  • come i giocatori moderni siano influenzati dal risultato del punto precedente
  • come i giocatori gestiscano la pressione sui punti più importanti.

L’immagine 1 mostra l’influenza che il risultato del punto precedente ha avuto sui giocatori nei tornei Slam 2015, per 150.000 punti giocati (nella versione originale è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). Si nota come per i giocatori ATP e per le giocatrici WTA esista evidenza di un leggero vantaggio psicologico derivante dall’aver vinto il punto precedente: un po’ di mano calda, se così si può dire.

Le differenze per uomini e donne

In entrambi i circuiti, questa spinta equivale a una differenza di 1 punto percentuale, quindi la probabilità di vincere il punto al servizio dopo aver vinto il punto precedente è l’1% maggiore che se il punto precedente fosse stato perso. Nel tennis moderno, i punti non sembrano comportarsi indipendentemente.

IMMAGINE 1 – Influenza del risultato del punto precedente nei tornei Slam 2015

km_1

Per il test successivo, quello dei punti più importanti, utilizziamo le palle break per definire gli scenari in cui la pressione è maggiore. L’immagine 2 mostra come i giocatori siano meno efficaci nel momento in cui devono fronteggiare una palla break rispetto ad altri punti. La differenza osservata è stata del 2.5% per i giocatori ATP e dell’1% per le giocatrici WTA. Queste suggerisce che, nel tennis moderno, i punti non sono nemmeno identicamente distribuiti.

IMMAGINE 2 – Gestione della pressione sui punti più importanti nei tornei Slam 2015

km_2

Rimane aperto l’interrogativo sulla significatività di queste differenze.

Quanto è rilevante lo scostamento di uno o due punti percentuali nella capacita di vincere al servizio?

Nel caso di un singolo punto, probabilmente poco o nulla, ma quando si considerano tutti i punti che vengono giocati in una partita, la deviazione cumulativa potrebbe diventare rilevante. Se si è davvero interessati a comprendere le differenze che influenzano il risultato finale di una partita, un valido campo d’indagine è l’analisi del differenziale nelle prestazioni al servizio tra vincitori e sconfitti delle partite degli Slam.

L’immagine 3 mostra questo confronto ed evidenzia come la separazione tra le due categorie sia stata in media di 10 punti percentuali per entrambi i circuiti. Questo assegna alle deviazioni iid considerate (ma in nessun modo esaustive) circa il 20% dell’importanza della differenza che determina il vincitore e lo sconfitto in una partita: non una differenza imponente, ma neanche una su cui soprassedere.

IMMAGINE 3 – Differenza nei punti vinti tra vincitore e sconfitto di una partita

km_3

Questa è una semplice rivisitazione del Mito 1 del libro di Klaassen e Magnus. Non ho tenuto conto di altri effetti dinamici o di come il cambiamento nella difficoltà dei colpi potrebbe spiegare alcune delle variazioni osservate nelle prestazioni al servizio.

Almeno a un primo sguardo, sembra che le deviazioni dal modello iid potrebbero essere più significative per il tennis attuale che per quello di vent’anni fa. Ma questo non toglie certamente validità al modello stesso. ◼︎

Klaassen & Magnus’s 22 Myths of Tennis— Myth 1

DELLO STESSO AUTORE