Il più grande archivio italiano di analisi statistiche sul tennis professionistico. Parte di Tennis Abstract

Probabilmente il più grande archivio italiano di analisi statistiche sul tennis professionistico. Parte di Tennis Abstract

L’ipotesi non indipendente e identicamente distribuito nel tennis

ULTIMI ARTICOLI

ULTIMI ARTICOLI

Pubblicato il 20 marzo 2020 StatsOnTheT – Traduzione di Edoardo Salvati

// In assenza di sport in campo per cause di forza maggiore, c’è più tempo per gli smanettoni dei numeri per scatenarsi. In questo articolo, cerco di rispondere alla domanda che dovrebbe stare a cuore di qualsiasi analista di tennis: ai giocatori si applica l’ipotesi non indipendente e identicamente distribuito (non iid)? Come si possono misurare le conseguenze relative a una situazione non iid? Perché dovrebbe interessarci? E quali sono stati i giocatori più non iid tra i primi 50 della classifica?

In uno dei rari studi di sport a essere pubblicato sul Journal of the American Statistical Association, i due giganti dell’analisi statistica del tennis Franc Klaassen e Jan Magnus si soffermano sull’ipotesi indipendente e identicamente distribuito (iid) per l’esito dei punti nel tennis. Se vi fosse mai capitato di fare una regressione, avrete già applicato l’ipotesi iid. Per un campione casuale di occorrenze, iid è un punto di partenza comodo e ragionevole. Nella fattispecie tennistica, iid è il modo più semplice per intendere la sequenza di punti in una partita. In sostanza, una volta che si conosce la media di punti vinti al servizio dal giocatore in quella partita si ipotizza che ogni punto al servizio sia una prova Bernoulli con la probabilità dell’esito “successo” pari alla probabilità di punti vinti al servizio del giocatore nella partita.

Da un punto di vista dell’analisi statistica, iid è una manna. Se i giocatori sono iid, allora qualsiasi quesito investigativo come vincere un set, vincere un tiebreak o vincere la partita si riduce a una qualche funzione della probabilità di punti vinti al servizio del giocatore.

Cosa succede però se i giocatori non sono iid?

Beh, la situazione si complica. L’ipotesi non iid vorrebbe dire che, in determinati momenti come ad esempio sul 30-30, i giocatori servono sistematicamente meglio o peggio. Dovremmo conoscere nel dettaglio quelle dinamiche per avere anche una speranza di descrivere le probabilità di risultato durante lo svolgimento di una partita.

Se guardando una partita vi è capitato di pensare che un giocatore ha il braccino o ha ceduto alla pressione, vi stavate esprimendo in termi di effetti non iid. Ci si è abituati ormai a vari cambiamenti di fronte nel corso di una partita che è difficile accettare il postulato per cui i giocatori sono iid. Quella che sembra una striscia vincente, o uno scenario sorprendente, è in realtà in linea con le probabilità associate a una sequenza di Bernoulli.

Se è possibile ricavare un insegnamento dallo studio di Klaassen e Magnus, è che la verità sta nel mezzo. Voglio cioè dire che i giocatori non sono iid, ma gli effetti del loro non iid sono molto più contenuti di quanto si potrebbe pensare. Così ridotti infatti che l’ipotesi iid, in molti casi nel tennis, è una descrizione estremamente veritiera dei risultati effettivi. Anche in presenza di effetti circoscritti, almeno nella media, è comunque possibile che alcuni giocatori mostrino un comportamento non iid più accentuato di altri. Quali sono tra quelli attualmente al vertice i giocatori meno iid in assoluto?

Una misura complessiva degli effetti non iid

Un modo per ottenere una misura complessiva degli effetti non iid in una partita è confrontare i game al servizio concretamente vinti da un giocatore con i servizi vinti in base alle previsioni iid. Chiamiamo g la proporzione di servizi vinti concretamente in una partita. Chiamiamo poi p la proporzione di punti vinti al servizio in una partita dal giocatore in esame e q quella del suo avversario. Date le caratteristiche espresse al servizio durante la partita, possiamo usare una simulazione Monte Carlo per calcolare una proporzione attesa di game vinti come ĝ(p,q).

Per fare un esempio pratico, nell’ultima partita prima della sospensione, Novak Djokovic ha vinto il 90% dei game al servizio, con una percentuale di punti vinti al servizio del 70% contro il 58% di Stefanos Tsitsipas. Inserendo probabilità al servizio del 70% e del 58% nel simulatore iid per una partita al meglio dei tre set, si riesce a determinare la stima dei game vinti al servizio per un grande numero di partite simulate.

Ho eseguito questa simulazione per le partite dal 2018 a oggi per tutti i giocatori tra i primi 50 (qualunque sia il significato attuale della classifica). L’immagine 1 mostra i risultati per tutte le partite, con in blu il non iid medio. I giocatori sono in ordine decrescente dall’alto verso il basso da quello con la media non iid più positiva a quello con la media non iid inferiore. Un effetto positivo qui significa che un giocatore ha vinto più game al servizio di quelli attesi rispetto alla sua percentuale di punti vinti al servizio e in ipotesi iid.

IMMAGINE 1 – Effetti non iid in partita per le partite dal 2018 a oggi per gli attuali primi 50 giocatori

Strategie basate sul servizio bomba

Proprio in cima troviamo tre dei giocatori con il servizio più potente: Reilly Opelka, Nick Kyrgios e John Isner. Quale può essere il motivo? Un’interpretazione è che i giocatori che fanno del servizio un colpo fondamentale lo utilizzano come elemento portante di una o due strategie per risolvere con efficacia i momenti più importanti della partita, come i game al servizio molto combattuti o le fasi conclusive. Potrebbe trattarsi di una modalità a disposizione di un giocatore per incrementare il rendimento nei game vinti al servizio, anche se poi la percentuale media di punti vinti al servizio rimane fondamentalmente invariata.

È interessante la presenza di diversi giocatori tra i primi dieci che non si pensa possiedano un servizio particolarmente forte, come ad esempio Pablo Carreno Busta, Jo Wilfried Tsonga o Denis Shapovalov. L’effetto non iid per loro è inferiore ma potrebbe essere dettato comunque dalla stessa strategia.

Anche se per questi giocatori la percentuale complessiva di punti vinti al servizio non è così alta, in ogni caso nei punti importanti al servizio potrebbero adottare una certa strategia o disposizione mentale che determina una divario misurabile tra previsione iid e previsione non iid.

Il caso di Carreno Busta

Nel caso di Carreno Busta, le tre partite con il massimo effetto iid sono terminate in una sconfitta, con i suoi avversari che hanno ottenuto più del 70% dei punti al servizio. Carreno Busta ha vinto più del 90% dei game al servizio in ognuna di quelle partite a dispetto di una percentuale relativamente bassa di punti vinti al servizio.

C’è stata la sconfitta nel 2019 agli Internazionali d’Italia contro Shapovalov, nella quale Carreno Busta ha vinto +17 punti percentuali di game al servizio rispetto alle attese iid. Come la sconfitta, sempre l’anno scorso, allo Shanghai Masters contro Dominic Thiem, nella quale ha vinto +14 punti percentuali delle attese. E la recente sconfitta a Rotterdam contro Felix Auger-Aliassime, nella quale ha vinto +13 punti percentuali. Sono occorrenze che evidenziano come gli effetti non iid potrebbero spiegare situazioni in cui un giocatore è riuscito a gestire egregiamente la pressione al servizio, ma ha comunque poi perso la partita.

La mentalità del campione

Non mi ha sorpreso vedere i Grandi Tre tra i giocatori più sistematici in termini di iid. Significa cioè che sono stati tra i meno influenzati dal contesto. O, detto in altro modo, sono giocatori che affrontano ogni punto come se avesse la stessa importanza, un aspetto che molti attribuiscono alla mentalità del campione. I lettori più attenti avranno notato che ci sono più giocatori dal lato positivo degli effetti non iid che dal lato negativo. Credo che in parte dipenda dal fatto che, considerati i pochi game al servizio giocati in una partita, soprattutto se una al meglio dei tre set, il risultato è più di tipo discreto con limite superiore di 1.

Una simile impostazione potrebbe tornare utile per altri indicatori di rendimento, oltre ai game vinti al servizio, più sensibili agli effetti non iid. L’elenco dei temi legati all’ipotesi non iid che meritano un approfondimento sembra davvero interminabile e di indubbia ispirazione per futuri articoli. ◼︎

Are Top ATP Players Non-IID?

DELLO STESSO AUTORE