Il più grande archivio italiano di analisi statistiche sul tennis professionistico. Parte di Tennis Abstract

Il più grande archivio italiano di analisi statistiche sul tennis professionistico. Parte di Tennis Abstract

L’ipotesi non indipendente e identicamente distribuito nel tennis

ULTIMI ARTICOLI

Prevedere l’esito dei prossimi cinque anni di Slam con la sfera di cristallo

Pubblicato il 16 ottobre 2020 su TennisAbstract - Traduzione di Edoardo Salvati // L’anno scorso, ho creato un modello...

È tornata la discesa a rete?

Pubblicato il 2 ottobre 2020 su StatsOnTheT - Traduzione di Edoardo Salvati // Se guardando il Roland Garros 2020...

Venti non vuol dire sempre venti

Pubblicato il 12 ottobre 2020 su TennisAbstract - Traduzione di Edoardo Salvati // C’è sempre più traffico in cima...

La fortuna del sorteggio: Roland Garros 2020 (donne)

Pubblicato il 25 settembre 2020 su HiddenGameOfTennis - Traduzione di Edoardo Salvati // Come per gli uomini, anche per...

La fortuna del sorteggio: Roland Garros 2020 (uomini)

Pubblicato il 25 settembre 2020 su HiddenGameOfTennis - Traduzione di Edoardo Salvati // Da diversi anni ormai eseguo simulazioni...

Cosa succede al ritmo di gioco con le nuove regole imposte dalla pandemia

Pubblicato il 31 agosto 2020 su TennisAbstract - Traduzione di Edoardo Salvati // La pandemia COVID-19 ha imposto agli...

Che valore assegnamo ai tornei Masters o Premier vinti nella bolla?

Pubblicato il 30 agosto 2020 su TennisAbstract - Traduzione di Edoardo Salvati // Il tennis è ripartito, ma molti...

Mettere un asterisco accanto agli US Open è prematuro, e forse del tutto sbagliato

Pubblicato il 19 agosto 2020 su TennisAbstract - Traduzione di Edoardo Salvati // Ci saranno diverse assenze di alto...

Il circuito femminile post COVID-19 sta rientrando alla normalità

Pubblicato il 17 agosto 2020 su TennisAbstract - Traduzione di Edoardo Salvati // Negli ultimi due tornei femminili, abbiamo...

Il sospetto che Venus e Serena debbano giocare contro troppo spesso è fondato?

Pubblicato il 12 agosto 2020 su TennisAbstract - Traduzione di Edoardo Salvati // Nel torneo di Lexington di questi...

ULTIMI ARTICOLI

Pubblicato il 20 marzo 2020 StatsOnTheT – Traduzione di Edoardo Salvati

// In assenza di sport in campo per cause di forza maggiore, c’è più tempo per gli smanettoni dei numeri per scatenarsi. In questo articolo, cerco di rispondere alla domanda che dovrebbe stare a cuore di qualsiasi analista di tennis: ai giocatori si applica l’ipotesi non indipendente e identicamente distribuito (non iid)? Come si possono misurare le conseguenze relative a una situazione non iid? Perché dovrebbe interessarci? E quali sono stati i giocatori più non iid tra i primi 50 della classifica?

In uno dei rari studi di sport a essere pubblicato sul Journal of the American Statistical Association, i due giganti dell’analisi statistica del tennis Franc Klaassen e Jan Magnus si soffermano sull’ipotesi indipendente e identicamente distribuito (iid) per l’esito dei punti nel tennis. Se vi fosse mai capitato di fare una regressione, avrete già applicato l’ipotesi iid. Per un campione casuale di occorrenze, iid è un punto di partenza comodo e ragionevole. Nella fattispecie tennistica, iid è il modo più semplice per intendere la sequenza di punti in una partita. In sostanza, una volta che si conosce la media di punti vinti al servizio dal giocatore in quella partita si ipotizza che ogni punto al servizio sia una prova Bernoulli con la probabilità dell’esito “successo” pari alla probabilità di punti vinti al servizio del giocatore nella partita.

Da un punto di vista dell’analisi statistica, iid è una manna. Se i giocatori sono iid, allora qualsiasi quesito investigativo come vincere un set, vincere un tiebreak o vincere la partita si riduce a una qualche funzione della probabilità di punti vinti al servizio del giocatore.

Cosa succede però se i giocatori non sono iid?

Beh, la situazione si complica. L’ipotesi non iid vorrebbe dire che, in determinati momenti come ad esempio sul 30-30, i giocatori servono sistematicamente meglio o peggio. Dovremmo conoscere nel dettaglio quelle dinamiche per avere anche una speranza di descrivere le probabilità di risultato durante lo svolgimento di una partita.

Se guardando una partita vi è capitato di pensare che un giocatore ha il braccino o ha ceduto alla pressione, vi stavate esprimendo in termi di effetti non iid. Ci si è abituati ormai a vari cambiamenti di fronte nel corso di una partita che è difficile accettare il postulato per cui i giocatori sono iid. Quella che sembra una striscia vincente, o uno scenario sorprendente, è in realtà in linea con le probabilità associate a una sequenza di Bernoulli.

Se è possibile ricavare un insegnamento dallo studio di Klaassen e Magnus, è che la verità sta nel mezzo. Voglio cioè dire che i giocatori non sono iid, ma gli effetti del loro non iid sono molto più contenuti di quanto si potrebbe pensare. Così ridotti infatti che l’ipotesi iid, in molti casi nel tennis, è una descrizione estremamente veritiera dei risultati effettivi. Anche in presenza di effetti circoscritti, almeno nella media, è comunque possibile che alcuni giocatori mostrino un comportamento non iid più accentuato di altri. Quali sono tra quelli attualmente al vertice i giocatori meno iid in assoluto?

Una misura complessiva degli effetti non iid

Un modo per ottenere una misura complessiva degli effetti non iid in una partita è confrontare i game al servizio concretamente vinti da un giocatore con i servizi vinti in base alle previsioni iid. Chiamiamo g la proporzione di servizi vinti concretamente in una partita. Chiamiamo poi p la proporzione di punti vinti al servizio in una partita dal giocatore in esame e q quella del suo avversario. Date le caratteristiche espresse al servizio durante la partita, possiamo usare una simulazione Monte Carlo per calcolare una proporzione attesa di game vinti come ĝ(p,q).

Per fare un esempio pratico, nell’ultima partita prima della sospensione, Novak Djokovic ha vinto il 90% dei game al servizio, con una percentuale di punti vinti al servizio del 70% contro il 58% di Stefanos Tsitsipas. Inserendo probabilità al servizio del 70% e del 58% nel simulatore iid per una partita al meglio dei tre set, si riesce a determinare la stima dei game vinti al servizio per un grande numero di partite simulate.

Ho eseguito questa simulazione per le partite dal 2018 a oggi per tutti i giocatori tra i primi 50 (qualunque sia il significato attuale della classifica). L’immagine 1 mostra i risultati per tutte le partite, con in blu il non iid medio. I giocatori sono in ordine decrescente dall’alto verso il basso da quello con la media non iid più positiva a quello con la media non iid inferiore. Un effetto positivo qui significa che un giocatore ha vinto più game al servizio di quelli attesi rispetto alla sua percentuale di punti vinti al servizio e in ipotesi iid.

IMMAGINE 1 – Effetti non iid in partita per le partite dal 2018 a oggi per gli attuali primi 50 giocatori

Strategie basate sul servizio bomba

Proprio in cima troviamo tre dei giocatori con il servizio più potente: Reilly Opelka, Nick Kyrgios e John Isner. Quale può essere il motivo? Un’interpretazione è che i giocatori che fanno del servizio un colpo fondamentale lo utilizzano come elemento portante di una o due strategie per risolvere con efficacia i momenti più importanti della partita, come i game al servizio molto combattuti o le fasi conclusive. Potrebbe trattarsi di una modalità a disposizione di un giocatore per incrementare il rendimento nei game vinti al servizio, anche se poi la percentuale media di punti vinti al servizio rimane fondamentalmente invariata.

È interessante la presenza di diversi giocatori tra i primi dieci che non si pensa possiedano un servizio particolarmente forte, come ad esempio Pablo Carreno Busta, Jo Wilfried Tsonga o Denis Shapovalov. L’effetto non iid per loro è inferiore ma potrebbe essere dettato comunque dalla stessa strategia.

Anche se per questi giocatori la percentuale complessiva di punti vinti al servizio non è così alta, in ogni caso nei punti importanti al servizio potrebbero adottare una certa strategia o disposizione mentale che determina una divario misurabile tra previsione iid e previsione non iid.

Il caso di Carreno Busta

Nel caso di Carreno Busta, le tre partite con il massimo effetto iid sono terminate in una sconfitta, con i suoi avversari che hanno ottenuto più del 70% dei punti al servizio. Carreno Busta ha vinto più del 90% dei game al servizio in ognuna di quelle partite a dispetto di una percentuale relativamente bassa di punti vinti al servizio.

C’è stata la sconfitta nel 2019 agli Internazionali d’Italia contro Shapovalov, nella quale Carreno Busta ha vinto +17 punti percentuali di game al servizio rispetto alle attese iid. Come la sconfitta, sempre l’anno scorso, allo Shanghai Masters contro Dominic Thiem, nella quale ha vinto +14 punti percentuali delle attese. E la recente sconfitta a Rotterdam contro Felix Auger-Aliassime, nella quale ha vinto +13 punti percentuali. Sono occorrenze che evidenziano come gli effetti non iid potrebbero spiegare situazioni in cui un giocatore è riuscito a gestire egregiamente la pressione al servizio, ma ha comunque poi perso la partita.

La mentalità del campione

Non mi ha sorpreso vedere i Grandi Tre tra i giocatori più sistematici in termini di iid. Significa cioè che sono stati tra i meno influenzati dal contesto. O, detto in altro modo, sono giocatori che affrontano ogni punto come se avesse la stessa importanza, un aspetto che molti attribuiscono alla mentalità del campione. I lettori più attenti avranno notato che ci sono più giocatori dal lato positivo degli effetti non iid che dal lato negativo. Credo che in parte dipenda dal fatto che, considerati i pochi game al servizio giocati in una partita, soprattutto se una al meglio dei tre set, il risultato è più di tipo discreto con limite superiore di 1.

Una simile impostazione potrebbe tornare utile per altri indicatori di rendimento, oltre ai game vinti al servizio, più sensibili agli effetti non iid. L’elenco dei temi legati all’ipotesi non iid che meritano un approfondimento sembra davvero interminabile e di indubbia ispirazione per futuri articoli. ◼︎

Are Top ATP Players Non-IID?

DELLO STESSO AUTORE

I 22 miti del tennis di Klaassen & Magnus – Mito 18 (sul servire con palline nuove)

Pubblicato l’8 luglio 2016 su StatsOnTheT - Traduzione di Edoardo Salvati // Un’analisi del Mito 17. Per...

Chi vince e chi perde in caso di sospensione della classifica

Pubblicato il 13 marzo 2020 su StatsOnTheT - Traduzione di Edoardo Salvati // L’annuncio di una sospensione di sei...

Chi è migliorato di più tra le teste di serie del Roland Garros 2018

Pubblicato il 26 maggio 2018 su StatsOnTheT - Traduzione di Edoardo Salvati // Con l’inizio del secondo Slam della stagione,...

Le previsioni Elo migliorano includendo Future e Challenger?

Pubblicato il 25 febbraio 2017 su StatsOnTheT - Traduzione di Edoardo Salvati // Considerata la stratificazione di tornei...

Il metodo migliore per determinare la pressione al servizio

Pubblicato il 29 gennaio 2019 su StatsOnTheT - Traduzione di Edoardo Salvati // La pressione è uno di quegli aspetti...

Previsioni per il Roland Garros 2018

Pubblicato il 26 maggio 2018 su StatsOnTheT - Traduzione di Edoardo Salvati // L’inizio del Roland Garros 2018 è ormai...

I 22 miti del tennis di Klaassen & Magnus – Mito 21 (sugli effetti del sentirsi vincenti)

Pubblicato il 30 luglio 2016 su StatsOnTheT - Traduzione di Edoardo Salvati // Un’analisi del Mito 20.

L’evoluzione di Zverev sulla terra battuta

Pubblicato il 18 maggio 2018 su StatsOnTheT - Traduzione di Edoardo Salvati // Alexander Zverev non è riuscito a difendere...

Previsioni per il Miami Masters 2018

Pubblicato il 21 marzo 2018 su StatsOnTheT - Traduzione di Edoardo Salvati // Dopo un avvio di stagione praticamente perfetto,...

Chi ha reso di più sotto pressione negli Slam 2019?

Pubblicato il 19 novembre 2019 su StatsOnTheT - Traduzione di Edoardo Salvati // In un precedente articolo ho esaminato...