Il più grande archivio italiano di analisi statistiche sul tennis professionistico. Parte di Tennis Abstract

Il più grande archivio italiano di analisi statistiche sul tennis professionistico. Parte di Tennis Abstract

La precisione delle previsioni del sistema Elo e la velocità della superficie

ULTIMI ARTICOLI

Prevedere l’esito dei prossimi cinque anni di Slam con la sfera di cristallo

Pubblicato il 16 ottobre 2020 su TennisAbstract - Traduzione di Edoardo Salvati // L’anno scorso, ho creato un modello...

È tornata la discesa a rete?

Pubblicato il 2 ottobre 2020 su StatsOnTheT - Traduzione di Edoardo Salvati // Se guardando il Roland Garros 2020...

Venti non vuol dire sempre venti

Pubblicato il 12 ottobre 2020 su TennisAbstract - Traduzione di Edoardo Salvati // C’è sempre più traffico in cima...

La fortuna del sorteggio: Roland Garros 2020 (donne)

Pubblicato il 25 settembre 2020 su HiddenGameOfTennis - Traduzione di Edoardo Salvati // Come per gli uomini, anche per...

La fortuna del sorteggio: Roland Garros 2020 (uomini)

Pubblicato il 25 settembre 2020 su HiddenGameOfTennis - Traduzione di Edoardo Salvati // Da diversi anni ormai eseguo simulazioni...

Cosa succede al ritmo di gioco con le nuove regole imposte dalla pandemia

Pubblicato il 31 agosto 2020 su TennisAbstract - Traduzione di Edoardo Salvati // La pandemia COVID-19 ha imposto agli...

Che valore assegnamo ai tornei Masters o Premier vinti nella bolla?

Pubblicato il 30 agosto 2020 su TennisAbstract - Traduzione di Edoardo Salvati // Il tennis è ripartito, ma molti...

Mettere un asterisco accanto agli US Open è prematuro, e forse del tutto sbagliato

Pubblicato il 19 agosto 2020 su TennisAbstract - Traduzione di Edoardo Salvati // Ci saranno diverse assenze di alto...

Il circuito femminile post COVID-19 sta rientrando alla normalità

Pubblicato il 17 agosto 2020 su TennisAbstract - Traduzione di Edoardo Salvati // Negli ultimi due tornei femminili, abbiamo...

Il sospetto che Venus e Serena debbano giocare contro troppo spesso è fondato?

Pubblicato il 12 agosto 2020 su TennisAbstract - Traduzione di Edoardo Salvati // Nel torneo di Lexington di questi...

ULTIMI ARTICOLI

Pubblicato il 10 febbraio 2017 su StatsOnTheT – Traduzione di Edoardo Salvati

// Con solo 2 delle prime 8 teste di serie nei quarti di finale degli Australian Open 2017, il primo Slam dell’anno si rivelato un’ecatombe per molti dei modelli predittivi. Anche il sistema di previsioni Elo, uno dei più accurati a disposizione nel tennis, non avrebbe potuto anticipare le condizioni insolite riscontrate quest’anno a Melbourne.

O, forse, avrebbe potuto?

Sappiamo che uno di fattori determinanti per le numerose vittorie a sorpresa è stata una percentuale al servizio più alta del solito. Analizzando il numero di punti vinti in media al servizio per torneo, si può notare negli anni una tendenza incrementale, diffusa tra tutte le superfici. Sul cemento, ad esempio, la percentuale al servizio è aumentata di 3 punti percentuali nell’arco di 20 anni. Quale sia stato l’effetto più rilevante tra superficie, palline o attrezzatura, gli Australian Open 2017 hanno rappresentato un estremo, anche rispetto alle tendenze riscontrate sul circuito.        

IMMAGINE 1 – Tendenze nella frequenza di servizi in campo per l’ATP nel periodo 1991 – 2016

Perché un cambiamento nel vantaggio al servizio dovrebbe influire sull’efficacia predittiva?

Ci sono diverse ragioni per le quali ci si può aspettare che le valutazioni predittive varino, per un determinato torneo, in funzione del livello complessivo di vantaggio al servizio. È possibile che percentuali al servizio sistematicamente migliori riflettano condizioni di gioco, come la velocità della superficie, o uno stile prevalente – scambi corti rispetto a scambi lunghi – che diano maggiori benefici ad alcuni giocatori piuttosto che ad altri.  Ci si chiede se i metodi predittivi classici che ignorano questi fattori dovrebbero invece considerarli.

Possiamo farci un’idea sulla risposta a questo interrogativo cercando di capire se l’errore predittivo è legato alla abilità complessiva al servizio di un giocatore.

Il grafico dell’immagine 2 riporta il valore, su base annua, della radice dell’errore quadratico medio (RMSE) nelle previsioni Elo di ciascun giocatore rispetto all’indice-z del servizio per l’anno di riferimento (nella versione originale è possibile visualizzare i singoli valori puntando il mouse sul grafico, n.d.t.). L’indice-z misura, nell’anno in questione, la prestazione al servizio del giocatore rispetto a un giocatore medio del circuito in unità di deviazione standard, con i valori più negativi che si riferiscono ai giocatori meno bravi al servizio e, viceversa, con i valori più positivi per i giocatori più bravi al servizio.

Evidenti strutture nella relazione tra errore predittivo e servizio

Analizzando tutte le partite del circuito ATP dal 1991 al 2016, troviamo alcune evidenti strutture nella relazione tra errore e servizio. L’RSME tende ad avere il valore più basso, ma anche il più variabile, per i giocatori con il servizio peggiore. Per i giocatori con un servizio medio o appena sopra la media la frequenza di errore aumenta ma la varianza si riduce. All’estremo opposto, dove si trovano giocatori come Ivo Karlovic, l’errore tende a diminuire di nuovo.   

IMMAGINE 2 – Errore predittivo e abilità al servizio

Che indicazioni si possono trarre dalla forma sigmoidale della curva? Un primo aspetto è che sembra suggerire che l’accuratezza abbia un costo, visto che i giocatori servono con percentuali più vicine alla media. I diversi colori rappresentano il vantaggio del servizio per lo specifico torneo. Vista la rilevante sovrapposizione di colori, la forma suggerisce anche che la relazione errore-abilità non subisce una grande variazione da un evento all’altro, cioè, quando si parla di dinamiche di errore, ha più importanza il livello di abilità al servizio del giocatore rispetto al campo in cui si gioca, anche se la particolare superficie di un torneo potrebbe influire sulla bravura al servizio di un giocatore in un momento specifico della stagione.

Elo tende ad attribuire più fiducia a un giocatore

Per verificare se l’errore tende ad assumere un particolare verso, si può analizzare l’errore medio. Il grafico dell’immagine 3 mostra la media delle probabilità di vittoria di un giocatore rispetto alle vittorie effettive raggruppata per giocatore e per anno, come nel grafico precedente. Una differenza positiva suggerisce che il sistema Elo tende a previsioni più ottimistiche. Si nota che, nell’arco di tutti gli indici-z, l’errore è più positivo che negativo, quindi Elo tende ad attribuire maggiore fiducia nelle prestazioni di un giocatore rispetto a quelle effettivamente poi conseguite.    

IMMAGINE 3 – Verso medio di errore nelle previsioni Elo in funzione del vantaggio al servizio

È interessante osservare che il verso dell’errore sembra cambiare in funzione delle percentuali al servizio di un determinato torneo. Mentre l’andamento medio evidenziato in grigio è tipico di molti tornei con frequenza di 0.64 (vale a dire, in media, il 64% di servizi in campo), i tornei sopra a questo livello tendono ad avere una correlazione negativa così che la parzialità si avvicina a zero per i giocatori dal servizio migliore nei tornei con una frequenza di servizi in campo complessivamente più alta. 

Conclusioni

C’è ancora molto da fare per comprendere le cause che determinano queste dinamiche di errore. Almeno per il momento l’analisi suggerisce che ridurre l’errore nei confronti dei giocatori che si pongono nella fascia media di servizio potrebbe essere una strategia importante per migliorare le capacità predittive nel tennis. ◼︎

Elo Prediction Accuracy and Court Pace

DELLO STESSO AUTORE

Verso una nuova distribuzione d’età bimodale agli US Open

Pubblicato il 6 settembre 2019 su StatsOnTheT - Traduzione di Edoardo Salvati // Con due giocatori e due giocatrici...

I 22 miti del tennis di Klaassen & Magnus – Mito 7 (sul doppio fallo)

Pubblicato il 19 aprile 2016 su StatsOnTheT - Traduzione di Edoardo Salvati // Un’analisi del Mito 6.

I 22 miti del tennis di Klaassen & Magnus – Mito 12 (sulla competitività del tennis maschile rispetto a quello femminile)

Pubblicato il 21 maggio 2016 su StatsOnTheT - Traduzione di Edoardo Salvati // Un’analisi del Mito 11.

Di nuovo sull’uso delle statistiche della partita per classificare gli stili di gioco

Pubblicato il 12 aprile 2019 su StatsOnTheT - Traduzione di Edoardo Salvati // In un precedente articolo, ho cercato di...

I 22 miti del tennis di Klaassen & Magnus – Mito 10 (sulla misura della qualità)

Pubblicato l’8 maggio 2016 su StatsOnTheT - Traduzione di Edoardo Salvati // Un’analisi del Mito 9. Dopo...

Chi ha giocato i set a maggiore e minore pressione del 2018?

Pubblicato il 17 novembre 2018 su StatsOnTheT - Traduzione di Edoardo Salvati // Dopo aver introdotto un indice di Pressione...

I 22 miti del tennis di Klaassen & Magnus – Mito 11 (sulle partenze lente)

Pubblicato il 14 maggio 2016 su StatsOnTheT - Traduzione di Edoardo Salvati // Un’analisi del Mito 10.

Le giocatrici con le migliori prospettive per la prima vittoria di uno Slam a Wimbledon

Pubblicato il 22 giugno 2018 su StatsOnTheT - Traduzione di Edoardo Salvati // A pochi giorni dall’inizio di Wimbledon, analizziamo...

Chi è il Giovanissimo Più Forte Di Sempre?

Pubblicato il 18 agosto 2018 su StatsOnTheT - Traduzione di Edoardo Salvati // Dopo che al Canada Masters 2018 Stefanos...

I ritiri non dipendono solo dal caldo

Pubblicato il 4 settembre 2015 su StatsOnTheT - Traduzione di Edoardo Salvati // Nella quarta giornata dell’edizione 2015 degli US...