Il più grande archivio italiano di analisi statistiche sul tennis professionistico. Parte di Tennis Abstract

Il più grande archivio italiano di analisi statistiche sul tennis professionistico. Parte di Tennis Abstract

Di nuovo sull’uso delle statistiche della partita per classificare gli stili di gioco

ULTIMI ARTICOLI

Venti non vuol dire sempre venti

Pubblicato il 12 ottobre 2020 su TennisAbstract - Traduzione di Edoardo Salvati // C’è sempre più traffico in cima...

La fortuna del sorteggio: Roland Garros 2020 (donne)

Pubblicato il 25 settembre 2020 su HiddenGameOfTennis - Traduzione di Edoardo Salvati // Come per gli uomini, anche per...

La fortuna del sorteggio: Roland Garros 2020 (uomini)

Pubblicato il 25 settembre 2020 su HiddenGameOfTennis - Traduzione di Edoardo Salvati // Da diversi anni ormai eseguo simulazioni...

Cosa succede al ritmo di gioco con le nuove regole imposte dalla pandemia

Pubblicato il 31 agosto 2020 su TennisAbstract - Traduzione di Edoardo Salvati // La pandemia COVID-19 ha imposto agli...

Che valore assegnamo ai tornei Masters o Premier vinti nella bolla?

Pubblicato il 30 agosto 2020 su TennisAbstract - Traduzione di Edoardo Salvati // Il tennis è ripartito, ma molti...

Mettere un asterisco accanto agli US Open è prematuro, e forse del tutto sbagliato

Pubblicato il 19 agosto 2020 su TennisAbstract - Traduzione di Edoardo Salvati // Ci saranno diverse assenze di alto...

Il circuito femminile post COVID-19 sta rientrando alla normalità

Pubblicato il 17 agosto 2020 su TennisAbstract - Traduzione di Edoardo Salvati // Negli ultimi due tornei femminili, abbiamo...

Il sospetto che Venus e Serena debbano giocare contro troppo spesso è fondato?

Pubblicato il 12 agosto 2020 su TennisAbstract - Traduzione di Edoardo Salvati // Nel torneo di Lexington di questi...

Effetti della pandemia nel torneo di Palermo?

Pubblicato il 10 agosto 2020 su TennisAbstract - Traduzione di Edoardo Salvati // È più difficile fare previsioni sullo...

Elo ai tempi del COVID-19

Pubblicato il 2 agosto 2020 su TennisAbstract - Traduzione di Edoardo Salvati // Il tennis è ripartito, ma nessuno...

ULTIMI ARTICOLI

Pubblicato il 12 aprile 2019 su StatsOnTheT – Traduzione di Edoardo Salvati

// In un precedente articolo, ho cercato di capire se statistiche di base della partita, come ace e minuti giocati per punto, potrebbero essere d’aiuto nella descrizione dello stile di gioco. Oggi, approfondisco le caratteristiche delle tipologie di stili ed esamino i raggruppamenti di stili di gioco che ne emergono.  

La volta scorsa ho fatto un piccolo esperimento con le ripercussioni dagli scontri diretti di due giocatori per verificarne il potenziale di determinazione di tipologie di stili di gioco tra loro differenti. Le ripercussioni analizzate erano la frequenza di ace e i minuti giocati per punto di un giocatore rispetto a quelli di un giocatore medio, stimati mediante modello gerarchico con ripercussioni da scontri diretti casuali. I risultati erano promettenti, con raggruppamenti in grado di separare, ad esempio, giocatori dal servizio notoriamente dominante da giocatori estremamente solidi in difesa. 

Probabilmente però, ace e durata dei punti non riescono a descrivere tutte le declinazioni degli stili di gioco come potrebbero fare le statistiche della partita. Dopo altre riflessioni e commenti di analisti di tennis su Twitter, ho deciso di includere i seguenti aspetti.

Frequenza di doppi falli

Dovrebbe far emergere quei giocatori che rischiano molto al servizio e quelli che invece non reggono la pressione. 

Differenza tra punti vinti sulla prima e sulla seconda di servizio

Per la maggior parte dei giocatori, ci si aspetta che il numero di punti vinti al servizio diminuisca quando devono servire la seconda. Stabilire quanta differenza ci sia tra le due situazioni potrebbe evidenziare particolari tecniche sulla seconda di servizio o quanto la capacità di attacco sia legata alla forza bruta del servizio.  

Differenza tra punti vinti sulla prima e alla risposta

Se i punti vinti sulla prima sono una misura della bravura complessiva al servizio – come summa della tecnica stessa al servizio, della tattica sul terzo colpo e della capacità di scambio – e se i punti vinti alla risposta lo sono dell’acume difensivo, la differenza dovrebbe allora aiutare a determinare il bilanciamento di un giocatore tra abilità in attacco e in difesa. 

Pur avendo considerato anche altri indicatori come il rapporto tra vincenti ed errori o la frequenza degli approcci a rete, sarebbe stato complicato trovare dati per più anni al di fuori degli Slam. Pensando inoltre alla scarsa frequenza dei punti a rete e alla variabilità nelle classificazione degli errori da un torneo all’altro, credo che l’affidabilità delle ripercussioni dagli scontri diretti avrebbe valore limitato se riferita alle sole partite degli Slam. Per il momento, quindi, le ho messe da parte.  

Correlazione tra caratteristiche

Prima di procedere con l’algoritmo di raggruppamento, dobbiamo capire il significato di queste caratteristiche e di come si rapportano alle altre. In tal senso, si può utilizzare un grafico di accoppiamento. L’immagine 1 mostra i risultati per i giocatori del circuito e per quelli che hanno giocato negli Slam per tutte le partite dal 2017 a oggi, in assenza di distinzione tra superfici. 

Tutte le ripercussioni sono su scala standardizzata, in modo da risultare centrate intorno allo zero e in un intervallo da -5 a +5, nella maggior parte dei casi. Ci sono diverse coppie che possiedono una correlazione positiva forte o moderata. La più solida è quella tra la frequenza di ace e la differenza tra punti vinti sulla prima e alla risposta, a indicazione del fatto che un servizio dominante potrebbe generare valori sopra la media per quest’ultimo indicatore. Vista la vicinanza di relazione tra queste due caratteristiche, escludo la differenza tra punti vinti sulla prima e alla risposta in modo da non ottenere una rappresentazione eccessiva dello stile associato a un servizio dominante. 

IMMAGINE 1 – Correlazione tra varie statistiche della partita per i giocatori del circuito maggiore

È interessante notare una correlazione simile tra la frequenza di doppi falli e la differenza tra punti vinti sulla prima e sulla seconda di servizio ma non con la differenza tra punti vinti sulla prima e alla risposta. Questo suggerisce che la frequenza di doppi falli può fornire indicazioni sulle scelte decisionali e sulla strategia in presenza di una seconda di servizio, che non verrebbero parimenti evidenziate da nessuna delle altre caratteristiche. Come ci si poteva attendere, data l’enfasi della maggior parte delle caratteristiche su aspetti del servizio, la durata dei punti possiede una correlazione nulla o negativa con il resto delle caratteristiche dello stile.

Identificazione dei raggruppamenti

Con qualche elemento in più, possiamo ora raggruppare i giocatori tramite algoritmo k-means, come fatto in precedenza. Il totale entro la somma dei quadrati identifica in 10 gruppi una scelta ragionevole per questo campione di giocatori. 

In presenza di quattro sole caratteristiche, la differenza di stile tra i raggruppamenti è facilmente visualizzata da un grafico a coordinate parallele, come nell’immagine 3. Ciascun colore rappresenta un raggruppamento di riferimento, e le linee più spesse la media del gruppo specifico di quel colore. Un dettaglio che emerge da subito è la rimarchevole variazione tra raggruppamenti per quanto riguarda la differenza tra punti vinti sulla prima e sulla seconda, vale a dire la variabile che più di tutte contribuisce a separare i raggruppamenti. All’opposto, la durata dei punti è quella in cui la distanza tra i raggruppamenti è minima.

IMMAGINE 2 – Raggruppamento tramite algoritmo k-means

IMMAGINE 3 – Raggruppamento di stili rispetto alla differenza nelle caratteristiche individuate

Utilità pratica

Il campione contiene più di 250 giocatori, rendendo difficile mostrare in modo compatto il raggruppamento di stile di ciascun giocatore. Possiamo selezionare i tre giocatori più rappresentativi per ogni raggruppamento mediante le ripercussioni da scontri diretti più adiacenti al centro geometrico del raggruppamento cui appartengono, come mostrato dalla tabella. La percentuale di giocatori che rientra in ciascun raggruppamento va dal 3% al 15%, con il raggruppamento 3 a essere il meno frequente e il raggruppamento 8 il più comune. 

L’utilità pratica di questi raggruppamenti è legata al loro potere predittivo. Se possono dare delucidazioni in termini di rendimento dei giocatori ai fini del risultato di una partita, rendimento che non sia già espresso dalla bravura complessiva (come valorizzata dalla classifica ufficiale o dalle valutazioni Elo), significa che esiste la speranza per rendere le ripercussioni da scontri diretti un fattore senza che siano legate al bilancio di vittorie e sconfitte, ma allo stile di gioco. Sarà questo l’argomento chiave del mio prossimo articolo sulla tematica. ◼︎

More Exploration on Using Match Stats to Classify Playing Styles

DELLO STESSO AUTORE

La WTA sta invecchiando bene

Pubblicato il 5 settembre 2015 su StatsOnTheT - Traduzione di Edoardo Salvati // Negli ultimi anni (grazie anche alle vittorie...

I giocatori migliori sull’erba al servizio e alla risposta

Pubblicato il 3 luglio 2017 su StatsOnTheT - Traduzione di Edoardo Salvati // Questa settimana ha inizio Wimbledon, il più...

Chi ha più sorpreso a Wimbledon 2017

Pubblicato il 22 luglio 2017 su StatsOnTheT - Traduzione di Edoardo Salvati // Quali sono i giocatori che più sono...

Un modello pitagorico per il tennis: edizione femminile

Pubblicato il 3 ottobre 2015 su StatsOnTheT - Traduzione di Edoardo Salvati // In un precedente articolo, basato...

Previsioni per il Roland Garros 2018

Pubblicato il 26 maggio 2018 su StatsOnTheT - Traduzione di Edoardo Salvati // L’inizio del Roland Garros 2018 è ormai...

La velocità del rovescio a rimbalzo – Australian Open Series

Pubblicato il 22 ottobre 2016 su StatsOnTheT - Traduzione di Edoardo Salvati // Negli ultimi mesi, il Game Insight Group...

Un semplice classificatore di stili di gioco alla prova

Pubblicato il 17 aprile 2019 su StatsOnTheT - Traduzione di Edoardo Salvati // Qualsiasi indicatore di stile di gioco ha...

La velocità del dritto a rimbalzo – Australian Open Series

Pubblicato il 26 novembre 2016 su StatsOnTheT - Traduzione di Edoardo Salvati // Il quinto articolo delle Australian Open Series.

E ora, cosa guardiamo?

Pubblicato il 26 marzo 2020 su StatsOnTheT - Traduzione di Edoardo Salvati // Non sembra possa esserci del tennis...

Misurare la fatica in partita

Pubblicato il 13 ottobre 2017 su StatsOnTheT - Traduzione di Edoardo Salvati // A seguito di un intervento a cui...