Il più grande archivio italiano di analisi statistiche sul tennis professionistico. Parte di Tennis Abstract

Il più grande archivio italiano di analisi statistiche sul tennis professionistico. Parte di Tennis Abstract

Un semplice classificatore di stili di gioco alla prova

ULTIMI ARTICOLI

Prevedere l’esito dei prossimi cinque anni di Slam con la sfera di cristallo

Pubblicato il 16 ottobre 2020 su TennisAbstract - Traduzione di Edoardo Salvati // L’anno scorso, ho creato un modello...

È tornata la discesa a rete?

Pubblicato il 2 ottobre 2020 su StatsOnTheT - Traduzione di Edoardo Salvati // Se guardando il Roland Garros 2020...

Venti non vuol dire sempre venti

Pubblicato il 12 ottobre 2020 su TennisAbstract - Traduzione di Edoardo Salvati // C’è sempre più traffico in cima...

La fortuna del sorteggio: Roland Garros 2020 (donne)

Pubblicato il 25 settembre 2020 su HiddenGameOfTennis - Traduzione di Edoardo Salvati // Come per gli uomini, anche per...

La fortuna del sorteggio: Roland Garros 2020 (uomini)

Pubblicato il 25 settembre 2020 su HiddenGameOfTennis - Traduzione di Edoardo Salvati // Da diversi anni ormai eseguo simulazioni...

Cosa succede al ritmo di gioco con le nuove regole imposte dalla pandemia

Pubblicato il 31 agosto 2020 su TennisAbstract - Traduzione di Edoardo Salvati // La pandemia COVID-19 ha imposto agli...

Che valore assegnamo ai tornei Masters o Premier vinti nella bolla?

Pubblicato il 30 agosto 2020 su TennisAbstract - Traduzione di Edoardo Salvati // Il tennis è ripartito, ma molti...

Mettere un asterisco accanto agli US Open è prematuro, e forse del tutto sbagliato

Pubblicato il 19 agosto 2020 su TennisAbstract - Traduzione di Edoardo Salvati // Ci saranno diverse assenze di alto...

Il circuito femminile post COVID-19 sta rientrando alla normalità

Pubblicato il 17 agosto 2020 su TennisAbstract - Traduzione di Edoardo Salvati // Negli ultimi due tornei femminili, abbiamo...

Il sospetto che Venus e Serena debbano giocare contro troppo spesso è fondato?

Pubblicato il 12 agosto 2020 su TennisAbstract - Traduzione di Edoardo Salvati // Nel torneo di Lexington di questi...

ULTIMI ARTICOLI

Pubblicato il 17 aprile 2019 su StatsOnTheT – Traduzione di Edoardo Salvati

// Qualsiasi indicatore di stile di gioco ha valenza in funzione della capacità di informare su un determinato giocatore più della sua bravura complessiva. Se applichiamo questa linea di giudizio a categorie di stili di gioco derivate da statistiche di base della partita, cosa otteniamo? 

Nell’ultimo di una serie di articoli sugli stili di gioco, cerco di capire se queste categorie sono in grado di migliorare la previsione sull’esito di una partita. Le statistiche in questione sono solo quattro – frequenza di ace e doppi falli, differenza nelle percentuali di punti vinti sulla prima e sulla seconda di servizio, durata media degli scambi – e sono quanto di meglio disponibile in termini aggregati per misurare determinati aspetti della prestazione di un giocatore che vanno oltre le qualità oggettive.  

In precedenza, ho valutato le conseguenze (o effetti) per i giocatori che hanno partecipato agli Slam su ognuna di queste statistiche e trovato che, tramite algoritmo k-means, 10 raggruppamenti erano una scelta ragionevole al fine di ridurre la varianza infragruppo. Ma come possono diventare utili? Se riteniamo che il confronto di stili abbia un peso, allora dovremmo attenderci che questi raggruppamenti migliorino le nostre aspettative per il risultato di almeno alcuni di questi scontri tra stili di gioco. 

È davvero così? Un po’ di statistica..

Per mettere alla prova lo scontro tra stili di gioco, dobbiamo partire dalla previsione di base di nostra scelta. Nel mio caso, la previsione fa uso delle valutazioni dei giocatori specifiche per superficie ed è determinata dalla differenza fra valutazioni tra il giocatore i e il giocatore j, che possiamo denominare Dij.

Ipotizziamo ora che anche la singola partita abbia una categoria di stile. Se il giocatore i appartiene a un raggruppamento di stile ki e il giocatore i a un gruppo di stile kj, e Jkè un vettore a K-elementi con valore 1 nel k-esimo posto e valore zero in tutti gli altri, possiamo assegnare un effetto stile per quella specifica partita, ϕ(ki, kj) definito come J′kiΦJkj, per una matrice K per K di parametri di stile Φ.

Il modello logistico che determina l’effetto stile è: 

log(pij/(1 − pij)) = βDij + ϕ(ki, kj).

Considerato che l’effetto ϕ(ki, kj) dovrebbe avere un effetto complementare per il giocatore j, cioè ϕ(ki, kj) = − ϕ(ki, kj), adattiamo il modello solo in termini del triangolo inferiore di Φ, dove ki kj. Con K = 10, risultano 55 effetti stile.  

Adattamento

Ho adattato il modello logistico appena descritto a tutte le partite (tra i giocatori che hanno partecipato agli Slam) almeno di livello Challenger tra il 2014 e il 2017. Ho poi applicato l’effetto stile per correggere la previsione di base per le partite giocate nel 2018. Dei 55 effetti stile delle partite oggetto del test, 19 hanno mostrato un miglioramento nella funzione di classificazione log-loss delle previsioni. Come si vede dal grafico dell’immagine 1 però, si tratta di un miglioramento ridotto se non per alcuni scontri tra giocatori. 

IMMAGINE 1 – Scontri di stile di gioco che migliorano la previsione delle partite del circuito maschile

In assenza di un contesto, sono scontri che hanno poco significato. Possiamo dare un’interpretazione a questi risultati analizzando specifici accostamenti giocatore-avversario che rientrano in ognuno dei gruppi più significativi, per osservare come la correzione generata dallo stile modifichi la previsione di quelle determinate partite.  

Raggruppamento 6 contro 7

L’immagine 2 mostra un campione degli scontri tra giocatori appartenenti al raggruppamento 6:7, quello con il maggior miglioramento predittivo di tutti gli scontri di stile.

Tre dei giocatori del raggruppamento 6 sono Ernests Gulbis, Feliciano Lopez e Jeremy Chardy. La caratteristica distintiva è un servizio più potente della media, una seconda più accurata della media, una differenza più ridotta della media tra punti vinti sulla prima e sulla seconda e una velocità di gioco superiore alla media.

IMMAGINE 2 – Esempi di scontri tra giocatori dal raggruppamento di stile 6:7

Nel raggruppamento di stile 7 invece, ci sono giocatori con un servizio meno potente, una maggiore frequenza di doppi falli, una differenza più ampia tra punti vinti sulla prima e sulla seconda e con un gioco caratterizzato da scambi più lunghi. Tra questi, Kei Nishikori, Rogerio Dutra Silva e Novak Djokovic.

L’effetto stile nello scontro tra questo raggruppamento e quello precedente non è favorevole a giocatori come Gulbis, Lopez e Chardy. La previsione di base infatti subisce un aggiustamento verso il basso, e più spesso sembra essere stata questa la direzione corretta.

Raggruppamento 6 contro 8

Il raggruppamento di stile 8 ha una marcata somiglianza con il 7, ma si distingue per una prima di servizio in media più potente e minori rischi con la seconda. Troviamo giocatori come Denis Istomin, Filip Krajinovic, e Philipp Kohlschreiber. È interessante notare che gli aspetti in comune dei raggruppamenti 7 e 8 generino uno scontro altrettanto forte con i giocatori del raggruppamento 6, a cui possiamo aggiungere Gilles Muller.

IMMAGINE 3 – Esempi di scontri tra giocatori dal raggruppamento di stile 6:8

In questo caso gli scontri determinano, in generale, una minore correzione verso il basso. Gli esempi suggeriscono comunque un rendimento peggiore più frequente per i giocatori del raggruppamento 6 contro quelli del raggruppamento 8.

Raggruppamento 5 contro 10

Lo scontro successivo è tra i giocatori del raggruppamento di stile 5 e quelli del raggruppamento 10, al terzo posto per miglioramento predittivo delle partite del campione testato. I giocatori del raggruppamento 5 si mettono in mostra per avere una differenza di rendimento ridotta tra la prima e la seconda senza però servire molti ace. Rappresentano anche il secondo gruppo dal ritmo di gioco più lento sul circuito. Tre giocatori in questa categoria di stile sono Jordan Thompson, Pablo Cuevas e Juan Martin Del Potro.

Il raggruppamento 10 è diametralmente opposto al 5, con un’alta frequenza di ace, un divario più ampio della media nel rendimento tra la prima e la seconda e uno dei ritmi di gioco più rapidi del circuito. Troviamo giocatori come Fabio Fognini, David Goffin e Mackenzie McDonald.

Il campione di partite dell’immagine 4 mostra che il raggruppamento 5 subisce le maggiori conseguenze quando si scontra con lo stile aggressivo e velocizzato dei giocatori del raggruppamento 10.

IMMAGINE 4 – Esempi di scontri tra giocatori dal raggruppamento di stile 5:10

Conclusioni

Emergono alcuni risultati positivi da una prima analisi del valore predittivo di categorie di stile basate sull’aggregazione delle più semplici statistiche di una partita. Almeno una parte degli scontri esaminati fa vedere un guadagno effettivo in termini di aspettative, e suggerisce che è possibile raggruppare i giocatori in funzione dello stile con un certo grado di ragionevolezza. Sarebbe interessante studiare come l’aggiunta di altri dettagli legati ai giocatori – ad esempio l’altezza, la mano dominante, il tipo di rovescio – contribuisca a migliorare i risultati. Da quanto osservato sinora, sembra che sia la giusta direzione per affrontare agli scontri diretti con un nuovo metodo d’indagine. ◼︎

Putting a Basic Playing Style Classifier to the Test

DELLO STESSO AUTORE

È tornata la discesa a rete?

Pubblicato il 2 ottobre 2020 su StatsOnTheT - Traduzione di Edoardo Salvati // Se guardando il Roland Garros 2020...

Un’analisi delle partite Slam più lunghe di sempre

Pubblicato il 24 maggio 2020 su StatsOnTheT - Traduzione di Edoardo Salvati // La sospensione della stagione tennistica ha...

Unicorni nel circuito femminile

Pubblicato il 12 luglio 2019 su StatsOnTheT - Traduzione di Edoardo Salvati // Con l’avvio della trasferta nordamericana di preparazione...

Previsioni per il singolare maschile degli Australian Open 2018

Pubblicato il 12 gennaio 2018 su StatsOnTheT - Traduzione di Edoardo Salvati // Pur avendo ricevuto dal sorteggio il quarto...

Un semplice classificatore di stili di gioco alla prova

Pubblicato il 17 aprile 2019 su StatsOnTheT - Traduzione di Edoardo Salvati // Qualsiasi indicatore di stile di gioco ha...

Previsioni per il singolare femminile degli Australian Open 2018

Pubblicato il 13 gennaio 2018 su StatsOnTheT - Traduzione di Edoardo Salvati // La vittoria a Brisbane e un po’...

Nella rivalità con Nadal, il rovescio di Federer è diventato un’arma?

Pubblicato il 17 marzo 2017 su StatsOnTheT - Traduzione di Edoardo Salvati // Chi tra gli appassionati di tennis ha...

Chi ha un vantaggio alla vigilia degli US Open?

Pubblicato il 24 agosto 2019 su StatsOnTheT - Traduzione di Edoardo Salvati // Con l’ultimo Slam dell’anno ai blocchi di...

Di nuovo sull’uso delle statistiche della partita per classificare gli stili di gioco

Pubblicato il 12 aprile 2019 su StatsOnTheT - Traduzione di Edoardo Salvati // In un precedente articolo, ho cercato di...

Chi vince e chi perde in caso di sospensione della classifica

Pubblicato il 13 marzo 2020 su StatsOnTheT - Traduzione di Edoardo Salvati // L’annuncio di una sospensione di sei...