Il più grande archivio italiano di analisi statistiche sul tennis professionistico. Parte di Tennis Abstract

Il più grande archivio italiano di analisi statistiche sul tennis professionistico. Parte di Tennis Abstract

Un modello pitagorico per il tennis: edizione femminile

ULTIMI ARTICOLI

È tornata la discesa a rete?

Pubblicato il 2 ottobre 2020 su StatsOnTheT - Traduzione di Edoardo Salvati // Se guardando il Roland Garros 2020...

Venti non vuol dire sempre venti

Pubblicato il 12 ottobre 2020 su TennisAbstract - Traduzione di Edoardo Salvati // C’è sempre più traffico in cima...

La fortuna del sorteggio: Roland Garros 2020 (donne)

Pubblicato il 25 settembre 2020 su HiddenGameOfTennis - Traduzione di Edoardo Salvati // Come per gli uomini, anche per...

La fortuna del sorteggio: Roland Garros 2020 (uomini)

Pubblicato il 25 settembre 2020 su HiddenGameOfTennis - Traduzione di Edoardo Salvati // Da diversi anni ormai eseguo simulazioni...

Cosa succede al ritmo di gioco con le nuove regole imposte dalla pandemia

Pubblicato il 31 agosto 2020 su TennisAbstract - Traduzione di Edoardo Salvati // La pandemia COVID-19 ha imposto agli...

Che valore assegnamo ai tornei Masters o Premier vinti nella bolla?

Pubblicato il 30 agosto 2020 su TennisAbstract - Traduzione di Edoardo Salvati // Il tennis è ripartito, ma molti...

Mettere un asterisco accanto agli US Open è prematuro, e forse del tutto sbagliato

Pubblicato il 19 agosto 2020 su TennisAbstract - Traduzione di Edoardo Salvati // Ci saranno diverse assenze di alto...

Il circuito femminile post COVID-19 sta rientrando alla normalità

Pubblicato il 17 agosto 2020 su TennisAbstract - Traduzione di Edoardo Salvati // Negli ultimi due tornei femminili, abbiamo...

Il sospetto che Venus e Serena debbano giocare contro troppo spesso è fondato?

Pubblicato il 12 agosto 2020 su TennisAbstract - Traduzione di Edoardo Salvati // Nel torneo di Lexington di questi...

Effetti della pandemia nel torneo di Palermo?

Pubblicato il 10 agosto 2020 su TennisAbstract - Traduzione di Edoardo Salvati // È più difficile fare previsioni sullo...

ULTIMI ARTICOLI

Pubblicato il 3 ottobre 2015 su StatsOnTheT – Traduzione di Edoardo Salvati

// In un precedente articolo, basato sul mio intervento al New England Symposium on Statistics in Sports (NESSIS) del 2015 ad Harvard, ho parlato della possibile applicazione per il tennis della formula di Pitagora inizialmente introdotta nel baseball, mostrando che le palle break convertite hanno una capacità predittiva delle vittorie di un giocatore straordinariamente simile ai punti segnati (in relazione ai punti concessi) per le vittorie di squadra nel baseball.

Le analisi pitagoriche si riferivano solo al circuito professionistico maschile. Grazie ai dati messi a disposizione da Jeff Sackmann di TennisAbstract, intendo verificare l’esistenza di una formula di Pitagora anche per il tennis femminile. 

Su un campione di più di 12.000 partite tra il 2010 e il 2015, l’era della struttura “Premier” dei tornei introdotta dalla WTA nel 2009, ho calcolato la “forza pitagorica” di 14 indicatori di prestazione, tramite la seguente formula:

%Vitt = Xα / (Xα+Yα) x 100

dove %Vitt si riferisce alla percentuale di vittorie stagionali sulle partite giocate, X è uno dei 14 indicatori della bravura di una giocatrice – calcolato come sommatoria di quella particolare abilità sull’insieme di partite giocate in un anno – e Y indica il totale corrispondente per gli avversari che la giocatrice ha affrontato.   

Il caso di Na

Prendiamo il modello pitagorico per i punti vinti con la prima di servizio da Li Na nel 2010, anno per il quale ci sono 45 partite nel database e 1105 punti vinti contro i 949 punti vinti dalle sue avversarie. La formula per le vittorie attese pitagoriche per Na nel 2010 rispetto ai punti vinti con la prima di servizio ha X = 1105 e Y = 949. Per completare il calcolo serve l’esponente α, stimato da un adattamento tramite minimi quadrati. 

IMMAGINE 1 – Coefficienti α per modelli pitagorici di 14 indicatori di prestazione nel tennis femminile per il periodo 2010-2015

women-pit_1

L’immagine 1 mostra gli esponenti per ogni indicatore di prestazione basati sull’esito vincente delle partite tra il 2010 e il 2015 nel circuito WTA. I punti vinti con la prima di servizio avevano una stima di α = 4.75. Tornando all’esempio, la stima per le vittorie della stagione 2010 per Na in funzione dei punti vinti con la prima di servizio è:

%Vitt = 11054.75 / (11054.75 + 9494.75) x 100 = 67%

La percentuale effettiva ottenuta da Na nelle 45 partite del campione è stata del 64%.

Nel modello BP2 per il circuito maschile, l’esponente con il migliore adattamento era 1.83, molto vicino al coefficiente pitagorico 2. Per la WTA, il coefficiente di adattamento migliore per il modello delle palle break convertite è 2.28, sempre vicino a una relazione pitagorica, ma in verso opposto rispetto agli uomini. Questo suggerisce che, a parità di miglioramento della percentuale di conversione di palle break sulle avversarie, si assiste a un incremento maggiore nelle vittorie rispetto a quanto accade per gli uomini, facendo ipotizzare l’esistenza di una relazione in qualche modo più diretta di quella del tennis maschile tra prestazione relativa sulle palle break ed esito vincente di una partita.

Quanto accuratamente questi modelli predicono la percentuale di vittorie?

L’immagine 2 evidenzia che il modello basato sulle palle break convertite è quello con la capacità predittiva più forte per la percentuale di vittorie attese, spiegando l’83% della variazione nel numero di vittorie con un errore di ±4 partite su un campione di 50 partite stagionali. È un risultato simile a quanto visto per il circuito maschile. Curiosamente, a differenza degli uomini, il modello con la seconda migliore capacità predittiva è quello basato sul totale dei punti vinti con il servizio (per gli uomini sono le opportunità di break generate), suggerendo che un maggiore dominio relativo al servizio è un fattore più preponderante sull’esito vincente di una partita rispetto al circuito maschile. Questo è coerente con il fatto che nel nel circuito femminile si verificano più break. 

IMMAGINE 2 – Coefficiente di adattamento per modelli pitagorici di 14 indicatori di prestazione nella WTA per il periodo 2010-2015

women-pit_2

Nel baseball, uno dei più remunerativi utilizzi delle attese pitagoriche è relativo alla stima del numero di vittorie, in quanto restituisce un valore più preciso delle predizioni basate sul record vittorie-sconfitte di una squadra. Ho mostrato che questo è vero anche per il modello BP2 applicato al tennis maschile.

Il modello BP2 per le donne

L’immagine 3 confronta le previsioni di vittorie WTA a metà stagione del modello pitagorico BP2 contro tre modelli alternativi, il primo dato da un modello di regressione con il più predittivo dei 14 indicatori di prestazione, il secondo dato dallo stesso modello con aggiunta della classifica relativa giocatrice-avversaria e il terzo dato dal record vittorie-sconfitte.    

Nel grafico di destra vittorie-sconfitte, si osserva un’ampia disseminazione di punti che rappresentano previsioni di vittorie e sconfitte, a indicazione del fatto che le vittorie di una giocatrice a metà stagione potrebbero variare ampiamente rispetto al numero di vittorie di fine anno. In effetti, l’errore per il modello vittorie-sconfitte in una stagione di 50 partite è stato superiore di più di una partita rispetto all’errore basato su BP2, una frequenza di errore praticamente identica all’efficacia dei modelli multivariati.     

IMMAGINE 3 – Proiezioni a metà stagione di BP2 per la WTA contro tre modelli alternativi

women-pit_3

Conclusioni

In conclusione, nonostante numerose differenze nella modalità e nello stile di gioco tra il tennis maschile e quello femminile, la relazione pitagorica tra palle break convertite e percentuale di vittorie resta valida.

Ci sono anche prove nei risultati ottenuti che indicano che il modello BP2 restituisce esiti migliori del record vittorie-sconfitte in misura superiore nel tennis femminile rispetto a quello maschile. Per entrambi i circuiti in ogni caso, BP2 promette di essere uno strumento semplice e funzionale per una valutazione accurata della bravura di una giocatrice o di un giocatore. ◼︎

Are Women as Pythagorean as Men in Tennis?

DELLO STESSO AUTORE

Rendimento al servizio e alla risposta secondo il sistema di valutazione Elo

Pubblicato il 18 novembre 2017 su StatsOnTheT - Traduzione di Edoardo Salvati // Il sistema Elo è uno...

I 22 miti del tennis di Klaassen & Magnus – Mito 12 (sulla competitività del tennis maschile rispetto a quello femminile)

Pubblicato il 21 maggio 2016 su StatsOnTheT - Traduzione di Edoardo Salvati // Un’analisi del Mito 11.

I 22 miti del tennis di Klaassen & Magnus – Mito 9 (sul ruolo delle statistiche e del caso fortuito)

Pubblicato l’1 maggio 2016 su StatsOnTheT - Traduzione di Edoardo Salvati // Un’analisi del Mito 8. Dopo...

Il primo colpo dopo il servizio – Australian Open Series

Pubblicato il 17 dicembre 2016 su StatsOnTheT - Traduzione di Edoardo Salvati // L’ottavo articolo delle Australian Open...

Le giocatrici migliori sull’erba al servizio e alla risposta

Pubblicato il 3 luglio 2017 su StatsOnTheT - Traduzione di Edoardo Salvati // L’analisi sui giocatori migliori.

La freschezza è un fattore al Roland Garros?

Pubblicato il 4 giugno 2018 su StatsOnTheT - Traduzione di Edoardo Salvati // Raggiungendo i quarti di finale al Roland...

Previsioni per il Roland Garros 2018

Pubblicato il 26 maggio 2018 su StatsOnTheT - Traduzione di Edoardo Salvati // L’inizio del Roland Garros 2018 è ormai...

Di nuovo sull’uso delle statistiche della partita per classificare gli stili di gioco

Pubblicato il 12 aprile 2019 su StatsOnTheT - Traduzione di Edoardo Salvati // In un precedente articolo, ho cercato di...

La classifica WTA non funziona bene

Pubblicato il 20 maggio 2017 su StatsOnTheT - Traduzione di Edoardo Salvati // Nella sua prima partita agli Internazionali d’Italia,...

Le giocatrici migliori al Roland Garros 2017

Pubblicato il 10 giugno 2017 su StatsOnTheT - Traduzione di Edoardo Salvati // Manca poco alla finale femminile del Roland...