Il più grande archivio italiano di analisi statistiche sul tennis professionistico. Parte di Tennis Abstract

Probabilmente il più grande archivio italiano di analisi statistiche sul tennis professionistico. Parte di Tennis Abstract

Un modello per il confronto tra tornei dei primi due mesi di stagione

ULTIMI ARTICOLI

ULTIMI ARTICOLI

Pubblicato il 9 aprile 2018 su sportsbrain – Traduzione di Edoardo Salvati

// In media, i giocatori con una classifica più alta hanno avuto la meglio nel torneo di Auckland e agli Australian Open di inizio 2018. Sulla base della classifica media del vincitore di ciascuna partita, nei tornei di Quito e Sofia il livello della competizione è stato inferiore (in termini di classifica giocatore).

IMMAGINE 1 – Confronto tra tornei di inizio 2018 in termini di classifica dei vincitori di ciascuna partita

I giocatori più vecchi hanno mediamente battuto la controparte più giovane agli Australian Open (con 0.36 anni di differenza), a Auckland (1.49) e a Pune (1.86). Si è verificato il contrario a Sydney e a Brisbane, dove il vincitore è stato in media più giovane dello sconfitto di 1.2 anni. 

IMMAGINE 2 – Confronto tra tornei di inizio 2018 in termini di differenza di età tra vincitori e sconfitti

Un modello di tipo foresta casuale (random forest) è stato costruito usando la classifica, l’altezza e l’età dei vincitori e degli sconfitti, oltre alla superficie (cemento, erba, terra) su cui si gioca.

L’apprendimento automatico del modello si è sviluppato su 330 partite, mentre è stato messo alla prova su 129 partite della stagione 2018 (compresa la Coppa Davis).

IMMAGINE 3 – Variabili del modello di tipo foresta casuale, con la classifica del vincitore a essere la più efficace nel predire l’esito di qualsiasi partita

Il modello suggerisce che le variabili più importanti per predire l’esito di una partita sono la classifica del vincitore, la superficie e la classifica dello sconfitto. L’altezza dello sconfitto insieme alla sua età e a quella del vincitore hanno avuto, all’interno del modello, un potere predittivo inferiore. Complessivamente, è stato correttamente previsto l’esito del 74.4% delle partite del campione considerato. 

Il codice dell’analisi è disponibile qui. ◼︎

Early Stages of the Tennis Season

DELLO STESSO AUTORE