Il più grande archivio italiano di analisi statistiche sul tennis professionistico. Parte di Tennis Abstract

Il più grande archivio italiano di analisi statistiche sul tennis professionistico. Parte di Tennis Abstract

E se fossimo nel 1988?

ULTIMI ARTICOLI

Ha sbagliato Djokovic a insistere sulla palla corta al Roland Garros?

Pubblicato il 18 ottobre 2020 su StatsOnTheT - Traduzione di Edoardo Salvati // È passato un po’ di tempo...

Prevedere l’esito dei prossimi cinque anni di Slam con la sfera di cristallo

Pubblicato il 16 ottobre 2020 su TennisAbstract - Traduzione di Edoardo Salvati // L’anno scorso, ho creato un modello...

È tornata la discesa a rete?

Pubblicato il 2 ottobre 2020 su StatsOnTheT - Traduzione di Edoardo Salvati // Se guardando il Roland Garros 2020...

Venti non vuol dire sempre venti

Pubblicato il 12 ottobre 2020 su TennisAbstract - Traduzione di Edoardo Salvati // C’è sempre più traffico in cima...

La fortuna del sorteggio: Roland Garros 2020 (donne)

Pubblicato il 25 settembre 2020 su HiddenGameOfTennis - Traduzione di Edoardo Salvati // Come per gli uomini, anche per...

La fortuna del sorteggio: Roland Garros 2020 (uomini)

Pubblicato il 25 settembre 2020 su HiddenGameOfTennis - Traduzione di Edoardo Salvati // Da diversi anni ormai eseguo simulazioni...

Cosa succede al ritmo di gioco con le nuove regole imposte dalla pandemia

Pubblicato il 31 agosto 2020 su TennisAbstract - Traduzione di Edoardo Salvati // La pandemia COVID-19 ha imposto agli...

Che valore assegnamo ai tornei Masters o Premier vinti nella bolla?

Pubblicato il 30 agosto 2020 su TennisAbstract - Traduzione di Edoardo Salvati // Il tennis è ripartito, ma molti...

Mettere un asterisco accanto agli US Open è prematuro, e forse del tutto sbagliato

Pubblicato il 19 agosto 2020 su TennisAbstract - Traduzione di Edoardo Salvati // Ci saranno diverse assenze di alto...

Il circuito femminile post COVID-19 sta rientrando alla normalità

Pubblicato il 17 agosto 2020 su TennisAbstract - Traduzione di Edoardo Salvati // Negli ultimi due tornei femminili, abbiamo...

ULTIMI ARTICOLI

Pubblicato l’11 agosto 2018 su HiddenGameOfTennis – Traduzione di Edoardo Salvati

// Questo articolo riprende l’eccellente analisi di Jeff Sackmann sul blog HeavyTopspin riguardo all’età media dei primi 50 giocatori negli ultimi 35 anni e all’emergere della Next Gen. Ho pensato che fosse divertente provare a considerare i primi 50 della classifica attuale e vedere come apparirebbero ricostruendoli in modo che abbiano all’incirca la stesso profilo di età dei primi 50 a fine stagione nel 1988.

Iniziamo evidenziando alcune statistiche descrittive di base per la classifica dei primi 50 a fine stagione 1988 e quella attuale.

Non c’è nulla in comune se non l’età del giocatore più vecchio (Jimmy Connors era il numero 7 nel 1988). Per chi non ne avesse familiarità, la deviazione standard è una misura della variabilità di età tra i primi 50: numeri più alti significano una maggiore variabilità. Ha senso quindi osservare che i primi 50 del 2018 siano più variabili, vista la presenza di molti più giocatori sopra i 30 anni insieme a i numerosi giovanissimi e poco più che ventenni.

È chiaro che serve una pesante manomissione per fare in modo che il profilo dei primi 50 di adesso somigli a quello del 1988. Ci sono probabilmente decine di modi, forse è anche possibile creare un algoritmo che li valuti uno per uno, ma trovandoci nel fantastico mondo del divertimento contro la scienza (e non sono sufficientemente abile da creare quell’algoritmo), ho utilizzato due metodi.

La prima revisione

Per la prima revisione, voglio che ci siano almeno tre giocatori di trent’anni o più come nel 1988. Per evitare che i primi 10 fossero troppo vecchi, sono partito eliminando tutti i giocatori con età superiore a 29 anni, tranne uno: siccome Connors nel 1988 era tre deviazioni standard dalla media e si trovava nei primi 10, devo tenere almeno un giocatore “molto vecchio”. E così rimane Roger Federer.

Gli altri due giocatori di almeno 30 anni nel 1988 erano Kevin Curren alla posizione 23 e Johan Kriek alla 39, cioè due sudafricani. Sono di fatto costretto a considerare Kevin Anderson come uno dei giocatori di almeno 30 anni, non trovate (una decisione più razionale sarebbe stata quella di tagliare Anderson a favore di Adrian Mannarino, che ha la stessa età ma una classifica più vicina a quella che aveva Curren nel 1988)?

Per il terzo giocatore con più di 30 anni, ho deciso di tenere il più giovane trentenne tra i primi 30 – così da avvicinarsi alla classifica di Kriek con il numero 39 – vale a dire Sam Querrey. In questa prima revisione, tutti gli altri giocatori sopra i 30 anni scompaiono.

L’ultimo dell’elenco è Yuki Bhambri, al momento il numero 99 del mondo. Riprendiamo la tabella comparativa iniziale, aggiungendo la prima revisione.

Sembra abbastanza valida! C’è però un aspetto che non si evince ma che proprio mi infastidisce. Lo si può vedere nella tabella che segue, dove ho suddiviso la media per ciascun insieme di dieci giocatori (cioè primi 10, 11-20, etc) per il 1988 e per la prima revisione.

L’elemento di disturbo è che i primi 10 nel 1988 erano decisamente più giovani della mia prima revisione, mentre è vero l’opposto per l’insieme 31-40. In entrambi i casi sono quasi due anni di differenza.

La seconda revisione

In cerca di una spiegazione, ho provato a fare una seconda revisione avvicinando l’età media per ogni insieme di dieci. Prima ho eliminato i giocatori più vecchi di ciascun insieme e, in caso di più di un giocatore con la stessa età, ho rimosso prima quelli con la classifica più bassa. La tabella mostra la seconda revisione, cui segue la stessa tabella vista in precedenza a cui però ho aggiunto la seconda revisione.

Sono spariti tutti i veterani più forti, ma le medie per insieme si allineano molto meglio rispetto alla prima revisione, con la media complessiva quasi identica a quella della prima revisione. Questo elenco inoltre non si addentra nella classifica dei primi 100 come accade per la prima revisione (Jaume Munar era 47esimo nella prima revisione e la sua classifica al momento è al numero 90).

Problema risolto, giusto? Non credo. Quello che non appare è che, con la seconda revisione, le deviazioni standard per insieme non si aggiustano bene, quindi la combinazione di giocatori per ogni insieme non è paragonabile al 1988 come lo era per la prima revisione. Inoltre, gli insiemi da dieci sono solo una suddivisione arbitraria, e questo si riflette in alcune delle scelte, anche loro arbitrarie, che ho dovuto fare. Ad esempio, Marin Cilic è entrato nei primi 10 a 29 anni e Mannarino nell’insieme 11-20 a 30 anni, ma ho dovuto tagliare Pierre-Hugues Herbert dagli ultimi dieci così da avere la media in linea, nonostante abbia solo 27 anni. Infine, non ci sono casi estremi nella seconda divisione nel modo in cui si presentavano nel 1988 (Connors) e nella mia prima revisione (Federer).

Conclusioni

Personalmente preferisco la prima revisione alla seconda. Se ignoriamo la decisione di inserire Anderson perché due degli almeno trentenni nel 1988 erano sudafricani e se facciamo salire ogni giocatore di una posizione mettendo Mannarino al numero 18, si riduce di un po’ la distanza dalla media dei primi 10 nella prima revisione, senza che vi siano conseguenze sui numeri complessivi. È probabile che sia il miglior compromesso tra i due metodi adottati.

In chiusura di ragionamento, ripropongo la tabella originale, con il 1988, la classifica attuale e la mia prima e seconda revisione. ◼︎

What if this were 1988?

DELLO STESSO AUTORE

Qualche classifica maschile con i dati del Match Charting Project

Pubblicato il 13 agosto 2019 su HiddenGameOfTennis - Traduzione di Edoardo Salvati // In preparazione a un precedente articolo...

La difficoltà di accorciare le partite di tennis – Parte I

Pubblicato il 18 settembre 2019 su HiddenGameOfTennis - Traduzione di Edoardo Salvati // Anche il tennis, come altri...

Un confronto tra i tornei sull’erba della stagione 2018

Pubblicato il 18 luglio 2018 su HiddenGameOfTennis - Traduzione di Edoardo Salvati // Il torneo di Newport segna...

La fortuna del sorteggio: Australian Open 2019

Pubblicato l’11 gennaio 2019 su HiddenGameOfTennis - Traduzione di Edoardo Salvati // Come solitamente faccio alla vigilia di uno...

Il fattore campo nel tennis, parte 3 (le conclusioni)

Pubblicato il 26 settembre 2015 su HiddenGameOfTennis - Traduzione di Edoardo Salvati // Nella parte 1 di questa serie, ho...

Nadal nelle retrovie

Pubblicato il 10 gennaio 2020 su HiddenGameOfTennis - Traduzione di Edoardo Salvati // (Con aggiornamento al 12 gennaio che...

Dominic Thiem può e deve migliorare sul cemento

Pubblicato il 25 aprile 2017 su HiddenGameOfTennis - Traduzione di Edoardo Salvati // Sui campi pubblici dove gioco a tennis...

Finali Next Gen Gruppo B, le probabilità delle semifinali

Pubblicato il 7 novembre 2018 su HiddenGameOfTennis - Traduzione di Edoardo Salvati // Le probabilità delle semifinali del Gruppo A.

Chi ha favorito e sfavorito di più il (o la fortuna nel) sorteggio del tabellone maschile di Wimbledon?

Pubblicato l’1 luglio 2017 su HiddenGameOfTennis - Traduzione di Edoardo Salvati // Nel sorteggio del tabellone di un torneo del...

La fortuna del sorteggio: Wimbledon 2019 (donne)

Pubblicato l’1 luglio 2019 su HiddenGameOfTennis - Traduzione di Edoardo Salvati // Come d’abitudine per gli Slam, ho eseguito una simulazione...