Il più grande archivio italiano di analisi statistiche sul tennis professionistico. Parte di Tennis Abstract

Probabilmente il più grande archivio italiano di analisi statistiche sul tennis professionistico. Parte di Tennis Abstract

E se fossimo nel 1988?

ULTIMI ARTICOLI

ULTIMI ARTICOLI

Pubblicato l’11 agosto 2018 su HiddenGameOfTennis – Traduzione di Edoardo Salvati

// Questo articolo riprende l’eccellente analisi di Jeff Sackmann sul blog HeavyTopspin riguardo all’età media dei primi 50 giocatori negli ultimi 35 anni e all’emergere della Next Gen. Ho pensato che fosse divertente provare a considerare i primi 50 della classifica attuale e vedere come apparirebbero ricostruendoli in modo che abbiano all’incirca la stesso profilo di età dei primi 50 a fine stagione nel 1988.

Iniziamo evidenziando alcune statistiche descrittive di base per la classifica dei primi 50 a fine stagione 1988 e quella attuale.

Non c’è nulla in comune se non l’età del giocatore più vecchio (Jimmy Connors era il numero 7 nel 1988). Per chi non ne avesse familiarità, la deviazione standard è una misura della variabilità di età tra i primi 50: numeri più alti significano una maggiore variabilità. Ha senso quindi osservare che i primi 50 del 2018 siano più variabili, vista la presenza di molti più giocatori sopra i 30 anni insieme a i numerosi giovanissimi e poco più che ventenni.

È chiaro che serve una pesante manomissione per fare in modo che il profilo dei primi 50 di adesso somigli a quello del 1988. Ci sono probabilmente decine di modi, forse è anche possibile creare un algoritmo che li valuti uno per uno, ma trovandoci nel fantastico mondo del divertimento contro la scienza (e non sono sufficientemente abile da creare quell’algoritmo), ho utilizzato due metodi.

La prima revisione

Per la prima revisione, voglio che ci siano almeno tre giocatori di trent’anni o più come nel 1988. Per evitare che i primi 10 fossero troppo vecchi, sono partito eliminando tutti i giocatori con età superiore a 29 anni, tranne uno: siccome Connors nel 1988 era tre deviazioni standard dalla media e si trovava nei primi 10, devo tenere almeno un giocatore “molto vecchio”. E così rimane Roger Federer.

Gli altri due giocatori di almeno 30 anni nel 1988 erano Kevin Curren alla posizione 23 e Johan Kriek alla 39, cioè due sudafricani. Sono di fatto costretto a considerare Kevin Anderson come uno dei giocatori di almeno 30 anni, non trovate (una decisione più razionale sarebbe stata quella di tagliare Anderson a favore di Adrian Mannarino, che ha la stessa età ma una classifica più vicina a quella che aveva Curren nel 1988)?

Per il terzo giocatore con più di 30 anni, ho deciso di tenere il più giovane trentenne tra i primi 30 – così da avvicinarsi alla classifica di Kriek con il numero 39 – vale a dire Sam Querrey. In questa prima revisione, tutti gli altri giocatori sopra i 30 anni scompaiono.

L’ultimo dell’elenco è Yuki Bhambri, al momento il numero 99 del mondo. Riprendiamo la tabella comparativa iniziale, aggiungendo la prima revisione.

Sembra abbastanza valida! C’è però un aspetto che non si evince ma che proprio mi infastidisce. Lo si può vedere nella tabella che segue, dove ho suddiviso la media per ciascun insieme di dieci giocatori (cioè primi 10, 11-20, etc) per il 1988 e per la prima revisione.

L’elemento di disturbo è che i primi 10 nel 1988 erano decisamente più giovani della mia prima revisione, mentre è vero l’opposto per l’insieme 31-40. In entrambi i casi sono quasi due anni di differenza.

La seconda revisione

In cerca di una spiegazione, ho provato a fare una seconda revisione avvicinando l’età media per ogni insieme di dieci. Prima ho eliminato i giocatori più vecchi di ciascun insieme e, in caso di più di un giocatore con la stessa età, ho rimosso prima quelli con la classifica più bassa. La tabella mostra la seconda revisione, cui segue la stessa tabella vista in precedenza a cui però ho aggiunto la seconda revisione.

Sono spariti tutti i veterani più forti, ma le medie per insieme si allineano molto meglio rispetto alla prima revisione, con la media complessiva quasi identica a quella della prima revisione. Questo elenco inoltre non si addentra nella classifica dei primi 100 come accade per la prima revisione (Jaume Munar era 47esimo nella prima revisione e la sua classifica al momento è al numero 90).

Problema risolto, giusto? Non credo. Quello che non appare è che, con la seconda revisione, le deviazioni standard per insieme non si aggiustano bene, quindi la combinazione di giocatori per ogni insieme non è paragonabile al 1988 come lo era per la prima revisione. Inoltre, gli insiemi da dieci sono solo una suddivisione arbitraria, e questo si riflette in alcune delle scelte, anche loro arbitrarie, che ho dovuto fare. Ad esempio, Marin Cilic è entrato nei primi 10 a 29 anni e Mannarino nell’insieme 11-20 a 30 anni, ma ho dovuto tagliare Pierre-Hugues Herbert dagli ultimi dieci così da avere la media in linea, nonostante abbia solo 27 anni. Infine, non ci sono casi estremi nella seconda divisione nel modo in cui si presentavano nel 1988 (Connors) e nella mia prima revisione (Federer).

Conclusioni

Personalmente preferisco la prima revisione alla seconda. Se ignoriamo la decisione di inserire Anderson perché due degli almeno trentenni nel 1988 erano sudafricani e se facciamo salire ogni giocatore di una posizione mettendo Mannarino al numero 18, si riduce di un po’ la distanza dalla media dei primi 10 nella prima revisione, senza che vi siano conseguenze sui numeri complessivi. È probabile che sia il miglior compromesso tra i due metodi adottati.

In chiusura di ragionamento, ripropongo la tabella originale, con il 1988, la classifica attuale e la mia prima e seconda revisione. ◼︎

What if this were 1988?

DELLO STESSO AUTORE