Il più grande archivio italiano di analisi statistiche sul tennis professionistico. Parte di Tennis Abstract

Probabilmente il più grande archivio italiano di analisi statistiche sul tennis professionistico. Parte di Tennis Abstract

Un confronto tra posizioni in classifica sul circuito maggiore femminile

ULTIMI ARTICOLI

ULTIMI ARTICOLI

Pubblicato il 25 giugno 2021 su HiddenGameOfTennis – Traduzione di Edoardo Salvati

// Mi sono chiesto cosa succederebbe se, invece di guardare agli scontri diretti tra giocatrici del circuito maggiore (ad esempio, Serena Williams contro Venus Williams), prendessi a riferimento solo gli scontri diretti tra posizioni in classifica (ad esempio la numero 1 contro la numero 10).

Per limitare il campo di applicazione, ho considerato solo gli scontri delle prime 100 contro le prime 100 e, ai fini di questo articolo, sono andato a ritroso fermandomi al 2005. È una scelta arbitraria, ma l’idea originaria era quella di concentrarsi solo sul tennis moderno, con attrezzatura relativamente attuale e una struttura simile di tornei, nel caso l’analisi avesse anche la minima rilevanza predittiva. Visto che questo elemento non sembra emergere in modo chiaro, chiunque può sempre andare più indietro nel tempo e soddisfare la propria curiosità.

Il perimetro formato dalle prime 100 si traduce in 4951 partite uniche tra posizioni in classifica, cioè il risultato di [(100*99) / 2] + 1. Il numero totale di partite nei quindici anni è di 27.852.

Tendenze interessanti, forse…

Illustrerò solo alcune delle molteplici risultanze che sono per me degne di attenzione. Generalmente parlando, l’aspetto più significativo arriva dalla non linearità dei risultati nel momento in cui sono interpretati in funzione della posizione in classifica. In altre parole, ci si potrebbe attendere che a una certa posizione corrisponda all’incirca una percentuale decrescente di battere ogni posizione davanti alla stessa. Di converso, a ogni posizione corrisponde all’incirca una percentuale crescente di battere ogni posizione inferiore alla stessa. Scendendo nel dettaglio però, non funziona in modo così diretto.

Vale la pena sottolineare che il campione disponibile per ciascuna posizione è, per la maggior parte, ridotto. Sappiamo già che gli scontri diretti tra giocatrici sono di solito pochi e quindi non aiutano a fare previsioni. Le tante partite tra Rafael Nadal e Novak Djokovic ad esempio possono far pensare al contrario, ma si tratta di un’eccezione, non della regola. Sarebbe ragionevole pensare che il campione di partite derivanti da posizione contro posizione sia più abbondante — e tecnicamente lo è nel perimetro delle prime 100 contro le prime 100, che ho voluto appositamente delimitare — ma non quanto si è portati a credere.

Detto questo, ho scelto a caso un numero tra 1 e 100 (è venuto fuori 78) e creato il grafico dell’immagine 1 che mostra come la posizione 78 si è comportata contro tutte le altre della classifica. Sull’asse delle ascisse è riportata la posizione dell’avversaria, la linea rossa seghettata indica il numero di partite secondo l’asse delle ordinate, mentre la linea blu seghettata è la percentuale di vittorie sempre in relazione all’asse delle ordinate.

IMMAGINE 1 – Scontri diretti della posizione 78 contro le altre posizioni in classifica

Ci sono tendenze?

Aggregando i dati in una o più modalità, si evidenziano delle tendenze. Nell’immagine 2 ad esempio c’è n’è una semplice data dalla percentuale di vittoria di ciascuna posizione delle prime 25 (sull’asse delle ascisse) contro le altre delle prime 100 intese come gruppo. Ci sono alcune interruzioni, ma si vede anche una dinamica molto marcata, a suggerire che più è bassa la classifica, inferiore sarà mediamente la percentuale di vittoria contro una delle prime 100. Il grafico non mostra che la curva inizia ad avere più spesso un andamento altalenante dopo le prime 25, poiché la differenza tra posizioni si assottiglia e i risultati diventano più variabili.

IMMAGINE 2 – Percentuale di vittoria per le posizioni 1-25 contro le altre prime 100

Si potrebbe forse individuare altre dinamiche creando dei sottogruppi, nell’ipotesi di identificare un meccanismo ragionevole di suddivisione tra gruppo e gruppo, ma il percorso poi si fa sempre più accidentato. Il grafico dell’immagine 3 mostra la curva per la posizione 10 e la corrispondente percentuale di vittoria contro le altre delle prime 100, divise in semplici sottogruppi di cinque posizioni. Siccome è una curva che si legge facilmente, proviamo a sovrapporre quella relativa alla posizione 78 vista in precedenza.

IMMAGINE 3 – Percentuale di vittoria per la posizione 10 contro le altre delle prime 100 divise in gruppi di cinque

Osserviamo ancora una tendenza generale, ma è aumentata la variabilità. In particolare, è rimarchevole la similarità nell’inversione della curva per i gruppi dalla numero 56 alla numero 70 per due posizioni così distanti tra loro (la 10 e la 78). C’è un declino importante nella dimensione del campione per la pozione 10 in quei sottogruppi (rispetto alle posizioni dalla 40 alla 55), ma così non è per la 78. Sembra che in quell’area di classifica accada qualcosa, perché la percentuale di vittoria dei sottogruppi dalla 56 alla 70 contro le altre delle prime 100 è molto ravvicinata a quella dei sottogruppi dalla 40 alla 55, mentre è relativamente distante da quella dalla 71 alla 85. È possibile che le giocatrici emergenti si fermino brevemente tra le posizioni 56 e 70 prima di arrivare molto più in alto?

Non ho dedicato il giusto tempo ai dati per rendere questa una vera e propria analisi, ma aggiungo un po’ di statistiche divertenti seppur di poco conto.

Curiosità nel confronto tra posizioni

Iniziamo con una domanda facile, perché vi ho già dato le informazioni per rispondere, anche se poi vi ho distratto con i grafici. Ma dopo questa, diventa quasi impossibile (a meno di non avere un proprio database. Ne approfitto per dire che la maggior parte dei dati grezzi che ho usato arriva dal database di Jeff Sackmann).

Domanda (D) 1: qual è il numero medio di partite giocate per scontri diretti unici tra posizioni in classifica?

Risposta (R) 1: ci sono 5.6 partite per scontri diretti unici. Non è meno di quanto avevate immaginato per 15 anni di partite del circuito maggiore?

D2: quale percentuale delle 4951 partite uniche tra posizioni in classifica è composta da almeno dieci partite giocate?
R2: circa il 12%. Credo si capisca ora che questo esercizio non è molto più utile da un punto di vista predittivo di quanto non lo siano gli scontri diretti.

D3: in quante coppie di posizioni in classifica con almeno dieci partite, quindi fuori dal 12% della domanda 2, c’è una posizione con un record perfetto (quindi quali posizioni sono almeno 10-0 contro un’altra posizione)?
R3: ci sono nove posizioni con un record perfetto contro un’altra posizione.

D4: qual è la posizione in classifica peggiore ad avere uno di quei record perfetti?
R4: la numero 24 ha un record perfetto (12-0) contro la numero 66. Tutte le altre posizioni con un record perfetto sono migliori della numero 24.

D5: in quali di quei nove record perfetti le due posizioni in classifica sono più ravvicinate?
R5: si tratta della numero 18 contro la numero 38 (record di 10-0).

D6: in quale di quei nove record perfetti la posizione con il record perfetto ha più vittorie in assoluto?
R6: si tratta della numero 2 contro la numero 41, e della già citata numero 25 contro la numero 66, con dodici vittorie in entrambi i casi.

D7: quali posizioni in classifica si sono incontrate più spesso?
R7: la numero 1 contro la numero 4 (32 volte, con la numero 1 che ha un record di 19-13). Al secondo posto la numero 1 contro la numero 7 (30 volte, con la 1 che ha un record di 21-9). Se pensavate alla numero 1 contro la numero 2, in realtà è al quarantesimo posto. Chissà se è la stessa cosa tra gli uomini.

D8: in uno specifico scontro tra posizioni in classifica quale posizione peggiore (quindi più indietro in classifica) ha la migliore percentuale di vittoria? La maggior parte delle posizioni con classifica più bassa ha una percentuale di vittoria ridotta, ma non tutte…
R8:  la numero 18 contro la numero 9 (con un record di 11-1).

D9: qual è la percentuale di vittoria delle prime 10 come gruppo contro la posizione numero 1?
R9: 32.2%.

D10: quale posizione tra le prime 10 ha la migliore percentuale di vittoria contro la posizione numero 1?
R10: la numero 6 (13-14).

D11: e quale posizione delle prime 10 ha perso più spesso contro la numero 1?
R11: la numero 9 (con un record di 14-3 a favore della numero 1).

D12: quante posizioni tra le prime 100 non hanno mai battuto la numero 1?
R12: 45.

D13: di queste 45, quale posizione in classifica ha avuto più possibilità di battere la numero 1?
R13: la numero 58 ha avuto 12 opportunità.

D14: quante sono le posizioni in classifica che non hanno mai giocato contro?
R14: 71, o circa l’1.5% di tutti i possibili accoppiamenti.

Domanda bonus: quante posizioni delle prime 100 non hanno mai perso contro la numero 1 negli ultimi 15 anni?
Risposta bonus: una, la numero 95, ma si tratta solo di una partita, quella in cui Klara Koukalova (Zakopalova da nubile) ha battuto Serena sulla terra nei trentaduesimi di finale del torneo di Marbella 2009. A seguire, il miglior record contro la numero 1 è una vittoria e una sconfitta della posizione numero 55. Va sottolineato che la numero 1 ha giocato contro tutte le posizioni delle prime 100 almeno una volta. ◼︎

Anonymized Rank vs Rank Win Percentages on the WTA Tour

DELLO STESSO AUTORE