Il più grande archivio italiano di analisi statistiche sul tennis professionistico. Parte di Tennis Abstract

Il più grande archivio italiano di analisi statistiche sul tennis professionistico. Parte di Tennis Abstract

Guida ufficiale al mio sistema di classifica JRank

ULTIMI ARTICOLI

ULTIMI ARTICOLI

Pubblicato il 28 maggio 2012 su TennisAbstract – Traduzione di Edoardo Salvati

// Nei miei articoli faccio spesso riferimento al “mio sistema di classifica”, che utilizzo per fare previsioni sui risultati dei tornei. Il sistema è ufficiosamente denominato “JRank”, ma avrebbe bisogno di un un nuovo nome. La classifica che genera è superiore a quella ATP (e presumibilmente a quella WTA) nel senso che ha una migliore facoltà predittiva dei risultati delle partite del circuito o dei Challenger.

Se l’algoritmo su cui si basa è complicato, non lo sono le idee che lo ispirano. La differenza fondamentale tra JRank e la classifica ATP è il modo in cui vengono valutate le singole partite.

JRank contro ATP

Il sistema ATP assegna punti in funzione dei tornei e del turno superato (una vittoria al primo turno di Wimbledon vale più di una vittoria al primo turno di Halle; una vittoria al terzo turno del Roland Garros vale più di una vittoria al secondo turno).

JRank invece assegna punti in funzione dell’avversario e di quando una partita è stata giocata. Una vittoria contro Rafael Nadal quindi vale molto più di una vittoria su Igor Kunitsyn, anche se entrambe si verificano allo stesso turno dello stesso torneo. E una vittoria su Kunitsyn vale di più se è avvenuta la settimana scorsa piuttosto che otto mesi fa. Una vittoria recente infatti fornisce più informazioni sull’attuale stato di forma di un giocatore di quanto non faccia una vittoria ottenuta tempo fa. 

Il vantaggio di attribuire un peso maggiore alle partite più recenti consiste nel fatto che è possibile prendere in considerazione partite più vecchie di un anno senza esporsi agli svantaggi del sistema su due anni proposto da Nadal che premia eccessivamente i veterani del circuito.

JRank utilizza tutte le partite degli ultimi due anni, ma una partita di un anno fa vale solo la metà di una della settimana scorsa, mentre una partita di due anni fa vale solo un quarto. In questo modo si beneficia della disponibilità di una maggiore quantità di dati senza favorire indebitamente i veterani.

Costanza e superficie

Un altro elemento positivo arriva dal fatto che JRank è più “costante” di settimana in settimana, non ci sono cioè effetti strani derivanti da un torneo che esce dal punteggio dopo un anno – come se i risultati di un giocatore risalenti a 51 settimane fa sono il 100% più rilevanti dei risultati di 54 settimane fa!      

JRank ha ulteriore valore perché crea classifiche differenziate per tipologia di superficie. Tutti sanno che la superficie conta, ma la classifica ATP ignora completamente questo aspetto. Se si vuole conoscere il favorito al Roland Garros, sembra quasi ridicolo attribuire importanza analoga ai risultati del Master di Parigi Bercy e a quelli del Monte Carlo Masters.

JRank assegna un peso maggiore alle vittorie di un giocatore sulla terra per la sua classifica su quella superficie, e così per le altre. Va da sé che battere uno specialista della terra battuta vale di più sulla terra che sul cemento.

Elaborare previsioni

Con questo tipo di classifiche a disposizione, sono veloci i passaggi che consentono di elaborare previsioni per qualsiasi torneo. In ogni partita, il pronostico si basa quasi esclusivamente sulla classifica dei due giocatori (la formula è una versione leggermente più complicata di A / A+B, dove A è rappresentato dai punti della classifica di un giocatore e B da quelli dell’altro. Funziona, più o meno, anche con i punti ATP).

Ci sono, però, alcuni aggiustamenti. Primo, le mie ricerche hanno evidenziato come i qualificati, i lucky loser e le wild card ottengano risultati sotto le attese. Il motivo non è chiaro anche se sospetto che per i qualificati sia dovuto a un fattore stanchezza: i loro avversarsi sono più freschi perché per qualificarsi servono due o tre partite.

Secondo, ho stabilito che esiste un piccolo fattore campo. Una volta tenuto conto della superficie, il fattore campo è minimo, ma comunque presente, visto che il giocatore “di casa” gioca circa il 2% meglio delle attese. Forse è un arbitraggio più favorevole, il cibo o il tifo locale, o una combinazione di questi elementi.

Gli scontri diretti sono indicazione superflua

Un suggerimento che spesso mi arriva è quello di ricomprendere gli scontri diretti nelle previsioni di ciascuna partita. È un’idea che ho sperimentato, ma non sembra fare troppa differenza, almeno non per un’ampia casistica incrociata di scontri diretti (forse, se un paio di giocatori ha dieci o più scontri diretti, emerge una particolare tendenza).

Nella maggior parte dei casi, se il sistema di classifica rappresenta una buona approssimazione dello stato di forma di un giocatore, quella degli scontri diretti è un’indicazione superflua.

Potrebbero esserci altre variabili degne di attenzione, tra cui l’importanza del torneo, la stanchezza di un giocatore o i suoi recenti infortuni, o l’esperienza maturata giocando in uno specifico evento. Al momento, sono parametri che non ho ancora testato. ◼︎

The Official JRank Reference

DELLO STESSO AUTORE