La fortuna del sorteggio: Australian Open 2020 (donne)

di Chapel Heel // HiddenGameOfTennis

Pubblicato il 19 gennaio 2020 – Traduzione di Edoardo Salvati

Come per gli uomini, anche per le donne ho eseguito una simulazione (con la mia variante Elo) di 100.000 configurazioni del tabellone principale, utilizzando lo stesso metodo che gli organizzatori usano per assegnare ai giocatori la loro posizione. L’ho poi confrontata con la previsione per il torneo su base Elo rispetto al tabellone effettivo.

La tabella mette a confronto la previsione effettiva del tabellone con i risultati dalle simulazioni di rimescolamento, in modo da avere alcune indicazioni sull’accessibilità del tabellone effettivo rispetto alle altre configurazioni. Tonalità di rosso (e arancione) evidenziano la sfortuna del giocatore. Al contrario, tonalità di verde rappresentano la fortuna ricevuta nel tabellone effettivo, in riferimento a un particolare turno. Il giallo simboleggia neutralità, e si può di fatto ignorare qualsiasi valore superiore o inferiore allo 0.2%.

Per una presentazione più compatta rispetto al passato, ho riportato nella tabella solo le teste di serie, e organizzato nella tabella successiva quei giocatori fuori dalle teste di serie per i quali c’è stata un’incidenza degna di nota (almeno l’1.0% di segno positivo o negativo).

Tabellone effettivo e simulato a confronto per le teste di serie

Generalmente, si vedono un po’ di tonalità di rosso e di verde nei numeri relativi ai quarti di finale, ma da li in avanti è quasi tutto giallo o sui toni dell’arancione. In questo senso la riga di Naomi Osaka appare particolarmente negativa (che ha superato il primo turno, n.d.t.), all’opposto quella di Serena Williams decisamente positiva (anche lei vincitrice al primo turno, n.d.t.). Forse è la volta buona per Williams di raggiungere il record di Slam di Margaret Court.

IMMAGINE 1 – Confronto tra tabellone effettivo e simulazioni per le teste di serie

Effetti di rilievo su una selezione di giocatrici fuori dalle teste di serie

A Maria Sharapova non era andata bene agli US Open 2019, forse in Australia la fortuna sta cercando di recuperare (ha però perso subito al primo turno, n.d.t.). Caroline Wozniacki invece non ha ricevuto nessun regalo di addio alle competizioni (ma ha superato il primo turno, n.d.t.).

IMMAGINE 2 – Effetti della casualità del sorteggio su alcune non teste di serie

Luck of the Draw: Australian Open 2020 (Women)

La fortuna del sorteggio: Australian Open 2020 (uomini)

di Chapel Heel // HiddenGameOfTennis

Pubblicato il 19 gennaio 2020 – Traduzione di Edoardo Salvati

Come d’abitudine per gli Slam, ho eseguito una simulazione (con la mia variante Elo) di 100.000 configurazioni del tabellone principale, utilizzando lo stesso metodo che gli organizzatori usano per assegnare ai giocatori la loro posizione. L’ho poi confrontata con la previsione per il torneo su base Elo rispetto al tabellone effettivo.

La tabella mette a confronto la previsione effettiva del tabellone con i risultati dalle simulazioni di rimescolamento, in modo da avere alcune indicazioni sull’accessibilità del tabellone effettivo rispetto alle altre configurazioni. Tonalità di rosso (e arancione) evidenziano la sfortuna del giocatore. Al contrario, tonalità di verde rappresentano la fortuna ricevuta nel tabellone effettivo, in riferimento a un particolare turno. Il giallo simboleggia neutralità, e si può di fatto ignorare qualsiasi valore superiore o inferiore allo 0.3%.

Per una presentazione più compatta rispetto al passato, ho riportato nella tabella solo le teste di serie, e organizzato nella tabella successiva quei giocatori fuori dalle teste di serie per i quali c’è stata un’incidenza degna di nota (almeno lo 0.5% di segno positivo o negativo).

Tabellone effettivo e simulato a confronto per le teste di serie

Rispetto a tabelloni casuali, la parte bassa del tabellone principale è più difficile di quella alta. A David Goffin non è andata proprio bene essendo finito nella sezione del giocatore più in forma del momento, Andrey Rublev, che invece è tra i più fortunati, come Matteo Berrettini. Pensavo che la testa di serie numero 8 per Berrettini fosse eccessiva, perché non mi sembra tra i primi otto favoriti, ma so che le teste di serie procedono in automatico. Comunque, ha il tabellone più fortunato tra tutte le teste di serie.

IMMAGINE 1 – Confronto tra tabellone effettivo e simulazioni per le teste di serie

Effetti di rilievo su una selezione di giocatori fuori dalle teste di serie

Kevin Anderson ha giocato abbastanza bene all’ATP Cup. Con un pò di fortuna potrebbe superare un po’ di turni, magari fino agli ottavi. I quarti di finale sembrano troppo ambiziosi. Fresco vincitore del primo torneo, Ugo Humbert non è stato ricompensato con un percorso semplice. Ma non credo farà troppa differenza perché, anche scarico di adrenalina, dovrebbe perdere da John Millman al primo turno.

IMMAGINE 2 – Effetti della casualità del sorteggio su alcune non teste di serie

Luck of the Draw: Australian Open 2020 (Men)

I favoriti agli Australian Open 2020

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 17 gennaio 2020 – Traduzione di Edoardo Salvati

Dopo aver visto le favorite per gli Australian Open 2020, a tabellone maschile completo quali sono le probabilità di vittoria dei Grandi Tre per il primo Slam dell’anno? E ci sono altri seri contendenti al titolo?

Con l’avvio delle competizioni, tutti si chiedono quale dei Grandi Tre sarà il primo a vincere uno Slam nel 2020. Sulla base delle mie valutazioni, Novak Djokovic e Rafael Nadal hanno la probabilità più alta, con un leggero margine per Djokovic dopo il solido livello di gioco mostrato durante l’ATP Cup.

I soliti noti

Djokovic ha quasi una probabilità su tre di titolo, Nadal quasi una su quattro, e la finale tra i due è l’esito più probabile. I molti appassionati di tennis che si sono entusiasmati per il secondo set della loro partita all’ATP Cup sono certamente in trepidante attesa a Melbourne per un altro episodio della saga.

La terza posizione di Roger Federer non dovrebbe rappresentare una sorpresa, almeno per i più attenti. Più sorprendente potrebbe invece essere il fatto che la distanza di Federer da Djokovic e Nadal sia così ampia, visto che entrambi hanno più del doppio della probabilità di vincere il torneo. Questo dipende solo in parte dalla valutazione attuale della forma di Federer. Dal lato di Djokovic e con giovani pericolosi come Filip Krajinovic, Hubert Hurkacz, Denis Shapovalov e Matteo Berrettini, la strada di Federer per il titolo è particolarmente in salita.

Alle spalle dei Grandi Tre, la probabilità di vittoria diminuisce vertiginosamente. Non si possono però ignorare le possibilità di un gruppo di giocatori che si sono messi in luce nel 2019, primi fra tutti Daniil Medvedev e Stefanos Tsitsipas che, pur non avendo ancora vinto uno Slam, hanno la probabilità più alta di detronizzare uno dei Grandi Tre.

Non possiamo poi dimenticare di menzionare diversi altri giovani per un risultato di prestigio. Dall’alto verso il basso troviamo Andrey Rublev, Denis Shapovalov (che però ha perso al primo turno, n.d.t.) e Berrettini. Anche Dominic Thiem e Roberto Bautista Agut rientrano tra i favoriti, ma sono convinta che i più giovani tra i possibili primi vincitori di Slam abbiano il vantaggio dell’età dalla loro parte.

Giocatore       Prob. titolo
Djokovic        29.6%
Nadal           26.9%
Federer         12.8%
Medvedev        6.9%
Tsitsipas       5.0%
Rublev          3.9%
Thiem           1.9%
Shapovalov      1.9%
Berrettini      1.3%
Bautista Agut   1.2%

La gioventù che avanza

È incredibile pensare che una probabilità cumulata di quasi il 50% per la vittoria finale tra Djokovic e Nadal sia inferiore a quella che i due avevano lo scorso anno. E non dipende da un loro calo vistoso, quanto dalla crescita degli altri, per alcuni in modo drammatico.

Lo si può osservare nell’andamento delle valutazioni dell’ultimo anno dei primi dieci favoriti. L’aspetto che più colpisce è l’incredibile ascesa dei più giovani dietro ai Grandi Tre, la maggior parte di quali ha guadagnato almeno 100 punti nel corso della passata stagione.

IMMAGINE 1 – Andamento della valutazione dei giocatori nell’ultimo anno

Se davvero esiste un vantaggio psicologico derivante dallo stato di forma, il grafico suggerisce che le aspettative su giocatori come Medvedev, Shapovalov, Berrettini e Rublev dovrebbero essere ancora più alte dell’effettiva previsione di titolo. Perché, tra i primi 10, hanno fatto siglare i miglioramenti più significativi. Anche Tsitsipas è cresciuto naturalmente, solo che un incremento stabile rende la sua evoluzione più insolita rispetto a quella degli altri appartenenti alla Next Gen.

Nonostante abbiano 105 anni insieme, i Grandi Tre continuano a sfidare la ragione e rimanere al vertice del tennis mondiale. Ancora una volta, sono loro a ottenere i favori del pronostico, ma è il primo Slam da qualche tempo a questa parte in cui la probabilità di altri giocatori per la vittoria finale non è un concetto puramente teorico.

Men’s Title Chances for the 2020 Australian Open

Le favorite agli Australian Open 2020

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 17 gennaio 2020 – Traduzione di Edoardo Salvati

Le speranze di una nazione saranno sulle spalle di Ashleigh Barty al via degli Australian Open 2020. Il pronostico suggerisce però che dopo quattro finali Slam consecutive perse, potrebbe essere la volta di Serena Williams.

Con la testa di serie numero uno per lo Slam di casa, Barty sarà probabilmente la giocatrice a sentire la pressione maggiore per la vittoria a Melbourne. Dovrà sfidare anche le previsioni basate su diversi sistemi di valutazione che, nonostante un tabellone teorico più abbordabile da prima della classifica, le assegnano solo una possibilità di titolo su dieci, visto che occupa il quarto posto tra le favorite. Con una probabilità su cinque, Williams non ha il trofeo assicurato, ma è comunque avanti rispetto alle altre contendenti. Queste previsioni non tengono però in considerazione il possibile “effetto finale” che sembra aver colpito Williams, che appunto non ha più vinto uno Slam dagli Australian Open 2017, e dopo aver avuto una figlia.

Serena e poi le altre

La forma di Williams è cresciuta di Slam in Slam, con dimostrazioni di potenza fino alla finale di Wimbledon e degli US Open. Ha inoltre vinto il suo torneo di preparazione a Auckland, un’altra iniezione di fiducia alla vigilia del primo Slam dell’anno. Potremmo assistere a una possibile sfida tra Barty e Williams in semifinale, l’ostacolo più duro per Barty per l’eventuale titolo. La testa di serie numero 8 assegnata a Williams ne sottostima il livello di forma, e la mette in rotta di collisione nei quarti di finale con Naomi Osaka, contro cui ha giocato l’ultima volta nella controversa finale degli US Open 2018.

Karolina Pliskova, anche lei non esente da polemiche, potrebbe essere la giocatrice tra le prime quattro favorite a passare meno osservata. Il fatto però di ritrovarsi dalla parte opposta del tabellone rispetto alle altre tre le ha sicuramente offerto la dose più alta di fortuna.

Giocatrice       Prob. titolo
S. Williams      20.4%
Osaka            13.7%
Kar. Pliskova    11.6%
Barty            9.9%
Sabalenka        4.5%
Halep            4.3%
Keys             4.3%
Kvitova          3.7%
Svitolina        3.7%
Bertens          3.0%

Ci siamo abituati a pensare che, sul circuito femminile, la competizione è così serrata da garantire possibilità di vittoria a chiunque in qualunque torneo. Anche se, rispetto a quanto succede per gli uomini, la probabilità di vittoria si distribuisce in modo più uniforme tra le giocatrici, è interessante vedere quanto abbiano oscillato le loro valutazioni nell’ultimo anno. Per le favorite all’inizio degli Australian Open 2020, si è trattato di un anno movimentato. Williams si è migliorata più di tutte, avendo aggiunto 200 punti alla valutazione del 2019.

Pericolose inversioni di forma

Per le altre, l’andamento più tipico è consistito in una curva piatta nella parte iniziale della stagione, seguita da un incremento deciso a partire da agosto. Barty, Simona Halep ed Elina Svitolina sono le uniche del gruppo ad affacciarsi al primo Slam con una chiara inversione negativa di forma.

IMMAGINE 1 – Andamento della valutazione delle giocatrici nell’ultimo anno

Williams gode dei favori delle statistiche e del livello di gioco più alto dopo la maternità. Se i riflettori puntati su Barty l’aiuteranno a superare la pressione subita nelle finali Slam che ha giocato al rientro sul circuito, potrebbe finalmente raggiungere il record di Margaret Court proprio in Australia.

Women’s Title Chances for the 2020 Australian Open

Quanto raccoglierà l’ATP Cup a favore delle vittime degli incendi in Australia?

di Jeff Sackmann // TennisAbstract

Pubblicato il 3 gennaio 2020 – Traduzione di Edoardo Salvati

L’ATP ha annunciato che effettuerà una donazione sostanziosa alla Croce Rossa Australiana:

Molti giocatori, tra cui Nick Kyrgios, hanno promesso di continuare a fare donazioni personali durante tutta l’estate di tornei in Australia (l’impegno di Kyrgios in questo senso ha incentivato le donazioni altrui, una rara circostanza in cui il circuito ha seguito l’esempio della sua stella più controversa).

Quanto esattamente?

L’ATP ha stimato di raggiungere i 1500 ace. È la prima edizione dell’ATP Cup a Perth, oltre a essere il primo torneo del circuito maschile, quindi non possiamo fare un confronto con l’anno passato. A ulteriore complicazione, non sappiamo chi giocherà per la propria nazione a ogni giornata del torneo, o quali paesi avanzeranno alla fase finale. In altre parole, qualsiasi previsione di ace è inevitabilmente approssimativa.

Iniziamo dalle basi. Ci saranno 129 partite durante la ATP Cup, equivalenti a 43 sfide con due partite di singolare e un doppio ciascuna. Come per le nuove Finali di Coppa Davis, è probabile che molti dei doppi saranno ininfluenti, quindi non verranno giocate tutte le 43 sfide. A Madrid si sono giocate 21 delle 25 partite di doppio (una delle quattro escluse è stato un ritiro sull’1-0 che per il conteggio degli ace, e per il buon senso, non ha di fatto creato gioco). Diciamo quindi che anche in Australia non verranno giocati dei doppi con la stessa frequenza di Madrid, facendo salire il totale a 36 partite di doppio.

Nelle partite al meglio dei tre set dell’intera passata stagione si sono contati in media 12 ace per il singolare e 7 per il doppio. Si arriva a un totale di 1284 ace per le 122 partite che ci aspettiamo vengano giocate nell’ATP Cup.

Possiamo fare di meglio

Sul cemento ci sono notoriamente più ace, e con un margine abbondante. Durante il 2019, nelle partite al meglio dei tre set sul cemento ci sono stati in media 15 ace, rispetto alla metà per le partite di doppio. Il totale previsionale sale a 1542 ace, il 20% in più del numero di partenza, e abbastanza simile ai calcoli dell’ATP.

Pur non avendo molti dati relativi alla superficie di Perth, abbiamo risultati di anni per i tornei di Brisbane e Sydney. Brisbane è stata una delle superfici del circuito più accomodanti in termini di ace, mentre Sydney si è posizionata dalla parte opposta. I numeri variano poi da un anno all’altro, anche tenendo in considerazione la diversa combinazione di giocatori. Da una prospettiva di un solo anno o di un intervallo più lungo, la frequenza media di ace a Brisbane e Sydney arriva a una cifra simile alla media osservata sul resto del circuito.

Elementi che rendono più difficile l’analisi

È probabile che il caldo record australiano contribuirà a incrementare la frequenza di ace. La combinazione dei giocatori invece rende considerevolmente molto più complesso fare previsioni. Un ostacolo è dato dalla variazione estrema tra i migliori giocatori del torneo (Rafael Nadal e Novak Djokovic) e i più deboli, come il moldavo Alexander Cozbinov, numero 818 del mondo.

Un primo ostacolo

Non solo la tipica frequenza di ace di giocatori senza i favori del pronostico come Cozbinov è destinata a ridursi drasticamente contro avversari di livello, ma è probabile che troveranno difficoltà a mantenere la partita competitiva. Più corta è la partita, minore il numero di ace. Ironicamente, Cozbinov ha combattuto per tre ore contro Steve Darcis nella prima giornata, ma anche in una partita così lunga solo 2 su 116 punti al servizio sono stati ace. Insieme, hanno ottenuto un totale di 10 ace, al di sotto della media.

E un secondo

Un secondo problema è comune alle previsioni sul numero di ace per qualsiasi torneo. Il conteggio complessivo degli ace è strettamente legato a quali giocatori arrivano ai turni finali. La Spagna di Nadal, Roberto Bautista AgutPablo Carreno Busta farà probabilmente bene anche con relativamente poche esplosioni sulla prima di servizio.

Se però il Canada replica il successo nelle Finali di Coppa Davis, la combinazione scintillante di Denis ShapovalovFelix Auger Aliassime potrebbe regalare sei turni di statistiche stratosferiche al servizio. Il duo americano formato da John Isner e Taylor Fritz potrebbe fare lo stesso, anche se le probabilità per gli Stati Uniti di andare avanti sono diminuite sensibilmente dopo la sconfitta iniziale contro la Norvegia. Quantomeno Isner ha già fatto la sua parte con 33 ace nella partita persa in tre set contro Casper Ruud.

Nelle prime dieci partite di singolare al momento della stesura ci sono stati in media 16 ace, leggermente sopra il tipico numero sul cemento durante la stagione. Grazie a Inser e Kyrgios, agli estremi dell’intervallo il conteggio è salito, con rispettivamente 37 e 35 ace totali dalle partite contro Ruud e Jan Lennard Struff. I tre doppi terminati hanno avuto una media di 6 ace ciascuno, appena sotto il tipico numero sul cemento durante la stagione (dopo il terzo giorno, gli ace totali sono 559, per un ammontare di 55.900 dollari, n.d.t.).

Si tifa per il massimo degli ace

Manca ancora molto, ma si potrebbe dire “sorpresa”! La stima dell’ATP in fondo sembra abbastanza accurata. Una simulazione integrale di ogni partita e dell’intero torneo permetterebbe ancora maggiore precisione ma, senza arrivare a tanto, 1500 ace e 150.000 dollari sono un’ottima approssimazione. La filantropia di tutto il mondo dovrebbe mettersi alle spalle dei grandi servitori dell’Australia, del Canada e degli Stati Uniti, o almeno tifare per più ace della media da parte di Nadal.

How Much Will the ATP Cup Raise for Australian Bushfire Relief?

Ripensare il risultato di una partita in termini di probabilità

di Jeff Sackmann // TennisAbstract

Pubblicato il 28 dicembre 2019 – Traduzione di Edoardo Salvati

Non serve aspettare la conclusione di una partita per sentire durante la telecronaca che le vittorie possono essere decise dal margine più risicato. È frequente per il vincitore raccogliere solo il 51% o il 52% dei punti totali. In decine di occasioni nel corso dell’anno capita di andare anche oltre, quando un giocatore trionfa avendo ottenuto meno della metà dei punti. Così è riuscito a fare Novak Djokovic nella finale di Wimbledon 2019, con 204 punti a suo favore rispetto ai 218 di Roger Federer.

Ha senso dedurre da risultati come quello tra Djokovic e Federer che molte partite sono decise da margini davvero ridotti o che il rendimento su determinati punti è cruciale. Ci sono addirittura situazioni di vittoria con non più del 47% dei punti giocati.

Può capitare però di attribuire al margine ridotto importanza eccessiva. Il 51% richiama effettivamente l’idea di un margine minimo, così come il 53%. In molte attività, sportive e non, il 55% rappresenta quasi una parità, e anche il 60% o il 65% suggerisce che non ci sia molto spazio a separare i contendenti. Nel tennis è diverso, specialmente sul circuito maschile che è dominato dal servizio. Quale ne sia l’interpretazione, il 60% dei punti vinti segnalano una partita a senso unico, il 65% una demolizione quasi imbarazzante. Nel 2019, in sole tre partite il vincitore ha raccolto più del 70% dei punti.

La domanda è un’altra

Per molte ragioni i punti vinti totali sono una misura imperfetta della superiorità di un giocatore, anche all’interno della singola partita. Un primo difetto è che di solito il valore si dispone nell’intervallo tra il 35% e il 65%, portando all’errata convinzione che tutte le partite siano relativamente equilibrate. Un secondo difetto è che non tutti i 55% (o i 51%, o i 62%) sono identici tra loro. Più è lunga la partita, più informazioni accumuliamo sui giocatori.

Per uno specifico formato di gioco, come le partite al meglio dei tre set, una partita più lunga mediamente richiede giocatori tra loro simili per andare al tiebreak o al terzo set. Se vogliamo però paragonare partite di formati diversi (come quelle al meglio dei tre set e dei cinque set), non necessariamente la durata fornisce indicazioni utili. Le partite al meglio dei cinque set sono più lunghe per via del regolamento, non per qualche caratteristica dei giocatori.

La soluzione risiede nel pensare in termini di probabilità

Data la durata di una partita, e la percentuale di punti vinti da ciascun giocatore, qual è la probabilità che il vincitore sia stato anche il giocatore migliore quel giorno?

Per rispondere, usiamo la distribuzione binomiale, considerando la probabilità che un giocatore vinca un numero di punti uguale a quelli che vincerebbe a parità di bravura fra giocatori. Se lanciamo una moneta 100 volte, ci aspetteremmo che esca testa circa 50 volte, senza però che siano sempre esattamente 50 volte. La distribuzione binomiale serve per sapere quanto spesso attendersi un particolare numero di testa su cento lanci: 49, 50 o 51 sono comuni, 53 un po’ meno, 55 ancora meno, 40 o 60 rari e così via. Esiste una probabilità che un qualsiasi numero di testa sia dovuto unicamente al caso, come esiste una probabilità che si verifichi perché la moneta è truccata.

Come si rapporta tutto questo a una partita di tennis?

Quando inizia la partita, facciamo finta di non sapere nulla della bravura dei giocatori e ipotizziamo che siano dello stesso livello. Il numero di punti è equivalente al numero di lanci della moneta, più sono i punti più è probabile che il giocatore che ne vince di più è realmente il migliore dei due. Il numero di punti del vincitore corrisponde al numero di testa nei lanci. Se il vincitore vince il 60% dei punti, possiamo stare certi che è il migliore, allo stesso modo in cui il 60% di testa su cento o più lanci farebbe supporre che probabilmente la moneta è truccata.

Più del solo 59%

La distribuzione binomiale aiuta a convertire queste intuizioni in probabilità. Facciamo un esempio. La finale del Roland Garros 2019 è stata abbastanza a senso unico. Rafael Nadal ha vinto il 58.6% del totale dei punti (116 su 198) contro Dominic Thiem, pur avendo perso il secondo set. Se Nadal e Thiem fossero allo stesso livello, la probabilità che Nadal vinca così tanti punti è poco meno dell’1%. Possiamo quindi dire che c’è una probabilità del 99% che Nadal sia stato — in quel giorno e con quelle condizioni — il giocatore migliore. Non è una sorpresa, e non dovrebbe esserlo.

Il ragionamento si fa più interessante modificando la durata della partita. Le altre due finali maschili del 2019 in cui un giocatore ha vinto circa il 58.6% dei punti sono state vinte da Djokovic. Al Masters di Parigi Bercy ha vinto il 58.7% dei punti (61 su 104) contro Denis Shapovalov, e a Tokyo il 58.3% (56 su 96) contro John Millman.

Vista la differenza di formato, al meglio dei tre set in questo caso, Djokovic ha impiegato la metà del tempo di Nadal, quindi la certezza che sia stato un giocatore migliore, per quanto comunque alta, non dovrebbe essere così vicina al 100%. La distribuzione binomiale assegna a quelle vittorie una probabilità rispettivamente del 95% e 94%.

Considerare anche la durata

In media, il vincitore di una partita del circuito maschile nella stagione 2019 ha vinto il 55% dei punti totali, un numero che può indicare un distacco minimo, anche se gli appassionati più attenti sanno che non è così. Una volta trasformato ogni risultato in probabilità, la probabilità media che il vincitore è anche il giocatore più forte è dell’80%.

Non solo è un numero che, intuitivamente, dà un’interpretazione superiore — sono meno infatti i risultati raggruppati intorno al 55%, con i numeri che si distribuiscono tra il 15% e il 100% — ma considera anche la durata della partita, un aspetto invece ignorato dalla vecchia maniera dei punti vinti totali.

Perché è importante?

Si potrebbe giustamente credere che chiunque interessato a quantificare i risultati delle partite abbia già avuto questo tipo di intuizioni. Si sa ad esempio che il 55% dei punti vinti corrisponde a una vittoria di misura, il 60% a una più facile, e che la durata della partita implica la necessità di leggere questi numeri in funzione del contesto. I punti validi per la classifica e i premi partita vengono assegnati senza tenere conto di queste particolarità, perché quindi cercare un’alternativa?

Per me ha un valore potenziale come modalità rappresentativa del margine di vittoria. Risponde a logica il fatto che qualsiasi sistema di valutazione, come le mie valutazioni Elo, incorpori il margine di vittoria, perché è più difficile vincere demolendo l’avversario di quanto non lo sia in una partita equilibrata. In altre parole, un giocatore che vince il 59% dei punti contro Thiem è probabilmente più forte di uno che ne vince il 51%, sempre contro Thiem. I sistemi di valutazione dovrebbero darne credito.

Ce ne sono già alcuni che lo fanno, tra cui quello introdotto recentemente da Martin Ingram e di cui abbiamo parlato in un podcast. Molti sistemi però non tengono in considerazione il margine di vittoria, tra cui le mie valutazioni Elo. Mi sono cimentato negli anni a provare tutti i possibili modi di integrare il margine di vittoria, non riuscendo a trovarne uno che riesca ad accrescere con continuità il potere predittivo delle valutazioni. Magari è la volta giusta.

Leva e partite lotteria

Ho già accennato a una limitazione di questo approccio, che riguarda la maggior parte degli altri indici sul margine di vittoria. Nella finale di Wimbledon 2019 Djokovic ha vinto solo il 48.3% dei punti totali, riuscendo ad alzare il trofeo grazie a una prestazione superiore a quella di Federer nei momenti più importanti. L’interpretazione del margine di vittoria in termini di probabilità restituisce più risultati all’80% che al 55%, ma anche più risultati al 25% che al 48%. Secondo questa metodologia, esiste solo una probabilità del 24% che Djokovic fosse il giocatore migliore quel giorno a Londra. Seppur una posizione non priva di fondamento, non dimentichiamo il divario di punti a favore di Federer, è però un po’ scomoda.

Con la distribuzione binomiale come descritta in precedenza, tralasciamo completamente la leva, il concetto cioè per il quale alcuni punti hanno più rilevanza di altri. Per quanto la maggior parte dei giocatori non produce un rendimento sempre ottimo o sempre pessimo in circostanze di alta leva, molte partite sono decise esclusivamente da come un giocatore si comporta in quei momenti chiave.

Indice di Leva e Indice di Dominio

Una soluzione potrebbe essere l’inserimento della mia nozione di Indice di Leva, che mette a confronto l’importanza dei punti vinti da ciascun giocatore. Sono poi andato avanti unendo l’Indice di Leva all’Indice di Dominio, una statistica molto vicina ai punti vinti totali, in un solo numero che chiamo DR+, o Indice di Dominio corretto.

È possibile vincere una partita con un Indice di Dominio inferiore a 1.0, che significa vincere meno punti alla risposta di quelli vinti dall’avversario, un’occorrenza che si verifica spesso quanto i punti vinti totali sono meno del 50%. Quando però il DR è corretto per la leva, è estremamente raro per un vincitore terminare con un DR+ inferiore a 1.0. L’Indice di Dominio di Djokovic nella finale di Wimbledon è stato dello 0.87, mentre il suo DR+ dello 0.97, una delle pochissime volte in cui il valore corretto del vincitore è rimasto sotto l’1.0.

Sarebbe impossibile aggiustare il metodo della distribuzione binomiale allo stesso modo in cui ho “sistemato” l’Indice di Dominio. Non si può semplicemente moltiplicare il 65%, l’80% o qualsiasi altro numero, per l’Indice di Leva e aspettarsi un risultato che abba senso. E potrebbe non essere così interessante. Il calcolo dell’Indice di Leva richiede accesso alla sequenza punto per punto della partita, senza poi considerare la complessità del codice per la probabilità di vittoria, che lo rende estremamente lungo, anche in presenza dei dati necessari.

Per il momento, la leva non è qualcosa che si riesce a sistemare, ma solo qualcosa di cui possiamo essere consapevoli, come per i numeri sul margine di vittoria che confondono, ad esempio il 24% di Djokovic nella finale di Wimbledon.

Nuove interpretazioni

Al pari di altre statistiche di mia ideazione, non mi aspetto che vi sia di questa un’adozione diffusa. Se, nella migliore delle ipotesi, diventasse un elemento accrescitivo delle valutazioni Elo, sarebbe un utile passo avanti, anche senza dover approfondire ulteriormente. L’obiettivo ultimo è quello di creare indici che raccolgano più dettagli delle nostre intuizioni. Anche se ci siamo abituati alle stranezze del punteggio tennistico, un universo in cui il 52% dei punti vinti totali segnala una partita equilibrata e il 54% non lo fa, non significa che non possiamo fare meglio di così. Pensare in termini di probabilità richiede uno sforzo aggiuntivo, ma quasi sempre fornisce preziosa conoscenza.

Rethinking Match Results as Probabilities

Un’introduzione all’uso di Elo nel tennis

di Jeff Sackmann // TennisAbstract

Pubblicato il 3 dicembre 2019 – Traduzione di Edoardo Salvati

Elo è il nome di un sistema di valutazioni di giocatori e giocatrici di tennis di qualità superiore rispetto alle formule che determinano le classifiche ufficiali per il circuito maschile e femminile. Da lettori seriali del mio blog o ascoltatori del podcast, ne sarete sicuramente venuti a conoscenza. A meno però di esservi ritrovati a contatto diretto con le valutazioni Elo in precedenza o di aver approfondito personalmente li tema, potreste pensare che sia una sorta di concetto che pertiene la sfera mitologica del tennis. Vale la pena dedicare del tempo a una comprensione più dettagliata del suo funzionamento.

L’algoritmo di base

Il principio sottostante qualsiasi sistema Elo è quello per cui la valutazione di un giocatore è una stima della sua bravura, che è possibile aggiornare dopo ogni partita (o torneo). Se un giocatore vince, la sua valutazione aumenta. Se perde, diminuisce. Dove Elo eccelle, è nel determinare l’ammontare secondo cui la valutazione dovrebbe salire o scendere.

Due sono le variabili principali considerate: quante partite sono già presenti nel sistema (vale a dire, quanta sicurezza abbiamo nella valutazione prima della partita) e la qualità dell’avversario. Riflettendoci bene, queste due variabili sono una buona approssimazione dell’idea che ci siamo già fatti della bravura di un giocatore. Più informazioni possediamo di un giocatore, più difficilmente cambieremo l’opinione che ne abbiamo sulla base di una sola partita.

La sconfitta di Novak Djokovic contro Dominic Thiem nel girone delle Finali di stagione è stata una sorpresa, ma solo il tifoso più apocalittico ha interpretato il risultato come un disastro che avrebbe dovuto modificare la stima della bravura di Djokovic. In modo analogo aggiustiamo l’opinione di un giocatore rispetto alla qualità dell’avversario. Una sconfitta contro Thiem genera delusione, ma una contro Marco Cecchinato, come nella semifinale del Roland Garros 2018, è più preoccupante. Il sistema Elo incorpora questo tipo di intuizioni istintive.

L’ampiezza delle valutazioni Elo

Tradizionalmente, all’ingresso nel sistema Elo e prima di accumulare risultati, un giocatore riceve una valutazione di 1500. È un numero completamente arbitrario. Tutto quello che conta è la differenza tra le valutazioni dei giocatori: se assegnassimo di partenza 0, 100 o 888, il risultato finale di quella differenza rimarrebbe il medesimo.

Quando ho iniziato a calcolare le valutazioni Elo, ho mantenuto la tradizione di partire da 1500. Negli anni, ho allargato l’orizzonte ai Challenger (e agli equivalenti tornei nel circuito femminile organizzati dalla Federazione internazionale) e alle qualificazioni del circuito maggiore. In assenza di un correttivo, la scala dell’intero sistema sarebbe stata alterata, generando inevitabile confusione. Quindi, ho sostituito il valore di 1500 con un numero poco superiore a 1200 (in funzione della categoria del torneo e della distinzione tra uomini e donne), così da ottenere una valutazione sostanzialmente identica.

Attualmente, il numero uno e la numero uno del mondo sono Rafael Nadal e Ashleigh Barty, con una valutazione Elo di 2203 per Nadal e 2123 per Barty. Questo è l’intervallo in cui stazionano i migliori, e i fenomeni assoluti spesso si avvicinano a 2500. Secondo la più recente versione del mio algoritmo, il picco di Djokovic è stato di 2470 e quello di Serena Williams di 2473. La quota di 2000 separa con buona precisione le élite dagli altri giocatori. Al momento, sei uomini e sette donne hanno valutazioni così alte. Sedici uomini e diciotto donne hanno valutazioni di almeno 1900. Una valutazione di 1800 equivale grossomodo a un posto tra i primi 50.

Confronto tra epoche e inflazione Elo

Se si riesce ad assegnare un valore Elo massimo a ogni giocatore, viene automatico iniziare a fare confronti tra epoche. Seppur un passatempo divertente, sono convinto che nessun sistema di valutazione dei giocatori di tennis abbia una qualche utilità ai fini di un raffronto tra epoche diverse, neanche Elo. Quello che può fare però è mettere a confronto la bravura di un giocatore rispetto ai suoi avversari.

Nel 1990, Helena Sukova raggiunse un valore di 2123, lo stesso posseduto ora da Barty. Non significa che Sukova era forte al tempo quanto lo è Barty adesso. Significa invece che hanno avuto un rendimento simile contro le rispettive avversarie. Le giocatrici di seconda fascia trent’anni fa erano considerevolmente più deboli, quindi in un certo senso era più facile raggiungere valutazioni molto elevate. Sukova occupava l’undicesima posizione Elo, molto lontana dal 2600 di Steffi Graf.

Questo per dire che Elo non permette un confronto tra epoche a meno di non essere certi che il livello della competizione sia analogo, o a meno di non avere altre idee per gestire quella variabile, un campo minato che ha respinto molti tra coloro che hanno approfondito il tema.

Inflazione e deflazione

Una problematica correlata è il concetto di inflazione o deflazione Elo, che può rendere ancora più complicati confronti tra epoche. Ogni volta che si gioca una partita, vincitore e sconfitto di fatto si “scambiano” alcuni dei loro punti, in modo da lasciare il numero totale dei punti nel sistema inalterato. Quando però un nuovo giocatore fa il suo ingresso, il totale dei punti aumenta. Al ritiro invece, il totale diminuisce.

Sarebbe più facile se addizioni e sottrazioni di punti si equivalessero, in modo da annullarsi, ma per molte competizioni che usano Elo questo non accade. Le addizioni tendono a essere maggiori delle sottrazioni, facendo crescere le valutazioni Elo nel corso del tempo. Non sembra che questo si verifichi con le mie valutazioni, almeno in parte perché ho previsto una penalizzazione per gli infortuni che tengono lontano dal gioco, ma è utile per ricordare che il numero di punti del sistema non è statico, e per ragioni non legate alla bravura dei giocatori di vertice.

Previsioni Elo

Iniziano a essere più chiare le caratteristiche di utilizzo di Elo come sistema che fornisce la valutazione di un giocatore rispetto a quella degli altri. Uno dei principali scopi di qualsiasi sistema di valutazione è la previsione del risultato delle partite, e in questo Elo riesce meglio della maggior parte dei suoi avversari, tra cui anche le classifiche ufficiali dell’ATP e della WTA. L’unico parametro necessario per fare una previsione è la differenza tra la valutazione dei due giocatori, da inserire poi nella seguente formula:

1 – (1 / (1 + (10^((differenza) / 400))))

Se volessimo prevedere una rivincita dell’ultima partita delle Finali di Coppa Davis, dovremmo prendere le valutazioni di Nadal e Denis Shapovalov (2203 e 1947), calcolare la differenza (256) e applicare la formula, ottenendo una probabilità di vittoria per Nadal dell’81.4%. Con la differenza negativa (-256) avremmo ottenuto la speculare probabilità di un risultato a sorpresa per Shapovalov del 18.6%.

La mia versione Elo nel tennis si basa sul formato più classico delle partite, cioè quello al meglio dei tre set. Per le partite al meglio dei cinque set il calcolo si complica, ma per chi fosse interessato ho scritto del codice. Il punto è che occorre un aggiustamento. Dovessero Nadal e Shapovalov giocare contro agli Australian Open 2020, la probabilità di vittoria di Nadal salirebbe all’86.7%.

Elo specifico per superficie

Per la maggior parte degli sport, ci si potrebbe fermare qui. Una partita è una partita, con poche altre variazioni marginali. Nel tennis però, valutazioni e previsioni dovrebbero variare sensibilmente in funzione della superficie.

Ammetto che la mia soluzione è un po’ complicata. Per ogni giocatore, ci sono quattro diverse valutazioni Elo: complessiva, specifica per il cemento (ma senza distinzioni tra campi all’aperto e al chiuso), specifica per la terra battuta e specifica per l’erba. Ad esempio, Thiem ha una valutazione complessiva di 2066, di 1942 sul cemento, di 2031 sulla terra e di 1602 sull’erba (la specificità di superficie in genere abbassa le valutazioni: quella di Thiem sulla terra è al terzo posto del circuito e lo pone un abisso davanti a tutti gli altri giocatori ad eccezione di Nadal e Djokovic).

Queste valutazioni specifiche per superficie permettono un confronto tra giocatori ignorando i risultati su tutte le altre superfici. Non è però un esercizio realistico, perché la valutazione relativa alla singola superficie non ha un grande potere predittivo dei risultati delle partite.

Una combinazione di superfici

Una soluzione più opportuna arriva da una combinazione al 50% della valutazione per superficie e di quella complessiva. Se volessimo calcolare le probabilità di Thiem per una partita sulla terra, dovremmo usare una valutazione a metà tra il 2066 complessivo e il 2031 della terra.

Nelle mie valutazioni Elo settimanali, la singola superficie è indicata con “HardRaw” (o Solo Cemento, e così via), mentre le valutazioni combinate con “hElo”, “cElo” e “gElo” (h per hard = cemento, c per clay = terra e g per grass = erba). Non esiste una legge fisica che impone una combinazione al 50%. Qualsiasi correzione fatta all’algoritmo di base di Elo è dettata esclusivamente da logiche funzionali.

All’inizio, pensavo che una combinazione tra valutazione specifica e complessiva fosse appropriata, perché il successo di un giocatore su una superficie è in qualche modo correlato a quello sulle altre. Mi attendevo che la combinazione fosse diversa per singola superficie, magari usando una percentuale più alta della valutazione complessiva nel caso dell’erba, visto il numero ridotto di partite su quella superficie. Alla fine però, dalle mie prove è emerso che il 50% funziona su tutte le superfici.

Senza correzioni

Un sondaggio tra appassionati su quali sono le partite più importanti e di quali tornei — per la classifica, per il dibattito sul più forte di sempre, o per qualsiasi altra questione — potrebbe portare a una lunga e dettagliata lista di fattori che definiscono il concetto di grandezza. Forse sono gli Slam a essere più importanti dei Master o dei Premier, anche se forse questi sono meno rilevanti delle Finali di stagione e delle Olimpiadi, e naturalmente le finali sono fondamentali, pure gli scontri diretti tra determinati giocatori, e così via all’infinito.

Elo fornisce una soluzione. Un coefficiente solitamente chiamato “fattore k” permette di assegnare maggiore peso a determinate partite. È frequente nelle valutazioni Elo di altri sport, ad esempio per le partite dei playoff che hanno un fattore k più alto rispetto a quelle della stagione regolare. Ho sperimentato ogni sorta di valore del fattore k per le partite considerate “importanti”, ma devo ancora trovare un’impostazione del sistema che migliori in modo continuativo la sua capacità di fare previsioni sul risultato di una partita.

La penalizzazione per assenza dal circuito

Esiste un’eccezione. In caso di assenza duratura, diminuisco la valutazione del giocatore, per poi aumentare il fattore k nelle prime partite successive al rientro. Ne avevo già parlato in questo articolo. Si tratta di un’estensione logica del modello Elo, specialmente se si pensa alla tipica disposizione mentale che si ha nei confronti di un giocatore rimasto a lungo lontano dal circuito per infortunio. Non si sa mai bene cosa attendersi quando rientra, se è più forte che mai o se è ancora troppo lento. Magari ritornerà in forma presto o magari non recupererà mai la forma di un tempo. Una lunga assenza solleva molte domande. Raramente chi arriva da un infortunio è a un livello superiore al precedente, mentre in molti fanno peggio, mostrando rendimenti in media inferiori.

È inevitabile quindi che, all’immediato rientro da un infortunio, la stima del livello di un giocatore sia inferiore. Tuttavia, si dovrebbe assegnare un peso maggiore a risultati da subito molto validi, da cui un valore più alto del fattore k, che incorpora nella valutazione di un giocatore la mancanza di fiducia che abbiamo sulle sue condizioni successive al rientro da un infortunio. L’algoritmo si complica, ma la logica è semplice. In sostanza, è solo il tentativo di dare rigore interpretativo ad affermazioni del tipo “non so quanto giocherà bene al rientro, ma lo seguirò attentamente”.

La penalizzazione per assenza ha l’effetto collaterale positivo di bilanciare la naturale tendenza di Elo a un’inflazione nelle valutazioni. Se da un lato ci sono più giocatori che entrano nel sistema di quelli che ne escono, facendo aumentare il numero complessivo dei punti disponibili, la penalizzazione toglie dei punti senza che vengano poi allocati nuovamente agli altri giocatori.

La validazione di Elo e altre misure correttive

Più volte ho detto di aver fatto delle prove, oltre ad aver iniziato l’articolo affermando che Elo è di qualità superiore rispetto alle classifiche ufficiali. Cosa significa esattamente, e perché lo si può dire? Il modo più semplice con cui paragonare sistemi di valutazione è una statistica chiamata “accuratezza”, che conta le previsioni fatte correttamente. Ad esempio, Elo ha predetto il vincitore in 36 delle 50 partite delle Finali di Coppa Davis, per un’accuratezza del 72%. La classifica ATP ha predetto il vincitore (nel senso che il giocatore con la classifica più alta ha vinto la partita) in 30, per un’accuratezza del 60%. L’esperimento è ridotto, ma Elo ha demolito la classifica ufficiale. Ed Elo è considerevolmente migliore quando l’arco temporale copre un’intera stagione.

L’indice di Brier

Per questo scopo è più utile l’indice di Brier, che considera il livello di fiducia riposto in ciascuna previsione. Riprendendo il precedente esempio, Elo assegna a Nadal una probabilità dell’81.4% di battere Shapovalov. Se Nadal effettivamente vince la partita, l’81.4% è una previsione “migliore” diciamo rispetto a una del 65%, ma è “peggiore” di una del 90%. L’indice Brier calcola la media del quadrato della differenza tra la previsione (81.4%) e il risultato (0% o 100% a seconda di chi ha vinto), per tutte le partite in oggetto. Remunera l’impudenza di quelle previsioni che si sono rivelate corrette ma, poiché usa il quadrato della differenza, punisce severamente le previsioni aggressive ma sbagliate.

Un metodo più intuitivo per capire la natura dell’indice Brier è di ipotizzare che Nadal e Shapovalov giochino 100 partite di fila (o, con più precisione ma meno intuitivamente, ipotizzare che cento identici Nadal giochino in contemporanea contro cento identici Shapovalov). Una previsione dell’81.4% significa che ci si attende che Nadal vinca 81 o 82 delle 100 partite. Se Nadal ne vince poi 90, la previsione non è stata sufficientemente favorevole nei confronti di Nadal. Non avremo mai cento partite di quel tipo in simultanea, abbiamo però migliaia di partite uniche, molte delle quali hanno la stessa previsione, come il 60% di probabilità di vittoria per il favorito. L’indice di Brier aggrega tutte quelle coppie di previsioni-risultati e restituisce un numero indicativo della bontà del nostro operato.

L’accuratezza ha comunque un valore limitato

È difficile prevedere il risultato delle partite di tennis. A prescindere da quanto è sofisticato un sistema, qualsiasi esso sia, sbaglierà comunque moltissime volte. In molti casi, una previsione “corretta” è a malapena meglio che non fare previsioni, se i dati suggeriscono che i due giocatori sono tra loro alla pari. Per questo, l’accuratezza ha un valore limitato: è più importante avere la giusta dose di fiducia che scegliere semplicemente un vincitore.

Tutte queste parole a dire: le mie valutazioni hanno un indice Brier molto più basso (cioè più preciso) delle previsioni derivanti dalle classifiche del circuito maschile e femminile. Le previsioni fatte con Elo non sono altrettanto puntuali di quelle degli allibratori, altrimenti dedicherei molto più del mio tempo a scommettere che a scrivere di sistemi di valutazione nel tennis.

L’indice di Brier permette inoltre di stabilire se un determinato correttivo — come la combinazione tra superfici, le assenze da infortunio o il tipo di torneo — rappresentano un miglioramento del sistema. La definizione di una penalizzazione per assenza da infortunio riduce l’indice Brier per l’intero gruppo di previsioni Elo, quindi vale la pena considerarla. Diminuire il fattore k per le partite di primo turno non ha effetti rilevanti, quindi si elimina quella pratica.

Per ulteriore approfondimento

Le mie valutazioni Elo del momento: ATP | WTA

Elo esteso al doppio

…e al doppio misto (in inglese)

Codice per Elo nel tennis (in R, che non ho scritto io)

Una gustosa infarinatura sull’indice di Brier (in inglese).

An Introduction to Tennis Elo

La probabilità di doppi decisivi nella nuova Coppa Davis

di Jeff Sackmann // TennisAbstract

Pubblicato il 28 novembre 2019 – Traduzione di Edoardo Salvati

Nel nuovo formato della Coppa Davis, ci sono tre partite per ogni sfida tra nazioni, due di singolare e una di doppio. Si giocano per primi i singolari, rendendo quindi possibile che il doppio perda di valore, cioè sia ininfluente sul risultato finale. 

Gli organizzatori delle Finali di Coppa Davis hanno provato a dare più peso al doppio, utilizzando criteri di spareggio (basati sul numero di set e game vinti) per determinare chi, durante la fase a gironi, si qualifica per quella a eliminazione diretta. Se è servito a mantenere interesse iniziale per i doppi irrilevanti, verso la fine dei gironi le squadre matematicamente qualificate non hanno avuto alcun incentivo a giocare il doppio.

In questo modo il Canada ha regalato il punto agli Stati Uniti con un ritiro pre-partita e l’Australia si è ritirata dopo un solo game giocato. Probabilmente era inevitabile, ma non è di certo auspicabile. Si presume che qualunque appassionato di tennis ne desideri sempre di più, e partite interrotte o non giocate potrebbero gettare scompiglio per lo spareggio.  

Sono molti i modi possibili per un ripensamento dell’evento, talmente tanti che evito di approfondirli in questa sede. Siccome i doppi irrilevanti sono inevitabili, vorrei invece analizzare quanto spesso dovremmo aspettarci che si verificano e, considerando che si verificheranno, se effettivamente è un aspetto che mette il doppio in secondo piano rispetto al singolare. 

Doppi ancora vivi

Lo spunto arriva da una domanda per il podcast della settimana scorsa:

La scelta più estrema riguardo ai doppi irrilevanti è semplicemente quella di non giocarli del tutto. Se si optasse per questa soluzione, a quanti doppi assisteremmo? Nelle Finali di Davis Cup a Madrid, ci sono state 25 sfide: 18 nella fase a gironi e 7 in quella a eliminazione diretta. In 12 sfide il doppio è stato determinante: 7 nelle 18 sfide dei gironi e 5 nelle 7 sfide dell’eliminazione diretta. Sulla base della metodologia proposta nel tweet, è all’incirca quanto ci saremmo attesi che accadesse. In media (per entrambe le fasi), una sfida aveva il 43% di arrivare al doppio decisivo, lasciando intendere che 11 partite di doppio sarebbero state importanti. 

La tabella elenca le 25 sfide, insieme alla probabilità di una vittoria a testa nelle prime due partite di singolare. L’ultima colonna indica se il doppio è stato decisivo. Le valutazioni Elo non sono state particolarmente efficaci nel predire quale sfida avrebbe portato a un doppio decisivo, anche se forniscono una buona stima di quanto spesso il doppio farebbe la differenza.

Sfida                 Prob. doppio   Giocato? 
Semi: GBR vs ESP      56.2%          SI  
Quarti: SRB vs RUS    54.3%          SI  
Semi: RUS vs CAN      53.3%          SI  
RR: FRA vs SRB        52.5%          NO  
RR: ARG vs GER        51.6%          NO  
RR: USA vs CAN        51.4%          NO  
RR: ITA vs CAN        50.0%          NO  
Quarti: GBR vs GER    50.0%          NO  
RR: GBR vs KAZ        49.8%          SI  
RR: ESP vs RUS        49.4%          SI  
Quarti: AUS vs CAN    49.4%          SI  
RR: USA vs ITA        48.7%          SI  
RR: BEL vs AUS        46.1%          NO  
RR: KAZ vs NED        46.0%          SI  
RR: CRO vs RUS        45.7%          NO  
RR: GER vs CHI        44.2%          SI  
RR: ARG vs CHI        43.6%          NO  
RR: FRA vs JPN        43.4%          SI  
Finale: CAN vs ESP    40.8%          NO  
RR: GBR vs NED        37.5%          SI  
RR: BEL vs COL        36.2%          NO  
Quarti: ARG vs ESP    34.6%          SI  
RR: SRB vs JPN        26.1%          NO  
RR: AUS vs COL        10.4%          NO  
RR: CRO vs ESP        7.3%           NO

Solo in pochi casi la vittoria in entrambi i singolari era quasi garantita. Anche in presenza di un tabellone molto lungo di 18 squadre, la maggior parte delle rappresentative è riuscita a schierare due solidi giocatori di singolare, e solo poche avevano il lusso di più di un giocatore di élite. 

Dieci anni di storia

Non si è trattato di pura casualità. Ho verificato tutte le sfide del World Group di Coppa Davis (tralasciando i playoff) dal 2010 al 2018 per identificare i due giocatori migliori di ciascuna squadra. Attraverso le loro valutazioni Elo al momento della partita e declinate sul nuovo formato al meglio dei tre set (anziché al meglio dei cinque), ho stimato quanto spesso saremmo di fronte a un doppio decisivo. In quelle 135 sfide, la probabilità media di un doppio decisivo è del 41%, di poco inferiore alla frequenza dell’edizione appena terminata. Escludendo un radicale rovesciamento gerarchico nella geografia del tennis mondiale, abbiamo una valida approssimazione di quanto frequentemente una squadra vince le prime due partite nel nuovo formato della Coppa Davis.

Quanto conta il doppio?

Quando il doppio ha un valore, è decisamente rilevante. Ogni partita di singolare ha la capacità di incidere in modo sostanziale sulla probabilità di ciascuna squadra di vincere la sfida, ma se il doppio entra in gioco, ha un’incidenza totale. Pensiamone in termini di leva, un concetto che solitamente applico a cambiamenti di punteggio durante la partita. Ipotizziamo due squadre equamente competitive e consideriamo la probabilità di vittoria in ogni passaggio del processo. Ogni squadra ha il 50% di probabilità di vincere ogni partita della sfida, che significa:

  • ogni squadra ha il 50% di probabilità di vincere la sfida
  • la squadra che vince la prima partita avrà il 75% di probabilità di vincere la sfida
  • in caso di parità dopo le prime due partite, ogni squadra avrà ancora una volta il 50% di probabilità di vincere la sfida.  

Prendiamo ora la leva di ciascuna partita dalla prospettiva della squadra A:

  • se vince la prima partita, la probabilità di vincere la sfida sale al 75%, altrimenti scende al 25%. Si tratta di un valore di leva del 75% – 25% = 50%
  • supponiamo che vinca la prima partita. Se vince anche la seconda, vince la sfida, una probabilità cioè del 100%. Se perde, scende al 50%. Di nuovo, è un valore di leva del 100% – 50% = 50% (se perde la prima partita, i calcoli sono identici, solo con probabilità del 50% e 0% invece di 100% e 50%) 
  • in presenza di un doppio decisivo, le probabilità all’inizio della partita di vincere la sfida sono del 50%. Con la vittoria del doppio, la probabilità raggiunge il 100%. Perdendo il doppio, la probabilità diventa dello 0%. È un valore di leva del 100% – 0% = 100%.  

Teoria e realtà

Potreste pensare che sia un ragionamento eccessivamente formale e convoluto, ed è difficile darvi torto. Il punto è che, con due squadre equivalenti, il doppio diventa due volte più decisivo. In molti altri sport succede che vi siano giocatori che non vengono coinvolti in tutte le fasi di gioco, subentrando nei momenti critici. Nel baseball ad esempio, con alcuni lanciatori chiamati a chiudere la partita solo in situazioni molto equilibrate. Oppure i kicker nella NFL, che partecipano a poche azioni della partita, ma con la possibilità di segnare molti punti. 

Per i parametri del mio campione d’indagine, il doppio avrà rilevanza esattamente il 50% delle volte, ed è due volte più importante di ognuna delle partite di singolare. Non funziona proprio così nel mondo reale, visto che il doppio è decisivo poco più del 40% delle volte. Però, quando poi il doppio diventa decisivo, ha sempre conseguenze da tutto o niente. Detto altrimenti, ha un valore di leva del 100%. 

Sono d’accordo nel non giocare i doppi irrilevanti. Non sarebbe una decisione che incontra il favore dei doppisti, e temo scatenerebbe le ire dei puristi della Davis. Pensando però alla posta in gioco, la reazione sarebbe più mitigata. In una formula da 16 o 18 squadre, l’equilibrio è sufficientemente distribuito da rendere necessario il doppio quasi nella metà delle volte. E quando si gioca il doppio, gli spesso dimenticati specialisti si trovano in una partita che è, letteralmente!, due volte più decisiva dei singolari che generano il massimo seguito di pubblico.  

The Likelihood of Live Doubles Rubber in the New Davis Cup

Stili di gioco e risultati a sorpresa

di Jeff Sackmann // TennisAbstract

Pubblicato il 14 gennaio 2019 – Traduzione di Edoardo Salvati

Durante un podcast con Carl Bialik, ho confessato una teoria che mi ronza in testa da tempo, e cioè che le vittorie a sorpresa sono più probabili in presenza di stili contrastanti di gioco. La logica è piuttosto semplice. Se ci sono due ribattitori, è probabile che il più forte vinca. Se ci sono invece due cannonieri del servizio, il migliore dei due non dovrebbe avere problemi. Ma se un cannoniere affronta un ribattitore beh…può succedere di tutto.

Abbiamo visto Rafael Nadal fare fatica contro giocatori come John Isner e Dustin Brown, così come un grande servizio essere neutralizzato dal suo opposto, ad esempio le sei sconfitte di Marin Cilic contro Gilles Simon a fronte di una sola vittoria. Ci sono comunque vittorie a sorpresa anche nello scontro di stili di gioco simili ma, come per tutte le ipotesi non sottoposte a prova empirica, anche questa ha il suo fascino e non è da scartare in partenza.

Serve una verifica approfondita

Al primo turno degli Australian Open 2019 Reilly Opelka ha battuto Isner. Difficile trovare due stili più affini e, da veterano, Isner aveva tutti i favori del pronostico nel perfetto caso di quel tipo di partita che mi aspetto già delineata, tranne che poi finisce per vincere lo sfavorito. Hanno giocato quattro tiebreak e ci sono stati solo due break, ma Opelka non ha nemmeno dovuto attivare la nuova regola del super-tiebreak al quinto set. Pur trattandosi di una sola partita, il suggerimento implicito che ne deriva è di fare una verifica più approfondita della mia idea.

Dopo un paio di ore di analisi, la teoria può vantare ora una prova ufficiale, e ho scoperto che non è esente da difetti. Fortunatamente, non si tratta solo di un altra battuta d’arresto. Lo stile di gioco è effettivamente correlato alla probabilità di un risultato a sorpresa, semplicemente non nel modo che mi ero immaginato.

Una misura della pronosticabilità

Voglio spiegare in dettaglio il test e poi illustrare gli esiti. Ho utilizzato i dati del Match Charting Project per calcolare l’Indice di Offensività di ciascun giocatore con almeno dieci partite nel database dal 2010. In sintesi, l’Indice di Offensività è la percentuale di colpi che terminano il punto (tramite un vincente, un errore non forzato o un errore forzato commesso dall’avversario) e si comporta da approssimazione dello stile di gioco. Otteniamo così 106 giocatori, da conservatori tipo Simon e Yoshihito Nishioka con Indice di Offensività del 13% a i battitori liberi come Brown e Ivo Karlovic, con indici intorno al 30%. Li ho poi suddivisi in quartili (per numero di partite, non numero di giocatori, con ogni quartile che contiene tra i 21 e 31 giocatori), in modo da vedere come in generale uno stile di gioco si comporta con un altro.

La divisione in quartili

Questi sono i gruppi:

(l’Indice di Offensività mette insieme due aspetti: grande servizio/grande potenza di colpi e aggressività tattica. Isner non è sempre iper aggressivo, ma per via della sua altezza e del talento al servizio, è in grado di terminare i punti così frequentemente che, statisticamente, sembra essere estremamente aggressivo. Quindi, parlerò allo stesso modo di “cannonieri” e “giocatori offensivi”, anche se in realtà ci sono molte differenze tra i due gruppi).

Un campione di 11 mila partite

Concentrandomi su questi 106 giocatori, ho trovato poco più di 11 mila partite da esaminare e le ho divise in insiemi sulla base del quartile di appartenenza dei due giocatori. Ciascuno dei dieci possibili sottoinsiemi di partite, come Q1 contro Q2 o Q4 contro Q4, contiene almeno 400 elementi.

Per ogni partita, ho stabilito la probabilità di vittoria del favorito con le valutazioni Elo corrette per superficie, in modo da ottenere pronostici pre-partita che, seppur non accurati quanto quelli degli allibratori, sono altrettanto affidabili. Questi pronostici permettono di stabilire se determinati gruppi sono più pronosticabili di altri. Se su 100 partite in cui il favorito ha una probabilità di vittoria del 60%, il favorito ne vince 70, diremo che il risultato è più pronosticabile delle attese. Se ne vince solo 50, il risultato è stato meno prevedibile.

Addio mia bella teoria

Per le partite in ciascuno dei dieci sottoinsiemi quartile contro quartile, ho calcolato la probabilità media di vittoria del favorito (“Probabilità Favorito”, confrontandola con la frequenza con cui il favorito ha effettivamente vinto (“% Vittoria Favorito”). La tabella mostra i risultati insieme al rapporto tra quei due numeri (“Indice”). Un indice di 1.0 significa che le partite del sottoinsieme sono pronosticabili esattamente quanto ci si attende che lo siano. Un indice più alto significa che il favorito è stato ancora più forte del pronostico, mentre un indice inferiore manifesta più vittorie a sorpresa delle attese.

Partite
Quartili
Numero
Partite
Probabilità
Favorito
% Vittoria
Favorito
Indice
Q1 vs Q141271.1%75.2%1.06
Q1 vs Q2107269.5%70.6%1.02
Q1 vs Q3138269.7%68.6%0.98
Q1 vs Q4118769.7%70.0%1.00
Q2 vs Q261270.2%69.9%1.00
Q2 vs Q3161668.8%67.8%0.99
Q2 vs Q4143468.8%67.4%0.98
Q3 vs Q388666.7%60.3%0.90
Q3 vs Q4168567.3%66.8%0.99
Q4 vs Q479167.1%61.2%0.91

Emerge un risultato impressionante: il valore più alto, che identifica il gruppo di partite più pronosticabili, arriva dalla coppia di giocatori più conservativi. Viceversa, il valore più basso, che identifica il gruppo di partite con più vittorie a sorpresa, arriva dalla coppia di giocatori più offensivi.

Prima di analizzare le correlazioni, facciamo un’altra verifica. I migliori non sono equamente distribuiti tra quartili, visto che nel Q1 ci sono due dei Fantastici Quattro. Per i più forti e per le partite più sbilanciate è più complicato calcolare con precisione pronostici basati sulle valutazioni Elo, che sono la colonna portante di questo procedimento.

Restringiamo il perimetro

Per questo motivo occorre prestare attenzione quando i giocatori di vertice potrebbero influenzare il risultato finale dell’analisi. Proviamo quindi a vedere gli stessi numeri relativi però solo a quelle partite in cui il favorito ha una probabilità di vittoria che va dal 50 al 70%, escludendo così molti degli scontri tra i giocatori di vertice e tutte le loro partite con pronostico a senso unico.

Partite
Quartili
Numero
Partite
Probabilità
Favorito
% Vittoria
Favorito
Indice
Q1 vs Q119659.5%62.8%1.05
Q1 vs Q260459.8%60.6%1.01
Q1 vs Q373159.7%58.1%0.97
Q1 vs Q466359.9%60.6%1.01
Q2 vs Q232259.0%54.7%0.93
Q2 vs Q393159.8%59.8%1.00
Q2 vs Q482259.7%57.2%0.96
Q3 vs Q354459.5%55.0%0.92
Q3 vs Q4102459.5%58.2%0.98
Q4 vs Q449359.3%55.0%0.93

Si elimina circa il 40% del campione, ma le dinamiche di pronosticabilità rimango in generale le stesse. Sia nel campione complessivo che in quello ridotto del 50-70% di probabilità per il favorito, la correlazione più solida che ho trovato è stato l’Indice di pronosticabilità e il quartile dei giocatori meno offensivi. In altre parole, è probabile che un ribattitore abbia risultati più prevedibili di un giocatore più aggressivo, a prescindere che l’avversario sia un cannoniere del servizio, un altro ribattitore o un giocatore che si pone a metà tra queste due tipologie.

Torniamo ai fondamentali

La mia teoria iniziale è chiaramente sbagliata. Mi aspettavo di trovare che le partite Q1 contro Q1 fossero più pronosticabili della media, e ho avuto ragione. Secondo questa logica, mi aspettavo che anche le partite Q4 contro Q4 andassero in quella direzione mentre accoppiamenti come Q1 contro Q4 fossero più soggetti a risultati a sorpresa. Sarebbe stato meglio che il gatto del mio avesse fatto pronostici per mio conto.

Si trova invece che partite con giocatori più aggressivi portano più probabilmente a esiti contro pronostico. Non è la scoperta del secolo, ed è una conclusione che avrei dovuto intuire. I grandi servitori tengono il servizio più facilmente e fanno break meno frequentemente, così che le loro partite finiscono con punteggi più ravvicinati, lasciando spazio a un ruolo maggiore da parte della fortuna specialmente quando set e partite sono decise da tiebreak.

Starete a questo punto pensando che ho buttato via il mio pomeriggio e la vostra attenzione per giungere a un esito scontato e poco degno di nota. Sono d’accordo, non è particolarmente eccitante proclamare che la fortuna ha un ruolo più incisivo con i cannonieri del servizio. C’è comunque una scoperta utile, e anche sorprendente, nascosta tra le righe.

Potenziale esponenziale di vittoria a sorpresa

Sappiamo che i giocatori in assoluto mono-dimensionali subiscono più di altri gli alti e bassi della fortuna, per via dei margini risicati del tiebreak. Per un giocatore che raramente strappa il servizio all’avversario, nessuna partita ha garanzia di vittoria. Per un giocatore che raramente subisce un break, nessun avversario è impossibile da battere. Però, mi sarei aspettato che la non pronosticabilità dei cannonieri fosse già incorporata nei pronostici delle partite, tramite la loro valutazione Elo. Se un giocatore ha risultati insolitamente casuali, ci attendiamo che la sua valutazione si muova verso la media del circuito. Questo è uno dei motivi per cui è molto difficile per i giocatori con una risposta debole arrivare in cima alla classifica.

Le cose però non sono come sembrano. Per i cannonieri del servizio, le valutazioni Elo, guidate dalla casualità, ottengono risultati quasi perfetti nella previsione delle partite contro i ribattitori, e hanno un leggero eccesso di confidenza contro avversari con uno stile di gioco più a metà strada nei quartili Q2 e Q3. Quando si affrontano tra di loro invece, i risultati a sorpresa sono all’ordine del giorno. Quella frazione di risultati così volatili, le partite piene di tiebreak in presenza di due cannonieri, rappresenta solo una parte della valutazione di questo tipo di giocatori.

Siamo abituati a vedere esiti imprevedibili legati ai giocatori più aggressivi, per via del grande servizio, del rendimento erratico alla risposta e degli scambi corti. L’analisi di oggi aumenta la conoscenza sulla frequenza con cui questo accade o non accade. Contro i ribattitori, la situazione non è poi così difficile da pronosticare. Quando però si ritrovano due cannonieri del servizio, ci aspettiamo l’inatteso, e il risultato diventa ancora più imprevedibile.

What I Should’ve Known About Playing Styles and Upsets

Una breve spiegazione sull’arrivo in volata alla Laver Cup

di Stephanie Kovalchik // StatsOnTheT

Pubblicato il 24 settembre 2019 – Traduzione di Edoardo Salvati

Nella terza edizione della Laver Cup, il Resto del Mondo si è avvicinato — come mai era riuscito — a battere l’Europa, che ancora una volta ha dimostrato di essere una potenza. Indietro nel punteggio per 5-7 al termine della seconda giornata, con la vittoria delle prime due partite della terza giornata il Resto del Mondo ha ristabilito l’equilibrio lasciando l’esito della sfida incerto fino all’ultimo. La situazione non sembrava chiara per i telecronisti, aperti alla possibilità di una tredicesima partita tra le due squadre. Vediamo perché non sarebbe potuto accadere e quali condizioni si sarebbero invece dovute verificare per arrivare alla partita decisiva.

La Laver Cup non ha una lunga tradizione, quindi parlare di tendenze può non avere molto senso. Abbandonando temporaneamente i rigidi dettami statistici, è curioso notare che il Resto del Mondo si è migliorato o ha eguagliato sé stesso al termine della seconda giornata in ciascuno dei tre anni. Gli 11 punti vinti in Svizzera sono a oggi il bottino più ampio. Escludendo la conquista del trofeo, il Resto del Mondo potrebbe superare questo traguardo con 12 punti alla fine delle partite della terza giornata forzando la sfida conclusiva, uno scenario che però non si è mai verificato.

Forzare la partita decisiva

Alcuni dei commenti televisivi hanno lasciato intendere che si sarebbe comunque sempre potuti arrivare alla partita decisiva. Non è la prima inesattezza numerica sentita durante una telecronaca, ma si è portati a pensare che la semplice addizione multipli di 3 al punteggio del Resto del Mondo alla fine della seconda giornata avrebbe evitato un errore di quel tipo.

Gli affezionati lettori di questo blog non avranno alcun problema nel realizzare che ci sono solo una manciata di punteggi dalle partite della seconda giornata che possono generare una parità di 12-12 dopo la dodicesima partita della terza giornata. E cioè:

  • 0-12
  • 3-9
  • 6-6
  • 9-3
  • 12-0

Meno immediato è capire quanto probabile fosse ciascuno di essi a Ginevra. Tenendo conto delle valutazioni specifiche per il cemento dei giocatori scelti per il singolare e il doppio nella prima e seconda giornata, il grafico dell’immagine 1 mostra tutte le combinazioni di punteggio possibili per il Resto del Mondo alla fine della seconda giornata, con la relativa probabilità.

Complessivamente, la probabilità che il Resto del Mondo fosse su uno dei cinque punteggi che avrebbe condotto a una partita decisiva era del 33%. Il più probabile era il 3-9, con il Resto del Mondo senza i favori del pronostico in tutti i singolari ma favorito in tutti i doppi.

È interessante notare che il punteggio effettivamente raggiunto (5-7) era, con il 17%, appena meno probabile del 3-9 su cui si sarebbero potuti trovare. Sicuramente la prima vittoria in singolare di Jack Sock (contro Fabio Fognini per 6-1 7-6, n.d.t.) per il Resto del Mondo deve essere tra le più grandi sorprese della competizione.

IMMAGINE 1 – Probabilità attesa per ogni combinazione di punteggio del Resto del Mondo alla fine della seconda giornata, sulla base di 50.000 simulazioni di risultato dalle partite effettive della prima e seconda giornata

Recuperare dallo 0-12?

Quando il Resto del Mondo ci riproverà a Boston, nella quarta edizione della Laver Cup nel 2020, guarderò con attenzione se saranno in grado di fare meglio di 5 punti dopo la seconda giornata e di 11 dopo la terza.

E spero di essere ancora in salute quando una delle due squadre recupererà uno svantaggio di 0-12 per giocarsi tutto nella partita finale. Con i giocatori presenti quest’anno, sarebbe successo solo in 6 delle 50.000 simulazioni della competizione. Temo ci sarà un po’ da aspettare per questo scenario. Per la prima partita decisiva invece, l’anno prossimo potrebbe essere quello giusto.

A Short Explainer on Getting to a Laver Cup Decider