Le partite Slam al quinto set da non perdere

di Martin Ingram // Martin Ingram’s Blog

Pubblicato il 29 marzo 2020 – Traduzione di Edoardo Salvati

Prendendo spunto da una precedente analisi di Stephanie Kovalchik, mi sono chiesto, in assenza di tennis giocato, quali sono le partite storiche da riguardare. Anche io ho elaborato un metodo per classificare le più interessanti e, visto che il mio risultato è diverso, vale la pena dedicare un approfondimento specifico.

Ho deciso di classificare le partite sulla base della somma delle valutazioni Elo dei due giocatori, con un modello Elo che considera il diverso rendimento a seconda della superficie e il margine di vittoria inteso come differenziale di game. Ogni partita è poi espressa in termini di valutazione totale ottenuta. Un dettaglio tecnico: siccome l’intervallo di valutazioni varia da superficie a superficie tra quelle della mia versione Elo, un valore di 2400 sulla terra battuta è meno significativo dello stesso valore sul cemento. Per questo il criterio adottato è l’indice-z del valore Elo complessivo della partita, indice che tiene conto della variazione dei valori per superficie. Ad esempio, se un giocatore ha una valutazione Elo di 2400 e l’altro di 2200 e la deviazione standard delle valutazioni è 100, l’indice-z viene calcolato come:

(2400−1500) + (2200−1500) / √ (1002 + 1002) = 11.3

mentre con una deviazione standard di 200 si otterrebbe un indice-z di 5.7. Ho considerato solo le partite Slam andate al quinto e solo quelle dal 1980, visto che trovare video per partite più vecchie può essere difficile (o, se esistono, sono spesso poco fruibili).

Che partite emergono con questo metodo?

Il valore totale Elo dovrebbe essere garanzia di una partita di qualità. Se il valore Elo di entrambi i giocatori è molto alto, significa che, almeno in linea teorica, hanno un rendimento considerevolmente superiore a quello di un giocatore medio, generando un indice-z altrettanto elevato. Concentrarsi solo sulle partite che hanno raggiunto il quinto set dovrebbe favorire la presenza di sfide equilibrate. Con il senno di poi però, non sono sicuro che questo sia abbastanza, perché per alcune partite il risultato sembrava già indirizzato nonostante la necessità di un quinto set. Ho anche provato a limitare la selezione a quelle partite con una differenza minima nelle valutazioni pre-partita, ma ci sto ancora lavorando. In ogni caso, senza ulteriori indugi, a voi la lista!

IMMAGINE 1 – Elenco delle migliori partite Slam al quinto set dal 1980 a oggi in ordine decrescente per indice-z

Mi colpisce questa selezione. Alcune riflessioni:

  • se siete dei tifosi di John McEnroe, vi rallegrerete, perché è protagonista di 7 delle prime quindici partite! C’è anche la famosa finale di Wimbledon 1980 contro Bjorn Borg, ma è curioso che abbia una valutazione superiore un’altra finale contro Borg sempre nello stesso anno, quella degli US Open 1980, questa volta vinta da McEnroe.
  • con cinque apparizioni, anche Novak Djokovic è ben rappresentato. Sono contento che tra queste ci sia la finale del Roland Garros 2013 contro Rafael Nadal. Ricordo, mentre la guardavo, di essere rimasto in ammirazione totale del livello di tennis
  • tutte le partite sono alternativamente dei primi anni ’80 o degli anni 2010, evidenziando la preferenza di questo metodo per quei due periodi
  • il metodo considera Borg imbattibile sulla terra nel 1981. La sua valutazione Elo prima della finale contro Ivan Lendl era di 2901! In confronto, quella di Nadal contro Djokovic nel 2013 era “solo” di 2534. Se si considera il record di Borg sulla terra, non è poi così privo di senso. La formula tiene conto del margine di vittoria e Borg raramente perdeva un set, vincendo spesso per 6-0. Alla vigilia di quella partita doveva sembrare inavvicinabile, anche se poi Lendl ha perso solo al quinto set. E quella sarà l’ultima partita di Borg a Parigi
  • penso che non ci siano dubbi che le partite dell’elenco sono tutte avvincenti. Sorprende forse di più l’assenza di altre che ci si sarebbe aspettato di trovare, come la finale di Wimbledon 2008 tra Nadal e Roger Federer. È utile ribadire che è uno dei vari metodi possibili e che ciascun metodo implica scelte soggettive che determinano quali partite rientrano nella selezione.

Personalmente, vorrei rivedere le sfide tra McEnroe e Jimmy Connors, ma spero che ci siano partite d’interesse per ognuno.

Grand Slam five-setters to watch

Il tennis è diventato più prevedibile? Un’indagine con un modello tematico

di Martin Ingram // Martin Ingram’s Blog

Pubblicato il 23 marzo 2020 – Traduzione di Edoardo Salvati

Visto che il tennis è sospeso, ho pensato che fosse interessante cercare di individuare alcune tendenze nell’evoluzione degli stili di gioco. È da tempo che avevo intenzione di applicare un modello diffuso nel campo dell’apprendimento automatico, il Latent Dirichlet Allocation (LDA), ai dati derivanti dal Match Charting Project. Per chi non lo conoscesse, il Match Charting Project è uno sforzo colossale di diversi volontari che codificano con minuzia la sequenza dei colpi di ciascuno scambio di un’intera partita di tennis. Rappresenta di gran lunga la più completa risorsa informativa sulle partite. Gli altri database pubblicamente disponibili infatti si limitano, nei casi migliori, a descrivere la sequenza dei colpi senza fornire altri dettagli sullo scambio.

Il modello LDA nell’apprendimento automatico

Che cos’è il Latent Dirichlet Allocation? Si tratta di un modello inizialmente concepito per trovare specifici temi o categorie in un insieme di documenti scritti in linguaggio naturale. Costituisce la base di analisi del LDA una serie di documenti, come potrebbero essere degli articoli del New York Times. Ciascun documento è identificato dalla frequenza con cui ogni parola, o termine, è citata. Ad esempio, se un documento consiste solo nella frase “ciao ciao arrivederci”, viene identificato con (ciao, 2), (arrivederci, 1), perché ciao compare due volte e arrivederci una.

L’idea centrale del LDA è il tema. Un tema definisce quanto ogni termine è probabile. Negli articoli del New York Times, si può pensare che ricorra un tema “politica” che assegna un’alta probabilità a parole come “politico”, “congresso”, “elezione”, e così via.

Si può naturalmente pensare che ogni documento è generato da un singolo tema. È una modalità legittima, e darebbe luogo a un modello combinato. Tuttavia, molti documenti contengono molti temi. Ad esempio, è ipotizzabile che il tema “politica” appaia spesso in articoli che hanno a che fare anche con l’economia. Il LDA ne tiene conto modellando ogni articolo come un misto di temi: un documento potrebbe essere 60% economia e 40% politica. Questo significa che ogni parola arriva al 60% probabilmente dal tema economia e al 40% dal tema politica.

Come si comporta il LDA nella pratica?

In presenza di un insieme di documenti con il rispettivo conteggio delle parole e con il numero di temi da cercare, il LDA è in grado di trovare quei temi – come sono distribuiti rispetto alle parole – e quanto è probabile che ogni documento vada ricollegato a un tema, quindi come sono distribuiti rispetto ai temi.

Il LDA per il Match Charting Project

In che modo il LDA può essere applicato al Match Charting Project? L’interrogativo primario riguarda a quali elementi del tennis corrispondono le “parole” e i “documenti”. La risposta non è così scontata, e ho considerato diverse possibilità. Quella da cui alla fine sono partito, principalmente perché era la più facile grazie al preciso lavoro di riordino dei dati da parte di Jeff Sackmann, è la seguente:

  • una parola equivale a un tipo di colpo. Il Match Charting Project prevede 17 tipi di colpi base, come dritto e rovescio a rimbalzo piatto o in topspin, dritto e rovescio tagliato, volée di dritto e così via, per citarne alcuni (di più su questo a breve)
  • ogni documento equivale a una combinazione giocatore-partita. Ad esempio, una partita tra Roger Federer e Rafael Nadal determina due documenti, uno per Federer, identificato da quanto spesso colpisce ogni colpo, e un altro per Nadal.

Pur nella convinzione che sia un punto di partenza ragionevole, ci sono ovvi margini di miglioramento. Un’aggiunta relativamente semplice è quella di procedere a un’ulteriore categorizzazione di tutti i colpi in funzione della direzione in cui sono stati colpiti. Un’altra idea può essere quella di raggruppare i colpi in sequenze di due colpi consecutivi: ad esempio (dritto a rimbalzo incrociato piatto o in topspin, dritto a rimbalzo incrociato piatto in topspin) indica che il giocatore ha ricevuto un dritto a rimbalzo incrociato piatto o in topspin e ha risposto con lo stesso tipo di dritto. Si potrebbero integrare così informazioni sullo sviluppo di uno scambio. In ogni caso, era il sistema più facile da applicare e, come spero sarete d’accordo, produce già dei risultati piuttosto interessanti.

La finale di Wimbledon 2008

Per illustrare l’idea, quale migliore esempio se non la rappresentazione dell’incredibile finale di Wimbledon 2008 tra Federer e Nadal?

IMMAGINE 1 – Rappresentazione secondo il metodo LDA della finale di Wimbledon 2008

Ogni colonna rappresenta qui un “documento” e ogni fila una “parola”. Come ci si poteva aspettare, la maggior parte dei colpi sono stati colpi a rimbalzo, e la maggior parte di questi dal lato del dritto. Federer ha colpito più rovesci tagliati ed è venuto a rete più spesso, mentre Nadal ha colpito più dritti. Tornerò su questo esempio più avanti nel riepilogo dei risultati ottenuti con il LDA.

Complessivamente, al momento della stesura, ci sono 4938 documenti partite-giocatore, relativi quindi al circuito maschile. Non stupisce che i giocatori più famosi sono anche quelli con più occorrenze, il solo Federer ne ha ben 417, ma si tratta comunque di una risorsa fondamentale. E il mio vivo ringraziamento va a tutti i volontari che hanno contribuito!

Aggiustamento del LDA

Nell’utilizzo del LDA, una scelta obbligata è quella del numero di temi da cercare. Non mi sono soffermato a lungo su questo aspetto. Come prima scelta, ho cercato di prendere il numero di elementi con la minore “perplessità”, un numero che ho facilmente calcolato con l’implementazione scikit-learn di Python che stavo usando. È emerso che quattro temi valutati sull’insieme di dati completo restituiscono il risultato migliore. Mi aspettavo un numero più alto, e non mi sento del tutto sicuro del mio metodo di selezione dei temi. Il timore è che quattro temi rischiano di essere una semplificazione eccessiva, anche se un numero ridotto ha il vantaggio di una maggiore immediatezza interpretativa contro, ad esempio, a dieci temi. Per ora quindi mantengo i quattro temi.

Temi

Questi sono i quattro temi che ho trovato, insieme alla loro distribuzione di probabilità rispetto ai colpi. Per facilitare la lettura, ho assegnato un nome a ciascuno. Per evitare eccessiva confusione, ho elencato solo i colpi con la probabilità più alta.

Tema 1, “Colpi da fondo”

54% rovesci a rimbalzo piatti o in topspin, 38% dritti a rimbalzo piatti o in topspin

Tema 2, “Colpi a rete”

28% volée di rovescio, 24% volée di dritto, 18% rovesci a rimbalzo piatti o in topspin, 10% dritti a rimbalzo piatti o in topspin, 6% smash normali, 4% demi-volée di rovescio, 3% rovesci tagliati, 3% demi-volée di dritto, 3% pallonetti di rovescio

Tema 3, “Scambio di dritto”

84% dritti a rimbalzo piatti o in topspin, 7% rovesci a rimbalzo piatti o in topspin, 4% rovesci tagliati

Tema 4, “Rovescio tagliato”

68% rovesci tagliati, 17% dritti a rimbalzo piatti o in topspin, 6% dritti tagliati, 3% rovesci a rimbalzo piatti o in topspin.

Cosa ne è di Federer e Nadal a Wimbledon 2008?

IMMAGINE 2 – Distribuzione di probabilità rispetto ai colpi per i quattro temi individuati per la finale di Wimbledon 2008

Osserviamo che il 54% dei colpi di Federer e Nadal rientrano nel tema Colpi da fondo, senza che vi sia in questo caso differenza tra i due. Federer è ricorso al tema Colpi a rete il 6% delle volte, mentre Nadal non lo ha mai praticamente fatto, con la probabilità di quel tema arrotondata a zero. Federer ha anche fatto più uso del tema Rovescio tagliato di Nadal. È interessante come Nadal è stato capace di fare intenso ricorso al tema dello Scambio di dritto. Infine, Federer ha usato il tema Rovescio tagliato più spesso di Nadal.

Giocatori rappresentativi di ciascun tema

Per una maggiore comprensione, l’immagine 3 mostra i giocatori con la più alta probabilità media di utilizzo di ciascun tema. Sono considerati solo i giocatori con almeno 20 partite nel database del Match Charting Project.

IMMAGINE 3 – Giocatori con la più alta probabilità media per tema

Quattro dei primi cinque giocatori nel tema Colpi da fondo hanno avuto i loro periodo più redditizio negli anni 2000 e negli anni 2010, come era pensabile considerato il dominio del gioco da fondo nel tennis contemporaneo. Per questi giocatori la maggior parte della distribuzione dei colpi è nel tema Colpi da fondo, con qualche colpo nel tema Scambio di dritto.

Una vera testimonianza che il gioco al volo è un retaggio del passato arriva dai giocatori in cima all’elenco del tema Colpi a rete. Tutti e cinque hanno vinto Wimbledon almeno una volta. Patrick Rafter si mette in evidenza per un uso cospicuo del rovescio tagliato, mentre sembra che Boris Becker e Goran Ivanisevic fossero più disposti a scambiare anche da fondo rispetto agli altri tre.

I primi cinque nel tema Scambio di dritto sono tutti in attività. Milos Raonic appare come il più prone a colpire di dritto. Feliciano Lopez si fa notare per tagliare i colpi più degli altri, con Grigor Dimitrov al secondo posto in questo senso. Nadal usa quasi esclusivamente i temi Colpi da fondo e Scambio di dritto.

Ivo Karlovic è in cima al tema Rovescio tagliato. Hai mai colpito un rovescio a rimbalzo piatto o in topspin? Da quanto si vede in partita, non ne fa certamente un’abitudine. I prime cinque nel tema hanno tutti il rovescio a una mano, come ci si poteva aspettare.

Evoluzione dei temi nel tempo

Come sono cambiati gli stili nel corso degli anni? Per avere un’idea, ho deciso di inserire nello stesso grafico le probabilità medie dei temi di ogni anno dal 1980, regolarizzando poi il risultato

IMMAGINE 4 – Evoluzione dei temi nel tempo

Il cambiamento più drastico a mio modo di vedere è il drammatico declino del gioco a rete. Per certi versi, sto dicendo un’ovvietà, tutti sanno che il servizio è volée è una tattica ormai superata. Ero però curioso di capire quando e quanto tempo fa è iniziato il declino. Nella versione regolarizzata, il tema Colpi a rete ha raggiunto l’apice nel 1986 per poi avviarsi alla ritirata intorno al 1990, fino a raggiungere il valore attuale del 5% verso il 2008. Contestualmente, come prevedibile, il tema Colpi da fondo è diventato più frequente, dal punto più basso del 45% nella metà degli anni ’80 fino al valore attuale del 60%.

Inoltre, è anche interessante che il tema Scambio di dritto, per quanto sempre presente, sia aumentato da un valore del 14% dei colpi intorno al 2000 fino a un valore attuale del 23%. Potrebbe essere indicazione che la tattica di colpire più dritti possibili si è diffusa da quel momento in avanti.

Mi piacerebbe sapere anche quanta parte di questi cambiamenti è legata ai diversi fattori di cui piace tanto dibattere agli appassionati. Gustavo Kuerten ha vinto il Roland Garros 1997 usando le famose corde in poliestere, anche se pare non fosse l’unico ad averle. Erano corde che consentivano di imprimere una maggiore rotazione alla palla e facilitare i passanti. Di sicuro il tema Colpi a rete era in fase calante in quel periodo, arrivato al 15% da un periodo d’oro del 25%, quindi era già successo qualcosa. In molti sostengono anche che le differenze tra superfici si sono livellate nel tempo. Non mi sembra così ovvio dal grafico visto che credo (forse erroneamente) che sia iniziato già nei primi anni 2000, ma può aver contribuito al continuo declino del gioco a rete in quel decennio.

Entropia

Sebbene il Match Charting Project sia la fonte più granulare che abbiamo, le partite in esso contenute non sono necessariamente un insieme rappresentativo. Non ho verificato le situazioni di squilibrio, ma è possibile che vi siano più dati per partite sull’erba negli anni ’80 che in quelli a seguire, che potrebbe spiegare parte del calo iniziale. È altresì possibile che i giocatori che compaiono nel database siano una specifica selezione, e che i giocatori che hanno continuato a portare avanti la causa del servizio è volée negli anni ’90 riscuotano meno fascino tra i volontari che raccolgono i dati. Fondamentale quindi leggere questi risultati con il beneficio del dubbio.

Per arrivare in ultimo alla domanda del titolo dell’articolo, ovvero se il tennis è diventato più prevedibile, ho analizzato l’entropia media delle partite per anno. A grandi linee, l’entropia in questo caso è solo una misura dell’ampiezza distributiva delle probabilità. Ad esempio, se tutte le partite hanno usato un unico tema, l’entropia sarebbe vicina allo zero, mentre con un uso uguale di tutti i temi, l’entropia sarebbe di circa 1.39.

IMMAGINE 5 – Entropia come misura dell’imprevedibilità del tennis

Il grafico suggerisce che l’entropia è diminuita e che i giocatori sono diventati più prevedibili nell’uso dei temi. Un possibile inizio del declino è nei primi anni ’90, con un’accelerazione sostenuta verso la fine del decennio. Questo però non deve far pensare che il tennis sia meno interessante: anche nel tema dei Colpi da fondo ricorrono molte sfumature che questo semplice modello non incorpora.

Conclusioni

Spero di avere la vostra approvazione sul fatto che un primo esame dei dati del Match Charting Project con il metodo Latent Dirichlet Allocation ha prodotto risultati interessanti. Ci sono molte estensioni del LDA che potrebbero essere applicate, come il LDA dinamico, che elabora un modello dell’evoluzione dei temi nel tempo e cerca anche di indagare quali documenti hanno cambiato temi. Come ho detto, vorrei procedere a usare più temi nel LDA o forse definirne un numero automatico con modelli gerarchici di temi, oltre a includere più dettagli sugli scambi. C’è ancora molto da fare!

Has tennis become more predictable? An initial look with a topic model

L’evoluzione del rovescio di Del Potro

di Martin Ingram // OnTheT

Pubblicato l’1 aprile 2018 – Traduzione di Edoardo Salvati

Con le vittorie ad Acapulco e all’Indian Wells Masters e la semifinale al Miami Masters, si può finalmente affermare che Juan Martin Del Potro è tornato a pieno titolo tra i favoriti del circuito.

Mi ha incuriosito un commento di Roger Federer, suo avversario nella finale di Indian Wells, in cui ha detto di ammirare Del Potro perché è sufficientemente contento di poter affrontare le partite quasi senza il rovescio a due mani, usando il rovescio tagliato. Anche se questo magari comporta perderne qualcuna in più contro determinati giocatori.

Federer si riferisce al rientro di Del Potro nel 2016, dopo la seconda operazione al polso, quando era evidente che ricorresse a molti più rovesci tagliati a una mano rispetto al passato.

Di quanto è cambiata la scelta dei colpi di Del Potro? È tornato a giocare come faceva prima dell’infortunio?

Grazie al prezioso lavoro di raccolta dati del Match Charting Project, in questo articolo cerco di trovare una risposta analizzando la variazione del rovescio di Del Potro nel tempo.

Vista la quantità di informazioni a disposizione, l’analisi è abbastanza agevole. Una delle indicazioni fornite è la tipologia di colpo (Shot Types).

Prendendo ad esempio i dati relativi alla finale di Indian Wells, vediamo che Del Potro ha colpito 172 rovesci (Backhand side), di cui 52 tagliati (BH slice/chip), che equivalgono al 30.2%.

Nel database aggregato del Match Charting Project le partite di Del Potro si fermano alla finale di Basilea 2017. Ho aggiunto manualmente le 4 partite della stagione 2018 di cui sono stati raccolti i dati.

IMMAGINE 1 – Porzione dei rovesci tagliati giocati da Del Potro nelle partite con a disposizione dati punto per punto

Il grafico mostra la porzione dei rovesci tagliati da Del Potro nel corso degli anni. Sembra che ci sia una discontinuità dal 2014, periodo dal quale ha iniziato improvvisamente a usare molto più spesso il rovescio tagliato di quanto non facesse precedentemente.

È stata un po’ una sorpresa per me, perché associo mentalmente questo cambiamento al suo rientro nel 2016 ma, stando ai dati del Match Charting Project, già a partire dalla vittoria nel torneo di Sydney 2014 Del Potro faceva largo uso del rovescio tagliato.

È tornato a colpire il rovescio come in passato?

Per provare a rispondere ho pensato di adattare un processo gaussiano ai dati del campione. Il processo gaussiano ipotizza che si verifichi un lieve cambiamento nel tempo e cerca di trovare una tendenza di lungo periodo.

Considerando che si tratta di una conta – nella quale cioè le osservazioni possono assumere solo valori interi non negativi e sono frutto di un conteggio invece che di ordinamento sulla base di una classifica – e che gli infortuni possono comportare brusche variazioni, il processo gaussiano non è necessariamente il modello ideale, ma fornisce una ragionevole approssimazione.

IMMAGINE 2 – Evoluzione del rovescio di Del Potro

Sono partito imputando manualmente i dati relativi a Indian Wells 2018, e il processo gaussiano è sembrato mostrare un leggero declino. Sono però poi le partite di Acapulco a cambiare l’andamento. In Messico, Del Potro ha usato il rovescio tagliato il 65% delle volte contro Alexander Zverev e il 64% contro Kevin Anderson.

Come visto in precedenza, a Indian Wells contro Federer ha invece usato solo 30% di rovesci tagliati. Sembra che in media Del Potro continui a giocare più tagliati, anche se il contrasto fra una partita e l’altra è ancora molto alto.

Anche se la porzione del 30.2% fatta vedere ultimamente è comunque superiore a qualsiasi altra prima del 2014 (con il 23.9%, la più alta era nella partita di Coppa Davis 2012 contro Ivo Karlovic).

L’impressione è che, complessivamente, Del Potro stia usando il rovescio in modo molto diverso dal periodo antecedente il 2014. Non è per forza però una circostanza negativa: forse il suo gioco ha raggiunto una completezza che non possedeva, anche grazie al rovescio tagliato.

Dopotutto, ha vinto entrambe le partite contro Anderson e Zverev senza particolari problemi, anche tagliando il rovescio quasi due volte su tre. In aggiunta, la percentuale relativamente bassa contro Federer lascia intendere che, dovesse averne bisogno, è in grado di ridurne l’utilizzo.

Un cambiamento evidente

È un’analisi parziale: il Match Charing Project ha un numero ridotto di partite di Del Potro, forse solo le più importanti e comunque con possibili altre limitazioni meno ovvie di questa.

Ciononostante, è interessante notare l’evidente cambiamento nel rovescio di Del Potro a partire dal 2014. Così come intrigante sarà vedere come giocherà il rovescio in futuro e se continuerà a ottenere risultati vincenti come quelli degli ultimi mesi.

The Evolution of Del Potro’s Backhand

Le strisce vincenti più sorprendenti nell’era Open del tennis maschile

di Martin Ingram // OnTheT

Pubblicato il 20 agosto 2017 – Traduzione di Edoardo Salvati

Denis Shapovalov, tra i giocatori della Next Gen ATP, ha sorpreso tutti raggiungendo la semifinale al Canada Masters 2017 con convincenti vittorie consecutive su Juan Martin Del Potro e Rafael Nadal.

Mi sono quindi chiesto: è stata una delle strisce vincenti più sorprendenti di sempre?

Per cercare di trovare una risposta, ho analizzato la probabilità delle strisce vincenti di un giocatore in funzione della valutazione Elo. In generale, la probabilità finale è semplicemente il prodotto tra probabilità di eventi multipli.

Ad esempio, la probabilità di ottenere 6 tre volte di fila lanciando un tradizionale dado a sei facce (con la medesima probabilità per ciascuna faccia) è 1/6 × 1/6 ×1/6 ≈ 0.005. Minore la probabilità, più sorprendente la stringa di eventi.

Per applicare questo concetto al tennis, ho moltiplicato le probabilità di vittoria associate alla valutazione Elo di un giocatore nel corso di una striscia vincente. La probabilità di vittoria si riduce con l’allungarsi della striscia e quando le singole vittorie di una striscia sono più inaspettate.

Le prime 10 strisce vincenti più sorprendenti nel circuito maschile

Questi sono i criteri che ho applicato per arrivare alla classifica:

  • almeno una partita deve essere stata giocata in un torneo Master o Slam. Questo perché non è chiaro se sconfitte a sorpresa in tornei di categoria inferiore dovrebbero avere lo stesso peso di quelle nei tornei più importanti
  • non sono state considerate le partite di Coppa Davis e delle Olimpiadi
  • non si è tenuto conto dei ritiri pre e durante la partita.

E queste sono le 10 strisce vincenti più improbabili dell’era Open (e – per derivazione – di sempre):

  1. Thomas Muster, 1995 – Muster ha vinto 35 partite di fila nel 1995 – il periodo di massima forma – con cui ha conquistato il (suo unico) Roland Garros, il Monte Carlo Masters e gli Internazionali d’Italia. Ha sconfitto giocatori di qualità, rendendo la probabilità della striscia vincente pari a 0.000002
  2. John Marks, 1979 – Marks ha raggiunto la finale degli Australian Open 1979, battendo, tra gli altri, Arthur Ashe. Pur trattandosi di una striscia di sole 4 partite, Marks è partito da un pessimo Elo di 1337 punti, che ha portato la probabilità della striscia vincente a essere pari a 0.000012.
  3. Goran Ivanisevic, 2001 – La striscia che ha portato Ivanisevic a vincere Wimbledon 2001 si classifica al terzo posto. Ha vinto 9 partite di fila, battendo tra gli altri Marat Safin, Patrick Rafter, Andy Roddick e Tim Henman, prima di perdere negli ottavi di finale a Cincinnati. Probabilità della striscia vincente pari a 0.000038.
  4. Thomas Enqvist, 1993 – Enqvist ha vinto il torneo di Schenectady nel 1993, battendo Ivan Lendl, prima di vincere a sorpresa contro Andre Agassi nel primo turno degli US Open e perdere per mano di Pete Sampras negli ottavi di finale. Con un Elo iniziale di soli 1643 punti, la sua striscia si posiziona al quarto posto, con una probabilità pari a 0.000053.
  5. Alex Obrien, 1996 – Obrien ha vinto il torneo di New Haven e raggiunto i quarti di finale al Canada Masters. Ha battuto giocatori come Yevgeny Kafelnikov e Mark Philippoussis, vincendo 9 partite di fila. Probabilità della striscia vincente pari a 0.000053.
  6. Novak Djokovic, 2011 – La famosa striscia di Djokovic si classifica al sesto posto. Ha vinto 38 partite di fila, battendo Roger Federer tre volte e Rafael Nadal quattro volte. Sebbene avesse una valutazione Elo già inizialmente molto alta (2236 punti), questa striscia incredibile aveva una probabilità pari a solo 0.000055.
  7. Vladimir Voltchkov, 2000 – Voltchkov ha raggiunto la semifinale a Wimbledon 2000 con un Elo di partenza di soli 1499 punti. Stando alla sua pagina Wikipedia, ha tratto ispirazione in quel periodo dal film Il Gladiatore, che ha guardato per quattro volte, ottenendo dalla stampa inglese il soprannome di “Vladiator” e il ruolo di idolo personale. Probabilità della striscia vincente pari a 0.000065.
  8. Jerzy Janowicz, 2012 – Janowicz ha raggiunto la finale al Master di Parigi Bercy 2012. Partendo da una valutazione Elo di soli 1549 punti, ha battuto Philipp Kohlschreiber, Marin Cilic, Andy Murray e Gilles Simon, perdendo da David Ferrer. Probabilità della striscia vincente pari a 0.000107.
  9. Marat Safin, 2000 – Safin ha conseguito una striscia di 12 partite nel 2000, vincendo i tornei di Barcellona e Maiorca prima di perdere al secondo turno degli Internazionali d’Italia. Probabilità della striscia vincente pari a 0.000107.
  10. Guillermo Vilas, 1977 – Vilas ha collezionato una striscia impensabile di 73 vittorie nel 1977, vincendo 12 tornei di fila. Tuttavia, si posiziona solamente al decimo posto perché ci si attendeva che vincesse molte di quelle partite. Probabilità della striscia vincente pari a 0.000120.

Come si valuta la striscia di Shapovalov?

La striscia vincente di Shapovalov ha avuto una probabilità pari a 0.00046, valida per il 32esimo posto dalla classifica di sempre. Si tratta di un risultato già di per sé sorprendente, lo diventa ulteriormente nel momento in cui si considera che Shapovalov aveva giocato solamente otto partite sul circuito maggiore all’inizio della sua striscia.

Se limitiamo l’analisi alle strisce vincenti ottenute da giocatori con meno di 30 partite in carriera, Shapovalov entra nei primi 10, al settimo posto. Solo Voltchkov (Wimbledon 2000), Janowicz (Parigi Bercy 2012), Alexander Popp (Wimbledon 2000), John Andrews (Roland Garros 1975), Mark Vines (Parigi Bercy 1982), e Nick Kyrgios (Wimbledon 2014) hanno avuto strisce più sorprendenti nelle fasi iniziali della loro carriera.

Una curiosità finale: se Shapovalov avesse battuto Alexander Zverev – il suo avversario in semifinale – si sarebbe piazzato al sesto posto. Pur con quella sconfitta, l’ascesa di Shapovalov è una delle più rapide di sempre, rendendolo un giocatore, per il futuro, su cui puntare i riflettori.

Most Surprising Runs in Men’s Open Era