Pubblicato il 19 aprile 2025 su TennisAbstract – Traduzione di Edoardo Salvati
// Ogni tanto, appare un’analisi che introduce un nuovo modo di classificare gli stili di gioco, con un approccio che solitamente presuppone l’identificazione di gruppi di giocatori o giocatrici più o meno simili rispetto a una manciata di statistiche. Un gruppo può essere quello di chi è più offensivo e con colpi piatti, un altro quello degli esperti su terra battuta, un altro ancora quello degli specialisti del servizio e dritto a chiudere. Ci sono due problemi di fondo. Il primo è che le statistiche di tennis tendono a essere altamente correlate: sei sei forte in una cosa, probabilmente sei forte nella maggior parte delle altre. Secondo, le statistiche a disposizione non sono granché. A volte, durante le dirette, veniamo premiati con prelibatezze come la rotazione della pallina e la velocità del colpo, ma è un’eccezione. Di regola invece si procede con una classificazione sulla base di semplici indicatori come la percentuale di punti vinti con la seconda o, nei casi migliori, indici costruiti su mappatura di partite come nel caso della Potenza del Rovescio e dell’Indice di Offensività. Sono però calcoli legati ai punti vinti, il che riporta al problema della correlazione.
Non possiedo una soluzione. Tuttavia, ho un’idea eccentrica che potrebbe dare qualche indicazione in più. Anziché classificare i giocatori con le statistiche più granulari che abbiamo, perché non identificare gli stili partendo a ritroso dai risultati? Se due giocatrici hanno lo stesso inaspettato record di scontri diretti contro, ad esempio, Iga Swiantek, potrebbero avere qualcosa in comune. E se entrambe hanno un simile inaspettato record di scontri diretti contro diverse avversarie, non solo Swiantek, probabilmente non è una mera coincidenza, no? Forse riusciamo a studiare gli stili di gioco e vedere che mettono in difficoltà le altre in maniera simile e, pur non sapendo nulla della loro bravura o delle loro tattiche, possiamo trovare elementi comuni nei risultati. Il concetto è molto semplice, non lo è la matematica e, ancora più significativo, si rimane con più domande che risposte. Magari è una strada senza uscita, ma per il momento non riesco a guardare oltre l’angolo per accorgermene.
Benvenuti nella matrice
A breve ci addentriamo nel tema, ma prima voglio attrarvi con questo grafico a rete.
IMMAGINE 1 – Grafico a rete delle 20 giocatrici più “uniche” del campione

Si tratta delle 20 giocatrici più “uniche” del campione. Il grado di somiglianza tra ogni coppia di giocatrici è rappresentato dallo spessore della linea che le connette (sono consapevole non si riesce a distinguere facilmente una linea dall’altra). Clara Tauson ha un puntino giallo in quanto la più unica di tutte. Ma ci torniamo…forse.
Come funziona: ho selezionato le 60 giocatrici con il maggior numero di vittorie sul circuito maggiore dal 2021 e trovato tutte le partite che hanno giocato tra loro. Per ciascuna coppia di giocatrici, ho usato le valutazioni Elo pre-partita per stabilire quali fossero i risultati “inattesi”, e in quale direzione. Ad esempio, le valutazioni Elo dicono che, normalmente, Jelena Ostapenko ha una probabilità di battere Swiantek di circa il 20%, eppure ci ha sempre perso. Quindi, il punteggio di Ostapenko contro Swiatek è +0.8, mentre quello di Swiantek per lo stesso scontro diretto è -0.8. Sono pochi punteggi a essere tanto estremi, perché la maggior parte finisce all’incirca come ci si aspetta, attestandosi quindi intorno allo zero. Così facendo, ogni giocatrice ha un punteggio contro tutte le altre. A seguire, mi sono affidato alla fattorizzazione di matrice per l’analisi e comparazione di quegli insiemi di punteggio. Si tratta di un metodo tipico dei sistemi di raccomandazione: se due persone assegnano una valutazione simile a una serie di film e a una delle due piace un nuovo film, è probabile che piacerà anche all’altra. Relativamente al tennis, diciamo che le giocatrici A e B hanno risultati inattesi contro molte delle stesse avversarie. Se la giocatrice A vince a sorpresa contro Aryna Sabalenka, anche la giocatrice B potrebbe avere un’opportunità migliore di quella che pensiamo per batterla. In teoria, è una metodologia mirata a catturare alcuni aspetti dello stile di gioco, pur non avendo informazioni se non gli scontri diretti con valutazioni Elo corrette. La fattorizzazione di matrice ricerca modi efficienti per caratterizzare i vari rapporti tra le giocatrici, che potrebbero corrispondere ad attributi del mondo reale come “topspin carico di effetto” o “seconda di servizio attaccabile”, oppure risultare, a noi mortali, incomprensibili.
Praticamente incomprensibile
L’algoritmo ha deciso che era meglio procedere dividendo le 60 giocatrici in dieci categorie, che ho numerato senza che l’ordine di esposizione abbia importanza. Eccone una:
1 — Azarenka, Bencic, Kalinskaya, Kasatkina, Kostyuk, Mertens, Parry, Rybakina
Ok…troviamo chi colpisce piatto (tranne Daria Kasatkina) e nessuna a cui piace rischiare molto. Si intuisce il tipo di giocatrice di questo gruppo. Il prossimo:
2 — Alexandrova, Anisimova, Frech, Kontaveit, Muchova, Pegula, Schmiedlova, Vekic
Colpo piatto con grande apertura, anche se non avrei messo Jessica Pegula, e pure Karolina Muchova non c’entra molto. Un altro:
3 — Begu, Krejcikova, Kvitova, Linette, Maria, Siniakova, Svitolina, Swiatek, Tomljanovic, Vondrousova, Q. Zheng
Ah si, le note gemelle Swiatek e Petra Kvitova. La fattorizzazione di matrice si muove avvolta nel mistero, mi viene da pensare. Il prossimo è il mio preferito:
4 — Bogdan, Tauson
Come detto, Tauson è la più unica di tutto il gruppo e Ana Bogdan non è molto lontano. È la sola cosa che hanno in comune, giusto? Continuiamo:
5 — Badosa, Garcia, Haddad Maia, Navarro, Pliskova, Potapova, Sherif
Quasi un grattacapo come il gruppo di Swiatek. Ci sono due giocatrici che meno verrebbe da mettere insieme come Caroline Garcia e Mayar Sherif? Per quello che vale, l’algoritmo crede che Paula Badosa ed Emma Navarro siano le due più simili del campione. Non serve commentare ogni singolo gruppo, ma questi sono gli altri:
6 — Bouzkova, Kudermetova, Ostapenko, Samsonova
7 — Putintseva, Shnaider, Sorribes Tormo
8 — Blinkova, Bronzetti, Collins, Fernandez, Kalinina, Parrizas Diaz, Sabalenka
9 — Cirstea, Paolini
10 — Cocciaretto, Cornet, Gauff, Gracheva, Jabeur, Keys, Osorio, Sakkari
Se si trattasse di gruppi basati su statistiche tradizionali o generate dalla mappatura di partite, penserei a un errore di codifica. Per come stanno le cose, con questo metodo alternativo non sono raggruppamenti che ispirano fiducia.
Una questione di stile
Sono gruppi che l’algoritmo ha determinato sulla base delle valutazioni di ciascuna giocatrice rispetto a tre “fattori di stile” estratti dai punteggi di tutti quegli scontri diretti. Ripeto, non sappiamo a cosa corrispondano nel mondo reale, ma ognuno di essi è associato al sovra o sotto rendimento nei confronti delle valutazioni Elo. L’immagine 2 mostra la disposizione delle giocatrici in funzione dei primi due fattori di stile.
IMMAGINE 2 – Gruppi di giocatrici rispetto ai fattori di stile 1 e 2 (proiezione 2D)

Ostapenko e Liudmila Samsonova in un angolo (e Yulia Putintseva e Bogdan) nell’altro? Potrebbe in effetti avere un senso! Da sinistra a destra, otteniamo una classificazione abbastanza indicativa di giocatrici da molto offensive a poco offensive, seppur con ingressi come Marie Bouzkova a sinistra (nascosta appena dietro ad Anna Schmiedlova) e Garcia sulla destra. Più complicato è studiare il flusso alto-basso. Esiste correlazione tra questi due fattori di stile, tale da evidenziare un minimo livello offensivo. Ma Jasmine Paolini così in alto? Non pensavo potesse esistere una caratteristica, positiva o negativa, tale da farla emergere con prepotenza dalle altre.
Questi sono i grafici che mostrano il primo e il terzo fattore.
IMMAGINE 3 – Gruppi di giocatrici rispetto ai fattori di stile 1 e 3 (proiezione 2D)

E il secondo e il terzo.
IMMAGINE 4 – Gruppi di giocatrici rispetto ai fattori di stile 2 e 3 (proiezione 2D)

Non so cosa dire. Swiatek è nascosta al centro del grafico perché è praticamente attaccata a Tatjana Maria. Credo non ci sia altro da aggiungere.
Un gioco di rivalità
Dovrebbe funzionare, non è così? Perché giocatrici e giocatori possiedono punti di forza e debolezza che rimangono relativamente inalterati nel tempo. Sono suscettibili a un certo tipo di avversarie, mentre ne demoliscono altre. E se ne parla in continuazione, motivo per il quale si dice che il tennis è un gioco di rivalità. Coco Gauff fatica contro questo tipo di giocatrice, la sua prossima avversaria è quel tipo di giocatrice, prepariamoci a una sconfitta a sorpresa! È possibile che la mia idea funzioni, potremmo usare questi raggruppamenti e indici di similarità per sintonizzare le previsioni Elo di ogni partita e osservare se c’è un miglioramento nei risultati. Quando in fase predittiva pre-partita si tiene conto degli scontri diretti, l’accuratezza a malapena oscilla, principalmente per il fatto che ci sono così pochi confronti tra coppie di giocatrici. Analizzare raggruppamenti di giocatrici aumenta il campione, anche a costo di sacrificare precisione. Potremmo non capire mai il significato di questi fattori di stile, ma la controprova è nelle previsioni. Forse. Non riesco a testare questa ipotesi, almeno non a breve. Pensiamo però di averlo fatto e di aver scoperto che non serviva a nulla. Ci sono diverse plausibili ragioni.
Le giocatrici cambiano troppo velocemente
Può essere per questo che Paolini si trova a un estremo: è una giocatrice ben diversa da quella che era qualche anno fa. Qualsiasi tentativo di caratterizzarla si scontra con la difficoltà di riconciliare la Paolini del 2021 con quella del 2024. E ce ne sono molte altre a essere cambiate in modo significativo. Ancora più rilevante, le professioniste hanno lucida consapevolezza dei loro punti deboli. Il genere di avversaria in grado di tormentare Mirra Andreeva quest’anno può diventare oggetto di attenzione specifica nella preparazione alla stagione successiva.
Le giocatrici mettono insieme sequenze di risultati
Ho il sospetto che Tauson sia in una posizione così unica perché ha vinto e perso gruppi di partite: a gennaio, ne ha vinte 7 di fila, ma non perché ha avuto la fortuna di incontrare il giusto tipo di giocatrici. Di contro, ne ha perse 6 di fila l’estate scorsa. In entrambe le circostanze, si è trattato di una sequenza più legata alla forma personale che a chi ha trovato dall’altra parte della rete.
Non ci sono abbastanza dati
In teoria, ogni “profilo-giocatrice” deriva da un insieme di 59 punteggi da scontri diretti. Ma negli ultimi quattro anni, si sono giocati meno di tre quarti dei possibili scontri diretti. Di questi, circa il 40% è fatto da una partita sola, a cui ho assegnato una ponderazione inferiore, ma rimane ampio spazio perché il rumore statistico prenda il sopravvento sui singoli profili.
Il tennis non è realmente un gioco di rivalità
Non voglio essere così categorico, sono però convinto che la definizione di “gioco di rivalità” sia chiaramente esagerata. Per ogni scontro diretto a senso unico tra Ostapenko e Swiatek, ce ne sono una dozzina molto più noiosi, del tipo due set a uno per la più forte. Il riferimento agli scontri diretti è invocato più spesso a partita terminata, come parte di una narrazione costruita a posteriori. Le quote dei siti di scommesse si avvicinano molto più alle valutazioni Elo che non considerano lo stile che a qualsiasi scontro diretto basato sulla tipologia di stile della giocatrice.
Come ho detto, più domande che risposte. Ero partito inizialmente dai dati ATP e, liberi di non crederci, i risultati sono stati ancora più enigmatici. Se sapete il motivo per cui Sabalenka è nello stesso gruppo di Anna Blinkova e Nuria Parrizas Diaz, fatemelo sapere! ◼︎