La statistica applicata al calcio
Applicare le regole della statistica per ottenere previsioni sui risultati delle partite di calcio

da | 9 Feb 2023 | Curiosità e tempo libero | 3 commenti

La statistica ed i modelli matematici che utilizzano la statistica hanno fatto passi da gigante.

Non c’è settore in cui non vengano applicati modelli statistici per prevedere quello che probabilisticamente succederà. Si pensi alle previsioni del tempo, a quelle finanziarie, alle pianificazioni di marketing e via dicendo.

Allora, stando così le cose, ci si potrebbe chiedere: perché non applicare le formule della statistica anche al calcio, ad es. alle partite di serie A, per prevederne i risultati?

In altri termini, esiste la possibilità di utilizzare la statistica previsionale per sapere in anticipo i risultati probabili delle partite di campionato?

La risposta a tale domanda è sì.

Quindi questi risultati previsionali possono essere considerati sufficientemente attendibili da prenderli per buoni?

La risposta è no.

Infatti, la statistica, anche la più raffinata, può dare l’esito probabilistico di una partita sulla base dei dati inseriti, ma alla fine in campo ci vanno 22 giocatori e non esiste software o algoritmo in grado di elaborare le infinite variabili del comportamento umano.

Detto ciò, che a ben vedere è un’ovvietà, possiamo però divertirci ad utilizzare appunto le regole della statistica per vedere quali sarebbero i risultati previsionali probabilistici delle future partite di serie A, sulla base dei dati relativi alle precedenti partite e, come detto, al di fuori di tantissime altre variabili non considerate.

A tal fine, Studiamo.it ha realizzato un programma in excel che prende in considerazioni le seguenti 10 variabili del campionato, per fare previsioni statisticamente probabili:

  • il numero di partite vinte in casa e fuori casa (2 variabili)
  • il numero di sconfitte in casa e fuori casa (2 variabili)
  • il numero di reti fatte e subite sia in casa che fuori casa (4 variabili)
  • il numero di pareggi in casa e fuori casa (2 variabili)

I dati da inserire sono quindi quelli sopra elencati, che possono essere inseriti facendo un “copia ed incolla” da qualche sito che riporta questi valori nella classifica della serie A.

Anche le squadre possono essere liberamente inserite. Ciò per tenere conto della diversità delle squadre da un campionato di serie A all’altro, ma anche per inserire eventualmente anche le squadre di un campionato diverso da quello della serie A (il programma funziona ugualmente).

In questo modo il programma fornisce la stima più probabile del risultato di una partita (considerate esclusivamente le variabili sopra citate). Di conseguenza, più sono numerosi i dati inseriti – riferiti alle partite già disputate del campionato – e più i risultati sono attendibili, nella declinazione sopra citata e molto prudente di attendibilità. Diciamo che i valori inseriti diventano dati significativi per fare previsioni dopo il girone di andata di un campionato.

Per chi è più curioso, il programma elabora la distribuzione normale sulle variabili indicate e definisce pertanto quelli che sono i valori fuori dell’intervallo di confidenza (soglia di significatività: 95%) così da stimare previsioni circa l’andamento delle gare future. Ecco perché più è corposa la massa dei dati inseriti e più le previsioni dovrebbero essere attendibili.

Inseriti i dati storici del campionato nelle celle bianche della tabella in alto, è sufficiente scegliere (con il menu a tendina sotto la tabella) le squadre della partita di cui si vuole conoscere il risultato probabilistico. Il programma restituisce l’esito previsionale dell’incontro.

Se si tratta di un derby bisogna selezionare, sempre con il menu a tendina, l’opzione “SI” alla relativa domanda, così che il programma prenda come input, per entrambe le squadre, i dati riferiti alle partite in casa (anziché i dati delle partite fuori casa per la squadra in trasferta).

Divertitevi a fare tutte le previsioni che volete, ma ricordate che si tratta comunque di un gioco, il quale, anche se basato su principi statistici, rimane pur sempre un gioco. Quindi non prendete seriamente i risultati ottenuti.

Ecco il programma in cui abbiamo già inserito dei dati a titolo di esempio. Questi dati sono però da sostituire con quelli aggiornati alla data più recente, così d’avere previsioni migliori. Potete sostituire anche le squadre.

Abbiamo messo tutto il nostro impegno nella realizzazione del programma e nella stesura dell’articolo, ma essi hanno esclusivamente finalità ludiche e pertanto non fate affidamento sui risultati del programma, né sulle informazioni contenute nel testo. Ci esoneriamo quindi da qualsiasi responsabilità per i danni derivanti dall’uso dei dati forniti.

3 Commenti

  1. Giuseppe Cristino

    Ciao ragazzi. Sono un programmatore di BOT per betfair (it com etc etc), si potrebbe avere l’algoritmo che usate e inserirlo in un BOT per verificare l’attendibilità dei prono e il ROI risultante dal vostro algoritmo?

    Fatemi sapere, sono molto curioso.

    Rispondi
    • Steve Round

      Piacerebbe anche a noi sapere l’attendibilità “dei prono ed il ROI risultante” (qualsiasi cosa siano). Ma l’algoritmo è di proprietà di Studiamo.it e pertanto …

      Rispondi
  2. Mike

    Buongiorno, sono uno studente dell’Università di Lugano (Svizzera) e sto facendo un progetto riguardante la statistica applicata nello sport. Questa pagina mi ha incuriosito parecchio. Buona giornata, Mike

    Rispondi

Invia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Share This