sabato 8 ottobre 2011

HATTRICK - Una misura (approssimata) del Random nella Serie



Tolgo un po' di polvere e posto qualcosa di nuovo.
Oddio, non proprio nuovissimo, dato che già n stagioni fa avevo fatto qualcosa di simile, ma l'avevo postato nei CS del mio team e quindi era rimasto con una visibilità assai limitata.

Quello che vado a proporre è una misura, seppur approssimata come indicato nel titolo, del "Random" all'interno di una Serie.
"Random" viene qui inteso come devianza dai risultati ottenuti rispetto a quelli attesi, mostrati a chi ha installato Foxtrick nella barra in basso, quella all'interno della "Analisi del Match di HTMS" (http://www.fantamondi.it/HTMS/index.php?lang=it).
Come specificato in quel sito "La barra invece mostra le percentuali di vittoria, pareggio, sconfitta. Questi valori provengono da un confronto statistico sull'analisi diretta dei dati e non da una predizione fatta tramite il modello matematico. Ovvero, ciò che è stato fatto è stato di raggruppare tutte le partite presenti nel DB in base ai rapporti tra centrocampo, attacco e difesa. Si è quindi passati a catalogare tutte le partite con gli stessi rapporti e a contare le percentuali di vittoria, sconfitta, pareggio (al netto degli SE) effettivamente ottenute. A questo scopo ovviamente un 8-0 conta una vittoria esattamente come un 2-1. Queste stesse percentuali sono quindi mostrate sulla barra e non sono quindi un lavoro di predizione, ma un resoconto di quello che è effettivamente successo."
E' un utile riferimento pertanto e non una misura assoluta, per questo parlo di misura "approssimata".

Prima di passare ai numeri introduco il concetto di "Valore Atteso" (o "Speranza Matematica"), che non è niente di complicato, provo a spiegarlo con un esempio concreto: giocare a testa o croce.
Gioco a testa o croce e punto 1 euro, vincendo 2 euro se azzecco o nulla se perdo.
La probabilità è del 50%.
Se gioco 1.000 volte mi aspetto di vincere nel 50% dei casi e di perdere nell'altro 50%.
Quindi 500 volte vinco 2 euro e 500 volte perdo, per un totale di 500*2€=1.000€
Quindi posso dire che a ogni giocata ho una vincita attesa di 1.000€/1.000giocate=1€ a giocata.
Chiaramente non ci sarà nessuna gocata in cui vincerò "1€", ma vincendo 2€ la metà delle volte e 0€ nell'altra metà, allora "in media" vincerò 1€ a ogni giocata.
Tale valore (il "valore atteso") è ottenuto moltiplicando gli esiti della giocata per le loro probabilità, cioè
2€ * 50% + 0€ * 50% = 2*0,5 + 0 = 1

In Hattrick chiaramente dovrò moltiplicare i punti dati dai risultati di 1, x, 2 per le loro probabilità che ricavo dalla barra citata sopra.
Per cui se in una partita ho il 60% di vittoria, il 25% di pareggio e il 15% di sconfitta significa che:
3punti*60% + 1punto*25% + 0 punti*15% = 1,8 + 0,25 + 0 = 2,05
e 2,05 sono i punti attesi da quella partita.
Come sopra, non ci sarà mai una partita in cui otterrò 2,05 punti, ma se la gioco 1.000 volte, allora in media 2,05 sarà il valore di punti ottenuto.

Ora non resta che da confrontare il valore vero ottenuto sul campo con quello atteso.
* se ho vinto allora ho ottenuto 3 punti, cioè sono stato leggermente fortunato e ho ottenuto 3-2,05=0.95 punti in più di quelli attesi
* se ho pareggiato allora ho ottenuto 1 punto, cioè sono stato leggermente sfortunato e ho ottenuto 1-2,05=-1,05 punti in meno di quelli attesi
* se ho perso allora ho ottenuto 0 punti, cioè sono stato molto sfortunato e ho ottenuto 0-2.05=-2,05 punti in meno di quelli attesi

Quindi il valore ottenuto con
PUNTI OTTENUTI SUL CAMPO - VALORE ATTESO
è una misura (seppur approssimata come detto) della fortuna (se positivo) o della sfortuna (se negativo) che si è avuto nella singola partita.
Sommando partita per partita e squadra per squadra si ottiene una misura di quali siano stati approssimativamente i team più fortunati e quelli più sfortunati.

ATTENZIONE: questo calcolo vede solo la differenza tra "valori in campo" e "risultato ottenuto", vi prego di tener presente che i "valori in campo" sono solo DOPO che si sono realizzati tutti gli eventi della partita. Ad es. se a un team si sono rotti 4 giocatori e sono entrati 4 riserve di valore basso, il calcolo sopra terrà conto solo del confronto tra i valori (bassi) e il risultato, determinando fortuna/sfortuna in base a quello e non considerando la (grande) sfortuna di avere 4 infortunati nella stessa partita. Attenzione quindi: trattasi di una misura non solo approssimata, ma anche PARZIALE della fortuna/sfortuna avuta dai diversi team.





Posto per esempio il risultato di questa analisi nelle giocate questa stagione nella mia serie. In fondo allego il file excel che - se volete - può fare da guida per un'analogo studio nella vostra serie.

Allora comincio mostrando la 1a giornata.


Ho inserito le varie squadre e il risultato della partita. Il foglio excel provvede a calcolare i punti ottenuti dai team (verde per la vittoria, grigio per il pareggio, rosa per la sconfitta).
Dopodiché


inserisco nelle colonne dei risultati attesi i valori delle % che trovo nelle barre in basso, partita per partita. Il folgio provvede a calcolare i punti attesi per ogni team e a mostrare la differenza tra punti attesi e punti ottenuti.
Un valore negativo (in rosso sempre più marcato più il valore è negativo) significa che i punti ottenuti sono stati meno degli attesi, per cui la partita è stata sfortunata, un valore positivo (in verde) il contrario.
Così nella prima giornata ero stato io il più fortunato (Hellas VB), portando a casa 1.84 punti più di quanto atteso, fortunati anche SambaReggae e AC Bresaola che portano a casa i 3 punti in partite non del tutto scontate. Differenza nulla per Atletic Birimbao che vince fuori casa contro il team bottizzato (Fear of starvation), vittoria del tutto attesa.
Procedo così dunque giornata per giornata


Inserito il tutto il foglio excel provvede a raccogliere e riordinare tutti i dati nel foglio "FOGLIO APPOGGIO (AUTO)" a calcolare le somme dei valori in "Punti Ottenuti (AUTO)" e "Punti Attesi (AUTO)" e mi presenta i risultati nel foglio "RISULTATO"


Da cui risulta che il team più sfortunato è stato Atletic Birimbao, che ha lasciato per strada quasi 3 punti e mezzo. Sfortunati anche SambaReggae (-2.26) e Seportivo Scarpasciolta (-1.80), neutro il team bottizzato, mentre sempre più fortunati S.C.A. Porto San Giorgio (+0.83), AC Bresaola (+0.98), Hellas VB (+1.48) e affittinelsalento (+1.84 punti).
Fortuna e sfortuna quindi non si compensano in un campionato così corto (solo 14 partite).

Ma tutto questo come ha inciso nella classifica?
E' presto detto (attenzione, questo calcolo non viene fatto in automatico, occorre fare copincolla e poi riordinare i valori)

Vedete a sinistra la classifica effettiva e a destra quella "Equa" coi punti pari ai punti attesi.
Primo S.C.A. Porto San Giorgio in tutte e due, fortuna/sfortuna non hanno inciso sul primo posto. Al secondo posto invece sarebbe stato secondo i punti attesi "Seportivo Scarpasciolta", che per una serie di partite sfortunate scivola al 4° posto reale, lasciando campo a Hellas VB e AC Bresaola. La squadra più fortunata di tutte (affittinelsalento) supera quella più sfortunata (Atletic Birimbao) cosa che genera uno scambio tra 5° e 6° posto.
Tirando le somme?
Ai playoff va il team che se lo merita, S.C.A. Porto San Giorgio, ai playout le due che sarebbero dovute andare (l'inversione tra 5° e 6° posto non cambia nulla) e anche le retrocesse direttamente sono quelle giuste.
Fortuna e sfortuna (pur in questa accezione APPROSSIMATIVA e PARZIALE, lo ricordo) alla fine della fiera non hanno inciso nelle cose che contano. Concludo col miglior in bocca al lupo per i miei cogironisti, che la dea bendata sia con voi nei decisivi spareggi!

Premete QUI per scaricare il file excel.


Andreac

4 commenti:

raspy ha detto...

Ma ti hanno pagato i biondi per dire che nonostante il random le cose non cambiano? LOL comunque gran lavoro come al solito. E' possibile applicare il mio campionato al foglio?

Andreac ha detto...

Certo, ho messo il file excel in modo che lo puoi applicare anche al tuo... Ho visto però che l'ordine delle partite cambia da serie a serie quindi devi ricopiare anche i team...

taised ha detto...

Certo che se sapevo che stavi elaborando un foglio excel per questo, ti avrei detto di risparmiare la fatica che lo stavo facendo io :)
Tra l'altro con foxtrick sarà presente in automatico nella pagina delle stagioni terminate.

Anonimo ha detto...

Ciao Andreac,

gran bel lavoro.
Ho provato anch'io a fare l'analisi del mio girone seguendo le tue indicazioni e, come sospettavo, la random l'ha fatta da padrone. In alcuni casi (la serie e' la IV.61) ci sono anche 10 punti in piu' (casi di fc padtm1987 e di babu' soccer team) e fino ad un disavanzo di 7,5 punti (lancusi wiola) che rivoluzionano di fatto la classifica "equa", come l'hai chiamata.

Grazie ancora
Karlas (AD68)