mercoledì 21 aprile 2010

HATTRICK - Nuovo motore e "random"

PREMESSA

Questo articolo si occupa delle modifiche introdotte a seguito dell'editoriale del 7/12/2009, intitolato "Nuovo motore di gioco: Risultati più bilanciati e due tattiche corrette", non delle modifiche recenti relative a bonus/malus di sovraffollamento e agli apporti dei giocatori in campo. Dopo una stagione infatti si sono chiarite le linee dei cambiamenti introdotti a dicembre e ci chiediamo se quanto era nei propositi poteva essere realizzato o meno con le modalità introdotte.




CONCLUSIONE

Lo studio che qui viene proposto evidenzia, attraverso la simulazione di qualche decina di migliaia di partite che, se quanto è mostrato in seguito è corretto (potrei anche sbagliarmi, si sa) le modifiche introdotte NON HANNO ALCUN EFFETTO relativo al "random" né a livello di devianza della media, né a livello di forma funzionale.
Vi sono sì delle variazioni, ma del tutto casuali e non sistematiche.




L'EDITORIALE del 7/12/2009

Questi aluni punti dell'editoriale

"Questo nuovo motore di gioco interviene principalmente sulla distribuzione delle azioni (o occasioni da rete) come le azioni sono create e distribuite sul campo. (...) Il nostro obiettivo, con questo nuovo motore di gioco, è quello di ridurre la varianza (quella che alcuni chiamano random) e bilanciare il motore di gioco. (...) Questa nuova versione del motore di gioco agisce principalmente nel modo in cui le azioni sono create e distribuite tra le due squadre in campo. Cambiandone il funzionamento, rendiamo Hattrick più bilanciato, con partite più combattute, e meno risultati "estremi" difficili da spiegare. (...)

La nuova simulazione delle partite
Nel nuovo motore rimpiazzeremo alcune delle occasioni esistenti (quelle vinte a scapito della squadra avversaria) per un nuovo tipo, esclusivo per ogni squadra. Il tuo centrocampo deve ancora competere con quello del tuo avversario e "vincere" l'opportunità di trasformare l'azione in occasione da goal (come nel vecchio sistema). Ma se il tuo centrocampo non ottiene l'azione, significherà che l'azione è andata persa. Il tuo avversario non potrà ottenere le tue occasioni esclusive e viceversa.

Questo significa che alcune occasioni della partita sono "aperte" a entrambe le squadre mentre alcune possono essere ottenute solo da te (e alcune solo dal tuo avversario). Il numero di occasioni esclusive è lo stesso per entrambe le squadre.

Questo significa anche che non ci sarà più un ammontare fisso di occasioni standard in una partita (bensì un minimo e un massimo), in quanto dipenderà dal numero di azioni esclusive convertite in occasioni da goal.

Motivi del nuovo motore
Oggi le due squadre in campo usano la loro valutazione del centrocampo per competere su ogni potenziale azione da goal. Queste possibilità sono, come sai, limitate in numero e "aperte" ad entrambe le squadre, il che significa che un'occasione vinta da una squadra è un'occasione persa dall'altra.

Questo è abbastanza logico, ma crea effetti indesiderati. Per un motivo in particolare, in quanto abbiamo solo 10 azioni normali in una partita, e anche il minimo vantaggio nel numero di occasioni vinte (6-4) fornisce in realtà ad una squadra il 50% più di occasioni da rete (e nel secondo caso più basso (7-3) addirittura il 133% di occasioni in più). Gli special event posso rovesciare questo effetto, ma preferiamo che le occasioni normali possano essere suddivise più equamente (per esempio 5-4).

Il sistema attuale significa inoltre che la varianza (il range di potenziali esiti in una partita) è particolarmente alta. Ora, la squadra più forte vince mediamente con la stessa frequenza del calcio reale. Ma in confronto al calcio reale ci sono meno pareggi in Hattrick e anche molte più vittorie pesanti (e di conseguenza sconfitte).

Caratteristiche principali del nuovo motore
Il nuovo motore agisce contro i "problemi" menzionati in precedenza. Si può dire che crea queste nuove "funzioni":

- Diventa possibile una suddivisione delle occasioni più vicina alla parità (come 5-4 per esempio)
- Riduce la varianza; più gare equilibrate e meno risultati estremi
- Migliore esperienza "live", in quanto non sai quante azioni ci saranno
- Migliore gestione del contropiede e del pressing (dettagli in seguito)"

da studi effettuati pare che
  • le azioni COMUNI siano 5
  • le azioni ESCLUSIVE siano 5 per squadra



ELEMENTI COMUNI

Si parte dal confronto tra i CC (indicati come CC1 e CC2), che determinava una certa % di possesso


sempre confrontando i centrocampi dei due team si può calcolare la % di probabilità di avere un'azione, la formula è molto simile alla precedente, con la differenza che i valori vengono elevati al cubo


L'elevazione al cubo rende la curva molto più ripida (per valori prossimi al 50% del possesso, ma non complichiamo troppo le cose), come si evince dalla seguente tabella.


A fronte del 50% di possesso avremo quindi un 50% di probabilità di ogni azione, mentre col 60% di possesso avremo circa il 77% ci probabilità di ogni azione.
In questo grafico vengono evidenziate le probabilità di ogni azione per il team 1 e il team 2 al variare del possesso per il team 1 tra il 50$ e il 65%


attenzione: questo non significa che se la vostra probabilità è dell'80% avrete l'80%, ma che OGNI azione avrà l'80% di essere vostra. Se siete particolarmente sfortunati quindi potreste averne anche solo 1 o nessuna.
Questo è quello che viene chiamato "random" ossia il fatto che le azioni effettive siano sensibilmente diverse da quelle attese.
Nella seguente analisi ci focalizzeremo sulle azioni normali, escludendo dall'analisi tutte le altre variabili quali gli SE.




IL VECCHIO MOTORE

Col vecchio motore era piuttosto semplice, 10 azioni totali estratte nel modo di cui sopra. Una simulazione da me effettuata con 1000 partite simulate (ok, non è un numero grande, ma basta a farsi un'idea) dà i seguenti risultati


per leggere la tabella, procediamo con ordine.
Vediamo indicati il possesso dei due team, le rispettive probabilità teoriche e le azioni effettive risultanti dalla simulazione.
Quindi, prendendo la prima riga, quella col 50% di possesso per entrambi i team vediamo che le probabilità di azione sono il 50% per entrambi, le azioni effettive per il team 1 sono quelle indicate nella tabella che riporta il numero di azioni, quindi su 1000 casi per 3 volte il team 1 avrà avuto 1 ssola azione, per 63 volte 2 azioni, per 147 volte 3 azioni, per 181 volte 4 azioni ecc...
tutto questo si può rappresentare con un istogramma relativo appunto al numero di azioni ottenute dal team 1 in caso di 50% di possesso


vediamo che una linea di tendenza dà la classica forma a campana (gaussiana) delle frequenze riscontrate.
Idem se confrontiamo il caso del 50% del possesso con quello del 51%, del 52%, del53% e del 54%

vediamo che le curve si spostano a destra (aumenta il numero medio di azioni), mantenendo la stessa forma. Occorre quindi studiare tali curve per capire come vari la distribuzione di azioni al variare dei valori di CC e in particolare la loro

  • MEDIA, il valore medio trovato
  • DEVIAZIONE STANDARD, è una misura della varianza, un valore che misura di quanto si allontanino gli altri valori da quello medio. il seguente grafico dà un'idea (i valori non c'entrano con Hattrick)
nell'intorno tra media e +/- il valore della deviazione standard cade circa il 70% dei casi.
Media e deviazione standard sono indicate nella tabella sopra, la media come "azioni effettive (in media)" e la deviazione standard come "dev.standard", per entrambi i team. Le deviazioni standard coincidono tra team 1 e team 2 dato che derivano dalla stessa estrazione aleatoria.

Ma tali parametri non sono sufficienti per noi, infatti quello che viene percepito come fastidioso in Hattrick è la quantità di valori lontani da quanto atteso. Due curve potrebbero avere la stessa media e la stessa varianza, ma avere "code" molto diverse, e se le code di una sono più spesse significa che i casi estremi sono maggiori.
Una misura di questo è dato da un indice detto CURTOSI.
Se il valore della curtosi è positivo la curva sarà detta "leptocurtica" e sarà appuntita (curva verde qui sotto) e quindi i casi estremi saranno rari. Se la curva invece è "platicurtica" (plati=piatta) la curtosi sarà negativa e i casi estremi saranno più frequenti.


Nella tabella sopra a destra delle frequenze delle azioni per i due team venivano indicati i valori di curtosi, si poteva vedere facilmente che le frequenze erano generalmente negative (la curva è più piatta di una gaussiana standard), ma crescevano in modo correlato al possesso. Insomma al crescere del possesso le curve si fanno più appuntite e i casi estremi più rari.




IL NUOVO MOTORE

Col nuovo motore la simulazione su 16mila partite, secondo le ipotesi 5 azioni comuni + 5 esclusive per team, dà i seguenti valori:



è subito evidente come, essendo ora dipendenti da estrazioni parzialmente differenti, i valori di deviazione standard e curtosi per team 1 e team 2 siano differenti.




IL CONFRONTO

Quello che ci interessa però è il confronto tra vecchio e nuovo motore: diminuiscono le varianze? aumenta la curtosi riducendo il "random"?

Questa la tabella, indicando in verde i valori per cui il "random" si riduce e in rosso quelli in cui aumenta

vediamo che gli scostamenti
  • delle medie sono piuttosto trascurabili
  • delle varianze sono variabili, senza una chiara riduzione, anzi analizzando il team 2 vediamo un sacco di valori rossi in cui la varianza aumenta
  • delle curtosi sono anch'essi variabili, spesso in riduzione (in rosso) con un aumento dei casi estremi
se quanto è stato mostrato è corretto, allora i due propositi

- Diventa possibile una suddivisione delle occasioni più vicina alla parità (come 5-4 per esempio)
- Riduce la varianza; più gare equilibrate e meno risultati estremi

non vengono realizzati. O almeno, se succede, capita in modo casuale.




****



SECONDA PARTE

Un amico che ha letto la parte sopra ha osservato che
"se prima 3 azioni mie erano 7 tue, non era matematicamente possibile finire una partita 7-4 oppure 8-3, mentre adesso sì (dando per assodato il famoso 5-5-5 mie-tue-comuni).
Quello che è cambiato non sono le probabilità indipendenti della singola squadra, ma quelle composite di entrambe che concorrono a generare il risultato" e che "la "varianza" di cui parla l'editoriale è riferita alla probabilità di ottenere un dato scarto nella differenza reti"
quindi è la riduzione nello scarto quella a cui si punta.

Ora in effetti se consideriamo assieme azioni del team 1 e del team 2 vediamo come si è passati dall'approccio DETERMINISTICO del vecchio motore: se io ho la pallina "7" tu hai per forza la pallina "3" ad uno SEMI-DETERMINISTICO del nuovo motore, nel quale l'abbinamento è solo parzialmente casuale, in quanto sono casuali 5 azioni per parte, mentre 5 azioni restano comuni e quindi con abbinamento deterministico (se una ne ha 3 l'altra ne ha per forza 2)

Prendiamo un esempio concreto, il caso del possesso del 56% per il team 1.

Nel vecchio motore avevamo trovato queste frequenze nelle nostre simulazioni.


quindi a 132 casi in cui il team 1 ha 5 azioni, corrispondono 132 casi in cui il team 2 ne ha 5, a 279 casi in cui il team 1 ne ha 7 ce ne sono 279 in cui il team 2 ne ha 3 e così via...


Con il nuovo motore invece cade parzialmente questo determinismo


i valori opposti non combaciano più, se io ho 5 azioni non è detto che tu ne abbia 5. Inoltre il fatto che ci siano 53 casi in cui il team 1 ha 4 azioni e ci siano altri 53 in cui il team 2 ne ha 6 non significa che siano gli stessi abbinamenti.
A me sembra per intuizione che dovendo "pescare" un valore in una distribuzione che è sostanzialmente la stessa di quella esistente nel vecchio motore, le cose alla fine non cambino, ma approfondiamo un po' per vedere se questo è vero. Per semplicità supporrò che il determinismo cada completamente e che il numero di azioni del team 2 venga abbinato in modo del tutto aleatorio a quello del team 1.


Vediamo la differenza reti e la distribuzione dei risultati (per semplicità supponiamo che tutte le azioni vengano realizzate in gol)


Nel Vecchio motore di faceva presto a calcolare.
Indico in azzurro il vantaggio per il team 1 e in rosa quello per il team 2. Il team 1 avrà 2 reti di vantaggio in 210 casi (il 21%) dato che ci sono 210 casi in cui ha a disposizione 6 occasioni (che segnerà, come detto) e il team 2 ne avrà 4 (che segnerà anche lui). Quindi c'è il 21% di avere una vittoria del team 1 per 6-4, idem per gli altri valori, avremo un 27.9% di un 7-3, un 20.4% di un 8-2, un 9.2% di un 9-1 ecc...


le differenze reti sono sempre in numero pari perché le possibilità sono (5-5=0 6-4=2 7-3=4). Vediamo un totale di 13.2% di pareggi, di 80.3% complessivo di vittoria del team 1 e del 6.5% complessivo di vittoria del team 2.

La distribuzione di frequenza della differenza reti è questa



Andiamo a vedere nel nuovo motore ora abbinando però in modo del tutto casuale un'estrazione nella frequenza delle azioni del team 1 a un'altra in quella del team 2.
Ho eseguito 5 simulazioni di questo tipo e i risultati sono i seguenti


non ci sono grandi differenze tra una simulazione e l'altra.
In media la vittoria del team 1 avverrà nel 92.5% dei casi, il pareggio nel 4.4% e la sconfitta nel 3.1%. Pare che con un'estrazione del tutto indipendente vi sia una riduzione dei risultati sfavorevoli al team 1, il più forte in questo caso (ricordo che analizzo per il 56% del team 1).
La distribuzione di frequenza della differenza reti è questa


Ora il confronto tra nuovo e vecchio motore è ostacolato dal fatto che i dati delle differenze reti sono solo nei valori pari per il vecchio motore. Come fare? Possiamo

A) spalmare i valori del vecchio motore anche sui valori dispari.


in tal caso sembra evidente che nelle simulazioni la curve si siano più concentrate attorno ai valori centrali, segno di una riduzione dei casi estremi (quella in blu chiaro è la curva del vecchio motore)
Non sappiamo quanto la "spalmatura" effettuata però incida sulla maggiore piattezza.


B) possiamo viceversa accorpare i valori del nuovo motore ai soli valori pari.


vediamo che in tal caso i valori di pareggi e sconfitte si alzano, mentre si abbassano quelli delle vittorie, riportandosi verso i valori del vecchio motore.
Anche qui un grafico evidenzia come

l'abbinamento totalmente casuale tra valori di azioni del team 1 e del team 2 sembra concentrare maggiormente i valori delle differenze reti attorno al valore atteso, diminuendo i casi estremi.

Ora come ora non so quanto di questo effetto attribuire all'ostacolo dei valori solo pari per il vecchio motore e al conseguente adattamento dei dati per il confronto. Ho pensato anche che sarebbe possibile ipotizzare realizzazioni del 50% in modo che nel vecchio motore non avremmo più solo casi pari, ma in tal caso avremo valori con "1,5", "2,5" ecc nel nuovo motore e l'impasse resterebbe. Pubblico questo quindi non come studio concluso, ma come spunto di discussione e di ricerca.


PS. dai un occhio all' INDICE del blog, ci sono parecchi articoli che ti potrebbero interessare.




Andreac (team ID 1730726 in Hattrick)

Creative Commons License
This opera by Andreac is licensed under a Creative Commons Attribuzione-Non commerciale 3.0 Unported License. Cioé questo lavoro può essere liberamente copiato, distribuito o modificato senza espressa autorizzazione dell'autore, a patto che l'autore sia chiaramente indicato e la pubblicazione non sia a fini commerciali.

1 commento:

Anonimo ha detto...

Uno studio davvero fatto bene, ma toglimi una curiosità: come hai fatto a campionare 16mila partite di HT?