venerdì 23 aprile 2010

HATTRICK - Analisi dell'editoriale del 19 marzo

AVVERTENZA: I Valori Esposti in questo articolo sono obsoleti, nuovi valori sono esposti nell'articolo HATTRICK - Risultati Finali del Feedback e Prediction F


TERZA VERSIONE del 21 MAGGIO
migliorata grazie ai risultati del Feedback ricevuto



Doverosa PREMESSA

Allora, come molti di voi, mi sono trovato un po' perplesso davanti all'editoriale dello scorso 19 marzo... per cercare di riordinare le idee ho cominciato a buttar giù un po' di numeri per capire i punti fermi del discorso di HT-Tjecken e cercare di interpretare le sue parole, aiutandomi anche grazie a Sam-Vimes-NH, frequentatore assiduo del forum Global, che ha raccolto in un thread alcune risposte di HT-Tjecken agli utenti che aprivano qualche spiraglio di luce sulla questione.
E' chiaro: sto cercando di tirare fuori numeri da parole, con tutte le incertezze del caso. Sono parole di un HT, ma sempre parole sono.
Alcune cose di quanto segue sono certe (i rapporti tra i malus di difesa e quello di centrocampo ad esempio), altre sono probabili, altre solo possibili (o intuibili, il rapporto Y/X che vedrete sotto ad esempio), altre sono completamente messe per intuizione (il bonus al trequartista nei passaggi laterali ad esempio). Quindi ci sono diversi gradi di certezza in quanto segue, vogliatene tener conto.

Qualsiasi stima sugli effetti tattici dell'editoriale (ad es se un tale modulo sarà più conveniente rispetto ad un altro ecc) abbisogna di un consistente numero di partite effettivamente giocate per potere fare stime fondate sull'ENTITA' di bonus e malus. Cercare di indovinare adesso mi sembra un azzardo assai poco fondato.

Come molti di voi sanno, abbiamo realizzato un sito per lo studio della questione dove troverete gli strumenti e informazioni http://sites.google.com/site/andreacprediction/

Procedo seguendo la logica dell'editoriale, le citazioni dall'editoriale sono in blu.



1 Contributo dei giocatori centrali

Quando un giocatore gioca da solo in posizione centrale contribuirà al 100%.
Quando due giocatori giocano in posizione centrale, entrambi perderanno un po' del loro contributo.
Quando tre giocatori giocano in posizione centrale, tutti loro perderanno ancor più del loro contributo.

Allora viene introdotto un "malus di sovraffollamento" in % (come spiegato dallo stesso HT-Tjecken)
  • 1 giocatore --> nessun malus
  • 2 giocatori --> malus X
  • 3 giocatori --> malus Y
segnerò "Xd" per il malus per i difensori, "Xm" per i centrocampisti (midfielders), "Xa" per gli attaccanti. Ora se X è una certa %, mettiamo il 5%, se il contributo del giocatore fosse, mettiamo, 6,00 allora moltiplicandolo per (1-X) cioé (1-0.05) cioé 0.95 otteniamo 5.70



2 Il quantitativo di perdita non è uguale per tutti i settori

La perdita per i centrocampisti centrali è circa il doppio di quella dei difensori.

Quindi
Xm=2*Xd
Ym=2*Yd

Per gli attaccanti si assesta circa alla metà dei due casi precedenti.

Xa=1.5*Xd
Ya=1.5*Yd

inoltre
i difensori centrali e gli attaccanti riceveranno un bonus (ma non i centrocampisti centrali). Questo bonus equivale alla perdita di contributo che ricevono due giocatori, cioè usare due attaccanti o due difensori sarà lo stesso rispetto al passato

viene introdotto un "bonus compensativo" per difensori e attaccanti in TUTTE le skill, pari a
1/(1-Xd) per i difensori e
1/(1-Xa) per gli attaccanti, cioé, sapendo la relazione che li lega, 1/(1-1.5*Xd)

se Xd=5% allora
per i difensori il bonus sarà del 5.26%
per gli attaccanti del 8.10%


NOTA: visto che ricevo diverse osservazioni su questo punto vorrei chiarire ancora. I bonus vanno a TUTTI i difensori, poi se gioca in 1 nessun malus, in due malus X e in tre malus Y. I malus si applicano DOPO. Quindi se moltiplichiamo DOPO per (1-Xd) l'unico modo di annullare tale modifica è quello di moltiplicare PRIMA per 1/(1-Xd)
dovendo applicare un malus del 10% ad es.
se prima diamo un bonus del 10% e poi un malus del 10%
100 + 10% = 110
110 - 10% = 99 e non siamo a 100
quindi dobbiamo fare 100 + 1/(1-0.10) cioè aggiungere l'11.1111111% per poi poter togliere il 10% e tornare ad avere 100



3 Promuovere rose più ampie e bilanciate

Qui avevo seguito la traduzione inglese "if you use two high level midfielders the third one will have to be at a level even teams in div X wouldn’t field that often to penalise you – so scenarios like that are rare" e "high level" è decisamente indefinito poi ho visto la traduzione in italiano "se usi due centrocampisti titanici il terzo dovrà essere di un livello che nemmeno le squadre di X serie mettono in campo così spesso" questa versione è più precisa e corretta, anche in svedese "om man har två titaniska mittfältare" e in molte altre lingue si indica chiaramente "15".
Questo è un punto di non poca importanza perché è l'unico appiglio che abbiamo per stimare Y.

Dalle formule che ho mostrato in altri articoli, ipotizzando giocatori monoskill con 6 di forma, 4 di resistenza, 4 di esperienza con 15 in primaria e 4 nelle secondarie ottengo un contributo di due centrocampisti (come descritto nell'editoriale) pari a 11.22.
Ora l'apporto di un giocatore molto più debole che ipotizzo tra 5 e 6 in primaria (dal forum: "what do you call a league 10 Inner? inadequate/passable?" "Somewhere around those lines, yes" HT-Tjecken, post 13865282.30) è tra 1.60 e 2.00

Ora dobbiamo valutare se il nuovo centrocampo è superiore o meno al precedente.
Il nuovo sarà (1-Y)*11.22+(1-Y)*1.6 oppure (1-Y)*11.22+(1-Y)*2, raccogliendo, (1-Y)*12.82 e (1-Y)*13.22

Se li devo confrontare con centrocampo a 2 significa valutare quando sono pari a (1-X)*11.22

E quindi nel caso di terzo giocatore insufficiente
(1-X)*11.22=(1-Y)*12.82(1-Y)=(1-X)*0.875
Y=1-(1-X)*0.875
Y=0.875*X+0.125

Nel caso di terzo giocatore accettabile vale (saltando i passaggi)
Y=0.849*X+0.151

questo determina il seguente grafico al variare di X (X è in basso, nelle ascisse, e varia tra 5% e 15%, mentre Y è nelle ordinate)

al variare di X vedete in blu l'ipotesi con terzo giocatore insufficiente e in rosso col terzo accettabile.
Più interessante ancora è considerare la variazione Y/X cioè quant'è il malus a tre giocatori rispetto al malus a due giocatori


valori troppo elevati sono poco credibili e HT-Tjecken ha chiarito che Y>2X come potete vedere in [post=13880492.536]

questo esclude che X sia > dell 11% o del 13%, per tali valori infatti Y è < y =" 2,25" style="text-align: justify;">
  • Xm MALUS per 2 centrocampisti pari a 8%
  • Ym MALUS per 3 centrocampisti pari a 18%

e quindi per le relazioni viste sopra:

  • Xd=4% MALUS per i 2 difensori
  • Yd=9% MALUS per i 3 difensori

  • Xa=6% MALUS per i 2 attaccanti
  • Ya=13.5% MALUS per i 3 attaccanti

teniamo per ora buoni questi valori e andiamo avanti... di
4 Esperienza nella formazione
5 Confusione
non parlo, mi sembrano piuttosto chiare


6 Modifiche al contributo dei giocatori


Generale: - Difensori centrali e attaccanti ricevono un bonus. Questo bonus equivale alla perdita di contributo dovuta ai due giocatori centrali. Nota che questo non è vero per gli attaccanti difensivi (vedi sotto).

se Xd è 4% allora il "bonus compensativo" sarà del
1/(1-0.04) = 4.16 % per i difensori e
1/(1-0.06) = 6.38 % per gli attaccanti



Regia: - Ali, difensori centrali e attaccanti difensivi perderanno parte della regia...per mantenere l'attuale bilanciamento relativo tra centrocampisti centrali e altre posizioni che usano la skill regia, così da non rendere più importante schierare ali verso il centro o attaccanti difensivi una volta che rendiamo i centrocampisti centrali meno forti

quindi c'è un "malus regia di adeguamento" Z per ali, dc, attaccanti dif.
con Xm attorno al 8% avevo immaginato che "per mantenere l'attuale bilanciamento relativo" la perdita Z fosse nell'ordine del 8%. Invece un utente svizzero, pumuel (secondo nella sua serie A), che qui ringrazio, mi ha segnalato una frase di HT-Tjecken in cui veniva affermato che questa perdita fosse compresa tra X e Y... allora mi sono messo a fare due conti (chi non ha voglia di vedere numeri può saltare direttamente alla conclusione)

il contributo pre-modifica in regia di ogni centrocampista normal era di 0,46825

3 centrocampisti danno 1.40475
una riduzione del 18% lo porta a 1.1519

2 centrocampisti apportano 0.9365
una riduzione del 8% lo porta a 0.86158

la differenza è di 0.2903

ora l'apporto precedente in regia di un'ala TM era 0,30659
è evidente che se così fosse sarebbe di gran lunga preferibile l'ala TM al terzo centrocampista
per portare l'apporto al 0.2903 serve una riduzione del (0.2903-0,30659)/0,30659 = del 5.30%... ed eccoci quindi a


un valore inferiore sia ad X (8%) che a Y (20%) .
Quindi il valore di confine di Z può essere qualsiasi numero compreso tra 8% e 20%... Ho lasciato appositamente 14,5% nelle prediction C per vedere se, in caso di giocatori con ordini individuali verso il centro avessi dei casi di sottostima.
E sottostima, seppur leggera, si è vista. Pertanto abbasso Z, il malus regia per DCO, ALI tm e ATT difensivi dal 14,5% al 10%. Siamo comunque superiori al 5.3% per cui il 3° cc sarà preferibile all'ala TM, come da editoriale.


Passaggi: - Attaccanti difensivi tecnici faranno anch'essi minor uso della loro skill passaggi al centro, ma un uso maggiore ai lati. La perdità è comunque maggiore rispetto al guadagno.
- Attaccanti difensivi non tecnici diventeranno più simili ai tecnici. La sola differenza sarà che i tecnici otterranno di più dai loro passaggi sui lati.


quindi non solo non hanno il bonus, ma i tecnici vengono COMPLETAMENTE equiparati ai non tecnici nell'attacco centrale e hanno un plus in quello laterale.
Avevo ipotizzato inizialmente un bonus sui lati del 7.5%. Tale valore si è rivelato molto inferiore a quanto necessario. Per far tornare i conti devo

1) introdurre anche per loro il bonus di reparto di base, pari a (1/0,94)%
2) alzare il bonus in passaggi dal 7.5% al 30%. Si avete letto bene, 30% (sempre sui coefficienti! non sulle percentuali)

Faccio notare che questo alza il loro contributo in passaggi nei lati dal coefficiente 0.2204 al 0.3048, una differenza inferiore in valore assoluto alla perdita al centro che è dal 0.4706 al 0.3224. Quindi "la perdita è maggiore del guadagno", come da editoriale.



Cross: Ali, terzini e attaccanti (specialmente verso l'ala) faranno maggior uso della loro skill cross, con l'eccezione dei terzini verso il centro, che la utilizzeranno meno.

maggiore quanto? avevo ipotizzato - del tutto arbitrariamente - un 7.5% di bonus (10% per lo "specialmente") e un 5% di malus.
Per quanto riguarda gli attacchi laterali risultano leggermente sottostimate le ali normali, sovrastimate le offensive (abbasso il bonus in cross dal 7.5% al 2.5%) e fortemente sottostimate le TM a cui assegno un +15% sia in passaggi che in cross.




Difesa: - Ali offensive e difensive useranno di più la loro skill difesa. - Difensori centrali verso l'ala contribuiranno di più con la loro difesa sul lato - Terzini difensivi perderanno un po' della loro difesa verso il centro

anche qui ipotizzo un 7.5% nei bonus e un 5% nel malus.
I DCO sono sembrati leggermente sottostimati in difesa laterale, ho assegnato loro un bonus del 4% (a quelli verso l'ala era stato assegnato uno del 7.5%). Terzini offensivi e soprattutto difensivi sono risultati sovrastimati nell'apporto alle difese laterali. Introduco un malus del 2% per i primi e del 3% per i secondi. Quelli verso il centro risultano un po' sottostimati. Assegno un bonus del 2.5%.
Le Ali TM erano un po' sottostimate in difesa laterale: estendo anche a loro il bonus del +7.5% già dato a difensive e offensive.



Parate: - I portieri contribuiranno leggermente meno con la loro skill parate, incidendo su entrambi i lati e centro.

Il malus in Parate, posto al 5% è sembrato leggermente eccessivo, i contributi sembravano un po' sottostimati, il malus è stato ridotto al 2%





Procedo ora a riconsiderare le tabelle calcolate da Flattermann (www.flattermann.net) per vedere i cambiamenti.
Ecco i nuovi valori A MONTE dei malus da sovraffollamento X e Y


LEGENDA
LE RIGHE
GK goalkeeper, portiere
CD central defender
WB wing back, terzino
IM inner midfielder, centrocampista centrale
WI winger, ala
FW forward, attaccante
off offensivo
def difensivo
tw toward wing, verso l'ala
tm toward middle, verso il centro

LE COLONNE
MID REG apporto di regia al centrocampo
CD Par apporto di parate alla difesa centrale
CD Dif apporto di difesa alla difesa centrale
SD Par apporto di parate alla difesa laterale (Side defence)
SD Dif apporto di difesa alla difesa laterale (Side defence)
CA Pass apporto di passaggi all'attacco centrale
CA Att apporto di attacco all'attacco centrale
SA Pass apporto di passaggi all'attacco laterale (Side attack)
SA Cro apporto di cross all'attacco laterale (Side attack)
SA Att apporto di attacco all'attacco laterale (Side attack)


e queste le variazioni totali, in %, PRIMA dei malus di sovraffollamento) rispetto ai valori della stagione precedente (che trovate nel sito di Flattermann http://www.flattermann.net/)


DOPODICHE' dobbiamo applicare i malus di sovraffollamento


per 2 giocatori in una zona
Xd=4%
Xm=8%
Xa=6%

per 3 giocatori in una zona
Yd=9%
Ym=18%
Ya=13.5%





PS. dai un occhio all' INDICE del blog, ci sono parecchi articoli che ti potrebbero interessare.




Andreac (team ID 1730726 in Hattrick)

Creative Commons License
This opera by Andreac is licensed under a Creative Commons Attribuzione-Non commerciale 3.0 Unported License. Cioé questo lavoro può essere liberamente copiato, distribuito o modificato senza espressa autorizzazione dell'autore, a patto che l'autore sia chiaramente indicato e la pubblicazione non sia a fini commerciali.

mercoledì 21 aprile 2010

HATTRICK - Nuovo motore e "random"

PREMESSA

Questo articolo si occupa delle modifiche introdotte a seguito dell'editoriale del 7/12/2009, intitolato "Nuovo motore di gioco: Risultati più bilanciati e due tattiche corrette", non delle modifiche recenti relative a bonus/malus di sovraffollamento e agli apporti dei giocatori in campo. Dopo una stagione infatti si sono chiarite le linee dei cambiamenti introdotti a dicembre e ci chiediamo se quanto era nei propositi poteva essere realizzato o meno con le modalità introdotte.




CONCLUSIONE

Lo studio che qui viene proposto evidenzia, attraverso la simulazione di qualche decina di migliaia di partite che, se quanto è mostrato in seguito è corretto (potrei anche sbagliarmi, si sa) le modifiche introdotte NON HANNO ALCUN EFFETTO relativo al "random" né a livello di devianza della media, né a livello di forma funzionale.
Vi sono sì delle variazioni, ma del tutto casuali e non sistematiche.




L'EDITORIALE del 7/12/2009

Questi aluni punti dell'editoriale

"Questo nuovo motore di gioco interviene principalmente sulla distribuzione delle azioni (o occasioni da rete) come le azioni sono create e distribuite sul campo. (...) Il nostro obiettivo, con questo nuovo motore di gioco, è quello di ridurre la varianza (quella che alcuni chiamano random) e bilanciare il motore di gioco. (...) Questa nuova versione del motore di gioco agisce principalmente nel modo in cui le azioni sono create e distribuite tra le due squadre in campo. Cambiandone il funzionamento, rendiamo Hattrick più bilanciato, con partite più combattute, e meno risultati "estremi" difficili da spiegare. (...)

La nuova simulazione delle partite
Nel nuovo motore rimpiazzeremo alcune delle occasioni esistenti (quelle vinte a scapito della squadra avversaria) per un nuovo tipo, esclusivo per ogni squadra. Il tuo centrocampo deve ancora competere con quello del tuo avversario e "vincere" l'opportunità di trasformare l'azione in occasione da goal (come nel vecchio sistema). Ma se il tuo centrocampo non ottiene l'azione, significherà che l'azione è andata persa. Il tuo avversario non potrà ottenere le tue occasioni esclusive e viceversa.

Questo significa che alcune occasioni della partita sono "aperte" a entrambe le squadre mentre alcune possono essere ottenute solo da te (e alcune solo dal tuo avversario). Il numero di occasioni esclusive è lo stesso per entrambe le squadre.

Questo significa anche che non ci sarà più un ammontare fisso di occasioni standard in una partita (bensì un minimo e un massimo), in quanto dipenderà dal numero di azioni esclusive convertite in occasioni da goal.

Motivi del nuovo motore
Oggi le due squadre in campo usano la loro valutazione del centrocampo per competere su ogni potenziale azione da goal. Queste possibilità sono, come sai, limitate in numero e "aperte" ad entrambe le squadre, il che significa che un'occasione vinta da una squadra è un'occasione persa dall'altra.

Questo è abbastanza logico, ma crea effetti indesiderati. Per un motivo in particolare, in quanto abbiamo solo 10 azioni normali in una partita, e anche il minimo vantaggio nel numero di occasioni vinte (6-4) fornisce in realtà ad una squadra il 50% più di occasioni da rete (e nel secondo caso più basso (7-3) addirittura il 133% di occasioni in più). Gli special event posso rovesciare questo effetto, ma preferiamo che le occasioni normali possano essere suddivise più equamente (per esempio 5-4).

Il sistema attuale significa inoltre che la varianza (il range di potenziali esiti in una partita) è particolarmente alta. Ora, la squadra più forte vince mediamente con la stessa frequenza del calcio reale. Ma in confronto al calcio reale ci sono meno pareggi in Hattrick e anche molte più vittorie pesanti (e di conseguenza sconfitte).

Caratteristiche principali del nuovo motore
Il nuovo motore agisce contro i "problemi" menzionati in precedenza. Si può dire che crea queste nuove "funzioni":

- Diventa possibile una suddivisione delle occasioni più vicina alla parità (come 5-4 per esempio)
- Riduce la varianza; più gare equilibrate e meno risultati estremi
- Migliore esperienza "live", in quanto non sai quante azioni ci saranno
- Migliore gestione del contropiede e del pressing (dettagli in seguito)"

da studi effettuati pare che
  • le azioni COMUNI siano 5
  • le azioni ESCLUSIVE siano 5 per squadra



ELEMENTI COMUNI

Si parte dal confronto tra i CC (indicati come CC1 e CC2), che determinava una certa % di possesso


sempre confrontando i centrocampi dei due team si può calcolare la % di probabilità di avere un'azione, la formula è molto simile alla precedente, con la differenza che i valori vengono elevati al cubo


L'elevazione al cubo rende la curva molto più ripida (per valori prossimi al 50% del possesso, ma non complichiamo troppo le cose), come si evince dalla seguente tabella.


A fronte del 50% di possesso avremo quindi un 50% di probabilità di ogni azione, mentre col 60% di possesso avremo circa il 77% ci probabilità di ogni azione.
In questo grafico vengono evidenziate le probabilità di ogni azione per il team 1 e il team 2 al variare del possesso per il team 1 tra il 50$ e il 65%


attenzione: questo non significa che se la vostra probabilità è dell'80% avrete l'80%, ma che OGNI azione avrà l'80% di essere vostra. Se siete particolarmente sfortunati quindi potreste averne anche solo 1 o nessuna.
Questo è quello che viene chiamato "random" ossia il fatto che le azioni effettive siano sensibilmente diverse da quelle attese.
Nella seguente analisi ci focalizzeremo sulle azioni normali, escludendo dall'analisi tutte le altre variabili quali gli SE.




IL VECCHIO MOTORE

Col vecchio motore era piuttosto semplice, 10 azioni totali estratte nel modo di cui sopra. Una simulazione da me effettuata con 1000 partite simulate (ok, non è un numero grande, ma basta a farsi un'idea) dà i seguenti risultati


per leggere la tabella, procediamo con ordine.
Vediamo indicati il possesso dei due team, le rispettive probabilità teoriche e le azioni effettive risultanti dalla simulazione.
Quindi, prendendo la prima riga, quella col 50% di possesso per entrambi i team vediamo che le probabilità di azione sono il 50% per entrambi, le azioni effettive per il team 1 sono quelle indicate nella tabella che riporta il numero di azioni, quindi su 1000 casi per 3 volte il team 1 avrà avuto 1 ssola azione, per 63 volte 2 azioni, per 147 volte 3 azioni, per 181 volte 4 azioni ecc...
tutto questo si può rappresentare con un istogramma relativo appunto al numero di azioni ottenute dal team 1 in caso di 50% di possesso


vediamo che una linea di tendenza dà la classica forma a campana (gaussiana) delle frequenze riscontrate.
Idem se confrontiamo il caso del 50% del possesso con quello del 51%, del 52%, del53% e del 54%

vediamo che le curve si spostano a destra (aumenta il numero medio di azioni), mantenendo la stessa forma. Occorre quindi studiare tali curve per capire come vari la distribuzione di azioni al variare dei valori di CC e in particolare la loro

  • MEDIA, il valore medio trovato
  • DEVIAZIONE STANDARD, è una misura della varianza, un valore che misura di quanto si allontanino gli altri valori da quello medio. il seguente grafico dà un'idea (i valori non c'entrano con Hattrick)
nell'intorno tra media e +/- il valore della deviazione standard cade circa il 70% dei casi.
Media e deviazione standard sono indicate nella tabella sopra, la media come "azioni effettive (in media)" e la deviazione standard come "dev.standard", per entrambi i team. Le deviazioni standard coincidono tra team 1 e team 2 dato che derivano dalla stessa estrazione aleatoria.

Ma tali parametri non sono sufficienti per noi, infatti quello che viene percepito come fastidioso in Hattrick è la quantità di valori lontani da quanto atteso. Due curve potrebbero avere la stessa media e la stessa varianza, ma avere "code" molto diverse, e se le code di una sono più spesse significa che i casi estremi sono maggiori.
Una misura di questo è dato da un indice detto CURTOSI.
Se il valore della curtosi è positivo la curva sarà detta "leptocurtica" e sarà appuntita (curva verde qui sotto) e quindi i casi estremi saranno rari. Se la curva invece è "platicurtica" (plati=piatta) la curtosi sarà negativa e i casi estremi saranno più frequenti.


Nella tabella sopra a destra delle frequenze delle azioni per i due team venivano indicati i valori di curtosi, si poteva vedere facilmente che le frequenze erano generalmente negative (la curva è più piatta di una gaussiana standard), ma crescevano in modo correlato al possesso. Insomma al crescere del possesso le curve si fanno più appuntite e i casi estremi più rari.




IL NUOVO MOTORE

Col nuovo motore la simulazione su 16mila partite, secondo le ipotesi 5 azioni comuni + 5 esclusive per team, dà i seguenti valori:



è subito evidente come, essendo ora dipendenti da estrazioni parzialmente differenti, i valori di deviazione standard e curtosi per team 1 e team 2 siano differenti.




IL CONFRONTO

Quello che ci interessa però è il confronto tra vecchio e nuovo motore: diminuiscono le varianze? aumenta la curtosi riducendo il "random"?

Questa la tabella, indicando in verde i valori per cui il "random" si riduce e in rosso quelli in cui aumenta

vediamo che gli scostamenti
  • delle medie sono piuttosto trascurabili
  • delle varianze sono variabili, senza una chiara riduzione, anzi analizzando il team 2 vediamo un sacco di valori rossi in cui la varianza aumenta
  • delle curtosi sono anch'essi variabili, spesso in riduzione (in rosso) con un aumento dei casi estremi
se quanto è stato mostrato è corretto, allora i due propositi

- Diventa possibile una suddivisione delle occasioni più vicina alla parità (come 5-4 per esempio)
- Riduce la varianza; più gare equilibrate e meno risultati estremi

non vengono realizzati. O almeno, se succede, capita in modo casuale.




****



SECONDA PARTE

Un amico che ha letto la parte sopra ha osservato che
"se prima 3 azioni mie erano 7 tue, non era matematicamente possibile finire una partita 7-4 oppure 8-3, mentre adesso sì (dando per assodato il famoso 5-5-5 mie-tue-comuni).
Quello che è cambiato non sono le probabilità indipendenti della singola squadra, ma quelle composite di entrambe che concorrono a generare il risultato" e che "la "varianza" di cui parla l'editoriale è riferita alla probabilità di ottenere un dato scarto nella differenza reti"
quindi è la riduzione nello scarto quella a cui si punta.

Ora in effetti se consideriamo assieme azioni del team 1 e del team 2 vediamo come si è passati dall'approccio DETERMINISTICO del vecchio motore: se io ho la pallina "7" tu hai per forza la pallina "3" ad uno SEMI-DETERMINISTICO del nuovo motore, nel quale l'abbinamento è solo parzialmente casuale, in quanto sono casuali 5 azioni per parte, mentre 5 azioni restano comuni e quindi con abbinamento deterministico (se una ne ha 3 l'altra ne ha per forza 2)

Prendiamo un esempio concreto, il caso del possesso del 56% per il team 1.

Nel vecchio motore avevamo trovato queste frequenze nelle nostre simulazioni.


quindi a 132 casi in cui il team 1 ha 5 azioni, corrispondono 132 casi in cui il team 2 ne ha 5, a 279 casi in cui il team 1 ne ha 7 ce ne sono 279 in cui il team 2 ne ha 3 e così via...


Con il nuovo motore invece cade parzialmente questo determinismo


i valori opposti non combaciano più, se io ho 5 azioni non è detto che tu ne abbia 5. Inoltre il fatto che ci siano 53 casi in cui il team 1 ha 4 azioni e ci siano altri 53 in cui il team 2 ne ha 6 non significa che siano gli stessi abbinamenti.
A me sembra per intuizione che dovendo "pescare" un valore in una distribuzione che è sostanzialmente la stessa di quella esistente nel vecchio motore, le cose alla fine non cambino, ma approfondiamo un po' per vedere se questo è vero. Per semplicità supporrò che il determinismo cada completamente e che il numero di azioni del team 2 venga abbinato in modo del tutto aleatorio a quello del team 1.


Vediamo la differenza reti e la distribuzione dei risultati (per semplicità supponiamo che tutte le azioni vengano realizzate in gol)


Nel Vecchio motore di faceva presto a calcolare.
Indico in azzurro il vantaggio per il team 1 e in rosa quello per il team 2. Il team 1 avrà 2 reti di vantaggio in 210 casi (il 21%) dato che ci sono 210 casi in cui ha a disposizione 6 occasioni (che segnerà, come detto) e il team 2 ne avrà 4 (che segnerà anche lui). Quindi c'è il 21% di avere una vittoria del team 1 per 6-4, idem per gli altri valori, avremo un 27.9% di un 7-3, un 20.4% di un 8-2, un 9.2% di un 9-1 ecc...


le differenze reti sono sempre in numero pari perché le possibilità sono (5-5=0 6-4=2 7-3=4). Vediamo un totale di 13.2% di pareggi, di 80.3% complessivo di vittoria del team 1 e del 6.5% complessivo di vittoria del team 2.

La distribuzione di frequenza della differenza reti è questa



Andiamo a vedere nel nuovo motore ora abbinando però in modo del tutto casuale un'estrazione nella frequenza delle azioni del team 1 a un'altra in quella del team 2.
Ho eseguito 5 simulazioni di questo tipo e i risultati sono i seguenti


non ci sono grandi differenze tra una simulazione e l'altra.
In media la vittoria del team 1 avverrà nel 92.5% dei casi, il pareggio nel 4.4% e la sconfitta nel 3.1%. Pare che con un'estrazione del tutto indipendente vi sia una riduzione dei risultati sfavorevoli al team 1, il più forte in questo caso (ricordo che analizzo per il 56% del team 1).
La distribuzione di frequenza della differenza reti è questa


Ora il confronto tra nuovo e vecchio motore è ostacolato dal fatto che i dati delle differenze reti sono solo nei valori pari per il vecchio motore. Come fare? Possiamo

A) spalmare i valori del vecchio motore anche sui valori dispari.


in tal caso sembra evidente che nelle simulazioni la curve si siano più concentrate attorno ai valori centrali, segno di una riduzione dei casi estremi (quella in blu chiaro è la curva del vecchio motore)
Non sappiamo quanto la "spalmatura" effettuata però incida sulla maggiore piattezza.


B) possiamo viceversa accorpare i valori del nuovo motore ai soli valori pari.


vediamo che in tal caso i valori di pareggi e sconfitte si alzano, mentre si abbassano quelli delle vittorie, riportandosi verso i valori del vecchio motore.
Anche qui un grafico evidenzia come

l'abbinamento totalmente casuale tra valori di azioni del team 1 e del team 2 sembra concentrare maggiormente i valori delle differenze reti attorno al valore atteso, diminuendo i casi estremi.

Ora come ora non so quanto di questo effetto attribuire all'ostacolo dei valori solo pari per il vecchio motore e al conseguente adattamento dei dati per il confronto. Ho pensato anche che sarebbe possibile ipotizzare realizzazioni del 50% in modo che nel vecchio motore non avremmo più solo casi pari, ma in tal caso avremo valori con "1,5", "2,5" ecc nel nuovo motore e l'impasse resterebbe. Pubblico questo quindi non come studio concluso, ma come spunto di discussione e di ricerca.


PS. dai un occhio all' INDICE del blog, ci sono parecchi articoli che ti potrebbero interessare.




Andreac (team ID 1730726 in Hattrick)

Creative Commons License
This opera by Andreac is licensed under a Creative Commons Attribuzione-Non commerciale 3.0 Unported License. Cioé questo lavoro può essere liberamente copiato, distribuito o modificato senza espressa autorizzazione dell'autore, a patto che l'autore sia chiaramente indicato e la pubblicazione non sia a fini commerciali.

mercoledì 14 aprile 2010

HATTRICK - Malus di sovraffollamento e possesso in centrocampi a 2 e a 3

Prendo spunto da un'osservazione di belfagor nel forum Italia:

Il punto è però il possesso, visto che tutti perdono in valore assoluto..
Faccio due conti buttati lì, magari ci sono errori ma sono per iniziare a ragionarci...
Prendiamo centrocampo a 3 valore 9 e uno a 2 valore 6 col vecchio motore. Possesso 60%.

Ipotizziamo i cali:
9*.85=7,65 6*.94=5,64
Possesso: 57,6%. (meno 2,6)

Con un 12-6 passeremmo da 66,6% a 64,3% (meno 2,3)
Con 7-6 passeremmo da 53,8% al 51,3% (meno 2,5)
Con 6-6 passeremmo da 50% a 46%

Se tutto è corretto cosa vuol dire?
Che più si fanno valori vicini usando meno centrocampisti più si può avere un vantaggio in termini di possesso.
Con più differenza avere un CC in più ti dà una perdita di possesso pari al 2 o 2,5%.
Ovviamente configurazioni che prima davano possesso pari, ora favoriscono chi lo ottiene con meno centrocampisti.


Provo a sviluppare un po' l'argomento confrontando malus su centrocampi a 2 e a 3 cc (tralasciando per semplicità gli apporti degli altri giocatori)
definisco con
CC3 il valore del centrocampo (pre-malus) del team che gioca con 3 cc
CC2 il valore del centrocampo (pre-malus) del team che gioca con 2 cc
ricordando che y% è il malus per il cc a 3 e x% il malus per il cc a 2

il possesso P3 del team con 3 cc è dato da P3 = CC3*(1-y)/(CC3*(1-y)+CC2(1-x))

ci sono 4 variabili, ma una la possiamo eliminare dato che è largamente ipotizzato che y=2,5x
quindi ci restano 3 variabili per valutare P3

P3 = (CC3*(1-2,5x))/(CC3*(1-2,5x)+CC2(1-x))

cominciamo a studiare il variare del Possesso al variare delle variabili




1) al variare del malus x (mentre i valori dei centrocampi restano uguali)

non abbiamo ancora stime sufficienti, ma ci possiamo aspettare che verosimilmente x varierà tra il 5% e il 10% con y tra il 12,5% e il 25%
considero due team che hanno centrocampi uguali, uno li ottiene con 2 centrocampisti (CC2) e uno con e (CC3), prendo per comodità il valore di eccellente basso (30)



la prima riga mi dice che nella situazione precedente all'introduzione dei malus valeva x=y=0% e quindi il possesso del team a 3 cc era il 50%
con l'inotrduzione del malus 5% per il centrocampo a 2 e del conseguente 12,5% per il centrocampo a 3 vedo che il CC2 si riduce a 28.50, il CC3 a 26.25 e quindi il possesso del team a 3 cc si riduce a circa il 48%. Per ogni punto di incremento percentuale di X la riduzione del possesso del team con 3 centrocampisti è di circa lo 0.50%
quindi
ΔP3 ≈ 0.50 * Δx



2) al variare del centrocampo CC3

considero per semplicità un valore medio di x pari a 7,5%, con un y quindi pari al 18.75%
vedo come varia il possesso P3 al variare di +/- 5 sottolivelli rispetto a quello di riferimento


vediamo che al variare di un sottolivello di CC3 rispetto a CC2, il possesso P3 varia di circa 0.80%
valore che cresce al calare di CC3 (già la differenza tra il livello 26 e il 25 è superiore al punto percentuale) e viceversa
(per i maniaci la formula si avvicina a δP3/δCC3 ≈ (CC3+27.75)^(-1) - CC3*(CC3+27.75)^(-2) che andrebbe moltiplicato per CC3(n)-CC3(n-1) )

Possiamo cercare il punto di pareggio: dato un malus x pari a 7,5% e un CC2 pari a 30 vediamo che per non perdere col centrocampo a 3 occorre che tale centrocampo sia maggiore di 4.15 sottolivelli rispetto a CC2. Infatti al valore di CC3 pari a 35 vediamo che il possesso è > del 50%.
Ora, grazie a uno spunto di Paliù-NH, andiamo a vedere come varia il punto di pareggio al variare di x e di CC2
cerchiamo quindi che il possesso sia 0.5 e che CC3=CC2+n

0.5=((CC2+n)*(1-2,5x))/((CC2+n)*(1-2,5x)+CC2(1-x))

che risolvendo darà rispetto a n
n = CC2*(0.75x)/(0.5-1.25x)

Questa è la formula appunto per capire di quanti sottolivelli dobbiamo essere superiori aggiungendo un terzo CC (si può vedere ad es. nel vecchio HO!) per compensare i malus introdotti ora e raggiungere il possesso del 50% col centrocampo a 2

nell'esempio precedente con x=0.075 e CC2=30
n = 30*(0.75*0.075)/(0.5-1.25*0.075)
n = 30*(0.05625)/(0.40625)
n = 1.6875/0.40625
n = 4.153845

cioè serve poco più di un livello per raggiungere il pareggio coi nuovi malus
ecco una tabella al variare di x e del CC2 che ci dice di quanti sottolivelli dovevamo essere superiori col centrocampo a 3 per raggiungere ora il possesso pari rispetto al centrocampo a 2




****



Mi permetto di scrivere un'AVVERTENZA per chi si metta a fare i confronti con Hattrick Organizer non aggiornato.

Nel sistema precedente ricordo che c'era la regola per cui il 3° centrocampista veniva penalizzato di circa (secondo HO!) il 15%
ora quella penalità è scomparsa, sostituita dal nuovo sistema

questo significa che se avete 3 CC, mettiamo un sovrannaturale, un magnifico e uno splendido e HO! vi dava 5.95 (insuff molto alto) per il vostro CC dovete tener conto che quel numero derivava da
14+12+11*0.85=35.35

ora la penalità è scomparsa, sostituita dalle nuove, per cui potete pensare a
14+12+11=37

dovete aumentare il valore precedente (a parità di forma, resistenza ecc) del 37/35.5=1.0466 cioè del 4.66%

quindi 5.95*1.0466=6.22 è l'unità su cui ragionare, sarebbe il vecchio valore "vero" prima di togliere il 15% del terzo centrocampista

se ora si perde il 20% ci possiamo aspettare un 6.22 -20% = 4.98 (debole molto alto)

la perdita VISIBILE in questo caso è di (5.95 - 4.98) = 0.97, cioè quasi 4 sottolivelli



****



per un confronto col CC a 2 se prima col sovra e il magnifico facevo 4.55 (debole alto)
ora farò 4.55 -8% = 4.18

la perdita in questo caso è di (4.55 - 4.18) = 0.37



****



la differenza visibile tra i due CC era di 5.95 - 4.55 = 1.40 che diviso 0.25 (che è il valore di un sottolivello) dà 5.60 sottolivelli

nella tabella in alto




cerco nella riga il valore di hatstat del CC a 2 centrocampisti che è "15" (4.55 - debole alto) e nelle righe il malus X stimato che è 8... il valore di equilibrio è 2.25 (a cui va aggiunto 0.5 sottolivello)

dato che la differenza tra i due CC era di 5.60 sottolivelli che è maggiore di 2.75, allora il centrocampo a 3 centrocampisti sarà superiore a quello a 2,

e infatti 4.98 > 4.18



****



il punto di equilibrio di "n" sottolivelli si calcola con la formula in quell'articolo che è

n = CC2*(0.75x)/(0.5-1.25x) a cui si aggiunge 0.5
dato che ipotizziamo che il malus X sia l'8% la formula diventa

n = CC2*0.15 + 0.50

quindi è facilissimo... il vostro centrocampo a 2 dava 6.90 accettabile molto alto ("24" hatstats)?

bene se allora il vostro centrocampo a 3 era superiore di
n = 24*0.15 + 0.50 = 4.1 sottolivelli, cioè era ALMENO 7.925

allora vi converrà ancora schierare il terzo CC e sarete ancora in guadagno, altrimenti nisba...


PS. dai un occhio all' INDICE del blog, ci sono parecchi articoli che ti potrebbero interessare.




Andreac (team ID 1730726 in Hattrick)

Creative Commons License
This opera by Andreac is licensed under a Creative Commons Attribuzione-Non commerciale 3.0 Unported License. Cioé questo lavoro può essere liberamente copiato, distribuito o modificato senza espressa autorizzazione dell'autore, a patto che l'autore sia chiaramente indicato e la pubblicazione non sia a fini commerciali.