Uè chi si vede!
Sono passati quasi 3 anni e mezzo dall'ultimo post.
Mi sono un filino allontanato da Hattrick.
Ieri però - chissà perché - ho ripreso un po' in mano la barca da lungo alla deriva e mi son messo a dare un occhio a quanto di nuovo c'è in giro. In un angolino del mio disco c'era da molti mesi il file "Hattrick_ Player Contributions - Season 59" che gli HT - bontà loro - in un attimo fugace di trasparenza hanno postato.
L'ho aperto e ho cominciato a fare un po' di considerazioni. Metto subito però le mani avanti: è da una vita che non guardo queste cose, dire "arrugginito" è dire poco, per cui mi scuso da subito per qualsiasi eventuale errore/imprecisione/omissione/etc. Ci mancherebbe. Umiltè, come diceva l'Arrighe.
Errori sono possibili, tra l'altro, perché parto da dove avevo lasciato, mentre vedo che altri (trigrotto, ora "crangruro_mortro") avevano meritoriamente preso in mano quanto da me fatto al tempo. Vedo anche che c'è stata mesi fa una lunga discussione (oltre 2000 post) nel forum. Scusate, ma non riesco a leggere tutto ora, ho dato una scorsa e non trovo coincidenza coi valori che risultano dai miei conti, magari mi saprete indicare dove sbaglio.
Ora, prendendo in mano il file degli HT e riordinandolo per renderlo leggibile e integrandolo con i reparti a 3 giocatori (da loro non considerati) ottengo la tabella seguente che per molti di voi è familiare. In ogni caso: nelle righe vedete i giocatori con i diversi posizionamenti e nelle colonne i settori (Centrocampo - Difesa Centrale - ecc...) con le specifiche skill che concorrono ad apportare valore per quel settore colorate in modo diverso in modo che sia immediatamente visibile cosa apporta dove (Parate in viola, Difesa in marrone, Passaggi in verde, Cross in blu e Attacco in rosso). Cliccate per ingrandire.
E fin qui non ho fatto quasi nulla.
Ora, infatti, la cosa da fare è inserire i MALUS di sovraffollamento.
Dovrebbe essere ancora valido quanto visto al tempo per cui:
* DIFENSORI, se ne metto due, entrambi perdono il 4%, se ne metto tre, perdono tutti il 9%
* CENTROCAMPISTI, se ne metto due, entrambi perdono l'8%, se ne metto tre, perdono tutti il 18%
* ATTACCANTI, se ne metto due, entrambi perdono il 6%, se ne metto tre, perdono tutti il 13,5%
Immediata deriva la nuova tabella coi valori modificati.
I valori modificati sono in GIALLO. Sempre cliccare per ingrandire.
Tra l'altro qui, en passant, abbiamo il chiaro rapporto, dichiarato dagli HT, tra parate e difesa per i portieri, che vale 2.486 per difesa centrale e 2.440 per le difese laterali. Siamo quindi a "poco meno di 2 volte e mezzo", un valore a cui ci eravamo cmq ben avvicinati anni orsono.
Ma COSA SONO QUESTE PERCENTUALI?
Beh, faccio un bel po' di passi indietro e mi scuso con chi sa già a menadito queste cose, ma credo sia importante chiarire per bene per evitare eventuali equivoci. Allora, il motore di gioco deve calcolare il totale del valore di ognuno dei 7 settori del campo, a partire dalle skill dei singoli giocatori (e considerando anche forma, resistenza ecc, ma qui per semplicità limito l'analisi alle skill).
Per far questo il motore MOLTIPLICA ogni skill di ogni giocatore per un certo moltiplicatore, che chiamiamo "Apporto o CONTRIBUTO", per ognuno dei settori del campo. Chiaramente molti di questi contributi saranno pari a 0 (sono le celle vuote nella tabella sopra) per cui, per es. la skill attacco nei portieri non apporta nulla in nessun settore naturalmente.
Il motore di gioco ha ovviamente contributi diversificati in modo logico, per cui settore per settore sono diversi i contributi delle singole skill.
In particolare possiamo notare che ci sono dei valori massimi di contrubuto per ogni settore:
* per CENTROCAMPO: il moltiplicatore ("contributo") di Regia del Centrocampista centrale da solo.
* per DIFESA CENTRALE: il moltiplicatore ("contributo") di Difesa del Difensore centrale da solo.
* per DIFESA LATERALE: il moltiplicatore ("contributo") di Difesa per il Terzino difensivo.
* per ATTACCO CENTRALE è il moltiplicatore ("contributo") di Attacco dell'Attaccante centrale da solo.
* per ATTACCO LATERALE è il moltiplicatore ("contributo") di Cross dell'Ala offensiva.
Cosa hanno fatto gli HT? Hanno preso questi contributi massimi per ogni dato settore e li hanno presi come riferimento, li hanno posti pari
al 100% (100% di QUEL settore) e a quello riferiscono tutti gli altri valori all'INTERNO di QUEL SETTORE.
Infatti, lo specificano anche nel file (loro chiamano gli apporti/contributi con il termine di "real value contribution"):
"INFO: The table
of Player Contributions uses relative percentages. This means that we
take the highest real value contribution for each sector and use it as
the 100%. Then we divide every single real value with the highest per
sector to find the relative percentage.
Here is an example:
Lets say that Winger Offensive contribute the most in the wing with the
real value of 5..Then this is the 100%…If Winger Defensive contribute
2.5 as the real value, then its percentage will be 2.5/5 = 50%."
Nell'es. si dice
come se "5" sia il valore per cui viene moltiplicata la skill cross per
l'ala offensiva e "2.5" il moltiplicatore cross per l'ala difensiva
(sempre nel calcolo del settore "attacco laterale") allora l'ala
difensiva avrà il 50%. Quindi "5" e "2.5" sono i contributi ("real value contributions") e 100% e 50% le rispettive percentuali.
ATTENZIONE, sottolineo ancora, queste percentuali valgono solo all'interno di quel settore specifico, perché fanno riferimento al contributo massimo di quel settore!
Infatti se, ipoteticamente, "5" fosse il contributo massimo per l'attacco laterale (associato alla skill cross dell'ala offensiva), questo non significa che sarà nuovamente "5" il contributo massimo per l'attacco centrale (associato alla skill attacco dell'attaccante centrale). Magari per l'attacco centrale quel valore sarà "3.6" e "3.6" sarà quindi il riferimento per il settore "attacco centrale", sarà il 100% per l'attacco centrale.
Lo sottolineo: le percentuali di ogni settore sono riferite al contributo massimo in quel settore e quindi si possono fare confronti tra percentuali SOLO all'interno di un singolo settore, non tra un settore e l'altro, perché ogni settore fa riferimento al suo contributo massimo.
E quali sono questi CONTRIBUTI MASSIMI?
Infatti... già che c'erano gli HT potevano dirci quali sono in concreto i contributi massimi settore per settore, invece no, e quindi non ci resta che rifarci alle stime precedenti, per cui:
per CENTROCAMPO: il contributo di Regia del Centrocampista centrale da solo è 0.139
per DIFESA CENTRALE: il contributo di Difesa del Difensore centrale da solo è 0.186
per DIFESA LATERALE: il contributo di Difesa per il Terzino difensivo è 0.284
per ATTACCO CENTRALE il contributo di Attacco dell'Attaccante centrale da solo è 0.178
per ATTACCO LATERALE il contributo di Cross dell'Ala offensiva è 0.222 (grazie al suggerimento di trigrotto)
tra l'altro questi valori sono arrotondati, nel file excel in fondo li trovate con i decimali successivi.
Tenuto presente quanto esposto sopra risulta con un semplice passaggio la TABELLA dei CONTRIBUTI, calcolata a partire dalle percentuali fornite dagli HT:
questi contributi sono direttamente moltiplicabili per le skill dei vostri giocatori al fine di calcolare il totale settore per settore.
E allora facciamolo no?
Anzi, spetta... l'avevo già fatto, 5 anni e passa fa, agganciando una tabella come quella qui sopra (in un abbozzo di "HO fatto in casa") al mio "predictorino" (con un diminutivo falsamente evocativo) per il quale rimando all'articolo "HATTRICK - Un Predictor per la Stima dei Risultati delle Partite".
Nel primo foglio del file "HO fatto in casa e TOOL Predictorino 1.6", quello che si chiama "La pasta fatta in casa" in cui nelle colonne da A a Q è riportata la tabella degli apportu e a voi basta inserire nelle colonne da S a X i valori delle skill dei vostri giocatori e oplà nella riga 79 avete i totali. Tutto questo è senza naturalmente la forma, la resistenza, il TS ecc... è un abbozzo appunto, ma giusto per orientarsi e per fare ipotesi "se invece di X fosse Y cosa succederebbe?". Ecco.
Essendo agganciato al predictorino nelle righe successive basta inserire i valori attesi dell'avversario (Team 2) e vi calcola al volo le % della partita. Tutto questo naturalmente lascia il tempo che trova, in quanto non ho mai avuto tempo/voglia di completare 'sto predictorino (vi lascio tutto il file aperto per vedere nei fogli successivi il folle livello di dettaglio a cui ero arrivato in preda ai demoni della pazzia) per cui mancano (si vede nel foglio "INPUT") le possibilità di AIM e AOW, per cui fa solo normal. E tale continuerà a fare eh, mica mi ci metto di nuovo... :)
Se volete una stima delle partite a partire dai valori di campo previsti infatti vi rimando a tool come il "Preniubbo v4" di trigrotto che trovate QUI, queste le ISTRUZIONI (oppure fare riferimento al post 16470127.1 nel forum AP).
Due i file che allego:
* FILE excel delle percentuali e dei CONTRIBUTI
* FILE excel "HO fatto in casa e predictorino"
Andreac
mercoledì 24 febbraio 2016
domenica 16 settembre 2012
HATTRICK - Random. Un bilancio della stagione 49
Random, random, random.
Non si parla d'altro.
Gli stipendi? I cali di skill?
Qualcosina, ma dopo poco - ci potete scommettere - si tornerà a parlare del buon vecchio random.
E allora, io che ho la fissa di voler sempre misurare tutto, mi son detto di vedere quant'è sto benedetto/maledetto random.
Per misurarlo occorre un predictor di qualche tipo (e io uno in effetti l'avrei abbozzato 2 anni fa, passa il tempo, http://acandio.blogspot.it/2010/09/hattrick-un-predictor-per-la-stima-dei.html, ma poi per una cosa o per l'altra non l'ho mai completato, in futuro, chissà...), dicevo, occorre un predictor di qualche tipo che dica quale sia il risultato ATTESO di una partita e dall'altra parte l'evento accaduto in Hattrick, con l'esito EFFETTIVO della partita.
1 - Il valore ATTESO
Faccio un esempio: mi aspetto che in una partita il team A abbia il 70% di probabilità di vittoria, il team B il 10% e il restante 20% sia per il pareggio.
Allora A in media otterrà il 70% delle volte 3 punti, e il 20% delle volte 1 punto. Se giochiamo 10 volte la stessa partita ci saranno 7 vittorie per A e 2 pareggi, quindi A otterrà 7*3+2*1=23 punti in 10 partite, quindi in media 2.3 punti a partita. Ovviamente non ci sarà nessuna partita in cui A ottiene "2.3" punti, questa è solo una media dei punti che si aspetta da quella partita ed è detta "VALORE ATTESO".
Il modo per calcolarlo è fare 70%*3+20%*1 = 2.1+0.2 = 2.3
Dalla stessa partita B ha un valore atteso di punti pari a 10%*3+20%*1 = 0.3+0.2 = 0.5 punti.
2. Il risultato EFFETTIVO
Ora la partita viene giocata
Mettiamo che vinca A.
A questo punto sottraiamo i punti ottenuti e quelli attesi:
per B è 0-0.5=-0.5 quindi un valore negativo, B è stato "leggermente sfortunato", torna a casa con 0 punti, ma poteva andargli meglio.
Mettiamo che vinca B, quella che si chiama di solito "randomata".
Come prima sottraiamo i punti ottenuti e quelli attesi:
per A è 0-2.3=-2.3 davvero una bella sfortuna, doveva vincere al 70% ed invece è incappato nel 10% per lui sfortunato. Raro, ma non impossibile: capita 1 volta su 10. Il bilancio è di -2.3 e quindi possiamo dire che è stato "molto sfortunato"
per B è 3-0.5=2.5 vale l'inverso e ottiene un saldo di punti effettivi rispetto a quelli attesi pari a +2.5, possiamo dire che è stato "molto fortunato"
Partita dopo partita possiamo sommare le differenze tra punti effettivi e punti attesi e fare i conti su chi sia complessivamente più sfortunato o più fortunato.
ATTENZIONE: non si sta qui discutendo la capacità dei manager, ma solo chi ottiene più o meno rispetto a quanto atteso. Uno può essere un fenomeno a poker, ma se non gli arrivano mai le carte non può fare miracoli. Analogamente qui. Avere una stagione fortunata non è una colpa, magari prima se ne erano avute 3 di fila sfortunate, non vuol dire nulla in sé, l'intento di questo studio è vedere quanta "casualità" vi sia in Hattrick non mettere in discorso il merito di questo o quel manager.
Ora occorre quindi vedere partita per partita, stimare i VALORI ATTESI, confrontarli con quelli EFFETTIVI e sommarli giornata per giornata, potremmo fare tutto a mano o ricorrere per semplicitrà al sito http://htev.org che fornisce tutto già bell'e pronto.
Ed è anche facile da leggere, vediamo un esempio, la serie A italiana, che trovate a http://htev.org/league/724/
Allora vedete da sinistra le colonne di:
Mi sono quindi scaricato quello che mi pareva un campione decente su cui fare qualche conto e quindi
Dai dati ho poi eliminato BOT e semiBOT che alteravano naturalmente i valori.
Vedo intanto alcuni valori (che mi serviranno dopo):
Le quote sembrano:
30 punti per la vittoria della serie
20 punti per salvarsi dai playout
15 punti per salvarsi dalla retrocessione diretta
Con le dovute eccezioni naturalmente: "Rastafarian Lions" in IV.1 si trova 5° e ai playout pur avendo fatto ben 26 punti, viceversa "Yoknapatawpha County" in IV.59 è 4° salvo dai playout con soli 19 punti. Gli stessi di "SAGACIA", che in III.12 è 7° retrocede direttamente con 19 punti.
Ma torniamo al nostro caro HTEV, che ci dà i punti effettivi, quelli attesi e già pronte le differenze (la colonna "d") e considero le differenze.
Su 680 squadre le 10 più fortunate sono state:
con in testa "Lucchirpool" in IV.29 che mette in cascina ben 14 punti più di quelli attesi che, con un team che sembrava destinato alla retrocessione diretta sfiora la promozione a 1 solo punto dalla prima.
Ancora una volta, giusto per mettere le mani avanti, qui non si vuole mettere in discussione le capacità di nessuno, avere una stagione fortunata non è una colpa, è una cosa che capita e io, anzi HTEV, la sta registrando, tutto qui, nessuno si offenda.
Altre 7 squadre riescono a ottenere più di 10 punti oltre quelli attesi.
In fondo troviamo le più sfortunate:
quindi 6 squadre che ottengono 10 punti meno degli attesi e una, la più sfortunata di tutte, "Stagni e Maniaci" in IV.29 (la stessa di "Lucchirpool") che ne ottiene ben 12 in meno di quanto atteso e la vede retrocedere direttamente, mentre sulla carta si doveva giocare la promozione in III.
Ora vediamo serie per serie e considero le differenze in valore assoluto, per vedere l'entità dello scostamento rispetto all'atteso, per la serie A ad esempio (in grigio le ultime due che sono semibottizzate)
vedo che le differenze in valore assoluto hanno una media di 4.77
Non è affatto poco, se considero che in media ogni 3 punti c'è una posizione di classifica, come visto sopra e 4.77 punti possono essere 1 posizione e mezza in più o in meno di quella che spetterebbe al team.
Ma la media delle differenze deve essere parametrata alla Media dei punti realizzata nella serie (bot e semibot esclusi), che nella serie A è di 25.3 punti. I 4.77 punti di differenza rispetto alla media di punti sono quasi il 20%.
Vediamo anche le altre serie.
Per le serie dalla I alla III:
Vedo valori assai variabili:
Nelle IV serie
la media degli scostamenti è di 3.43, simile a quella delle prime tre serie (anche qui circa il 15% dei punti ottenuti). Ci sono però numerosi picchi, tra cui la IV.29 in cui c'è ben il 7.71 di scostamento medio! una serie in cui davvero è successo di tutto.
Per avere però meglio il polso della situazione guardo alla seconda parte delle tabelle disponibili su HTEV, quella che mi dà le % di essere in una certa posizione di classifica.
Date quelle è facile calcolare la POSIZIONE ATTESA di classifica.
Tornando sempre alla serie A ecco che
vedo come leggermente favorita per la vittoria era Pollame (posizione attesa 2.2) appena davanti ad excoto (2.23), seguiti da A.S.Kursaal (2.6 di posizione attesa, quindi tra la 2a e la 3a posizione), poi A.C Ponte Nuovo (a 4.22) vicino a A.S.Gozzadini (4.34) a distanza Tergeste (5.58, era atteso vicino alla sesta, ma è riuscito a finire 4°), infine Team Polpetta che era atteso in 7a (6.92) ed è finito in quella e idem per Thai.
Quello che conta è la differenza tra la "POSIZIONE ATTESA" e quella "EFFETTIVA".
Sfortunati Kursaal e Gozzadini che sono 2 posizioni ciascuno indietro a quanto ci si aspettava da un pto di vista di equità statistica.
Una buona misura del random è questo valore che dà la differenza in posizioni di classifica.
Non posso qui postare tutte le serie, alla fine allego il file che potete scaricare e consultare.
In valore assoluto questo SCOSTAMENTO di posizione rispetto al valore atteso ha una media di 0.998, cioè in media ogni squadra si trova spostata di 1 posizione rispetto a quella che le spetterebbe (sempre secondo le stime di HTEV). E 1 posizione non è poco.
Vediamo anche qui, su 680 i casi estremi: 14 team ottengono oltre 3 posizioni più in alto di quelle eque
molti di questi ottengono una vittoria mentre la posizione attesa da HTEV erano i Playout (per Misterya, Lokomotiv Kebab, Palline Luvi ecc... anche qui attenzione, Misterya adotta spesso il contropiede, tattica che HTEV sottostima!)
Dall'altra parte le 15 più sfortunate
10 delle quali ottengono oltre 3 posizioni in meno di quelle attese (tra queste la "Arezzo Galasocaray" di Marrundo in IV.53, serie a dir poco bizzarra nei risultati, andate a vedere nel file). e 2 addirittura 4 posizioni in meno di quella "giusta", con la palma di più sfortunata qui a "Cyber Warriors", ultima in una serie che poteva anche vincere... o in cui aveva quasi il 50% di essere nelle prime tre (15+17+16=48).
E' un caso che fosse la IV.17 ?
Ciao
GM-Andreac
qui il file https://sites.google.com/site/andreactools/home/Bilancio%20Random%20Stagione%2049.xlsx?attredirects=0&d=1
Non si parla d'altro.
Gli stipendi? I cali di skill?
Qualcosina, ma dopo poco - ci potete scommettere - si tornerà a parlare del buon vecchio random.
E allora, io che ho la fissa di voler sempre misurare tutto, mi son detto di vedere quant'è sto benedetto/maledetto random.
Per misurarlo occorre un predictor di qualche tipo (e io uno in effetti l'avrei abbozzato 2 anni fa, passa il tempo, http://acandio.blogspot.it/2010/09/hattrick-un-predictor-per-la-stima-dei.html, ma poi per una cosa o per l'altra non l'ho mai completato, in futuro, chissà...), dicevo, occorre un predictor di qualche tipo che dica quale sia il risultato ATTESO di una partita e dall'altra parte l'evento accaduto in Hattrick, con l'esito EFFETTIVO della partita.
1 - Il valore ATTESO
Faccio un esempio: mi aspetto che in una partita il team A abbia il 70% di probabilità di vittoria, il team B il 10% e il restante 20% sia per il pareggio.
Allora A in media otterrà il 70% delle volte 3 punti, e il 20% delle volte 1 punto. Se giochiamo 10 volte la stessa partita ci saranno 7 vittorie per A e 2 pareggi, quindi A otterrà 7*3+2*1=23 punti in 10 partite, quindi in media 2.3 punti a partita. Ovviamente non ci sarà nessuna partita in cui A ottiene "2.3" punti, questa è solo una media dei punti che si aspetta da quella partita ed è detta "VALORE ATTESO".
Il modo per calcolarlo è fare 70%*3+20%*1 = 2.1+0.2 = 2.3
Dalla stessa partita B ha un valore atteso di punti pari a 10%*3+20%*1 = 0.3+0.2 = 0.5 punti.
2. Il risultato EFFETTIVO
Ora la partita viene giocata
Mettiamo che vinca A.
A questo punto sottraiamo i punti ottenuti e quelli attesi:
PUNTI EFFETTIVI - PUNTI ATTESI
per A è 3-2.3=0.7 il risultato finale è 0.7 punti in più degli attesi. Era il risultato più probabile, A era il favorito, ma la palla è rotonda
e tutto può sempre succedere, poteva anche pareggiare o perdere. Ad aver portato a casa i 3 punti è comunque stato "leggermente fortunato" dal punto di vista statistico.per B è 0-0.5=-0.5 quindi un valore negativo, B è stato "leggermente sfortunato", torna a casa con 0 punti, ma poteva andargli meglio.
Mettiamo che vinca B, quella che si chiama di solito "randomata".
Come prima sottraiamo i punti ottenuti e quelli attesi:
per A è 0-2.3=-2.3 davvero una bella sfortuna, doveva vincere al 70% ed invece è incappato nel 10% per lui sfortunato. Raro, ma non impossibile: capita 1 volta su 10. Il bilancio è di -2.3 e quindi possiamo dire che è stato "molto sfortunato"
per B è 3-0.5=2.5 vale l'inverso e ottiene un saldo di punti effettivi rispetto a quelli attesi pari a +2.5, possiamo dire che è stato "molto fortunato"
Partita dopo partita possiamo sommare le differenze tra punti effettivi e punti attesi e fare i conti su chi sia complessivamente più sfortunato o più fortunato.
ATTENZIONE: non si sta qui discutendo la capacità dei manager, ma solo chi ottiene più o meno rispetto a quanto atteso. Uno può essere un fenomeno a poker, ma se non gli arrivano mai le carte non può fare miracoli. Analogamente qui. Avere una stagione fortunata non è una colpa, magari prima se ne erano avute 3 di fila sfortunate, non vuol dire nulla in sé, l'intento di questo studio è vedere quanta "casualità" vi sia in Hattrick non mettere in discorso il merito di questo o quel manager.
Ora occorre quindi vedere partita per partita, stimare i VALORI ATTESI, confrontarli con quelli EFFETTIVI e sommarli giornata per giornata, potremmo fare tutto a mano o ricorrere per semplicitrà al sito http://htev.org che fornisce tutto già bell'e pronto.
Ed è anche facile da leggere, vediamo un esempio, la serie A italiana, che trovate a http://htev.org/league/724/
Allora vedete da sinistra le colonne di:
- Team
- p, cioè i punti EFFETTIVI raccolti in campionato
- ev, (contornati in verde) questi sono i punti ATTESI, sono i punti che il predictor del sito HTEV si sarebbe aspettato sommando i punti attesi partita dopo partita (come nell'esempio sopra i 2.3 punti per A nella prima partita + quelli nella seconda ecc...). Vediamo come il sito stimasse al 1° posto con le stesse possibilità sia excoto che Pollame (entrambi hanno una somma di 29.6 punti attesi), al 3° posto stimava A.S.Kursaal, che è invece incappata in una stagione sfortunata ed è finita al 5° posto. Al 4° posto stimava A.C.Ponte Nuovo, che invece è finita 3° e così via...
- d, non è altro che la DIFFERENZA, come sopra, tra punti EFFETTIVI e punti ATTESI. Se il saldo è positivo il team è stato fortunato, se negativo, sfortunato.Guardando i valori qui il più fotunato è stato proprio il vincitore dello Scudetto, con un saldo di ben +8.4 punti rispetto agli attesi. Il più sfortunato A.S.Kursaal con -7.3 punti, si attendeva un terzo posto ed invece si trova agli spareggi.
- le colonne cerchiate in rosso da 1 a 8 indicano la probabilità che il team sia in quella posizione di classifica, ad esempio guardiamo A.S.Kursaal, aveva il 25% di vincere lo scudetto (colonna "1), il 25% di essere al 2° posto, il 26% di essere al 3° posto. Complessivamente quindi un 76% di essere nei primi 3 posti, ma non è andata così, è finito al 5° posto, evento previsto solo nel 7% dei casi, ancora peggio gli poteva andare al 6° posto, solo nel 2% dei casi.
Mi sono quindi scaricato quello che mi pareva un campione decente su cui fare qualche conto e quindi
- serie A
- le 4 serie II
- le 16 serie III
- le 64 serie IV
Dai dati ho poi eliminato BOT e semiBOT che alteravano naturalmente i valori.
Vedo intanto alcuni valori (che mi serviranno dopo):
- tra le 85 vincitrici ad aver ottenuto più punti è stata "OnASkiff" in serie IV.16 con 42 punti. Ad aver ottenuto la vittoria col minimo di punti è stata "Real Zambuzanza" in serie IV.53 con soli 24 punti. In media le vincitrici hanno vinto con 32.7 punti
- le seconde classificate hanno ottenuto in media 28.2 punti
- le terze 25.5 punti
- le quarte 22.9 punti
- le quinte - ai playout - 19.7 punti
- le seste (esclusi 2 bot/semibot) - ai playout - 16.4 punti
- le settime (esclusi 18 bot/semibot), retrocesse, 13.3 punti
- le ottave le tralascio visto che ci sono troppi bot/semibot (ben 58)
Le quote sembrano:
30 punti per la vittoria della serie
20 punti per salvarsi dai playout
15 punti per salvarsi dalla retrocessione diretta
Con le dovute eccezioni naturalmente: "Rastafarian Lions" in IV.1 si trova 5° e ai playout pur avendo fatto ben 26 punti, viceversa "Yoknapatawpha County" in IV.59 è 4° salvo dai playout con soli 19 punti. Gli stessi di "SAGACIA", che in III.12 è 7° retrocede direttamente con 19 punti.
Ma torniamo al nostro caro HTEV, che ci dà i punti effettivi, quelli attesi e già pronte le differenze (la colonna "d") e considero le differenze.
Su 680 squadre le 10 più fortunate sono state:
con in testa "Lucchirpool" in IV.29 che mette in cascina ben 14 punti più di quelli attesi che, con un team che sembrava destinato alla retrocessione diretta sfiora la promozione a 1 solo punto dalla prima.
Ancora una volta, giusto per mettere le mani avanti, qui non si vuole mettere in discussione le capacità di nessuno, avere una stagione fortunata non è una colpa, è una cosa che capita e io, anzi HTEV, la sta registrando, tutto qui, nessuno si offenda.
Altre 7 squadre riescono a ottenere più di 10 punti oltre quelli attesi.
In fondo troviamo le più sfortunate:
quindi 6 squadre che ottengono 10 punti meno degli attesi e una, la più sfortunata di tutte, "Stagni e Maniaci" in IV.29 (la stessa di "Lucchirpool") che ne ottiene ben 12 in meno di quanto atteso e la vede retrocedere direttamente, mentre sulla carta si doveva giocare la promozione in III.
Ora vediamo serie per serie e considero le differenze in valore assoluto, per vedere l'entità dello scostamento rispetto all'atteso, per la serie A ad esempio (in grigio le ultime due che sono semibottizzate)
vedo che le differenze in valore assoluto hanno una media di 4.77
Non è affatto poco, se considero che in media ogni 3 punti c'è una posizione di classifica, come visto sopra e 4.77 punti possono essere 1 posizione e mezza in più o in meno di quella che spetterebbe al team.
Ma la media delle differenze deve essere parametrata alla Media dei punti realizzata nella serie (bot e semibot esclusi), che nella serie A è di 25.3 punti. I 4.77 punti di differenza rispetto alla media di punti sono quasi il 20%.
Vediamo anche le altre serie.
Per le serie dalla I alla III:
Vedo valori assai variabili:
- nelle II ad esempio, random basso (scostamenti medi di 1.6 punti, 1.76 punti) nelle II.3 e II.4, leggermente superiore nella II.2 e alto nella II.1 (ben 5.53 punti di scostamento medio, che sono praticamente 2 posizioni di classifica)
- nelle III diverse serie hanno random medi, con picchi nella III.4 (5.74), nella III.9 (5.06) e nella III.13 (la mia, con 4.91).
Nelle IV serie
la media degli scostamenti è di 3.43, simile a quella delle prime tre serie (anche qui circa il 15% dei punti ottenuti). Ci sono però numerosi picchi, tra cui la IV.29 in cui c'è ben il 7.71 di scostamento medio! una serie in cui davvero è successo di tutto.
Per avere però meglio il polso della situazione guardo alla seconda parte delle tabelle disponibili su HTEV, quella che mi dà le % di essere in una certa posizione di classifica.
Date quelle è facile calcolare la POSIZIONE ATTESA di classifica.
Tornando sempre alla serie A ecco che
vedo come leggermente favorita per la vittoria era Pollame (posizione attesa 2.2) appena davanti ad excoto (2.23), seguiti da A.S.Kursaal (2.6 di posizione attesa, quindi tra la 2a e la 3a posizione), poi A.C Ponte Nuovo (a 4.22) vicino a A.S.Gozzadini (4.34) a distanza Tergeste (5.58, era atteso vicino alla sesta, ma è riuscito a finire 4°), infine Team Polpetta che era atteso in 7a (6.92) ed è finito in quella e idem per Thai.
Quello che conta è la differenza tra la "POSIZIONE ATTESA" e quella "EFFETTIVA".
Sfortunati Kursaal e Gozzadini che sono 2 posizioni ciascuno indietro a quanto ci si aspettava da un pto di vista di equità statistica.
Una buona misura del random è questo valore che dà la differenza in posizioni di classifica.
Non posso qui postare tutte le serie, alla fine allego il file che potete scaricare e consultare.
In valore assoluto questo SCOSTAMENTO di posizione rispetto al valore atteso ha una media di 0.998, cioè in media ogni squadra si trova spostata di 1 posizione rispetto a quella che le spetterebbe (sempre secondo le stime di HTEV). E 1 posizione non è poco.
Vediamo anche qui, su 680 i casi estremi: 14 team ottengono oltre 3 posizioni più in alto di quelle eque
molti di questi ottengono una vittoria mentre la posizione attesa da HTEV erano i Playout (per Misterya, Lokomotiv Kebab, Palline Luvi ecc... anche qui attenzione, Misterya adotta spesso il contropiede, tattica che HTEV sottostima!)
Dall'altra parte le 15 più sfortunate
10 delle quali ottengono oltre 3 posizioni in meno di quelle attese (tra queste la "Arezzo Galasocaray" di Marrundo in IV.53, serie a dir poco bizzarra nei risultati, andate a vedere nel file). e 2 addirittura 4 posizioni in meno di quella "giusta", con la palma di più sfortunata qui a "Cyber Warriors", ultima in una serie che poteva anche vincere... o in cui aveva quasi il 50% di essere nelle prime tre (15+17+16=48).
E' un caso che fosse la IV.17 ?
Ciao
GM-Andreac
qui il file https://sites.google.com/site/andreactools/home/Bilancio%20Random%20Stagione%2049.xlsx?attredirects=0&d=1
venerdì 25 maggio 2012
HATTRICK - Panchina lunga a centrocampo?
Ciao a tutti.
Questo articolo è rivolto a coloro che non allenano regia e non sono bottizzati. A tutti gli allenatori di parate, difesa, cross, attacco e (parzialmente) passaggi che abitualmente piazzano 3 ragazzotti non allenati a centrocampo. Spesso in là con gli anni e possibilmente italiani, per ridurre i costi di stipendio.
Da qualche stagione nella scelta tra
a) avere in rosa 3 o 4 fortissimi da cui scegliere i 3 da schierare
b) avere in rosa 5 o 6 meno forti (costo singolo minore) da cui scegliere i 3 più in forma da schierare
ho scelto la b, con un monte stipendi per il centrocampo simile, ma garantendomi la possibilità di scelta, di lasciar fuori quelli meno in forma.
E' una scelta ottimale?
Ho provato a formalizzare la cosa, lasciando fuori dai conti alcune questioni (l'età e gli sconti stipendio, il discorso infortuni, la resistenza ecc...)
Allora, prendiamo gli INGREDIENTI:
1) una tabella degli stipendi per la skill REGIA, tabella che non è perfetta, lo so (soprattutto sui valori alti), ma è un riferimento:
per semplicità considero solo giocatori senza decimali (quindi il titanico sarà 15.00, l'extraterrestre 16.00 ecc...)
2) la formula della FORMA
effetto della forma = ((Forma-0.5)/7)^0.45
questa formula determina un moltipicatore (0.732 per forma debole, 0.820 per forma insufficiente ecc) che incide parecchio nella resa dei giocatori, tanto per avere un riferimento, questi sono i valori moltiplicati per le skill regia:
quindi, considerando la forma, un giocatore di livello 12 con forma buona (7) ha la stessa resa in campo di un 13 con forma accettabile (6) e un po' più di un 14 di forma insufficiente (5).
Il giocatore con skill 14 però costa quasi 19k alla settimana, mentre il 12 meno di 7k.
Da questa considerazione l'ipotesi di avere in rosa più giocatori di livello inferiore (la "panchina lunga") da cui attingere i più in forma settimanalmente, tenendo un monte stipendi contenuto.
Supponiamo ad es. di essere particolarmente sfortunati e di avere 3 giocatori di livello X tutti insufficienti di forma, mentre un mio cogironista ha 3 giocatori di livello X-1 anche quelli insufficienti (neanche lui è particolarmente fortunato), ma ne ha anche un altro, sempre X-1, ma quello è buono di forma.
Vediamo il confronto:
Io ho 3 titanici (liv.15), insufficienti di forma, resa complessiva 12.3*3=36.89 ad un costo settimanale di 83k, il mio cogironista invece ha 3 sovrannaturali (liv 14) insufficienti di forma e 1 buono di forma, schiera 2 insuff + 1 buono e ha una resa complessiva molto simile di 36.49, ma risparmia sugli stipendi in quanto nonostante abbia un giocatore in più spende solo 75k
Un altro cogironista ha fatto una scelta di panchina ancora più lunga, non 4, ma 5 giocatori fuoriclasse (liv 13), anche lui ne ha 3 insufficienti, ma 2 sono buoni di forma, per cui schiera 1 cc fuoriclasse insuff di forma e 2 buoni con una resa totale in campo di 35.80, ma spendendo solo 54.8k di stipendi
Questo è solo un esempio naturalmente, per trarre delle conclusioni occorre analizzare un campione più ampio, ho fatto quindi delle simulazioni generando dei valori di forma compresi tra 4 (debole) e 8 (eccellente) su sette giocatori ipotetici
ho ipotizzato quindi nove possibili configurazioni di rose, 9 team che scelgono di avere:
1) "3 pl 16": 3 giocatori extraterrestri (liv.16), che sono i valori obbligati dal player 1 al player 3, costo settimanale di 122k
2) "4 pl 16": 4 giocatori extraterrestri (liv.16), il manager sceglie i 3 più in forma tra player 1 e player 4, costo settimanale di 162k
3) "4 pl 15": 4 giocatori titanici (liv.15), il manager sceglie i 3 più in forma tra player 1 e player 4, costo settimanale di 110k
4) "5 pl 15": 5 giocatori titanici (liv.15), il manager sceglie i 3 più in forma tra player 1 e player 5, costo settimanale di 138k
5) "6 pl 15": 6 giocatori titanici (liv.15), il manager sceglie i 3 più in forma tra player 1 e player 6, costo settimanale di 166k
6) "4 pl 14": 6 giocatori sovrannaturali (liv.14), il manager sceglie i 3 più in forma tra player 1 e player 4, costo settimanale di 75k
7) "5 pl 14": 6 giocatori sovrannaturali (liv.14), il manager sceglie i 3 più in forma tra player 1 e player 5, costo settimanale di 94k
8) "6 pl 14": 6 giocatori sovrannaturali (liv.14), il manager sceglie i 3 più in forma tra player 1 e player 6, costo settimanale di 112k
9) "7 pl 14": 6 giocatori sovrannaturali (liv.14), il manager sceglie i 3 più in forma tra player 1 e player 7, costo settimanale di 131k
in questo caso il player 4 è inferiore di forma ai player da 1 a 3 (per semplicità suppongo che l'allenatore riesca a stimare i decimali della forma e a valutare quindi qs differenze) per cui il team con i 3 extraterrestri e quello con i 4 schiereranno sempre gli stessi (l'1 il 2 e il 3) con una resa di 45.32 (e costi diversi dato che il 4° fuori forma è un salasso inutile per il team che ne ha 4).
Il 5° giocatore è in forma discreta e quindi il team con 5 titanici schiererà i giocatori 1, 3 e 5 avendo una resa superiore a quello del team con soli 4 titanici. Il team con 6 titanici avrà una resa ancora superiore, ma spende in stipendi come quello con 4 extraterrestri.
I team con i sovrannaturali (liv.14) avranno via via rese crescenti in quanto riescono a scegliere su giocatori migliori di forma.
Questo un grafico che rappresenta la situazione:
più giocatori a disposizione, maggiore la scelta e quindi la resa in questo esempio.
Altri grafici, che qui non posto per non mettere troppa carne al fuoco, mostrano come chi ha pochi giocatori sia talvolta "condannato" a dover schierare quel che passa il convento, così in situazioni sfortunate chi ha 3 extra si trova ad aver rese inferiori ai team con 5 o 6 sovrannaturali, che spendono meno di stipendi, ma possono scegliere quelli in forma su una rosa più ampia.
Ma QUANTO spesso accadono queste situazioni sfortunate?
Ha senso allargare la rosa?
Vediamo.
Ho simulato 50 gruppi di 7 giocatori, su cui i 9 team dovevano fare le loro scelte e ho messo a confronto i risultati, vedendo le medie e le deviazioni standard
come ci si poteva aspettare al crescere del numero di giocatori in rosa diminuisce la varianza:
sui 16 2.29 è inferiore a 2.35
sui 15 si va da 2.14 a 1.85 e poi a 1.47
sui 14 da 2 a 1.73 a 1.38 e infine a 1.21
logico, chi ha meno giocatori deve prendere quel che viene, è più esposto ai capricci del caso (il tanto "amato" random), mentre chi ha più giocatori riesce ad ammortizzare escludendo via via i più bassi di forma.
E questo può essere un elemento interessante, magari ti trovi basso di forma nel momento clou del campionato e son dolori. Ma quello che conta sono anche (e soprattutto) le medie. E gli stipendi.
Per vedere bene il confronto tra le medie ho dovuto mettere le curve su grafici gaussiani.
Confronto allora per esempio il team 2 (quello con 4 extra) col team 5 (quello con 6 titanici) dato che hanno monti stipendio molto simili (attorno ai 165k):
vedo quindi che la squadra con maggior numero di giocatori ha una curva più stretta (meno random, meno varianza), ma la sua media è parecchio inferiore, tanto che l'area (colorata in rosa) in cui il team 2 ha vantaggio probabilistico rispetto al team 5 è di gran lunga superiore alla piccolissima area (colorata in azzurro a sinistra) in cui ha vantaggio il team 5.
A parità di monte stipendi, probabilisticamente è avvantaggiato come resa il team 2, quello con un numero inferiore di giocatori più forti.
Procedo a un altro confronto, tra il team 3 con 4 titanici e il team 8 con 6 sovrannaturali, entrambi spendono sui 111k di stipendio e anche qui vediamo come il team con minor numero di giocatori più forti sia avvantaggiato probabilisticamente rispetto all'altro (l'area azzurra è enormemente superiore a quella piccolissima a sinistra)
ora che avete capito comq funziona posso postare anche grafici più complessi come questo che rappresenta tutti i team con giocatori 15 e 16
vedete che all'aumentare del numero di giocatori in rosa si alza la media (le curve si spostano a destra) e si riduce la varianza (le curve si stringono), ma il confronto tra le curve diverse dice che:
* 6 giocatori 15 è inferiore a 4 gocatori 16, pur avendo costo leggermente superiore
* 5 giocatori 15 è lì lì con 3 giocatori 16, media leggermente inferiore, minor varianza, ma il costo è di 138k invece di 122 alla settimana
* 4 giocatori 15 è inferiore a tutte le altre, dà risparmio, ma anche minor resa rispetto a 3 giocatori 16
Infine, stesse conclusioni se considero i team con i giocatori di livello 14
le curve si stringono, ma le medie restano basse, anche spendendo molto (i 7 giocatori di liv 14 per 131k settimanali) si resta sotto a quanto riescono a garantire i 4 di livello 15 a soli 110k.
giovedì 29 marzo 2012
HATTRICK - Valore di Flesso ed Effetto fossa. Come distribuire i valori di attacco.
(TERZA VERSIONE)
Ciao a tutti.
Stavo scambiando qualche HTmail con un amico e mi son reso conto che quanto scritto (quasi 2 anni fa) nell'articolo http://acandio.blogspot.it/2010/05/hattrick-la-matematica-della-difesa.html non chiarisce alcuni punti importanti. Mano a mano che scrivevo questo articolo ho dovuto tornare su più volte, cambiarlo e modificarlo, spero sia piuttosto chiaro ora.
Il problema è un punto centrale del funzionamento del Motore di Gioco: ossia la conversione delle occasioni da gol in gol, che nasce dal confronto tra Attacco e Difesa.
Tralasciando la fiducia la formula che regola questo confronto dovrebbe essere all'incirca:
***************
Il problema è un punto centrale del funzionamento del Motore di Gioco: ossia la conversione delle occasioni da gol in gol, che nasce dal confronto tra Attacco e Difesa.
Tralasciando la fiducia la formula che regola questo confronto dovrebbe essere all'incirca:
Probabilità % di Gol = Att^3.6 / (Att^3.6+ Dif^3.6)
Primo passo è osservare che la formula NON è LINEARE.
Se fosse lineare, ogni aumento di tot del mio attacco mi darebbe un aumento costante di tot della probabilità di segnare.
Così non è.
Occorre quindi capire COME la funzione non sia lineare, per vedere come distribuire meglio i propri valori in attacco per massimizzare la propria probabilità di segnare.
Comincio da un esempio numerico, semplice semplice: il mio avversario fa 50 di difesa (fuoriclasse basso), io invece vario il mio attacco da 20 a 80
ad es.
- io faccio 50? allora 50^3.6/(50^3.6+50^3.6) = 0.5 , la probabilità di segnare è il 50%
- io faccio 45? la probabilità di segnare è il 40.63%
- io faccio 60? la probabilità di segnare è il 65.84%
vediamo una tabella che riassume questo:
Se fosse lineare, ogni aumento di tot del mio attacco mi darebbe un aumento costante di tot della probabilità di segnare.
Così non è.
Occorre quindi capire COME la funzione non sia lineare, per vedere come distribuire meglio i propri valori in attacco per massimizzare la propria probabilità di segnare.
Comincio da un esempio numerico, semplice semplice: il mio avversario fa 50 di difesa (fuoriclasse basso), io invece vario il mio attacco da 20 a 80
ad es.
- io faccio 50? allora 50^3.6/(50^3.6+50^3.6) = 0.5 , la probabilità di segnare è il 50%
- io faccio 45? la probabilità di segnare è il 40.63%
- io faccio 60? la probabilità di segnare è il 65.84%
vediamo una tabella che riassume questo:
dove vedete come varia la probabilità di segnare al variare del mio attacco, mentre la difesa del mio avversario è costante.
Ora, le percentuali, al variare del valore del mio attacco non sono lineari, si vede subito, se le metto in un grafico, che hanno una forma a "S":
Ora, le percentuali, al variare del valore del mio attacco non sono lineari, si vede subito, se le metto in un grafico, che hanno una forma a "S":
Proviamo a vedere i numeri in alto:
parto dal centro: faccio 50 in attacco, l'avversario 50, ho il 50%
passo da 50 a 52 (+2), vedo che la probabilità passa dal 50% al 53.52%, cioè +3.52%
passo da 52 a 54 (+2), vedo che la probabilità passa dal 53.52% al 56.88%, cioè +3.36%
vedete? ho guadagnato, ma meno di prima
idem se passo da 54 a 56 (sempre +2), vedo che la probabilità passa dal 56.88% al 60.06%, cioè +3.18%
quindi più aumento il mio valore di attacco, più alta sarà la mia probabilità % di segnare, ma l'aumento della probabilità sarà via via sempre più piccolo.
(Indico questo fenomeno come "Effetto Flesso", lo spiegherò nel paragrafo successivo)
Per dire, passare da 78 a 80 mi dà un aumento dal 83.21% al 84.45% cioè un misero +1.23%
Questo perché, tornando nella curva ad "S" sono nella parte alta, dove la curva abbassa la sua inclinazione, è meno ripida e quindi minore sarà il guadagno.
Fin qui penso sia tutto chiaro.
***************
Ora arriva però un punto importante: la curva NON ha il suo "centro" al valore pari a quello dell'avversario, che nell'esempio in esame è 50.
Si vedeva subito, anche ad occhio: da 50 a 80 del mio attacco è +30, e la percentuale passa dal 50% all'84.45% cioè +34.45%, ma dall'altra parte da 50 a 20 ho -30, ma la percentuale passa dal 50% al 3.56% cioè -46.44%.
50 quindi non è un punto di "simmetria" della funzione.
Torno all'esempio numerico e procedo andando indietro passo passo a vedere come variano i valori:
da 48 a 50 (+2): da 46.33% a 50%, cioè +3.67%, che è maggiore del passaggio da 50 a 52
da 46 a 48 (+2): da 42.55% a 46.33%, cioè +3.78%, che è maggiore del precedente
da 44 a 46 (+2): da 38.69% a 42.55%, cioè +3.86%, che è maggiore del precedente
da 42 a 44 (+2): da 34.80% a 38.69%, cioè +3.89%, che è maggiore del precedente
da 40 a 42 (+2): da 30.93% a 34.80%, cioè +3.87%, che è MINORE del precedente
Questa la tabella:
che in grafico è
Questo avrà grosse conseguenze sulle scelte di come distribuire i valori di attacco.
INCISO MATEMATICO
Quello che ho chiamato il valore di Flesso è infatti il punto di flesso della curva di probabilità (dove la curva passa da concava a convessa), che si ricava ponendo x il valore del mio attacco e k il valore della difesa dell'avversario e annullando la derivata seconda della funzione y=x^3.6/(x^3.6+k^3.6). Non è proprio una cosa immediata. Qui i conti se siete interessati: https://sites.google.com/site/andreactools/home/CALCOLO%20del%20PUNTO%20di%20FLESSO.docx?attredirects=0&d=1, sennò saltate direttamente alla conclusione che è:
Nell'esempio sopra, con k=50 è il valore preciso è 42.6718 e rotti, quello approssimato di 42.67.
Il valore quindi a cui cambia la curva è pari a circa l'85.34% del valore dell'avversario.
Ora, tornando a bomba, il punto chiave è che più mi allontano dal Valore di Flesso (verso l'alto o verso il basso) minore sarà la variazione della mia probabilità di segnare.
Chiamo questo fenomeno "EFFETTO FLESSO"
Cosa comporta questo nelle mie scelte di distribuzione dei valori in campo?
Comincio con degli esempi numerici e supponiamo di considerare i due attacchi laterali assieme.
Le difese del mio avversario sono fisse ed uguali, fa 50 a sinistra e 50 a destra.
CASO A. I miei attacchi sono in media maggiori delle difese avversarie
Parto con l'esempio della parità con l'avversario: ho a disposizione un totale di 100. Come lo distribuisco? 50 e 50? 55 e 45? 60 e 40?
Proviamo a vedere e poi sarà chiaro.
1. 50 e 50.
A sinistra 50 attacco contro 50 difesa, probabilità di segnare 50%
A destra 50 attacco contro 50 difesa, probabilità di segnare 50%
media complessiva è 50%
2. 55 e 45.
A sinistra 55 attacco contro 50 difesa, probabilità di segnare 58.49%
A destra 45 attacco contro 50 difesa, probabilità di segnare 40.63%
media complessiva è 49.56%
Il perché è chiaro: i 5 punti tra 50 e 55 sono più lontani dal Valore di Flesso (qui 42.92) dei 5 punti tra 45 e 50. Pertanto la variazione della probabilità di segnare dell'attacco di sinistra (da 50% a 58.49% è +8.49%) è inferiore alla variazione della probabilità di segnare a destra (da 50 a 40.63% è un -9.37%).
3. 60 e 40.
A sinistra 60 attacco contro 50 difesa, probabilità di segnare 65.84%
A destra 40 attacco contro 50 difesa, probabilità di segnare 30.93%
media complessiva è 48.39%
Come ci si poteva aspettare la media è calata ancora.
Avendo 100 a disposizione la scelta ottimale è quella di distribuirli in modo identico sui due lati di attacco. Questo il grafico della probabilità media di segnare al variare delle coppie di attacchi vedete indicate, a partire da destra 50 e 50 con probabilità 50%, il pallino blu subito a sinistra è 51 e 49, poi 52 e 48... poi 55 e 45 che ha un valore di 49.56% (lo vedete nella colonna a sinistra) e via via tutti gli altri:
Il valore quindi a cui cambia la curva è pari a circa l'85.34% del valore dell'avversario.
Ora, tornando a bomba, il punto chiave è che più mi allontano dal Valore di Flesso (verso l'alto o verso il basso) minore sarà la variazione della mia probabilità di segnare.
Chiamo questo fenomeno "EFFETTO FLESSO"
***************
Cosa comporta questo nelle mie scelte di distribuzione dei valori in campo?
Comincio con degli esempi numerici e supponiamo di considerare i due attacchi laterali assieme.
Le difese del mio avversario sono fisse ed uguali, fa 50 a sinistra e 50 a destra.
CASO A. I miei attacchi sono in media maggiori delle difese avversarie
Parto con l'esempio della parità con l'avversario: ho a disposizione un totale di 100. Come lo distribuisco? 50 e 50? 55 e 45? 60 e 40?
Proviamo a vedere e poi sarà chiaro.
1. 50 e 50.
A sinistra 50 attacco contro 50 difesa, probabilità di segnare 50%
A destra 50 attacco contro 50 difesa, probabilità di segnare 50%
media complessiva è 50%
2. 55 e 45.
A sinistra 55 attacco contro 50 difesa, probabilità di segnare 58.49%
A destra 45 attacco contro 50 difesa, probabilità di segnare 40.63%
media complessiva è 49.56%
Il perché è chiaro: i 5 punti tra 50 e 55 sono più lontani dal Valore di Flesso (qui 42.92) dei 5 punti tra 45 e 50. Pertanto la variazione della probabilità di segnare dell'attacco di sinistra (da 50% a 58.49% è +8.49%) è inferiore alla variazione della probabilità di segnare a destra (da 50 a 40.63% è un -9.37%).
3. 60 e 40.
A sinistra 60 attacco contro 50 difesa, probabilità di segnare 65.84%
A destra 40 attacco contro 50 difesa, probabilità di segnare 30.93%
media complessiva è 48.39%
Come ci si poteva aspettare la media è calata ancora.
Avendo 100 a disposizione la scelta ottimale è quella di distribuirli in modo identico sui due lati di attacco. Questo il grafico della probabilità media di segnare al variare delle coppie di attacchi vedete indicate, a partire da destra 50 e 50 con probabilità 50%, il pallino blu subito a sinistra è 51 e 49, poi 52 e 48... poi 55 e 45 che ha un valore di 49.56% (lo vedete nella colonna a sinistra) e via via tutti gli altri:
E se ho 110? Idem. La scelta ottimale sarà 55 e 55, dato che se metto 56 e 54 il guadagno da 55 a 56 è inferiore alla perdita da 55 a 54 (dato che 54 è più vicino al Valore di Flesso di 56).
Quindi se la somma dei valori dei miei attacchi laterali è maggiore o uguale alla somma di quelli del mio avversario la scelta ottimale è quella di distribuire gli attacchi in modo uguale, attacchi SIMMETRICI.
CASO B. I miei attacchi sono in media minori delle difese avversarie, ma superiori al valore di flesso.
E se la somma dei miei attacchi è inferiore alla somma delle difese dell'avversario?
Qui entra in gioco un altro effetto.
Rappresento di nuovo la curva messa all'inizio, quella della mia probabilità di segnare, all'inizio avevo mostrato da 20 a 80 il mio valore di attacco a fronte di 50 quello della difesa avversaria.
Ora amplio e mostro da 0 a 100.
Quindi se la somma dei valori dei miei attacchi laterali è maggiore o uguale alla somma di quelli del mio avversario la scelta ottimale è quella di distribuire gli attacchi in modo uguale, attacchi SIMMETRICI.
CASO B. I miei attacchi sono in media minori delle difese avversarie, ma superiori al valore di flesso.
E se la somma dei miei attacchi è inferiore alla somma delle difese dell'avversario?
Qui entra in gioco un altro effetto.
Rappresento di nuovo la curva messa all'inizio, quella della mia probabilità di segnare, all'inizio avevo mostrato da 20 a 80 il mio valore di attacco a fronte di 50 quello della difesa avversaria.
Ora amplio e mostro da 0 a 100.
La curva si schiaccia ed è sotto l'1% già al valore 13. I valori inferiori hanno variazioni irrisorie quindi. E' una zona che ho chiamato "la fossa".
Pur essendo più vicina al valore di flesso, la forma della curva fa sì che le variazioni in alto, quelle sopra l'80, diventino maggiori di quelle nella fossa.
Pertanto se la somma dei miei attacchi laterali è pari a 94 (che fa 47 in media, quasi a metà tra il valore dell'avversario, 50, e quello del flesso, 42.9), la curva della probabilità di segnare al variare delle coppie di attacchi è la seguente.
Nel grafico sono indicate le coppie possibili, la prima coppia a sinistra è 1 e 93 e quindi è il massimo dell'asimmetria possibile tra gli attacchi, poi il pallino blu successivo indica 2 e 92, poi 3 e 93 e così via:
Fino alla coppia "6 e 88" comunque siamo ancora sotto, come valore percentuale di probabilità di segnare alla coppia di destra, simmetrica, "47 e 47".
Danfisico osserva "C'è da dire, però, che fare con un attacco valori da "fossa" mentre l'altro è molto forte è davvero difficile... la presenza stessa degli attaccanti che contribuiscono ad un lato, renderà l'altro attacco più forte dei valori (estremi) da fossa secondo me."
Verissimo, realizzare la coppia "4 e 90" che dà una media di probabilità migliore di "47 e 47" non è sempre possibile, in ogni caso questi discorsi teorici vanno valutati con i dati concreti.
Quanto sopra vale con un valore medio dei miei attacchi di 47, ma più scendo verso il valore di flesso (poco meno di 43), più è forte l'effetto Fossa rispetto all'effetto Flesso e la scelta di concentrare tutto su un lato diventa (statisticamente) vincente.
Caso C. La media dei valori dei miei attacchi è inferiore al valore di flesso
Sparisce il valore di flesso come lo conoscevamo: proviamo per un attimo a ignorare l'effetto fossa. E' meglio, supponendo un totale di 80, avere 40 o 40 oppure 39 e 41?
40 e 40?
Sbagliato.
Ricordiamo che all'allontanarsi dal punto di flesso le variazioni diventano sempre più piccole e quindi quell'1 che rinuncio passando da 41 a 40 non è compensato dalla salita da 39 a 40.
Effetto flesso ed effetto fossa qui spingono entrambi nella stessa direzione, suggerendo l'asimmetria tra i reparti.

SINTESI FINALE, a parità di difese laterali dell'avversario, quindi, abbiamo visto che la decisione se schierare attacchi uguali (simmetrici) oppure diversi (asimmetrici) dipende dal valore totale dei miei attacchi:
1) se il valore medio del mio attacco è superiore a quello della difesa avversaria (nell'esempio qui sopra superiore a 50), allora l'effetto flesso è più forte dell'effetto fossa e mi conviene schierare attacchi simmetrici
2) se il valore medio del mio attacco è compreso tra il valore di flesso (42,9 nell'esempio) e quello del mio avversario (50), allora effetto flesso ed effetto fossa sono in contrasto e occorrerà analizzare coi dati concreti se conviene l'attacco simmetrico o quello asimmetrico (oltretutto non è detto che i valori estremi di "fossa" siano concretamente realizzabili)
3) se il valore medio del mio attacco è inferiore al valore di flesso, allora l'effetto flesso si inverte (importante!) e indica che è meglio un attacco asimmetrico.
Questa una tabella per ricordare:

Ecco una immagine gif riassuntiva, al variare della somma dei miei attacchi da 120 (media 60) a 60 (media 30), con le difese avversarie sempre simmetriche e pari a 50. Vedete come a valori alti dei miei attacchi le curve siano più alte a destra (attacchi simmetrici), mentre mano a mano che si abbassano siano più interessanti gli attacchi a sinistra (asimmetrici):

Se avrò tempo farò qualche prova anche con difese avversarie asimmetriche, ora non riesco, sorry :)
40 e 40?
Sbagliato.
Ricordiamo che all'allontanarsi dal punto di flesso le variazioni diventano sempre più piccole e quindi quell'1 che rinuncio passando da 41 a 40 non è compensato dalla salita da 39 a 40.
Effetto flesso ed effetto fossa qui spingono entrambi nella stessa direzione, suggerendo l'asimmetria tra i reparti.
SINTESI FINALE, a parità di difese laterali dell'avversario, quindi, abbiamo visto che la decisione se schierare attacchi uguali (simmetrici) oppure diversi (asimmetrici) dipende dal valore totale dei miei attacchi:
1) se il valore medio del mio attacco è superiore a quello della difesa avversaria (nell'esempio qui sopra superiore a 50), allora l'effetto flesso è più forte dell'effetto fossa e mi conviene schierare attacchi simmetrici
2) se il valore medio del mio attacco è compreso tra il valore di flesso (42,9 nell'esempio) e quello del mio avversario (50), allora effetto flesso ed effetto fossa sono in contrasto e occorrerà analizzare coi dati concreti se conviene l'attacco simmetrico o quello asimmetrico (oltretutto non è detto che i valori estremi di "fossa" siano concretamente realizzabili)
3) se il valore medio del mio attacco è inferiore al valore di flesso, allora l'effetto flesso si inverte (importante!) e indica che è meglio un attacco asimmetrico.
Questa una tabella per ricordare:
Ecco una immagine gif riassuntiva, al variare della somma dei miei attacchi da 120 (media 60) a 60 (media 30), con le difese avversarie sempre simmetriche e pari a 50. Vedete come a valori alti dei miei attacchi le curve siano più alte a destra (attacchi simmetrici), mentre mano a mano che si abbassano siano più interessanti gli attacchi a sinistra (asimmetrici):
Se avrò tempo farò qualche prova anche con difese avversarie asimmetriche, ora non riesco, sorry :)
Andreac
domenica 16 ottobre 2011
HATTRICK - Bonus Fedeltà
Dall'editoriale del 3 ottobre 2011 le cose sono piuttosto chiare, vengono introdotti 2 distinti bonus:
1) BONUS 1 - Bonus fedeltà dei giocatori
"Un giocatore sarà più attaccato e fedele alla vostra squadra per ogni giorno consecutivo che trascorrerà con essa.
La fedeltà si guadagna più velocemente all’inizio, quindi sempre più lentamente col passare del tempo. La massima fedeltà è raggiunta dopo 3 stagioni, ma sarà a metà livello dopo 12 settimane.
Bonus massimo: +1 livello di abilità in ogni abilità (Resistenza esclusa), dopo 3 stagioni (336 giorni)"
Allora il bonus per la presenza dei giocatori nel team, chiamiamolo BONUS1
* è basato sui giorni
* è a metà livello (+0.5 di abilità in ogni skill) dopo 12*7=84 giorni e al massimo (+1 di abilità in ogni skill) dopo 336 giorni
come suggeritomi da GM-Wiles la formula sottostante è molto semplice:
che infatti vale 0,5 se i giorni sono 84 (84/336=1/4 la cui radice è 1/2)
e 1 se i giorni sono 336
Altri punti interessanti sono 21 (3 settimane) per cui la formula vale 0,25 e 189 (27 settimane, poco più di 1 stagione e mezza) per cui vale 0,75
NOTA: Per giorni maggiori di 336 vale sempre 1, quindi la formula completa e corretta sarebbe min(1;RADQ(GIORNI/336)).
Il grafico è questo
Il bonus sarà indicato nel sito con un livello da 1 a 20 (da "disastroso" a "divino"), ma il valore esatto dovrebbe essere ricavabile dalla formula esposta sopra.
2) BONUS 2 - Bonus Squadra Madre "I giocatori che giocano per la loro squadra madre, come i giocatori delle vostre giovanili, e che l'hanno fatto per tutta la loro carriera danno qualcosa in più sul campo"

I bonus sono cumulabili, quindi
Naturalmente un giocatore non uscito dalle giovanili (e rimasto continuamente nel team) non gode del Bonus 2.
IMPATTO DEI BONUS
Ora faccio un passo in più e cerco di capire come vari il beneficio ottenuto ruolo per ruolo.
Supponiamo per semplicità di avere un giocatore che sia uscito dalle giovanili e che sia ora in prima squadra (bonus totale= bonus 1+bonus 2=1,5) , che sia straordinario (10) in primaria e accettabile (6) nelle secondarie rilevanti per il ruolo.
Avremo quindi:
Mi appoggio al lavoro fatto a febbraio
http://acandio.blogspot.com/2011/02/hattrick-i-contributi-dei-giocatori-in.html
per valutare l'impatto dei bonus.
Comincio dal reparto difensivo

vedete i contributi reparto per reparto di tutte le possibili disposizioni.
Il primo gruppo di colonne è relativo ai "senza bonus" e vale per i giocatori che non godono né del bonus 1 né del bonus 2 (acquistati quindi da altri team da 0 giorni) e riporta i valori di apporto del giocatore ai livelli delle valutazioni nelle diverse zone del campo.
Il secondo gruppo di colenne sono sempre gli apporti nelle varie zone, per chi gode del bonus massimo di 1,5 punti per skill (cresciuti nel team).
Il terzo gruppo di colonne sono le differenze tra gli apporti (quindi i guadagni per chi gode del bonus), con l'ultima colonna che indica il totale dato dalla somma delle differenze.
* I Portieri sono quelli che godono più di tutti del bonus, il guadagno, suddiviso in più zone del campo, rispetto a un portiere senza bonus è di 1.16 livelli.
Questo guadagno è quasi equamente distribuito tra i tre reparti di difesa: apportano quasi 0,4 (0.398 nella tabella) livelli in più alle valutazioni delle difese laterali del team e poco meno (0.366) alla valutazione della difesa centrale.
* I Difensori Centrali hanno un guadagno medio totale di poco più di mezzo livello.
Questo guadagno, se considero il caso di due difensori centrali, va in minima parte al centrocampo. Quelli normal godono di un bonus di poco più di un quarto di livello per la difesa centrale (+0.268) e di poco meno per la difesa laterale più vicina (+0.222). Il guadagno aumenta per i difensori centrali verso l'ala ("tw") che apportano 0.326 in più alla difesa laterale verso cui spingono (naturalmente godono meno nella difesa centrale, dove il guadagno si abbassa a 0.200)
* I Terzini guadagnano più dei difensori centrali, e non è una sorpresa, dato che il bonus incide maggiormente nelle secondarie del giocatore e i terzini sono più legati alle secondarie. Il guadagno medio totale è di 0.70 livelli.
Il guadagno dato dal bonus per il terzino normal è soprattutto in difesa laterale (quasi mezzo livello in più, con 0.402), di circa la metà (0.193 livelli) in attacco laterale, ancora minore in difesa centrale (0.125 livelli)
Se il terzino è difensivo rispetto al normal il guadagno è di poco superiore in difesa laterale (0.426), ma molto inferiore in attacco laterale.
Continuo analizzando il reparto di centrocampo.

* I Centrocampisti che godono del bonus apportano complessivamente circa mezzo livello in più alle valutazioni del team. Questo mezzo livello di apporto maggiore va per poco più di un terzo all'aumento nella valutazione di centrocampo, per un terzo all'aumento nei contributi alla difesa e per poco meno di un terzo all'aumento nei contributi all'attacco.
Vediamo i numeri per un caso tipoco: centrocampista normal messo a sinistra, in centrocampo a 3 centrocampisti. Il giocatore che gode del bonus apporta 0.171 livelli in più alla valutazione di centrocampo, 0.086 in più alla difesa centrale e 0.069 in più alla difesa laterale sinistra (totale di 0.155 in più alle due difese); in attacco apporta 0.070 in più all'attacco centrale e 0.069 in più all'attacco laterale sinistro (totale di 0.140 in più ai due attacchi di competenza).
* Le Ali, essendo multiskillose, godono parecchio del bonus, per loro il guadagno medio totale è di 0.71 livelli.
Questo guadagno va in misura via via maggiore all'attacco centrale (0.03 livelli), alla difesa centrale (0.05 livelli), al centrocampo (0.10 livelli), alla difesa laterale di competenza (0.15 livelli in media), ma soprattutto all'attacco laterale (quasi +0.40 livelli in media).
Le differenze si spostano naturalmente a seconda dell'ordine individuale assegnato all'ala, per cui l'ala offensiva guadagnerà ancora di più in attacco laterale ecc...
Ecco il reparto offensivo

* Gli Attaccanti, guadagnano anch'essi mediamente 0.70 livelli di apporto complessivo grazie al bonus.
Se considero un attaccante sinistro in un attacco a due punte vedo come per un normal il guadagno del bonus sia di 0.343 livelli all'attacco centrale e di 0.194 livelli a ogni attacco laterale, il totale del guadagno è di 0.73 livelli.
Un attaccante verso l'ala guadagna 0.356 di livello nell'attacco laterale, ma solo 0.218 nell'attacco centrale e 0.040 nell'altro laterale, per un guadagno complessivo di soli 0.61 livelli.
Per un trequartista (il difensivo tecnico) il guadagno è di 0.296 livelli all'attacco centrale e di 0.210 per ogni attacco laterale (oltre che a un 0.082 al centrocampo), per un totale complessivo di 0.80 di livelli.
Risulta quindi dai calcoli come (dati i valori di partenza) sia il trequartista il gicoatore di movimento a godere maggiormente di questi bonus. E non è una sorpresa, essendo per definizione il trequartista un giocatore multiskilloso e incidendo % i bonus in modo maggiore nelle secondarie (+1.5 sul valore 6 della secondaria è un +25%, mentre sul 10 della primaria è solo un +15%).
Andreac
1) BONUS 1 - Bonus fedeltà dei giocatori
"Un giocatore sarà più attaccato e fedele alla vostra squadra per ogni giorno consecutivo che trascorrerà con essa.
La fedeltà si guadagna più velocemente all’inizio, quindi sempre più lentamente col passare del tempo. La massima fedeltà è raggiunta dopo 3 stagioni, ma sarà a metà livello dopo 12 settimane.
Bonus massimo: +1 livello di abilità in ogni abilità (Resistenza esclusa), dopo 3 stagioni (336 giorni)"
Allora il bonus per la presenza dei giocatori nel team, chiamiamolo BONUS1
* è basato sui giorni
* è a metà livello (+0.5 di abilità in ogni skill) dopo 12*7=84 giorni e al massimo (+1 di abilità in ogni skill) dopo 336 giorni
come suggeritomi da GM-Wiles la formula sottostante è molto semplice:
e 1 se i giorni sono 336
Altri punti interessanti sono 21 (3 settimane) per cui la formula vale 0,25 e 189 (27 settimane, poco più di 1 stagione e mezza) per cui vale 0,75
NOTA: Per giorni maggiori di 336 vale sempre 1, quindi la formula completa e corretta sarebbe min(1;RADQ(GIORNI/336)).
Il grafico è questo
2) BONUS 2 - Bonus Squadra Madre "I giocatori che giocano per la loro squadra madre, come i giocatori delle vostre giovanili, e che l'hanno fatto per tutta la loro carriera danno qualcosa in più sul campo"
I bonus sono cumulabili, quindi
BONUS TOTALE = Bonus 1 + Bonus 2
Naturalmente un giocatore non uscito dalle giovanili (e rimasto continuamente nel team) non gode del Bonus 2.
IMPATTO DEI BONUS
Ora faccio un passo in più e cerco di capire come vari il beneficio ottenuto ruolo per ruolo.
Supponiamo per semplicità di avere un giocatore che sia uscito dalle giovanili e che sia ora in prima squadra (bonus totale= bonus 1+bonus 2=1,5) , che sia straordinario (10) in primaria e accettabile (6) nelle secondarie rilevanti per il ruolo.
Avremo quindi:
- Portiere 10/6 in parate/difesa
- Difensore Centrale e Terzino 10/6/6 in difesa/regia/cross
- Centrocampista centrale 10/6/6/6 in regia/passaggi/difesa/cross
- Ala 10/6/6/6 in cross/regia/passaggi/difesa
- Trequartista (attaccante difensivo tecnico) 10/6/6/6 in passaggi/regia/attacco/cross (questo profilo è il più discutibile, lo so, ma tengo così per coerenza con gli altri ruoli)
- Attaccante 10/6/6 in attacco/passaggi/cross
Mi appoggio al lavoro fatto a febbraio
http://acandio.blogspot.com/2011/02/hattrick-i-contributi-dei-giocatori-in.html
per valutare l'impatto dei bonus.
Comincio dal reparto difensivo
vedete i contributi reparto per reparto di tutte le possibili disposizioni.
Il primo gruppo di colonne è relativo ai "senza bonus" e vale per i giocatori che non godono né del bonus 1 né del bonus 2 (acquistati quindi da altri team da 0 giorni) e riporta i valori di apporto del giocatore ai livelli delle valutazioni nelle diverse zone del campo.
Il secondo gruppo di colenne sono sempre gli apporti nelle varie zone, per chi gode del bonus massimo di 1,5 punti per skill (cresciuti nel team).
Il terzo gruppo di colonne sono le differenze tra gli apporti (quindi i guadagni per chi gode del bonus), con l'ultima colonna che indica il totale dato dalla somma delle differenze.
* I Portieri sono quelli che godono più di tutti del bonus, il guadagno, suddiviso in più zone del campo, rispetto a un portiere senza bonus è di 1.16 livelli.
Questo guadagno è quasi equamente distribuito tra i tre reparti di difesa: apportano quasi 0,4 (0.398 nella tabella) livelli in più alle valutazioni delle difese laterali del team e poco meno (0.366) alla valutazione della difesa centrale.
* I Difensori Centrali hanno un guadagno medio totale di poco più di mezzo livello.
Questo guadagno, se considero il caso di due difensori centrali, va in minima parte al centrocampo. Quelli normal godono di un bonus di poco più di un quarto di livello per la difesa centrale (+0.268) e di poco meno per la difesa laterale più vicina (+0.222). Il guadagno aumenta per i difensori centrali verso l'ala ("tw") che apportano 0.326 in più alla difesa laterale verso cui spingono (naturalmente godono meno nella difesa centrale, dove il guadagno si abbassa a 0.200)
* I Terzini guadagnano più dei difensori centrali, e non è una sorpresa, dato che il bonus incide maggiormente nelle secondarie del giocatore e i terzini sono più legati alle secondarie. Il guadagno medio totale è di 0.70 livelli.
Il guadagno dato dal bonus per il terzino normal è soprattutto in difesa laterale (quasi mezzo livello in più, con 0.402), di circa la metà (0.193 livelli) in attacco laterale, ancora minore in difesa centrale (0.125 livelli)
Se il terzino è difensivo rispetto al normal il guadagno è di poco superiore in difesa laterale (0.426), ma molto inferiore in attacco laterale.
Continuo analizzando il reparto di centrocampo.
* I Centrocampisti che godono del bonus apportano complessivamente circa mezzo livello in più alle valutazioni del team. Questo mezzo livello di apporto maggiore va per poco più di un terzo all'aumento nella valutazione di centrocampo, per un terzo all'aumento nei contributi alla difesa e per poco meno di un terzo all'aumento nei contributi all'attacco.
Vediamo i numeri per un caso tipoco: centrocampista normal messo a sinistra, in centrocampo a 3 centrocampisti. Il giocatore che gode del bonus apporta 0.171 livelli in più alla valutazione di centrocampo, 0.086 in più alla difesa centrale e 0.069 in più alla difesa laterale sinistra (totale di 0.155 in più alle due difese); in attacco apporta 0.070 in più all'attacco centrale e 0.069 in più all'attacco laterale sinistro (totale di 0.140 in più ai due attacchi di competenza).
* Le Ali, essendo multiskillose, godono parecchio del bonus, per loro il guadagno medio totale è di 0.71 livelli.
Questo guadagno va in misura via via maggiore all'attacco centrale (0.03 livelli), alla difesa centrale (0.05 livelli), al centrocampo (0.10 livelli), alla difesa laterale di competenza (0.15 livelli in media), ma soprattutto all'attacco laterale (quasi +0.40 livelli in media).
Le differenze si spostano naturalmente a seconda dell'ordine individuale assegnato all'ala, per cui l'ala offensiva guadagnerà ancora di più in attacco laterale ecc...
Ecco il reparto offensivo
* Gli Attaccanti, guadagnano anch'essi mediamente 0.70 livelli di apporto complessivo grazie al bonus.
Se considero un attaccante sinistro in un attacco a due punte vedo come per un normal il guadagno del bonus sia di 0.343 livelli all'attacco centrale e di 0.194 livelli a ogni attacco laterale, il totale del guadagno è di 0.73 livelli.
Un attaccante verso l'ala guadagna 0.356 di livello nell'attacco laterale, ma solo 0.218 nell'attacco centrale e 0.040 nell'altro laterale, per un guadagno complessivo di soli 0.61 livelli.
Per un trequartista (il difensivo tecnico) il guadagno è di 0.296 livelli all'attacco centrale e di 0.210 per ogni attacco laterale (oltre che a un 0.082 al centrocampo), per un totale complessivo di 0.80 di livelli.
Risulta quindi dai calcoli come (dati i valori di partenza) sia il trequartista il gicoatore di movimento a godere maggiormente di questi bonus. E non è una sorpresa, essendo per definizione il trequartista un giocatore multiskilloso e incidendo % i bonus in modo maggiore nelle secondarie (+1.5 sul valore 6 della secondaria è un +25%, mentre sul 10 della primaria è solo un +15%).
Andreac
sabato 8 ottobre 2011
HATTRICK - Una misura (approssimata) del Random nella Serie
Tolgo un po' di polvere e posto qualcosa di nuovo.
Oddio, non proprio nuovissimo, dato che già n stagioni fa avevo fatto qualcosa di simile, ma l'avevo postato nei CS del mio team e quindi era rimasto con una visibilità assai limitata.
Quello che vado a proporre è una misura, seppur approssimata come indicato nel titolo, del "Random" all'interno di una Serie.
"Random" viene qui inteso come devianza dai risultati ottenuti rispetto a quelli attesi, mostrati a chi ha installato Foxtrick nella barra in basso, quella all'interno della "Analisi del Match di HTMS" (http://www.fantamondi.it/HTMS/index.php?lang=it).
Come specificato in quel sito "La barra invece mostra le percentuali di vittoria, pareggio, sconfitta. Questi valori provengono da un confronto statistico sull'analisi diretta dei dati e non da una predizione fatta tramite il modello matematico. Ovvero, ciò che è stato fatto è stato di raggruppare tutte le partite presenti nel DB in base ai rapporti tra centrocampo, attacco e difesa. Si è quindi passati a catalogare tutte le partite con gli stessi rapporti e a contare le percentuali di vittoria, sconfitta, pareggio (al netto degli SE) effettivamente ottenute. A questo scopo ovviamente un 8-0 conta una vittoria esattamente come un 2-1. Queste stesse percentuali sono quindi mostrate sulla barra e non sono quindi un lavoro di predizione, ma un resoconto di quello che è effettivamente successo."
E' un utile riferimento pertanto e non una misura assoluta, per questo parlo di misura "approssimata".
Prima di passare ai numeri introduco il concetto di "Valore Atteso" (o "Speranza Matematica"), che non è niente di complicato, provo a spiegarlo con un esempio concreto: giocare a testa o croce.
Gioco a testa o croce e punto 1 euro, vincendo 2 euro se azzecco o nulla se perdo.
La probabilità è del 50%.
Se gioco 1.000 volte mi aspetto di vincere nel 50% dei casi e di perdere nell'altro 50%.
Quindi 500 volte vinco 2 euro e 500 volte perdo, per un totale di 500*2€=1.000€
Quindi posso dire che a ogni giocata ho una vincita attesa di 1.000€/1.000giocate=1€ a giocata.
Chiaramente non ci sarà nessuna gocata in cui vincerò "1€", ma vincendo 2€ la metà delle volte e 0€ nell'altra metà, allora "in media" vincerò 1€ a ogni giocata.
Tale valore (il "valore atteso") è ottenuto moltiplicando gli esiti della giocata per le loro probabilità, cioè
2€ * 50% + 0€ * 50% = 2*0,5 + 0 = 1
In Hattrick chiaramente dovrò moltiplicare i punti dati dai risultati di 1, x, 2 per le loro probabilità che ricavo dalla barra citata sopra.
Per cui se in una partita ho il 60% di vittoria, il 25% di pareggio e il 15% di sconfitta significa che:
3punti*60% + 1punto*25% + 0 punti*15% = 1,8 + 0,25 + 0 = 2,05
e 2,05 sono i punti attesi da quella partita.
Come sopra, non ci sarà mai una partita in cui otterrò 2,05 punti, ma se la gioco 1.000 volte, allora in media 2,05 sarà il valore di punti ottenuto.
Ora non resta che da confrontare il valore vero ottenuto sul campo con quello atteso.
* se ho vinto allora ho ottenuto 3 punti, cioè sono stato leggermente fortunato e ho ottenuto 3-2,05=0.95 punti in più di quelli attesi
* se ho pareggiato allora ho ottenuto 1 punto, cioè sono stato leggermente sfortunato e ho ottenuto 1-2,05=-1,05 punti in meno di quelli attesi
* se ho perso allora ho ottenuto 0 punti, cioè sono stato molto sfortunato e ho ottenuto 0-2.05=-2,05 punti in meno di quelli attesi
Quindi il valore ottenuto con
PUNTI OTTENUTI SUL CAMPO - VALORE ATTESO
è una misura (seppur approssimata come detto) della fortuna (se positivo) o della sfortuna (se negativo) che si è avuto nella singola partita.
Sommando partita per partita e squadra per squadra si ottiene una misura di quali siano stati approssimativamente i team più fortunati e quelli più sfortunati.
ATTENZIONE: questo calcolo vede solo la differenza tra "valori in campo" e "risultato ottenuto", vi prego di tener presente che i "valori in campo" sono solo DOPO che si sono realizzati tutti gli eventi della partita. Ad es. se a un team si sono rotti 4 giocatori e sono entrati 4 riserve di valore basso, il calcolo sopra terrà conto solo del confronto tra i valori (bassi) e il risultato, determinando fortuna/sfortuna in base a quello e non considerando la (grande) sfortuna di avere 4 infortunati nella stessa partita. Attenzione quindi: trattasi di una misura non solo approssimata, ma anche PARZIALE della fortuna/sfortuna avuta dai diversi team.
Posto per esempio il risultato di questa analisi nelle giocate questa stagione nella mia serie. In fondo allego il file excel che - se volete - può fare da guida per un'analogo studio nella vostra serie.
Allora comincio mostrando la 1a giornata.
Ho inserito le varie squadre e il risultato della partita. Il foglio excel provvede a calcolare i punti ottenuti dai team (verde per la vittoria, grigio per il pareggio, rosa per la sconfitta).
Dopodiché
inserisco nelle colonne dei risultati attesi i valori delle % che trovo nelle barre in basso, partita per partita. Il folgio provvede a calcolare i punti attesi per ogni team e a mostrare la differenza tra punti attesi e punti ottenuti.
Un valore negativo (in rosso sempre più marcato più il valore è negativo) significa che i punti ottenuti sono stati meno degli attesi, per cui la partita è stata sfortunata, un valore positivo (in verde) il contrario.
Così nella prima giornata ero stato io il più fortunato (Hellas VB), portando a casa 1.84 punti più di quanto atteso, fortunati anche SambaReggae e AC Bresaola che portano a casa i 3 punti in partite non del tutto scontate. Differenza nulla per Atletic Birimbao che vince fuori casa contro il team bottizzato (Fear of starvation), vittoria del tutto attesa.
Procedo così dunque giornata per giornata
Inserito il tutto il foglio excel provvede a raccogliere e riordinare tutti i dati nel foglio "FOGLIO APPOGGIO (AUTO)" a calcolare le somme dei valori in "Punti Ottenuti (AUTO)" e "Punti Attesi (AUTO)" e mi presenta i risultati nel foglio "RISULTATO"
Da cui risulta che il team più sfortunato è stato Atletic Birimbao, che ha lasciato per strada quasi 3 punti e mezzo. Sfortunati anche SambaReggae (-2.26) e Seportivo Scarpasciolta (-1.80), neutro il team bottizzato, mentre sempre più fortunati S.C.A. Porto San Giorgio (+0.83), AC Bresaola (+0.98), Hellas VB (+1.48) e affittinelsalento (+1.84 punti).
Fortuna e sfortuna quindi non si compensano in un campionato così corto (solo 14 partite).
Ma tutto questo come ha inciso nella classifica?
E' presto detto (attenzione, questo calcolo non viene fatto in automatico, occorre fare copincolla e poi riordinare i valori)
Primo S.C.A. Porto San Giorgio in tutte e due, fortuna/sfortuna non hanno inciso sul primo posto. Al secondo posto invece sarebbe stato secondo i punti attesi "Seportivo Scarpasciolta", che per una serie di partite sfortunate scivola al 4° posto reale, lasciando campo a Hellas VB e AC Bresaola. La squadra più fortunata di tutte (affittinelsalento) supera quella più sfortunata (Atletic Birimbao) cosa che genera uno scambio tra 5° e 6° posto.
Tirando le somme?
Ai playoff va il team che se lo merita, S.C.A. Porto San Giorgio, ai playout le due che sarebbero dovute andare (l'inversione tra 5° e 6° posto non cambia nulla) e anche le retrocesse direttamente sono quelle giuste.
Fortuna e sfortuna (pur in questa accezione APPROSSIMATIVA e PARZIALE, lo ricordo) alla fine della fiera non hanno inciso nelle cose che contano. Concludo col miglior in bocca al lupo per i miei cogironisti, che la dea bendata sia con voi nei decisivi spareggi!
Premete QUI per scaricare il file excel.
Andreac
giovedì 14 aprile 2011
HATTRICK - Ricerca DAC sui Calci Piazzati Indiretti
A oltre un anno dalla pubblicazione nel sito DAC, http://croack.altervista.org/it/ric-cp-ind, posto anche qui i risultati di una ricerca svolta in DAC e poi elaborata da me sui CP indiretti.
Grazie al lavoro di raccolta dei dati svolto in DAC coi contributi preziosi di Artic, gigietto, ggangus e molti altri abbiamo a disposizione circa 350 partite con cui provare a stimare come il motore di gioco calcoli la valutazione in CP indiretti, sia in attacco che in difesa.
1) ATTACCO
Dal manuale
L'efficienza della squadra che attacca è influenzata dalla
• media della skill calci piazzati e dalla
• media della skill attacco dei giocatori di movimento.
• In aggiunta, il livello di calci piazzati dello specialista darà un impatto aggiuntivo.
Quindi abbiamo un valore della Valutazione di attacco che dipende chiaramente da tre parametri ben precisi. Ho proceduto quindi alla raccolta dei dati postati, alla loro ripulitura e, grazie al contributo di charlie84 (anche lui armato di grande pazienza), ho ottenuto un file col quale provare a stimare i coefficienti β dei parametri mCP (media calci piazzati), mAtt (media in attacco) e tirCP (skill CP del tiratore).
VAtt=β0+β1*mAtt +β2* mCP+ β3*tirCP
Per quanto riguarda le valutazioni ho posto “X molto basso” in mezzo al suo segmento di valore e cioè a X,125, idem per “X basso” a X,375, “X alto” a X,625 e “X molto alto” a X,875
Poi ho proceduto modificando le medie delle skill, dato che non conosciamo i decimali è prudente anche qui porsi in mezzo e sostituire le medie senza decimali mAtt con mAtt+0.5
A questo punto possiamo ipotizzare che la funzione che stiamo stimando abbia o no intercetta, se non ce l’ha sarà nella forma
VAtt=β1*mAtt +β2* mCP+ β3*tirCP
E la regressione mi dà questi valori
β1=0.4796 con sqm=0.0142
β2=0.2930 con sqm=0.0177
β3=0.0919 con sqm=0.006
Rquadro pari a 0.9938 (troppa grazia)
Cioè il valore di attacco in CP indiretti è pari al
48% della media della skill attacco + 29.3% della media della skill calci piazzati + il 9% della skill CP del tiratore
Se ipotizziamo che vi sia una intercetta e la funzione sia
VAtt=β0+β1*mAtt +β2* mCP+ β3*tirCP
Allora otteniamo
β0=-0,1442 con sqm=0,1425
β1=0,5013 con sqm=0,0257
β2=0,2998 con sqm=0,0189
β3=0,0908 con sqm=0.006
Rquadro pari a 0.8744
Qui mi puzza quello sqm altissimo dell’intercetta che è praticamente pari ad essa in valore assoluto… data la scarsezza dei dati è comunque notevole la vicinanza dei β a dei valori che sembrano chiari e che mi sembrano del tutto ragionevoli per quanto finora visto e cioè mi sento di ipotizzare β0=0, β1=0.50, β2=0.30 e β3=0.09.
La ricetta per la parte di attacco quindi prevede, secondo me,
il 50% della media di attacco +
il 30% della media di CP +
il 9% della skill CP del tiratore
VAtt = 0.50*mAtt + 0.30*mCP+0.09*tirCP
provo a tradurlo in valori più concreti:
per fare 1 livello in più in attacco in CP indiretti (cioé per passare da insuff molto basso a accettabile molto basso) servono
- +2 nella media in attacco dei giocatori di movimento oppure
- +3,33 nella media in cp dei giocatori di movimento oppure
- +11 nella skill cp del tiratore
questo un grafico a dispersione delle stime rispetto ai valori reali:

2) DIFESA
Nel manuale c'è una nuova formulazione
Per il calcolo della difesa vengono usati (in ordine d'importanza) • la media dell'abilità Difesa di tutti i giocatori (ad eccezione del portiere), • la loro media in calci piazzati, e le • skill parate e • calci piazzati del portiere che deve parare.
Quindi il valore della Valutazione di difesa in CP indiretti dipende da 4 parametri ben precisi.
Ho proceduto anche qui alla raccolta dei dati postati, alla loro ripulitura e, grazie al contributo di JoJo8, ho ottenuto un file col quale provare a stimare i coefficienti β dei parametri mCP (media calci piazzati dei giocatori di movimento), mDIF (media in difesa dei giocatori di movimento), gkCP (skill CP del portiere), gkPAR (skill parate del portiere)
Tralasciando l’ipotesi di intercetta perché abbiamo visto che non è presente nel caso di attacco e non avrebbe senso vi fosse in quello di difesa, la forma funzionale dovrebbe persumibilmente essere
VDif=β1*mDIF +β2* mCP+ β3*gkCP+ β4*gkPAR
Per quanto riguarda le valutazioni anche qui ho posto “X molto basso” in mezzo al suo segmento di valore (tra 0 e 0,25) e cioè a X,125, idem per “X basso” a X,375, “X alto” a X,625 e “X molto alto” a X,875
Poi ho proceduto modificando le medie delle skill, dato che non conosciamo i decimali è prudente anche qui porsi in mezzo e sostituire le medie senza decimali mDIF e mCP con (mDIF+0.5) e (mCP+0.5), idem per CP e Par del portiere.
Siamo quindi, dopo tanto lavoro, pronti per la regressione che dà questi valori:
β1=0.3809 con sqm=0.0109 per la mDIF
β2=0.3122 con sqm=0.0154 per la mCP
β3=0.0981 con sqm=0.006 per la gkCP
β4=0.0814 con sqm=0.006 per la gkPAR
Rquadro pari a 0.9952
Cioè il valore di difesa in CP indiretti è pari al
38.1% +/- 1% della media della skill difesa +
31.2% +/- 1.5% della media della skill calci piazzati +
9.8% +/- 0.6% della skill CP del portiere +
8.1% +/- 0.6% della skill parate del portiere
Questo un grafico degli scostamenti delle stime rispetto ai valori reali (indicate con delta1)
dato che le osservazioni sono ordinate in ordine decrescente (dalla valutazione di difesa più alta a quella più bassa) noto che la stima tende un po’ a sottostimare i valori elevati e sovrastimare quelli bassi
Allarghiamo il quadro e consideriamo quanto avevamo trovato per attacco: 50% mAtt + 30% mCP + 9% tirCP
Qui la funzione parrebbe essere
38% mDIF + 31% mCP + 10% gkCP + 8% gkPAR.
Vediamo che i valori di mCP sono molto simili tra attacco e difesa... se dovessimo ipotizzare una simmetria potremmo immaginare un 30% per la mCP che sarebbe anche dentro al range dello sqm (31.2 +/- 1.5%), e 40% non è troppo lontano dal limite massimo di mDIF+sqm che sarebbe 39.2%. Ci vorrebbero probabilmente ulteriori dati per confermare queste impressioni, per ora prudenzialmente teniamo il 38%, anche se non ci sono grandi conseguenze se tenete a mente una sua versione approssimata
VDif = 40% mDIF + 30% mCP + 10% gkCP + 8% gkPAR
Osservo infine che 10% e 8% sono prossimi al 9% della skill CP del tiratore nella valutazione di attacco.
Anche qui un esempio concreto: per avere 1 livello in più di difesa in CP indiretti serve uno dei seguenti elementi
- 2.6 punti in più nella media in difesa oppure
- 3.2 punti in più nella media in CP oppure
- 10 livelli in più nella skill CP del portiere oppure
- 12.5 livelli in più nella skill parate del portiere
****
RIASSUNTO FINALE
VAtt in CP indiretti = 50% mAtt + 30% mCP + 9% tirCP
VDif in CP indiretti = 40% mDif + 30% mCP + 10% gkCP + 8% gkPAR
Iscriviti a:
Post (Atom)



