domenica 16 settembre 2012

HATTRICK - Random. Un bilancio della stagione 49

Random, random, random.
Non si parla d'altro.
Gli stipendi? I cali di skill?
Qualcosina, ma dopo poco - ci potete scommettere - si tornerà a parlare del buon vecchio random.

E allora, io che ho la fissa di voler sempre misurare tutto, mi son detto di vedere quant'è sto benedetto/maledetto random.
Per misurarlo occorre un predictor di qualche tipo (e io uno in effetti l'avrei abbozzato 2 anni fa, passa il tempo, http://acandio.blogspot.it/2010/09/hattrick-un-predictor-per-la-stima-dei.html, ma poi per una cosa o per l'altra non l'ho mai completato, in futuro, chissà...), dicevo, occorre un predictor di qualche tipo che dica quale sia il risultato ATTESO di una partita e dall'altra parte l'evento accaduto in Hattrick, con l'esito EFFETTIVO della partita.

1 - Il valore ATTESO
Faccio un esempio: mi aspetto che in una partita il team A abbia il 70% di probabilità di vittoria, il team B il 10% e il restante 20% sia per il pareggio.
Allora A in media otterrà il 70% delle volte 3 punti, e il 20% delle volte 1 punto. Se giochiamo 10 volte la stessa partita ci saranno 7 vittorie per A e 2 pareggi, quindi A otterrà 7*3+2*1=23 punti in 10 partite, quindi in media 2.3 punti a partita. Ovviamente non ci sarà nessuna partita in cui A ottiene "2.3" punti, questa è solo una media dei punti che si aspetta da quella partita ed è detta "VALORE ATTESO".
Il modo per calcolarlo è fare 70%*3+20%*1 = 2.1+0.2 = 2.3
Dalla stessa partita B ha un valore atteso di punti pari a 10%*3+20%*1 = 0.3+0.2 = 0.5 punti.

2. Il risultato EFFETTIVO
Ora la partita viene giocata

Mettiamo che vinca A.

A questo punto sottraiamo i punti ottenuti e quelli attesi:
PUNTI EFFETTIVI - PUNTI ATTESI
per A è 3-2.3=0.7 il risultato finale è 0.7 punti in più degli attesi. Era il risultato più probabile, A era il favorito, ma la palla è rotonda e tutto può sempre succedere, poteva anche pareggiare o perdere. Ad aver portato a casa i 3 punti è comunque stato "leggermente fortunato" dal punto di vista statistico.
per B è 0-0.5=-0.5 quindi un valore negativo, B è stato "leggermente sfortunato", torna a casa con 0 punti, ma poteva andargli meglio.

Mettiamo che vinca B, quella che si chiama di solito "randomata".
Come prima sottraiamo i punti ottenuti e quelli attesi:
per A è 0-2.3=-2.3 davvero una bella sfortuna, doveva vincere al 70% ed invece è incappato nel 10% per lui sfortunato. Raro, ma non impossibile: capita 1 volta su 10. Il bilancio è di -2.3 e quindi possiamo dire che è stato "molto sfortunato"
per B è 3-0.5=2.5 vale l'inverso e ottiene un saldo di punti effettivi rispetto a quelli attesi pari a +2.5, possiamo dire che è stato "molto fortunato"

Partita dopo partita possiamo sommare le differenze tra punti effettivi e punti attesi e fare i conti su chi sia complessivamente più sfortunato o più fortunato.
ATTENZIONE: non si sta qui discutendo la capacità dei manager, ma solo chi ottiene più o meno rispetto a quanto atteso. Uno può essere un fenomeno a poker, ma se non gli arrivano mai le carte non può fare miracoli. Analogamente qui. Avere una stagione fortunata non è una colpa, magari prima se ne erano avute 3 di fila sfortunate, non vuol dire nulla in sé, l'intento di questo studio è vedere quanta "casualità" vi sia in Hattrick non mettere in discorso il merito di questo o quel manager.


Ora occorre quindi vedere partita per partita, stimare i VALORI ATTESI, confrontarli con quelli EFFETTIVI e sommarli giornata per giornata, potremmo fare tutto a mano o ricorrere per semplicitrà al sito http://htev.org che fornisce tutto già bell'e pronto.
Ed è anche facile da leggere, vediamo un esempio, la serie A italiana, che trovate a http://htev.org/league/724/


Allora vedete da sinistra le colonne di:
  • Team
  • p, cioè i punti EFFETTIVI raccolti in campionato
  • ev, (contornati in verde) questi sono i punti ATTESI, sono i punti che il predictor del sito HTEV si sarebbe aspettato sommando i punti attesi partita dopo partita (come nell'esempio sopra i 2.3 punti per A nella prima partita + quelli nella seconda ecc...). Vediamo come il sito stimasse al 1° posto con le stesse possibilità sia excoto che Pollame (entrambi hanno una somma di 29.6 punti attesi), al 3° posto stimava A.S.Kursaal, che è invece incappata in una stagione sfortunata ed è finita al 5° posto. Al 4° posto stimava A.C.Ponte Nuovo, che invece è finita 3° e così via...
  • d, non è altro che la DIFFERENZA, come sopra, tra punti EFFETTIVI e punti ATTESI. Se il saldo è positivo il team è stato fortunato, se negativo, sfortunato.Guardando i valori qui il più fotunato è stato proprio il vincitore dello Scudetto, con un saldo di ben +8.4 punti rispetto agli attesi. Il più sfortunato A.S.Kursaal con -7.3 punti, si attendeva un terzo posto ed invece si trova agli spareggi.
  • le colonne cerchiate in rosso da 1 a 8 indicano la probabilità che il team sia in quella posizione di classifica, ad esempio guardiamo A.S.Kursaal, aveva il 25% di vincere lo scudetto (colonna "1), il 25% di essere al 2° posto, il 26% di essere al 3° posto. Complessivamente quindi un 76% di essere nei primi 3 posti, ma non è andata così, è finito al 5° posto, evento previsto solo nel 7% dei casi, ancora peggio gli poteva andare al 6° posto, solo nel 2% dei casi.
Ora, HTEV non è la Bibbia, è chiaro. E tutte le sue valutazioni dipendono dal suo metro di valutazione, che viene esposto qui: http://htev.org/elo_system/ un metodo che, vedendo il grafico, pare buono, ma non infallibile (e per stessa ammissione di chi l'ha elaborato tende a sottostimare la forza dei contropiede). In mancanza di meglio teniamo queste stime, non saranno il massimo possibile, ma almeno sono qualcosa e ci consentono di farci un'idea.

Mi sono quindi scaricato quello che mi pareva un campione decente su cui fare qualche conto e quindi
  • serie A
  • le 4 serie II
  • le 16 serie III
  • le 64 serie IV
un totale di 85 serie, con 680 squadre, mi pare sufficiente.
Dai dati ho poi eliminato BOT e semiBOT che alteravano naturalmente i valori.

Vedo intanto alcuni valori (che mi serviranno dopo):
  • tra le 85 vincitrici ad aver ottenuto più punti è stata "OnASkiff" in serie IV.16 con 42 punti. Ad aver ottenuto la vittoria col minimo di punti è stata "Real Zambuzanza" in serie IV.53 con soli 24 punti. In media le vincitrici hanno vinto con 32.7 punti
  • le seconde classificate hanno ottenuto in media 28.2 punti
  • le terze 25.5 punti
  • le quarte 22.9 punti
  • le quinte - ai playout - 19.7 punti
  • le seste (esclusi 2 bot/semibot) - ai playout - 16.4 punti
  • le settime (esclusi 18 bot/semibot), retrocesse, 13.3 punti
  • le ottave le tralascio visto che ci sono troppi bot/semibot (ben 58)
Ora, vediamo gli scarti tra le posizioni: tra le prime e seconde 32.7-28.2 vi è in media uno scarto di 4.5 punti, di 2.7 tra le seconde e le terze, di 2.6 tra terze e quarte, di 3.2 tra quarte e quinte, di 3.3 tra quinte e seste e 3.1 tra seste e settime. Insomma lo scarto medio tra una posizione e l'altra è di 3 punti, con l'unica eccezione delle vincitrici che staccano un po' di più le seconde.

Le quote sembrano:
30 punti per la vittoria della serie
20 punti per salvarsi dai playout
15 punti per salvarsi dalla retrocessione diretta

Con le dovute eccezioni naturalmente:  "Rastafarian Lions" in IV.1 si trova 5° e ai playout pur avendo fatto ben 26 punti, viceversa "Yoknapatawpha County" in IV.59 è 4° salvo dai playout con soli 19 punti. Gli stessi di "SAGACIA", che in III.12 è 7° retrocede direttamente con 19 punti.


Ma torniamo al nostro caro HTEV, che ci dà i punti effettivi, quelli attesi e già pronte le differenze (la colonna "d") e considero le differenze.
Su 680 squadre le 10 più fortunate sono state:


con in testa "Lucchirpool" in IV.29 che mette in cascina ben 14 punti più di quelli attesi che, con un team che sembrava destinato alla retrocessione diretta sfiora la promozione a 1 solo punto dalla prima.
Ancora una volta, giusto per mettere le mani avanti, qui non si vuole mettere in discussione le capacità di nessuno, avere una stagione fortunata non è una colpa, è una cosa che capita e io, anzi HTEV, la sta registrando, tutto qui, nessuno si offenda.
Altre 7 squadre riescono a ottenere più di 10 punti oltre quelli attesi.

In fondo troviamo le più sfortunate:


quindi 6 squadre che ottengono 10 punti meno degli attesi e una, la più sfortunata di tutte, "Stagni e Maniaci" in IV.29 (la stessa di "Lucchirpool") che ne ottiene ben 12 in meno di quanto atteso e la vede retrocedere direttamente, mentre sulla carta si doveva giocare la promozione in III.

Ora vediamo serie per serie e considero le differenze in valore assoluto, per vedere l'entità dello scostamento rispetto all'atteso, per la serie A ad esempio (in grigio le ultime due che sono semibottizzate)


vedo che le differenze in valore assoluto hanno una media di 4.77
Non è affatto poco, se considero che in media ogni 3 punti c'è una posizione di classifica, come visto sopra e 4.77 punti possono essere 1 posizione e mezza in più o in meno di quella che spetterebbe al team.
Ma la media delle differenze deve essere parametrata alla Media dei punti realizzata nella serie (bot e semibot esclusi), che nella serie A è di 25.3 punti. I 4.77 punti di differenza rispetto alla media di punti sono quasi il 20%.

Vediamo anche le altre serie.
Per le serie dalla I alla III:


 Vedo valori assai variabili:
  • nelle II ad esempio, random basso (scostamenti medi di 1.6 punti, 1.76 punti) nelle II.3 e II.4, leggermente superiore nella II.2 e alto nella II.1 (ben 5.53 punti di scostamento medio, che sono praticamente 2 posizioni di classifica)
  • nelle III diverse serie hanno random medi, con picchi nella III.4 (5.74), nella III.9 (5.06) e nella III.13 (la mia, con 4.91).
in media nelle serie dalla I alla III la media degli scostamenti è di 3.38 punti, il 15% in più o in meno di quelli che ci si aspetta.

Nelle IV serie


la media degli scostamenti è di 3.43, simile a quella delle prime tre serie (anche qui circa il 15% dei punti ottenuti). Ci sono però numerosi picchi, tra cui la IV.29 in cui c'è ben il 7.71 di scostamento medio! una serie in cui davvero è successo di tutto.


Per avere però meglio il polso della situazione guardo alla seconda parte delle tabelle disponibili su HTEV, quella che mi dà le % di essere in una certa posizione di classifica.
Date quelle è facile calcolare la POSIZIONE ATTESA di classifica.
Tornando sempre alla serie A ecco che


vedo come leggermente favorita per la vittoria era Pollame (posizione attesa 2.2) appena davanti ad excoto (2.23), seguiti da A.S.Kursaal (2.6 di posizione attesa, quindi tra la 2a e la 3a posizione), poi A.C Ponte Nuovo (a 4.22) vicino a A.S.Gozzadini (4.34) a distanza Tergeste (5.58, era atteso vicino alla sesta, ma è riuscito a finire 4°), infine Team Polpetta che era atteso in 7a (6.92) ed è finito in quella e idem per Thai.
Quello che conta è la differenza tra la "POSIZIONE ATTESA" e quella "EFFETTIVA".
Sfortunati Kursaal e Gozzadini che sono 2 posizioni ciascuno indietro a quanto ci si aspettava da un pto di vista di equità statistica.

Una buona misura del random è questo valore che dà la differenza in posizioni di classifica.
Non posso qui postare tutte le serie, alla fine allego il file che potete scaricare e consultare.
In valore assoluto questo SCOSTAMENTO di posizione rispetto al valore atteso ha una media di 0.998, cioè in media ogni squadra si trova spostata di 1 posizione rispetto a quella che le spetterebbe (sempre secondo le stime di HTEV). E 1 posizione non è poco.

Vediamo anche qui, su 680 i casi estremi: 14 team ottengono oltre 3 posizioni più in alto di quelle eque


molti di questi ottengono una vittoria mentre la posizione attesa da HTEV erano i Playout (per Misterya, Lokomotiv Kebab, Palline Luvi ecc... anche qui attenzione, Misterya adotta spesso il contropiede, tattica che HTEV sottostima!)
Dall'altra parte le 15 più sfortunate


10 delle quali ottengono oltre 3 posizioni in meno di quelle attese (tra queste la "Arezzo Galasocaray" di Marrundo in IV.53, serie a dir poco bizzarra nei risultati, andate a vedere nel file). e 2 addirittura 4 posizioni in meno di quella "giusta", con la palma di più sfortunata qui a "Cyber Warriors", ultima in una serie che poteva anche vincere... o in cui aveva quasi il 50% di essere nelle prime tre (15+17+16=48).
E' un caso che fosse la IV.17 ?

Ciao
GM-Andreac

qui il file https://sites.google.com/site/andreactools/home/Bilancio%20Random%20Stagione%2049.xlsx?attredirects=0&d=1

venerdì 25 maggio 2012

HATTRICK - Panchina lunga a centrocampo?


Ciao a tutti.
Questo articolo è rivolto a coloro che non allenano regia e non sono bottizzati. A tutti gli allenatori di parate, difesa, cross, attacco e (parzialmente) passaggi che abitualmente piazzano 3 ragazzotti non allenati a centrocampo. Spesso in là con gli anni e possibilmente italiani, per ridurre i costi di stipendio.

Da qualche stagione nella scelta tra
a) avere in rosa 3 o 4 fortissimi da cui scegliere i 3 da schierare
b) avere in rosa 5 o 6 meno forti (costo singolo minore) da cui scegliere i 3 più in forma da schierare

ho scelto la b, con un monte stipendi per il centrocampo simile, ma garantendomi la possibilità di scelta, di lasciar fuori quelli meno in forma.

E' una scelta ottimale?
Ho provato a formalizzare la cosa, lasciando fuori dai conti alcune questioni (l'età e gli sconti stipendio, il discorso infortuni, la resistenza ecc...)

Allora, prendiamo gli INGREDIENTI:

1) una tabella degli stipendi per la skill REGIA, tabella che non è perfetta, lo so (soprattutto sui valori alti), ma è un riferimento:

per semplicità considero solo giocatori senza decimali (quindi il titanico sarà 15.00, l'extraterrestre 16.00 ecc...)

2) la formula della FORMA

effetto della forma = ((Forma-0.5)/7)^0.45

questa formula determina un moltipicatore (0.732 per forma debole, 0.820 per forma insufficiente ecc) che incide parecchio nella resa dei giocatori, tanto per avere un riferimento, questi sono i valori moltiplicati per le skill regia:


quindi, considerando la forma, un giocatore di livello 12 con forma buona (7) ha la stessa resa in campo di un 13 con forma accettabile (6) e un po' più di un 14 di forma insufficiente (5).
Il giocatore con skill 14 però costa quasi 19k alla settimana, mentre il 12 meno di 7k.
Da questa considerazione l'ipotesi di avere in rosa più giocatori di livello inferiore (la "panchina lunga") da cui attingere i più in forma settimanalmente, tenendo un monte stipendi contenuto.

Supponiamo ad es. di essere particolarmente sfortunati e di avere 3 giocatori di livello X tutti insufficienti di forma, mentre un mio cogironista ha 3 giocatori di livello X-1 anche quelli insufficienti (neanche lui è particolarmente fortunato), ma ne ha anche un altro, sempre X-1, ma quello è buono di forma.
Vediamo il confronto:
Io ho 3 titanici (liv.15), insufficienti di forma, resa complessiva 12.3*3=36.89 ad un costo settimanale di 83k, il mio cogironista invece ha 3 sovrannaturali (liv 14) insufficienti di forma e 1 buono di forma, schiera 2 insuff + 1 buono e ha una resa complessiva molto simile di 36.49, ma risparmia sugli stipendi in quanto nonostante abbia un giocatore in più spende solo 75k
Un altro cogironista ha fatto una scelta di panchina ancora più lunga, non 4, ma 5 giocatori fuoriclasse (liv 13), anche lui ne ha 3 insufficienti, ma 2 sono buoni di forma, per cui schiera 1 cc fuoriclasse insuff di forma e 2 buoni con una resa totale in campo di 35.80, ma spendendo solo 54.8k di stipendi


Questo è solo un esempio naturalmente, per trarre delle conclusioni occorre analizzare un campione più ampio, ho fatto quindi delle simulazioni generando dei valori di forma compresi tra 4 (debole) e 8 (eccellente) su sette giocatori ipotetici


ho ipotizzato quindi nove possibili configurazioni di rose, 9 team che scelgono di avere:
1) "3 pl 16": 3 giocatori extraterrestri (liv.16), che sono i valori obbligati dal player 1 al player 3, costo settimanale di 122k
2) "4 pl 16": 4 giocatori extraterrestri (liv.16), il manager sceglie i 3 più in forma tra player 1 e player 4, costo settimanale di 162k
3) "4 pl 15": 4 giocatori titanici (liv.15), il manager sceglie i 3 più in forma tra player 1 e player 4, costo settimanale di 110k
4) "5 pl 15": 5 giocatori titanici (liv.15), il manager sceglie i 3 più in forma tra player 1 e player 5, costo settimanale di 138k
5) "6 pl 15": 6 giocatori titanici (liv.15), il manager sceglie i 3 più in forma tra player 1 e player 6, costo settimanale di 166k
6) "4 pl 14": 6 giocatori sovrannaturali (liv.14), il manager sceglie i 3 più in forma tra player 1 e player 4, costo settimanale di 75k
7) "5 pl 14": 6 giocatori sovrannaturali (liv.14), il manager sceglie i 3 più in forma tra player 1 e player 5, costo settimanale di 94k
8) "6 pl 14": 6 giocatori sovrannaturali (liv.14), il manager sceglie i 3 più in forma tra player 1 e player 6, costo settimanale di 112k
9) "7 pl 14": 6 giocatori sovrannaturali (liv.14), il manager sceglie i 3 più in forma tra player 1 e player 7, costo settimanale di 131k 


in questo caso il player 4 è inferiore di forma ai player da 1 a 3 (per semplicità suppongo che l'allenatore riesca a stimare i decimali della forma e a valutare quindi qs differenze) per cui il team con i 3 extraterrestri e quello con i 4 schiereranno sempre gli stessi (l'1 il 2 e il 3) con una resa di 45.32 (e costi diversi dato che il 4° fuori forma è un salasso inutile per il team che ne ha 4).
Il 5° giocatore è in forma discreta e quindi il team con 5 titanici schiererà i giocatori 1, 3 e 5 avendo una resa superiore a quello del team con soli 4 titanici. Il team con 6 titanici avrà una resa ancora superiore, ma spende in stipendi come quello con 4 extraterrestri.
I team con i sovrannaturali (liv.14) avranno via via rese crescenti in quanto riescono a scegliere su giocatori migliori di forma.
Questo un grafico che rappresenta la situazione:


più giocatori a disposizione, maggiore la scelta e quindi la resa in questo esempio.
Altri grafici, che qui non posto per non mettere troppa carne al fuoco, mostrano come chi ha pochi giocatori sia talvolta "condannato" a dover schierare quel che passa il convento, così in situazioni sfortunate chi ha 3 extra si trova ad aver rese inferiori ai team con 5 o 6 sovrannaturali, che spendono meno di stipendi, ma possono scegliere quelli in forma su una rosa più ampia.
Ma QUANTO spesso accadono queste situazioni sfortunate?
Ha senso allargare la rosa?

Vediamo.
Ho simulato 50 gruppi di 7 giocatori, su cui i 9 team dovevano fare le loro scelte e ho messo a confronto i risultati, vedendo le medie e le deviazioni standard


come ci si poteva aspettare al crescere del numero di giocatori in rosa diminuisce la varianza:
sui 16 2.29 è inferiore a 2.35
sui 15 si va da 2.14 a 1.85 e poi a 1.47
sui 14 da 2 a 1.73 a 1.38 e infine a 1.21
logico, chi ha meno giocatori deve prendere quel che viene, è più esposto ai capricci del caso (il tanto "amato" random), mentre chi ha più giocatori riesce ad ammortizzare escludendo via via i più bassi di forma.
E questo può essere un elemento interessante, magari ti trovi basso di forma nel momento clou del campionato e son dolori. Ma quello che conta sono anche (e soprattutto) le medie. E gli stipendi.

Per vedere bene il confronto tra le medie ho dovuto mettere le curve su grafici gaussiani.
Confronto allora per esempio il team 2 (quello con 4 extra) col team 5 (quello con 6 titanici) dato che hanno monti stipendio molto simili (attorno ai 165k):


vedo quindi che la squadra con maggior numero di giocatori ha una curva più stretta (meno random, meno varianza), ma la sua media è parecchio inferiore, tanto che l'area (colorata in rosa) in cui il team 2 ha vantaggio probabilistico rispetto al team 5 è di gran lunga superiore alla piccolissima area (colorata in azzurro a sinistra) in cui ha vantaggio il team 5.
A parità di monte stipendi, probabilisticamente è avvantaggiato come resa il team 2, quello con un numero inferiore di giocatori più forti.

Procedo a un altro confronto, tra il team 3 con 4 titanici e il team 8 con 6 sovrannaturali, entrambi spendono sui 111k di stipendio e anche qui vediamo come il team con minor numero di giocatori più forti sia avvantaggiato probabilisticamente rispetto all'altro (l'area azzurra è enormemente superiore a quella piccolissima a sinistra)


ora che avete capito comq funziona posso postare anche grafici più complessi come questo che rappresenta tutti i team con giocatori 15 e 16

vedete che all'aumentare del numero di giocatori in rosa si alza la media (le curve si spostano a destra) e si riduce la varianza (le curve si stringono), ma il confronto tra le curve diverse dice che:
* 6 giocatori 15 è inferiore a 4 gocatori 16, pur avendo costo leggermente superiore
* 5 giocatori 15 è lì lì con 3 giocatori 16, media leggermente inferiore, minor varianza, ma il costo è di 138k invece di 122 alla settimana
* 4 giocatori 15 è inferiore a tutte le altre, dà risparmio, ma anche minor resa rispetto a 3 giocatori 16


Infine, stesse conclusioni se considero i team con i giocatori di livello 14

le curve si stringono, ma le medie restano basse, anche spendendo molto (i 7 giocatori di liv 14 per 131k settimanali) si resta sotto a quanto riescono a garantire i 4 di livello 15 a soli 110k.

giovedì 29 marzo 2012

HATTRICK - Valore di Flesso ed Effetto fossa. Come distribuire i valori di attacco.





(TERZA VERSIONE)



Ciao a tutti.
Stavo scambiando qualche HTmail con un amico e mi son reso conto che quanto scritto (quasi 2 anni fa) nell'articolo http://acandio.blogspot.it/2010/05/hattrick-la-matematica-della-difesa.html non chiarisce alcuni punti importanti. Mano a mano che scrivevo questo articolo ho dovuto tornare su più volte, cambiarlo e modificarlo, spero sia piuttosto chiaro ora.


***************

Il problema è un punto centrale del funzionamento del Motore di Gioco: ossia la conversione delle occasioni da gol in gol, che nasce dal confronto tra Attacco e Difesa.
Tralasciando la fiducia la formula che regola questo confronto dovrebbe essere all'incirca:

Probabilità % di Gol = Att^3.6 / (Att^3.6+ Dif^3.6)

Primo passo è osservare che la formula NON è LINEARE.

Se fosse lineare, ogni aumento di tot del mio attacco mi darebbe un aumento costante di tot della probabilità di segnare.
Così non è.

Occorre quindi capire COME la funzione non sia lineare, per vedere come distribuire meglio i propri valori in attacco per massimizzare la propria probabilità di segnare.

Comincio da un esempio numerico, semplice semplice: il mio avversario fa 50 di difesa (fuoriclasse basso), io invece vario il mio attacco da 20 a 80

ad es.
- io faccio 50? allora 50^3.6/(50^3.6+50^3.6) = 0.5 , la probabilità di segnare è il 50%
- io faccio 45? la probabilità di segnare è il 40.63%
- io faccio 60? la probabilità di segnare è il 65.84%

vediamo una tabella che riassume questo:


dove vedete come varia la probabilità di segnare al variare del mio attacco, mentre la difesa del mio avversario è costante.
Ora, le percentuali, al variare del valore del mio attacco non sono lineari, si vede subito, se le metto in un grafico, che hanno una forma a "S":

Questo cosa significa in concreto?
Proviamo a vedere i numeri in alto:

parto dal centro: faccio 50 in attacco, l'avversario 50, ho il 50%
passo da 50 a 52 (+2), vedo che la probabilità passa dal 50% al 53.52%, cioè +3.52%
passo da 52 a 54 (+2), vedo che la probabilità passa dal 53.52% al 56.88%, cioè +3.36%
vedete? ho guadagnato, ma meno di prima
idem se passo da 54 a 56 (sempre +2), vedo che la probabilità passa dal 56.88% al 60.06%, cioè +3.18%

quindi più aumento il mio valore di attacco, più alta sarà la mia probabilità % di segnare, ma l'aumento della probabilità sarà via via sempre più piccolo.
(Indico questo fenomeno come "Effetto Flesso", lo spiegherò nel paragrafo successivo)

Per dire, passare da 78 a 80 mi dà un aumento dal 83.21% al 84.45% cioè un misero +1.23%
Questo perché, tornando nella curva ad "S" sono nella parte alta, dove la curva abbassa la sua inclinazione, è meno ripida e quindi minore sarà il guadagno.

Fin qui penso sia tutto chiaro.


***************


Ora arriva però un punto importante: la curva NON ha il suo "centro" al valore pari a quello dell'avversario, che nell'esempio in esame è 50.

Si vedeva subito, anche ad occhio: da 50 a 80 del mio attacco è +30, e la percentuale passa dal 50% all'84.45% cioè +34.45%, ma dall'altra parte da 50 a 20 ho -30, ma la percentuale passa dal 50% al 3.56% cioè -46.44%.
50 quindi non è un punto di "simmetria" della funzione.

Torno all'esempio numerico e procedo andando indietro passo passo a vedere come variano i valori:
da 48 a 50 (+2): da 46.33% a 50%, cioè +3.67%, che è maggiore del passaggio da 50 a 52
da 46 a 48 (+2): da 42.55% a 46.33%, cioè +3.78%, che è maggiore del precedente
da 44 a 46 (+2): da 38.69% a 42.55%, cioè +3.86%, che è maggiore del precedente
da 42 a 44 (+2): da 34.80% a 38.69%, cioè +3.89%, che è maggiore del precedente
da 40 a 42 (+2): da 30.93% a 34.80%, cioè +3.87%, che è MINORE del precedente

Questa la tabella:


che in grafico è

come vedete è una curva che ha un massimo, in un punto, chiamiamolo "Valore di Flesso" e tale valore è inferiore alla parità coi valori dell'avversario (nell'esempio, 50)
Questo avrà grosse conseguenze sulle scelte di come distribuire i valori di attacco.

INCISO MATEMATICO
Quello che ho chiamato il valore di Flesso è infatti il punto di flesso della curva di probabilità (dove la curva passa da concava a convessa), che si ricava ponendo x il valore del mio attacco e k il valore della difesa dell'avversario e annullando la derivata seconda della funzione y=x^3.6/(x^3.6+k^3.6). Non è proprio una cosa immediata. Qui i conti se siete interessati: https://sites.google.com/site/andreactools/home/CALCOLO%20del%20PUNTO%20di%20FLESSO.docx?attredirects=0&d=1, sennò saltate direttamente alla conclusione che è:
Nell'esempio sopra, con k=50 è il valore preciso è 42.6718 e rotti, quello approssimato di 42.67.
Il valore quindi a cui cambia la curva è pari a circa l'85.34% del valore dell'avversario.

Ora, tornando a bomba, il punto chiave è che più mi allontano dal Valore di Flesso (verso l'alto o verso il basso) minore sarà la variazione della mia probabilità di segnare.
Chiamo questo fenomeno "EFFETTO FLESSO"


***************


Cosa comporta questo nelle mie scelte di distribuzione dei valori in campo?
Comincio con degli esempi numerici e supponiamo di considerare i due attacchi laterali assieme.
Le difese del mio avversario sono fisse ed uguali, fa 50 a sinistra e 50 a destra.


CASO A. I miei attacchi sono in media maggiori delle difese avversarie

Parto con l'esempio della parità con l'avversario: ho a disposizione un totale di 100. Come lo distribuisco? 50 e 50? 55 e 45? 60 e 40?
Proviamo a vedere e poi sarà chiaro.

1. 50 e 50.
A sinistra 50 attacco contro 50 difesa, probabilità di segnare 50%
A destra 50 attacco contro 50 difesa, probabilità di segnare 50%
media complessiva è 50%

2. 55 e 45.
A sinistra 55 attacco contro 50 difesa, probabilità di segnare 58.49%
A destra 45 attacco contro 50 difesa, probabilità di segnare 40.63%
media complessiva è 49.56%
Il perché è chiaro: i 5 punti tra 50 e 55 sono più lontani dal Valore di Flesso (qui 42.92) dei 5 punti tra 45 e 50. Pertanto la variazione della probabilità di segnare dell'attacco di sinistra (da 50% a 58.49% è +8.49%) è inferiore alla variazione della probabilità di segnare a destra (da 50 a 40.63% è un -9.37%).

3. 60 e 40.
A sinistra 60 attacco contro 50 difesa, probabilità di segnare 65.84%
A destra 40 attacco contro 50 difesa, probabilità di segnare 30.93%
media complessiva è 48.39%
Come ci si poteva aspettare la media è calata ancora.

Avendo 100 a disposizione la scelta ottimale è quella di distribuirli in modo identico sui due lati di attacco. Questo il grafico della probabilità media di segnare al variare delle coppie di attacchi vedete indicate, a partire da destra 50 e 50 con probabilità 50%, il pallino blu subito a sinistra è 51 e 49, poi 52 e 48... poi 55 e 45 che ha un valore di 49.56% (lo vedete nella colonna a sinistra) e via via tutti gli altri:



E se ho 110? Idem. La scelta ottimale sarà 55 e 55, dato che se metto 56 e 54 il guadagno da 55 a 56 è inferiore alla perdita da 55 a 54 (dato che 54 è più vicino al Valore di Flesso di 56).

Quindi se la somma dei valori dei miei attacchi laterali è maggiore o uguale alla somma di quelli del mio avversario la scelta ottimale è quella di distribuire gli attacchi in modo uguale, attacchi SIMMETRICI.



CASO B. I miei attacchi sono in media minori delle difese avversarie, ma superiori al valore di flesso.

E se la somma dei miei attacchi è inferiore alla somma delle difese dell'avversario?
Qui entra in gioco un altro effetto.
Rappresento di nuovo la curva messa all'inizio, quella della mia probabilità di segnare, all'inizio avevo mostrato da 20 a 80 il mio valore di attacco a fronte di 50 quello della difesa avversaria.
Ora amplio e mostro da 0 a 100.

Ho indicato con delle righe blu i confini del grafico sopra, quelli che indicavano le zone "normali". Nelle zone estreme le cose cambiano e mentre a destra, sopra 80, i valori di probabilità di segnare continuano, seppur lentamente, a salire, sotto il 20 invece si appiattiscono in modo drastico.
La curva si schiaccia ed è sotto l'1% già al valore 13. I valori inferiori hanno variazioni irrisorie quindi. E' una zona che ho chiamato "la fossa".
Pur essendo più vicina al valore di flesso, la forma della curva fa sì che le variazioni in alto, quelle sopra l'80, diventino maggiori di quelle nella fossa.

Pertanto se la somma dei miei attacchi laterali è pari a 94 (che fa 47 in media, quasi a metà tra il valore dell'avversario, 50, e quello del flesso, 42.9), la curva della probabilità di segnare al variare delle coppie di attacchi è la seguente.
Nel grafico sono indicate le coppie possibili, la prima coppia a sinistra è 1 e 93 e quindi è il massimo dell'asimmetria possibile tra gli attacchi, poi il pallino blu successivo indica 2 e 92, poi 3 e 93 e così via:

così mentre a destra vedete l'andamento determinato dall'effetto FLESSO, per cui la coppia 47 e 47 è meglio di 42 e 52 in quanto valori più ravvicinati al punto di flesso, a sinistra c'è l' "effetto fossa" per cui dalla coppia 22 + 72 verso sinistra i valori dell'attacco più debole entrano nella "fossa", cominciano a perdere meno di quanto guadagni l'attacco forte e le medie della probabilità di segnare cominciano a risalire.
Fino alla coppia "6 e 88" comunque siamo ancora sotto, come valore percentuale di probabilità di segnare alla coppia di destra, simmetrica, "47 e 47".

Danfisico osserva "C'è da dire, però, che fare con un attacco valori da "fossa" mentre l'altro è molto forte è davvero difficile... la presenza stessa degli attaccanti che contribuiscono ad un lato, renderà l'altro attacco più forte dei valori (estremi) da fossa secondo me."
Verissimo, realizzare la coppia "4 e 90" che dà una media di probabilità migliore di "47 e 47" non è sempre possibile, in ogni caso questi discorsi teorici vanno valutati con i dati concreti.

Quanto sopra vale con un valore medio dei miei attacchi di 47, ma più scendo verso il valore di flesso (poco meno di 43), più è forte l'effetto Fossa rispetto all'effetto Flesso e la scelta di concentrare tutto su un lato diventa (statisticamente) vincente.


Caso C. La media dei valori dei miei attacchi è inferiore al valore di flesso

Sparisce il valore di flesso come lo conoscevamo: proviamo per un attimo a ignorare l'effetto fossa. E' meglio, supponendo un totale di 80, avere 40 o 40 oppure 39 e 41?
40 e 40?
Sbagliato.
Ricordiamo che all'allontanarsi dal punto di flesso le variazioni diventano sempre più piccole e quindi quell'1 che rinuncio passando da 41 a 40 non è compensato dalla salita da 39 a 40.
Effetto flesso ed effetto fossa qui spingono entrambi nella stessa direzione, suggerendo l'asimmetria tra i reparti.



SINTESI FINALE, a parità di difese laterali dell'avversario, quindi, abbiamo visto che la decisione se schierare attacchi uguali (simmetrici) oppure diversi (asimmetrici) dipende dal valore totale dei miei attacchi:

1) se il valore medio del mio attacco è superiore a quello della difesa avversaria (nell'esempio qui sopra superiore a 50), allora l'effetto flesso è più forte dell'effetto fossa e mi conviene schierare attacchi simmetrici

2) se il valore medio del mio attacco è compreso tra il valore di flesso (42,9 nell'esempio) e quello del mio avversario (50), allora effetto flesso ed effetto fossa sono in contrasto e occorrerà analizzare coi dati concreti se conviene l'attacco simmetrico o quello asimmetrico (oltretutto non è detto che i valori estremi di "fossa" siano concretamente realizzabili)

3) se il valore medio del mio attacco è inferiore al valore di flesso, allora l'effetto flesso si inverte (importante!) e indica che è meglio un attacco asimmetrico.

Questa una tabella per ricordare:


Ecco una immagine gif riassuntiva, al variare della somma dei miei attacchi da 120 (media 60) a 60 (media 30), con le difese avversarie sempre simmetriche e pari a 50. Vedete come a valori alti dei miei attacchi le curve siano più alte a destra (attacchi simmetrici), mentre mano a mano che si abbassano siano più interessanti gli attacchi a sinistra (asimmetrici):



Se avrò tempo farò qualche prova anche con difese avversarie asimmetriche, ora non riesco, sorry :)

Andreac