giovedì 26 febbraio 2009

HATTRICK - Nuove Giovanili - Stelline e Stima dei Valori delle Skill 2.0



***

AVVERTENZA: QUESTO ARTICOLO E' OBSOLETO, I CALCOLI RIPORTATI SI RIFERISCONO AL PERIODO DI ELABORAZIONE DELLO STESSO, FEBBRAIO 2009, LO LASCIO COME RIFERIMENTO, MA TENETE CONTO DELLA SUA ETA'. GRAZIE

***




Come molti mi sono parecchio arrabattato sulle nuove giovanili. Quello che resta il nocciolo del problema è la STIMA DEI VALORI DI SKILL NELLE GIOVANILI che sono spesso sconosciuti.

La carenza di dati al riguardo è stata compensata da qualche gruppo di volenterosi che hanno pazientemente raccolto i loro valori: raccolte interessanti sono state fatte da agiro per i portieri e da altri per gli altri ruoli. Per questo abbozzo di ricerca ho utilizzato i dati raccolti in http://www.nrgjack.altervista.org/giovanili/ngpromozioni.php (220 giocatori) e http://hwuguadagno.altervista.org/studiong (418 giocatori) per un totale di 638 giocatori.

Ho riportato le tabelle in excel e ho cominciato a procedere considerando che il problema è quello solito della stima dei coefficienti dei parametri in una regressione lineare (http://it.wikipedia.org/wiki/Regressione_lineare) , occorre stimare i valori βi in Yi=β0+β1X1+...+βnXn.

Nel caso del portiere, ad esempio, avrò il vettore delle Stelline riportate giocando in porta dai vari giocatori (StGK) e i corrispondenti valori di esperienza e delle skill parate e difesa rivelatisi dopo la promozione in prima squadra. Ho sostituito alle valutazioni "buono","disastroso" e "tremendo" i valori mediani 7,5 1,5 e 2,5. Non conoscendo i decimali è prudente porsi nel mezzo.

Questo è un estratto di quello che risulta in excel:



Questi i risultati delle analisi reparto per reparto

* PORTIERI pochi dati, solo 22, quindi stima solo provvisoria

Per i portieri quindi sembra che venga considerato l'86% della skill parate, il 6% dell'esperienza e solo il 1.9% della skill difesa. Questo ultimo valore è praticamente irrilevante dal punto di vista statistico, confermando l'utilizzo per le giovanili del vecchio motore di gioco che per i portieri considera solo la skill parate.
La formula potrebbe essere:

StGK= 1 + 0,86*PAR + 0,06*exp




* DIFENSORI

prima fase di analisi: consideriamo il campione piu' ampio possibile -> 208 giocatori di cui conosciamo le stelline nelle giovanili, e il valore difesa ed esperienza rivelatisi in seguito. La regressione dà:

la formula per questa prima analisi è
StDIF=0,212+0,853*DIF+0,163*exp



seconda fase di analisi
restringo ora l'analisi ai 98 di cui conosco oltre alla skill in difesa anche quella in cross e ottengo

la formula per questa seconda analisi è
StDIF=-0,559+0,871*DIF+0,205CRO+0,005*exp

da notare il coefficiente nullo dell'esperienza e quello praticamente identico della difesa, mentre R2 cresce dal 79,8% al 85,2%



terza fase di analisi considero i 22 di cui conosco difesa e regia e ottengo

il campione in esame è molto ristretto però il coefficiente in regia parla chiaro 0,008 --> regia non va considerata



quarta fase considerando i 13 giocatori di cui conosco regia, difesa e cross cross parrebbe ancora meno rilevante di difesa, non riporto i dati delle stime per la limitatezza del campione.



con molta prudenza, considerando le fasi 1 e 2 dell'analisi, potrebbe quindi essere ipotizzata una formula:

StDIF= -0,5 + 0,87*DIF + 0,20*CRO



* CENTROCAMPISTI

i 75 valori del sito http://hwuguadagno.altervista.org/studiong mi lasciano piuttosto perplesso perché se li utilizzo per la regressione ottengo un coefficiente della skill difesa doppio rispetto a quello della skill regia, cosa che per i CC è incongruente.

restringo l'analisi ai 39 giocatori dell'altro sito e ottengo

che suggeriscono una formula pari a

StREG = 0,14 + 0,64*REG + 0,25*PAS + 0,08*DIF + 0,07*exp

Per i CC allora viene considerato il 65% della skill regia + il 25% della skill passaggi e l'8% di difesa



* ALI qui si lavora bene: 138 giocatori completi di tutti i valori in difesa, regia, passaggi e cross
e anche i risultati sono buoni

R quadro oltre l'86% che suggerisce questa formula:

StCRO= -1,5 + 0,62*CRO + 0,30*REG + 0,24*PAS + 0,14*DIF + 0,27*exp

valore di cross considerato a poco piu' del 60%, pari al doppio della regia, poco meno per passaggi e ca il 14% per la difesa.



* ATTACCANTI

fase uno
: 127 giocatori di cui conosco sia il livello in attacco che quello in passaggi

quindi StATT=-0,177+0,713*ATT+0,283*PAS+0,117*exp



fase due:
restringo ai 42 giocatori di cui conosco anche l'abilità in cross per vedere se questa skill ha peso
0,04 come coefficiente per i cross, con le altre che variano abbastanza e R quadro che crolla.. hmm preferisco la prima fase quindi:


StATT = -0,18 + 0,71*ATT + 0,28*PAS + 0,12*exp

per gli attaccanti il 71% di attacco e il 28% di passaggi.



°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°



Quello che ottengo è quindi un sistema di equazioni lineare, che potrà essere via via risolto in relazione alle skill che verranno rese certe dall'allenatore delle giovanili.

ecco il sistema

StGK = 1+0,86*PAR+0,06*exp
StDIF = -0,5+0,87*DIF+0,20*CRO
StREG = 0,14+0,64*REG+0,25*PAS+0,08*DIF+0,07*exp
StCRO = -1,5+0,62*CRO+0,30*REG+0,24*PAS+0,14*DIF+0,27*exp
StATT =-0,18+0,71*ATT+0,28*PAS+0,12*exp


quindi, ad esempio, potrò risolvere la prima equazione per stimare il valore di skill del portiere,

StGK = 1 + 0,86 PAR + 0,06 exp
StGK - 1 - 0,06 exp= 0,86 PAR
PAR = (StGK - 1 - 0,06 exp) /0,86

se ad esempio riceve 6 stelline e la sua exp è stimata a 1,5 allora sarà
PAR = (6 - 1 - 0,06*1,5)/0,86 = 5,709

notare che in mancanza di dati piu' precisi conviene sempre stimare Debole=4,5, Scarso=3,5 ecc



°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°


questo lavoro può essere utile anche al contrario, ossia per

STIMARE I DECIMALI DEI GIOCATORI PROMOSSI

esempio concreto (segnalato da un amico): giocatore appena promosso con
regia 5
difesa 3
pass 4
in giovanile aveva ottenuto in posizione centrocampista centrale 5,5 stelline

avrò quindi
StREG=0,13+0,64REG+0,25PAS+0,08DIF

imposto in excel mettendo regia 5,5, passaggi 4,5 e difesa 3,5


i primi valori sono quelli rilevati, imposto poi la formula che mi stima il valore che qui è pari a 5,160 e l'ultimo valore è la differenza col valore reale (5,5-5,160)

è chiaro che mancano dei decimali... (se l'errore è positivo devo aumentare i decimali, se negativo ridurli) allora proverò ad aumentare i decimali per ridurre al minimo lo scostamento, aumento quindi regia, passaggi e difesa quanto serve restando dentro il limite (cioè regia insufficiente varierà tra 5,0 e 5,9)

vedo che inserendo regia 5,9, passaggi 4,8 e difesa 3,6 l'errore si riduce a 1 millesimo...




come detto sopra vista la scarsezza del campione in esame tutto questo è suscettibile di ampie correzioni, tuttavia può essere una base da cui sviluppare una ricerca e dare indicazioni di massima sui decimali dei giocatori




Andreac (team ID 1730726 in Hattrick)

qui l'INDICE del Blog


Creative Commons License
This opera by Andrea Candio is licensed under a Creative Commons Attribuzione-Non commerciale 3.0 Unported License. Cioé questo lavoro può essere liberamente copiato, distribuito o modificato senza espressa autorizzazione dell'autore, a patto che l'autore sia chiaramente indicato e la pubblicazione non sia a fini commerciali.