|
[...continua]
Su footystats necessarie tre precisazioni fondamentali, anche perché ho già provato a validare questi dati sul campione Serie A, provando a confrontarli con quelli di altri siti simili e più affidabili ma che trattano solo campionati maggiori:
1. più si scende di livello nelle serie, minore è la copertura, e meno affidabili sono tutti i dati che leggi. La Serie C è purtroppo all'ultimo gradino e quindi tutti i dati vanno presi con le pinze;
2. i dati sulle singole partite possono essere "sbagliati" (ovvero molto differenti dagli stessi dati proposti dalla maggior parte di altri siti simili), se confrontiamo partite di Serie A ad esempio, per quanto riguarda la parte di statistica predittiva. Per quanto riguarda la parte descrittiva, invece, generalmente non ho riscontrato grandi anomalie.
3. Sebbene per l'appunto sulla singola partita la parte predittiva possa essere anche molto sballata, se facciamo un'analisi a larga scala sull'intero campione di partite giocate dalle singole squadre, gli ordini di grandezza di xG/xGA per squadra, ad esempio, sono invece molto simili, ed in misura minore anche il ranking di tale statistica tra le squadre. Probabilmente per qualche effetto di compensazione degli "errori".
Per cui la mia impressione su footystats è che le stats descrittive vadano bene, e che su larga scala (xG/xGA medi per partita e ranking, ad esempio) le stats predittive funzionino abbastanza, ma non sulle singole partite.
Per la Serie C, occorre abbassare ulteriormente il livello di affidabilità del dato, ma è impossibile quantificare: potrebbe anche essere spazzatura, ma diciamo che se si segue il campionato di C un'idea sulle caratteristiche e la pericolosità delle squadre ce la si fa. Ti dico che a me l'anno scorso non sono sembrate stats totalmente sballate, ma è una mia impressione. Magari anche sbagliata.
Scusa il pippone
|