Englannin Valioliigan todennäköisyysjakauma
Lähetetty:
Todennäköisyysjakauman määrityksessä on varmasti yhtä monta laskutapaa kuin on laskijaakin.
Monenlaisia kaavarisukasoja nähneenä tuli mieleen etsiä todellista tietoa näistä luvuista, jotta ei tarvitse uskoa, luulla eikä arvailla, saati jäljitellä markkinaa.
Tarkastelut pohjautuvat seuraavanlaiseen tietokannasta poimittuun Excel-taulukkoon:
Taulukko kattaa Valioliigan kaikki ottelut kausilta 2001 - 2012 eli 11 sarjakautta, yhteensä 4180 ottelua.
Taulukko yhdistää ottelukohtaisiin tietoihin koko sarjakauden tiedoista poimitut
-kokonaispistemäärät, tehdyt ja päästetyt maalit sekä rangaistukset.
Tämänkaltainen rakenne mahdollistaa monenlaisten analyysien tekemisen:
- minkätäsoisten joukkueiden kohtaamiset ovat runsasmaalisia,
- mikä on kotivoiton todennäköisyys tietynvahvuisten joukkueiden kohdatessa,
- jne.
Niinhän sitä luulisi...
Joukkueet on jaoteltu 10 luokkaan kauden aikana saavutetun pistemäärän mukaan. Joukkuemäärät (ja samalla ottelumäärät) jäävät melko pieniksi muutamissa luokissa.
Pieniä luokkia ovat vahvuustasot 1, 2, 3 ja 10. Tässä 10 x 10 jaottelussa esim. kohtaamisia 3 vs. 3 löytyi kaikkien 11 kauden ajalta vain 6 kappaletta.
Kaavio kotivoittojen todennäköisyyksistä:
Kaavion perusteella tuskin kannattaa kovin suuria summia Veikalle lähetellä.
Ongelma on monesta aiemmastakin selvityksestä tuttu: 4180 ottelua on aivan liian pieni määrä jotta tiedoista voitaisiin laskea luotettavia tilastokeskiarvoja.
Tummanvihreä käppyrä kertoo että kun 3 vs. 3 kohtaamisia löytyi 6 kappaletta, voitti kotijoukkue ne kaikki (100%). Vastaavasti 4 vs. 3 kohtaamisia oli 21 kappaletta, joista kotijoukkue voitti vain 4 (19%)!
Kun satunnaispoikkeamat pienestä ottelumäärästä johtuen ovat näin suuria, on tulos yllä kuvatun kaltainen.
Valioliigassa ottelutilastoja pitäisi kaivaa vähintään nälkävuosiin asti ennenkuin käyrät alkavat kunnolla oieta...
Silloin taas herää kysymys, onko saatu data enää validia vuonna 2012.
Onneksi kehittyneet tilastolliset abstrahointi-menetelmät tulevat avuksemme!
Kun edellä saadut käppyrät käsitellään riittävän voimakkaalla korjausoperaattorilla, muuttuu tilanne huomattavasti valoisammaksi. Käyrien muoto ja sijainti voidaan määrittää suurella tarkkuudella.
Menemättä laskujen yksityiskohtiin, esitän tässä vain tulokset:
Voimakaskaan korjaus ei kykene selvittämään kaikkia ongelmakohtia ja korjaus toistetaan tällä kertaa hyvin heikolla operaattorilla. Pahimmilla alueilla olen laskenut muutaman karttapisteen kokonaan manuaalisesti.
Lopputulos on tämän näköinen vähän parempi-resoluutioisena versiona:
Kaavioita luetaan seuraavasti, esimerkkinä ottelu 2 vs. 8:
- vierasjoukkueen taso = 8, luetaan 8. käppyrää (vaaleanpunainen)
- kotijoukkueen taso = 2, luetaan arvo vaaka-akselin kohdasta 2.
Ottelun 2 vs. 8 todennäköisyysjakaumaksi saadaan: 78.48 - 16.82 - 4.70
Ei mitään mutu-arvailua, ei mitään sekalaisia kaavasotkuja, ei mitään markkina-smoottailuja vaan raakaa hard-coded dataa Englannin Valioliigasta kausilta 2001 - 2012.
Saatu todennäköisyysjakauma soveltuu sellaisenaan vain Valioliigaan. Erot liigojen välillä ovat suuria ja poikkeamat jakauman eri alueilla voivat olla huomattavan suuria.
Vastaavalla menettelyllä voidaan laatia kaaviot maaliodotusarvoista.
Siitä seuraavassa postissa.
Monenlaisia kaavarisukasoja nähneenä tuli mieleen etsiä todellista tietoa näistä luvuista, jotta ei tarvitse uskoa, luulla eikä arvailla, saati jäljitellä markkinaa.
Tarkastelut pohjautuvat seuraavanlaiseen tietokannasta poimittuun Excel-taulukkoon:
Taulukko kattaa Valioliigan kaikki ottelut kausilta 2001 - 2012 eli 11 sarjakautta, yhteensä 4180 ottelua.
Taulukko yhdistää ottelukohtaisiin tietoihin koko sarjakauden tiedoista poimitut
-kokonaispistemäärät, tehdyt ja päästetyt maalit sekä rangaistukset.
Tämänkaltainen rakenne mahdollistaa monenlaisten analyysien tekemisen:
- minkätäsoisten joukkueiden kohtaamiset ovat runsasmaalisia,
- mikä on kotivoiton todennäköisyys tietynvahvuisten joukkueiden kohdatessa,
- jne.
Niinhän sitä luulisi...
Joukkueet on jaoteltu 10 luokkaan kauden aikana saavutetun pistemäärän mukaan. Joukkuemäärät (ja samalla ottelumäärät) jäävät melko pieniksi muutamissa luokissa.
Pieniä luokkia ovat vahvuustasot 1, 2, 3 ja 10. Tässä 10 x 10 jaottelussa esim. kohtaamisia 3 vs. 3 löytyi kaikkien 11 kauden ajalta vain 6 kappaletta.
Kaavio kotivoittojen todennäköisyyksistä:
Kaavion perusteella tuskin kannattaa kovin suuria summia Veikalle lähetellä.
Ongelma on monesta aiemmastakin selvityksestä tuttu: 4180 ottelua on aivan liian pieni määrä jotta tiedoista voitaisiin laskea luotettavia tilastokeskiarvoja.
Tummanvihreä käppyrä kertoo että kun 3 vs. 3 kohtaamisia löytyi 6 kappaletta, voitti kotijoukkue ne kaikki (100%). Vastaavasti 4 vs. 3 kohtaamisia oli 21 kappaletta, joista kotijoukkue voitti vain 4 (19%)!
Kun satunnaispoikkeamat pienestä ottelumäärästä johtuen ovat näin suuria, on tulos yllä kuvatun kaltainen.
Valioliigassa ottelutilastoja pitäisi kaivaa vähintään nälkävuosiin asti ennenkuin käyrät alkavat kunnolla oieta...
Silloin taas herää kysymys, onko saatu data enää validia vuonna 2012.
Onneksi kehittyneet tilastolliset abstrahointi-menetelmät tulevat avuksemme!
Kun edellä saadut käppyrät käsitellään riittävän voimakkaalla korjausoperaattorilla, muuttuu tilanne huomattavasti valoisammaksi. Käyrien muoto ja sijainti voidaan määrittää suurella tarkkuudella.
Menemättä laskujen yksityiskohtiin, esitän tässä vain tulokset:
Voimakaskaan korjaus ei kykene selvittämään kaikkia ongelmakohtia ja korjaus toistetaan tällä kertaa hyvin heikolla operaattorilla. Pahimmilla alueilla olen laskenut muutaman karttapisteen kokonaan manuaalisesti.
Lopputulos on tämän näköinen vähän parempi-resoluutioisena versiona:
Kaavioita luetaan seuraavasti, esimerkkinä ottelu 2 vs. 8:
- vierasjoukkueen taso = 8, luetaan 8. käppyrää (vaaleanpunainen)
- kotijoukkueen taso = 2, luetaan arvo vaaka-akselin kohdasta 2.
Ottelun 2 vs. 8 todennäköisyysjakaumaksi saadaan: 78.48 - 16.82 - 4.70
Ei mitään mutu-arvailua, ei mitään sekalaisia kaavasotkuja, ei mitään markkina-smoottailuja vaan raakaa hard-coded dataa Englannin Valioliigasta kausilta 2001 - 2012.
Saatu todennäköisyysjakauma soveltuu sellaisenaan vain Valioliigaan. Erot liigojen välillä ovat suuria ja poikkeamat jakauman eri alueilla voivat olla huomattavan suuria.
Vastaavalla menettelyllä voidaan laatia kaaviot maaliodotusarvoista.
Siitä seuraavassa postissa.