Sivu 1/1

Maalijakaumien korjaus

Lähetetty:
Kirjoittaja KR
Itseäni otteluiden tilastollinen mallintaminen kiinnostaa tukivälineenä arvioiden tekemiseen ja minulla on pikkutrabeli. Miten %-laskelmia tehdessänne huomioitte useimpien joukkueiden kohdalla tiettyjen maalilukujen (tai maalierot) kohdalla olevat poikkeamat? Esim illan UEFA joukkue Middlesbro on runsaan kahden kauden aikana pelannut seuraavin tuloksin vieraissa /Premiership. Kiinnostaisi jonkinlaisen mallin rustaaminen, mutta joku totuuspohja tässä mallissa olisi plussaa ainakin jos rahoja aikoo sijoittaa. Esimerkkitaulukossa mahdollinen 5 tai suuremman maalin ero on huomioitu 4:ssa.

Koodi: Valitse kaikki

Maaliero
===========
ME	KPL
-4	1
-3	2
-2	7
-1	14
0	9
1	4
2	3
3	2
4	1

Koodi: Valitse kaikki

             *  
             *  
             *
             * 
             * 
             *  *     
             *  *     
          *  *  *    
          *  *  *    
          *  *  *    
          *  *  *  *
          *  *  *  *  *
       *  *  *  *  *  *  *
    *  *  *  *  *  *  *  *  *
-|--|--|--|--|--|--|--|--|--|--|
-5 -4 -3 -2 -1  0  1  2  3  4  5
MIDDLESBRO maaliero vierasotteluissa (#=43)
Eli joukkue on hävinnyt monta kertaa yhden maalin erolla (ei ole yksin Boron ominaisuus vaan samaa löytyy monilta muilta joukkueilta) ja itse asiassa näistä 14 kerrasta 10 kertaa 0-1. Se on sivuseikka, mutta joka tapauksessa kovinkaan moni (???) joukkuekohtainen tilasto ei sovi tunnettuihin perusjakaumiin kovinkaan helposti johtuen tuosta piikistä -1 kohdalla. Useaman joukkueen yhdistetyt kausikeskiarvot tasoittavat jakautumia mukavasti Poissoniin sopivimmiksiksi:

Koodi: Valitse kaikki

          
 Y-aks (* vastaa 10 esiintymiskertaa; aineistona kaikki 380 premiership ottelua 2003/04, "pikselin" epätarkkuus +- 5 )
                * 
                * 
                *    
             *  *     
             *  *    
             *  *  *  
          *  *  *  *  
          *  *  *  *  
          *  *  *  *  *  
       *  *  *  *  *  *  
    *  *  *  *  *  *  *  *  
-|--|--|--|--|--|--|--|--|--|--|
-5 -4 -3 -2 -1  0  1  2  3  4  5

X-aks maaliero "vieraan" näkökulmasta
Oikeastaan se ei ole mikään salaisuus että yleisimmät jakaumat sopivat otteludataan melko huonosti mutta sitä lähinnä kysynkin että KUN korjaatte jakaumia niin mitä te itse asiassa korjaatte silloin? Toivottavasti vastauksia tulee paljon koska prosenttiarvioitakin on runsain määrin tarjolla.

-kr-

Lähetetty:
Kirjoittaja Willy
Maalaisjärkeni sanoo, että korjausta ei kannata tehdä ELLEI tuohon poikkeukselliseen jakaumaan ole jokin looginen selitys JA saman meiningin voidaan olettaa jatkuvan tulevissa otteluissa. Tuo otoskoko sinänsä ei tietenkään kerro yksistään mitään.

Saatan olla ihan väärässäkin mutta eiköhän yksi vedonlyöjien suurimmista kompastuskivistä ole hätiköityjen johtopäätösten tekeminen liian pienen otoksen perusteella. Räikeinpinä esimerkkeinä voisi ajatella lukuisia jenkkifoorumeilla pyöriviä sällejä, jotka vetävät jonkun muun tipseillä, koska se tipsasi edellisenä viikonloppuna 6-1 ATS ja on nyt siis "hot"..

Lähetetty:
Kirjoittaja Player1
Vois lähteä ajatuksesta, että noi parin viime kauden niukat vierastappiot muuttais joukkueen pelaamista sillä tavalla, että tällä kaudella sitten takaa-ajo asemassa pelaisivat aktiivisemmin loppuhetkillä. Hyökkäisivät kuudella ja ottaisivat molaria kulmureihin mukaan aikaisessa vaiheessa jne. Siis oletuksena, että samat jätkät siellä pelailee ja sama manageri. Kyllä luulisin, että tuolla historialla voi olla jopa päinvastainen vaikutus noihin yhden maalin tappioihin. Tyyliin yrittänyttä ei laiteta.

Itse ainakin tollasta tilastoa katsellessa managerina miettisin, että onko riskiä ruvettu ottamaan liian myöhään ja liian vähän, kun ei olla tasoihin noustu koskaan ja aina hävitty vaan yhdellä. Pelaajiakin varmaan vituttaa tollaset niukat tappiot ja varmaan on kova into on ainakin yrittää tasoitusta rohkeasti tulevaisuudessa.

Lähetetty:
Kirjoittaja gary
Itse korjaan ainoastaan tasureita Poissonedin malliin, joka on mielestäni riittävä. Edelleenkin paljon tärkeämpää on ne lähtötiedot eli maalilukuennusteet tai miksi niitä nyt voisi sanoa...maaliodotusarvot. Ne kun saisi kohilleen, niin hyvin menee.

Lähetetty:
Kirjoittaja KR
Kiitos vastauksista tähän mennessä, lissääkin saa kommentteja tulla. Toki sarjoja voidaan ottaa pidemmältä jaksolta mutta edelleenkään nämä eivät sovi tunnettuihin jakaumiin; vaikkapa 8 kauden tilastot:

Koodi: Valitse kaikki

MIDD KOTI
8 KAUTTA

                *
                *
                * 
                *
                *
                *  *
                *  *    
             *  *  *    
             *  *  *  *
             *  *  *  *
             *  *  *  *  
          *  *  *  *  *
       *  *  *  *  *  * 
       *  *  *  *  *  *  *  *
    *  *  *  *  *  *  *  *  * 
-|--|--|--|--|--|--|--|--|--|--| 
-5 -4 -3 -2 -1  0  1  2  3  4  5 
MIDDLESBRO maaliero kotiotteluissa (#=152) 
"*" vastaa suunnilleen 2% esiintymisprosenttia (KARKEA JAKO)

Koodi: Valitse kaikki

MIDD VIERAS
8 KAUTTA

                *
             *  *
             *  * 
             *  *
             *  *
             *  * 
             *  *      
             *  *      
             *  *  *  
          *  *  *  *  
          *  *  *  *    
          *  *  *  * 
          *  *  *  *  * 
    *     *  *  *  *  *  * 
 *  *  *  *  *  *  *  *  *   
-|--|--|--|--|--|--|--|--|--|--| 
-5 -4 -3 -2 -1  0  1  2  3  4  5 
MIDDLESBRO maaliero vierasotteluissa (#=152) 
"*" vastaa suunnilleen 2% esiintymisprosenttia (KARKEA JAKO)
Kun lisätään edelleen vuosia ja sekoitetaan pakkaan muita joukkueita niin yksityiskohdat keskiarvottuvat. Siinä ajassa jo lajin säännötkin yms ovat jo muuttuneet enkä ainakaan tuohon luottaisi. Toisin sanoen minun pitäisi kai löytää jokin maaginen korjauskerroin (jollaista ei ehkä ole?) sille että voisin muuntaa sarjakeskiarvon yksittäistä joukkuetta vastaavaksi.

Koodi: Valitse kaikki

10 KAUTTA, KAIKKI PREMIERSHIP OTELUT

                *
                * 
                *  
                *  *
                *  *
                *  *   
             *  *  * 
             *  *  *  * 
             *  *  *  *
             *  *  *  * 
          *  *  *  *  *
          *  *  *  *  *  * 
          *  *  *  *  *  *  
    *  *  *  *  *  *  *  *  *  *
-|--|--|--|--|--|--|--|--|--|--| 
-5 -4 -3 -2 -1  0  1  2  3  4  5 
1994/95-2003/04 maaliero PREMIERSHIP kaikki ottelut (#=3882) 
"*" vastaa suunnilleen 2% esiintymisprosenttia (KARKEA JAKO)
Kuten jäsen G edellä toteaa on ainakin tasuri pielessä vaikka kuinka keskiarvotettaisiin (3882 ottelun keskimääräinen jakauma) mutta väitän että tuossa jo monet muutkin mutkat on jo suoristettu. Ja kyllähän tuo otoksen suuruus on AINA riittämätön eli pelaaja joutuu tekemään päätöksiään heikkojen signaalien ja omien arvioiden perusteella joten analyysi pitää aina riskin sisällään vaikka lähtökohtina olisivatkin todelliset historiatiedot aiemmista otteluista. Riskinhän tulisi korjaantua oman seurannan perusteella.

Vielä täsmennän tuota yksittäisen joukkuekohtaisen analyysin vaikeutta:

Koodi: Valitse kaikki

Arsenal

                   *
                   *
                   * 
                *  *
                *  *  *
                *  *  *
                *  *  * 
                *  *  * 
                *  *  *
                *  *  *  *
             *  *  *  *  *
             *  *  *  *  * 
          *  *  *  *  *  *  *  *  
          *  *  *  *  *  *  *  *
-|--|--|--|--|--|--|--|--|--|--| 
-5 -4 -3 -2 -1  0  1  2  3  4  5 
Arsenal kotiottelut 2003 ja taaksepäin: (#=192) 

Koodi: Valitse kaikki

Bolton

                *
                *
                *
                *
                *  
                *  
                *   
                *  *
                *  * 
                *  * 
                *  *  
             *  *  *  
             *  *  * 
          *  *  *  * 
          *  *  *  * 
          *  *  *  *  *   
    *  *  *  *  *  *  *  *    
 *  *  *  *  *  *  *  *  * 
-|--|--|--|--|--|--|--|--|--|--| 
-5 -4 -3 -2 -1  0  1  2  3  4  5 
Bolton kotiottelut 2003 ja taaksepäin: (#=95)  

Koodi: Valitse kaikki

Liverpool

                 
                 
                 
                 
                   
                   
                *     *
                *     * 
                *  *  * 
                *  *  * 
                *  *  *  
             *  *  *  * 
             *  *  *  * 
             *  *  *  * 
             *  *  *  *  *
             *  *  *  *  *  *
             *  *  *  *  *  *  
          *  *  *  *  *  *  *  * 
-|--|--|--|--|--|--|--|--|--|--| 
-5 -4 -3 -2 -1  0  1  2  3  4  5 
Liverpool kotiottelut 2003 ja taaksepäin: (#=192)  

Koodi: Valitse kaikki

Sheffield W

                 
                 
                 
                * 
                *   
                *   
                *     
                *      
                *  *   
                *  *   
             *  *  *    
             *  *  *   
          *  *  *  *  * 
          *  *  *  *  * 
          *  *  *  *  *  
          *  *  *  *  *  
       *  *  *  *  *  *     *
       *  *  *  *  *  *  *  *  
-|--|--|--|--|--|--|--|--|--|--| 
-5 -4 -3 -2 -1  0  1  2  3  4  5 
Sheffield W kotiottelut 1999 ja taaksepäin: (#=116)  

Koodi: Valitse kaikki

Tottenham
                 
                 
                 
                   *
                *  * 
                *  *   
                *  *    
                *  *   
                *  *   
             *  *  *    
             *  *  *   
             *  *  *  * 
             *  *  *  * 
             *  *  *  *  
          *  *  *  *  *  *
       *  *  *  *  *  *  *  
       *  *  *  *  *  *  *  *  
-|--|--|--|--|--|--|--|--|--|--| 
-5 -4 -3 -2 -1  0  1  2  3  4  5 
Tottenham kotiottelut 2004 ja taaksepäin: (#=192)  
Voisihan näitä listailla vaikka kuinka mutta se on kai varmaa että esimerkiksi liigakeskiarvo (varsinkaan pitkän ajan ka) EI KUVAA YHDENKÄÄN joukkueen jakaumia ja itse ainakin olisin tästä kovin huolissani jos minulla olisi analyysiohjelma ja olisin vaikkapa vain maalikeskiarvojen varassa. Eikö kukaan muu ole huolissaan? Mikä on esimerkiksi jäsen G:n siteeraama "oikea maalikeskiarvo" ja mitä sillä sitten tehdään kun se on saatu "oikeaksi"?

-kr-