Kirjoitukset avainsanalla hajonta

Kuva: Minderbinder / Wikimedia Commons

Keskiarvoja on kaikkialla. Nettikauppa listaa tuotteidensa asiakasarvostelujen keskiarvot. Todistuksesta kysytään aina keskiarvo. Tutkimuksesta näytetään keskiarvot, eikä mediassa usein muuta kerrotakaan.

Keskiarvo on toki kuvaava tunnusluku, mutta yksinään riittämätön. Keskiarvon lisäksi pitäisi aina ilmoittaa myös hajonta, havaintojen keskimääräinen poikkeama keskiarvosta. Hajonta sisältää nimittäin oleellista, jopa ratkaisevaa, tietoa.

Oletetaan, että tarvitset pesukonetta ja tarjolla on kaksi samanhintaista vaihtoehtoa, Zing ja Zang. Molempiin on tuhansia asiakasarvioita, joiden molempien keskiarvot ovat tasan kolme tähteä. Valinta jää sattuman ja perusteettomien ennakkoluulojen varaan.

Mutta entä jos saatkin tietää juuri ennen ostopäätöstä pesukoneiden asiakasarvostelujen hajonnat: Zing on saanut jokaiselta asiakkaalta kolme tähteä, Zang taasen puolelta asiakkaista yhden tähden (eli heikoimman arvosanan) ja puolelta asiakkaista viisi tähteä (eli parhaan arvosanan). Molempien keskiarvo on kolme, mutta Zingin hajonta nolla, Zangin hajonta kaksi tähteä (eli suurin mahdollinen, kun asteikkona 1-5 tähteä). Kumman valitset?

Hajonnan merkitys riippuu asiayhteydestä. Pesukoneelta sopii toivoa tasaista varmuutta, ei hohtoa tai ihmeitä. Pesukoneista kannattaa siis valita se vaihtoehto, jonka arvosteluissa on pienempi hajonta. Luultavasti puolet Zangin koneista on viallisia tai siinä on jokin ominaisuus, joka ei puolelle käyttäjistä sovellu. Parasta olisi tietysti selvittää tuo syy ja päättää vasta sitten, mutta aikakin on rahaa eikä syy välttämättä selviä etukäteen.

Oletetaan, että menet katsomaan elokuvaa ja tarjolla on jälleen kaksi vaihtoehtoa, Zing ja Zang. Molempiin on tuhansia arvosteluja, joiden molempien keskiarvot ovat tasan kolme tähteä, mutta Zingin hajonta on nolla, Zangin hajonta kaksi tähteä. Kumman valitset?

Toisin kuin pesukoneen, elokuvan sopii herättää tunteita. Kannattaa siis mennä katsomaan elokuvaa, jota puolet katsojista vihaa ja puolet rakastaa, kuin sellaista johon kaikki reagoivat jassoo.

Arvosteluista on muutamalla klikkauksella yleensä nähtävissä myös arvosanojen koko jakauma, mutta hajonta voisi näkyä keskiarvon ohella jo tuotelistauksessa. Moni ei ehkä tiedä tai ymmärrä hajontaa, mutta voisi oppia jos näkisi hajonnan yhtä usein kuin keskiarvonkin.

Oletetaan, että tarvitset työntekijän ja tarjolla on jälleen kaksi vaihtoehtoa, Matti ja Teppo. Molempien hakijoiden todistusten keskiarvo on tasan seitsemän, mutta Matti on saanut jokaisesta 20 aineesta seiskan, Teppo 12 vitosta ja 8 kymppiä. Kumman valitset?

Hajonnan merkitys riippuu jälleen asiayhteydestä. Kaavamaiseen puurtamiseen kannattaa näillä tiedoilla valita Matti, luovaan älylliseen työhön Teppo.

Hajontaa voi mitata monin tavoin, ei ainoastaan keskihajonnan numeerisen arvon avulla. Esimerkiksi hajonnan positiivisen merkityksen voi määrittää valintatilanteessa huomioimalla keskiarvon lisäksi vaikkapa viisi parasta arvosanaa. Tepon ansioluettelo 7, 10, 10, 10, 10, 10 näyttää silloin paljon paremmalta kuin Matin vastaavaa 7, 7, 7, 7, 7, 7. Üheksa ametit, kümnes nälg, tietävät etelänaapurimmekin.

Jokaiseen tutkimukseen sisältyy virherajat, joita ei kerro keskiarvo vaan hajonta. Virherajat johtuvat kaiken väistämättömästä epävarmuudesta, eivätkä tarkoita mokaa tai että jotain olisi tehty väärin. Täydelliseen tutkimukseenkin sisältyy virhe, mutta täydellisessä tutkimuksessa se on osuvasti arvioitu ja täsmällisesti ilmoitettu. Tutkimustuloksista näytetään tai korostetaan uutisissa ja lehtijutuissa silti vain keskiarvoja ilman minkäänlaista hajonnan tai virherajojen kaltaista epävarmuuden ilmaisua.

Ongelma on siinä, että ilman virherajoja tutkimustuloksia ei voida verrata toisiinsa. Ei voida sanoa onko hanke A, jonka kustannusarvio on 1,6 miljardia euroa, toteutuessaan kalliimpi kuin hanke B, jonka kustannusarvio on 1,2 miljardia euroa, jos ennusteiden virherajoista ei tiedetä mitään. Ennusteen poikkeama on nimittäin verrannollinen tekijään (keskiarvojen erotus)/virhe, ja kun virhe → 0, jakolasku kasvattaa poikkeaman äärettömäksi. Virheettömät ennusteet ovat siis äärettömän huonoja.

Virherajojen puuttuminen vaivaa yleisemminkin viestintää, jopa tiedepuolella. Ongelma on niin lukijoissa, jotka janoavat varmuutta, mediassa, joka varmuutta kauppaa, kuin tutkijoissa, jotka eivät riittävästi korosta tulostensa epävarmuutta.

Ongelma helpottuisi, jos vain riittävän moni ymmärtäisi hajonnan ratkaisevan merkityksen.

Kun siis kuulet tai näet seuraavan kerran pelkän keskiarvon, vaadi myös hajontaa!

Kommentit (2)

Sisältö jatkuu mainoksen alla
Sisältö jatkuu mainoksen alla

Jos lottoaisi kaikki mahdolliset rivit, paljonko voittaisi? Veikkaus pitää itsellään n. 60% lottoon pelatuista rahoista, joten jokaista pelaamaansa miljoonaa kohti saisi 400 000 euroa takaisin.

Tappiota tulisi siis 600 000 euroa per pelattu miljoona, joten kaikkien rivien pelaamisessa ei ole tietenkään mitään järkeä. Mutta keskimäärin jokaista lottoamaansa euroa kohtikin saa vain 40 senttiä takaisin, joten odotusarvoisesti lottoaminen on tappiollista puuhaa joka tapauksessa.

Paitsi että joku sen päävoiton aina saa. Matemaatikko kutsuu tätä hajonnaksi. Juuri voittojen hajonta tekee lottoamisesta edes jossain mielessä kannattavaa. Mitä suurempi hajonta, sitä kannattavampaa odotusarvoisesti tappiollisen loton pelaaminen on.

Kuvitellaan kaksi loton muunnelmaa A ja B, joissa molemmissa jokaista pelaamaansa euroa kohti saa keskimäärin 40 senttiä takaisin. A-lotossa jokainen rivi antaa aina takaisin 40 senttiä, sattuipa riviin oikeita numeroita 0, 1, 2 tai vaikka kaikki 7. B-lotossa ainoastaan kaikki oikein antaa voiton, joka olisi 40% kaikkien lottoamista euroista eli paljon suurempi kuin nykyinen päävoitto. Muilla riveillä ei sitten voittaisi penniäkään – ei vaikka osuisi kuusi ja lisänumero. Voittojen hajonta on A-lotossa pyöreä nolla, B-lotossa taas suurin mahdollinen.

Kukaan tuskin pelaisi A-lottoa; sehän olisi kuin 60 sentin antamista pois jokaista riviä kohden.

Mutta minä ainakin pelaisin "kaikki tai ei mitään" B-lottoa, jos sellainen olisi olemassa. Nykyistä lottoa en pelaa, koska liian suuri osa palautetuista rahoista menee pikkuvoittoihin. Toisin sanoen hajonta on liian pieni. Toki voittoina palautettava osuus saisi sekin olla suurempi kuin nykyinen 40%, mutta minun silmissä loton arvoa alentaa erityisesti nuo hajontaa pienentävät pikkuvoitot. Veikkauksen lotto muistuttaa liikaa A-lottoa.

Miksi Veikkaus ei sitten kasvata hajontaa, jos se kerran tekisi lottoamisesta kannattavampaa ilman että yhtiö joutuisi tinkimään omasta 60% voitto-osuudestaan? Koska juuri pikkuvoitot koukuttavat pelaajat jatkamaan tappioistaan huolimatta. Ilman pikkuvoittojen addiktoimia massoja Veikkauksen euromääräiset tulot romahtaisivat, vaikka yhtiö voittaisi edelleen pelatuista euroista sen 60% osuuden.

Juuri hiljattain mainostettiin, että loton voittojen määrää vain entisestään kasvatettiin, kun myös kolme oikein riveistä alettiin maksaa voittoja. Lotto siirtyi taas askeleen kauemmas kannattavammasta B-lotosta kohti kannattamatonta A-lottoa. Mainospuheissa tämä huononnus tietysti esitettiin parannuksena.

Toisessa mainoksessaan Veikkaus mainosti uutta peliään "Kaikki tai ei mitään". Hetken jo ajattelin, että onko tosiaan tullut joku B-loton kaltainen peli, jota minäkin voisin pelata. Mutta olisihan se pitänyt arvata, mistä pelissä on kyse: pikkuvoittoja jaetaan vähintäänkin entiseen malliin ja päävoittokin on jaettu kahtia (sen voi saada jos on joko 12 oikein tai 0 oikein valittavasta 24 numerosta; siitä siis nimi; 0 ja 12 oikein todennäköisyys on tietysti yhtä suuri, joten ero on pelkästään näennäinen).

Jonottaessani bussikortin lataamista kioskeissa olen huomannut, että myyjillä on tapana kysyä Veikkauksen pelivoittoja lunastavilta asiakkailta, että laitetaanko voittorahoilla uudet rivit vetämään. Sitten vielä kysytään, että laitetaanko joku ekstra jokeripokeripoks tuplaus myös.

On kuin panttitölkkien palauttajalta kysyttäisiin kassalla, että laitetaanhan taas samaa kaljaa panttirahoilla. Tai tupakan ostajalta, että ostaisitko kuitenkin mieluummin tällaisen isomman askin. Tai pornolehden ostajalta, että laitetaanko myös tällainen vähän härskimpi lisänumero mukaan.

Euron panoksella saatu euro ei ole voitto vaan ajan haaskausta. Mistä tulikin mieleeni, että en ole vieläkään jaksanut raaputtaa toissa jouluna lahjaksi saamaani kalenteriarpaa.

Kommentit (6)

Hänen pyhyytensä
Liittynyt13.5.2005
Viestejä28239
1/6 | 

Ehkä en nyt täysin ymmärtänyt. Jos lotossa olisi saumat voittaa enemmän rahaa kuin kaikkien rivien veikkaaminen maksaa, niin eikös peli ikään kuin menetä merkityksensä?

Jos argumentista ei voi johtaa yleistä sääntöä, sillä ei ole sisältöä.

Vierailija
23/6 | 

Vuoden 2019 paras uusi nettikasino avattu, voittomahdollisuudet paljon isommat kuin Veikkauksella. Kannatta pelata järkevästi sillä palautusprosentti ratkaisee! <a href="https://www.wildz.com">Uusi netikasino Wildz</a>

Vierailija
25/6 | 

Kaikki tai ei mitään pätee myös sähkösopimuksiin - Ilman vertailemista tai kilpailutusta todennäköisesti maksat kalleimman hinnan sähköstä. Siksi sähkön kilpailuttaminen on ainut tapa säästää sähkössä!

Vierailija
26/6 | 

Nykypäivänä on todellakin typerää jättää asiat vertailematta. Kuten edellisessäkin viestissä mainittiin, sähkön kilpailutus on todellakin asia jota normaalit kansalaiset eivät usein tee tietämättömyyttään vaikka sen avulla voi säästää satoja euroja vuodessa.

UlkomaillaAsuva
27/6 | 

Myyjiä on useimmiten opastettu tähän käyttäytymiseen jossa pelaajalta kysytään pelataanko uudelleen voittorahoilla. Se minkä takia tämä on ok, mutta alkoholin kanssa ei, on toki hyvä kysymys. Ulkomailla suurimmaksi osaksi asuneena kummastuttaa tulla aina Suomeen takaisin vierailulle kuin joka vuosi tuntuu, että pelaaminen on lisääntynyt. Myös ulkomaalaiset nettikasinot ovat huomanneet, että suomalaiset pelaavat paljon. Enemmän kuin missään muualla maailmassa. Ja osa pitää tätä järkevämpänä toimintana kuin sijoittaminen, vaikka tietävät että todennäköisyydet ovat pelaajaa vastaan. Mutta ainakin sitä saa haaveilla niin kauan lottovoittoa kuin kuponki on kädessä ja arvonta suorittamatta. 

Seuraa 

Rajankäyntiä

Teppo Mattsson on kosmologiaan ja suhteellisuusteoriaan erikoistunut teoreettisen fysiikan tutkija, joka harrastaa matkailua tieteenalojen välisillä rajaseuduilla. Blogi on matkakertomus näiltä retkiltä.

Teemat

Blogiarkisto

Kategoriat