Monissa elävän elämän lukusarjoissa näkyy Benfordin laki, joka sanoo, että luvun ensimmäisenä numerona ykkönen on tavallisin ja yhdeksikkö hännänhuippu. Laki auttaa talousrikosten tutkijaa ja tv-etsivää.


että luvun ensimmäisenä numerona ykkönen on tavallisin ja yhdeksikkö
hännänhuippu. Laki auttaa talousrikosten tutkijaa ja tv-etsivää.

Sisältö jatkuu mainoksen alla

Sisältö jatkuu mainoksen alla


Televisiossa pyörivässä sarjassa Num3rot ratkotaan rikoksia matematiikan avulla. Katsojalle jää hieman himmeä käsitys matematiikan voimasta selvittää rikoksia, kun sarjan päähenkilö näyttää vain hääräilevän liitutaululla epämääräisten kaavojen kanssa. Osittain tämä johtunee siitä, että rikosten ratkaisussa oikeasti käytettävät matemaattiset mallit eivät kertoisi mitään muille kuin matemaatikoille.

Sarjan tulevassa jaksossa Juokseva mies turvaudutaan kuitenkin niin yksinkertaiseen matemaattiseen malliin, että maallikkokin pystyy sen ymmärtämään. Se on nimeltään Benfordin laki.

Paljastui likaantuneista taulukoista

Lain keksi 1881 yhdysvaltalainen tähtitieteilijä Simon Newcomb. Hän havaitsi, että kirjastojen logaritmitaulujen reunat olivat likaantuneempia taulukkokirjojen alku- kuin loppupuolelta. (Olisiko hän keksinyt lakiaan taskulaskinten aikakaudella, jää arvailujen varaan.)

Logaritmitauluja availlaan vain niiden lukujen kohdilta, joita tarvitaan. Tästä Newcomb päätteli, että pienet numerot (1, 2, 3,...) esiintyvät tietynlaisen tilastoaineiston luvuissa useammin ensimmäisenä numerona kuin suuret (..., 7, 8, 9).




Näkyykö laki kotikadullasi?


Oletetaan yksinkertaisuuden vuoksi, että talonnumeroiden määrä riippuu suoraan kadun pituudesta. Näin useimmiten on, ellei kadulla ole puistoja tai suuria julkisia rakennuksia.

Jos kadulla on numero 9, kadun pitää olla vain 11 % pidempi, jotta sillä olisi myös numero 10. Sen jälkeen pituuden pitää kaksinkertaistua eli kasvaa 100 %, jotta numeroissa päästään 20:een. Mutta tästä talonnumeroon 30 riittääkin 50 %:n pituuden lisäys, ja numerosta 30 numeroon 40 pituutta tarvitaan lisää vain 33 %. 

Prosenttiluku pienenee entisestään, kunnes päästään dekadin loppuun, eli numerosta 90 numeroon 100 on taas enää vain 11 %:n lisäys. Numerosta 100 numeroon 200 lisäys onkin sitten jälleen 100 %. Tästä syystä ykkösellä alkavia kadunnumeroita on enemmän kuin kakkosella alkavia, joita taas on enemmän kuin kolmosella alkavia jne.

Hyvän aineiston Benfordin lain testaamiseen saat puhelinluettelosta. Tilastoi kadunnumerot ensimmäisen numeron mukaan; yhdenkin sivun tarkastelu riittää.






Frank BenfordTheodore Hill

Sopii kauppalaskuun mutta ei aleen

Benfordin lain on havaittu pätevän hyvin lukuihin, jotka ovat peräisin elävästä elämästä ja syntyneet tavalla tai toisella kasvun tuloksena. Tällaisia ovat esimerkiksi sähkölaskut, yhtiöiden liikevaihdot, alkuaineiden atomipainot, kuntien asukasluvut, järvien pinta-alat tai kasvavien taimien pituudet.

Arkijärkeen istuu hyvin, että esimerkiksi kympin tai parin kauppalaskuja  on enemmän kuin suuria laskuja eli ykköset ja kakkoset ovat alkunumeroina kärjesssä.

Toinen Benfordin lakia noudattava tilanne on sellainen, jossa muuttujat ovat kokonaislukuja ja jokaista lukua edeltävät kaikki pienemmät luvut, mutta eivät välttämättä suuremmat. Hyvä esimerkki ovat katujen numerot. Jos kadulta löytyy vaikka numero 19, siellä on kaikki aiemmat numerot mutta ei ehkä enää numeroa 20.

Benfordin ensimmäisen numeron lakia ei sen sijaan voida soveltaa esimerkiksi tasaisesti jakautuneisiin lottonumeroihin tai normaalijakaumaa noudattaviin aikuisten ihmisten pituuksiin. Laki ei myöskään päde lukuihin, joita on jollain tavoin manipuloitu. Esimerkiksi yksittäisten kauppatavaroiden hinnoissa numeroa 9 esiintyy tavallista enemmän, koska 9,95 € on houkuttelevampi hinta kuin tasasumma 10,00 €.


Auttaa nappaamaan huijarit

Yhdysvaltojen Seattlessa saatiin 2002 eräs tilastotietoja keräävä haastattelija kiinni vilpistä Benfordin lain avulla.
Haastattelijan piti haastatella markkinointitutkimusta varten päivällä kotona olevia ihmisiä ja merkitä lomakkeeseen haastatellun osoite. Joku yhtiössä kiinnitti kuitenkin huomiota siihen, että tämän haastattelijan osoitteissa kadunnumerot jakautuivat hyvin tasaisesti, kun ne muilla alkoivat yleensä pienillä numeroilla. Haastattelija oli täyttänyt lomakkeet itse ja jälkiä peittääkseen kirjannut osoitteiden numerot tasaisesti, liian tasaisesti.

Samalla tavalla on paljastunut vakuutuspetoksia. Jos esineiden arvot alkavat liian tasaisesti jakautuneilla numeroilla, on syytä epäillä, ettei korvauksen hakijalla ole puhtaat jauhot pussissa.

Onpa Yhdysvalloissa Benfordin lakia käytetty jopa entisen presidentin Bill Clintonin verojen analysointiin. Ainakaan tuolloin tulokset eivät viitanneet "Rehellisen Billin" syyllistyneen verovilppiin.

Kannattaa muistaa, että Benfordin laki ei ole todiste sen paremmin vilpin kuin rehellisyyden puolesta. Mutta kun todellinen jakauma poikkeaa lain antamasta, asiaa on syytä tutkia tarkemmin.



Timo Suvanto on vapaa tietokirjailija ja valokuvaaja.

P(n)=log(1+1/n) todistaa pienten numeroiden vallan































1 30,1
2 17,6
3 12,5
4 9,7
5 7,9
6 6,7
7 5,8
8 5,1
9 4,6

Kaava kertoo todennäköisyyden sille, että luvun alussa ovat numerot n. Kaava käsittää yksittäiset numerot mutta myös useamman numeron sarjat.
Esimerkiksi todennäköisyys, että tilaston lukuarvo alkaa numeroilla 123, on P(123) = log(1 + 1/123) = 0,0035 = 0,35 %
Todennäköisyys sille, että luku alkaa numeroilla 987, on
P(987) = log(1 + 1/987) = 0,00044 = 0,044 % eli pienten numeroiden todennäköisyys on kahdeksankertainen.
Laki on käytetystä skaalasta riippumaton. Esimerkiksi järvien pinta-alojen ensimmäisen numeron jakauma on sama, oli pinta-ala ilmoitettu neliökilometreinä tai vaikka neliömaileina. Tämä johtuu lain logaritmisesta luonteesta.


 

Sisältö jatkuu mainoksen alla