Kuva: Peng / Wikimedia Commons

Olen taitava heittämään nopalla kuutosia. Katsokaa vaikka. Oho, tuli kakkonen. Mutta odottakaapas kun heitän sataa noppaa. Tuli 25 kuutosta! Todistaa väitteeni, vai kuinka? Ai et usko. No heitänpä sinun mieliksi vielä tuhat noppaa. Nyt tuli 165 kuutosta! Näin monta kuutosta ei voi epäilevimmänkään mielestä olla enää tuuria.

Lapsikin ymmärtää, miten huijasin. Silti samalla tempulla "todistetaan" milloin mitäkin. Ja temppua kehdataan vielä väittää tieteeksi. Tietenkin kehdataan, koska se menee läpi. Etenkin silloin, kun tempulla todistetaan "tieteellisesti" jotain, jonka ihmiset haluavat kuulla.

Mutta miten ihmeessä nopanheittotemppuni muka vastaa näennäistieteellistä todistamista?

Ensinnäkin kaikkien ilmiöiden luonteeseen kuuluu kohina eli satunnainen vaihtelu. Siksi yksittäinen tutkimus on kuin nopanheitto. Kuutonen tukekoon tutkimusväitettä, ja muut silmäluvut olkoon ristiriidassa sen kanssa. Toisinaan satunnaisvaihtelua on enemmän ja toisinaan vähemmän, mitä kuvaa nopan sivujen vaihteleva määrä.

Toisekseen samasta aiheesta löytyy yleensä paljon aineistoa ja tutkimuksia. Noppaa ei siis heitetä vain kerran, vaan sata tai tuhat kertaa. Aivan kuten tempussanikin.

Sanotaan sitten, että joku haluaa todistaa väitteensä kuten minä todistin taitoni heittää kuutosia. Olkoon väite, että maskit eivät suojaa kulkutaudilta. Poimitaan sadasta aiheeseen liittyvästä tuloksesta 25, jotka puoltavat väitettä, ja viitataan niihin. Ripotellaan mutkistavat yksityiskohdat satasivuiseen raporttiin ja yksinkertaistetaan viesti mediaan sopivaksi: maskit ei suojaa. Yleisö ottaa toivotun totuuden huojentuneena vastaan: "Onneks ei tarvi niitä noloja naamareita pitää. Nythän se on oikein tieteellisestikin todistettu, että suomalaisia ne ei suojaa!" Eikä 25 kuutosta voi olla sattumaa, eihän?

Mitä enemmän tutkimuksia, sitä enemmän vaihtelua. Ja mitä enemmän vaihtelua, sitä varmemmin tuloksista löytyy jokaisen ennakkoluuloille vahvistus.

Tutkimuksiin perehtyminen vahvistaa uskomuksia ja poliittisia erimielisyyksiä, kun ihmiset valikoivat tuloksista vain ne, jotka puoltavat omaa kantaa.

Vaikka jokainen tutkimus itsessään olisi yhtä tieteellinen ja reilu kuin jokainen heittämäni noppa, tulosten valikointi ei ole tiedettä sen enempää kuin kuutosten valikointi todistaa heittotaitoni.

Big dataan eli räjähdysmäisesti kasvaviin jättiaineistoihin suhtaudutaan hyvin toiveikkaasti. Onpa tätä digikehityksen hedelmää esitetty jopa perinteisen tieteellisen tutkimuksen syrjäyttäjäksi. Mutta kohina kasvaa nopeammin kuin signaali: noppavertauksessa big data vastaa ziljardeja heittoja, jolloin myös kuutosten lukumäärä kasvaa kohinalla. Jättiaineistoissa silkka sattuma tuottaa väärien tulosten tulvan, jonka pinnalta jokainen voi poimia mieluisat tulokset. Ja esittää ne omien väitteidensä todisteeksi. 

Big datalle voi esittää loputtomasti kysymyksiä, ja sattuma huolehtii että lopulta löytää myös toivomansa vastauksen.

Ongelman ydin on kivikautiset vaistomme: ne eivät ymmärrä satunnaistamisen ratkaisevaa roolia totuuden etsinnässä. Jos tutkimuskohde sisältää enemmän tietoa kuin pystymme käsittelemään, siitä on poimittava satunnaisotos, johon jokaisella tiedonmurulla on yhtä suuri todennäköisyys päätyä. Rusinoiden poimiminen pullasta ei ole satunnaisotos.

Lannoitteiden vaikutusta viljasatoihin tutkittiin tuloksetta miltei koko 1800-luku, kunnes Ronald Fisher ratkaisi ongelman 1900-luvulla, satunnaistamalla. Satunnaistamisen ratkaiseva merkitys opittiin sen jälkeen kaikilla tieteenaloilla. Mutta savanniapinan aivomme lankeavat yhä uudestaan samaan ei-satunnaisen valikoinnin perisyntiin.

Ratkaisu jättiaineistojen tuottamien väärien tulosten ongelmaankin on siis vanha tuttu. Pitää satunnaistaa. Satunnaistaa. Ja satunnaistaa.

Ainakin jos totuus on tärkeämpää kuin tuntea olevansa oikeassa.

Kommentit (0)

Sisältö jatkuu mainoksen alla
Sisältö jatkuu mainoksen alla
Seuraa 

Rajankäyntiä

Teppo Mattsson on kosmologiaan ja suhteellisuusteoriaan erikoistunut teoreettisen fysiikan tutkija, joka harrastaa matkailua tieteenalojen välisillä rajaseuduilla. Blogi on matkakertomus näiltä retkiltä.

Teemat

Hae blogista

Blogiarkisto

Kategoriat