Kirjoitukset avainsanalla todennäköisyys

Kuva: Wikimedia Commons

Epäilty on syytön, kunnes toisin todistetaan. Rokote on tehoton, kunnes toisin todistetaan. Kolikko on reilu, kunnes toisin todistetaan. Joulupukkia ei ole, kunnes toisin todistetaan. Usko on väärä, kunnes toisin todistetaan.

Syyttömyysolettama kiteyttää myös tieteen lähtöoletuksen: mitään uutta ei tapahdu missään. Tuomarina toimii todistusaineisto, joka kumoaa tai säilyttää tämän lähtöoletuksen eli nollahypoteesin, kuten tilastomatemaatikot sitä nimittävät.

Tieteellisen päättelyn vastakohta on somepäättely. Somepäättelyssä omat uskomukset ovat tosia ja toisten uskomukset vääriä, vaikka toisin todistetaan. 

Aineiston todistusvoiman määrää se, kuinka epätodennäköiseltä aineisto näyttää syyttömyysolettaman valossa. Haluaisimme tietenkin tietää syyllisen, mutta on helpompi määrittää aineiston epätodennäköisyys kuin syyllisyyden todennäköisyys. Haluaisimme tietää totuuden, mutta todisteiden epätodennäköisyys on helpompi laskea. Se mikä päättelyn mutkikkuudessa hävitään, laskennan helppoudessa voitetaan.

DNA-todisteet, videotallenne, motiivi, savuava ase ja seikkaperäinen tunnustus ovat syyttömyysolettaman valossa hyvin epätodennäköisiä. Ne riittävät kumoamaan syyttömyysolettaman, eli todistavat syyllisyyden, vaikka eivät suoraan kerrokaan sitä mitä eniten haluamme eli syyllisyyden todennäköisyyttä.

Rokkotautien kukistaminen tekee rokotteiden tehottomuusoletuksen epäuskottavaksi. Siispä päättelemme, että rokotteet tehoavat.

Sata peräkkäistä klaavaa tekee kolikon reiluusoletuksen epäuskottavaksi. Siispä päättelemme, että kolikko ei ole reilu.

Tieteessä aineiston todistusvoimaa mittaa p-arvo: mitä pienempi p-arvo, sitä epäuskottavammalta syyttömyysolettama eli nollahypoteesi vaikuttaa. Jos p-arvo = 1/1000, täytyy ostaa keskimäärin tuhat arpaa saadakseen yhtä poikkeuksellisen tuloksen tai yhtä raskauttavat todisteet sattumalta. Vaikka p-arvo on nimenomaan aineiston todennäköisyys (syyttömyysolettamalla), se kertoo siis epäsuorasti myös syyllisyydestä tai syyttömyydestä. Ykköstä lähellä olevat, yli 1/10 p-arvot, eivät horjuta syyttömyysolettamaa tai nollahypoteesia, koska sen suuruisia arvoja syntyy tuon tuostakin silkasta sattumasta kuin yksi oikein -lottorivejä. Tarkkaan ottaen p-arvo on vähintään käsillä olevan aineiston vahvuisten todisteiden todennäköisyys syntyä sattumalta eli sillä oletuksella, että syytetty on syytön, rokote tehoton tai kolikko reilu. Eli vähintään havaitun vahvuisen signaalin todennäköisyys kohinassa: p-arvo = P(signaali|kohina), joka ei kuitenkaan ole kohinan, sattuman tai syyttömyyden todennäköisyys koska ehdollinen todennäköisyys ei ole vaihdannainen.

Määrite vähintään on ratkaisevan tärkeä p-arvon määritelmässä. Selvitetään sen merkitystä tarkastelemalla lähtöoletusta, että tyttöjä ja poikia esiintyy yhtä paljon jossain tutkimuksen kohteena olevassa populaatiossa.

Olkoon aineistonamme populaatiosta kymmenen satunnaisesti arvottua lasta, joista kahdeksan on poikia ja kaksi tyttöjä. Mikä todennäköisyys kuvastaa tämän näytön vahvuutta syyttömyysolettamaa eli sukupuolten tasajakaumaoletusta vastaan?

Kahdeksan pojan todennäköisyys P(8 poikaa kymmenestä lapsesta) on noin 4%, jos molempia sukupuolia esiintyisi yhtä paljon. Tällainen sattuma esiintyy harvemmin kuin kerran kahdestakymmenestä. Havaitun kahdeksan pojan pieni todennäköisyys ei kuitenkaan vielä riitä kumoamaan sukupuolten tasajakaumaoletusta, sillä epätodennäköisyyslaskennassa täytyy laskea mukaan myös kaikkien muiden vähintään yhtä äärimmäisten tai raskauttavien todisteiden todennäköisyydet. Toisin sanoen mukaan on laskettava myös todisteita, joita ei ole edes olemassa!

Vaikka todistusaineistossamme on vain kahdeksan poikaa, todistusaineiston epätodennäköisyyttä mittaavaan p-arvoon lasketaan siis myös yhdeksän ja kymmenen pojan todennäköisyydet. Lisäksi on laskettava kahdeksan, yhdeksän ja kymmenen tytön eli kahden, yhden ja nollan pojan todennäköisyydet, koska nekin ovat sukupuolen tasajakaumaoletuksen näkökulmasta vähintään yhtä äärimmäisiä tuloksia kuin havaittu kahdeksan pojan aineisto.

Oikea p-arvo saadaan siis laskemalla yhteen p-arvo = P(8 poikaa) + P(9 poikaa) + P(10 poikaa) + P(2 poikaa) + P(1 poika) + P(0 poikaa) = 11%, eli huomattavasti enemmän kuin pelkkä kahdeksan pojan todennäköisyys 4%.

Kahdeksan poikaa ei siis olekaan kovin epätodennäköinen aineisto, sillä kerran yhdeksästä saadaan vähintään yhtä äärimmäinen poikkeama tasajakaumasta puhtaasti sattumalta. Ei edes kolme oikein -lottorivin veroinen tulos.

Kuviteltujen todisteiden huomioinen kasvattaa syyttömyysoletuksen todennäköisyyttä, eli raskauttavammat lisätodisteet toimivatkin syytetyn eduksi!

Vakuuttavatko kuvitellut todisteet lakimiehet ja tuomarit? Tuntuuko niiden huomioiminen sinusta suorastaan väärältä? Et ole ainoa, mutta asian hahmottamista helpottaa vielä toisen aineiston tarkastelu.

Olkoon toisena aineistonamme tuhat satunnaisesti arvottua lasta, joista tasan 500 on poikia ja loput 500 tyttöjä. Mikä todennäköisyys nyt kuvastaa tämän näytön vahvuutta syyttömyysolettamaa eli sukupuolten tasajakaumaoletusta vastaan?

Jos ensimmäisen aineiston tapauksessa oikea vastaus olisi ollut havaitun kahdeksan pojan todennäköisyys, niin samalla logiikalla oikean vastauksen tulisi tässä olla havaitun 500 pojan todennäköisyys P(500 poikaa tuhannesta lapsesta) joka on vain 2.5%. Tällainen sattuma esiintyy vain kerran neljästäkymmenestä, jonka perusteella tasajakaumaoletus näyttää hyvin epäuskottavalta. Mutta aineistossahan on täsmälleen yhtä monta poikaa ja tyttöä, joten mitään näyttöä tasajakaumaoletusta vastaan ei edes ole!

Ristiriita poistuu, kun huomioidaan p-arvon määritelmä vähintään yhtä äärimmäinen aineisto: 500 pojan aineistossa ei ole äärimmäisyyttä alkuunkaan, koska tulos ei poikkea tasajakaumasta lainkaan. Niinpä vähintään yhtä äärimmäisiä kuin 500 poikaa ovat kaikki mahdolliset tulokset nollasta tuhanteen poikaan, joiden yhteistodennäköisyys on tietenkin tasan 100% eli p-arvo on täsmälleen 1! Tämä esimerkki vakuuttaa toivottavasti maallikkotuomaritkin siitä, että myös kuvitteelliset todisteet on huomioitava oikeudessa ja tieteessä.

Tieteellinen päättely on epätodennäköisyyslaskentaa. Se tuntuu epäintuitiiviselta, koska päättelyssä on ylimääräinen mutka joka saa aivotkin helposti solmuun. Kun solmun avaa huolellisesti jokaisen tulkinnan kohdalla, epäintuitiivisesta tulee järkeenkäypää.

Kommentit (4)

Lauri Raittio
1/4 | 

Todennäköisyysteorian mahdollistama tilastollinen päättely toimii tosi hienosti niin kauan kuin pysytään noppien, kolikkojen ja pöytäkorttien laskemisessa.

Suurimmassa osassa empiiristä tutkimusta on valtavasti erilaisia systemaattisia harhoja jotka vinouttavat aineistoa siten, ettei nollahypoteesi pidä (juuri) koskaan paikkaansa jos aineisto on riittävän suuri, Systemaattisten harhojen vuoksi havaittu tulos eroaa nollahypoteesista vaikka se olisikin totta.

Nollahypoteesin testaaminen vastaa kysymykseen: kuinka todennäköistä on havaita aineisto jos nollahypoteesi on totta. Mielenkiintoisempi kysymys on puolestaan kuinka todennäköisesti vaihtoehtoinen hypoteesi on totta. Siihen tarvitsisi vaihtoehtoisen hypoteesin ennakkotodennäköisyyden. 

Teppo Mattsson
Liittynyt13.1.2014
Viestejä144
2/4 | 

Tärkeä huomio. Efektikoon luottamusvälin tarkastelu on oleellinen osa tilastollista päättelyä, mistä voisi vaikka julkaista oman kirjoituksen.

Käyttäjä6458
Liittynyt27.2.2018
Viestejä1712
4/4 | 

Ehdottomasti tarvitsevat, kopska he tarvitsevat sieltä joukon käsitteitä, jotka eivä ole (ainakaan pelkkää) fysiikkaa - eivätkä matematiikkaa, kuten syys ja seuraus, määrä ja laatu, sattuma ja välttämättömyys, subjektiivinen ja objektiivinen, mahdollisuus ja todellisuus (aktuaalisuus), sisältö ja muoto, materia ja liike, totuus, todennäköisyys jne.

Sisältö jatkuu mainoksen alla
Sisältö jatkuu mainoksen alla
Kuva: Wikimedia Commons

Kuinka usein sataa, kun taivaalla on pilviä? Ehkä vain joka kolmas päivä, sillä poutapilvet ovet yleisempiä kuin sadepilvet.

Kuinka usein taivaalla on pilviä, kun sataa? Aina, sillä sade vaatii pilven, josta vesi putoaa. Aina sadepilveä ei näe, mutta ei sadetta ilman vettä eli pilveä.

Sateen todennäköisyys pilvisellä säällä P(sade|pilviä) ei siis ole lainkaan sama kuin pilvien todennäköisyys sadesäällä P(pilviä|sade). P(sade|pilviä) ≠ P(pilviä|sade) yhtä varmasti kuin 1/3 ≠ 1.

Olemme tottuneet laskemaan asioita haluamassamme järjestyksessä. Onhan 1 + 2 yhtä kuin 2 + 1 eli A + B = B + A. Joskus laskujärjestyksellä on kuitenkin väliä. Esimerkiksi todennäköisyyslaskennassa. 

Matemaatikko ilmaisee asian sanomalla, että ehdollinen todennäköisyys ei ole vaihdannainen: P(A|B) ≠ P(B|A) eli A:n todennäköisyys ehdolla B ei ole sama kuin B:n todennäköisyys ehdolla A. Sateen todennäköisyys ehdolla pilvet ei ole sama kuin pilvien todennäköisyys ehdolla sade.

Pilvien ja sateen todennäköisyyden eron ymmärtää jokainen. Mutta kun tunteet tulevat peliin, ajattelumme alkaa tehdä pahamaineisia tepposiaan. Herkkä aihe, ja pim, järkeväkin ihminen taantuu alkukantaiseen uskoon, että P(A|B) = P(B|A).

Selittämättömistä vaivoista kärsivä alkaa etsiä syitä vaivoilleen. Google kertoo, että juuri tuossa vakavassa sairaudessa on kaikki samat vaivat. Apua, minulla on kuolemantauti! Ahdistuksen ja pelon vallassa tuntuu, että johtopäätös on varma kuin tauti.

Mikä meni päättelyssä vikaan?

Mikäs muukaan kuin ehdollinen todennäköisyys. Tolkuissaan oleva ystävä rauhoittelee: P(kuolemantauti|vaivat) ≠ P(vaivat|kuolemantauti) eli kuolemantaudin todennäköisyys, kun on vaivat, ei ole lainkaan sama asia kuin vaivojen todennäköisyys kun on kuolemantauti. Google kertoi aivan oikein, että ne joilla on kuolemantauti, kärsivät varmasti vaivoista. Tästä ahdistunut googlaaja teki virhepäätelmän, että ne joilla on vaivat, on varmasti kuolemantauti.

Taudin todennäköisyys P(kuolemantauti|vaivat) eroaa vaivojen todennäköisyydestä P(vaivat|kuolemantauti) paljon, koska kuolemantauti on harvinainen mutta vaivat yleisiä. Eli on paljon ihmisiä, jotka kärsivät samoista vaivoista, mutta joilla ei ole kuolemantautia vaan vaivoihin on jokin vaarattomampi syy.

Harvinaisten tautien väestötason seulontakin säikyttelee terveitä väärillä hälytyksillä samasta syystä.

Otetaan tautiseula, jonka tarkkuus ja herkkyys on 99%. Testataan seulalla tautia, jota esiintyy seulotussa väestössä joka tuhannella. Mikä on todennäköisyys, että positiivisen testituloksen saaneella on tauti?

Vastaukset saadaan suoraan Bayesin kaavasta: Positiivisen testituloksen saaneista vain 9% on seulottava tauti. Eli jokaista seulaan jäänyttä sairasta kohti on yli yhdeksän tervettä, jotka säikähtävät väärää hälytystä (ja pahimmassa tapauksessa joutuvat kärsimään tarpeettoman hoidon haitoista). 

Sovelletaan samaa seulaa vielä erityiseen riskiryhmään, jossa tauti esiintyy joka kymmenennellä. Nyt Bayesin kaava kertoo, että hälyttävän tuloksen saaneista 92% ovat oikeastikin sairaita. Testin positiiviseen tulokseen voi siis luottaa, kunhan se kohdennetaan yleisväestön sijasta oikeille riskiryhmille. 

Mitä harvemmin esiintyvästä asiasta kyse, sitä useammin ehdollisen todennäköisyyden sekoittaminen johtaa vääriin hälytyksiin. Ja mullistavat löydökset, jos mitkä, ovat harvinaisia niin tieteessä kuin missä hyvänsä tutkimuksessa.

Poikkeuksellinen löydös vaatii tuekseen poikkeuksellista näyttöä, jotta ei synny vääriä hälytyksiä ja kohua kohinasta.

Havainnot on vielä tärkeää erotella yllätyslöydöksiin, joista ei ole mitään etukäteistietoa, ja vankkojen teorioiden toteutuneisiin ennusteisiin. Esimerkiksi Higgsin hiukkasesta ei tarvita niin vahvaa kokeellista näyttöä kuin jos vastaava havainto olisi tehty ilman teoreettista ennustetta hiukkasen olemassaolosta.

Jättiläismäinen aineisto, josta sokeasti pengotaan ziljoonia asioita ilman mitään teoreettista ennustetta, tuottaa löydöksiä jotka ovat harvinaisempia kuin yksi ziljoonasta. Mutta monet niistäkin ovat vain satunnaista kohinaa vailla taustalla olevaa aitoa ilmiötä. Samalla tavalla kuin joku voittaa aina lotossakin vailla tietoa oikeista numeroista.

Tutkimustuloksille voi laskea ns. p-arvon, jonka käänteisluku kertoo kuinka monta arpaa pitäisi keskimäärin ostaa, että saisi yhtä poikkeuksellisen tuloksen sattumalta. Jos aineistolähtöisessä tutkimuksessa on tehty enemmän testejä kuin niiden pienimmän p-arvon käänteisluku, väärien hälytysten riski on huomattava.

Tutkimusten p-arvotkin ymmärretään erittäin usein jopa ammattitutkijoiden parissa väärin. P-arvo kertoo todennäköisyyden, jolla vähintään havaitun vahvuinen signaali syntyy satunnaisesta kohinasta p = P(signaali|kohina). Tämä ei siis ole todennäköisyys, että havaittu signaali olisi satunnaista kohinaa eli havainto sattumaa, sillä kuten olemme oppineet P(signaali|kohina) ≠ P(kohina|signaali) eli P(havainto|sattuma) ≠ P(sattuma|havainto).

Jokainen todennäköisyys on pohjimmiltaan ehdollinen todennäköisyys, vähimmäisehtona ainakin luonnonlait. Ehdollisen todennäköisyyden sekoittamisessa on siis kyse yleisestä ongelmasta, joka esiintyy kaikkialla missä esiintyy todennäköisyyksiä. Eli kaikkialla.

Koneet voidaan ohjelmoida välttämään tunteisiin sortuvan ihmisen virheitä, mutta omalta osaltamme ehdollisen todennäköisyyden ongelmaan auttaa vain se sama lääke kuin muihinkin inhimillisen päättelyn vinoumiin. Eli vanha tuttu sivistys.

Kommentit (0)

Kuva: Steve Jurvetson / Wikimedia Commons

Tutkimuksen julkaisun ratkaisee usein yksi luku. Luku, joka erottelee menestyjät luusereista. Luku, joka kantaa nimeä p-arvo.

Kun p-arvo alittaa maagisen 0.05 rajan, tapahtuu monenlaista kivaa: tuloksesta tulee merkitsevä, tutkimuksesta julkaisu, tutkijasta menestyjä, lääkkeestä tehokas – ja mikä tärkeintä, raha alkaa virrata. Rajan 0.05 yläpuolella tutkimus päätyy pöytälaatikkoon, tutkija kortistoon ja raha onnekkaammille.

P-arvoa vastaavia todennäköisyyksiä on laskettu ainakin 1700-luvulta lähtien. Lontoon syntyvyystilastoja vuosilta 1629-1710 tutkinut John Arbuthnot havaitsi, että kaikkina 82 vuotena poikia oli syntynyt enemmän kuin tyttöjä. Todennäköisyyslaskentaan perustuen hän päätteli, että ero ei voinut olla sattumaa.

P-arvo kertoo todennäköisyyden, jolla satunnaisesta kohinasta syntyy vähintään havaitun vahvuinen signaali. Poikaenemmistön syntyminen 82 peräkkäisenä vuonna puhtaasti sattumalta on yhtä epätodennäköistä kuin heittää 82 klaavaa peräkkäin, eli p = 1/2⁸² < 0.000000000000000000000001. Voidaan siis oikeutetusti päätellä, että ero ei ole sattumaa vaan poikia todella syntyy enemmän kuin tyttöjä.

On järkeenkäypää, että positiivista tulosta arvostetaan enemmän kuin negatiivista. Penisilliinin tehon osoittaminen on tärkeämpää kuin poronsarviuutteen tehottomuuden.

Ongelma syntyy, kun p = 0.05 kaltainen mielivaltainen raja määrää mikä merkitsee ja mikä ei. Ongelma pahenee, kun merkitsevää luullaan merkittäväksi, tilasto-osaaminen on ylipäänsä heikkoa ja kognitiiviset vinoumat ohjaavat tutkimusta. Evoluutio herkisti ihmisen tunnistamaan hahmoja satunnaisuudessa ja erehtymään kohinaa signaaliksi. 

Anna tutkijalle p < 0.05 ja ruokit hänet päiväksi. Opeta tutkijaa kalastamaan p-arvoja ja ruokit hänet loppuelämäksi.

Merkitsevyyden raja p = 0.05 tarkoittaa, että joka 20. arpa voittaa. Big data tarkoittaa, että arpoja riittää. Ja vain voittavat arvat huomataan ja muistetaan.

Eipä ihme, että eräs luotettavimmin toistuvista tutkimustuloksista on, että julkaistuista tuloksista korkeintaan puolet onnistutaan toistamaan.

Tieteelle p-arvojen 0.049 ja 0.051 välinen 0.2 prosenttiyksikön ero on yhtä mitätön kuin tavalliselle tallaajalle 4.9% ja 5.1% välinen ero sateen todennäköisyydessä. Merkitsevän ja ei-merkitsevän ero ei itsessään ole merkitsevä! Silti p = 0.049 kerää kunnian ja p = 0.051 vaipuu unholaan.

Nature julkaisi viime viikolla yli 800 tutkijan allekirjoittaman vetoomuksen, jossa halutaan lopettaa jako merkitseviin ja ei-merkitseviin tuloksiin. "Älä sano tilastollisesti merkitsevä", myötäilee The American Statistician -lehden pääkirjoitus uusimmassa numerossaan, jonka kaikki 43 artikkelia ehdottavat keinoja korvata perinteinen merkitsevyysluokittelu kehittyneemmällä päättelyllä.

Tilastollisen merkitsevyyden vastustamisen on vienyt pisimmälle sosiaalipsykologian lehti Basic and Applied Social Psychology, joka asetti vuonna 2015 ehdottoman kiellon p-arvoille sekä kaikille muillekin merkitsevyyden mitoille. Lehti julkaisee nyt ainoastaan tutkimuksia, joissa ei ole mitään viittauksia tulosten tilastolliseen merkitsevyyteen. Fysiikassa vastaava tarkoittaisi, että esim. Higgsin hiukkasen löydön varmuutta ei saisi julkaista (eli monenko sigman signaali on havaittu). Kiellon jälkeen lehden saamien viittausten määrä on yli kaksinkertaistunut ja päätoimittaja seisoo edelleen päätöksensä takana.

Mielestäni p-arvot eivät ole ongelma. Ongelma on p-arvojen väärinkäyttö ja heikko tilasto-osaaminen. Eikä p-arvon kaltaisten, merkitsevyyttä mittaavien tärkeiden tilastollisten työkalujen kielto korjaa ongelmaa.

Ei ole järkevää kieltää matematiikkaa, koska jotkut käyttävät sitä väärin. Tai lakeja, koska jotkut eivät noudata sääntöjä. Tai nettiä, koska sitä käytetään pahaan.

Parannuksia tietysti tarvitaan: Tutkimuksen julkaiseminen pitäisi olla yhtä helppoa, olipa p-arvo 0.049 tai 0.051. Isoa p-arvoa ei pidä väittää osoitukseksi, että vaikutusta ei ole. Tuloksen merkitsevyyttä ei pidä sekoittaa sen merkittävyyteen. Merkitsevyys tulee ymmärtää jatkumona, eikä p = 0.05 kaltaisen mielivaltaisen rajan pidä kategorisoida tuloksia merkitseviksi ja ei-merkitseviksi. P-arvoa ei pidä sekoittaa siihen käänteiseen todennäköisyyteen, että havaintoaineiston perusteella signaali olisi kohinaa: p = Pr(signaali | kohina) ≠ Pr(kohina | signaali).

Tilastotieteen osaamattomuuteen ei ole helppoa tai nopeaa ratkaisua. On vain vaikea ja hidas ratkaisu. Koulutus. Mutta sillä on eräs verraton etu. Se toimii.

Kommentit (14)

Eusa
Liittynyt16.2.2011
Viestejä19329
1/14 | 

Onkohan yleistä vääristymä, jossa ei käytetä symmetristä kaksisuuntaista koetta, vaikka sille olisi selvä kysyntä?

Esimerkiksi tulkitaan poikien olevan matemaattisesti tyttöjä lahjakkaampia, jos heitä on p-arvolla 4,5% enemmän matemaattisissa onnistujissa tietyn rajan yli, mutta ei huomioida, että vastaavasti heitä voi olla samalla yksisuuntaisella merkitsevyydellä ylisedustus matemaattisissa epäonnistujissa ja kaksisuuntaisen tarkastelun tulos olisikin p-arvolla 9% matemaattisen onnistumisen poikkeavuus tilastollisesti eli ei merkitsevästi. Jos pojilla olisi yliedustus onnistujissa ja epäonnistujissa p-arvolla 2%, osoittautuisi tilastollinen vääristymä todelliseksi p-arvolla 4%,  jos merkitsevyydelle asetetaan tuo 5%. Tuolloin tulkinta olisi se, että poikien matemaattinen lahjakkuus tyttöihin verrattuna on joko huippua tai heikkoa ja voitaisiin jatkotutkia mistä kummasta tuo saattaisi aiheutua.

Vääristyneellä yksisuuntaisella tarkastelulla saatetaan hyvinkin kohdistaa jatkotutkimus varsin epäoleelliseen seikkaan, kun vaihtoehtona olisi osua tavallisen epäoleelliseen seikkaan, joista sentään jokin aina silloin tällöin voi osoittautua hieman oleelliseksikin. Tiedejulkaisemisessa on havaittavissa typerysten kyyhkysparviefektiä - kun yksi säikähtää johonkin suuntaan, muut käännähtävät samaan suuntaan... :D

Hienorakennevakio vapausasteista: (1+2¹+3²+5³+1/2¹*3²/5³)⁻¹ = 137,036⁻¹

111
Liittynyt11.1.2019
Viestejä3318
2/14 | 

"Tieteelle p-arvojen 0.049 ja 0.051 välinen 0.2 prosenttiyksikön ero on yhtä mitätön kuin tavalliselle tallaajalle 4.9% ja 5.1% välinen ero sateen todennäköisyydessä "

🤔

Ikuista työntävän voiman kierrätystä äärettömässä 3 D avaruudessa joka ei todellakaan laajene tai kaareudu. Laajeneva avaruus on keisari alasti!!!

Top Essay Writing Assignment S...
9/14 | 

Finding Top Essay Writing Services and Top Essay Writing Help Online to suit all your academic requirements can be essay if you need Top Essay Writing Services Online.

Vierailija
11/14 | 

Here are 7 things you need to know about how to improve working memory, how to improve concentration and how to improve memory retention. By following the tips in this guide, you’ll start to notice the results quickly, possibly even within a few days.

Since the early 20th century, raw scores on Worldwide IQ tests have increased in most parts of the world.[68][69][70] When a new version of an IQ test is normed, the standard scoring is set so performance at the population median results in a score of IQ 100. The phenomenon of rising raw score performance means if test-takers are scored by a constant standard scoring rule, IQ test scores have been rising at an average rate of around three IQ points per decade. This phenomenon was named the Flynn effect in the book The Bell Curve after James R. Flynn, the author who did the most to bring this phenomenon to the attention of psychologists.[71][72]

Dickens and Flynn have argued that genes for high IQ initiate an environment-shaping feedback cycle, with genetic effects causing bright children to seek out more stimulating environments that then further increase their IQ. In Dickens' model, environment effects are modeled as decaying over time. In this model, the Flynn effect can be explained by an increase in environmental stimulation independent of it being sought out by individuals. The authors suggest that programs aiming to increase IQ would be most likely to produce long-term IQ gains if they enduringly raised children's drive to seek out cognitively demanding experiences.[102][103]

David Wechsler produced the first version of his test in 1939. It gradually became more popular and overtook the Stanford-Binet in the 1960s. It has been revised several times, as is common for IQ tests, to incorporate new research. One explanation is that psychologists and educators wanted more information than the single score from the Binet. Wechsler's ten or more subtests provided this. Another is that the Stanford-Binet test reflected mostly verbal abilities, while the Wechsler test also reflected nonverbal abilities. The Stanford-Binet has also been revised several times and is now similar to the Wechsler in several aspects, but the Wechsler continues to be the most popular test in the United States.[22]

Now there’s some bad news for people in the right tail of the IQ bell curve. In a study just published in the journal Intelligence, Pitzer College researcher Ruth Karpinski and her colleagues emailed a survey with questions about psychological and physiological disorders to members of Mensa IQ test . A “high IQ society,” Mensa requires that its members have an IQ in the top 2 percent. For most intelligence tests, this corresponds to an IQ of about 132 or higher. (The average IQ of the general population is 100.) The survey of Mensa’s highly intelligent members found that they were more likely to suffer from a range of serious disorders.

Kumman ottaisit, ison rahan ehkä vai pienen varmasti?

Tilastotieteessä on kaksi samankuuloista käsitettä, merkittävä ja merkitsevä. Ne eroavat toisistaan samalla tavalla kuin ison rahan mahdollisuus eroaa varmuudesta saada ylipäätään mitään rahaa. Merkittävä tarkoittaa isoa, merkitsevä varmuutta.

Käsitteiden ero on periaatteessa selvä, mutta käytännössä sen sisäistäminen on vaikeaa. Viimeistään tilastokurssien opettajana olen tuon vaikeuden huomannut. Samankuuloinen nimi vain lisää käsitteiden sekaantumisen vaaraa.

Kuten yleensä, havainnollistavat esimerkit helpottavat oppimista.

Esimerkiksi halutaan luotettavasti selvittää kumpi kaksosista, Matti vai Teppo, on painavampi. Yksi punnitus ei riitä, koska mittaamiseen liittyy monia virhelähteitä. Vaa'an lukema heittelee. Kehon nestemäärä vaihtelee. Maha, rakko ja suolisto ovat välillä tyhjänä, välillä täynnä. Jos vaaka näyttää Matille 89 kg ja Tepolle 90 kg, ero voi johtua silkasta sattumasta.

Ratkaistaan ongelma punnitsemalla Matti ja Teppo satunnaisina hetkinä samanaikaisesti kymmenen kertaa. Vaaka antaa Matin lukemiksi 88.9, 90.2, 91.0, 88.5, 88.8, 90.0, 87.5, 88.6, 88.6, ja 90.3 kg ja Tepon vastaaviksi lukemiksi 90.2, 91.2, 92.0, 88.2, 91.2, 88.3, 93.1, 90.7, 90.0 ja 92.0 kg. Pelkästään mittaussarjoja tuijottamalla painavuusjärjestys ei ratkea: kymmenen punnituksen sarjassa painavampi on välillä Matti, välillä Teppo. Tarvitaan tilastotiedettä.

Matin mittausten keskiarvoksi saadaan laskemalla 89.2 kg ja Tepon vastaavasti 90.7 kg. Tepon keskiarvo on siis 1.5 kg suurempi kuin Matin, ja tässä tapauksessa ero on tilastollisesti merkitsevä: kymmenen samasta normaalijakaumasta arvotun numeroparin välille ainoastaan 4% tapauksissa sattuu vähintään yhtä suuri keskiarvojen ero kuin Matin ja Tepon mitatuissa painoissa.

Vaikka mitattu keskiarvojen ero painossa on merkitsevä, se ei ole tässä merkittävä, sillä prosentin suuruusluokan ero painossa ei käytännössä vaikuta: silmin sitä ei havaitse, terveyttä se ei ratkaise ja samat vaatteet sopivat.

Mittauksista voidaan siis melko varmasti päätellä, että Teppo on painavampi kuin Matti, mutta ero on pieni. Ero on merkitsevä, muttei merkittävä, tilastotieteen kielellä ilmaistuna.

Entäs sitten Matti ja Seppo, joiden painot on mitattu samanaikaisesti vain kahtena satunnaisena hetkenä. Matin vaakalukemat ovat 92.9 ja 87.1 kg, Sepon vastaavasti 97.1 ja 102.9 kg. Painon keskiarvoksi tulee Matilla 90 kg, Sepolla 100 kg.

10 kg ero painossa olisi jo merkittävä: Seppo olisi silminnähden paksumpi kuin Matti, Sepon terveysriskit olisivat suuremmat eivätkä Matille istuvat vaatteet sopisi Sepolle.

Vaikka mittausten välinen ero on merkittävä, se ei kuitenkaan ole tässä tilastollisesti merkitsevä. Nimittäin kahden samasta normaalijakaumasta arvotun numeroparin välille sattuu jopa kerran kolmesta tapauksesta vähintään yhtä suuri ero kuin Matin ja Sepon mitatuissa painoissa.

Näiden kahden mittauksen perusteella ei voida siis luotettavasti päätellä, että Seppo olisi Mattia painavampi.

Mitä suurempi otos, eli enemmän mittauksia, sen pienemmät erot tulevat merkitseviksi. Suuri otos erottelee siis herkemmin kuin pieni otos. Matin ja Tepon pieni ero painossa näkyi kymmenellä mittauksella, mutta Matin ja Sepon mahdollisesti suurtakaan eroa ei saatu kahdella mittauksella varmennetuksi. Lisämittaukset voisivat paljastaa, oliko Matin ja Sepon mittausten ero todellinen vai sattuman oikkua. Mitä suurempi todellinen ero, sen vähemmän mittauksia eron havaitsemiseen tarvitaan.

Matin ja Tepon esimerkissä merkitsevä ei ole merkittävä, ja Matin ja Sepon esimerkissä merkittävä ei ole merkitsevä. Valitsin esimerkit vakuuttaakseni, että merkittävä ja merkitsevä todella ovat erilliset käsitteet. On toki tapauksia, joissa tutkimuksessa havaittu ero on sekä merkitsevä että merkittävä, ja tapauksia joissa se ei ole kumpaakaan (joista julkaisuvinouman takia tosin harvemmin kuullaan). 

Merkittävän ja merkitsevän sekoittaminen aiheuttaa jatkuvasti ongelmia ja sekaannuksia tutkimuksista uutisoitaessa ja jopa tutkijoiden välisessä kommunikaatiossa. Lääke ei auta merkittävästi vain siksi, että sen teho on merkitsevä. Lisäksi yhdessä tutkimuksessa merkitseväksi havaittu ilmiö ei välttämättä ole seuraavassa tutkimuksessa enää edes merkitsevä, mutta se on jo kokonaan toinen tarina.

Kohulla elävän toimittajan näppäimistöllä tutkimusjulkaisun merkitsevä kääntyy helposti tiedeuutisessa merkittäväksi: kun tutkija sanoo pieni, toimittaja kuulee iso. Tosin nykyään, kun tutkijatkin joutuvat elämään yhä enemmän kohulla, syy ei ole välttämättä toimittajan. Ovelimmat tutkijat voittavat mediapelissä keinoilla, joilla voisi pärjätä jopa politiikassa. Tieteen alistaminen vapaiden markkinoiden kiihkeälle kilpailulle tuottaa kaikenlaista jännää.

Kenellepä ei kelpaisi iso raha varmasti.

Kommentit (4)

Vierailija
1/4 | 

Matti ja Seppo -tapaus on taas yksi matematiikan esimerkki, jossa matematiikka ja todellisuus eivät ole yhteensopivia.  Olisi erittäin omituista, jos henkilön painossa olisi yli 10% virhemarginaali. Tilastotieteessä sellainen varmasti on täysin mahdollista, mutta käytännössä ei. Tuollainen arkijärjen vastainen esimerkki vain hämmentää asiaa opettelevaa ja johtaa ajatukset harhapoluille, kun tarkoitus oli selventää asiaa.

Mieleen muistuu Mind you decisions -Youtube-kanavan matemaattinen laskutehtävä, jossa kadunaurauskone saavutti valonnopeuden, kun lumen määrä väheni lähelle nollaa.

VH
2/4 | 

Jaan Tepon huolen täysin esim. tutkimusrahoitukseen liittyvästä epäterveestä kilpailusta, joka pitkälti määrittää nykyään kuka Suomessa tutkimusta ylipäätään tekee. Miksi meidän "eturivin" tieteentekijät eivät ota asiaa esiin julkisuudessa suuremmalla intensiteetillä vai ovatko he itse pääosin hyötyjien joukossa?

Cargo (ei kirj.)
3/4 | 

"Vanha sanonta, jonka mukaan naiset ovat kiinnostuneempia ihmisistä, miehet asioista, kuitataan usein seksistisenä kliseenä."

Miesten aivot ovat "autistisemmat" kuin naisten, ja tuo sellainen tekiä, joka karsii jyvät akanoista, kun istutaan alas ja yritetään rakaista matemaattista ongelmaa. Mielikuvituksellisia ideoita voi heitellä ilmoille kuka tahansa, mutta syvällinen ajattelu ja ylikeskittyminen ei luonnistu kaikilta.

Voi siis hyvin miettiä, että löytyykö paljonkin sellaisia esimerkkejä, joissa nainen on rakentanut yksin ison osan kokonaan uutta teoriaa? Millä todennäköisyydellä esim. David Hilbert tai Shinichi Mochizuki saattaisivat olla naisia vain saavutusten perusteella? Kyllä suuriin saavutuksiin tarvitaan miehistä testosteronia ja kykyä ylikeskittyä.

Seuraa 

Rajankäyntiä

Teppo Mattsson on kosmologiaan ja suhteellisuusteoriaan erikoistunut teoreettisen fysiikan tutkija, joka harrastaa matkailua tieteenalojen välisillä rajaseuduilla. Blogi on matkakertomus näiltä retkiltä.

Teemat

Blogiarkisto

Kategoriat