Virhemarginaali on toinen nimitys tilastolliselle luottamusvälille.

Sana on suomennos englanninkielen termistä margin of error, jota käytetään usein rinnan confidence interval -termin kanssa.

Luottamusväli kertoo otostutkimuksissa, mille välille otoksesta lasketut tunnusluvut todennäköisesti asettuvat tutkittavassa perusjoukossa. Tunnusluvut voivat olla esimerkiksi perusjoukkoa kuvailevia kokonaismääriä, keskiarvoja ja prosenttiosuuksia.

Luottamusvälin perusta on todennäköisyyslaskennassa. Yleisimmin käytetään 95 prosentin todennäköisyydelle laskettuja luottamusvälejä. Esimerkki valaiskoon, mitä tämä tarkoittaa.

Helsingin Sanomat kertoi 2. 1. 2008 teettämästään haastattelututkimuksesta, jonka mukaan 78 prosenttia pääkaupunkiseudun 18 vuotta täyttäneistä asukkaista on sitä mieltä, että roskaamisesta tulisi voida sakottaa.

Vastaajia oli 1 000, ja virhemarginaaliksi ilmoitettiin 3 prosenttiyksikköä suuntaansa. Se merkitsee, että 95 prosentin todennäköisyydellä tätä mieltä on 75–81 prosenttia pääkaupunkiseudun kansalaisista.

Virhemarginaalin suuruuteen vaikuttavat otosasetelma, otoskoko ja tutkittavan tunnusluvun tilastollinen jakauma. Normaalisti esimerkiksi otoksen koon kasvu pienentää virhemarginaalia.

HS kertoi poimittaneensa haastateltavat ”monivaiheisena ositettuna otantana” selittämättä sitä tarkemmin. Koska vastaamatta jättäneiden määrästä ei ole tietoa, laskelman tarkastaminen on hankalaa. Yksinkertainen satunnaisotanta tuottaisi joka tapauksessa hiukan kapeamman luottamusvälin olettaen, että vastauskato oli hyvin pieni ja satunnainen.

Luottamusväli ja virhemarginaali perustuvat siis otosten poiminnasta aiheutuvaan satunnaisvaihteluun, joka ei sanan varsinaisessa mielessä ole virhettä, vaan kuvaa saadun tiedon tarkkuutta. Tiedon keruun ja käsittelyn aikana havaintoaineistoon vaikuttavat kuitenkin monet virhelähteet, kuten kysymysten muotoilu, käsitteiden monitulkintaisuus, tutkimuksen tekoaika, vastaajien valikoituminen, taipumus vastata sosiaalisesti suotavalla tavalla ja vastaamatta jättäneiden määrä. Nämä saattavat tuottaa tuloksiin aitoa virhettä eli harhaa, jota virhemarginaali ei kata.


Julkaistu Tiede-lehdessä 3/2008

Sisältö jatkuu mainoksen alla

Vastaaja:


Jussi Melkas


kehityspäällikkö


Tilastokeskus

Sisältö jatkuu mainoksen alla
Sisältö jatkuu mainoksen alla