Virhemarginaali

Seuraa 
Viestejä45973
Liittynyt3.9.2015

On vaalit missä 1900:lta kysytään mitä puoluetta kannattavat. Virhemarginaaliksi suurien puolueiden kohdalla sanotaan ±2 prosenttiyksikköä.

Nyt jos oletetaan, että puolue A:n kannatukseksi ilmoitetaan 25.0 prosenttiyksikköä. Eikös tuolloin kannatus ole ilmeisimmin jotain väliltä 23-27 prosenttiyksikköä?

Omaisivatko tuossa esim. 23.n tai 25:n prosenttiyksikön todelliset kannatukset saman todennäköisyyden vai onko 25 prosenttiyksikköä todennäköisempi tulos?

Jos on eroa todennäköisyyksissä, niin miten tuollainen laskettaisiin? (jos jäi jotain oleellista tietoa mainitsematta, niin kenties voi lisätä oman esimerkkitiedon)

Kommentit (6)

Vierailija

Tästä tulikin koominen vaali-gallupi mieleen rapakon takaa. Siellä BBC:n toimittaja selitti ihan tosissaan tuloksia jotka oli saatu haastattelemalla 800 ameriikkalaista äänestäjää.

Tulos oli 47% Gorelle ja 49% Bushille. Virhemarginaali oli 1 prosentti-yksikkö!!!!!!!!!

Ajatella: Jokaisessa 52 osavaltiossa oli haastateltu 16 asukasta ja sillä saatiin iiiihan täsmällisiä tuloksia.

Tähän ei kykene Suomalaiset: Haastatellaan 12 äänestäjää ja tehdään sen pohjalta tutkimus. Voi jee

Vierailija
Kimnice
Nyt jos oletetaan, että puolue A:n kannatukseksi ilmoitetaan 25.0 prosenttiyksikköä. Eikös tuolloin kannatus ole ilmeisimmin jotain väliltä 23-27 prosenttiyksikköä?

Kyllä, mutta ainoastaan kyseisen gallupin mukaan. Lisäksi pitäisi tietää otannasta esim. vastaajien ikäjakaumaa ja maantieteellistä jakaumaa että saadaan edes jollain tapaa perusteita väittää lukuja oikeudenmukaisiksi.

Kimnice
Omaisivatko tuossa esim. 23.n tai 25:n prosenttiyksikön todelliset kannatukset saman todennäköisyyden vai onko 25 prosenttiyksikköä todennäköisempi tulos?

Jos vertailtavat arvot mahtuvat vihremarginaalin sisään, ei niitä voi sen tarkemmin vertailla noilla tiedoilla.

Vierailija
A. Ankka

Jos vertailtavat arvot mahtuvat vihremarginaalin sisään, ei niitä voi sen tarkemmin vertailla noilla tiedoilla.

Mitä tietoja pitäisi saada? Jos oletetaan, että tuossa tutkimuksessa oli sen verran tasavertainen 1900:n hengen otos, että tuli hyvin edustettua eri ihmisryhmät eripuolella maata.

Vierailija
Kimnice
On vaalit missä 1900:lta kysytään mitä puoluetta kannattavat. Virhemarginaaliksi suurien puolueiden kohdalla sanotaan ±2 prosenttiyksikköä.

Nyt jos oletetaan, että puolue A:n kannatukseksi ilmoitetaan 25.0 prosenttiyksikköä. Eikös tuolloin kannatus ole ilmeisimmin jotain väliltä 23-27 prosenttiyksikköä?


Tässä tapauksessa tulos siis tarkoittaisi sitä, että äänestäjien keskuudessa puolueen kannatus on välillä 23-27% tietyllä todennäköisyydellä (usein 95%). Olettaen, että otoksesta saadut tiedon ovat virheettömiä.

Kimnice
Omaisivatko tuossa esim. 23.n tai 25:n prosenttiyksikön todelliset kannatukset saman todennäköisyyden vai onko 25 prosenttiyksikköä todennäköisempi tulos?

Nähdäkseni 25% ei ole "todennäköisempi" tulos, se on vain luottamusvälin keskimmäinen luku, tulos mikä on saatu tällä otannalla. Mielestäni gallupin tulos "oikein" ilmoitettuna olisi siis "puolueen A kannatus on (esim.) 95% todennäköisyydellä välillä 23-27%".

Vierailija
o_0
Kimnice
On vaalit missä 1900:lta kysytään mitä puoluetta kannattavat. Virhemarginaaliksi suurien puolueiden kohdalla sanotaan ±2 prosenttiyksikköä.

Nyt jos oletetaan, että puolue A:n kannatukseksi ilmoitetaan 25.0 prosenttiyksikköä. Eikös tuolloin kannatus ole ilmeisimmin jotain väliltä 23-27 prosenttiyksikköä?


Tässä tapauksessa tulos siis tarkoittaisi sitä, että äänestäjien keskuudessa puolueen kannatus on välillä 23-27% tietyllä todennäköisyydellä (usein 95%). Olettaen, että otoksesta saadut tiedon ovat virheettömiä.

Juuri näin.

o_0
Kimnice
Omaisivatko tuossa esim. 23.n tai 25:n prosenttiyksikön todelliset kannatukset saman todennäköisyyden vai onko 25 prosenttiyksikköä todennäköisempi tulos?

Nähdäkseni 25% ei ole "todennäköisempi" tulos, se on vain luottamusvälin keskimmäinen luku, tulos mikä on saatu tällä otannalla.

Kyllä 25% on samalla todennäköisempi, kuin 23%. Kyseessähän on jatkuva jakauma, joka tämän suuruisella otannalla on jo erittäin lähellä normaalijakaumaa (oikeastaan kyseessä on Studentin t-jakauma). Näissä jakaumissa luottamusvälin keskimmäiset arvot ovat selvästi todennäköisempiä, kuin luottamusvälin reunimmaiset arvot. Pitää myös huomata, että suurempikin poikkeama tutkimuksessa on mahdollinen...

o_0
Mielestäni gallupin tulos "oikein" ilmoitettuna olisi siis "puolueen A kannatus on (esim.) 95% todennäköisyydellä välillä 23-27%".

...niin kuin tästä jo käy ilmikin. On siis 5% todennäköisyys, että kannatus poikkeaa enemmän kuin 2%-yksikköä suuntaansa.

Vierailija

Niin ja jäi vielä vastaamatta, kuinka se lasketaan.

Oletetaan, että otos on otettu parhaalla mahdollisella tavalla.

Otoskoko n=1900
Kannatus p=25%=0,25

keskihajonta s=√[p(1-p)/n]=√(0,25∙0,75/1900)≈0,009933

poikkeama d=1,96s=1,96∙0,009933≈0,0195=1,95%

mistä 1,96 tulee Studentin t-jakaumasta 95%-luottamusvälin kohdalta (kaksisuuntaisesti) vapausasteella 1899 (=n-1). Käytännössä voi näin suurella otoksella käsitellä Studentin t-jakauman asemasta jo normaalijakaumaa, mikä myös antaa saman 1,96.

Tapana ei koskaan ole ainakaan vähätellä poikkeamaa, joten

p=25,0%±2,0%

Uusimmat

Suosituimmat