nopanheiton todennäköisyydet

Seuraa 
Viestejä45973
Liittynyt3.9.2015

Oletetaan että "onnistuminen" on se kun saadaan silmäluvuksi yksi. Kysymys kuuluukin: "monennellako heitolla saadaan tuo silmäluku".

Aivan ensimmäiseksi laskin eri heittomäärien todennäköisyydet binomijakauman kaavalla. Odotusarvoksi tuli kuusi heittoa, kuten odottaa sopii. Sitä pienemmillä ja suuremmilla heittomäärillä todennäköisyys laskee hyvin jyrkästi. Suuremmassa suunnassa P lähenee nollaa. Jatkoin näiden laskemista n=30 saakka. Sitä suuremmilla luvuilla P ei juurikaan muutu.

Sen jälkeen lähdin simuloimaan näitä heittoja open officella. Yllätyin kovasti, kun yhden heiton onnistumisia tuli aivan liian paljon. Tarkistin laskennat moneen kertaan, mutten millään keksi mikä mättää.

Tein silmälukujen ja onnistumiseen vaadittujen heittojen määristä histogrammit frekvenssien avulla. Havaitsin heittojen silmälukujen jakautuneen melko tasaisesti, mutta itse onnistumiseen vaadittujen heittojen määrä ei noudattanut riittävän hyvin tilanteen teoreettista mallia. Itse heittojen generointi ilmeisesti toimii moitteettomasti, mutta jotain outoa tapahtuu sen jälkeen.

Laskennan teknisistä yksityiskohdista ja kaavoista voi kertoa tarvittaessa enemmän, jottei tästä postauksesta tule aivan tolkuttoman pitkää.

Sivut

Kommentit (30)

Vierailija
Tetrafuran
Oletetaan että "onnistuminen" on se kun saadaan silmäluvuksi yksi. Kysymys kuuluukin: "monennellako heitolla saadaan tuo silmäluku".
Radikaali virhe tuossa on se, että ei voida millään matematiikan keinolla vastata tuohon kysymykseen. Todennäköisyys ykköselle on joka kerralla sama, eikä se muutu toistojen myötä. Sen sijaan todennäköisyyslaskenta ei voi vastata tuohon kysymykseesi.

Ronron
Seuraa 
Viestejä9265
Liittynyt10.12.2006

Se voi tulla vaikka ensimmäisellä. Keskimäärin taitaa tulla kuudennella, jos aina aloittaa alusta kun se ykkönen tulee.

くそっ!

Vierailija

Ehken ole tajunnut mitä haet mutta luulen, että montako heittoa tarvitaan, jotta todennäköisyydellä 0,5 on saatu silmäluku 1. Joka heitollahan todennäköisyys on 1/6 saada 1 ja 5/6 saada jokin muu. Mitä useampi heitto sitä suurempi todennäköisyys jotta on saatu silmäluku 1. Todennäköisyys ettei kuudella heitolla saada vielä kertaakaan 1 on (5/6)^6 = 0,335. Todennäköisesti 4 heittoa riittää.

Vierailija

Jos oletetaan, että noppa on symmetrinen, niin tilanne noudattaa geometrista jakaumaa. Olkoon satunnaismuuttuja X = silmäluvun yksi ensimmäinen esiintymiskerta, jolloin X ~ Geom(1/6). Tällöin odotusarvo E(X) = 1/(1/6) = 6 eli keskimäärin ensimmäisen kerran silmäluku yksi saadaan kuudennella heitolla.

Vierailija

Jos heitellään jatkuvasti niin tottakai saadaan keskimäärin joka kuudennella heitolla ykkönen. Mutta kun aloitetaan, ensimmäinen heitto voi olla missä hyvänsä kohdassa tätä kuuden heiton keskimääräistä jaksoa ja siksi se ensimmäinen ykkönen saadaan todennäköisyydellä puoli jo neljännellä heitolla. En tiedä kuinka tuon voisi testata.

Vierailija

Kokeilin simuloida tietsikalla ja kyllä se tulee keskimäärin kuudennella heitolla. kaipa tuo keskimääräisyys sitten vaatii todennäköisyyden 1 - 0,335 = 0,665 eli noin 2/3. En ole kyllä todennäköisesti mikään todennäköisyyksien ekspertti.

Vierailija

Kokeilin vielä todennäköisyksiä simuloimalla noppaa ja kyllä se noin näyttää menevän. Eli todennäköisyys että n heitolla saadaan silmäluvuksi 1 ainakin kerran on 1 - (5/6)^n. Kokeilemalla saa juuri tuon mukaiset todennäköisyydet. Se että keskimääräinen tulos saadaan todennäköisyydellä 0,665 oli minulle uutta.

Vierailija
Tetrafuran
Oletetaan että "onnistuminen" on se kun saadaan silmäluvuksi yksi. Kysymys kuuluukin: "monennellako heitolla saadaan tuo silmäluku".



Äärettömän monella heitolla onnistuu varmasti tuon ykkösen heitto. Mikään äärellinen heittojen määrä ei välttämättä riitä.

Noin 51.7 % todennäköisyydellä viimeistään neljännellä heitolla tulee ykkönen.

Välillä sitten meneekin huomattavasti enemmän heittoja, joten keskimäärin tarvitaan 6 heittoa.

Vierailija
Tetrafuran
Oletetaan että "onnistuminen" on se kun saadaan silmäluvuksi yksi. Kysymys kuuluukin: "monennellako heitolla saadaan tuo silmäluku".



Olkoon Tapahtuma: A = "silmäluku on 1"

Perusjoukko: E = {1,2,3,4,5,6}

Olkoon:

Perusjoukon E alkeistapausten lukumäärä: n(E) = 6

ja

Tapahtumalle A suotuisten alkeistapausten määrä: n(A) = 1 (tai n(silmäluku on 1) = 1)

Tapahtuman A klassinen todennäköisyys: P(A) = n(A) / n(E) = 1/6 = n. 0,167

Voisi toki kuvitella että noppaa on heitettävä kuusi (6) kertaa, jotta saataisiin yksi mutta todennäköisyyksissä on mielenkiintoista se että ei voida koskaan olla varmoja milloin tapahtuma tapahtuu.

Mitä enemmän noppaa heitetään sitä lähemmäksi päästään klassista todennäköisyyttä, todellisuudessa emme pääse koskaan klassiseen todennäköisyyteen.
Jos noppaa heitettäisiin ääretön kertaa olisi jokaisen nopan silmäluvun lukumäärä yhtä suuri, sillä jokaisen nopan silmäluvun klassinen todennäköisyys on sama 1/6.

Toisaalta jokaisella heitolla on aivan yhtä suuri todennäköisyys saada nopan silmäluvuksi 1, sillä jokainen heitto on yksittäinen tapahtuma eikä edellinen heitto voi vaikuttaa seuraavaan mitenkään.

Eli emme voi mitenkään taata millä heitolla todennäköisyys on 1 että silmäluku on 1!

Vierailija

Taidanpa hieman selventää simulointitapahtumaa. Seuraavien sarakkeiden pituus on jotain yli 900 riviä. Onpahan riitävän iso otanta.

Sarakkeella A toistetaan seuraavaa. kaavaa
=TRUNC(RAND()*6)+1
rand funktio arpoo satunnaislukuja, jotka kerrotaan kuudella, ja sekaan plussataan yksi. Tällöin muodostuu lukuja 1,000...6,999 välillä. Niistä leikataan desimaalit pois jolloin päästää mielestäni hyvään noppasimulaatioon. Olen tutkinut tämän työvaiheen luotettavuutta histogrammilla, keskiarvolla ja keskihajonnalla. Keskihajonta pyörii 1,7 molemmin puolin ja keskiarvo on siinä 3,5 paikkeella.

B sarakkeelle laitoin if lausekkeen, jonka tehtävänä on laskea monennellako heitolla saatiin silmäluku 1. Käytin funktiota =IF(A5=1;1;B5+1) edellinen heitto oli 1, ilmoitetaan seuraavalle heitolla lukumääräksi 1, mikäli taas edellinen heitto on jotain muuta, kuin yksi kasvatetaan edellisen heiton järjestyslukua yhdellä. Selvällä suomenkielellä tämä kaava siis laskee monesko heitto on kyseessä ja kun ykkönen saaadaan, aloitetaan laskut alusta.

Sarakkeen C nimesin poimintasarakkeeksi, koska siinä kaava =IF(A5=1;B5;"") poimii edellisen sarakkeen heittomäärän, mikäli on saatu silmäluku yksi. Muutoin kaava näyttää tyhjää. Tyhjää arvoa seuraava frekvenssikaava ei käsittääkseni tulkise lainkaan.

D sarakkeelle laitoin frekvenssejä varten eri luokat. 1...40 Yli neljäkymmentä heittoa onnistumisen odottelu on jo häviävän epätodennäköistä, joten tuo riittänee. Tämäkin luku on valittu ilman kummempia matemaattisia perusteluja. Koulussa tietysti tuonkin olisi joutunut valitsemaan jotenkin neljän sigman päästä tai jotain.

Sarakkeelle E laitoin frekvenssikaavan, johon syötettiin class kohtaan D sarakkeen asiat ja data kohtaan poimintasarake C. Viimeinen sarake F tuottaa samalla tavalla frekvenssit itse nopanheitoista.

E ja F sarakkeista tein kuvaajat. Heitot eli F toimii kuten odottaa sopii. "Monesko heitto on ykkönen" -sarake sensijaan tuottaa aivan liian paljon onnistumisia yhdellä, kahdella ja kolmella heitolla. Toivottavasti tästä saatte hieman osviittaa, missä on menty vikaan.

Satuinpa katsomaan geometrisen jakauman sivuja ja huomasin tuon kuvaajan. Se näyttää likimain samalta kuin minun E sarakkeen frekvensseistä väsätty kuvaaja.

Vierailija
Tetrafuran
Yllätyin kovasti, kun yhden heiton onnistumisia tuli aivan liian paljon. Tarkistin laskennat moneen kertaan, mutten millään keksi mikä mättää.



Jos kertoisit että paljonko noita yhden heiton onnistumisia prosentuaalisesti oli, sekä toistojen kokonaismäärän, niin olisi helpompaa lähteä miettimään että missä vika mahdollisesti piilee?

EDIT:

Yhden heiton onnistumisia pitäisi siis olla noin 16,7%.

Vierailija

Todennäköisyys, että tietyn silmäluvun saa juuri n.ellä heitolla, on (1/6)*(5/6)^(n-1). Todennäköisintä on siis saada se juuri ensimmäisellä heitolla eli 1/6, toisella siis hieman pienempi eli 5/36 jne. Jotta ensimmäisen ykkösen saisi vasta 40:ellä heitolla todennäköisyys on luokkaa puoli promillea. Todennäköisys saada se ykkönen juuri tietyllä heittokerralla laskee jatkuvasti heittokertojen kasvaessa. Mikä se on, joka ensin kasvaa kuudenteen heittokertaan ja sitten alkaa laskea?

tli
Seuraa 
Viestejä1057
Liittynyt11.11.2005
korant
Todennäköisyys, että tietyn silmäluvun saa juuri n.ellä heitolla, on (1/6)*(5/6)^(n-1). Todennäköisintä on siis saada se juuri ensimmäisellä heitolla eli 1/6, toisella siis hieman pienempi eli 5/36 jne. Jotta ensimmäisen ykkösen saisi vasta 40:ellä heitolla todennäköisyys on luokkaa puoli promillea. Todennäköisys saada se ykkönen juuri tietyllä heittokerralla laskee jatkuvasti heittokertojen kasvaessa. Mikä se on, joka ensin kasvaa kuudenteen heittokertaan ja sitten alkaa laskea?



Tuo on kyllä jokin hihasta ravistettu kaava, eikä se missään tapauksessa kerro, mikä on todennäköisyys saada jokin tietty silmäluku heittokerralla n. Se kertoo yksinkertaisesti sen, että jos jonkin tapahtuman todennäköisyys on ensimmäisellä kerralla 1/6 ja sen jälkeen 5/6, niin mikä on todennäköisyys, että tämä tapahtuma esiintyy jokaisella heittokerralla, kun heittokertoja on n kappaletta.

Tämä on minusta selvää omilla vähäisilläkin todennäköisyyslaskentatiedoillani. Luku muuten myös pienenee alusta lähtien, eikä kasva kuuteen saakka, minkä jälkeen se rupeaisi pienenemään.

Epäilen, onko olemassakaan mitään kaavaa, millä tuollainen asia voitaisiin laskea, sillä todennäköisyyslaskennassa ratkotaan kyllä kysymyksiä siitä, kuinka suurella todennäköisyydellä jokin tulema esiintyy tietyssä joukossa tapauksia. Itse asiahan on kyllä muutenkin itsestäänselvä, sillä jonkin tietyn silmäluvun esiintymistodennäköisyys jokaisella heittokerralla on 1/6. Todennäköisyyslaskenta astuu kuvioihin, kun arvioidaan sen esiintymistä ainakin kerran tai useammin tietyssä heittojen joukossa.

Vierailija

En ravistele kaavoja hihasta ja varsinkaan näin simppeliä ei tarvitse mistään kaivaa. Kerroin kyllä tarkalleen mitä kaavalla tarkoitan ja olet sen viestiisi lainannut mutta et näköjään ymmärtänyt. Onko sitten selvempää sanoa, että kyseisellä todennäköisyydelä jokin silmäluku saadaan vasta sillä heittokerralla. Silmäluvut ovat symmetrisellä arpakuutiolla yhtä todennäköisiä joten voit valita vapaasti mitä silmälukua vahtaat. Viestin lopussa kysyin (viestiketjun aloittajalta), mikä on se joka alussa kasvaa ja kuudennen heiton jälkeen alkaa taas pienentyä enkä suinkaan väitä että kaavan antama todennäköisyys näin menisi. Kyllähän siitä jokainen numerot ja peruslaskutoimitukset ymmärtävä tajuaa että se pienenee n:n kasvaessa.
Mutta ilmeisesti alkujaan on haettu todennäköisyyttä, monenko heiton jälkeen saadaan ensimmäinen ykkönen. Koska se saadaan keskimäärin joka kuudennella heitolla niin tämä todennäköisyys on siinä maksimissaan (kai) ja pienenee sen jälkeen. Saadaan kaiketi niiden kahden esittämäni kaavan tulona mutten ole varma.
Laskeskelin vähän ja tuommoisia todennäköisyyksiä tulee:
1 2,31 %
2 3,54 %
3 4,06 %
4 4,16 %
5 4,01 %
6 3,71 %
7 3,35 %
8 2,97 %
9 2,60 %
10 2,26 %
11 1,94 %

Tämän mukaan tietty silmäluku saadaan siis todennäköisimmin neljännellä heittokerralla. Tämänhän voi vielä tarkistaa simuloimalla.

Edit: höpö höpö
Siis edelleen jää kysymykseksi mikä on se alkujaan teoreettisesti saatu juttu joka aluksi kasvaa ja sitten alkaa kuudennen heiton jälkeen pienentyä. Jos kokeilee monennellako heitolla saa ykkösen niin saa seuraavat todennäköisyydet jotka ovat siis juuri kaavan 1/6 * (5/6)^(n-1) mukaiset:
n 1/6*(5/6)^(n-1)
1 16,67 % 16,595
2 13,89 % 13,817
3 11,57 % 11,574
4 9,65 % 9,716
5 8,04 % 8
6 6,70 % 6,733
7 5,58 % 5,641
8 4,65 % 4,597
9 3,88 % 3,877
10 3,23 % 3,242
11 2,69 % 2,702
12 2,24 % 2,163
13 1,87 % 1,807
14 1,56 % 1,58
15 1,30 % 1,289
16 1,08 % 1,114
17 0,90 % 0,864
18 0,75 % 0,781
19 0,63 % 0,629
20 0,52 % 0,524
21 0,43 % 0,467
22 0,36 % 0,392
23 0,30 % 0,314
24 0,25 % 0,269
25 0,21 % 0,194
26 0,17 % 0,18
27 0,15 % 0,157
28 0,12 % 0,138
29 0,10 % 0,112
30 0,08 % 0,096
31 0,07 % 0,075
Taulukosa on ensin teorettinen arvo ja sitten simuloimalla saatu (noin 600 000 heittoa).

tli
Seuraa 
Viestejä1057
Liittynyt11.11.2005
korant
Viestin lopussa kysyin (viestiketjun aloittajalta), mikä on se joka alussa kasvaa ja kuudennen heiton jälkeen alkaa taas pienentyä enkä suinkaan väitä että kaavan antama todennäköisyys näin menisi. Kyllähän siitä jokainen numerot ja peruslaskutoimitukset ymmärtävä tajuaa että se pienenee n:n kasvaessa.

Mutta ilmeisesti alkujaan on haettu todennäköisyyttä, monenko heiton jälkeen saadaan ensimmäinen ykkönen. Koska se saadaan keskimäärin joka kuudennella heitolla niin tämä todennäköisyys on siinä maksimissaan (kai) ja pienenee sen jälkeen. Saadaan kaiketi niiden kahden esittämäni kaavan tulona mutten ole varma.




Edit: Kirjoitin tuossa alla pitkät pätkät aika itsestäänselviä todennäköisyyslaskennan perusteita, joista pidän kyllä edelleen kiinni, joten en viitsi sitä poistaa. Kuitenkin, kun viestin lopussa aloin esittelemään, miten simulaatio tulisi tehdä, niin mieleeni juolahti, että tulosten joukosta kyllä voi poimia ne tapaukset, joissa tietty tulema esiintyy vaikkapa vasta neljännellä heittokerralla, jolloin tapausten esiintymistiheys voidaan laskea ja saada todennäköisyys ko. tapauksille.

Voi siis olla, että kehitelmässäsi sittenkin on jotain järkeä tässä nimenomaisessa erityistapauksessa, jolloin kysytään ensimmäisen esiintymisen todennäköisyyttä jollain tietyllä heittokerralla. Tällöinhän riippumattomuusoletuskaan ei olisi enään voimassa, koska sitä rajoittaisi se, että aiemmilla kerroilla ko. tulemaa ei ole esiintynyt, kuten olisi pitänyt. Tämä oli ainakin minulle hieman uusi näkökulma.

Vahvennan nämä jälkikäteiskommentit, jotta ne erottuvat alkuperäisestä tekstistä.

Tuota noin, yritetään käydä ajatuksella läpi kaikessa rauhassa tätä kaavaa 1/6*(5/6)^(n-1).

Kaavassa ilmeisesti sovelletaan peräkkäisten toisistaan riippumattomien tapausten kertolaskusääntöä. Tutkittaessa kahta vaihtoehtoa, säännöllä saadaan laskettua, mikä on todennäköisyys, että toinen vaihtoehto esiintyy joka kerta n:ssä tapauksessa. Esim. jos halutaan laskea vaikkapa tässä noppaesimerkissä, että jokaisella vaikkapa 6 heitolla saadaan sama silmäluku, vaikkapa ykkönen, niin se saadaan kaavalla:

(1/6)^6 = 0,000021

Tämähän lienee selvää aiempien viestiesi mukaan myös sinulle. Mutta jos tätä kaavaa ruvetaankin kertomaan toisen vaihtoehdon todennäköisyydellä, tässä tapauksessa 5/6:lla, niin lopputuloksella ei ole enään mitään järkevää tulkintaa eli se ei enään merkitse mitään, koska kertolaskusäännön soveltamisessa on tehty virhe. Toisen vaihtoehdon peräkkäisten todennäköisyyksien laskemiseen ei voi sotkea vastakkaisen vaihtoehdon todennäköisyyttä.

Siis tarkasteltavan kaavan osa (5/6)^(n-1) kertoo sen, kuinka suurella todennäköisyydellä tutkittava silmäluku ei esiinny (n-1) -heittokerralla, siis millä todennäköisyydellä vastakkaisen vaihtoehto eli joku muu silmäluku toteutuu jokaisella heitolla, joita on (n-1) kpl. Tätä ei voi kertoa toisen vaihtoehdon todennäköisyydellä 1/6, sillä tulos ei silloin kerro enään mitään.

Esitän lyhyesti, miten minun mielestäni näitä vaihtoehtoisia todennäköisyyksiä tulisi käsitellä. Ajatellaan, että noppaa heitetään vaikkapa 40 kertaa. Tällöin todennäköisyys, että saatu noppaluku on joku muu kuin vaikkapa 2, on siis

(5/6)^40 = 0,00068

Silloin todennäköisyys, että 40 joukon heitossa esiintyy ainakin kerran silmäluku 2 on 1 - 0,00068 = 0,99932 (Tämä kaava taisi kyllä vilahtaa myös jossain omassa viestissäsi). Saatu todennäköisyys ei kuitenkaan kerro yhtään mitään siitä, monennellako heittokerralla se esiintyy, vaan se kertoo vain, että on noinkin varmaa, että 40 heiton joukossa se esiintyy ainakin kerran. Kerta voi olla ensimmäinen tai seitsemäs tai kolmaskymmenes, siis mikä tahansa. Tämäkin todennäköisyys kasvaa koko ajan, eikä rupea pienemään 6:nnen heittokerran jälkeen.

Tästä ei voi mitenkään päätellä sitäkään, mikä on heiton 41 silmäluku, sillä koska tapaukset ovat toisistaan riippumattomia, niin jokaisella yksittäisellä heitolla vaihtoehtojen todennäköisyydet ovat 1/6 ja 5/6. Koko laskenta perustuu siihen, että yksittäiset heittokerrat ovat toisistaan riippumattomia. Jos näin ei olisi, kaikkien esitettyjen laskelmien perusteet romahtaisivat, eikä niitä voitaisi enään perustellusti tehdä.

Todennäköisyyslaskennassa tutkitaan siis kuinka monta tiettyä tulemaa esiintyy jossain tapahtumien joukossa, eikä sitä missä tarkassa järjestyksessä ne esiintyvät.

Noihin simulointeihin en oikein usko, koska viestissä jää epäselväksi, miten ne on tarkasti ottaen tehty. Katsotaan nyt kuitenkin vielä yksinkertainen laskentaesimerkki ja miten sitä tulisi simuloida.

Ketjussa puhuttiin aiemmin 4 heiton tapauksesta. Jos lasketaan, kuinka suurella todennäköisyydellä 4 heittokerralla ei esiinny tulemaa 2, niin sehän saadaan yksinkertaisesti:

(5/6)^4 = 0,482253

Se taas, mikä on todennäköisyys, että tulema 2 esiintyy ainakin kerran 4 heiton joukossa on 1 - 0,482253 = n. 0,52 eli todennäköisyys ylittää 50 %, jolloin voidaan sanoa todennäköiseksi, että tulema 2 esiintyy 4 heiton joukossa, mutta sehän voi esiintyä tuolla todennäköisyyydellä missä tahansa kohtaa heittosarjaa. Tämä kait on itsestään selvää Korantillekin.

Simulaatiossa näitä 4 heiton sarjoja tulisi tehdä mahdollisimman monta, vaikkapa 100000. Näistä sarjoista 52 % tulisi olla sellaisia, että niissä esiintyy tulema 2. Se taas, millä heitolla sarjan 4 heitosta 2 esiintyy, jakautuu taas tasaisesti heittoihin 1-4, siis todennäköisyys ei kerro järjestystä.

Edit: Tässä kohdassa tulin siis hieman epävarmaksi, koska oivalsin, että simulaation tuloksista voidaan poimia ne tapaukset, joissa tulema 2 tulee vasta neljännellä heittokerralla, jolloin sille on mahdollista laskea simulaatioon perustuva todennäköisyys.

Sivut

Uusimmat

Suosituimmat