Syntyykö tästä Gaussin käyrä

Seuraa 
Viestejä45973
Liittynyt3.9.2015

Syntyykö tästä Gaussin käyrä!?

Vaikuttavatko kaikkeuden painovoimalait matematiikkaan tai tarkoitan mekaanisesti arvottuihin tuloksiin, kumpiinkin erikseen!?

Laitan esimerkin:
-Otetaan 100 täsmälleen samanpainoista pingispalloa, jotka numeroidaan vaikkapa ohuella tushikynällä tai elektronisesti 0-100 siten että ensimmäinen on 001 ja viimeinen 100 ja pudoitetaan pallojen sekoitusastiaan jota jokin konelaite hämmentää.
-Numerointia ei voisi mielestäni tehdä järjestyksessä ensin 1 ja sitten viimeiseksi sata tai päinvastoin vaan satunnaisesti, koska sekin asettaa pallot jollakin tavalla järjestykseen, jos ne koneen nieluun pudoitetaan sitä mukaa kuin numerointi tehdään. Ensin pitäisi arpoa pallojen numerointijärjestys.

Pallojen sekoitusrumpu pitää mielestäni olla alaspäin suppeneva lieriö suhteutettunan astelukuun maapallon keskipisteeseen(yksi miljardisosa mikromillimetriä oletettuna 100-litran saaviin), koska sisältöön vaikuttaa tietenkin painovoima, jossa pienetkin painoerot vaikuttavat pallojen järjestykseen ja se ei ole varmaankaan satunnaista.

Sitten silmänsä huivilla peittänyt henkilö ottaa rummusta viisikymmentä palloa ja joka kerralla ennen nostoa kädellään rummussa olevia palloja sekoittaen.

Pallojen osoittamat numeroluvut lasketaan yhteen ja näin saadaan numerotulos joka osoittaa noston keskiarvon.

-Olettaisin, että jos koe toistettaisiin vaikkapa tuhat tai 10 tuhatta kertaa jossain sopivassa paikassa (yliopistot?) eri pallonnostajien toimesta, niin tuosta syntyisi yhteistulos, joka muistuttaisi Gaussin käyrää, jolloin pallojen suurin lukuarvo olisi kuuden- ja neljänkymmenen välillä ja laskisi kumpaankin suuntaan, mutta kuitenkin nousten hiukan lähellä nollaa ja sataa.

Siis mitä mieltä olette te viisaaat
T: Mietiskelijä

Kommentit (10)

Vierailija

-anteeksi , tarkoitin tietenkin kun tulosarvo lasketaan käyrää laadittaessa niin oletus on prosenteissa, eikä pallojen osoittamissa lukuarvoissa.
T.Kirjoittaja

Vierailija

Kyllä tämä hyvin lähellä normaalijakaumaa tulee olemaan. Keskihjontaan en tässä nyt puutu, muttu summien keskiarvo (=odotusarvo) on kuitenkin helppo, se on 50·(100+1)/2 = 2525.

Vierailija

Jos jätetään painovoima ja varsinkin Kuun aiheuttama sellainen, jolla voi olla mitä erilaisimpia vaikutuksia side silmillä palloja nostelevaan henkilöön, vähemmälle huomiolle, niin keskeinen raja-arvolause sanoo, että riippumattomien satunnaismuuttujien summa noudattaa normaalijakaumaa asymptoottisesti varsin yleisillä oletuksilla.

Kun henkilö nostaa uurnasta 50 kuulaa palauttamatta nostettuja takaisin, niin satunnaismuuttujat eivät ole riippumattomia, koska mahdolliset realisaatiot (numerot) riippuvat siitä, mitkä kuulat on jo nostettu. Jos poimija sen sijaan ottaa numeron vain muistiin ja palauttaa kuulan takaisin uurnaan, noudattaa saatu summa normaalijakaumaa (asymptoottisesti, eli sitä paremmin mitä enemmän yhteenlaskettavia on).

Pääpointti on siis riippumattomuus, eli kuulat pitää palauttaa takaisin uurnaan jokaisen noston jälkeen. Tällä tavalla saatavia jakaumia voi tarkastella vaikka seuraavassa osoitteessa:

http://elonen.iki.fi/articles/centrallimit/index.html

Kyllähän tuo käytetyillä lukuarvoilla (50, 1, 100, 1/100, 10 000) normaalijakaumaa muistuttaa. Tosin koska tasajakautuneiden yhteenlaskettavien kohdalle konvergenssi kohti norm. jak. on nopeaa, näkyy esim. tuo asymptoottisuus paremmin, kun alkaa kasvattaa yhteenlaskettavien määrää vaikka yhdestä...

Vierailija

-niin mutta täytyisi ottaa huomioon että nostettavat numerot vähenevät ykkösen ja sadan läheisyydessä riippuen nostotuloksesta jolloin keskemmällä oleville numeroille jää enemmän mahdollisuutta tulla nostetuiksi.
-Että keskimääräisyys toteutuisi, niin pitäisi ottaa käyttöön vaikkapa 300 palloa siten, etta varsinaiset arvontapallot 1-100 olisi merkitty mustalla, miinus 1--100 pallot punaisella ja plus 1-+100 sinisellä, jolloin voitaisiin saada käyrästä mustien varsinaisten pallojen osalta melkeinpä suora viiva.
-Muuttuja täsä alkuperäisesä kysymyksessä onkin ollut se että nostetut pallot poistuvat jäljellejääneistä nostetavista, kuten tuossa joku hoksasikin.

-ei tätä mielestäni voi ratkaista yksinkertaisella todennäköisyysyhtälöllä.
T:Mietiskelijä

Vierailija
Mietiskelijä
-niin mutta täytyisi ottaa huomioon että nostettavat numerot vähenevät ykkösen ja sadan läheisyydessä riippuen nostotuloksesta jolloin keskemmällä oleville numeroille jää enemmän mahdollisuutta tulla nostetuiksi.
-Että keskimääräisyys toteutuisi, niin pitäisi ottaa käyttöön vaikkapa 300 palloa siten, etta varsinaiset arvontapallot 1-100 olisi merkitty mustalla, miinus 1--100 pallot punaisella ja plus 1-+100 sinisellä, jolloin voitaisiin saada käyrästä mustien varsinaisten pallojen osalta melkeinpä suora viiva.
-Muuttuja täsä alkuperäisesä kysymyksessä onkin ollut se että nostetut pallot poistuvat jäljellejääneistä nostetavista, kuten tuossa joku hoksasikin.

-ei tätä mielestäni voi ratkaista yksinkertaisella todennäköisyysyhtälöllä.
T:Mietiskelijä


Ei voikaan ratkaista. Tämä palauttamatta jättäminen tekee tästä hankalan. Koska otettujen pallojen lukumäärä on jopa puolet kaikista palloista, niin edelliset pallot aiheuttavat voimakasta riippuvuutta seuraaviin palloihin. Sen takia tästä ei aivan normaalijakaumaa tule. Likimain normaalijakauma saataisiin, jos palloja nostetaan vähintään suunnilleen sama määrä kuin nyt (useita kymmeniä) ja palloja on yhteensä todella reilusti (lähemmäs tuhat).

Vierailija
Mietiskelijä
Syntyykö tästä Gaussin käyrä!?
Laitan esimerkin:
-Otetaan 100 täsmälleen samanpainoista pingispalloa, jotka numeroidaan vaikkapa ohuella tushikynällä tai elektronisesti 0-100 siten että ensimmäinen on 001 ja viimeinen 100 ja pudoitetaan pallojen sekoitusastiaan jota jokin konelaite hämmentää.

Sitten silmänsä huivilla peittänyt henkilö ottaa rummusta viisikymmentä palloa ja joka kerralla ennen nostoa kädellään rummussa olevia palloja sekoittaen.

Pallojen osoittamat numeroluvut lasketaan yhteen ja näin saadaan numerotulos joka osoittaa noston keskiarvon.

-Olettaisin, että jos koe toistettaisiin vaikkapa tuhat tai 10 tuhatta kertaa jossain sopivassa paikassa (yliopistot?) eri pallonnostajien toimesta, niin tuosta syntyisi yhteistulos, joka muistuttaisi Gaussin käyrää, jolloin pallojen suurin lukuarvo olisi kuuden- ja neljänkymmenen välillä ja laskisi kumpaankin suuntaan, mutta kuitenkin nousten hiukan lähellä nollaa ja sataa.

Siis mitä mieltä olette te viisaaat
T: Mietiskelijä


Tein nopean brute-force simulaation tapauksesta. Näyttäisi aika pitkälti normaalijakautuneelta. Eli toistin tuon 50 pallon noston 100 pallon joukosta 100000 kertaa, ja jokaisella kerralla laskin 50 nostetun pallon keskiarvon.

keskiarvojen keskiarvo koko aineistosta oli 50.494 hajonnalla 2.894, eli luultavasti odotusarvo tuolle keskiarvolle tulisi olemaan 50.5, mikä ei sinänsä ole yllättävää.

histogrammi "kokeesta" on täällä: http://www.esnips.com/doc/43597b26-b09c ... pallot.png

simulaation koodi (Matlab) alla:
[code:1qcy0npg]rand('state',sum(100*clock));
A = [1:100]'; % numeroinnit
eta = zeros(100000,1);
for zz=1:100000
B = zeros(size(A)); % pallo nostamatta (0) vai nostettu (1)
x = zeros(50,1); % nostetut pallot
ind = floor(100*rand)+1; % arvotaan nostettava pallo
for ii=1:50
while B(ind) > 0 % arvotaan uusi pallo,
%jos jo aiemmin nostettu
ind = floor(100*rand)+1;
end
x(ii) = A(ind);
B(ind) = 1; % merkitään pallo nostetuksi
end
eta(zz) = mean(x); % otetaan sarjan keskiarvo talteen
end
[/code:1qcy0npg]
(ei ole mitenkään optimoitu viritys "lottokoneeksi", mutta noin 4 sekuntia kesti tämän simulaation ajo läppärilläni...)

Vierailija
Tigeri
Tein nopean brute-force simulaation tapauksesta. Näyttäisi aika pitkälti normaalijakautuneelta. Eli toistin tuon 50 pallon noston 100 pallon joukosta 100000 kertaa, ja jokaisella kerralla laskin 50 nostetun pallon keskiarvon.

keskiarvojen keskiarvo koko aineistosta oli 50.494 hajonnalla 2.894, eli luultavasti odotusarvo tuolle keskiarvolle tulisi olemaan 50.5, mikä ei sinänsä ole yllättävää.




Onko tuo 2,894 siis KESKIARVOJEN KESKIHAJONTA? Onko se otoksen- vai populaation keskihajonta (onko siis jakajana n vai n-1)?

Tigeri
histogrammi "kokeesta" on täällä: http://www.esnips.com/doc/43597b26-b09c ... pallot.png

Tämä on siis histogrammi KESKIARVOISTA, vai mitä?

EDIT: Olisiko mahdollista saada TAULUKKONA eri summien (tai keskiarvojen) frekvenssit?

Vierailija
Kale
Tigeri
Tein nopean brute-force simulaation tapauksesta. Näyttäisi aika pitkälti normaalijakautuneelta. Eli toistin tuon 50 pallon noston 100 pallon joukosta 100000 kertaa, ja jokaisella kerralla laskin 50 nostetun pallon keskiarvon.

keskiarvojen keskiarvo koko aineistosta oli 50.494 hajonnalla 2.894, eli luultavasti odotusarvo tuolle keskiarvolle tulisi olemaan 50.5, mikä ei sinänsä ole yllättävää.




Onko tuo 2,894 siis KESKIARVOJEN KESKIHAJONTA? Onko se otoksen- vai populaation keskihajonta (onko siis jakajana n vai n-1)?



Kyseessä on todellakin näiden keskiarvojen keskihajonta, vastaa tuota linkittämääni kuvaa. Tässä siis otos koostuu näistä yksittäisistä kokeista, joista jokaisen tulos on siis keskiarvo 50 nostetun pallon luvuista. Jakajana on keskihajontaa laskettaessa n-1=100000-1, eli tiukasti ottaen harhaton estimaatti populaation keskihajonnalle. Kuitenkin, kun n on näin iso, tällä ei ole käytännön merkitystä.

Tigeri
histogrammi "kokeesta" on täällä: http://www.esnips.com/doc/43597b26-b09c ... pallot.png

Tämä on siis histogrammi KESKIARVOISTA, vai mitä?
EDIT: Olisiko mahdollista saada TAULUKKONA eri summien (tai keskiarvojen) frekvenssit?

Jep, eli histogrammi 100000 kokeen (=50 pallon nosto sadasta --> keskiarvo) tuloksista, tuossa aiemmin esittämässäni koodissa muuttuja "eta" sisältää kunkin kokeen keskiarvon. Kyllähän nuo frekvenssitkin saisi, ehkäpä olisi parempi käyttää summien frekvenssiä. Tuossa esittämässäni histogrammissa on käytetty 60 "biniä". En nyt tähän väliin kykene laittamaan nettiin noita frekvenssejä, mutta ehkäpä myöhemmin.

Vierailija
Kale
Koska otettujen pallojen lukumäärä on jopa puolet kaikista palloista, niin edelliset pallot aiheuttavat voimakasta riippuvuutta seuraaviin palloihin. Sen takia tästä ei aivan normaalijakaumaa tule. Likimain normaalijakauma saataisiin, jos palloja nostetaan vähintään suunnilleen sama määrä kuin nyt (useita kymmeniä) ja palloja on yhteensä todella reilusti (lähemmäs tuhat).

Tämä on totta yhden nostokerran (ne 50 palloa) tapauksessa, mutta kun tätä tehdään paljon (Tigeri teki 10000 kertaa), niin KESKIARVOT (TAI SUMMAT) JAKAUTUVAT NORMAALISTI! Itse lähdin miettimään, minkälainen jakauma syntyy yhdellä nostokerralla (tilastomuuttuja x = 50 pallon summa). Se nimittäin ei ole normaalisti jakautunut. Binomijakauma se ei myöskään ole, vaan jotakin hankalampaa (liekö sillä edes nimeä).

Uusimmat

Suosituimmat