Matikkaongelma

Seuraa 
Viestejä45973
Liittynyt3.9.2015

Moi! Minun pitäisi laskea ilmiölle X lukuarvo. Ilmiö X koostuu neljästä eri ilmiöstä, jotka ovat A, B, C ja D ja joista jokainen vaikuttaa ilmiöön X eri painokertoimella. Yksi muuttujista on vielä negatiivisessa korrelaatiossa ilmiöön, muiden kolmen ollessa positiivisessa korrelaatiossa. Tässä luvut:

Muuttujien yhteydet ilmiöön X (korrelaatiot):
A: -.38
B: .22
C: .24
D: .31

Isossa aineistossa muuttujien A, B, C ja D keskiarvo on 5, vaihteluvälin ollessa 1-10. Samoin on ilmiön X kohdalla.

Millä kaavalla saan laskettua X:lle arvon? Jos kaikki muuttujat olisivat positiivisessa korrelaatiossa X:n kanssa, olisi kaava ilmeisesti:
X=(38*A + 22*B + 24*C + 31*D)/28,75/4

Tuossa jako 28,75:llä (painokertoimien keskiarvo) poistaa ilmeisesti painokertoimien vaikutuksen.

Homma menee kuitenkin yli minun hilseen, koska muuttujan A korrealatio X:ään on negatiivinen. Muuttujan X arvon pitäisi olla siis 5 (joka on ns. normaali, odotettu tulos), silloin kun muuttujien A, B, C ja D arvo on 5.

Kommentit (9)

xyzzy
Seuraa 
Viestejä72
Liittynyt1.11.2007
Juha
Moi!
Muuttujien yhteydet ilmiöön X (korrelaatiot):
A: -.38
B: .22
C: .24
D: .31




Sen verran sekava esitys että ei voi auttaa. Miten nuo A ja muut on määritetty. Ja mikä tuo korrelaatio on? Jos ne on korrelaatio kertoimia niin esittämäsi tapa ei toimi ja jos ne on jotain muuta niin pitäisi olla tietoa siitä miten ne on - eli miten ne on mitattu.

Vierailija
xyzzy
Sen verran sekava esitys että ei voi auttaa. Miten nuo A ja muut on määritetty. Ja mikä tuo korrelaatio on? Jos ne on korrelaatio kertoimia niin esittämäsi tapa ei toimi ja jos ne on jotain muuta niin pitäisi olla tietoa siitä miten ne on - eli miten ne on mitattu.



Pahoitelut epäselvyydestä. Aloitan alusta.

A, B, C ja D ovat testituloksia liittyen ihmisen käyttäytymiseen. Myös X on ihmisen käyttäytymiseen liittyvä ilmiö. Testien avulla saadaan arvot muuttujille A, B, C ja D. Ilmiöstä X ei saada testeistä tietoa, mutta tutkimusten mukaan ilmiöt A, B, C ja D korreloivat (Spearman-korrelaatio) X:n kanssa seuraavasti:

A: -.38
B: .22
C: .24
D: .31

Muuttujat A, B, C ja D voivat siis saada arvon väliltä 1-10, lukeman 5 ollessa keskimääräinen, "normaali" tulos. Minua kiinnostaisi arvioida muuttujien A, B, C ja D perusteella, millä tasolla ilmiö X on, kun tiedossa on muuttujien korrelaatiot X:n kanssa. Muuttujan X tulisi mielellään olla samassa muodossa kuin muutkin muuttujat, eli vaihteluväli 1-10 ja X:n arvo on 5, mikäli kaikkien siihen vaikuttavien muuttujien arvo on 5. Mikäli tämä on hankalaa, käy myös muunlainen asteikko.

JAM
Seuraa 
Viestejä192
Liittynyt5.4.2006
Juha

A, B, C ja D ovat testituloksia liittyen ihmisen käyttäytymiseen. Myös X on ihmisen käyttäytymiseen liittyvä ilmiö. Testien avulla saadaan arvot muuttujille A, B, C ja D. Ilmiöstä X ei saada testeistä tietoa, mutta tutkimusten mukaan ilmiöt A, B, C ja D korreloivat (Spearman-korrelaatio) X:n kanssa seuraavasti:

A: -.38
B: .22
C: .24
D: .31

Muuttujat A, B, C ja D voivat siis saada arvon väliltä 1-10, lukeman 5 ollessa keskimääräinen, "normaali" tulos. Minua kiinnostaisi arvioida muuttujien A, B, C ja D perusteella, millä tasolla ilmiö X on, kun tiedossa on muuttujien korrelaatiot X:n kanssa. Muuttujan X tulisi mielellään olla samassa muodossa kuin muutkin muuttujat, eli vaihteluväli 1-10 ja X:n arvo on 5, mikäli kaikkien siihen vaikuttavien muuttujien arvo on 5. Mikäli tämä on hankalaa, käy myös muunlainen asteikko.


Analyyttisellä geometrialla saadaan ainakin

X=5 -0.38*(A-5) + 0.22*(B-5) + 0.24*(C-5) + 0.31*(D-5)

A:n kasvaessa X pienenee, muitten kasvaessa X kasvaa. X:n keskiarvo on 5, mutta vaihteluväli ei varmaankaan ole se 1-5.

xyzzy
Seuraa 
Viestejä72
Liittynyt1.11.2007
Juha
xyzzy
Ilmiöstä X ei saada testeistä tietoa, mutta tutkimusten mukaan ilmiöt A, B, C ja D korreloivat (Spearman-korrelaatio) X:n kanssa seuraavasti:

A: -.38
B: .22
C: .24
D: .31


Tuo sana Spearman korrelaatio auttaa paljon. Sehän mittaa sitä kuinka hyvin vaikkapa muuttuja A selittää muuttujaa X JOSS A ja X ovat normaalijakautuneita ja niiden välillä on lineaarinen riippuvuus

Se että Corr(A,X) =-0.38 ei kerro riippuvuudesta kovinkaan paljon. Lähinnä se kertoo että A selittää X arvosta noin 0.38*0.38 * 100% = 14 %. Se ei sinänsä kerro mitään korrelaation kulma kertoimesta, vain sen merkityksestä.

Lisäksi vaikka tuntisit kulmakertoimet et voi muosostaa yhtälöä joka toimii, elleivät muuttujat A,B,C,D ole riippumattomia toisistaan

Jos haluat matemaattisen mallin näiden aineistojen välille sinun tulee etsiä esimerkiksi pienimmän neliösumman menetelmällä ratkaisu kertoimille

eli X = KA * A + KB * B ....

Ja sitten vaan matriiseja kääntämään. tTai nykyään olisi tietty tehdä Naivi Bayes luokittelija annetulla aineistolla. Siihen löytyy tavaraa googlaamaalla.

Eli ongelmasi ei ole aivan triviaali.

Vierailija

JAM, tuo esittämäsi kaava ei vaikuta tuottavan hyviä tuloksia. Jos laittaa muuttujille B, C ja D pienimmän mahdollisen arvon (1) ja A:lle keskimääräisen arvon (5), pitäisi X:n arvo olla alla keskiarvon, koska kolme muuttujaa vetää X:ää alaspäin keskiarvosta (5) ja yksi muuttuja pyrkii pitämään sitä keskiarvossa. Tuloksena kuitenkin on, että X on yli keskiarvon.

xyzzy
Eli ongelmasi ei ole aivan triviaali.



Ok. Jos unohdetaan nuo kertoimet, niin millainen kaava laskisi X:lle arvon? Oletetaan siis, että muuttujat B, C ja D ovat positiivisessa korrelaatiossa X:n kanssa ja A on negatiivisessa korrelaatiossa.

En hae tässä siis matemaattisen tarkkaa kaavaa, vaan "sinnepäin"-tulosta. Jos tulos on vaikkapa +-1 oikeasta, on siitä jo iloa.

xyzzy
Seuraa 
Viestejä72
Liittynyt1.11.2007
Juha

xyzzy
Eli ongelmasi ei ole aivan triviaali.



Ok. Jos unohdetaan nuo kertoimet, niin millainen kaava laskisi X:lle arvon? Oletetaan siis, että muuttujat B, C ja D ovat positiivisessa korrelaatiossa X:n kanssa ja A on negatiivisessa korrelaatiossa.



Ilman analyysia itse aineistosta ei onnistu. Minkäänlaisen kaavan antaminen ei onnistu ilman jotain "multivariate" analyysiä

Tuossa on yksi mahdollisuus:
http://en.wikipedia.org/wiki/Bayesian_m ... regression

JA tuolta ehkä aavistuksen konkreettisempaa:
http://www.egwald.ca/statistics/statistics.php3

Ylipäätänsä googlettamiseen:
Multivariate regression
multiple regression

haut saattavat tuottaa tuloksia. jostain löytyy varmaan valmiita työkaluja.

Ja jos tykkäät vaikka execeliä käyttää ja datat on excel muodossa lisää hakuun vaikka excel sana ja löydät ton tyyppisiä apuja:
http://www.bionicturtle.com/learn/artic ... n_10_min_/

http://economics.about.com/cs/termpaper ... iate_2.htm

JAM
Seuraa 
Viestejä192
Liittynyt5.4.2006
Juha
JAM, tuo esittämäsi kaava ei vaikuta tuottavan hyviä tuloksia. Jos laittaa muuttujille B, C ja D pienimmän mahdollisen arvon (1) ja A:lle keskimääräisen arvon (5), pitäisi X:n arvo olla alla keskiarvon, koska kolme muuttujaa vetää X:ää alaspäin keskiarvosta (5) ja yksi muuttuja pyrkii pitämään sitä keskiarvossa. Tuloksena kuitenkin on, että X on yli keskiarvon.



X=5 -0.38*(A-5) + 0.22*(B-5) + 0.24*(C-5) + 0.31*(D-5)

= 5 - 0 +0.22*(-4)+ 0.24*(-4) +0.31*(-4)

antaa kyllä viitosta pienemmän tuloksen!!

tli
Seuraa 
Viestejä1057
Liittynyt11.11.2005

Sorry, en ymmärrä ollenkaan, miten erillisistä X:n ja muiden muuttujien välisistä korrelaatioista voitaisiin johtaa X:n arvot muiden muuttujien arvojen ollessa joitain oletettuja arvoja. Noita erillisiä korrelaatiokertoimia ei mitenkään voi käyttää painokertoimina, sillä kukin korrelaatiokerroin kertoo vain X:n ja kyseisen muuttujan suhteen riippumatta muista muuttujista, eivätkä ne summaudu ykköseksi, kuten painokerrointen tulisi summautua.

Ainoa keino selvittää X:n arvo suhteessa muihin muuttujiin on mallintaa käytettävissä oleva empiirinen aineisto vaikkapa pienimmän neliösumman menetelmällä käyttäen X:ää selitettävänä muuttujana ja muita muuttujia selittävinä, kuten joku ehdottikin aiemmin. Tällöinkin kyseessä on ennuste, eikä näillä tiedoilla voida mitenkään yksiselitteisesti määritellä X:n täsmällistä arvoa muiden muuttujien saadessa joitain arvoja. Täsmällisen X:n arvon löytämiseksi tarvittaisiin joitain muita tietoja X:n ja muiden muuttujien suhteesta kuin pelkkä kokeellinen aineisto ja tästä aineistosta lasketut korrelaatiot.

Vierailija

Matematiikka on näköjään kieli, jota Juha ei osaa, koska muut eivät ymmärrä.

Ilmeisesti tässä haetaan pseudoinverssiä tai jotain vastaavaa. Ihan sama. Sehän ei ole totta, vaan yksi malli miljoonista.

Uusimmat

Suosituimmat