Miidi, keskiarvoa lähinnä oleva alkio

Seuraa 
Viestejä45973
Liittynyt3.9.2015

Huomasin tuossa eräässä yhteydessä, että keskiarvoa lähinnä olevalle alkiolle / havainnolle ei ole käsitettä.

Esim. jos kysytään kyselyssä mihin aikaan pyöräily-yhteislenkin olisi hyvä alkaa työviikolla ja vaihtoehdot olisivat seuraavat:

17:00
17:30
18:00
18:30

Ja tulokset 67 vastaajalla seuraavat:

17 18
17,5 20
18 24
18,5 5

Jos valittaisiin ajoista mediaani tulisi vastaukseksi 17:00 ja 17:30. Jos puolestaan otettaisiin tähän tarkoitukseen parempi moodi, niin valinta kohdistuisi vaihtoehtoon klo 18 sen ollessa yleisin. Kuitenkin vaihtoehdon 18:30 epäsuosiosta päätellen moni ehkä ei olisi kiinnostunut 17:00 suosivista menemään klo 18, täten moodikaan ei oletettavasti tuota optimaalista tulosta, joka olisi siiis tässä esimerkissä mahdollisimman monta osallistujaa mahdollisimman monella lenkillä vuodessa.

Kun tarkoituksena on löytää kaikille sopivin aika, keskiarvo on sinänsä hyvä ratkaisu, mutta sen todennäköisyys osua näiden neljän vaihtoehdon joukkoon on pieni, eikä sekään siten riitä.

Keskiarvoajaksi saadaankin n. 17,62 eli n. 17:37. Paitsi, että 17:37 ei tosiaan ole mikään vaihtoehdoista, ei se myöskään aikana olisi yhtä helppo muistaa ja tähdätä kuin neljä annettua vaihtoehtoa. Ideana olisikin valita keskiarvoa lähin annetuista vaihtoehdoista, joka olisi siis tässä tapauksessa 17:30. Tätä keskiarvoa lähinnä olevaa alkiota / havaintoa / lähtöarvoa / vaihtoehtoa voitaisiin sitten nimittää miidiksi, mide englanniksi.

Mielenkiintoista että kyseistä keskiluku-käsitettä ei oltu kehitetty, vaikka sille esimerkin mukaisesti on selkeä tilaus tilastotieteessä.

miidi: http://fi.wikipedia.org/wiki/Miidi
keskiluku: http://fi.wikipedia.org/wiki/Keskiluku

Kommentit (14)

David
Seuraa 
Viestejä8875
Liittynyt25.8.2005

Olisikohan niin, että kieli pysyy helpommin ymmärrettävämpänä ja omaksuttavampana sitä paremmin, mitä vähemmän siihen ympätään sellaisia käsitteitä, jotka saadaan johdannaisina jo olemassa olevista yksinkertaisemmista käsitteistä.

Kiinan kielen kirjoitusmerkit edustavat mielestäni tällaista käsitteistöä, jota voidaan pitää vaikeasti omaksuttavana ja hahmotettavana.

Ymmärrän kyllä ajatuksesi tuossa, mutta sen käsitteen tarpeellisuudesta jo olemassa olevien lisäksi en ole ihan yhtä vakuuttunut.

Asenteeni saattaa tosin johtua siitä, että olen huono painamaan mieleeni "rajatonta" määrää yksittäisiä merkityksiä. Tästä johtuen joudun usein rakentaamaan näkemykseni ns. peruslähtökohdista käsin, kun ns. valmiiden konseptien mieleenjääminen on heikohkoa. Tästä asiasta johtuu myös huonohko kielitaidon oppimiskyky, kun pitäisi muistaa ulkoa perussanaston lisäksi miljoona eri sanontaa yms.

Nykyisisssä ohjelmointikielissä on vähän samaa ongelmaa, on hirveä määrä erilaisia elementtejä erilaisine ominaisuuksineen ja merkityksineen. Noista ei kykene hallitsemaan kuin murto-osaa, ellei omaa ns. valokuvamuistia.

Edit: Mitä tuohon asiaan tulee, niin tuon selektion (mikä vaihtoehto edustaa parhaiten populaation näkemyksiä) perusteenahan voi olla mikä muu painoarvo tahansa, sen ei välltämättä tarvitse olla juuri keskiarvo, sen perusteena voi olla esim. painotettu neliöllinen keskiarvo tmv. peruste.

Täten jokaiselle vaihtoehtoiselle painotustavalle pitäisi muodostaa oma selektiivikäsitteensä.

Ongelma kiertyy tavallaan itseensä siinä, että mitä ilmaisuvoimaisempi (sanarikkaampi) kieli, sitä vaikeampi sitä on omaksua ja sitä vähemmän sille on "vapaaehtoisia" käyttäjiä. Eli jostain kohtaa löytynee optimi käsitteistön määrän ja käyttöhalukkuden suhteen, vähän kuin tuon lenkkeilyajankohdankin suhteen.

Seurauksena tästä on se, että kun sama ei sovi kaikille, joten porukat jakaantuvat eri ajoille (ja eri kielille).

Vierailija

Olen paljolti Davidin kanssa samoilla linjoilla mutta kuinka tässä tapauksessa asian voisi ilmaista sanallisesti lyhyesti ja täsmällisesti? Tuossa forlonin jälkimmäisessä linkissä oli jo melkoinen määrä erilaisia termejä lukujoukon erilaisille käsitteille mutta tähän esimerkkiin soveltuvaa termiä ei ole. Miidi olisi todella yksinkertainen ja selkeä ilmaisu. Jos sen määrittämiseen käytetään erilaisia painotuksia keskiarvon laskemisessa niin ne voi sitten mainita erikseen, esim. neliöllisesti painotettu miidi.

Vierailija
forlon
Mielenkiintoista että kyseistä keskiluku-käsitettä ei oltu kehitetty, vaikka sille esimerkin mukaisesti on selkeä tilaus tilastotieteessä.



Sille mitään selkeää tilausta ole. Jos olisi, niin käsite olisi kyllä kehitetty. Koko ylläoleva perustelu voidaan tiivistää muotoon "minusta tämä luku on hyvä, joten se on hyvä ja siten sille on selkeä tilaus".

Moodi, mediaani ja keskiarvo ovat selkeitä peruskäsitteitä ja niillä on matemaattisesti helppo operoida.

Jos jossakin erikoistilanteessa tarvitaan mutkikkaampia apukäsitteitä, niitä voidaan helposti määritellä ad hoc just niin paljon kuin halutaan, mutta se ei tee niistä yleisesti käyttökelpoisia peruskäsitteitä.

Vierailija

jmk, kuinka itse ilmaisisit käsitteen lukujoukon miidi eli lukujoukon keskiarvoa lähinnä oleva luku? Siis 5 kirjaimisen sanan miidi tilalla on neljä sanaa, 26 kirjainta. Jospa tätä joutuisi toistamaan muutaman kerran!

Vierailija
korant
jmk, kuinka itse ilmaisisit käsitteen lukujoukon miidi eli lukujoukon keskiarvoa lähinnä oleva luku? Siis 5 kirjaimisen sanan miidi tilalla on neljä sanaa, 26 kirjainta. Jospa tätä joutuisi toistamaan muutaman kerran!



Sepä se, kun ei joudu.

Jos tätä käsitettä tarvittaisiin usein, sille kyllä kehitettäisiin lyhyempi ilmaus. Hyvinkin äkkiä.

Kielen sanavarasto toimii yleensäkin adaptiivisen taloudellisesti niin, että usein tarvituille käsitteille syntyy lyhyet ilmaisut, ja harvoin käytetyt on varaa ilmaista vähän pidemmin. Näin on pakkokin menetellä, sillä mitenkään ei voida konstruoida kaikille mahdollisille käsitteille lyhyitä ilmaisuja. Karkeana analogiana voit tutustua vaikkapa Huffmanin koodaukseen (http://en.wikipedia.org/wiki/Huffman_coding).

Miten sinä, korant, ilmaisisit käsitteen "mies, joka on ostanut kolmen päivän aikana viisi vihreää jalkapalloa, mutta ei yhtään tikkukaramellia, ja jolla on viininpunainen neulesolmio"? Eikö olisi kätevää, jos tälle käsitteelle olisi lyhyempi ilmaus, vaikkapa "mikoje"?

(Vastaus: Ei, ei olisi.)

Vierailija
jmk

Sille mitään selkeää tilausta ole. Jos olisi, niin käsite olisi kyllä kehitetty. Koko ylläoleva perustelu voidaan tiivistää muotoon "minusta tämä luku on hyvä, joten se on hyvä ja siten sille on selkeä tilaus".

Moodi, mediaani ja keskiarvo ovat selkeitä peruskäsitteitä ja niillä on matemaattisesti helppo operoida.




Esimerkiksi äänestystuloksista johtopäätöksiä tehtäessä mediaanilla ei helposti tee mitään, miidi taas antaa valmiin tuloksen. Ei tosiaan ole välttämättä mielekästä käyttää käsitettä "aritmeettista keskiarvoa lähinnä ole selektio", toistaa sitä tekstissä sitten jatkuvasti, kun voi sanoa lyhyesti miidi tai tosiaan esim. neliöllisesti painotettu miidi, jos tarkennetta tarvitaan, aritmeettinen keskiarvo olisi siis oletusarvoasetus miidille.

Kaikkea ei ole kehitetty, miksi tieteen, myös matematiikan kehittämiseen halutaan edelleen laittaa rahaa? Ei siis ainoastaan kehittääksemme tieteen sovellutuksia, vaan itse tiedettä ja sen työkaluja. Miidi mielestäni on kätevä työkalu ja se olisi hyvä vakiinnuttaa. Kyllä aivoissa riittää kapasiteettia käsitellä suurtakin määrää eri käsitteitä, voihan ihminen opetella useita kieliäkin ja ainahan sitä voi palautella asioita muistiin esim. tässä tapauksessa keskilukujen kuvauslistasta, jos on alan käsitteistö päässyt unohtumaan.

Tuolle mide-sanallekin saataisiin hyödyllinen uusi käyttökohde, tämänhetkinen on nähdäkseni suhteellisen triviaali: http://en.wikipedia.org/wiki/Mide

Jos näitä käännöksiä joku miettii, niin näinhän se menee loogisesti:

mode > moodi
miidi > mide

Joku alan tutkija voisi nyt tehdä paperin aiheesta. Laita yksityistä viestiä julkaisuun liittyen.

Vierailija

Alla olevista linkeistä löytyy käytännön sovellus keskustelupalstalla tehdystä kyselystä, jonka tulokset arvioin käyttäen miidiä ja moodia. Mediaanista ei olisi ollut hyötyä.

Kysely:
http://www.fillarifoorumi.fi/forum/show ... tcount=880

Tutkimuksen käsittely:
http://www.fillarifoorumi.fi/forum/show ... tcount=955

Tuossa toisena huomionarvoisena esille tulleena asiana on se, että jos henkilö valitsi kaksi vaihtoehtoa, niin merkitsin sen vain 0,5:n arvoiseksi vastaukseksi kyseisille vaihtoehdoille. Jos siis vastaisi kolme vaihtoehtoa, niin vastauksen arvo olisi tällöin siis 1/3. Miksi kirjoittaa lomakkeeseen, että "valitse vain yksi vaihtoehto", kun voi ilmoittaa kyselyn alussa, että vaihtoehdot koodataan ylläolevalla tavalla radiobuttonien osalta (checkbuttonien osalta normaalisti kaikista arvo 1, kunhan sallittu valintamäärä ei ylity).

Vierailija
jmk

Miten sinä, korant, ilmaisisit käsitteen "mies, joka on ostanut kolmen päivän aikana viisi vihreää jalkapalloa, mutta ei yhtään tikkukaramellia, ja jolla on viininpunainen neulesolmio"? Eikö olisi kätevää, jos tälle käsitteelle olisi lyhyempi ilmaus, vaikkapa "mikoje"?
(Vastaus: Ei, ei olisi.)

Tuohon ei nyt juuri kannattaisi edes vastata mutta vastaan että jmk, joka kirjoittelee täällä hölynpölyä.

David
Seuraa 
Viestejä8875
Liittynyt25.8.2005
forlon
Alla olevista linkeistä löytyy käytännön sovellus keskustelupalstalla tehdystä kyselystä, jonka tulokset arvioin käyttäen miidiä ja moodia. Mediaanista ei olisi ollut hyötyä.

Kysely:
http://www.fillarifoorumi.fi/forum/show ... tcount=880

Tutkimuksen käsittely:
http://www.fillarifoorumi.fi/forum/show ... tcount=955

Tuossa toisena huomionarvoisena esille tulleena asiana on se, että jos henkilö valitsi kaksi vaihtoehtoa, niin merkitsin sen vain 0,5:n arvoiseksi vastaukseksi kyseisille vaihtoehdoille. Jos siis vastaisi kolme vaihtoehtoa, niin vastauksen arvo olisi tällöin siis 1/3. Miksi kirjoittaa lomakkeeseen, että "valitse vain yksi vaihtoehto", kun voi ilmoittaa kyselyn alussa, että vaihtoehdot koodataan ylläolevalla tavalla radiobuttonien osalta (checkbuttonien osalta normaalisti kaikista arvo 1, kunhan sallittu valintamäärä ei ylity).




Onhan suomekielessä jo olemassa oleva käsite keskimäärin, joka aika hyvin vastaa tarkoittamaasi asiaa. En ole kovin innokas ottamaan ns. lainasanoja käyttöön, paitsi jos kyseistä käsitettä ole omassa kielessä lainkaan ilmaistavissa. Kielenhuoltoliitollakin saattaisi olla siihen sanansa sanottavana.

Käsitteenä keskimäärin ei ehkä ole eksaktisti sama asia tarkoittamassasi merkityksessä, mutta se kävisi luultavasti asiayhteydestä ilmi.

Vierailija

Alkuperäiseen pyöräily-yhteislenkki -esimerkkiin kävisi käsitteeksi ihan tuttu pyöristetty keskiarvo. Tässä tilanteessa pyöristäminen tarkoittaisi siis pyöristystä lähinpään puoleen tuntiin.

David
Seuraa 
Viestejä8875
Liittynyt25.8.2005
lapio
Alkuperäiseen pyöräily-yhteislenkki -esimerkkiin kävisi käsitteeksi ihan tuttu pyöristetty keskiarvo. Tässä tilanteessa pyöristäminen tarkoittaisi siis pyöristystä lähinpään puoleen tuntiin.

Ok, tuo on lähinnä oikea termi.

Vierailija

Ideanahan on etsiä substantiivia, joka sisältäisi nuo halutut attribuutit. Keskimääräinen, keskiarvoinen, niiden tähän tarkoitukseen ehkä paremmin soveltuvat superlatiivit keskiarvoisin, keskimääräisin ja muu näiden sanojen synonyymit ovat adjektiivejä ja vaativat varsinaisen substantiivin, kuten havainnon attribuoitavaksi.

Lisäksihän moodista voidaan esimerkiksi käyttää vaihtoehtoisesti ilmaisua suosituin tai yleisin valinta, mediaanista puolestaan esimerkiksi keskimmäisin luku. Silti näille on omat terminsä, joiden käyttöä varmaankaan kukaan ei kyseenalaista tiedemaailmassa. Yksiosainen käsite on tehokkaampi, näin ilmeisimmin ajateltaneen.

Pyöristetty keskiarvo, paitsi että olisi niin ikään kaksiosainen määrite, vaatisi lisäksi selkeän asiayhteyden.

Tieteellisissä termeissähän on se hyvä, että ne ovat eksakteja tietyn asian ilmaisuja. Kun siis halutaan spefioida esimerkiksi tietty metodi ja käyttää nopeaa tapaa ilmaista se, kehitetään sille termi ja miidi tosiaan puoltaisi paikkaansa esimerkiksi tilastotieteen käsitteistössä sen ilmaisullisen tehokkuuden (yksiosainen, kuvaileva substantiivi) puolesta. Jos etymologisesti asiaa tarkastellaan, niin midehän koostuu mid-etuliitteestä (keski-) ja e-kirjaimesta, joka tekee sanasta erityisen, mid-liitteestä erottuvan, mutta selkeästi kuitenkin siitä johdetun substantiivin. Miidi on sitten suora käännös tästä, siinä missä moodi.

[size=85:1f5ygtji]Mielenkiintoista, ettei tuota ilmaisua ole käytetty aiemmin julkaistussa internetissä:
http://www.google.com/search?num=100&hl ... nG=Hae&lr=
Toisaalta usein tulee käytettyä yksiosaisia sanoja, jotka ovat aiemmin olleet käyttämättömiä:
http://www.google.com/search?num=100&hl ... nG=Hae&lr= Johtuu usein toki sijamuodoista: http://www.google.com/search?num=100&hl ... nG=Hae&lr=[/size:1f5ygtji]

Vierailija

Eipä tälle ole tilausta, ilmeisesti nytkin on päättelemällä päätelty mikä aika on lähin, eikä matematiikkaa ole sovellettu?

Jos laskee pikaseen minuutteina tätä asiaa niin keskiarvoksi tulee 1057,16
Tästä luvusta kun ottaa moduluksen
1057,16 % 30 = 7,16
Tätä luku vertaamalla voi sitten ottaa, joko 1050 tai 1080 ja muuntaa sen taas tunneiksi ja minuuteiksi.

Tässäkin on vain ongelmana, että kumpaan suuntaan painotetaan mikäli kyseessä olisi 17:45

Vierailija
njake
Eipä tälle ole tilausta, ilmeisesti nytkin on päättelemällä päätelty mikä aika on lähin, eikä matematiikkaa ole sovellettu?

Jos laskee pikaseen minuutteina tätä asiaa niin keskiarvoksi tulee 1057,16
Tästä luvusta kun ottaa moduluksen
1057,16 % 30 = 7,16
Tätä luku vertaamalla voi sitten ottaa, joko 1050 tai 1080 ja muuntaa sen taas tunneiksi ja minuuteiksi.

Tässäkin on vain ongelmana, että kumpaan suuntaan painotetaan mikäli kyseessä olisi 17:45




Se, että selviääkö asia suoraan lukuja vertaamalla ei poista sitä vaatimusta, että sinänsä yksinkertaiselle, mutta käytettävälle asialle löytyy terminsä.

Tuo, että kumpaan suuntaan painotetaan lopulta ratkaisua voidaan tehdä tilanteessa sopivalla tavalla, jos ratkaisu kahden arvon välillä tulee tehdä, kuten äänestystilanteessa, muutoinhan voidaan mediaanin tapaan ilmoittaa kaksi arvoa. Tarkoitus ei ollut nostaa esille matemaattista ongelmaa, vaan tutkimukseen käytännön apuväline, sopiva termi käytettäväksi lähinnä tilastotieteessä, näkisin.

Uusimmat

Suosituimmat