Törttö ja tietokone

Seuraa 
Viestejä45973
Liittynyt3.9.2015

Huomasitteko tämän päivän uutisen:

Tietokone lauseopissa

Täydellinen kielikone on kohta tosiasia. Cornellin ja Tel Avivin yliopistojen tutkijat ovat kirjoittaneet tietokoneohjelman, joka oppii vähitellen skannatun tekstin kieliopin oli teksti mitä kieltä tahansa. Kielen säännöt opittuaan ohjelma pystyy käyttämään sitä ja tuottamaan uusia ”älykkäitä” lauseita. Samalla ohjelmalla selviää myös muun muassa musiikin ja proteiinien rakenne, kehuu Cornellin yliopiston tiedote.

“Tämä on ensimmäinen kerta, kun algoritmin (sarja tietokoneohjelmaan liittyviä käskyjä) on osoitettu pystyvän oppimaan monimutkaista lauseoppia itsenäisesti ja luomaan kieliopillisesti uudenlaisia lauseita sekä löytämään rakenteita esimerkiksi bioinformatiikkaa kuvaavasta datasta”, sanoo Cornellin yliopiston tutkija Shimon Edelman.
Uusi tietokoneohjelma, jonka nimi on Automatic Distillation of Structure (ADIOS), analysoi tekstiä etsimällä siitä toistuvia rakenteita. Tiedote antaa esimerkiksi kolme englannin kielistä lausetta: I would like to book a first-class flight to Chicago, I want to book a first-class flight to Boston ja Book a first-class flight for me, please. Näistä lauseista kone oppii rakenteen book a first-class flight - mikäli rakenne läpäisee ohjelman osan, joka testaa sen tilastollista merkittävyytä. Jos ohjelma lukee myöhemmin lauseet I need to book a direct flight from New York to Tel Aviv ja I would like to book an economy flight, se saattaa tulkita tilanteen niin, että first-class, direct ja economy ovat tasavertaisia juuri opitussa rekenteessa jne. Mitenkähän kauan tällä menetelmällä kuluu suomen kieliopin oppimiseen!

ADIOS-ohjelmalle haetaan parhaillaan patenttia.

Muutama kysymys tuli heti mieleen:

- Onnistuuko tällä periaatteella toimiva tietokone oppimaan esim suomen kielen rakenteen, joka on hyvin eri tyyppinen kuin germaanisissa kielissä?

- Mitäs jos tietsikkaan syöttäisi TörttöBillin tekstin? Hänen kirjoituksensa ovat epätavallisesti rakennettuja, mutta täysin suomen sananmuodostusopim mukaisia?

Onko lingvistinörtttejä linjoilla?

Sivut

Kommentit (18)

Pikku Gen
Seuraa 
Viestejä3210
Liittynyt2.6.2005

Itse toivottavasti lähitulevaisuudessa ammattimaisena kääntäjänä voin sanoa, että pitkään vielä menee. Palikkamalliset kielet ovat helpompia, kun niissä ei tarvitse erikseen "oppia" että yksi sana voi olla monen näköinen. Englanti, kiina, korea, kaikki vastaavat toimivat erilaisen kieliopin mukaan kuin agglutinoiva suomi, mikä haittaa kovasti esim. Mikkisoftan hemmetin oikolukuohjelmia...

"Ubi est actio hic?" Missä täällä on säpinää?

Vierailija

Niinpä, kiinat ja koreat sun muut unohdin tykkänään.

Muuten, jos kääntämisestä tiedät niin kerropa yksi juttu.

Kun tonaalisissa kielissä, kuten kiinassa yksi sama sana "ma" voi tarkoittaa sävelkulusta riippuen useaa eri asiaa vaikkapa anoppia , hilloa, vuorovettä ja retuliiniä, niin miten kieltä lukeva voi tietää, mitä niistä tarkoitetaan? Pitääkö vain asiayhteydestä päätellä vai ilmaistaanko intonaatio erillisin kirjoitusmerkein?

Taas on ollut liikaa joutoaikaa

Mummolla

Vierailija

Miten toi ohjelma toimii, onko jossain jotain juttua tosta missä kerrotaan tarkemmin. Minusta toi proteiinien rakenteen selvittäminen on hienompi juttu.
Sitähän on yritetty selvittää pitkään, miten ne proteeinit laskostuu.

Vierailija

Ei saa puhua proteiineista eikä geeneistä tässä juonteessa! Tämä on tietokonelingvistiikkaa ja kielitiedettä varten

komentaa

Mummo

Vierailija
Mummo

Muuten, jos kääntämisestä tiedät niin kerropa yksi juttu.

Kun tonaalisissa kielissä, kuten kiinassa yksi sama sana "ma" voi tarkoittaa sävelkulusta riippuen useaa eri asiaa vaikkapa anoppia , hilloa, vuorovettä ja retuliiniä, niin miten kieltä lukeva voi tietää, mitä niistä tarkoitetaan? Pitääkö vain asiayhteydestä päätellä vai ilmaistaanko intonaatio erillisin kirjoitusmerkein?

Anteeksi, minä riennän vastaamaan Pikku Genin puolesta. Kiinassa kirjoitusmerkki on eri, vaikka sana lausutaan samalla tavalla. Siitä sen siis tietää, mitä lausumista tarkoitetaan. Jos taas sana kirjoitetaan meikäläisin kirjaimin, niin sanan päälle tulee toonimerkki, eli ylöspäin sojottava viiva (á) jos äänne on nouseva, alaspäin (à) jos laskeva jne.

totinen
Seuraa 
Viestejä4875
Liittynyt16.3.2005
dinoflagellat
Mummo

Muuten, jos kääntämisestä tiedät niin kerropa yksi juttu.

Kun tonaalisissa kielissä, kuten kiinassa yksi sama sana "ma" voi tarkoittaa sävelkulusta riippuen useaa eri asiaa vaikkapa anoppia , hilloa, vuorovettä ja retuliiniä, niin miten kieltä lukeva voi tietää, mitä niistä tarkoitetaan? Pitääkö vain asiayhteydestä päätellä vai ilmaistaanko intonaatio erillisin kirjoitusmerkein?




Anteeksi, minä riennän vastaamaan Pikku Genin puolesta. Kiinassa kirjoitusmerkki on eri, vaikka sana lausutaan samalla tavalla. Siitä sen siis tietää, mitä lausumista tarkoitetaan. Jos taas sana kirjoitetaan meikäläisin kirjaimin, niin sanan päälle tulee toonimerkki, eli ylöspäin sojottava viiva (á) jos äänne on nouseva, alaspäin (à) jos laskeva jne.

Japanissa ja Kiinassa käytetään osin samoja kirjainmerkkejä, joten Japanilaiset osaavat lukea kiinaa ja kiinalaiset japania.

H
Seuraa 
Viestejä2622
Liittynyt16.3.2005
Mummo
Onnistuuko tällä periaatteella toimiva tietokone oppimaan esim suomen kielen rakenteen, joka on hyvin eri tyyppinen kuin germaanisissa kielissä?

Kävin vilkaisemassa noita Teinin antamia sivuja. Ohjelma näyttää tunnistavan vain merkkijonoja ja niiden välisiä suhteita, joten vastaus mummon kysymykseen on valitettavasti ei niin kuin Pikku Gen arvelikin

Vierailija
Pikku Gen
Palikkamalliset kielet ovat helpompia, kun niissä ei tarvitse erikseen "oppia" että yksi sana voi olla monen näköinen. Englanti, kiina, korea, kaikki vastaavat toimivat erilaisen kieliopin mukaan kuin agglutinoiva suomi, mikä haittaa kovasti esim. Mikkisoftan hemmetin oikolukuohjelmia...

Kyllä suomi on tietokoneelle melko helppo kieli. Esim. yhdellä tai kahdella säännöllä tavutus toimii yli 90%:sti oikein. Eikä suomen kielen oikeinkirjoituskaan ole kovin vaikeata. Itselläni on käytössä Soikko, joka tunnistaa sanojen kaikki taivutusmuodot ja osan yhdyssanasäännöistäkin. Soikko toimii muuten myös käyttämässäni selaimessa ja on vieläpä ilmainen.

Vierailija
Mummo
Samalla ohjelmalla selviää myös muun muassa musiikin ja proteiinien rakenne, kehuu Cornellin yliopiston tiedote.

Mitähän ohjelma mahtaisi tykätä Webernin tai Schönbergin teoksista?

lierik
Seuraa 
Viestejä4922
Liittynyt31.3.2005
totinen

Japanissa ja Kiinassa käytetään osin samoja kirjainmerkkejä, joten Japanilaiset osaavat lukea kiinaa ja kiinalaiset japania.

Kiinassa puhutaan niin erilaisia "kiinoja" ja niiden murteita, etteivät maan eriosissa asuvat ymmärrä toistensa puhetta. Virallisin versio lienee mandariinikiina ja etelässä puhuttu on kantoninkiinaa, mm Hongkong. Kirjoitus on kuitenkin pääosin samanlaista, jos siitä jostain 50 000^ merkin joukosta voi niin sanoa. Uusia tulee koko ajan lisää. Tuntuu että niitä voi yhdistellä vielä ymmärrettävästi rajattomasti. "Västi, asti ". Taisi olla, että tuo 50 000 oli jonkun äidinkielen professorin tietämä määrä.

Turisti kun opiskelee muutaman sanan kiinaa, eikä sillä saa itseään ymmäretyksi, niin torimuija mielellään kirjoittaa asiansa paperille ja ihmettelee tyhmää ulkomaalaista, joka ei vieläkään tajua tarkoitusperiään.

Edit: Korjasin tuon mandariinin, että tuli oikea hedelmä.

Lierikki Riikonen

Vierailija
Mummo

Muutama kysymys tuli heti mieleen:
- Mitäs jos tietsikkaan syöttäisi TörttöBillin tekstin? Hänen kirjoituksensa ovat epätavallisesti rakennettuja, mutta täysin suomen sananmuodostusopim mukaisia?

ottamatta sinänsä toki loisteliaisiin tuotantoihini laatu- ynnämuiltasensemmoisilta tasoilta mittailtuina mitään varsinaista kantaa puolesta tahi vastaankaan ihmettelen suuresti, miksei minulle ole tuotantojeni sekä laajuuden että syvyyden ja monialaisuuden ja joissain aniharvoissa tapuksissa myöskinsä monimutkallisuuden huomioonottaen myönnetty jo useanpanakin vuonna perätysten alan suurinpia palkintoja elikäs hyvinkin pitkälti kirjallisuuksien noobeleita asiaankuuluvine diploomeine sekä aploodeine niistä koituvia haastattelupyyntöjäkään unohtamatta... enkä tällä tietenkään tahdo ensinkään vihjailla sitä, etteikö sinänsä toki kovasti kaipaamiani haastattelupyyntöjäkin saattaisi koitua osakseni täysin muista syistä, vaan sitä, että vaihtelu saattaisi olla tässäkin mielessä tervetullutta... mitä taasen tuleepi tekstuureitteni syöttelemisiin tietokoneisiin, toteaisin, että modernien oikolukuohjelmistojen käsittelyitten jäljiltä erivärisiä alle- ja päälleviivauksia osiksensa saaneita tutantojani katsellessa ja varsinkin vähintäänkin lieviin muotoseikkoja koskeviin erimielisyyksiin po ohjelmistojen velhojen kanssa ajauduttuani muistuvat minulle toki länpimästi mieleeni kansakoulun sekä ala- että yläluokkieni äidinkieltenopettajien sinipunakynäilyt silloisissa tuotannoissani... onpi tietenkin myönnettävä, että nykyään saan niin kovin harvoin varsinaisia arvosanoja tuotannoistani, mutta saamani arvostelut ovat olleet joissain poikkeustapauksissa hyvinkin paljon rakentavenpia luonteiltansa...

Vierailija

Loistavat sivut Törtöllä! Kauankos meinaat vielä jaksaa kivillä liukastelua? Koreografiasi oli hengästyttävän tainnuttavan energistä, toi mieleen Gumma gumma- intiaanien alkukantaisen selvitymisrituaalin joen äärellä missä alligaattorit vaanivat.

Sivut

Uusimmat

Suosituimmat