Tietokone osaa jo tunnistaa puheesta ilon, surun ja vihan, jos ne kuuluvat selvästi. Pienissä vihjeissä ja vivahteissa se on vielä oppipoika.

TEKSTI: Kaisa Karppinen ja Juhani Toivanen

Sisältö jatkuu mainoksen jälkeen

Tietokone osaa jo tunnistaa puheesta ilon, surun ja vihan,
jos ne kuuluvat selvästi. Pienissä vihjeissä ja vivahteissa se on vielä oppipoika.

Sisältö jatkuu mainoksen alla


Julkaistu Tiede-lehdessä 7/2003

Jokainen meistä tietää omasta kokemuksestaan, että puhe välittää merkityksiä, jotka eivät sisälly sanoihin. Tärkeämpää kuin se, mitä sanotaan, voi olla se, miten sanotaan. Esimerkiksi äänen voimakkuus, painon ja sävelkorkeuden vaihtelut ja puhenopeus saattavat paljastaa, miten puhuja suhtautuu kuuntelijaan tai asiaan, josta puhutaan. Näistä puheen niin sanotuista prosodisista piirteistä voidaan päätellä, onko puhuja esimerkiksi närkästynyt, vihainen tai jännittynyt.

Prosodisten piirteiden havaitseminen käy meiltä ihmisiltä helposti, koska kaikilla meillä on suuri määrä muistikuvia puhetavoista ja -äänistä, jotka viestivät erilaisia tunteita. Aivomme vertaavat uutta puhetilannetta mielikuviin ja tulkitsevat salamannopeasti, miltä puhuja kuulostaa. Pystymme tekemään tulkinnan usein jo parista sanasta. Voidaankin olettaa, että puhekumppanin tunteiden nopea tulkitseminen on ollut evoluutiossa tärkeä asia.

Käyttökohteita riittää leluista sairaaloihin

Viime vuosina puheteknologia on kehittynyt nopeasti. Niinpä tiedepiireissä on alettu miettiä, miten emootioita voitaisiin tunnistaa puheesta automaattisesti.

  Vakavampia sovelluksia ovat kliiniseen käyttöön tarkoitetut menetelmät, joilla pystytään seuraamaan esimerkiksi potilaiden depressiota tai stressiä. Tunnetilojen tarkkailulla parannetaan myös työturvallisuutta. Kriittisissä tehtävissä toimivien ihmisten tunnetilasta kerätään vihjeitä seuraamalla heidän puheääntään.

Emootioiden automaattisesta tunnistuksesta olisi hyötyä myös puhelinliikenteen tarkkailussa. Sen avulla yritykset voisivat esimerkiksi erottaa uhkaussoitot nykyistä helpommin. Niin ikään siitä olisi iloa erilaisissa hakujärjestelmissä ja laajemminkin informaation sisällön analysoinnissa.

Oulussa kehitetään menetelmiä suomeen

Tietokone ei tietenkään osaa tulkita puheen prosodiaa, ennen kuin se opetetaan laskemaan puhesignaalista tiettyjä piirteitä ja vertaamaan niitä muistiin syötettyihin piirteisiin.

Emootioiden tunnistusta tutkitaan Oulun yliopiston sähkö- ja tietotekniikan osaston MediaTeam Oulu -ryhmässä. Kieli- ja audioteknologian tutkimusohjelmassa on jo muutaman vuoden ajan kehitetty menetelmiä, jotka sopivat pitkähkön suomen kielen analysointiin; valtaosa aiemmasta tutkimuksesta on tehty englannin kielestä.

Professori Tapio Seppäsen johtamaan tutkimustyöhön osallistuu niin insinöörejä, kielitieteilijöitä kuin informaatiotutkijoita. Kaikkia heitä tarvitaan, sillä puheen tutkimus on monitieteistä. Kun toiset kehittävät teknisiä työkaluja, toiset kuvaavat ja mallintavat puheen prosodiaa.

Kone jo lähes yhtä tarkka kuin ihminen

Tutkimusta varten tarvitaan mittava puhetietokanta, josta tietokoneelle riittää uutta opittavaa. MediaTeam-ryhmä tuotti tietokannan itse yhdessä Oulun kaupunginteatterin näyttelijöiden kanssa. Näyttelijät simuloivat emootioita lukemalla nauhalle saman tekstin neutraalisti, iloisesti, vihaisesti, surullisesti ja niin edelleen.

Itse kehitettiin myös puheentutkimusalgoritmi, jonka avulla aineistosta laskettiin kymmeniä prosodisia muuttujia. Näitä puheen piirteiden laskennallisia vastineita ovat muun muassa puheen perustaajuuden keski-, maksimi- ja minimiarvo ja niiden vaihteluväli, erityyppiset tauot ja niiden kesto sekä puheen ja hiljaisuuden suhde.

Kuuntelukokeet osoittavat, että ihmiset kykenevät tunnistamaan neljä perusemootiota - neutraali mielentila, ilo, suru ja viha - noin 85 prosentin tarkkuudella. Kone hahmottaa perusemootiot lähes yhtä hyvin, kun prosodiset piirteet kuuluvat puheessa selvästi.

Tulokset ovat lupaavia, mutta haasteitakin riittää. Kone ei vielä tunnista eri emootioiden vivahteita. Se on kuin olivat mekarobotit Steven Spielbergin elokuvassa A.I. - Tekoäly (2001). Ne tunnistivat ihmisen tunnetilan ainoastaan silloin, kun emootio oli selvä ja muuttumaton. Kun ne joutuivat erottelemaan aitoja ja teeskenneltyjä tunteita, ne epäonnistuivat.

Emootioitamme vaivattomasti ja oikein tunnistava robotti onkin vielä tulevaisuuden haave - tai kauhukuva.

Kaisa Karppinen on tiedottaja ja Juhani Toivanen tutkijatohtori. He työskentelevät Oulun yliopiston MediaTeam Oulu -tutkimusryhmässä.

Ajatus ohjaa pyörätuolia

Liikuntakyvyttömät ihmiset saattavat tulevaisuudessa saada osan riippumattomuudestaan takaisin. Sveitsissä kehitetään pyörätuolia, joka liikkuu ajatuksen voimalla.

New Scientist -lehti kertoo, että toistaiseksi Millánin myssyllä on onnistuttu ohjaamaan robottia. Se liikkui hyvin jo kahden päivän harjoittelun jälkeen.

Ajatuksin ohjattavasta aivokäyttöliittymästä toivotaan apua myös puhekyvyttömille (ks. Ajatus ohjaa tietokonetta, Tiede 2/2003).

Tuoksuloukku listii hiiriä

Warwickin yliopistossa Britanniassa on kehitetty hiirenloukku, joka toimii syötittä. Keksintö perustuu houkuttelevaan tuoksuun.

Tuotekehittelyn ensimmäinen vaihe oli hiiren mielitekojen kartoittaminen. Tutkijat houkuttelivat hiiriä häkkeihin, jotka oli hajustettu eri esanssein. Tarjolla oli muun muassa juuston, vaniljan ja suklaan tuoksua. Hiiret valitsivat useimmiten suklaan.

Seuraavaksi tutkijat ottivat yhteyttä jyrsijöiden tuhoamiseen erikoistuneeseen Sorex-yhtiöön ja kehittivät yhdessä sen kanssa suklaan tuoksuisen muovin, josta loukku valmistettiin. Nyt loukkua saa Britannian rautakaupoista.

  Syötittömän loukun ideaa tullaan käyttämään muidenkin jyrsijöiden nappaamiseen, lupaa Martina Flynn Sorex-yhtiöstä Warwickin yliopiston tiedotteessa.  

Robota oppii leikkiessään

Pienet lapset juttelevat nukkensa kanssa aivan kuin nukke olisi tasavertainen kumppani. Lapsen on kuitenkin itse keksittävä nuken vastaukset. Enää ei tarvitse keksiä, kun lapselle annetaan Aude Billardin kehittämä Robota-nukke.

Billard alkoi pohtia Robotan ideaa valmistellessaan väitöskirjaa Edinburghissa Skotlannissa. Nykyisen muotonsa Robota sai Etelä-Kalifornian yliopiston robottilaboratoriossa.

Robota on 45 senttiä pitkä ja se osaa matkia ihmiskumppaninsa liikkeitä. Sen sisuksissa on oppiva ohjelmisto, joten esimerkiksi tanssi lapsen kanssa sujuu kerta kerralta paremmin. Robotassa on myös kosketuksen aistivia tunnistimia, ja lisäksi se toistaa leikkikaverinsa puhetta ja muita ääniä. Silmissä on videokamerat.

Robotasta on myös leikkiä vakavampiin tehtäviin. Nukesta uskotaan olevan apua esimerkiksi silloin, kun itseensä sulkeutuneita lapsia kannustetaan vuorovaikutukseen lähiympäristönsä kanssa.

Sisältö jatkuu mainoksen alla