Tulevat tekstintunnistusohjelmat lukevat kolme käsinkirjoitettua kirjainta sekunnissa ja tottuvat sinunkin koukeroihisi.

TEKSTI:Risto Varteva


Tulevat tekstintunnistusohjelmat lukevat kolme käsinkirjoitettua
kirjainta sekunnissa ja tottuvat sinunkin koukeroihisi.

Sisältö jatkuu mainoksen alla

Sisältö jatkuu mainoksen alla

Julkaistu Tiede-lehdessä

1/2003


Tekstiviestin näppäilyyn tuskastunut nakkisormi joutuu yhtenään kiroilemaan sitä, miksi kännykkään kirjoittamista ei tehdä helpommaksi. Tehdään tehdään, kaiken aikaa, mutta aivan vielä näitä ohjelmia ei ole jokapojan ulottuvilla.


Teknillisen korkeakoulun neuroverkkotutkija Vuokko Vuori väitteli joulukuussa tekniikan tohtoriksi juuri siitä, miten kone opetetaan tulkitsemaan käsin raapustettuja kirjaimia niin nopsaan kuin ne kirjoitetaan. Väiteltyään Vuori siirtyi tutkijaksi Nokiaan ja ehti myös avioitua: nyt hän on Vuokko Lantz.


Kirjainten automaattinen tulkinta ei ole uutta, sillä koneet ovat jo pitkään osanneet lukea käsin kirjoitettua tekstiä melko hyvin. Nämä eivät kuitenkaan ole taskussa kulkevia laitteita.


Sen sijaan esimerkiksi kämmentietokoneet ja elektroniset muistikirjat ovat. Niihin on varmasti mukavinta kirjoittaa tekstiä kynänpätkällä omalla käsialallaan.


Kone pystyisi tulkitsemaan mallin mukaisesti piirrettyjä tikkukirjaimia paljon vaivattomammin kuin persoonallista käsialaa, mutta tikkukirjaimin kirjoittaminen ei ole luontevaa. Pienissä taskutietokoneissa, esimerkiksi PDA-laitteissa käsin kirjoittaminen on jo mahdollista, mutta niissä käyttäjä joutuu opettelemaan kirjoitustavan, joka voi poiketa omasta käsialasta paljonkin.


Lantzin mukaan oppivan tunnistuksen ideana tulisi kuitenkin olla se, että kone pannaan toimimaan ihmisen ehdoilla eikä ihmistä koneen ehdoilla.


- Tekstin syöttö etenee joutuisasti, kun kirjaimia saa kirjoittaa noin kolme kappaletta sekunnissa, Lantz kertoo. - Jos kone osaa tulkita ne näin nopeasti, meidän ei tarvitse kirjoittaessa hidastella.


Ihminen näkee muodot, kone viivan sijainnit


Katsokaapa hieman omaa käsialaanne - tai jos oikein haluatte kauhistella, naapurin käsialaa!


Lantz lupaa, että harakanvarpaiden ongelmasta kyllä selvitään, vaikka "eräiden käsialojen lukeminen on mahdotonta niin koneelle kuin ihmiselle". Akateemikko Teuvo Kohosen Teknilliseen korkeakouluun aikoinaan perustamassa neuroverkkoryhmässä on kolme vuosikymmentä tutkittu koneellista hahmontunnistusta, siitä käsin kirjoitetun tekstin reaaliaikaista tunnistusta noin viisi vuotta.


Ihminen tunnistaa kirjaimen viivojen kokonaisuutena, mutta kone käyttää tunnistukseen pisteitä. Kun kynä painaa kirjoitusalustaa, kone ottaa lukemat säännöllisin väliajoin.


- Jatkuvan viivan sijasta saadaan sarja pisteitä. Oleellinen tieto tunnistuksessa on se, missä aikajärjestyksessä mittauspisteet ovat ja mihin suuntaan niiden jono kulloinkin etenee, Lantz selvittää. - Pistejonon kulkua verrataan muistissa oleviin mallikirjaimiin. Tunnistusohjelma muokkaa mitattua pistejoukkoa, kunnes se vastaa yhtä muistin mallikirjaimista. Tulkinta on sitä luotettavampi, mitä pienemmillä muutoksilla osutaan mallikirjaimeen.


Alun korjausten jälkeen koneen tulkinta paranee


Lantz lupaa, että kaikki äly on ohjelmassa itsessään: - Tästä voidaan tehdä niin helppokäyttöinen, että käyttäjä vain rupeaa kirjoittamaan omalla käsialallaan ja korjaa ensimmäisissä lauseissa tulkintavirheitä. Ohjelma oppii, ja muutaman lauseen jälkeen virheet vähenevät selvästi.


Juuri tässä on menetelmän juju: hirveäkin käsiala tulee ohjelmalle tutuksi, koska ohjelma osaa omin päin muuttaa ja täydentää mallikirjaimensa käyttäjän käsialan mukaisiksi.


Eräässä kokeessa ohjelma teki aluksi virheen keskimäärin joka seitsemännessä kirjaimessa, mutta opettelun jälkeen virheet putosivat kymmenenteen osaan eli väärin meni enää vain yksi kirjain seitsemästäkymmenestä. Sen verran kirjoitusvirheitä voi hyvin tulla jo kirjoittajalle itselleenkin.

Sisältö jatkuu mainoksen alla