Suomalaisen jääkiekkovalmentajan puhetta DeepMind ei vielä osaa tulkita huulilta. Kuva: Veli-Matti A. Pitkänen
Suomalaisen jääkiekkovalmentajan puhetta DeepMind ei vielä osaa tulkita huulilta. Kuva: Veli-Matti A. Pitkänen

DeepMind tunnisti testissä täsmälleen oikein noin puolet sanoista.

Tekoäly osaa lukea puhuttua englantia huulilta paremmin kuin yksikään ihminen. Tämän todisti joukko tutkijoita, jotka kokeilivat tekoälyn kykyä tunnistaa englantilaisten tv-ohjelmien puhetta.

Maineikkaan DeepMind-tekoälyn tutkijat loivat ohjelman suuraineiston avulla. Oppivaa tekoälyä koulutettiin Britannian yleisradioyhtiön BBC:n televisio-ohjelmien avulla.

Videot sisälsivät kaikkiaan 118 000 lausetta, kertovat ohjelman laatineet tutkijat fyysikoiden arxiv-verkkolehdessä.

Sisältö jatkuu mainoksen alla

DeepMind kykeni kokeissa tunnistamaan pelkästään huulia lukemalla sanasta sanaan esimerkiksi englanninkielisen lauseen, joka kuuluu suomeksi: ”Me tiedämme, että sinne tulee myös satoja toimittajia.”

Sisältö jatkuu mainoksen alla

Tekoäly oli myös selvästi parempi kokeessa, jossa DeepMind ja huulilta lukemisen ammattilainen yrittivät tulkita 200 lauseen pätkää videoilta.

Ihminen tunnisti sanoista virheittä 12,4 prosenttia. Tekoäly luki 46,8 prosenttia sanoista täysin oikein. Monet tekoälyn virheistä olivat lisäksi hyvin pieniä. Esimerkiksi kirjain ”s” saattoi puuttua sanan lopusta, kertoo New Scientist.

Ohjelma päihitti helposti myös kaikki muut ohjelmat, joita oli aiemmin kehitetty lukemaan huulilta.

Huulilta lukemista ei olisi voinut toteuttaa ilman paljoa dataa eli suuraineistoa, sanovat tutkijat.

DeepMindin kokoama tunnistusohjelma osaa nyt lukea englantia kaikkien ihmisten huulilta. Aiemmat tietokoneet yrittivät ohjelmalla, jonka sanasto oli DeepMindia suppeampi ja jossa aineistona oli yhden ihmisen huulet ja puhe.

Äänen ja kuvan piti kuitenkin olla täysin tasatahdissa, jotta tekoäly pystyi huippusuoritukseen. Tekoäly pystyi itse tahdistamaan nauhat, jos huomasi tahdistuksessa puutteita.

Monet kysyvät nyt, onko ohjelma väline urkintaan ja vakoiluun. Vakoilussa ääntä kaukaa nappaavat mikrofonit ovat kuitenkin jo pitkään pystyneet parempaan.

Ohjelma voi myös tukea kuulolaitteiden käyttäjiä. Lisäksi se mahdollistaa hiljaisen sanelun julkisissa tiloissa, ja sen avulla voi tunnistaa puhetta meluisissa ympäristöissä.

Sisältö jatkuu mainoksen alla