Äänen voi jo kopioida erehdyttävästi. Kuva: Wikimedia Commons
Äänen voi jo kopioida erehdyttävästi. Kuva: Wikimedia Commons

Kiinalaisen hakukoneyhtiö Baidun ohjelma tarvitsee vain minuutin kestävän ääninäytteen.

Tekoäly voi oppia ihmisen äänen minuutissa, väittävät kiinalaiset tutkijat. Ohjelma tarvitsee vain minuutin kestävän äänitallenteen, ja äänen ”klooni” on pian valmis.

Tulos ei ole vieläkään täysin sama kuin jokaisen ihmisen persoonallinen ääni, mutta kopio on hyvin lähellä. Näin sanoo äänten ja tekoälyn tutkija, yhdysvaltalainen Sercan Arik.

Kiinalaisen hakujätin Baidun tutkijat sanovat, että tekniikalla voisi tuottaa digitaalisen puhuvan kopion ihmisille, joilta on kadonnut puhekyky. Baidu on Googlen veroinen hakujätti Kiinassa.

Äänikloonin avulla voitaisiin tehdä digitaalisia avustajia persoonallisiksi. Tehty ääni kelpaisi myös videopelin hahmon ääneksi tai palveluihin, jotka kääntävät tekstiä puheeksi.

Äiti tai isä voisivat helposti luoda äänikirjan, jossa iltasatoja luetaan heidän omalla äänellään, sanoo Arik, joka johti äänikloonaajan kehittelyä Baidun tutkimuskeskuksessa.

Verkkoyhtiö Baidun tutkimus perustuu sen Deep Voice -ohjelmaan, joka yhdistelee tekstiä ja puhetta. Laskentaohjelma kuuli yli 800 tuntia ääntä yhteensä 2 400 puhujalta, kertoo tiedelehti New Scientist. Puheäänien perusteella ohjelma rakensi mallin ihmisen puheesta.

Deep Voice pystyy tuottamaan äänen keinotekoisen kopion, joka perustuu alkuperäisen äänen kuulemiseen.

Parhaimpaan tulokseen tekoäly tarvitsi vain sata lyhyttä, viiden sekunnin mittaista ääninäytettä, sanovat Baidun tutkijat.

Kuitenkin jo yksi ohjelman versio pystyi 50 sekuntin aineistolla puijaamaan ääniä tunnistavaa laitteistoa yli 95 prosenttia ajasta. Kun ihmiset olivat tuomareina, he antoivat jäljitelmälle pisteet 3,16/4.

Baidun tutkijoiden kokeita on julkaistu Arxiv-verkkopalvelussa. Se ei ole vertaisarvioitu lehti, mutta tutkijat lähettävät sinne tutkimuksiaan arviotaviksi.

Äänen täydellinen kopiointi eli kloonaus on kehittynyt viime vuosina nopeasti. Adobe-yhtiö julkaisi vuonna 2016 VoCo-palvelun, joka pystyi jäljittelemään henkilön yksilöllistä ääntä. Tähän tarvittiin äänestä 20 minuutin tallenne.

Viime vuonna kanadalainen Lyrebird avasi palvelun, jossa kuka tahansa voi tuottaa äänensä digitaalisen kopion. Siihen tarvitaan vain minuutin ääninäyte.

Parhaissakin keinotekoisissa äänissä on digitaalisia signaaleja, jotka voi havaita helposti ääniä tulkitsevilla ohjelmilla. Näin sanoo New Scientistille Rita Singh. Hän on Carnegie Mellonin yliopistolla rikosteknisten äänien asiantuntija.

Puhetta tunnistavia ohjelmia voidaan kuitenkin huijata. Niitä ovat esimerkiksi puhelinten pankkipalvelut ja älypuhelin äänentunnistus.

Alabaman yliopiston tietoturvan tutkija Nitesh Saxena osoitti jo vuonna 2014, että kaupasta tai verkkokaupasta vapaasti saatava äänen muokkauksen työkalu osaa hommansa. Sen avulla pystyy huijaamaan puhetta tunnistavia laitteita 80–90 prosenttia ajasta.

Jakob
Seuraa 
Viestejä1187
Liittynyt11.7.2015

Tekoäly kloonaa äänesi vain minuutin näytteestä

Käyttäjä4499 kirjoitti: Ihmettelin, mitä artikkelin kuvassa olevat henkilöt tekevät. Se on tervehdystapa: https://en.wikipedia.org/wiki/Elbow_bump Vaatii säätämistä, ei kätsy... jos kyynärpäät kolahtaa ,voi iskeä ikävästi hermoon. Kyynärpäät voivat tosiaan kolahtaa ikävästi yhteen. Karjalan suunnalla tähän on jo pitemmän aikaa käytetty panssarointia suojana. North Carelian elbow bump: https://fi.wikipedia.org/wiki/Pohjois-Karjalan_maakunta#/media/File:Pohjois-Karjala.vaakuna.svg
Lue kommentti