Suurten ja pienten kielten välillä ammottaa kieliteknologinen kuilu.

Suuri osa eurooppalaisista kielistä uhkaa kuolla digitaaliseen sukupuuttoon, ilmenee Euroopan johtavien kieliteknologian asiantuntijoiden uudesta tutkimuksesta.

Asiantuntijat arvioivat 30 eri eurooppalaiselle kielelle tarjolla olevaa tukea ja tulivat siihen tulokseen, että 21 kielen digitaalinen tuki on olematon tai parhaimmillaan heikko.

Digiajan kieliteknologiaohjelmistot osaavat käsitellä puhuttua tai kirjoitettua ihmiskieltä. Sellaisia ovat esimerkiksi oikeinkirjoitusohjelmat, automaattiset käännösjärjestelmät, Internet-hakukoneet ja navigaattoreissa käytetyt synteettiset äänet.

Tutkittujen kielten kieliteknologista tukea arvioitiin neljän eri sovellusalan mukaan: konekäännös, puheenkäsittely, tekstinanalyysi ja kielivarojen saatavuus. 

Asiantuntijat sijoittivat 30 kielestä 21 alimpaan luokkaan ("tuki on heikko tai olematon") ainakin yhdellä mainituista sovellusaloista. Useat kielet, esimerkiksi islanti, latvia, liettua ja malta saivat alimmat pistemäärät kaikilla neljällä sovellusalalla.

Suomen kielellä on "osittainen tuki", joten se kuuluu riskialttiiden kielten joukkoon yhdessä baskin, bulgarian, katalaanin, kreikan, unkarin ja puolan kanssa. Suomenkielisellä puheenkäsittelyllä on kohtuullinen tuki, mutta suomenkielisellä konekäännöksellä sen sijaan on heikko tai olematon tuki.

Vain englannin kielellä oli "hyvä tuki". "Kohtalaisen tuen" kieliä olivat espanja, hollanti, italia, ranska, saksa ja tsekki.

Tutkimuksen toteutti Euroopan huippuosaamisen verkosto META-NET, joka koostuu 60 tutkimuskeskuksesta 34 eri maassa. 

"Tutkimuksemme tulokset ovat erittäin huolestuttavia. Suurin osa Euroopan kielistä on vakavasti aliresurssoitu ja jotkut niistä on lähes täysin laiminlyöty. Tästä näkökulmasta katsottuna monien kieltemme tulevaisuus ei ole lainkaan varma", toteaa professori Hans Uszkoreit, META-NET:in koordinaattori ja Saksan tekoälyn tutkimuskeskuksen DFKI:n tutkimusjohtaja.

"Kielten kieliteknologiatuen välillä on dramaattisia eroja. Tätä menoa 'suurten' ja 'pienten' kielten välillä ammottava teknologinen kuilu vieläpä levenee. Meidän on varmistettava, että myös pienemmillä kielillä on tarvittava perusteknologia, muuten nämä kielet on tuomittu digitaaliseen sukupuuttoon", raportin toinen toimittaja, tohtori Georg Rehm sanoo.