Väkivalta leviää netissä kuin tartuntatauti. Lietsojia vastaan käydään tunteita aistivilla tekoälyohjelmilla.

Teksti: Mikko Puttonen

Julkaistu Tiede-lehdessä 7/2012

Verkossa leviävät monenlaiset ideat, kuten vaikkapa ohjeet siitä, miten kaapata panttivanki.

Ei ole helppo sanoa, milloin verkon viestintä sysää liikkeelle tapahtumia tosielämässä. Kuitenkin kun verkkolehti al-Battar julkaisi kaappauskäsikirjan verkossa vuonna 2004, sitä seurasi sieppausten aalto Irakissa ja Saudi-Arabiassa.

Samana vuonna islamistinen Global Islamic Media -sivusto kertoi, ettei Espanja tarvitsisi kuin pari kolme iskua vetääkseen joukkonsa Irakista. Pian junat räjähtivät Madridissa ja lähes kaksisataa ihmistä kuoli.

Noista ajoista väkivaltainen viestiliikenne on vain kasvanut. Myös Norjan joukkomurhaaja Anders Behring Breivik otti vauhtia verkon vihasivustoista. Netissä kuplii väkivalta, joka räiskyy aika ajoin yli pahoin seurauksin.

Tutkijat luotaavat pimeitä alueita

Rikollisuutta ja terrorismia valvovat viranomaiset pitävät parhaansa mukaan silmällä, mitä verkon uumenissa muhii. Työmaa on kuitenkin valtava. Siksi Arizonan yliopiston tekoälylaboratorion johtaja Hsinchun Chen on ryhtynyt työtovereineen kehittämään tietoteknisiä työkaluja hämäräpuuhien valvomiseen.

– Kyse on pahiksista, jotka piileskelevät verkon pimeillä alueilla. Koetamme analysoida heitä ja tutkia, miten he toimivat ja vaikuttavat toisiinsa, Chen kuvaili Yhdysvaltain tieteenedistämisseuran vuosikongressissa helmikuussa Vancouverissa.

– Se on kuin Facebookin tai Twitterin tutkimista mutta paljon vaikeampaa, koska nämä ihmiset piileskelevät. He eivät halua, että heidän viesteihinsä päästään käsiksi.

Piilopaikkojen ovet aukeavat

Laboratorion tekoälytutkijat hankkivat pääsyn viesteihin, vaikka ne olisivat suojatuilla verkkosivuilla. Pimeän verkon sivustot voivat piiloutua valvovilta katseilta ohjelmilla, jotka torjuvat esimerkiksi kaikki yleisiltä hakukoneilta tulevat yhteydenotot. Chen on keksinyt kuitenkin keinon hämätä näitä suojauksia niin sanotuilla ryömintäohjelmilla. Kun ne kokoavat vaikkapa jonkin nettifoorumin viestiketjuja, ylläpitäjästä näyttää siltä kuin joku vain selaisi keskustelua.

Tutkijat ovat keränneet yli 10 000 sivustolta kenties maailman suurimman kokoelman ääriliikehdintään tai terrorismiin liittyviä verkkosisältöjä. Puolustusvoimien tai poliisien kokoelmien mittavuudesta ei ole tietoa, sillä ne ovat salaisia. Arizonalaisten tietokanta pitää sisällään likimain 500 miljoonaa nettisivua, tiedostoa ja viestiä.

Ja kokoelma kasvaa jatkuvasti. Ryömintäohjelmat hankkivat valikoiduilta verkon foorumeilta sisällöt joka toinen tai kolmas kuukausi. 300:lta terroristien keskustelufoorumilta otetaan talteen kaikki.

Videot opettavat pommintekoa

Pahantekijät luottavat myös kuvan mahtiin.Tekstin lisäksi pimeän verkon kokoelma onkin karttunut miljoonalla kuvalla ja 15 000 videolla ja niiden kommenteilla. Puolet tallennetuista videoklipeistä neuvoo, miten väkertää omatekoisia pommeja.

Terroristit eivät niinkään käytä internetiä varsinaisten iskujen suorittamiseen, Chen muistutti. Kyberiskuja enemmän heitä kiinnostavat tuhotyöt reaalitodellisuudessa. Verkko onkin kanava uusien terroristien värväämiseen, rahankeruuseen, propagandaan ja sielunveljien ajatustenvaihtoon.

Tällaista toimintaa harrasti esimerkiksi mieskolmikko, joka muutama vuosi sitten tuomittiin Britanniassa vankilaan terrori-iskuihin yllyttämisestä internetissä. Miehet muun muassa levittivät verkossa pyhien sotureiden myrkky- ja pommiopasta sekä kuvia terroristien tekemistä panttivankien teloituksista. Yksi heistä esiintyi nimimerkillä "irhabi007", jossa terroristia tarkoittavan arabiankielisen sanan jatkoksi oli pantu James Bondin kuuluisa agenttinumero.

Tekstistä syntyy sormenjälki

Ei riitä, että pimeään verkkoon pääsee käsiksi, sen valtavasta sisällöstä on myös kaivettava olennainen esiin. Tehtävässä auttavat Hsinchun Chenin kehittämät apuvälineet, kuten kirjoitussormenjälki, verkkosisältöjen tunneanalyysi ja vihan epidemiologia.

Kirjallisuudentutkijat ovat jo pitkään eritelleet suurten kirjailijoiden tyyliä määritelläkseen ne ainutlaatuiset ominaisuudet, jotka erottavat kirjailijain tekstin muiden teksteistä. Mutta me olemme kaikki shakespeareja, meillä kaikilla on kirjoitussormenjälkemme, jonka perusteella meidät pystyy tunnistamaan, myös netissä. Itse asiassa Chenin laboratorion kehittämä nettikirjoittajan tunnistusmenetelmä luotiin alun perin erottamaan Shakespearen kirjoittamat tekstit muista.

5–10 viestiä riittää

Tunnistus perustuu paitsi nimimerkkeihin myös lukuisiin tekstin piirteisiin: sanojen merkitykseen ja pituuteen, sanaston rikkauteen, tekstin pilkutukseen ja kappalejakoon sekä tervehdyksiin. Näissä piirteissä ihmiset ovat lähes yhtä yksilöllisiä kuin sormenjäljissäänkin: vaikka nimimerkki vaihtuisi, tyylin puumerkki pysyy.

– Tarvitsemme 5–10 viestiä, jotta sormenjälki voidaan rakentaa. Englannin kielellä saavutamme tunnistamisessa 95 prosentin tarkkuuden, arabiassa 92 prosentin, Chen sanoi.

Kirjoitussormenjäljestä rakennetaan kuvahahmo, johon voi verrata tunnistamattomista viesteistä luotuja hahmoja. Kun hahmot täsmäävät, kyse on samasta tekijästä. Tutkijat eivät kuitenkaan ota selvää oikeasta henkilöstä kirjoitusten ja nimimerkkien takana. Se on poliisiviranomaisten tehtävä, mikäli katsovat tutkinnan tarpeelliseksi.

Vihamittari näyttää punaista

Pimeässä verkossa kohtaa tällaisia viestejä: "Sanomme Amerikalle ja sen avustajille: vaviskaa kauhusta." "Hyvä Jumala, tuhoa vihollisesi ja muslimien viholliset." "Jihad taistelee Jumalan vihollisia vastaan." Lauseisiin on latautunut eri tavoin vihaa ja väkivallan uhkaa. Kun tällaisia keskusteluja käydään verkkofoorumeilla, joilla voi olla kymmeniätuhansia käyttäjiä, tunnelmia on mahdotonta tutkia ilman konevoimaa.

Apua tarjoaa Chenin laboratorion kehittämä koneellinen tunneanalyysi. Se pisteyttää viestit sen mukaan, miten voimakkaasti ne ottavat kantaa jonkin puolesta tai jotakin vastaan ja miten paljon ne henkivät vihaa, väkivaltaa ja rasismia. Tunneanalyysi tekee melko vähän virheitä: toimintatesteissä se arvioi viestin tunnelman väärin alle kymmenessä prosentissa tapauksista.

Yli 30 ryhmää tunnistettu

Tunneanalyysi voi paljastaa netissä poten­tiaalisia terroristeja tai vaikutusvaltaisia väkivallan lietsojia. Vihan leviämistä pystyy myös seuraamaan laskentamalleilla, jotka kuvaavat tartuntatautien kulkua.

– Väkivaltainen sosiaalinen media merkitsee meidän näkökulmastamme mielten tartuntoja, Chen vertasi.

Erään itsemurhaiskun jälkeen tutkijat mittasivat, miten tapahtuman kirvoittama kommentaari levisi netissä ja kuinka moni sai selvän tartunnan päähänsä. Tarttuvuus oli Chenin mukaan 2/10 000. Toisin sanoen kymmenestätuhannesta väkivaltameemin kohdanneesta kaksi altistui niin vakavasti, että heiltä saattaa odottaa pahaa.

Menetelmillään pimeän verkon tutkijat kertovat tunnistaneensa yli 30 terroristi- tai ääriryhmää. Tosin vielä ei tiedetä, kuinka vaaralliset aikeet ryhmillä on.