Twiittien liveseurantaa republikaanien kokouksessa Tampa Bayssa elokuussa.
Twiittien liveseurantaa republikaanien kokouksessa Tampa Bayssa elokuussa.

Tietokoneohjelma nuuskii, mistä aiheesta mikroblogistaniassa kohistaan viiden tunnin päästä.

Mikroblogipalvelu Twitter päivittää listaa twiittaajia kulloinkin eniten kiinnostavista aiheista. Järjestys nojaa aihetta käsittelevien twiittien määrän kasvuun.

Devavrat Shah Massachusettsin teknisestä yliopistosta opiskelijoineen pisti paremmaksi. He kehittivät algoritmin, joka ennustaa, mitkä aiheet ponkaisevat twiittajien suosikeiksi 1,5 tunnin päästä. Jotkin tulevat hitit se haistoi jo viisi tuntia etukäteen.

Kuten kaikkia oppivia algoritmeja, Shah'n ohjelmaa piti aluksi "harjoittaa". Se laitettiin kampaamaan dataa twiittiaiheista, joista aiemmin oli tullut suosittuja sekä toisista, jotka olivat jääneet twitterestanian seinäkukkasiksi. Oppimansa nojalla ohjelma sitten vertasi uusia twiittiaiheita aiemmista löytämiinsä kaavamaisuuksiin, punnitsi niiden painoarvoa ja arvasi, mihin aiheeseen tullaan tarttumaan hanakimmin.

Sisältö jatkuu mainoksen alla

Shah'n kokeissa koneopetus tehtiin 200 hittitwiittiaiheen ja 200 epäsuositun aiheen avulla. Kun algoritmi sitten päästettiin suorana twiittien kimppuun, se poimi tulevat hittiteemat 95-prosentin varmuudella. Shah arvelee MITin tiedotteessa, että ohjelman tarkkuus paranee entisestään isommilla opetusaineistoilla.

Sisältö jatkuu mainoksen alla

Tietokoneohjelma kiinnostanee paitsi Twitteriä, joka pystyisi sen avulla laskuttamaan mansikoita suosikkiaiheisiin linkatuista mainoksista, myös muita jatkuvasti muuttuvan tilastotiedon analysoijia ja hyödyntäjiä. Sillä voisi ennakoida esimerkiksi bussimatkojen kestoa, elokuvalippujen menekkiä, jopa osakekursseja. 

Sisältö jatkuu mainoksen alla