IBM:n Thomas J. Watson -tutkimuskeskuksessa on kokeiltu tehokasta roskapostisuodinta, jossa käytetään dna-tutkimuksista tuttua tekniikkaa, New Scientist kertoo. Dna-...

IBM:n Thomas J. Watson -tutkimuskeskuksessa on kokeiltu tehokasta roskapostisuodinta, jossa käytetään dna-tutkimuksista tuttua tekniikkaa, New Scientist kertoo. Dna-tutkimuksissa tähdätään tuttuihin merkkijonoihin, jotka antavat viitteitä geenien toiminnasta. IBM:n roskapostimenetelmässä roskapostille tyypilliset merkkijonot saavat ohjelman heittämään sähköpostiviestin automaattisesti roskakoriin.

Ohjelma opetettiin tunnistamaan roskaposteja antamalla sen lukea 65 000 roskapostia ja saman verran harmittomia viestejä. Roskapostin tunnisteiksi valittiin sitten ne merkkijonot, joita esiintyi roskaposteissa paljon mutta vain harvoin harmittomissa viesteissä.

Näin saaduilla tunnisteilla pystyttiin sen jälkeen suodattamaan roskaposteista yli 96 prosenttia. Harmittomia viestejä ohjelma tulkitsi erehdyksessä roskapostiksi vain yhdessä tapauksessa 6000:sta.

Koska ohjelma keräsi tunnisteet automaattisesti, se löysi myös tapaukset, joissa roskapostisuotimia yritetään hämätä kirjainmuunnoksilla kuten "$ex" eikä "sex" tai kirjoittamalla ratkaisevat sanat väärin, esimerkiksi "Soffttwares at bottom prrice!".