BGI:n, eli Pekingin genomiikkainstituutin, geenitestien ja GM-ruoan myyntiautomaatti. Kuva: Scotted400 / Wikimedia Commons
 

Sukututkijoiden käyttämät tietokannat ovat paljastuneet rikostutkijoille todellisiksi aarreaitoiksi: uusilla tutkimusmenetelmillä on tunnistettu Yhdysvalloissa jo useita ratkaisemattomia murhatapauksia. Käytännössä uudet tutkintatavat tarkoittavat, että sukututkimustarkoituksiin internetiin ladattu perimätieto, voi paljastaa lähisukulaisen syyllisyyden esimerkiksi murhaan.

Perinteisesti poliisin käyttämä - ja tarkkaan tutkittu sekä varmistettu - DNA-tunnistusmenetelmä on toistojaksojen (STR, short tandem repeat) selvittäminen ja näiden vertailu eri näytteistä. Toistojaksoja käytetään vain 15-30 kappaletta, joten niiden kyky tunnistaa lähisukulaisia on kehno: näytteistä pystyy ehkä päättelemään ensimmäisen tai toisen asteen sukulaiset ja nekin epävarmasti. Käytännössä tämä tarkoittaa sitä, että poliisin keräämistä tietokannoista pystytään tunnistamaan vain vastaako näyte tietokannassa jo olevaa tietoa, eli onko kyseessä saman yksilön perimä.

Sukututkijat sen sijaan käyttävät DNA:ta tunnistamaan läheisiä ja kaukaisempiakin sukulaisia. Tähän tarkoitukseen DNA-näytteistä selvitetään satoja tuhansia markkereita (SNP, single nucleotide polymorphism), jolloin tutkimuksesta tulee paljon tarkempaa. Sukulaisuuksia voidaan selvittää tällä tavalla huomattavasti pidemmälle, esimerkiksi pikkuserkkuihin useamman polven taakse.

Kaupalliset geenitestit tuottavat sukututkimukseen soveltuvaa aineistoa. Yritykset eivät kuitenkaan anna keräämäänsä perimäaineistoa viranomaisten käyttöön ilman oikeuden päätöstä, joten tästä ei ole vielä iloa viranomaisille. Sen sijaan näytteen lähettäneet käyttäjät saavat koko aineiston haltuunsa ja he usein lataavat aineiston johonkin julkiseen tietokantaan, jossa he voivat analysoida omaa perimäaineistoaan eteenpäin. Nämä julkiset tietokannat ovat viranomaisille hyödyllisiä, koska sieltä he saavat kaiken aineiston käyttöönsä.

Tilanne on poliisille kuin jättivoitto. Siinä missä perinteinen DNA-näytteiden tunnistaminen on halpaa, sukututkimukseen vaadittava kattavampi sekvenointi maksaa enemmän. Kansalaiset ovat kuitenkin itse maksaneet nämä testit, joten poliisilla on käytössään ilmainen aineisto.

Kaikki Yhdysvalloissa toistaiseksi ratkaistut tapaukset ovat toimineet samalla logiikalla: poliisit ovat tuottaneet ratkaisemattomista tapauksista, joista on epäillyn tappajan DNA:ta, aineiston, joka on voitu ladata julkisiin tietokantoihin. Tämän jälkeen poliisit ovat hakeneet vastaavuuksia tietokannassa jo olleilta ihmisiltä omaan näytteeseensä ja saavat näin selville, onko tietokannassa näytteelle läheisiä sukulaisia. Muun väestötiedon, kuten iän, sukupuolen ja sijainnin avulla, näistä sukulaisista voidaan sitten rajata epäiltyjen joukkoa.

Kun poliisilla on rajattuna vain muutama epäilty, näiden tutkintaa on jatkettu perinteisin keinoin. Viimeistään DNA-näytteen avulla on pystytty varmistamaan todennäköinen epäilty.

Lupia poliisi ei kysele. Yleisesti käytetty GEDmatch-tietokanta ei tiennyt, että poliisi käytti tietokantaa tapausten setvimiseen. Helsingin Sanomien haastattelemien asiantuntijoiden mukaan Suomessa poliisin julkisista tietokannoista keräämä DNA-aineisto olisi lain kannalta harmaata vyöhykettä, eikä sitä ole vielä tehty.

Selvittämättömiä tapauksia on Yhdysvalloissa ratkottu tänä vuonna joukolla, koska julkiset perimätietokannat ovat vihdoinkin riittävän isoja. Tähän mennessä tapauksia on 17 ja vuoden loppuun mennessä niitä saattaa olla jo sata kappaletta.

 

Jotta epäillyn sukulainen löytyy tietokannasta, yhden tai useamman sukulaisen on oltava ladannut tietonsa tietokantaan. Mitä kaukaisempia sukulaisia on kyseessä, sitä useampia näytteitä tarvitaan.

Yaniv Ehrlich tutkimusryhmineen selvitti, kuinka laaja tietokanta on oltava, että sieltä voidaan rajata riittävän pieni epäiltyjen joukko. Jos kaksi prosenttia populaatiosta lataa perimätietonsa tietokantaan, käytännössä jokainen ihminen voidaan tunnistaa tietokannan avulla. Tämä raja ylittyy esimerkiksi yhdysvaltalaisten eurooppalaistaustaisten keskuudessa tänä tai ensi vuonna.

Julkiset perimätietokannat tuottavat merkittävän eettisen ongelman. Ongelma ei ole välttämättä siinä, että poliisi käyttää niitä tunnistamaan murhaajia. (Joskin ei tämäkään ole ongelmatonta, epäilyt kun monesti osuvat harhaan.) Ongelma on siinä, että kuka tahansa voi käyttää julkisia tietokantoja. 

Julkinen sukututkimustietokanta voi esimerkiksi romuttaa kokonaan tutkimuskäyttöön käytettyjen perimätietojen yksityisyyden. Julkisesti saatavilla olevasta anonymisoidusta DNA-sekvensisstä voidaa tuottaa tietokantaan sopiva muoto, ladata tämä tietokantaan ja etsiä sitten lähisukulaisia. Perimätiedon perusteella voidaan nykyisten tietokantojen aikakaudella tunnistaa kenestä on kyse.

Ehrlich tutkimusryhmineen ehdotti suhteellisen yksinkertaista tapaa, jolla perimätiedon yksityisyyttä voidaan parantaa: kaupalliset yhtiöt, jotka tuottavat aineistoja, voivat lisätä tiedostoihinsa salausavaimen. Julkisiin tietokantoihin otettaisiin tämän jälkeen vain näytteitä, jotka on tuottanut luotettava taho. 

 

Monin tavoin perimätietojen julkisuudessa ollaan menty jo niin pitkälle, että paluuta aikaan, jolloin perimätieto oli yksityistä, ei enää ole. Julkisissa tietokannoissa on jo niin paljon tietoa, että se koskettaa meitä kaikkia - enemmän tietenkin niitä ryhmiä, joista tietokannoissa on enemmän tietoa. 

Julkisista tietokannoista paljastuvat tiedot tulevat tuottamaan monia sekä iloisia että ikäviä yllätyksiä. Rikollisia tulee löytymään, lapset ja vanhemmat voivat kohdata toisensa ja monien ihmisten perimätieto tulee päätymään nimen kera julkisuuteen.

Kommentit (0)

Seuraa 

Kaiken takana on loinen

Tuomas Aivelo on ekologian ja evoluutiobiologian tutkijatohtori Helsingin yliopistossa. Hän karkaa arjestaan tutkimaan Helsingin viemärirottia, punkkeja ja metsämyyriä Alpeille, pohtimaan biologian oppimista tai ihan vain ihastelemaan loisia.

Teemat

Hae blogista

Blogiarkisto

2017
Heinäkuu
2016
2015
2014