MRCA:n todennäköisyyslaskelman tarkkuus?

Seuraa 
Viestejä9031
Liittynyt16.3.2005

Miten tulisi suhtautua todennäköisyyslaskelmiin, joita saa geenitesteistä?

Teetin Y-DNA -tutkimuksen itselleni, ja muiden analyysien lisäksi sain taulukot todennäköisyyksistä sille, kuinka todennäköistä on sukulaisuussuhteeni (most recent common ancestor, isälinjalla) muiden testin tehneiden ihmisten kanssa. Tietokannan mukaan kaikkein läheisin 67 markkerin testannut henkilö sai tällaiset arvot vertailussa minuun:

[list:wpldw1pz]Knowing that D.D. and N.N. could not have had a common ancestor in the last 3 generations, their 67 marker comparison shows that the probability that they shared a common ancestor within the last...
3 - 5 generations is 35.63%
7 generations is 64.79%
9 generations is 82.62%
11 generations is 92%
13 generations is 96.5%
15 generations is 98.52%
17 generations is 99.4%
19 generations is 99.76%
21 generations is 99.9%
23 generations is 99.96%
25 generations is 99.99%
[/list:u:wpldw1pz]
Koska tällaisia tapauksia on tähän mennessä löytynyt kaksi, voitaisiin tuon taulukon perusteella päätellä että todennäköisyys sille että vähintään toinen on serkkuni korkeintaan 5 sukupolvea taaksepäin on noin 60%. Mutta onko asia niin yksinkertainen?

FTDNA:n tietokannassa on noin 30 000 ihmistä, jotka ovat testauttaneet 67 markkeria. Jos olettaisiin että jokainen näistä 30 000 ihmisestä olisi serkkuni vaikkapa tasan 10 sukupolvea taaksepäin, eikö olisi kuitenkin todennäköistä että sattuman kautta aika moni heistä saisi melko läheisen vastaavuuden 67 markkerin testissä minun kanssani? Meidän suvuissamme olisi tapahtunut sattumalta samat mutaatiot vuosisatojen kuluessa, johtaen siihen että Y-DNA:mme olisivat yhtä samanlaisia keskenään kuin viiden sukupolven takaisilla serkuilla keskimäärin.

Näin ollen näin suuresta tietokannasta valitsemalla "parhaat päältä" saataisiin aina joitain "onnekkaita" vastaavuuksia, joiden todellinen sukulaisuussuhde onkin todennäköisesti paljon etäisempi kuin mitä taulukkoa suoraan lukemalla voisi päätellä.

Onko jossain tietoa siitä, mitkä matemaattiset lait vaikuttavat tällaisten todennäköisyyksien muodostumiseen ja miten tuollaisia taulukoita tulisi lukea? Tässä on yksi selityssivu, mutta siinä ei nähdäkseni käsitellä aihetta tältä kannalta:
http://nitro.biosci.arizona.edu/ftdna/TMRCA.html

Kommentit (0)

Uusimmat

Suosituimmat