Tähän mennessä sekvensoitujen noin 700 suomalaisten koronavirusnäytteiden sukupuu

Viime viikon sosiaali- ja terveysministeriön ja Terveyden ja hyvinvoinnin laitoksen tiedotustilaisuudessa Olli Vapalahti hieman ohi mennen sanoi: ”Syksyn kannat poikkeavat aika lailla siitä mitkä meillä kiersivät keväällä, jotka sitten varmaan hiipuivat pois.”

Tämä kuulosti mielestäni oleelliselta: keväällä Suomessa kiersi useita viruskantoja ja nämä sitten tukahdutettiin. Syksyksi olimme kuitenkin saaneet ulkomailta uudet kannat, jotka sitten muodostivat syksyn virusaallon.

Onneksi muutamia satoja suomalaisia virussekvenssejä on nyt saatu kansainväliseen GISAID-tietokantaan, joten asiain tola on helppo todeta aineistosta. Osasta suomalaisista koronavirustartunnoista on siis selvitetty niiden aiheuttaneen viruksen geenisekvenssi, eli perimän emäsjärjestys. Koronaviruksen perimä koostuu yksijuosteisesta RNA-ketjusta, jossa on hieman alle 30 000 emästä. Viruksen perimässä tapahtuu hitaasti, mutta varmasti, muutoksia eli mutaatioita. Keskimäärin niitä syntyy noin kaksi kappaletta kuukaudessa. Tämän takia pystymme vertailemaan eri virusnäytteitä ja päättelemään niiden välisiä sukulaisuuksia.

Tein nopean analyysin suomalaisista virussekvensseistä ja se tuki vahvasti Vapalahden väitettä: kevään ja syksyn viruskannat ovat hyvin erilaisia ja syksyn viruskantojen lähimmät sukulaiset ovat ulkomailta havaittuja viruksia.

Päätelmä kuitenkin selkeästi herätti epäilyksiä. Esimerkiksi Terveyden ja hyvinvoinnin laitoksen tutkimusprofessori Markku Peltonen oli Twitterin puolella hyvin kriittinen: ”En ymmärrä miten tällaiseen johtopäätökseen voi päätyä näillä sekvenssimäärillä.” Muista tutkijoista esimerkiksi Annamari Heikinheimo ja Mikael Niku suhtautuivat kriittisesti, että miten muutamalla sadalla selvitetyllä sekvenssillä voidaan tehdä päätelmiä, jos tartuntoja on kokonaisuudessaan kymmeniätuhansia.

Ehkäpä siis on syytä aukaista koko prosessia: kirjoitan tässä blogissa ensiksikin siitä, (I) miten sekvenssitietoa voidaan analysoida, sitten siitä (II) mitä sekvenssitiedosta voidaan yleisesti päätellä ja tarkemmin (III) mitä Suomen virusnäytteistä voidaan päätellä. Jos tekniset yksityiskohdat eivät kiinnosta, voit siis hyvin hypätä ensimmäisen osan yli.

Taustaksi on hyvä ymmärtää, että SARS-CoV-2 -koronavirus on sekvensointimääriltään parhaiten tutkittu taudinaiheuttaja. Vuodessa kansainvälisesti sekvensoitujen virusten määrä on yli 300 000 ja Suomessakin virusta on sekvensoitu satoja näytteitä. Liikumme siis koronaviruksen evoluution kanssa niin vankalla pohjalla kuin taudinaiheuttajan kanssa ylipäänsä voidaan.

 

I

Tein suomalaisista virussekvensseistä fylogeneettisen – eli evolutiivisia sukulaisuussuhteita käsittelevän – puun. Tämä on suhteellisen suoraviivaista: keräsin tietokannasta kaikki koronavirussekvenssit ja ajoin sen Nextstrain-työkalun läpi. Lyhyesti: työkalu linjaa kaikki virussekvenssit, laskee niiden väliset erot, päättelee näistä virusten sukupuun ja lopulta tekee siitä nätin kuvan.

Suomalaista sukupuuta varten valitsin kaikki suomalaiset virussekvenssit. Nämä näytteet pitää asettaa tietenkin kansainväliseen kontekstiin, joten Nextstrain arpoo mukaan muita virusnäytteitä sen mukaan, että suomalaisille näytteille läheistä sukua olevilla virusnäytteillä on suurempi todennäköisyys päätyä mukaan. Sukupuu siis muodostaa mahdollisimman hyvän kuvan, mistä suomalaisille virusnäytteille läheisimmät sukulaiset ovat löytyneet.

Rakentamani sukupuun näkee tästä linkistä: https://nextstrain.org/community/aivelo/cov-finland?f_country=Finland Nyt valinta automaattisesti korostaa suomalaiset näytteet oransseina palloina - jos tämän filtterin ottaa pois päältä sukupuun yläpuolelta, niin puusta erottuvat kaikki eri maiden mukaan otetut näytteet. Puussa näytteet ryhmittyvät yhteen sukulaisuutensa perusteella ja x-akselilla on aika. Vasemmalla on siis kevään näytteet ja oikealla syksyn. Puun haaroja painamalla voi tarkentaa tiettyyn osaan puusta. Jos sivupaneelista valitsee "time" sijasta "divergence" puusta hahmottaa paremmin, että mitkä näytteistä ovat identtisiä ja missä on tapahtunut evoluutiota.

Mitä tästä puusta sitten voi oikein nähdä? Ensinnäkin, näytteet jakautuvat ryhmiin, joissa on enemmän tai vähemmän näytteitä. Näiden ryhmien sisällä kaikki näytteet ovat Suomessa kerättyjä. Tämä siis tarkoittaa, että ne ovat samaa Suomessa tapahtunutta tartuntaklusteria. Virus ei muutu jokaisen tartunnan yhteydessä, vaan keskimäärin noin joka kolmannen kohdalla.

Esimerkiksi tässä kuvassa on yksi laaja tartuntaklusteri, jossa on mukana yli 200 näytettä ja joka on kestänyt yli neljä kuukautta. Klusterin lähimmät sukulaiset ovat irlantilaisia näytteitä (sinisellä puun alareunassa). Suomalaisen klusterin sisällä on lisäksi tanskalainen ja norjalainen näyte (turkoosit pallot).
Esimerkiksi tässä kuvassa on yksi laaja tartuntaklusteri, jossa on mukana yli 200 näytettä ja joka on kestänyt yli neljä kuukautta. Klusterin lähimmät sukulaiset ovat irlantilaisia näytteitä (sinisellä puun alareunassa). Suomalaisen klusterin sisällä on lisäksi tanskalainen ja norjalainen näyte (turkoosit pallot).

Syksyn ja kevään tartuntaklusterit eivät ole samoja: kaikkien syksyn tartuntaketjujen lähin tunnettu sukulainen on joku ulkomainen näyte. Läheisimmissä sukulaisissa on edustettuna eri maita, pääosin Euroopasta: Tanska, Ranska, Irlanti, Venäjä ja niin edelleen.

Puulla on rajoituksensa: tein analyysin suhteellisen pikaisesti, joten en varmistanut yksittäin, miten suomalaisten tartuntaklustereiden lähimmät sukulaiset oikeasti asettuvat ja miten onnistuneesti Nextstrain arpoi mukaan näytteitä. Lisäksi tietokannoissa on hyvin vaihtelevasti näytteitä eri maista: siinä missä Iso-Britanniasta ja Tanskasta on paljon, Virosta ei mukaan päässyt yhtään näytettä. Itä-Eurooppa on myös heikosti edustettuna. Saattaa siis olla, että suomalaisten virusnäytteiden lähimmät sukulaiset ovat yksinkertaisesti sekvensoimatta. Tämän takia kannattaa suhtautua epäilevästi, että tällä analyysillä on pystytty tunnistamaan maita, josta virus on Suomeen levinnyt. Kun näytteitä on sekvensoitu vähän, tietenkin viruksia voi myös levitä Suomesta muualle ja sitten tämä näyttää tuottavan puun, josta suunta näyttääkin toiselta.

Tässä puussa ei ole mukana muita lentokentällä kerättyjä näytteitä kuin joulukuun lopulla havaitut kolme uutta B.1.1.7-muunnosta kantanutta tartuntaa. Näytteiden keruu lentokentiltä tietenkin paisuttaa eri virustartuntaketjujen määrää, eivätkä ne anna hyvää kuvaa siitä, mitä Suomessa kotoperäisesti tapahtuu. Sikäli ne on hyvä sulkea pois tämänkaltaisesta tarkastelusta.

Suomalaiset näytteet ovat lähes täysin Uudenmaan alueelta. Tämä tarkoittaa, ettemme saa hyvää kuvaa siitä, että miten virukset ovat liikkuneet Suomen alueella. Suomalaisista todellisista tartuntamääristä on lisäksi sekvensoitu varmaankin alle prosentin verran. Virusotos on tutkijoiden mukaan pääsääntöisesti satunnainen, mutta näytteissä saattaa olla vahvat positiiviset yliedustettuna, koska näistä jää helpommin riittävästi näytettä sekvensoitavaksi. Yleinen käsitys koronaviruksesta kuitenkin on, että eri haarojen välillä ei ole eroa taudin vakavuudessa, joten tämän ei pitäisi vaikuttaa.

Mistä sitten voidaan tietää, että näytemäärämme on riittävän iso, että olemme tunnistaneet pääosan merkittävistä tartuntaklustereista? Virusklustereiden luonteeseen kuuluu, että niitä ei ole loputonta määrää. Tilannetta kuitenkin vaikeuttaa, että klustereiden kokojakauma saattaa olla haasteellinen: jos on yksi iso klusteri ja loput ovat pieniä, näytteitä pitää saada melko paljon.

Riittävän laajan näytteenoton tunnistamiseen on kätevä ikiaikainen tapa: akkumulaatiokuvaaja. Lyhyesti: ensin laskemme kuinka monta eri tartuntaklusteria olemme havainneet ja kuinka monta näytettä kussakin on. Sitten alamme arpoa tuosta joukosta näytteen kerrallaan ja piirrämme kuvaajan, jossa y-akselille on merkitty havaittujen klustereiden määrä ja x-akselille arvottujen näytteiden määrä. Kuvaaja kuvaa, että kuinka monta näytettä pitää kussakin vaiheessa kerätä, että kaikki klusterit on havaittu. Kun kuvaaja tasoittuu, tiedämme, että olemme saaneet lähes koko diversiteetin havaittua. Nämä kuvaajat näyttävät kevään ja syksyn suomalaiselle virusklustereille tältä:

Kevään klusterit Syksyn klusterit

Koska molemmat kuvaajat ovat tasaantumassa, tämä kertoo, että näytekoon lisääminen ei paljasta kovin paljon enempää tartuntaklustereita. Tämä kertoo siitä, että emme ole saaneet vielä havaittua kaikkia klustereita, mutta lähestymme sitä hyvin. Syksy on myös avoin aikasarja sikäli, että mukaan on laskettu kaikki klusterit tähän asti - niitähän tulee todennäköisesti jatkuvasti lisää maahan. Kuvaajista näkee myös, että keväällä klustereita on ollut vähemmän kuin syksyllä.

Päätelmien uskottavuutta lisää vielä se, että fylogeneettinen puu osuu yksiin epidemiologisen tiedon sekä sen kanssa, mitä tiedämme hengitystievirusten leviämisestä.

Ensinnäkin: keväällä R-arvo, eli viruksen uusiutumisluku, oli Suomessa pitkään alle yhden, mikä tarkoitti, että epidemia pieneni. Tämän takia voimme olettaa, että merkittävä osa tartuntaketjuista loppui. Kesällä puolestaan Suomessa oli hyvin vähän virustapauksia ja melko suuri osa näistä linkittyi ulkomailta Suomeen matkustaviin. Tämä sopii yhteen ajatuksen kanssa, että kotoperäiset tartuntaketjut tukahtuivat ja uudet maahan tulleet tartuntaketjut olivat syksyn aallon takana.

Toiseksi: tiedämme, että influenssaviruksen maailmanlaajuinen kierto tapahtuu ennen kaikkea (lento)matkustajien mukana ja muutkin hengitystievirukset näyttävät seuraavan samaa kaavaa. Korona siis toimii, kuten olettaisimme.

 

II

Iso-Britannia johtaa selkeästi maailmanlaajuista koronaviruksen sekvensointityötä. Lähes puolet kaikista reilusta 300 000 sekvensoidusta näytteestä on brittien tekemiä. Britit käyttävät sekvensointia apuna esimerkiksi tartunnanjäljityksessä.

Virusnäytteiden sekvenssejä vertailemalla voimme sanoa kuinka läheistä sukua ne ovat. Jos esimerkiksi koulussa on useita virustartuntoja, näytteet sekvensoimalla voimme selvittää ovatko nämä samaa virusklusteria, eli tartunta leviää todennäköisesti koulussa, vai ovatko ne eri klustereita, jolloin tartunnat luultavasti tulevat koulun ulkopuolelta. Hyödyllisyys on tietenkin rajallista: koska kaikissa sukupolvissa muutoksia ei viruksen perimään tapahdu, mihinkään erityisen suureen tarkkuuteen tässä ei pääse.

Suurimmalla osalla maailman maista ei ole rkykyä käyttää sekvenssejä tartunnanjäljityksessä. Muut maat, jossa sitä käytetään, kuten Islanti, Taiwan, Singapore ja Uusi-Seelanti, ovat maita, jossa tartuntoja on huomattavasti vähemmän. Lisäksi Britannian ei voida erityisen hyvin sanoa suoriutuneen tästä pandemiasta, joten on myös kyseenalaista, kuinka hyödyllistä sekvensointi oikeasti on tartunnanjäljityksessä.

Virussekvenssit soveltuvatkin paremmin laajemman tilannekuvan muodostamiseen: mistä tartuntoja on maahan tullut ja miten ne maan sisällä leviävät. Esimerkiksi heti pandemian alkuvaiheessa tutkijat sekvensoivat virusnäytteitä Washingtonin osavaltiossa ja huomasivat, että näytteet eroavat toisistaan niin paljon, että niiden lähin yhteinen esimuoto on puolentoista kuukauden takaa. Tämä tarkoittaa todennäköisesti sitä, että virus oli levinnyt huomaamatta puolentoista kuukauden ajan.

Suomessa voitaisiin laajemman sekvensoinnin perusteella esimerkiksi tutkia, mistä maista tartuntoja on tullut Suomeen ja miten Suomen sisäiset tartunnat leviävät maakunnasta toiseen. Tämä auttaisi toisaalta selvittämään kuinka merkittävää leviäminen ulkomailta on ja mihin valvontaa kannattaa kohdistaa. Lisäksi on epäselvää, kuinka vahvasti maakunnat seuraavat toisiaan tautitilanteessa ja kuinka paljon tartunnat liikkuvat maakunnasta toiseen: parempi tilannekuva voi helpottaa alueellisten toimien kohdistamisessa.

Suomessa on sekvensoitu tähän mennessä reilu 800 näytettä ja sekvensointityötä ollaan nyt huomattavasti tehostamassa. Sekvensointia Suomessa hoitaa Helsingin yliopiston virologian laitoksen tutkijat muun koronavirustyön yhteydessä. Suomessa ei ole omasta takaa tutkijaryhmiä, jotka olisivat tehneet taudinaiheuttajien laajaa ja kattavaa sekvensointia. Tämä on suhteellisen tuore lähestymistapa epidemioihin, koska sekvensointiteknologiatkin ovat suhteellisen uusia. Laajaa sekvensointia on tähän asti tehty lähinnä maissa, joissa yksinkertaisesti on enemmän tutkijoita ja resursseja, eli tutkimusrahaa, käytettävissä. Lisäksi monet tutkijat ovat keränneet kokemusta tekemällä reaaliaikaista sekvensointia esimerkiksi zika- ja ebolaepidemioissa. Olettaisin, että tämä kotimaisen kokemuksen puute on syynä myös siihen, miksi esimerkiksi terveysviranomaiset eivät pysty käynnistämään laajamittaista sekvensointia.

Laajemmin sekvensoinnilla voidaan seurata miten viruksen evoluutio etenee. Esimerkiksi Briteissä ensimmäiseksi löydetyn B.1.1.7-variantin havainnointi vaatii geenisekvensointia. Tämän muunnoksen Suomeen leviämisen estäminen onkin ajanut kiinnostusta virusten sekvensointiin.

Kun selvitetään, mitkä kohdat viruksessa ovat muuttuneet, voidaan tietokonemallinnuksin tai laboratoriotutkimuksella arvioida, miten viruksen toiminta muuttuu. Kiinnostavaa on, että mahdollistavatko viruksessa tapahtuvat mutaatiot immuunipuolustuksen väistämisen. Tämän takia muutoksia erityisesti viruksen piikkiproteiinissa, joka sitoutuu ihmisen soluihin, seurataan tarkoin ja muutosten merkitystä testataan jatkuvasti. Tällöin voidaan vertailla, miten koronaviruksen sairastaneen tai rokotteen saaneen ihmisen vasta-aineet pystyvät neutralisoimaan muuntuneen viruksen.

 

III

Suomalaiset virussekvenssit kertovat hyvin selkeästi, että keväällä ja syksyllä maassa ovat kiertäneet eri viruskannat. Kevään tehokkailla toimilla saatiin tukahdutettua leviävät tartuntaketjut, mutta heinäkuusta lähtien maahan tulleet uudet tartuntaketjut laajenivat syksyllä toiseksi aalloksi.

Olisi väärin päätellä, että syksyinen toinen aalto johtuu ulkomaisista tartunnoista. Sinänsä jos ulkomailta ei olisi tullut tartuntoja, hyvin todennäköisesti aaltoa ei olisi tullut. Jos ulkomailta olisi tullut huomattavasti vähemmän tartuntoja kuin tuli, tilanne olisi varmasti samanlainen kuin juuri nyt. Tämä johtuu siitä, että Suomen epidemianhallintaa säätelevät tietyt tartuntojen määrien raja-arvot. Vähemmillä maahantulleilla viruksilla tartuntaklustereita olisi vähemmän ja niiden kasvu olisi ehkä kestänyt hieman kauemmin, mutta ne olisivat isompia ennen kuin niiden leviämistä tehokkaasti rajattaisiin.

Ulkomaiset ja kotoperäiset tartunnat eivät ole toisensa poissulkevia: Suomessa on ollut vähän tartuntoja, joten eri tartuntaketjut eivät kilpaile keskenään. Ne jatkuvat niin kauan kuin jatkuvat. Jos syntyy uusi paremmin leviävä virusmuunnos, kuten B.1.1.7 vaikuttaa olevan, se ei suoraan kilpaile kotoperäisiä kantoja pois. Syrjäyttäminen tapahtuu sitä kautta, että kotoperäiset tartuntaketjut sammuvat helpommin kuin paremmin leviävän kannan tartuntaketjut. Tällöin suhteelliset jatkuvasti suurempi osa on paremmin leviävää virusmuunnosta.

Viruksen perimän selvittäminen on siis tehokas keino selvittää, mitä Suomessa oikein tapahtuikaan keväällä, kesällä ja syksyllä. Nyt kun virussekvensointia merkittävästi lisätään, pysymme ehkä hieman reaaliaikaisemmin kartalla miten virus Suomessa kiertääkään.

 

Jatkan Suomen virussekvenssien sukupuun päivittämistä säännöllisesti sitä mukaan, kun GISAID-tietokantaan tulee lisää näytteitä. Kiitokset Teemu Smuralle tiedoista suomalaisen virussekvensoinnin otoksen kattavuudesta.

Kommentit (8)

Sisältö jatkuu mainoksen alla
Sisältö jatkuu mainoksen alla
Seuraa 

Kaiken takana on loinen

Tuomas Aivelo on ekologian ja evoluutiobiologian tutkijatohtori Helsingin yliopistossa. Hän karkaa arjestaan tutkimaan Helsingin viemärirottia, punkkeja ja metsämyyriä Alpeille, pohtimaan biologian oppimista tai ihan vain ihastelemaan loisia.

Teemat

Hae blogista

Blogiarkisto

2018
2017
Heinäkuu
2016
2015
2014
Sisältö jatkuu mainoksen alla