Uudet supertietokoneet louhivat dataa, murskaavat numeroita ja nostavat Suomen korkealle konetehon
top 500 -listalla.


ja nostavat Suomen korkealle konetehon top 500 -listalla.



Pohjolan kivikalliossa, yhdeksän lukon takana oli kerran Sampo. Se jauhoi Pohjolan väelle ruokaa ja rahaa. Espoon Otaniemessä on nyt samanlaisessa luolassa Louhi. Se louhii meille tietoa.

Louhi on Suomen uusi supertietokone. Maallikkokansalaisen silmään se ei näytä kovin superilta eikä edes tietokoneelta vaan riviltä peltisiä pukukaappeja. Ovet ovat sentään pirteän pinkit ja vihreät. Ne on tilattu Tieteen tietotekniikan keskuksen CSC:n logoväreissä, paljastaa koneiden isäntä, CSC:n toimitusjohtaja Kimmo Koski.

Huomaamattomasta ulkomuodostaan huolimatta Louhi on todella kova pakkaus, kehuvat amerikkalaisvieraat, jotka ovat myös tulleet mukaan kurkistamaan maailman supereitten kuopusta.

Heitä voi tässä asiassa uskoa. Tennesseen yliopiston tietojenkäsittelytieteen professori Jack Dongarra on maailman supertietokoneiden top 500 -listan isä ja ylläpitäjä. Kalifornian teknisessä korkeakoulussa Caltechissä ja Yhdysvaltain ilmailu- ja avaruushallinnon Nasan suihkumoottorilaboratoriossa työskentelevä Thomas Sterling on erityisesti perehtynyt supertietokoneiden ohjelmointiin. Heidät oli kutsuttu esiintymään Otaniemeen uuden koneen kunniaksi pidettyyn suurteholaskennan seminaariin.

Jos Louhi-rouva olisi jo täysissä voimissaan, se olisi voinut sijoittua peräti kärkikymmenikköön kesäkuussa julkistetulla tuoreella top 500 -listalla. Alkukankeana siitä irtosi testauksessa vasta reilu kymmenesosa tulevasta huipputehosta, ja sijoitus oli 109:s.




Neljä esimerkkiä suomalaisesta tutkimuksesta, joka hyötyy uudesta supertietokoneesta:

Aerosolien vaikutus ilmastonmuutokseen
Havumetsät päästävät ilmaan pienhiukkasia, jotka vaikuttavat pilvipisaroiden kasvuun. Pilvisyyden lisääntyminen taas voisi jarruttaa ilmaston lämpenemistä.

Alle kymmenen nanometrin kokoisten hiukkasten kasvua ja kulkeutumista kuvaavat mallit täytyy kytkeä ilmakehämalliin, hydrologiseen malliin ja biosfäärimalliin, jotta voidaan selvittää hiukkasten kokonaisvaikutusta maailmanlaajuiseen ilmastonmuutokseen.

Solukalvot ja lääkemolekyylit

Jos opitaan tuntemaan solujen toimintaa ja viestintää, saadaan selville myös lääkeaineiden vaikutusmekanismeja ja pystytään kehittämään uusia. Suomessa tutkitaan muun muassa antibioottien vuorovaikutusta solukalvojen kanssa ja lääkeaineita soluihin kuljettavien rasva-aineiden rakenteita.

Maailmankaikkeuden ikä ja
koostumus

Euroopan avaruusjärjestön Esan Planck-satelliitti lähtee ensi vuonna avaruuteen mittaamaan mikroaaltosäteilyä, joka on jäänne alkuräjähdyksen ajoilta. Tämän kosmisen taustasäteilyn perusteella on mahdollista laskea maailmankaikkeuden ikä ja tavallisen aineen, koostumukseltaan tuntemattoman pimeän aineen ja energian määrät sekä se, miten maailmankaikkeus on laajentunut. Huomattava osa laskennasta on tarkoitus tehdä suomalaisin voimin.

Fuusioreaktorin toiminta

Fuusioenergia voisi tyydyttää päästöttömästi koko maailman energiantarpeen. Jotta fuusiovoimala toimisi, täytyy tukahduttaa fuusioplasman pyörteet ja löytää reaktoriin materiaalit, jotka kestävät valtavaa kuumuutta. Molempien ongelmien ratkaisemiseen tarvitaan suurta laskentatehoa.
Ennennäkemättömiä mahdollisuuksia

Supertietokoneilla eittämättä kilpaillaan statuksesta. Sterling myöntää, että amerikkalaisille oli kova paikka, kun ykköseksi nousi pari vuotta sitten japanilainen kone. Mutta jotain koneilla tehdäänkin, eikä vain kehuskella. Parhaat pystyvät laskemaan sellaista tahtia, että päästäksemme samaan ihmisvoimin jokaisen maailman kansalaisen vaarista vauvaan pitäisi suorittaa 43 000 laskutoimitusta sekunnissa.

Tämä laskuvoima avaa tieteessä mahdollisuuksia, jotka muuten olisivat pelkkää päiväunta. Ennen muinoin tutkimuksen kaksi peruspilaria olivat teoria ja kokeet. Nyt kolmanneksi on tullut laskenta. Sen avulla on mahdollista korvata tai toistaa kokeita, jotka olisivat kalliita tai täysin mahdottomia. Tietokonemallinnuksilla voidaan esimerkiksi havainnoida kahden galaksin yhteentörmäystä tai kokeilla, mikä saa lentokoneen sakkaamaan.

Universumin rakenteen selvittäminen vaatii suurteholaskentaa, ja biologiakin pureutuu yhä monimutkaisempiin systeemeihin. Dna:n, proteiinien ja solukalvojen toiminnan mallintamiseen tarvitaan yhä lisää laskuvoimaa. Biotieteet haukkaavat jo kymmenesosan Tieteen tietotekniikan keskuksen koneajasta.

Optimointiklinikka auttaa ohjelmoinnissa

Hyödyn saamiseksi koneita täytyy osata käyttää. Niihin tarvitaan käyttöjärjestelmät ja sovellukset. Tutkittavat mallit täytyy vääntää matematiikaksi ja kääntää ohjelmiksi.

- Algoritmit ja ohjelmistot eivät ole enää pysyneet koneiden kehityksen perässä, ja siksi niistä ei saada kaikkea irti, Dongarra pahoittelee.

Suomen CSC:ssä on töissä 150 ihmistä. Suuri osa heistä auttaa tutkijoita käyttämään koneita parhaalla tavalla. Tarjolla on myös nippu valmisohjelmia. Esimerkiksi kemistit käyttävät  niitä ahkerasti. Fyysikot taas kirjoittavat ohjelmansa itse.

Vaikka tutkijat olisivat nerokkaita, heidän ohjelmansa eivät aina ole täydellisiä. Sen vuoksi laskentakeskuksen palveluihin kuuluu Tekesin kanssa perustettu optimointiklinikka. Tehoja tuhlaavia ohjelmia parannellaan niin, että tietokoneen tarvitsee runksutella vähemmän nollia ja ykkösiä.

- Joskus näin on menetetty asiak¬kaita, koska ohjelman optimoinnin jälkeen ei enää tarvittu superlaskentaa, johtaja Koski kertoo.

Verkottaminen ei korvaa superkoneita

Tietokoneiden tehot kasvavat edelleen hurjaa vauhtia. Intelin perustaja Gordon Moore esitti vuonna 1965 Mooren lain, jonka mukaan transistorien määrä kaksinkertaistuu mikropiireissä runsaan vuoden välein.  Dongarran mukaan laki pätee yhä.

- Koneet kehittyvät eksponen¬tiaalisesti. Niiden teho kaksinkertaistuu joka puolestoista vuosi.

IBM julkisti kesäkuun lopussa uuden Blue Gene -koneen, joka on kolme kertaa tehokkaampi kuin maailman tähän asti tehokkain kone, edellinen Blue Gene. Senkin huipputeho on viisi kertaa suurempi kuin Louhen.

Miksi tarvitaan aina vain tehokkaampia tietokoneita, jos tehoja ei enää osata kunnolla käyttää? Onhan keksitty gridit eli verkot, joissa suurteholaskentaa voi jakaa eri tietokoneille. Suomenkin superkoneet ovat osa eurooppalaista Deisa-verkkoa. Siinä EU-maat jakavat yhteistä laskentavoimaa.

Tiedon siirtely verkossa vie kuitenkin aikaa, ja se maksaa, vastaa Sterling. Niissä sekunnin murto-osissa, jotka datan matka Euroopan halki kestää, supertietokone ehtii tehdä  miljoonia laskutoimituksia. Joskus gridi voi myös olla tukossa. Jos tarvitaan tiukkaa kommunikointia ja nopeaa laskentaa, yksittäinen superkone on ehdoton.
Erilaiset koneet ja verkot ovatkin parhaimmillaan erilaisissa tehtävissä.





20 % biotieteet
18 % kemia
14 % fysiikka
9 % tietojenkäsittelytiede
7 % nanotiede
4 % tekniikka
4 % virtauslaskenta
4 % teollisuus
4 % kielitiede
3 % matematiikka
3 % lääkeainesuunnittelu
10 % muut

Karvalakkimallillekin käyttönsä

capability

capacity

Joskus koneiden verkottaminen riittää



Seti@home-projektissa