Page 34

Dynamo_42

”Life science involverer folk fra mange forskellige fagområder, for eksempel biologer og læger, og mange af dem har ikke en særlig computerscience-baggrund. Deres beregningsalgoritmer er hverken ensartede eller statiske, og dataene er ligeledes meget forskelligartede. De kan både bestå af genomer, proteiner, højt opløste røntgenbilleder og endda tekst i form af patientjournaler. Alt dette skal systemet kunne håndtere, ligesom det skal kunne klare at køre op til 1000 forskellige algoritmer. Derfor har vi lanceret et parallelt filsystem og en hybrid cloud, der kan håndtere sensitive data, og det er ret unikt inden for supercomputere.” Tiltrækker data Computerome strøg fra starten ind på listen over de 500 største computersystemer i verden. Den har 16.048 compute-kerner, tre petabyte eller 3.000.000 gigabyte hukommelse. Den har en lagerkapacitet på fire petabyte, og dens regnekraft er 410,8 teraflops (floating point operations per second). Der er et stykke vej op til verdens p.t. hurtigste, ‘Tianhe-2’ i Guangzhou, Kina, som klarer 33.862,7 teraflops, altså 82,4 gange mere. Men Computerome har rigeligt med fortrin til at tiltrække brugere fra store dele af verden, netop fordi den er specielt designet til life science. ”Vi har alene i 2015 genereret over halvanden petabyte data, og det er selvfølgelig en udfordring, som blandt andet betyder, at vi allerede nu må overveje at udvide lagerkapaciteten. Men det betyder også, at vi meget hurtigt er blevet en interessant samarbejdspartner for forskere fra ind- og udland. De kan se en fordel i at placere deres data her, også fordi vi er anerkendt for vores måde at håndtere sikkerheden omkring de ofte følsomme data og for vores dataanalyser,” siger Peter Løngreen. Computerome samler både sensitive data, som kun skal kunne tilgås af en afgrænset gruppe mennesker, og mere offentlige dataserier, som alle skal kunne bruge. Den er designet sådan, at alle data ligger i en såkaldt cloud, en slags virtuel computer, der svarer til, at den enkelte dataejer har sit eget private cluster. Det sikrer dataejerne 100 procent beskyttelse og samtidig, at de kan integrere hele eller dele af deres sensitive datasæt med de offentlige og på den måde få ny viden, for eksempel om bestemte sygdomme og deres sammenhæng med menneskelige gener. Lynhurtig databehandling Lektor Simon Rasmussen Sapiens’ udvandring fra Afrika egentilig foregik, bygger på en kortlægning af mange individers genomer, og her er Simon Rasmussen eksperten. Men han måtte melde pas, fordi han skulle på barsel nogle måneder. Opgaven blev derfor udliciteret til et af verdens tre største genomcentre. fra DTU Systembiologi har konkret erfaret Computeromes enorme potentiale i forbindelse med et projekt med Københavns Universitet og flere udenlandske universiteter. Projektet, der går ud på at forstå, hvordan Homo Marianne Vang Ryde 34 HIGH PERFORMANCE COMPUTING


Dynamo_42
To see the actual publication please follow the link above