Page 8

DTUavisen0714

Ny supercomputer til life science Datamængder Både den industrielle bioteknologi og lægemiddelforskningen vil få glæde af en ny supercomputer, der placeres i et kommende high-performance computing-center på Risø Campus. Af Marianne Vang Ryde En supercomputer, der snart bliver opstillet på Risø Campus, bliver blandt de 100 største i verden. Den skal indgå i den europæiske forskningsinfrastruktur ELIXIR og hjælpe forskerne med at lagre og analysere de hastigt voksende mængder af biologiske data. Hvert halve år fordobles mængden af elektroniske data om levende organismers biologi. Man beskriver organismernes mindste bestanddele - celler, gener og proteiner - i alt fra bakterier og gærsvampe til mennesker. Man registrerer organismernes levevis i laboratorier og samler hospitalernes patientjournaler, der også inkluderer viden om livsstil. Med alle disse data om millioner af arter samlet i potente supercomputere kan man blive meget klogere, for eksempel på hvordan sygdomme hænger sammen og er koblet til bestemte gener, eller hvordan man skal ændre bakterier, så de bliver til den perfekte bioteknologiske cellefabrik. De enorme datamængder er i udgangspunktet meget uensartede og - når det drejer sig om mennesker eller kommercielle formål - samtidig meget sensitive, så computeren skal være optimeret netop til denne mangfoldighed, og man skal helst ikke flytte sine data for meget ud og ind af den. Derfor opbygger man i øjeblikket store såkaldte high-performance computing (HPC)-centre og kobler dem sammen i netværk som det europæiske ELIXIR, Danmark blev medlem af i dette forår. På den måde kan man gøre brug af hinandens data og analysere sig frem til nye, større sammenhænge. Professor ved DTU Systembiologi Søren Brunak har været bestyrelsesformand i ELIXIR’s startfase, og han står også bag anskaffelsen af det HPC-center, der er ved at blive installeret på Risø Campus. Potent og miljøvenlig Den nye supercomputer er blandt de 100 største i verden. Den kan rumme 7,5 petabyte data og er optimeret til de hastigt voksende datamængder. En petabyte er 1015 byte, og alle amerikanske forskningsbibliotekers data fylder tilsammen 2 petabyte; det siger lidt om størrelsen. I løbet af sommeren er der blevet ryddet en plads i det nordligste hjørne af Risø Campus bag den tidligere DMU-bygning. Her var det muligt at finde 3500 kvm til ny infrastruktur som denne supercomputer til life science, der vil fylde 800 kvm og bruge en megawatt strøm. Computeren ankommer i starten af oktober i to præfabrikerede containere udstyret med det hotteste inden for chipkøling. „CPU’erne bliver kølet med vand, der skylles direkte ind på dem og derefter via varmepumper sendes videre ind i fjernvarmesystemet, så varmen kan udnyttes. Allerede med disse første servermoduler vil Risø Campus være næsten 100 procent opvarmet med overskudsvarme fire måneder om året, og det bliver jo kun bedre i takt med, at sitet udbygges,“ fortæller chefkonsulent Peter Løngreen fra DTU Systembiologi, der koordinerer de danske bioinformatikgruppers arbejde på tværs af alle danske universiteter. National facilitet HPC-serveren bliver selvfølgelig et uvurderligt værktøj for alle på DTU, som beskæftiger sig med life science-data, men også andre DTU-forskningsgrupper vil få mulighed for at booke regnetid på supercomputeren. Derudover er alle store life science-forskningsgrupper i Danmark blandt brugerne ligesom en række af DTU Systembiologis udenlandske samarbejdspartnere, blandt andet Beijing Genomics Institute. „Vi regner med at komme op på omkring 500 brugere, når supercomputeren i løbet af efteråret bliver køreklar. I første omgang vil vi fokusere på alle områder inden for bioinformatikken, både den industrielle bioteknologi og lægemiddelforskningen, herunder personaliseret medicin, der anvender molekylær analyse af personer og deres sygdomme til at bestemme, hvilken behandlingsmetode, der vil virke bedst til hver enkelt gruppe. Det er et område med enorme potentialer, hvor high-performance computing spiller en helt essentiel rolle. Her vil der også være et væsentligt samspil med industrien, hvilket vi selvfølgelig lægger stor vægt på,“ siger Peter Løngreen. Ilus tration Emil Krog Niels en, DT U Campus Service Det nye High Performance Computing-site. De to hvide kasser i midten rummer supercomputeren, resten er køleanlæg, varmepumpe, elforsyning osv. De blå/gennemsigtige installationer viser den mulige fremtidige udbygning med supercomputere. The new High-Performance Computing site. The two white boxes in the middle contain the supercomputer—the rest are cooling systems, heat pumps, power supply, etc. The blue/transparent installations show the possible future expansion of supercomputers. ■■Få mere at vide Peter Løngreen, chefkonsulent, DTU Systembiologi, peterl@cbs.dtu.dk New supercomputer for life science Data volumes A new supercomputer currently being established at Risø Campus will be among the 100 largest in the world. It will form part of the European research infrastructure ELIXIR, helping researchers to store and analyse the rapidly growing volumes of biological data. Every six months, the volume of digital data on living organisms doubles. In everything from bacteria and yeast fungus to humans, the smallest components of living organisms— cells, genes and proteins—are described, their laboratory living conditions are recorded and hospital patient record data, including lifestyle knowledge, are gathered. All these data on millions of species stored on powerful supercomputers can teach us a great deal—e.g. how diseases are linked and coupled to particular genes or how to change bacteria so they act as the perfect biotechnological cell factory. Generally speaking, the huge data volumes are extremely heterogeneous and—in the case of personal data or data intended for commercial use—extremely sensitive, so the computer must be optimized to deal with this diversity and data transfer should therefore be kept to a minimum. Hence the emergence of large, so-called high-performance computing centres (HPC) connected to networks such as the European ELIXIR, which Denmark joined this spring. Such networks make it possible to utilize each other’s data to analyse new and larger contexts. 8  |  FORSKNING / RESEARCH  |    nr. 7·2014 Scan to read FULL articles dtu.dk/1407


DTUavisen0714
To see the actual publication please follow the link above