Lynalgoritmer skal udrydde flaskehalse inden for DNA-analyse

Genodesk: Martin Bundgaard har sagt farvel til en stilling i en international medicokoncern og goddag til INCUBA StartupLab, hvor han anvender sin matematiske baggrund til at udvikle avancerede algoritmer til analyse af den menneskelige arvemasse.

Af Christian Bjerggaard Jørgensen

På endevæggen i det lille kontor hænger et whiteboard dækket af rød tusch i mønstre og regnestykker vel uden for lægmands rækkevidde. Ved et skrivebord midt i lokalet sidder 37-årige Martin Bundgaard lænet over en 13” bærbar og komponerer de algoritmer, der skal udgøre fundamentet i hans nye virksomhed Genodesk.

Genodesk udvikler software til Next Generation Sequencing; en forholdsvis ny metode til nøjagtig kortlægning af baserne i vores DNA. Teknikken gør det muligt at indhente enorme datamængder på kort tid og sekventere hele det menneskelige genom på én gang. Udviklingen af programmer, der kan analysere de enorme datamængder inden for en overkommelig tidsramme, halter imidlertid bagefter.

”Selvom det er blevet bedre, er der er stadigvæk områder, hvor analysedelen udgør en stor flaskehals,” siger Martin Bundgaard, der i maj flyttede ind i StartupLab for at hellige sig projektet.

Han kommer fra en stilling som lead developer i den tyske medicokoncern QIAGEN, der i 2013 opkøbte aarhusianske CLC bio, hvor Martin Bundgaard arbejdede med udvikling af algoritmer til analyse af biodata.

”Der var stadig mange spændende opgaver, men de helt store skridt, hvor man virkelig laver om på alting og tager det til næste niveau, bliver forståeligt nok sværere i en så stor virksomhed,” fortæller han.

Snedige algoritmer
Første trin er udvikling af en række kerneteknologier, som kan danne basis for forskellige softwareprodukter. Den centrale tekniske udfordring består i at udvikle et framework, der på én og samme tid er hurtigt og bruger minimal hukommelse.

”Når vi har at gøre med så store datamængder, skal man nogle gange være snedig, når man prøver at beskrive dataene internt i algoritmerne, for at det ikke stikker helt af,” siger Martin Bundgaard.

Hvor store datamængder taler vi om?


”Sekventerer man et helt menneskeligt genom, sekventerer man typisk 30X, hvilket betyder, at man har DNA svarende til 30 kopier af DNA’et i cellen. Et sådan datasæt vil let fylde 100 gigabyte. I nogle henseender har man brug for at håndtere det hele på én gang, nogle gange kan man processere lidt ad gangen, så der er mange forskellige udfordringer.”

Det lyder som et omfattende projekt for en enkelt person?

”Det er det også. Mange af tingene kan jeg med min baggrund lave selv, men jeg har ikke uendelig tid, og derfor skal det også på sigt skaleres med de rette personer. Men jeg vil gerne vente, til jeg har fået sat en sammenhængende retning på det. Derefter giver det mening med ekstra kræfter.”

Vinkede farvel til ph.d.
Genodesk er ikke Martin Bundgaards første iværksætterprojekt. I 2005 sagde han efter fire måneder farvel til England og en ph.d. i matematik, fordi projektet ikke var det rette. Samtidig voksede fritidsinteressen for at programmere.

Han erfarede, at det var svært at finde nye ph.d.-projekter, og det blev startskuddet til jobbanken AcademicPeople.com, som han udviklede og lancerede et par år efter. Det lykkedes at lande aftaler med ca. 20 universiteter, men forretningen løb ikke rundt. Manglende kritisk masse endte med at tvinge projektet i graven, men glæden ved at bygge et konkret og anvendeligt projekt hang ved. Ved et tilfælde blev det også begyndelsen på en varig interesse for biologiske algoritmer.

”Jeg begyndte at tænke over, hvordan man kunne bygge en teknologi, der kunne aflæse og forstå hjemmesider; finde ud af, hvornår de blev opdateret og udtrække struktureret information såsom jobannoncer,” fortæller han:

”I den forbindelse stødte jeg på alignment-algoritmer, hvor man dybest set har to sekvenser af noget, som man sætter op mod hinanden for at finde ud af, hvordan man kan få dem til at passe bedst sammen. Jeg begyndte at interessere mig for, hvordan man kunne gøre det hurtigt, og det ledte ind i biologiske algoritmer, fordi det typisk er her, man har det største behov for, at ting går hurtigt. Så man kan faktisk trække en tråd helt tilbage fra dengang,” fortæller han.

Fakta om Genodesk
Etablering: Stiftet maj 2017 af kandidat i matematik Martin Bundgaard.
Produkt: Software til DNA-analyse. Kundesegmentet spænder fra individuelle forskere til store sekventeringscentre på eksempelvis hospitaler. Sekventering kan bl.a. bruges til at finde mutationer i arvemassen.
Læs mere: www.genodesk.com

INCUBA-bonusinfo: CLC Bio, Martin Bundgaards tidligere arbejdsplads, blev medstiftet af Thomas Knudsen, der i dag er adm. direktør i Falcon Invest, der ligesom Genodesk holder til i INCUBA Navitas.

Dato:
20. juni 2017

Del dette