Forskere fra Københavns Universitet har med AI (kunstig intelligens) løst et problem, som indtil nu har været stopklods for vigtig proteinforskning i dynamikkerne bag sygdomme som cancer, Alzheimers og Parkinsons samt i udviklingen af grøn, bæredygtig kemi og ny genteknologi.
Det har nemlig været et både tidskrævende og vanskeligt arbejde at analysere de kæmpe datamængder, som forskerne indsamler, når de ved hjælp af mikroskopi og teknikken FRET undersøger, hvordan proteiner bevæger sig og interagerer med deres omgivelser. Samtidig kræver opgaven høj ekspertise. Derfor har det hobet sig op med fyldte servere og harddiske. Nu har forskere fra Kemisk Institut, Nano-Science Center, Novo Nordisk Foundation Center for Protein Research og Niels Bohr Institutet udviklet en machine learning-algoritme til at tage det tunge slæb.
– Før sad vi og sorterede data, indtil vi var ved at blive skøre. Nu trykker vi på en knap, og så er al vores data analyseret. Og algoritmen gør det mindst lige så godt eller bedre end os. Det frigiver ressourcer til, at vi kan optage endnu større datamængder end tidligere og hurtigere nå resultater, siger Simon Bo Jensen, biofysiker og Ph.d.-studerende ved Kemisk Institut og Nano-Science Center.
Algoritmen har lært at genkende mønstre i proteinernes bevægelser, så den på få sekunder kan klassificere datasæt, som det normalt kan tage eksperter flere dage at komme igennem.
KU-forskernes studier i sammenhængen mellem proteiners bevægelse og funktion er internationalt anerkendt og afgørende for at forstå, hvordan den menneskelige krop fungerer. Fx skyldes sygdomme som cancer, Alzheimers og Parkinsons, at proteiner klumper sammen eller ændrer deres opførsel. Også genteknologien CRISPR, som i år vandt Nobelprisen i kemi, er baseret på proteiners evne til at klippe i specifikke DNA-sekvenser. Når forskerne på KU, herunder Guillermo Montoya og Nikos Hatzakis, undersøger hvordan de processer foregår, er det netop ved hjælp af data fra mikroskopi.
– Før vi kan behandle alvorlige sygdomme eller udnytte genteknologien CRISPR til fulde, er vi nødt til at forstå hvordan de mindste byggesten, proteinerne, fungerer. Her kommer proteinernes dynamik og bevægelser i spil, og vores værktøj er en stor hjælp, siger Guillermo Montoya fra Novo Nordisk Foundation Center for Protein Research.
Det lader til, at andre proteinforskere rundt om i verden også har savnet et sådant værktøj. Allerede nu har adskillige forskergrupper i udlandet henvendt sig og udvist interesse i at bruge algoritmen.
– AI-værktøjet er et kæmpe plus for hele forskningsfeltet, fordi det giver nogle fælles standarder, man ikke før har haft, når forskere verden over skal sammenligne data. Før var meget af analysen baseret på en subjektiv opfattelse af, hvilke mønstre, der var brugbare. Og det kan jo variere fra forskningsgruppe til forskningsgruppe. Nu har vi et værktøj, der kan sikre, at vi alle når de samme konklusioner, siger forskningsleder og lektor Nikos Hatzakis fra Kemisk Institut og Novo Nordisk Foundation Center for Protein Research.
Fakta:
•For at studere proteinernes bevægelser og interaktioner, bruger forskerne teknikken FRET (Förster Resonance Energy Transfer), der simpelt sagt fungerer ved, at man putter to eller flere fluoroscerende mærker på samme proteinmolekyle. Når mærkerne kommer i nærkontakt med hinanden, udsender de lys, som avancerede mikroskoper kan opfange. På den måde kan proteinernes bevægelser måles på nanoskala.
•AI-værktøjet, som har fået navnet DeepFRET, er et open source-software, der bygger på kunstige neurale netværk, som er trænet i at genkende avancerede mønstre i data. Softwaren kan bruges på enhver computer og er kompatibel med Mac og Windows.
•Sammenlignet med menneskelige eksperter tager det DeepFRET mindre end 1 % af tiden at klassificere data. Det sker med en præcision på enten samme eller højere niveau.
•Den videnskabelige artikel om det nye AI-værktøj er udgivet i det anerkendte, internationale tidsskift eLife.
•Forskningen er udført af: Johannes Thomsen, Magnus B. Sletfjerding, Simon Bo Jensen, Mette G. Malle fra Kemisk Institut og Nano-Science Center; Nikos S. Hatzakis fra Kemisk Institut, Nano-Science Center og Novo Nordisk Foundation Centre for Protein Research; Stefano Stella, Bijoya Paul og Guillermo Montoya fra Novo Nordisk Foundation Centre for Protein Research samt Troels C. Petersen fra Niels Bohr Institutet.
•Forskningen er bl.a. støttet af Carlsbergfonden, VILLUM Fonden og Novo Nordisk Fonden.
Kontakt:
Nikos Hatzakis, lektor, Kemisk Institut, Københavns Universitet, mail: hatzakis@chem.ku.dk