Nieuw algoritme maakt simulatie van complexe kwantumsystemen mogelijk

      -      English  -  Nederlands   -  Français

Een internationaal team van wetenschappers van de Universiteit van Luxemburg, het Berlin Institute for the Foundations of Learning and Data (BIFOLD) van de TU Berlijn en Google heeft nu met succes een algoritme voor machinaal leren ontwikkeld om grote en complexe kwantumsystemen aan te pakken. Het artikel is gepubliceerd in het gerenommeerde tijdschrift Science Advances.

De kwantumeigenschappen van atomen geven vorm aan talloze biochemische en fysische processen. Enkele van ’s werelds grootste wetenschappelijke uitdagingen zijn fundamenteel verbonden met het begrijpen van vele op elkaar inwerkende atomen in de tijd. Deze interacties worden beheerst door de wetten van de kwantummechanica. Voorbeelden variëren van de vorming van nucleïnezuren in het genoom tot de afbraak van schadelijke moleculen in de atmosfeer. Bijzonder uitdagend voor wetenschappers zijn de correlaties in ruimte en tijd van dergelijke kwantumsystemen: Hun meest interessante eigenschappen vloeien niet voort uit een eenvoudige optelling van individuele bijdragen van atomen, maar uit ingewikkelde atomaire correlaties. Bijgevolg kunnen kwantumsystemen niet gemakkelijk wiskundig worden gemodelleerd. Met name grotere kwantumsystemen zijn tot nu toe onttrokken aan nauwkeurig machinaal leren (ML) omdat ze niet uniek kunnen worden opgedeeld in onafhankelijke kleine rekenpakketten. Een directe modellering van de ingewikkelde correlaties zou de bestaande rekencapaciteiten te boven gaan.

Realistisch en nauwkeurig

Het ontwikkelde leeralgoritme reconstrueert zogenaamde globale krachtvelden op basis van machinale leermethoden zonder mogelijk onnodige vereenvoudigingen. De term -globale krachtvelden- beschrijft de aanpak om alle atomaire interacties (zoals elektrostatische, chemische, enz.) van een molecuul in beschouwing te nemen. Het is anders gebruikelijk om het aantal gemodelleerde atoominteracties te verminderen ten gunste van de rekenefficiëntie.

-Kwantumtoestanden zijn onafscheidelijk en de afzonderlijke bestanddelen kunnen niet onafhankelijk handelen zonder het systeem als geheel te beïnvloeden,- verklaart Prof. Alexandre Tkatchenko , Professor voor Theoretische Chemische Fysica aan de Universiteit van Luxemburg. Deze eigenschap markeert een van de meest ingrijpende verschillen tussen de kwantummechanica en de klassieke Newtoniaanse en elektrostatische interacties waarmee iedereen intuïtief vertrouwd is. Zij vormt ook een dilemma bij het modelleren van kwantumsystemen: Een alomtegenwoordig paradigma in algoritmisch ontwerp en een belangrijke bouwsteen bij het modelleren van atomaire interacties is het opdelen van een probleem in kleinere onafhankelijke delen die voor de computer gemakkelijker te hanteren zijn. Dit is niet mogelijk bij kwantumsystemen vanwege de bovengenoemde eigenschappen.

Globale krachtvelden die de collectieve interacties van vele atomen in moleculaire systemen kunnen weergeven, zijn momenteel slechts schaalbaar tot enkele tientallen atomen met behulp van machinaal leren, omdat de complexiteit van het model aanzienlijk toeneemt met de grootte van het systeem in kwestie. Het team pakte juist deze uitdaging aan door een algoritme te ontwikkelen om globale krachtvelden te trainen voor systemen tot enkele honderden atomen zonder complexe correlaties te negeren. Hun aanpak scheidt de sterk gekoppelde atoominteracties binnen het model zorgvuldig in een zogenaamd collectief laagdimensionaal deel, dat terugkerende interactiepatronen bevat, en een zogenaamd residu, dat de bijdragen van individuele interacties beschrijft. Door deze scheiding kunnen beide onderdelen van het krachtveldreconstructieprobleem onafhankelijk van elkaar worden opgelost. Met de numerieke eigenschappen van elk deelprobleem, die het gevolg zijn van onvermijdelijke afrondingsfouten in computerberekeningen, wordt specifiek rekening gehouden. Bijgevolg kunnen globale krachtvelden worden gereconstrueerd op basis van grotere referentiegegevenssets om complexere interacties weer te geven, zoals die voorkomen in systemen met veel atomen of in bijzonder flexibele moleculen. "De numerieke kenmerken van algoritmen voor machinaal leren hebben vaak een grotere impact dan de wiskundige formulering suggereert, waardoor de resultaten mogelijk worden vertekend. Verbeteringen in de numerieke stabiliteit kunnen verstrekkende gevolgen hebben voor de toepassing van algoritmen," zegt Dr. Stefan Chmiela , onderzoeksgroepleider van de groep Machine Learning for Many-body Systems in BIFOLD.

Het feit dat de ontwikkelde methode over meerdere computers kan worden geparallelliseerd is een bijkomend voordeel. Het neemt algoritmische knelpunten weg en maakt het effectieve gebruik van moderne parallelle computerhardware zoals GPU’s mogelijk. "Het succes van algoritmen voor machinaal leren wordt vaak bepaald door hoe efficiënt ze kunnen draaien en schalen op de beschikbare hardware", verklaart Klaus-Robert Müller , mededirecteur van BIFOLD.

-Dit werk is een springplank naar echt voorspellende kwantumsimulaties van systemen met honderden atomen,- zegt Oliver Unke , onderzoekswetenschapper bij Google. De wetenschappers hebben al met succes dynamische simulaties van supramoleculaire complexen uitgevoerd op uitdagende lange tijdschalen. Vergelijkbare simulaties worden routinematig uitgevoerd in de farmaceutische industrie om verbindingen met specifieke eigenschappen te identificeren als potentiële nieuwe kandidaat-geneesmiddelen. "Machine-leermethoden beloven een convergentie tussen exacte kwantummechanische modellen en efficiënte empirische oplossingen. Zij hebben het potentieel om het wetenschappelijk onderzoek in de kwantumchemie te versnellen door geheel nieuwe mogelijkheden te bieden om atoominteracties in ingewikkelde fysische systemen beter te begrijpen," legt Alexandre Tkatchenko uit.

Artikel " Nauwkeurige globale machine learning krachtvelden voor moleculen met honderden atomen ", Science Advances, januari 2023