Op 8 mei 2025 publiceerde een team van het Centre for Genomic Regulation in Barcelona een artikel in Cell waarin werd aangetoond dat een artificiële intelligentie-systeem korte, synthetische regulatoire DNA-sequenties kan ontwerpen die fungeren als celtypespecifieke schakelaars in gezonde zoogdiercellen. Minder dan een jaar later kondigde een afzonderlijke groep van Rice University in Nature een complementaire vooruitgang aan: een experimenteel platform genaamd CLASSIC dat miljoenen volledige genetische circuits koppelt aan cellulaire outputs en die metingen doorgeeft aan machine learning-modellen, zodat deze de functie kunnen voorspellen over een enorme, ongeteste ontwerpruimte. Samen markeren deze artikelen een snelle verschuiving: de algoritmische verbeelding van DNA-sequenties beweegt zich van speelgoedvoorbeelden naar echte moleculen die op betrouwbare wijze de genactiviteit in levende cellen veranderen, en de industrie en beleidsgroepen haasten zich om productie en toezicht hierop aan te passen.
Een nieuwe klasse van synthetische enhancers
Het Cell-artikel van de groep uit Barcelona beschrijft een generatieve AI die is getraind op basis van massale metingen van hoe korte DNA-fragmenten — enhancers — de genexpressie beïnvloeden tijdens de ontwikkeling van bloedcellen. Enhancers zijn niet-coderende stukken DNA die transcriptiefactoren rekruteren en bepalen wanneer en waar genen tot expressie komen. Het CRG-team synthetiseerde meer dan 64.000 varianten, ontworpen om combinaties en rangschikkingen van bindingsmotieven voor tientallen transcriptiefactoren te testen, en mat vervolgens de activiteit in meerdere stadia van de hematopoëse. Uit die gegevens leerde het model ontwerpregels en stelde het sequenties voor die nooit in de natuur hadden bestaan, maar die zich wel gedroegen zoals bedoeld wanneer ze werden geïntroduceerd in primaire muizenbloedprogenitorcellen: sommige fungeerden als graduele regelaars, andere vertoonden nagenoeg binair aan/uit-gedrag, en vele toonden een opvallende celtypespecificiteit.
Massale bibliotheken en het in kaart brengen van genetische circuits met CLASSIC
CLASSIC bracht twee praktische lessen voor ontwerpers aan het licht. Ten eerste zijn circuits vaak geen problemen met slechts één oplossing — veel verschillende ontwerpen kunnen dezelfde output bereiken — wat ingenieurs de flexibiliteit geeft om afwegingen te maken tussen robuustheid, sterkte en verbruik van hulpbronnen. Ten tweede presteren onderdelen met een gemiddelde sterkte vaak beter dan de meest extreme componenten; met andere woorden, de biologie heeft haar eigen Goldilocks-zones. Cruciaal is dat de pijplijn werd gevalideerd door voorspelde ontwerpen te synthetiseren en te testen: tientallen door AI gekozen circuits kwamen overeen met de laboratoriumresultaten, wat aantoont dat modellen kunnen generaliseren buiten hun trainingssets wanneer die sets groot zijn en zorgvuldig zijn gemeten.
Van in silico-ontwerpen naar levende cellen
Beide onderzoekslijnen benadrukken een nauw gekoppelde design-build-test-cyclus. In Barcelona stelt de AI korte enhancersequenties voor; onderzoekers synthetiseren die fragmenten van 250 basen, verpakken ze in afleveringsvectoren en brengen ze in levende zoogdiercellen om de activiteit in verschillende celtoestanden uit te lezen. In Houston en bij samenwerkende laboratoria produceert de CLASSIC-strategie bibliotheken van volledige circuits, leest de outputs uit in duizenden of miljoenen cellen en koppelt die resultaten terug naar een ML-model dat de volgende ronde kandidaten aanbeveelt.
Het praktische resultaat is snelheid en creativiteit. Waar klassieke genetische manipulatie maandenlang iteratieve debugging en deskundige intuïtie vereiste, stelt AI in combinatie met massaal parallelle metingen teams in staat om combinatorische ruimtes te verkennen op schalen die voorheen onmogelijk waren. Dat versnelt de ontdekking van functionele DNA-schakelaars voor therapeutische promotoren, lineage-specifieke expressiecasettes en complexere logische poorten in cellen.
Productie op AI-snelheid: celvrije synthese en toeleveringsketens
Het ontwerp overtreft het aanbod als de synthese en productie niet kunnen bijblijven. Industriegroepen en enkele startups passen zich al aan: celvrije DNA-syntheseworkflows — die lineaire, voor IVT geschikte sjablonen assembleren zonder klonering in bacteriën — elimineren bronnen van contaminatie (endotoxinen, gastheer-DNA) en vermijden recombinatieproblemen die lange homopolymeren, zoals gecodeerde poly(A)-staarten, onstabiel maken in plasmiden. Deze voordelen zijn belangrijk voor AI-cycli omdat modellen snel itereren en veel verschillende, op maat gemaakte sjablonen vereisen binnen strakke tijdlijnen.
Celvrije sjablonen verminderen ook de downstream-variabiliteit in poly(A)-staartlengte en sequentie-integriteit, wat de reproduceerbaarheid van in-vitro transcriptieproducten verbetert. Wanneer AI honderden of duizenden kandidaat-sequenties voorstelt, wordt een snelle, automatiseringsvriendelijke toeleveringsketen die synthese, QC en IVT-sjablonen levert een beperkende factor — en dat betekent dat bedrijven, contractfabrikanten en academische kernfaciliteiten hun processen herzien rond celvrije benaderingen om het tempo van de berekeningen bij te houden.
Toepassingen, beperkingen en vroege grenzen
Er zijn echter reële beperkingen. Het regulatoire genoom is enorm en contextafhankelijk: de CRG-studie bracht slechts een subset van transcriptiefactoren en celtoestanden in kaart, en de Rice CLASSIC-demonstraties werden uitgevoerd in modelcellijnen als proof of principle. Het vertalen van een sequentie die werkt in een petrischaal naar een veilige, duurzame en effectieve therapie bij mensen zal uitgebreide preklinische validatie vereisen. Modellen generaliseren het best wanneer trainingsdata de doelcontext weerspiegelen; hiaten in trainingssets blijven een belangrijke bron van falen.
Risico's, governance en menselijk toezicht
Snel ontwerp en goedkope synthese roepen vragen op over veiligheid en governance waar de synthetische-biologiegemeenschap al jaren mee worstelt. Een review in npj Biomedical Innovations kaderde dit als een convergentieprobleem: AI verlaagt de technische drempel voor complexe bio-engineering, terwijl geautomatiseerde labs en goedkope synthese de capaciteit en distributie vergroten. Die combinatie vergroot zowel de gunstige toegankelijkheid als het dual-use-risico.
Uit recent commentaar en beleidswerk komen drie prioriteiten voor governance naar voren. Ten eerste, verklaarbaarheid en audit trails voor modellen en ontwerppijplijnen: ondoorzichtige "black box"-aanbevelingen zijn moeilijker te beoordelen op fouten of misbruik. Ten tweede, human-in-the-loop-controles bij beslissingsmomenten — het onderwerpen van elke sequentie die bedoeld is voor introductie in biologische systemen aan deskundige beoordeling en functionele assays. Ten derde, maatregelen in de toeleveringsketen en standaarden voor sequentie-screening om ontwerpen te detecteren die schadelijke functies mogelijk maken, zelfs als ze nieuw zijn. Nationale inspanningen om de screening van nucleïnezuursynthese uit te breiden, getuigen van de beleidsaandacht die deze technologieën nu krijgen.
De wetenschap ontwikkelt zich snel en vooralsnog combineert het verstandige pad enthousiasme over wat AI kan creëren met weloverwogen, transparante praktijken om risico's te beperken, de herkomst te documenteren en het menselijk oordeel te behouden waar dat het meest essentieel is.
Bronnen
- Cell (onderzoeksartikel over door AI ontworpen synthetische enhancers)
- Nature (onderzoeksartikel: CLASSIC-platform voor ultra-high-throughput mapping van genetische circuits)
- npj Biomedical Innovations (analyse van de convergentie tussen AI en synthetische biologie)
- Centre for Genomic Regulation (CRG), Barcelona
- Rice University Synthetic Biology Institute
- Pompeu Fabra University (UPF)
Comments
No comments yet. Be the first!