DNA-'cassettebandje' slaat petabytes op en gaat millennia mee

Wetenschap
DNA 'Cassette Tape' Stores Petabytes, Lasts Millennia
Een Chinees team heeft een werkend prototype gebouwd dat synthetisch DNA op een lange plastic tape print en bestanden ophaalt met een cassette-achtige drive; het belooft een opslagdichtheid op petabyte-niveau en een levensduur van eeuwen tot millennia, maar wordt gehinderd door trage, kostbare DNA-synthese en sequencing.

Plastic folie, geprint DNA en een retro-drive: het nieuwe prototype

In een laboratorium in China hebben onderzoekers twee zeer verschillende tijdperken van informatietechnologie samengebracht: het moleculaire geheugen van DNA en het mechanische gemak van een cassettebandje. Het team printte korte, synthetische DNA-strengen op een flexibele polyester-nylon film, rolde de strip in een cassette en bouwde een kleine drive die tracks met barcodes kan scannen, een plekje in een oplossing kan dopen en het DNA kan terugwinnen voor sequencing en decodering naar bestanden.

Het resultaat is een functionerend proof-of-concept dat door de onderzoekers wordt omschreven als een "compacte cassette voor op DNA gebaseerde gegevensopslag." Het experiment toont aan dat DNA kan worden georganiseerd op een lang, adresseerbaar medium en toegankelijk is met geautomatiseerde, cassette-achtige bewegingen, in plaats van DNA alleen in buisjes of flesjes te bewaren – een stap die volgens de auteurs het medium gemakkelijker bruikbaar maakt als bestandssysteem.

Hoe het systeem bestanden codeert, beschermt en vindt

Het proces volgt een bekend patroon van ander onderzoek naar DNA-opslag: een digitaal bestand wordt vertaald naar sequenties van de vier nucleotiden-"letters" (A, T, C en G); deze synthetische sequenties worden als minuscule druppeltjes gedeponeerd in microscopische, met barcodes gemarkeerde compartimenten op de strip; en een beschermend omhulsel — een kristallijne metaal-organische coating — beschermt de kwetsbare moleculen totdat ze nodig zijn. Om een bestand te lezen, lokaliseert de drive de barcode, brengt een mild chemisch middel aan om de strengen uit dat compartiment vrij te maken, voert deze aan een sequencer en vertaalt de verkregen base-calls terug naar bits en bytes.

Deze architectuur biedt verschillende praktische voordelen. Barcodes stelt de drive in staat om individuele bestanden te lokaliseren, vergelijkbaar met een indexeringssysteem in een bibliotheek, en de kristalcoating voorkomt chemische degradatie van het DNA, waardoor de onderzoekers kunnen pleiten voor een lange opslagduur. Het prototype ondersteunt ook overschrijven en repareren: enzymen kunnen worden gebruikt om oude strengen te verwijderen en nieuwe te deponeren, en het team demonstreerde eenvoudige autonome herstel- en herdeponeringsstappen binnen de drive.

Dichtheid en levensduur: de belangrijkste cijfers

De cijfers zijn opvallend. Het team rapporteert een theoretische opslagdichtheid die, geëxtrapoleerd, honderden petabytes per kilometer tape zou kunnen bereiken — cijfers die zich vertalen naar tientallen petabytes voor een cassette van 100 meter. De auteurs en mediakanalen hebben vergelijkingen gebruikt zoals "genoeg om miljarden liedjes op te slaan" om een tastbaar beeld van de schaal te geven. Die schattingen van de capaciteit zijn gebaseerd op een dichte pakking van vele adresseerbare plekken en meerdere kopieën van elke sequentie om te beschermen tegen gegevensverlies.

Bescherming is belangrijk omdat DNA-chemie langzaam maar gestaag afbreekt bij omgevingstemperaturen. Met de bepantsering van zeolitisch imidazolaat (ZIF) of een soortgelijk metaal-organisch raamwerk dat in het prototype is gebruikt, projecteert het team levensduren van eeuwen bij kamertemperatuur. Onder koude opslag — bijvoorbeeld nabij 0 °C — vertraagt de afbraaksnelheid aanzienlijk, en sommige publieke rapportages beschreven extrapolaties die duiden op conservering in de orde van duizenden tot tienduizenden jaren onder diepvriesomstandigheden. Die langere cijfers moeten worden gelezen als op modellen gebaseerde projecties en niet als gemeten resultaten: ze zijn het gevolg van de toepassing van standaard wiskunde voor chemische afbraak op de versnelde verouderings- en stabiliteitstests die de auteurs hebben uitgevoerd.

Prestaties van het prototype: bewijs versus productie

Belangrijke kanttekeningen scheiden de persvriendelijke capaciteits- en levensduurcijfers van de praktische realiteit. Het apparaat is een laboratoriumdemonstratie, geen commercieel product. In de experimenten van het team schreef en herstelde het systeem bescheiden testbestanden — in de orde van enkele honderden kilobytes — en elke volledige schrijf-lees-herschrijfcyclus duurde vele minuten tot uren, voornamelijk omdat de chemische stappen die DNA creëren en lezen traag en kostbaar blijven. Onafhankelijke verslaglegging van het onderzoek vatte een vroege demonstratie samen waarbij een enkel bestand van ~156,6 KB werd opgeslagen en beschreef volledige cycli die in de orde van tientallen minuten tot meer dan een uur duurden vóór optimalisaties. Die snelheden betekenen dat het prototype gegevens schrijft in het regime van hooguit kilobytes per uur, veel langzamer dan enige conventionele harde schijf of tape-library.

Met andere woorden, het systeem excelleert momenteel in principe in dichtheid en duurzaamheid, niet in doorvoersnelheid. De mechanische onderdelen van de drive — de barcodescanner en de tape-afhandeling — kunnen zeer snel over de strip zoeken, maar de bottlenecks zijn moleculair: het synthetiseren van op maat gemaakte DNA-sequenties (schrijven) en het terug sequencen ervan naar digitale bits (lezen) blijven orders van grootte langzamer en duurder dan op silicium gebaseerde opslagoperaties.

Waar dit past in het opslagecosysteem

Onderzoekers presenteren de DNA-cassette als een mogelijke brug tussen archiverings "koude" opslag — bestanden die je zelden opvraagt maar decennia of eeuwen wilt bewaren — en "warme" opslag die af en toe wordt gelezen of bijgewerkt. Als de kosten voor synthese en sequencing dalen en de snelheid verbetert, zou een adresseerbare DNA-tape plausibel in grote bibliotheken naast magnetische tapecassettes kunnen staan, als een zeer energiezuinig langetermijnmedium voor het culturele en wetenschappelijke erfgoed van de wereld. Vooralsnog lijkt de technologie het meest relevant voor instellingen die een lange levensduur belangrijker vinden dan onmiddellijke toegangssnelheid: musea, nationale archieven en bepaalde wetenschappelijke datasets.

Experts die niet bij het onderzoek betrokken waren, waarschuwen dat snelle vooruitgang in DNA-synthese en sequencing noodzakelijk zal zijn voordat het idee praktisch wordt. Het automatiseren van moleculaire workflows — de kernverbetering hier — is een grote stap, maar het verandert de fundamentele economie niet van de ene op de andere dag. Om die redenen beschrijven het team en externe commentatoren het werk als een belangrijke platformtechnologie in plaats van een vervanging op korte termijn voor harde schijven of cloud-datacenters.

Praktische hindernissen en volgende stappen

  • Snelheid en kosten: Synthetisch DNA blijft duur om te maken en traag om op grote schaal te produceren. Totdat dat verandert, zal het medium eerder geschikt zijn voor archiefgebruik dan voor dagelijkse opslag in grote volumes.
  • Standaardisatie: Wijdverbreid gebruik vereist overeengekomen formaten en cross-compatibele drives, zodat een DNA-cassette die vandaag wordt gemaakt, over decennia nog kan worden gelezen.
  • Validatie van levensduur: Claims van conservering op een schaal van millennia zijn afhankelijk van afbraakmodellen en versnelde tests; langere real-time experimenten en gestandaardiseerde protocollen voor versnelde veroudering zijn nodig om zeker te zijn over bewaring over meerdere millennia.
  • Beleid en bioveiligheid: Het opslaan van willekeurige gegevens als DNA roept duidelijke governance-vragen op over toezicht, herkomst en de grens tussen onschadelijke synthetische strengen en biologische agentia; die discussies zullen parallel aan de technische ontwikkeling moeten plaatsvinden.

Het DNA-cassetteproject is representatief voor een grotere trend: ingenieurs lenen steeds vaker biologische oplossingen om informatietechnologische problemen op te lossen. De natuurlijke dichtheid van DNA en de energievrije stabiliteit (eenmaal geschreven en verzegeld) maken het een aantrekkelijke kandidaat voor langlevende archieven; het cassetteformaat biedt een vertrouwde, energiezuinige mechanische interface die op een dag zou kunnen passen in bibliotheekachtige ecosystemen voor databeheer.

Voorlopig kan het nieuwe apparaat het beste worden gezien als een opvallende demonstratie met duidelijke sterke punten en duidelijke beperkingen. Het laat zien dat geprint, adresseerbaar DNA op een draagbare strip kan worden gevonden, gelezen, aangepast en opnieuw verzegeld — een moleculair bestandssysteem in het klein — maar het benadrukt ook de lastige, vertragende chemie die moet worden opgelost voordat DNA-opslag de stap maakt van laboratoriumcuriositeit naar infrastructuur. De komende jaren zullen uitwijzen of snellere synthese, goedkopere sequencing en robuuste standaarden het idee tot een praktische optie maken voor het opslaan van de meest waardevolle archieven van de mensheid.

Bronnen

  • Science Advances (onderzoekspaper: "A compact cassette tape for DNA‑based data storage", DOI: 10.1126/sciadv.ady3406)
  • Southern University of Science and Technology (onderzoeksgroepleider: Xingyu Jiang; corresponderende instellingen)
  • Shanghai Jiao Tong University (samenwerkend laboratorium)
James Lawson

James Lawson

Investigative science and tech reporter focusing on AI, space industry and quantum breakthroughs

University College London (UCL) • United Kingdom

Readers

Readers Questions Answered

Q Hoe codeert, beschermt en herstelt het DNA-cassette-opslagsysteem gegevens?
A Het systeem codeert digitale bestanden als DNA-sequenties met behulp van A, T, C en G, waarbij de strengen als druppels worden gedeponeerd in met barcodes gemarkeerde compartimenten op een flexibele film. Een kristallijne metaal-organische coating beschermt de segmenten. Om te lezen lokaliseert de drive de barcode, laat de strengen vrij, bepaalt de sequentie ervan en zet de resultaten weer om in digitale gegevens.
Q Wat zijn de claims over de dichtheid en levensduur van het prototype?
A Claims over de dichtheid spreken van honderden petabytes per kilometer tape, wat neerkomt op tientallen petabytes op een cartridge van 100 meter met dichte datapunten en beschermende kopieën. Schattingen van de levensduur, ondersteund door een metaal-organische coating, suggereren eeuwen bij kamertemperatuur en duizenden tot tienduizenden jaren bij temperaturen nabij de 0 °C; dit zijn op modellen gebaseerde projecties, geen directe metingen.
Q Wat zijn de huidige beperkingen op het gebied van prestaties en kosten?
A Het prototype is een laboratoriumdemonstratie, geen commercieel product. Het schrijft en leest bescheiden bestanden — in de orde van enkele honderden kilobytes — waarbij volledige schrijf-lees-herschrijfcycli minuten tot uren duren. De doorvoer blijft beperkt tot kilobytes per uur omdat DNA-synthese en sequentiebepaling traag en kostbaar zijn in vergelijking met siliciumopslag.
Q Waar zou deze DNA-cassette passen in het ecosysteem van opslag, en welke hindernissen blijven er?
A Experts zien de DNA-cassette als een brug tussen koude archiefopslag en incidentele 'warme' toegang, waarbij het mogelijk naast magneetbanden in grote bibliotheken kan bestaan. Het realiseren van deze visie vereist snellere, goedkopere synthese en sequentiebepaling, standaardisatie en schaalbare automatisering; vooralsnog is het een belangrijke platformtechnologie in plaats van een vervanging op korte termijn voor harde schijven of cloudopslag.

Have a question about this article?

Questions are reviewed before publishing. We'll answer the best ones!

Comments

No comments yet. Be the first!