DNA-kassettband lagrar petabyte, håller i årtusenden

Vetenskap
DNA 'Cassette Tape' Stores Petabytes, Lasts Millennia
Ett kinesiskt forskarlag har byggt en fungerande prototyp som skriver ut syntetiskt DNA på ett långt plastband och hämtar filer med en kassettliknande läsare; tekniken utlovar täthetsnivåer på petabyte-skala och livslängder från århundraden till årtusenden, men hämmas av långsam och kostsam DNA-syntes och sekvensering.

Plastfilm, utskrivet DNA och en retro-enhet: den nya prototypen

I ett laboratorium i Kina har forskare förenat två vitt skilda epoker av informationsteknik: det molekylära minnet hos DNA och kassettbandets mekaniska bekvämlighet. Teamet skrev ut korta, syntetiska DNA-strängar på en flexibel polyester-nylonfilm, rullade in remsan i en kassett och byggde en liten enhet som kan skanna streckkodade spår, doppa en punkt i en lösning och återvinna DNA-molekylerna för sekvensering och avkodning tillbaka till filer.

Resultatet är ett fungerande bevis på konceptet (proof-of-concept) som forskarna beskriver som ett ”kompakt kassettband för DNA-baserad datalagring”. Experimentet visar att DNA kan organiseras på ett långt, adresserbart medium och nås med automatiserade, kassettliknande rörelser snarare än att bara förvaras i rör eller provflaskor – ett steg som författarna menar gör mediet lättare att använda som ett filsystem.

Hur systemet kodar, skyddar och hittar filer

Processen följer ett mönster som känns igen från annat arbete inom DNA-lagring: en digital fil översätts till sekvenser av de fyra nukleotid-”bokstäverna” (A, T, C och G); dessa syntetiska sekvenser deponeras som små droppar i mikroskopiska, streckkodsmärkta fack på remsan; och ett skyddande hölje – en kristallin metallorganisk beläggning – bevarar de bräckliga molekylerna tills de behövs. För att läsa en fil lokaliserar enheten streckkoden, applicerar en mild kemikalie för att frigöra strängarna från facket, matar dem till en sekvenserare och översätter de returnerade basbestämningarna till bitar och byte.

Denna arkitektur ger flera praktiska fördelar. Streckkoder gör att enheten kan lokalisera enskilda filer ungefär som ett indexeringssystem i ett bibliotek, och kristallbeläggningen förhindrar kemisk nedbrytning av DNA:t, vilket gör att forskarna kan argumentera för långa lagringstider. Prototypen stöder även överskrivning och reparation: enzymer kan användas för att ta bort gamla strängar och nya kan deponeras på deras plats, och teamet uppvisade enkla autonoma steg för återvinning och återdeponering inuti enheten.

Densitet och livslängd: rubriksiffrorna

Siffrorna är uppseendeväckande. Teamet rapporterar en teoretisk lagringstäthet som, vid extrapolering, skulle kunna nå hundratals petabyte per kilometer band – siffror som motsvarar tiotals petabyte för en 100-meterskassett. Författarna och medierapporteringen har använt jämförelser som ”tillräckligt för att rymma miljarder låtar” för att ge en konkret känsla av skalan. Dessa kapacitetsuppskattningar bygger på en tät packning av många adresserbara punkter och flera kopior av varje sekvens för att skydda mot dataförlust.

Skyddet är viktigt eftersom DNA-kemin bryts ned långsamt men stadigt vid omgivningstemperatur. Med det skyddshölje av zeolitiskt imidazolat (ZIF) eller liknande metallorganiska ramverk (MOF) som används i prototypen, beräknar teamet livslängder i storleksordningen århundraden vid rumstemperatur. Vid kallförvaring – till exempel nära 0 °C – saktar nedbrytningshastigheten ner dramatiskt, och viss offentlig rapportering beskrev extrapoleringar som antyder bevarande i storleksordningen tusentals till tiotusentals år under djupfrysta förhållanden. Dessa högre siffror bör läsas som modellbaserade prognoser snarare än uppmätta resultat: de härrör från tillämpning av standardmatematik för kemisk nedbrytning på de tester av accelererat åldrande och stabilitet som författarna utförde.

Prototypens prestanda: bevis kontra produktion

Viktiga förbehåll skiljer de pressvänliga siffrorna för kapacitet och livslängd från den praktiska verkligheten. Enheten är en laboratoriedemonstration, inte en kommersiell produkt. I teamets experiment skrev och återvann systemet blygsamma testfiler – i storleksordningen några hundra kilobyte – och varje fullständig cykel av skrivning–läsning–överskrivning tog många minuter till timmar, främst för att de kemiska stegen som skapar och läser DNA förblir långsamma och kostsamma. Oberoende rapportering av studien sammanfattade en tidig demonstration som lagrade en enskild fil på cirka 156,6 KB och beskrev fullständiga cykler som tog mellan tiotals minuter och över en timme före optimeringar. Dessa hastigheter innebär att prototypen skriver data i bästa fall i storleksordningen kilobyte per timme, vilket är betydligt långsammare än någon konventionell hårddisk eller bandstation.

Med andra ord utmärker sig systemet för närvarande genom sin densitet och hållbarhet i princip, inte genom sin genomströmning. De mekaniska delarna i enheten – streckkodsläsaren och bandhanteringen – kan söka mycket snabbt över remsan, men flaskhalsarna är molekylära: att syntetisera skräddarsydda DNA-sekvenser (skrivning) och sekvensera dem tillbaka till digitala bitar (läsning) är fortfarande storleksordningar långsammare och dyrare än kiselbaserad lagring.

Var detta passar in i lagringsekosystemet

Forskarna ramar in DNA-kassetten som en potentiell bro mellan arkiverande ”kall” lagring – filer som sällan används men som man vill spara i decennier eller århundraden – och ”varm” lagring som läses eller uppdateras ibland. Om kostnaderna för syntes och sekvensering sjunker och hastigheten förbättras, skulle ett adresserbart DNA-band rimligen kunna ta plats i stora bibliotek tillsammans med magnetiska kassetter och erbjuda ett extremt strömsnålt, långsiktigt medium för världens kulturella och vetenskapliga arv. För närvarande framstår tekniken som mest relevant för institutioner som värdesätter livslängd högre än omedelbar åtkomsthastighet: museer, nationella arkiv och vissa vetenskapliga dataset.

Experter som inte varit involverade i studien varnar för att snabba framsteg inom DNA-syntes och sekvensering kommer att vara nödvändiga innan idén blir praktiskt användbar. Att automatisera molekylära arbetsflöden – vilket är det centrala framsteget här – är ett stort steg, men det förändrar inte den grundläggande ekonomin över en natt. Av dessa skäl beskriver teamet och utomstående kommentatorer arbetet som en viktig plattformsteknik snarare än en snar ersättare för hårddiskar eller molndatacenter.

Praktiska hinder och nästa steg

  • Hastighet och kostnad: Syntetiskt DNA är fortfarande dyrt att framställa och långsamt att producera i stor skala. Tills detta ändras kommer mediet att vara lämpat för arkivbruk snarare än daglig lagring i stora volymer.
  • Standardisering: Bred användning kommer att kräva överenskomna format och kompatibla enheter så att en DNA-kassett som skapas idag kan läsas om flera decennier.
  • Validering av livslängd: Anspråk på bevarande i årtusenden beror på nedbrytningsmodeller och accelererade tester; längre realtidsexperiment och standardiserade protokoll för accelererat åldrande behövs för att vara säker på hållbarhet över flera årtusenden.
  • Policy och biosäkerhet: Att lagra godtyckliga data som DNA väcker uppenbara frågor om tillsyn, proveniens och gränsen mellan ofarliga syntetiska strängar och biologiska agens; dessa diskussioner måste ske parallellt med den tekniska utvecklingen.

DNA-kassettprojektet är representativt för en större trend: ingenjörer lånar i allt högre grad biologiska lösningar för att lösa informationstekniska problem. DNA:s naturliga densitet och energifria stabilitet (när det väl är skrivet och förseglat) gör det till en attraktiv kandidat för långlivade arkiv; kassettformatet erbjuder ett bekant, strömsnålt mekaniskt gränssnitt som en dag skulle kunna passas in i biblioteksliknande ekosystem för dataförvaltning.

För närvarande bör den nya enheten främst ses som en slående demonstration med tydliga styrkor och tydliga begränsningar. Den visar att utskrivet, adresserbart DNA på en bärbar remsa kan hittas, läsas, modifieras och återförseglas – ett molekylärt filsystem i miniatyr – men den belyser också den svåra, hastighetsbegränsande kemi som måste lösas innan DNA-lagring går från att vara en laboratoriekuriositet till att bli infrastruktur. De kommande åren kommer att avgöra om snabbare syntes, billigare sekvensering och robusta standarder gör idén till ett praktiskt alternativ för att lagra mänsklighetens mest värdefulla arkiv.

Källor

  • Science Advances (forskningsartikel: "A compact cassette tape for DNA‑based data storage", DOI: 10.1126/sciadv.ady3406)
  • Southern University of Science and Technology (ledare för forskargruppen: Xingyu Jiang; korresponderande institutioner)
  • Shanghai Jiao Tong University (samarbetande laboratorium)
James Lawson

James Lawson

Investigative science and tech reporter focusing on AI, space industry and quantum breakthroughs

University College London (UCL) • United Kingdom

Readers

Readers Questions Answered

Q Hur kodar, skyddar och hämtar DNA-kassettlagringssystemet data?
A Systemet kodar digitala filer som DNA-sekvenser med hjälp av A, T, C och G, och deponerar strängarna som droppar i streckkodsmärkta fack på en flexibel film. En kristallin metallorganisk beläggning skyddar segmenten. För att läsa lokaliserar enheten streckkoden, frigör strängarna, sekvenserar dem och omvandlar resultaten tillbaka till digital data.
Q Vilka påståenden görs om prototypens densitet och livslängd?
A Densitetsanspråken ligger på hundratals petabyte per kilometer band, vilket motsvarar tiotals petabyte på en 100-meterskassett med täta punkter och skyddskopior. Livslängdsuppskattningar, understödda av en metallorganisk beläggning, antyder århundraden i rumstemperatur och tusentals till tiotusentals år vid nära 0 °C; dessa är modellbaserade prognoser, inte direkta mätningar.
Q Vilka är de nuvarande prestanda- och kostnadsbegränsningarna?
A Prototypen är en laboratoriedemonstration, inte en kommersiell produkt. Den skriver och läser blygsamma filer – i storleksordningen några hundra kilobyte – där fullständiga skriv–läs–omskrivningscykler tar minuter till timmar. Genomströmningen förblir kilobyte per timme eftersom DNA-syntes och sekvensering är långsamt och kostsamt jämfört med kisellagring.
Q Var kan denna DNA-kassett passa in i lagringsekosystemet och vilka hinder kvarstår?
A Experter ser DNA-kassetten som en brygga mellan arkivbaserad kallagring och tillfällig varm åtkomst, och att den potentiellt kan finnas vid sidan av magnetband i stora bibliotek. För att förverkliga denna vision krävs snabbare och billigare syntes och sekvensering, standardisering och skalbar automatisering; för närvarande är det en viktig plattformsteknik snarare än en kortsiktig ersättning för hårddiskar eller molnlagring.

Have a question about this article?

Questions are reviewed before publishing. We'll answer the best ones!

Comments

No comments yet. Be the first!