DNA slaat gegevens op in bits na een epigenetische upgrade
Een nieuw proces maakt het mogelijk om DNA als binaire opslag te gebruiken. Onderzoekers van de Universiteit van Peking laten zien hoe epigenetische veranderingen gegevens efficiënt kunnen opslaan.

DNA slaat gegevens op in bits na een epigenetische upgrade
DNA bestaat al duizenden jaren de favoriete gegevensopslagfaciliteit van de mensheid. Robuust en compact, en zo informatief dat één gram voldoende gegevens is voor 10 miljoen uur hoge resolutie video kan besparen.
Maar er is altijd ruimte voor verbetering.
Een nieuwe methode maakt het nu mogelijk om informatie in DNA op te slaan als binaire code - dezelfde nullen en enen die door conventionele computers worden gebruikt. Deze methode zou op een dag goedkoper en sneller kunnen zijn dan het coderen van informatie in de reeks bouwstenen waaruit DNA bestaat, die momenteel door cellen wordt gebruikt en de meeste pogingen om dit te doen Kunstmatig gegenereerde gegevens opslaan komt overeen met de gebruikte methode.
De methode is zo eenvoudig dat 60 vrijwilligers uit verschillende vakgebieden hiermee de tekst van hun keuze konden opslaan. Velen van hen geloofden aanvankelijk niet dat de techniek zou werken, zegt Long Qian, een computationeel synthetisch bioloog aan de Peking Universiteit in Beijing en auteur van het onderzoek. 1, die de technologie beschrijft.
"Toen ze eenmaal de reeks zagen en de juiste regels terugkregen, begonnen ze te geloven dat ze het echt konden", legt ze uit. Het onderzoek werd vandaag gepubliceerd in Nature.
Korte opslag
Deze techniek is slechts een van de vele Proberen van DNA een duurzaam alternatief te maken naar traditioneel, elektronische opslagmogelijkheden die geen gelijke tred kunnen houden met de toenemende dataproductie in de wereld. “We bereiken fysieke grenzen”, zegt Nicholas Guise, natuurkundige aan het Georgia Tech Research Institute in Atlanta. “En we genereren voortdurend meer data.”
De enorme opslagcapaciteit van DNA maakt het een aantrekkelijk alternatief. Verder kan DNA kan, mits beschermd tegen vocht en ultraviolet licht, honderdduizenden jaren meegaan. Elektronische harde schijven moeten daarentegen om de paar jaar worden vervangen, anders raken gegevens beschadigd.
De meest voor de hand liggende manier om informatie in DNA op te slaan, is door de gegevens in de DNA-sequentie in te voegen, een proces waarbij een DNA-streng helemaal opnieuw moet worden gesynthetiseerd. Deze aanpak is traag en vele ordes van grootte duurder dan elektronische gegevensopslag, legt Albert Keung uit, een synthetisch bioloog aan de North Carolina State University in Raleigh.
Om een goedkopere, snellere manier te ontwikkelen, hebben Qian en haar collega's zich daartoe gewend ‘Epigenoom’ – een verscheidenheid aan moleculen die cellen gebruiken om genactiviteit te controleren, zonder de DNA-sequentie zelf te wijzigen. Kan bijvoorbeeld zogenaamde methylgroepen worden toegevoegd aan of verwijderd uit DNA om hun functie te veranderen.
Qian en haar collega's ontwikkelden een systeem waarin een reeks korte, geprefabriceerde DNA-‘bouwstenen’ – met of zonder methylgroepen – aan een reactievat konden worden toegevoegd om een groeiende DNA-streng te vormen met de juiste binaire code. Om de gegevens op te halen, gebruiken de onderzoekers een DNA-sequencingtechniek, die de methylgroepen langs de DNA-streng kan detecteren. De resultaten kunnen worden geïnterpreteerd als een binaire code, waarbij de aanwezigheid van een methylgroep overeenkomt met 1 en de afwezigheid overeenkomt met 0.
Pandaportret in DNA
Omdat de techniek gebruik maakt van vooraf gemaakte DNA-fragmenten, kan deze verder worden geoptimaliseerd om massaproductie mogelijk te maken, zegt Keung. Dit zou het veel goedkoper maken dan het synthetiseren van een op maat gemaakte DNA-streng voor elk stukje informatie dat moet worden opgeslagen. De volgende stap, zegt Keung, zal zijn om te zien hoe goed het systeem kan worden geschaald om grote datasets te kunnen verwerken.
Als stap in deze richting codeerden en lazen Qian en haar collega's de instructies om een afbeelding te maken van een tijger uit de Han-dynastie in het oude China en een gekleurde afbeelding van een panda in weelderig groen. De afbeeldingen zijn gecodeerd in bijna 270.000 1s en 0s, oftewel ‘bits’.
Voorlopig moet het veld de kosten verlagen voordat het kan concurreren met elektronische gegevensopslag, zegt Guise. “DNA-opslag heeft nog een lange weg te gaan voordat het commercieel relevant kan worden”, zegt hij. “Maar er is behoefte aan disruptieve technologie.”
-
Zhang, C. et al. Natuur 634, 824–832 (2024).