Come hanno dimostrato alcuni studi condotti da alcuni ricercatori della Columbia University nel 2017, in linea di principio 1 singolo grammo di DNA sarebbe in grado di contenere fino a 215 petabyte di informazioni, ovvero 215 milioni di gigabyte di informazioni: una capacità impressionante se paragonata agli hard disk moderni! Non solo, il DNA con la sua straordinaria densità e resistenza nel tempo, potrebbe rappresentare un'alternativa più duratura agli attuali supporti di memoria, che soffrono di una “vita” alquanto breve. È bene precisare, però, che l'immagazzinamento di dati tramite DNA è una tecnologia ancora in fase sperimentale, che soffre di costi elevati e velocità di scrittura e lettura limitate.
La ricerca su quanti dati può contenere il DNA
L’archiviazione di dati digitali nel DNA si basa sulla sua struttura molecolare di questo acido nucleico, composta da quattro basi azotate – adenina (A), timina (T), citosina (C) e guanina (G) – che fungono da elementi di codifica, analoghi agli 0 e 1 del linguaggio binario dei computer. Ogni nucleotide può rappresentare teoricamente fino a 1,8 bit di informazione e Yaniv Erlich e Dina Zielinski, due ricercatori della Columbia University, nel 2017 sono riusciti ad avvicinarsi dell'85% a questo limite, codificando 1,6 bit per nucleotide. Un risultato mai raggiunto prima di quel momento!
Tutto questo, tradotto in termini spiccioli, equivale a dire che la quantità totale di dati prodotti globalmente (nel 2018 stimata in 3,52 · 1022 bit e che si prevede possano centuplicare entro il 2040), potrebbe teoricamente essere conservata senza ricorrere ad hard disk meccanici, dischi a stato solido (SSD) e altri supporti di storage “classici”. Per usare i termini impiegati dalla rivista Science il sistema potrebbe, almeno teoricamente, «archiviare ogni bit di dati mai registrato dagli esseri umani in un contenitore delle dimensioni e del peso di un paio di pick-up».
Per raggiungere questo risultato, Erlich e Zielinski hanno studiato gli algoritmi già utilizzati in passato da altri ricercatori per codificare e decodificare i dati. A questo riguardo, la rivista Science racconta:
Hanno iniziato con sei file, tra cui un sistema operativo completo, un virus informatico, un film francese del 1895 intitolato Arrival of a Train at La Ciotat e uno studio del 1948 del teorico dell'informazione Claude Shannon. Hanno prima convertito i file in stringhe binarie di 1 e 0, li hanno compressi in un file master e poi hanno suddiviso i dati in brevi stringhe di codice binario. Hanno ideato un algoritmo chiamato “DNA fountain”, che ha impacchettato casualmente le stringhe in cosiddette goccioline, a cui hanno aggiunto tag extra per aiutarli a riassemblarle nell'ordine corretto in seguito. In tutto, i ricercatori hanno generato un elenco digitale di 72.000 filamenti di DNA, ciascuno lungo 200 basi.
In seguito, i ricercatori hanno inviato i file di dati alla startup Twist Bioscience, che si è occupata di sintetizzare i filamenti di DNA. Un paio di settimane più tardi Erlich e Zielinski hanno ricevuto per posta una fiala contenente il granello di DNA che era stato utilizzato per la codifica del loro file e, avvalendosi della moderna tecnologia di sequenziamento del DNA, hanno provveduto a decodificare le informazioni. Le sequenze sono state quindi inserite in un computer, che ha tradotto il codice genetico in codice binario sfruttando i tag per andare a riassemblare i sei file originali. Come riportato su Science, l'approccio usato dai ricercatori «ha funzionato così bene che i nuovi file non contenevano errori».
Se volete approfondire gli aspetti tecnici dell'esperimento, vi lasciamo al seguente video (in lingua inglese), in cui i due ricercatori illustrano il tutto.
DNA: un giorno lo useremo come hard disk?
A questo punto viene spontaneo chiedersi: visti i risultati raggiunti nell'esperimento, un giorno useremo il DNA come hard disk? È ancora presto per dirlo. Questo perché pur trattandosi di un metodo efficace per immagazzinare grandi quantità di dati in poco spazio, si tratta di una pratica estremamente costosa, il che potrebbe scoraggiare l'adozione di simili tecnologie su larga scala. Basti pensare che per 2 megabyte di dati i ricercatori hanno sborsato 7.000 dollari per sintetizzarli e altri 2.000 dollari per leggerli, sostenendo così una spesa complessiva di 9.000 dollari. Senza contare che, rispetto ad altre modalità di archiviazione dei dati, la scrittura e la lettura del DNA richiede tempi relativamente più lunghi. Questo potrebbe suggerire scenari in cui il DNA non verrà usato come “hard disk” dall'utente comune, ma dalle grandi aziende che lavorano enormi quantità di dati, in primis le big tech.