Stocarea de date digitale ADN se referă la procesul de codificare și decodificare a datelor binare către și de la șiruri de ADN sintetic.
Deși ADN-ul are un potențial enorm ca mediu de stocare datorită densității sale mari de stocare, utilizarea sa practică este în prezent sever limitată datorită costului ridicat și a vitezei de citire și scriere foarte mici.
În iunie 2019, Oamenii de știință raportează că 16 GB de text din versiunea engleză a Wikipedia au fost codați cu succes în sinteza ADN-ului (în) .
În prezent , Cea mai utilizată tehnologie de secvențiere a ADN-ului este cea dezvoltată de Illumina , care implică imobilizarea unei singure fire de ADN pe un suport solid, reacția în lanț a polimerazei secvențelor și marcarea bazelor azotate individuale cu complementare baze azotate însele etichetate de sonde fluorescente . Modelul de fluorescență (o culoare diferită pentru fiecare dintre cele patru baze azotate) poate fi apoi capturat într-o imagine și procesat pentru a determina secvența ADN. O alternativă recent dezvoltată Este tehnologia nanopore în care moleculele de ADN sunt trecute printr-un por din nanoscală sub controlul unei enzime cu clichet. Trecerea moleculelor de ADN determină o mică modificare a curentului electric care poate fi măsurată. Principalul avantaj al acestei tehnologii este că poate fi citit în timp real. Cu toate acestea, precizia de citire a acestei tehnologii este în prezent Insuficientă pentru stocarea datelor.
Sinteza se face prin mai multe procese, ruta chimică fiind dominantă în 2020.
Este posibil să se încapsuleze ADN în nanobulele de silice. Depozitându-le în capsule din oțel inoxidabil, se estimează că se poate atinge o durată de valabilitate de 50.000 de ani.
Codul genetic al organismelor vii poate fi cooptat pentru a stoca informații. În plus, biologia sintetică poate fi utilizată pentru a proiecta celule cu „înregistratoare moleculare” pentru a permite stocarea și recuperarea informațiilor stocate în materialul genetic al celulei. CRISPR-Cas9 poate fi, de asemenea, utilizat pentru a insera secvențe de ADN artificial în genomul celulei.
Ideea stocării informațiilor digitale asupra ADN-ului datează din 1959, când fizicianul Richard P. Feynman , în prelegerea sa „ There’s Plenty of Room at the Bottom (en) ”, descrie perspectivele generale de evoluție. Referitoare la crearea obiectelor artificiale. similar cu obiectele din domeniul microscopic (inclusiv biologic) și având capacități similare sau chiar mai extinse. În 1964-65, Mikhail Samoilovich Neiman (ro) , fizician sovietic, a publicat 3 articole despre microminiaturizarea în electronică la scară molecular-atomică, unde a prezentat independent considerații generale și câteva calcule privind posibilitatea de a înregistra, stoca și prelua informații despre sintetizate Molecule de ADN și ARN. După publicarea primului articol al lui Neiman și după ce a primit de către editor manuscrisul celui de-al doilea articol al său (The8 ianuarie 1964, așa cum sa menționat în acest articol) , este publicat interviul cu Norbert Wiener , tatăl ciberneticii. Wiener exprimă idei cu privire la miniaturizarea memoriei computerului, aproape de ideile propuse de Neiman, în mod independent. Idei din Wiener pe care Neiman le-a menționat în al treilea articol.
Una dintre primele utilizări ale stocării datelor ADN a venit în 1988 prin colaborarea dintre artistul Joe Davis și cercetătorii de la Harvard . Imaginea, înregistrată într-o secvență ADN a unei bacterii E. coli , este formată ca o matrice de 5 rânduri de 7 coloane care, atunci când este decodificată, formează imaginea unei vechi rune germanice reprezentând viața și Pământul feminin. În matrice, 1s corespund pixelilor întunecați, în timp ce 0s corespund pixelilor luminoși.
În 2007, la Universitatea din Arizona a fost creat un dispozitiv care utilizează molecule de direcționare pentru a codifica site-uri de nepotrivire într-un fir ADN . Aceste nepotriviri pot fi apoi citite prin efectuarea digestiei enzimei de restricție , permițând astfel recuperarea datelor.
În 2011, George Church , Sri Kosuri și Yuan Gao au efectuat un experiment încercând să codeze o carte de 659 KB, co-autoră de Church. Pentru a face acest lucru, echipa de cercetare a făcut un meci doi la unu în care un 0 binar era reprezentat de o adenină sau o citozină și un 1 binar era reprezentat de o guanină sau o timină. La examinare, au fost găsite 22 de erori în ADN.
În 2012, George Church și colegii săi de la Universitatea Harvard codifică ADN-ul cu informații digitale cuprinzând o versiune HTML a unei cărți de 53.400 de cuvinte scrise de investigatorul principal, unsprezece imagini în format JPEG și un program JavaScript . Se adaugă mai multe copii pentru redundanță și 5,5 petabiți pot fi depozitați în fiecare milimetru cub de ADN. Se utilizează un cod simplu în care biții sunt mapați unul câte unul cu baze, care are dezavantajul de a duce la execuții lungi ale aceleiași baze, a căror secvențializare este predispusă la erori. Acest rezultat a arătat că, pe lângă celelalte funcții ale sale, ADN-ul poate fi, de asemenea, un tip de mediu de stocare, cum ar fi hard diskurile și benzile magnetice .
În 2013, cercetătorii de la Institutul European de Bioinformatică (EBI) au trimis un articol cam în același timp cu lucrarea Bisericii și a colegilor care raportau despre stocarea, recuperarea și reproducerea a peste cinci milioane de biți de date cu o fidelitate între 99,99% și 100 %. Principalele inovații din această lucrare de cercetare au fost utilizarea unui mecanism de corecție a erorilor pentru a asigura o rată extrem de scăzută de pierdere a informațiilor, precum și ideea de codificare a datelor într-o serie de oligonucleotide scurte care se suprapun și identificabile datorită unui mecanism de indexare din secvențe. În plus, secvențele firelor de ADN individuale s-au suprapus astfel încât fiecare porțiune de date a fost repetată de patru ori pentru a evita erorile (redundanță). Două dintre aceste patru fire au fost construite cu capul în jos, tot cu scopul de a elimina erorile. Costurile pe megabyte au fost estimate la 12.400 USD pentru codificarea datelor și 220 USD pentru recuperare. Cu toate acestea, s-a observat că scăderea exponențială a sintezei ADN și a costurilor de secvențiere, dacă va continua în viitor, va face tehnologia viabilă pentru stocarea datelor pe termen lung până în 2023.
În 2013, software-ul numit „DNACloud” a fost dezvoltat de Manish K. Gupta și colegii săi pentru a codifica fișiere computerizate în ADN. Aceasta este o versiune mai puțin intensă în memorie a algoritmului propus de Goldman și colab. pentru a codifica (și decoda) datele ADN (fișiere .dnac).
Un articol despre stabilitatea pe termen lung a datelor codificate cu ADN, scris de cercetători de la Institutul Federal Elvețian de Tehnologie din Zurich , apare înfebruarie 2015. Echipa adaugă redundanță prin codul Reed-Solomon și prin încapsularea ADN-ului în sfere de sticlă de silice prin procesul Sol-gel .
În 2016, Church and Technicolor Research and Innovation a publicat un articol în care sunt stocate și recuperate 22 megabytes de imagini video într-un format MPEG și recuperate prin ADN. Se constată că secvența recuperată nu conținea erori.
În martie 2017, Yaniv Erlich (în) și Dina Zielinski de la Columbia University și New York Genome Center (en) au publicat o metodă numită „DNA Fontaine” care stochează date la o densitate de 215 petabytes pe gram de ADN. Tehnica abordează capacitatea canalului de stocare a ADN-ului, ajungând la 85% din limita teoretică. Metoda nu este apoi pregătită pentru utilizare pe scară largă, deoarece costă 7000 USD pentru a sintetiza 2 megabyți de date și 2000 $ pentru a le citi.
În martie 2018, Universitatea din Washington și Microsoft publică rezultate care demonstrează stocarea și recuperarea a aproximativ 200 megabyți de date. Aceste rezultate propun și evaluează, de asemenea, o metodă de acces direct la datele stocate în ADN. Înmartie 2019, aceeași echipă anunță că a demonstrat un sistem complet automatizat pentru codificarea și decodarea datelor în ADN.
În ianuarie 2019, un articol publicat de cercetătorii de la Eurecom și Imperial College din Londra demonstrează posibilitatea stocării datelor structurate în ADN sintetic. Articolul arată cum să codificați date structurate sau mai precis relaționale în ADN sintetic și arată cum să efectuați operațiuni de prelucrare a datelor (similare cu SQL ) direct pe ADN prin procese chimice.
În iunie 2019, oamenii de știință raportează că cele 16 GB ale Wikipedia au fost codificate în ADN sintetic.
Primul articol care descrie stocarea datelor pe secvențe ADN native prin crestături enzimatice a fost publicat în aprilie 2020. In articol, oamenii de știință demonstrează o nouă metodă de înregistrare a informației în ADN - ul schelet , care permite directa bit cu bit de acces și de calcul în memorie.
21 ianuarie 2015, Nick Goldman (in) European Bioinformatics Institute (EBI), unul dintre autorii original al articolului Nature 2013 anunță Bitcoin Challenge Davos la reuniunea anuala a Forumului Economic Mondial de la Davos. În timpul prezentării sale, tuburi de ADN sunt distribuite publicului, fiecare tub conținând cheia privată codificată în ADN de exact un bitcoin . Provocarea este secvențierea și decodarea ADN-ului, primul care face acest lucru poate revendica bitcoinul. Durata provocării este stabilită la trei ani și trebuie să se încheie dacă nimeni nu pretinde premiul înainte de21 ianuarie 2018.
În ianuarie 2020, Activitatea de proiecte de cercetare avansată de inteligență (IARPA) finanțează două consorții publice private cu obiectivul, în 4 ani, de a putea stoca 1 terabyte de date în 24 de ore la un cost mai mic de 1000 de dolari. Un consorțiu este condus de Broad Institute (în) și implică în special compania franceză DNA Script , în timp ce celălalt implică inclusiv Universitatea din Washington și Twist Bioscience .
Conceptul de ADN obiect a fost prezentat în 2019 de o echipă de cercetători israelieni și elvețieni. Se referă la codificarea datelor digitale în molecule de ADN, care sunt apoi integrate în obiecte. Spre deosebire de Internetul obiectelor , care este un sistem de dispozitive de calcul interdependente, ADN-ul obiectelor creează obiecte care sunt obiecte de stocare independente, complet off-grid .