[ad_1]
Au cours de la dernière décennie, les chercheurs universitaires et en entreprise se sont tournés vers l'acide désoxyribonucléique en tant que moyen possible de stocker des données. Le stockage de données ADN offre une densité et une durabilité bien supérieures à tous les supports de stockage actuels – lecteurs de bande, lecteurs flash ou lecteurs optiques. L’ADN existe également depuis des milliards d’années et ne devrait donc pas devenir obsolète de si tôt.
Il n’est pas surprenant que les scientifiques se concentrent autant sur le stockage de données à base d’ADN en ce moment. Le monde produit plus de données que jamais et ces chiffres ne feront que croître. Selon le rapport d'IDC "L'âge des données 2025: l'évolution des données critiques pour la vie", le monde produira 163 zettaoctets de données chaque année d'ici 2025. Pour stocker cette quantité de données, il vous faudrait environ 16 disques durs modernes de 12 To. disques. Même si cela était financièrement réalisable, les disques auraient besoin de beaucoup d’espace et d’énergie, tout en ayant une durée de vie relativement courte. L'ADN peut potentiellement résoudre bon nombre de ces problèmes.
Cela ne veut pas dire que le stockage basé sur l'ADN ne présente pas son propre ensemble de défis; c'est coûteux, lent et sujet aux erreurs. Malgré tout, les chercheurs ont fait des progrès constants pour relever ces défis, avec quelques succès récents notables.
Comment l'ADN fonctionne pour le stockage
L'ADN est un matériau auto-répliquant qui se forme naturellement dans une cellule biologique. L'ADN code des informations sur les caractéristiques et les fonctions d'une cellule, fournissant les instructions génétiques nécessaires pour façonner l'organisme hôte de la cellule.
L'ADN contient quatre structures moléculaires appelées nucléotides – l'adénine, la cytosine, la guanine et la thymine – qui sont reliées ensemble en paires de bases, avec deux nucléotides différents par paire. Ensemble, les paires de bases forment un brin linéaire, ou oligonucléotide, chaque paire de bases représentant un barreau sur l’échelle oligonucléotidique, ce qui donne la chaîne en double hélice bien connue des journaux scientifiques et des logos d’entreprise.
Le stockage de données ADN utilise les nucléotides pour représenter les valeurs binaires et les zéros qui constituent la base des données numériques actuelles. L'enregistrement de données dans l'ADN est un processus de base en deux étapes:
- Le logiciel de traduction convertit les données binaires d'un fichier en séquences de paires de bases de nucléotides en corrélation avec les modèles de bits.
- Un synthétiseur construit des brins d'ADN basés sur les séquences de nucléotides. Un synthétiseur est un instrument scientifique utilisant des technologies de génie biologique de synthèse pour créer des molécules d’ADN artificielles, procédé appelé synthétiser.
La récupération des données encodées dans l'ADN synthétique est également un processus en deux étapes:
- Un séquenceur décode les nucléotides d’ADN contenus dans les oligonucléotides dans un ordre précis et renvoie leur code génétique, processus connu sous le nom de séquençage. Comme un synthétiseur, le séquenceur est un instrument scientifique, mais dans ce cas, il est utilisé pour automatiser les opérations de séquençage.
- Un programme de traduction convertit les résultats renvoyés par le séquenceur en un format binaire basé sur les mêmes modèles de bits utilisés à l'origine pour convertir les données.
La synthèse et le séquençage de l'ADN sont devenus des pratiques standard dans les bio-industries d'aujourd'hui. En conséquence, une grande partie des technologies nécessaires pour prendre en charge le stockage de données ADN existe déjà.
La promesse de l'ADN
Les chercheurs se tournent vers le stockage d'ADN, car celui-ci offre potentiellement de nombreux avantages par rapport au support de stockage actuel. L'un des principaux avantages est sa densité, qui est supérieure de plusieurs ordres de grandeur à tout support de stockage actuel. Un gramme d'ADN peut contenir des millions de giga-octets de données.
L'ADN est également extrêmement durable. Selon certaines estimations, si l’ADN est conservé au frais et au sec, sans être exposé à la lumière ni aux radiations, il pourrait durer des milliers d’années et ne jamais devenir obsolète. De plus, étant donné le rôle central de l'ADN dans le développement cellulaire, les scientifiques continueront sans doute à l'étudier et à rechercher de meilleurs moyens de le synthétiser et de le séquencer, sans que le stockage de données ADN ne connaisse le même sort que la disquette obsolète.
L’ADN peut également générer des économies de coûts considérables, en partie parce qu’il nécessite beaucoup moins d’espace et d’énergie que par rapport aux médias actuels, mais aussi parce que les technologies de synthèse et de séquençage continueront de gagner en efficacité tout en réduisant les coûts plus loin dans le fonctionnement interne de l'ADN.
Malgré ce potentiel de réduction des coûts, l'un des plus grands défis actuels pour adopter de manière significative le stockage de données à base d'ADN est le coût élevé associé à la synthèse et au séquençage de l'ADN. Stocker quelques centaines de mégaoctets de données de cette façon peut facilement coûter des milliers de dollars.
Un autre défi est que l’écriture de données dans l’ADN est un processus extrêmement lent, car elle tente de convertir tous ces modèles de bits en nucléotides. De plus, la mémoire RAM a été difficile à obtenir avec le stockage de données ADN, nécessitant le séquençage de l'ADN en gros blocs et le ralentissement du processus de lecture. En outre, les processus de synthèse et de séquençage eux-mêmes peuvent être sujets à des erreurs qui se produisent au niveau moléculaire, ce qui peut se traduire par une perte ou une corruption des données.
Faire fonctionner l'ADN
Malgré les difficultés liées au stockage basé sur l'ADN, cette technologie est suffisamment prometteuse pour que les scientifiques puissent continuer à rechercher des réponses pratiques. Par exemple, les chercheurs de Catalog Technologies ont trouvé un moyen de rendre le stockage d’ADN plus économique pour l’archivage de données à long terme en découplant les processus de synthèse et de séquençage. Plutôt que de mapper des bits individuels sur des paires de bases de nucléotides, ils synthétisent de grandes quantités de types d'ADN relativement peu nombreux qui servent de blocs de construction pour le codage des données.
Des chercheurs de l'Université de Padoue en Italie recherchent également des moyens d'améliorer le stockage des données ADN à des fins d'archivage en utilisant des nanotréseaux bactériens et des plasmides individuels, caractéristiques des cellules bactériennes contenant des informations génétiques. Les bactéries peuvent être utilisées pour accéder de manière fiable à des données spécifiques à partir de différents emplacements de stockage, en utilisant une technologie connue sous le nom de système de positionnement moléculaire, qui permet aux bactéries de détecter les chimioémissions et de se mobiliser vers un emplacement spécifique.
Des chercheurs de l'Université de l'Illinois à Urbana-Champaign travaillent sur une solution pour obtenir une RAM sans erreur pour le stockage de données à base d'ADN. Leur approche est basée sur l’amplification sélective de données spécifiques pour accélérer les lectures sans avoir à séquencer l’ensemble du pool d’ADN. Pour exécuter cette méthode, ils ajoutent deux séquences uniques (amorces) à chaque oligonucléotide, un à chaque extrémité, en utilisant une simple architecture clé-valeur pour identifier les amorces.
Microsoft et l’Université de Washington collaborent également à la mise au point d’une technique similaire permettant d’obtenir de la RAM sans erreur. Les chercheurs de ces organisations ont récemment démontré la capacité de récupérer des fichiers spécifiques à partir de plus de 400 Mo de données. Microsoft prévoit d'introduire un prototype de système commercial de stockage de données d'ADN d'ici 2020.
De nombreuses autres organisations, telles que la Defense Advanced Research Projects Agency, s'intéressent également sérieusement à la possibilité de stocker l'ADN. Dans le même temps, les processus de synthèse et de séquençage s’améliorent régulièrement et les prix baissent. Étant donné les énormes quantités de données attendues par les analystes, tout espoir de les stocker réside dans des technologies bien plus avancées que les médias actuels. L'ADN a certainement la capacité de répondre à ce besoin, si son application pratique peut être pleinement réalisée.
Source link