Un algorithme de streaming vidéo aide au stockage sur ADN

Deux chercheurs américains se sont basés sur un code utilisé dans le streaming vidéo pour augmenter sensiblement la capacité de stockage sur ADN.

Publié par Jacques Cheminat le 4 mars 2017 | Mis à jour le 2 mars 2021 à 11:11

Lecture
3 min

Imprimer

De plus en plus de chercheurs se tournent vers l'ADN pour le stockage des données. Une nouvelle étude menée par des chercheurs de l'Université de Columbia et du Centre de Génomique de New York a déterminé qu'un algorithme utilisé pour le streaming vidéo sur les mobiles pouvait débloquer la capacité de stockage de l'ADN en compactant plus d'information sur les 4 nucléotides de base.

Yaniv Erlich et sa collègue Dina Zielinski ont choisi de coder 6 fichiers sur de l'ADN : un système d'exploitation complet, le film français des frères Lumière « L'arrivée d'un train à la Ciotat » (datant de 1895), une carte cadeau Amazon de 50 dollars, un virus informatique, une plaque de la sonde spatiale Pioneer et une étude du théoricien de l'informatique Shannon datant de 1948.

Un algorithme de code fontaine pour compresser les données

Les chercheurs ont compressé les documents dans un fichier maître, puis ont divisé les données dans des chaînes courtes de code binaire (composées de 1 et de 0). Ensuite, ils se sont appuyés sur un algorithme de correction d'erreurs, baptisé code fontaine (utilisé dans le streaming vidéo), pour intégrer les chaînes de manière aléatoire au sein de droplet (gouttelettes). Par la suite, ils ont cartographié les 1 et les 0 dans chaque droplet sur les 4 nucléotides de base de l'ADN : A, G, C et T. L'algorithme cité précédemment permet de supprimer les combinaisons de lettres connues pour créer des erreurs. Il ajoute également un code-barre à chaque droplet pour aider au réassemblage des fichiers a posteriori.

La technique de code fontaine pour l'ADN.

Au total, les scientifiques ont généré une liste numérique de 72 000 brins d'ADN, contenant chacun 200 bases longues. Cette liste a été envoyée dans un fichier texte à une start-up de San Francisco, Twist BioScience, spécialisée dans la transformation des données numériques en données biologiques. deux semaines plus tard, les universitaires ont reçu un flacon contenant un brin de molécules d'ADN.

215 Po de données en théorie

Pour récupérer les fichiers à partir de cet ADN, ils ont utilisé un outil de séquençage puis un logiciel spécialisé pour traduire le code génétique en binaire. Et ont récupéré l'ensemble des fichiers avec zéro erreur. Par ailleurs, les spécialistes ont démontré qu'avec leur technique de codage, ils pouvaient créer de manière illimitée des copies de leurs fichiers en multipliant les échantillons d'ADN via la technique PCR (polymerase chain reaction). Et toujours sans erreur lors de la récupération des informations.

Avec ce système de codage, les chercheurs estiment que dans 1 gramme d'ADN, ils peuvent stocker 215 Po de données. Soit 100 fois plus qu'avec les méthodes précédentes. Mais il reste encore un obstacle au développement du stockage de données sur ADN : le coût. Pour mener à bien leur expérience, les scientifiques ont dépensé 7 000 dollars pour synthétiser l'ADN embarquant 2 Mo de données et 2 000 dollars pour le lire.

Stockage sur ADN, Microsoft en route pour le datacenter

Apple ResearchKit s'intéresse à l'étude de l'ADN

Photo credit: thdoubleu via Visual hunt / CC BY-SA

Publié par :
Jacques Cheminat

Tags associés :

sponsorisé

Gestion de crises : les leçons d’un DSI

Gestion de crises : les leçons d’un DSI17:35

SNCF Connect & Tech explore toutes les voies de la rés…23:13

D'une mine à la supply chain, de l'OT à l’industrie 4.…22:33

Champs d'application et exigences NIS220:52

Retour d'expérience : mise en œuvre des exigences par…20:42

Comment simplifier la sécurisation de votre réseau tou…20:23

Sécurité renforcée : comment préparer la conformité à…20:56

Le savoir-faire règlementaire international de Cloudfl…20:32

Se protéger et remédier aux Attaques de Messagerie : U…21:48

[Episode en public] Les leçons de résilience d’OVH29:04

[Énergie] La résilience du réseau et sa mesure d'impact19:43

SASE : La fusion du SD-WAN et du SSE décryptée07:42

Quand la cyber-résilience investit l’espace16:31

Sécurité Multicouche : La clé pour une entreprise rési…16:11

Remettre l’humain au centre du cyber-espace16:55

L’IA, super-pouvoir du cyberespace09:39

Les enjeux de sécurité des médias internationaux de la…14:32

L’IA, un atout pour une continuité de service public p…16:50

Une cyber-résilience à l’aune de l’IA et des régulatio…19:25

Tous les Internets se valent-ils ?10:59

Decathlon : une culture agile à l’international20:08

Comment Carrefour a transformé la crise sanitaire en t…12:48

Comment Groupama s’assure d’être résilient face aux cr…13:48

Comment impulser une culture data dans une grande entr…14:17

Hors-série : La data du futur (Volume 1)08:28

Cegid : la tête dans le Cloud22:16

Hors-série : La data du futur (Volume 2)07:30

La data au service des verres intelligents chez Essilo…09:42

La vision conseil de Deloitte sur la data et l’IA19:04

Data altruisme et IA responsable au Crédit Mutuel Arkéa11:54

[BONUS] La Data Responsable : une vision écologique23:08

Silicon.fr L'actualité informatique et high-tech pour décideurs IT

Un algorithme de streaming vidéo aide au stockage sur ADN

Un algorithme de code fontaine pour compresser les données

215 Po de données en théorie

Photo credit: thdoubleu via Visual hunt / CC BY-SA

OpenAI : un chiffre d'affaires de près de 13 milliards en 2025 ?

Qualcomm lance un raid antitrust contre Arm

Les États-Unis ajoutent 50 entreprises chinoises à leur liste [...]

VMware attaque Siemens pour "des milliers de licences" manquantes

Musique et IA : Anthropic gagne une bataille contre les labels

S’abonner

Simplifier l’architecture et améliorer la sécurité

Réunir la connectivité et la sécurité

Le grand dîner de Gala de la Communauté

La Matinale Silicon - Zéro Trust

La MasterClass Silicon - NIS2

Silicon.fr L'actualité informatique et high-tech pour décideurs IT

Un algorithme de code fontaine pour compresser les données

215 Po de données en théorie

Photo credit: thdoubleu via Visual hunt / CC BY-SA

S’abonner

Partager l'épisode