Pour gérer vos consentements :
Categories: Réseaux

La déduplication des données: chère ou économique?

Cette année, le Nouveau Monde numérique va créer une déferlante de données qui remplirait 400 millions de disques durs de 1 To (tera-octets, ou 1000 gigas) . Mis bout à bout, ces supports de stockage feraient plus de 14 fois le tour de la Terre !

Au centre de la plupart des échanges financiers et humains, cette muraille colossale vit et grandit sans cesse pour constituer la plus formidable des problématiques jamais gérée par les systèmes d’informations.

Il ne fait aucun doute que pour y répondre, de nombreuses DSI de grandes et petites organisations sont aujourd’hui à la recherche d’outils de gestion afin de minimiser les impacts financiers de cette marée de données.

Au début de ce siècle, des start-up se sont penchés sur cette question et ont découvert la pierre philosophale du stockage: la déduplication des données.

Un peu de pédagogie pour comprendre leur découverte

Si l’on transforme un disque dur en un énorme chaudron d’un million de billes dispatchées inégalement dans 10.000 sachets (les fichiers), la déduplication va permettre de « factoriser » toutes les billes similaires contenues dans les sachets pour n’en garder qu’une réelle (le facteur) dans une cuve prévue à cet effet. Chaque sachet disposera d’autant de pointeur(s) vers cette cuve qu’il possédait de bille(s) factorisée(s).

Cette opération pourrait réduire jusqu’à 20 fois le poids du million de billes …

A l’échelle d’une organisation, l’économie semble considérable et l’investissement dans ce type de technologie pourrait avoir une indéniable rentabilité. Oui, mais à condition de toujours bien sauvegarder les données dédupliquées sur un autre support

C’est peut-être ce qui explique les doutes de certains sur l’utilité d’une technique coûteuse en termes d’acquisition et de gestion : pressentant le danger sur leurs ventes en volume, les grandes enseignes du stockage ont toutes acquis la technologie en absorbant les ‘start-ups’ du secteur et la proposent alors directement intégrée à leurs systèmes respectifs, mais à des tarifs élevés….

Par exemple, dans le domaine des données non structurées telles que les vidéos, photos, MP3 , les occurrences ont des chances d’être moins nombreuses et la déduplication pourrait être alors considérée comme un luxe alors que la duplication des données est indispensable pour la sauvegarde et l’archivage.

En conclusion,

les avantages économiques de la déduplication sont aujourd’hui réservés à de riches entités, gérant des données structurées et susceptibles d’être présentes sur de nombreux disques durs d’utilisateurs (présentations, plans, vidéos, etc…). Pour les autres, il vaudra mieux attendre l’arrivée de technologies Open Source à faible coût d’acquisition

___

(*) Intellique

Recent Posts

Pour son premier LLM codeur ouvert, Mistral AI choisit une architecture alternative

Pour développer une version 7B de son modèle Codestral, Mistral AI n'a pas utilisé de…

14 heures ago

Microsoft x Inflection AI : l’autorité de la concurrence britannique lance son enquête

L’Autorité de la concurrence et des marchés (CMA) britannique ouvre une enquête sur les conditions…

17 heures ago

Thomas Gourand, nouveau Directeur Général de Snowflake en France

Thomas Gourand est nommé Directeur Général pour la France. Il est chargé du développement de…

18 heures ago

Accord Microsoft-CISPE : comment Google a tenté la dissuasion

Pour dissuader le CISPE d'un accord avec Microsoft, Google aurait mis près de 500 M€…

18 heures ago

Vers des mises à jour cumulatives intermédiaires pour Windows

Pour réduire la taille des mises à jour de Windows, Microsoft va mettre en place…

19 heures ago

RH, finances, stratégie… Les complexités de la Dinum

De l'organisation administrative à la construction budgétaire, la Cour des comptes pointe le fonctionnement complexe…

2 jours ago