Stockage objets (1) : problématiques et limites de la technologie RAID
Publié par La rédaction le | Mis à jour le
Avis d'expert, par Laurent Fanichet, Responsable Marketing Produit - Big Data pour la zone EMEA/APAC de Quantum, spécialiste de la sauvegarde et de l'archivage depuis 30 ans.
Alors que les possibilités de monétisation du contenu n'ont jamais été aussi nombreuses qu'aujourd'hui, l'accès des équipes de production aux ressources numériques ne cesse de se compliquer. Fournir une capacité de stockage suffisante, et ce dès la capture des données, permettrait d'améliorer considérablement cette situation. En effet, pour enregistrer des événements en direct, on utilise aujourd'hui plus de caméras qu'auparavant, et les formats haute résolution saturent les systèmes d'ingestion en moins de temps qu'il n'en faut pour le dire.
La forte demande de capacité de stockage ne s'arrête pas là : les transcodeurs produisent plus de formats de distribution pour des dispositifs connectés toujours plus nombreux et les propriétaires de contenu créent plus de contenu « second écran » destiné aux marchés du direct et du contenu à la demande. Résultat : les propriétaires de contenu ont bien du mal à préserver l'accès de leurs créateurs de contenu et des consommateurs à des ressources numériques dont le volume croît rapidement. Les bibliothèques numériques connaissent une croissance exponentielle qui leur a fait franchir le cap du pétaoctet, et ce n'est pas fini.
La stratégie la plus courante consiste à stocker autant de contenu que les budgets le permettent sur des systèmes de stockage hautes performances. Puis, à mesure que ceux-ci se remplissent, à archiver les données plus anciennes sur des bandes hors ligne. Ces stratégies sont risquées au vu des nouvelles possibilités de monétisation du contenu, telles que la réutilisation pour accélérer la production de nouvelles ouvres et la distribution sur de nouvelles plates-formes. Les équipes de production doivent pouvoir accéder rapidement au contenu.
Les propriétaires de contenu pourront exploiter un potentiel énorme en termes de revenus sans que leurs budgets augmentent au même rythme que le volume des contenus. Il leur faut une solution de stockage capable de fournir un accès très rapide à partir de sites multiples, une protection efficace contre la perte de données et une évolutivité sans limites, le tout pour un budget raisonnable. C'est ici que le stockage objets entre en jeu.
La technologie RAID atteint ses limites
La plupart des systèmes de stockage sur disque actuellement commercialisés intègrent la technologie RAID. Celle-ci utilise des checksums ou le mirroring pour protéger les données qu'elle répartit, ainsi que les checksums, entre les disques d'un groupe appelé « baie RAID ». Avec les disques d'une capacité de plusieurs téraoctets commercialisés aujourd'hui, il est possible de gérer des importants volumes de données sur une seule baie RAID logique et homogène composée de 4 à 12 disques et proposant une capacité utile totale d'une trentaine de téraoctets.
Cependant, la croissance des données est telle que la technologie des disques n'arrive plus à suivre. Des volumes de données atteignant plusieurs pétaoctets obligent à utiliser des groupes comportant plus de 12 disques, ce qui accroît le risque de perte de données consécutif à une panne matérielle, ou à répartir les données entre plusieurs groupes RAID, ce qui augmente le coût et la complexité de la gestion globale de la cohérence et de l'intégrité des données.
Les baies RAID avec beaucoup de capacité imposent de longues reconstructions
Les disques de plus grande capacité allongent aussi le temps de reconstruction en cas de panne. La panne d'un disque d'une capacité de 3 To ou plus peut accroître le risque de corruption des données et dégrader les performances pendant 24 heures au moins, le temps nécessaire à la reconstruction par les systèmes RAID sur un disque de remplacement.
Des migrations délicates avec les mises à niveau RAID
La technologie RAID impose que tous les disques d'un groupe présentent une capacité et une structure homogènes. La technologie RAID exige également que tous les disques soient locaux et, en général, associés au même contrôleur. Sans la réplication, la protection qu'elle assure est limitée en cas de défaillance au niveau des nouds, et inexistante en cas de panne à l'échelle d'un site.
La réplication améliore la protection, au détriment de l'efficacité
La réplication améliore l'intégrité des données, la restauration et l'accessibilité, mais elle réduit l'espace de stockage utile et induit de nouvelles complications au niveau opérationnel. Avec la réplication, les fichiers sont copiés vers un emplacement secondaire distant en vue de la reprise après incident ou pour améliorer l'accès aux données, ce qui multiplie par deux le coût du stockage.
Conclusion
Tous les professionnels de l'audiovisuel sont déjà confrontés, ou le seront bientôt, à la gestion de bibliothèques de contenus numériques toujours plus volumineuses. Les opportunités de monétisation du contenu se font plus nombreuses et les consommateurs exigent de pouvoir disposer de contenus à tout moment, où qu'ils se trouvent et quel que soit l'équipement qu'ils utilisent. Cela pèsera sur les workflows actuels et risque de nuire à la compétitivité de certains sites.
L'approche traditionnelle n'est pas capable de gérer les pétaoctets de données d'aujourd'hui ni les exaoctets de demain. De plus, l'utilisation de disques RAID pour le stockage near-line constitue une solution à court terme très coûteuse au quotidien et très risquée lorsque des pétaoctets de données sont en jeu.
Voir aussi
Silicon.fr étend son site dédié à l'emploi IT
Silicon.fr en direct sur les smartphones et tablettes