Déjà incorporée à son produit Red Hat Storage Server, l’éditeur entend étendre la portée de la technologie Gluster File System, en particulier pour contourner les difficultés associées à HDFS (Hadoop Distributed File System), et en faire un projet de l’Apache Software Foundation.
C’est en 2011 que Red Hat a fait l’acquisition de Gluster, pour 131 millions de dollars, et de sa technologie de Gluster File System (GlusterFS). Il s’agit d’un système de fichiers scale-out destiné aux NAS (Network Attached Storage), reposant sur un composant à la fois client et serveur sous protocole TCP/IP, InfiniBand ou SDP, basé sur un design empilable de l’espace utilisateur.
Un système de briques de stockage, en quelque sorte, qui exploite des ‘traducteurs’ (expression avancée par Gluster) pour réunir des espaces de stockage disponibles sur des serveurs distants en volumes composites de stockage virtuel.
L’utilisateur voit un volume global de stockage via des mécanismes FUSE sous protocole NFS v3. À noter que ces volumes virtuels peuvent être exportés via le kernel NFS v4, SAMBA, ou encore sous la forme d’objets OpenStack Storage (dans le projet Swift).
GlusterFS est un produit gratuit proposé sous licence GNU GPL v3. Mais Red Hat a d’autres ambitions pour ce produit et lorgne avec intérêt vers le Big Data et Hadoop. Devenue Red Hat Storage Hadoop, la solution open source se présente comme une alternative au Hadoop Distributed File System.
La solution est plus avancée que celle de la communauté Hadoop. En particulier elle offre un certain nombre de fonctionnalités avancées, dans la gestion, la réplication, la haute disponibilité, la compliance POSIX, ou encore pour le plan de reprise d’activité.
Des fonctionnalités plus particulièrement recherchées par les acteurs du Big Data qui misent sur le stockage unifié, la scalabilité et les clusters Hadoop.
Si l’initiative de Red Hat est appréciée, nous pouvons en revanche nous inquiéter de la profusion des contributeurs qui adressent la problématique HDFS. Chacun y va de son plug-in, open source pour Red Hat ou Quantcast, propriétaire pour EMC ou NetApp. À multiplier les initiatives, l’utilisateur ne sait plus où tourner la tête, ni quelle solution choisir…
D’autant que ces alternatives à HDFS ont aussi pour but d’étendre les solutions de stockage des éditeurs ou des constructeurs, souvent bien au-delà de leurs solutions de Big Data. Dans ces conditions, le risque est grand d’éloigner l’utilisateur de l’approche de standardisation qui pourtant domine dans tous ces secteurs.
L’avenir du Big Data demeure encore incertain dans sa formulation comme dans ses technologies.
Voir aussi
Quiz Silicon.fr – Le vocabulaire du cloud
Silicon.fr étend son site dédié à l’emploi IT
Silicon.fr en direct sur les smartphones et tablettes
Pour développer une version 7B de son modèle Codestral, Mistral AI n'a pas utilisé de…
L’Autorité de la concurrence et des marchés (CMA) britannique ouvre une enquête sur les conditions…
Thomas Gourand est nommé Directeur Général pour la France. Il est chargé du développement de…
Pour dissuader le CISPE d'un accord avec Microsoft, Google aurait mis près de 500 M€…
Pour réduire la taille des mises à jour de Windows, Microsoft va mettre en place…
De l'organisation administrative à la construction budgétaire, la Cour des comptes pointe le fonctionnement complexe…