Big Data : Red Hat Storage Hadoop, alternative à HDFS
Déjà incorporée à son produit Red Hat Storage Server, l'éditeur entend étendre la portée de la technologie Gluster File System, en particulier pour contourner les difficultés associées à HDFS (Hadoop Distributed File System), et en faire un projet de l'Apache Software Foundation.
Système de fichiers scale-out
C'est en 2011 que Red Hat a fait l'acquisition de Gluster, pour 131 millions de dollars, et de sa technologie de Gluster File System (GlusterFS). Il s'agit d'un système de fichiers scale-out destiné aux NAS (Network Attached Storage), reposant sur un composant à la fois client et serveur sous protocole TCP/IP, InfiniBand ou SDP, basé sur un design empilable de l'espace utilisateur.
Un système de briques de stockage, en quelque sorte, qui exploite des 'traducteurs' (expression avancée par Gluster) pour réunir des espaces de stockage disponibles sur des serveurs distants en volumes composites de stockage virtuel.
L'utilisateur voit un volume global de stockage via des mécanismes FUSE sous protocole NFS v3. À noter que ces volumes virtuels peuvent être exportés via le kernel NFS v4, SAMBA, ou encore sous la forme d'objets OpenStack Storage (dans le projet Swift).
Red Hat Storage Hadoop
GlusterFS est un produit gratuit proposé sous licence GNU GPL v3. Mais Red Hat a d'autres ambitions pour ce produit et lorgne avec intérêt vers le Big Data et Hadoop. Devenue Red Hat Storage Hadoop, la solution open source se présente comme une alternative au Hadoop Distributed File System.
La solution est plus avancée que celle de la communauté Hadoop. En particulier elle offre un certain nombre de fonctionnalités avancées, dans la gestion, la réplication, la haute disponibilité, la compliance POSIX, ou encore pour le plan de reprise d'activité.
Des fonctionnalités plus particulièrement recherchées par les acteurs du Big Data qui misent sur le stockage unifié, la scalabilité et les clusters Hadoop.
À multiplier les offres.
Si l'initiative de Red Hat est appréciée, nous pouvons en revanche nous inquiéter de la profusion des contributeurs qui adressent la problématique HDFS. Chacun y va de son plug-in, open source pour Red Hat ou Quantcast, propriétaire pour EMC ou NetApp. À multiplier les initiatives, l'utilisateur ne sait plus où tourner la tête, ni quelle solution choisir.
D'autant que ces alternatives à HDFS ont aussi pour but d'étendre les solutions de stockage des éditeurs ou des constructeurs, souvent bien au-delà de leurs solutions de Big Data. Dans ces conditions, le risque est grand d'éloigner l'utilisateur de l'approche de standardisation qui pourtant domine dans tous ces secteurs.
L'avenir du Big Data demeure encore incertain dans sa formulation comme dans ses technologies.
Voir aussi
Quiz Silicon.fr - Le vocabulaire du cloud
Silicon.fr étend son site dédié à l'emploi IT
Silicon.fr en direct sur les smartphones et tablettes
Sur le même thème
Voir tous les articles Data & IAPar Clément Bohic
Par Clément Bohic
Par Clément Bohic
Par La rédaction