RainStor : l'approche économique et compressée du Big Data
En direct de la Silicon Valley : John Bandleman, le CEO de RainStor, affiche la tranquillité de ces serial-entrepreneurs de la Silicon Valley, qui fortune faite à force de créations et d'IPO, n'ont plus à démontrer leur capacité à repérer les bons coups technologiques, mais frappés par le virus des technos continuent de construire les acteurs de demain. RainStor n'échappe pas à cette vision. À l'origine, le projet de cette start-up portait sur une base de données dédiée à l'archivage. À force d'évolutions du marché et d'adaptations à la demande, elle est devenue la première base de données native Big Data sur Hadoop.
« RainStor est une base de données, tient à affirmer John Bandleman. Une base de données native sur Hadoop permet de réaliser de l'analytique plus rapide pour un coût de gestion réduit. Notre offre est basée sur la vélocité, avec la capacité de traiter plusieurs milliards de transactions par jour, le volume, afin de passer du térabit au pétabit, la variété, en étant multi-structurée pour gérer le multi-formats des fichiers, et finalement la valeur. »
Un taux de compression record
Le point fort de RainStor, c'est son haut degré de compression, qui peut dépasser les fois 40. Concrètement, cela signifie d'une part un avantage énorme pour l'entreprise, la capacité de stocker des volumes extrêmement importants de données sur une infrastructure de stockage réduite, donc de réduire sensiblement ses coûts ; sous réserve d'autre part d'accepter la contrainte que ces données ne seront plus transactionnelles, c'est-à-dire qu'elles ne peuvent plus être transformées après compression.
Justement, l'analytique est le second point fort de l'offre de RainStor. Solution Big Data Analytics sur Hadoop, John Bandleman souligne l'importance de « l'analytique rapide avec SQL et MapReduce, de 10 à 100 fois plus véloce qu'une solution classique. »
Pour logique qu'il soit, le choix d'associer SQL et MapTReduce, l'approche structurée de la base de données et l'outil d'interrogation à programmer du monde Hadoop, surprend. « Nous pensons que SQL et MapReduce peuvent évoluer ensemble ». Certes, mais au final le message du fondateur de RainStor se fait séduisant en retenant principalement l'argument économique : « Hadoop est une architecture low cost, qui a la capacité à gérer le multi-formats de fichiers, et qui est mise en valeur par le logiciel. Nous y ajoutons la compression massive qui permet de réduire le nombre de nodes. »
Le Big Data sur Hadoop n'en est qu'à ses débuts et loin de proposer un environnement stable, car en devenir. D'ailleurs John Bandleman ne le cache pas, « les solutions MapReduce manquent encore de robustesse ». Et pourtant RainStore propose déjà à ses clients - pour le moment principalement des opérateurs télécoms attirés par la promesse de compression exceptionnelle des données - d'adopter une approche de coût agressive. Avec un tel argument, la promesse du Big Data sur Hadoop a de quoi séduire.
Sur le même thème
Voir tous les articles Data & IA