Silicon Valley Tour - Les logiciels : nouveaux maîtres du stockage
Notre voyage dans la Valley nous a confrontés à plusieurs types de logiciels de stockage : Scality et le Software Defined Storage, Delphix et la gestion des copies de bases de données, ou StorPool regroupant les ressources de stockage inutilisées.
Avec l'avènement de la virtualisation, la tendance n'est clairement plus matérielle ! Et pourtant. Il reste indispensable. En attendant, de nombreux éditeurs naissent pour répondre à diverses problématiques de stockage. Soit en proposant une solution globale de stockage, à l'image de Scality qui affine sa solution et réajuste avec pragmatisme son positionnement. Soit en répondant à un besoin plus spécifique comme Delphix qui optimise les multiples copies de bases de données
Scality intègre Hadoop, OpenStack et plus de clients
En quelques mois, Scality a confirmé son expansion en passant à 85 employés (contre 35 il y a 18 mois), et en recrutant Erwan Ménard Au poste directeur des opérations et Philippe Mechanick comme directeur financier (en janvier).
Positionné comme « la fondation du stockage pour le Software Defined Datacenter, multi-tenant, multi-application et multi-workload », l'anneau Scality (RING) est un logiciel de stockage indépendant du matériel « à l'échelle du cloud », reposant sur une infrastructure de serveurs x86.
Outre le stockage de fichiers, en mode bloc ou objet (sur lequel la société modère son enthousiasme passé - marché oblige.), Scality propose aussi le stockage Hadoop.
Son fondateur et dirigeant, Jérome Lecat, confirme sa cible privilégiée : « Nous ne nous adressons qu'aux entreprises gérant un stockage d'au moins un pétaoctet.»
La société française dispose aujourd'hui de 50 clients aux États-Unis, en Europe et au Japon. En un moins d'un an, Scality a signé avec plus de 10 nouveaux clients dont Los Alamos National Laboratory, RTL Interactive (16000 vidéos), AB Groupe, Pluriad, Renault, ou encore Dailymotion (10 Pétaoctets),
En se positionnant sur le SDS, Scality doit affirmer aussi son alignement aux standards et à l'intégration des technologies utilisées par les entreprises. La solution étend d'ailleurs sa comptabilité avec openstack de Cinder (stockage bloc) à Swift (stockage Objet).
Côté sécurité, la réplication systématique intervient pour protéger le stockage des petits fichiers, tandis que les plus conséquents sont protégés par un mécanisme « d'erasure coding », permettant de reconstituer l'information par calcul en cas de problème (type RAID 5). Une distinction qui améliore sensiblement les performances selon l'entreprise.
La base de données MESA gérant les métadonnées Scality répond aux caractéristiques de fiabilité optimale des bases données ACID (Atomicité, Cohérence, Isolation et Durabilité).
Enfin, l'éditeur travaille toujours sur la possibilité de créer des snapshots de façon ponctuelle et/ou incrémentale. À suivre.
Delphix virtualise le fléau des copies de bases de données
Située à Menlo Park, municipalité du comté de San Mateo à une cinquantaine de kilomètres de San Francisco, Delphix a déjà fait l'objet de plusieurs articles dans silicon.fr (ici et ici). Et pour cause : cette start-up commence à s'installer dans le paysage mondial des bases de données.
« Virtualisation des bases de données », une expression ambigüe et mystérieuse souvent utilisée pour qualifier le métier de cet éditeur. En fait, la solution s'attaque à un problème onéreux : l'optimisation des copies de données. En effet, une base de données en entreprise est copiée plusieurs fois (entre 5 et 7 en moyenne) pour des besoins de développement, de tests, d'audit, etc. Généralement, ces copies nécessitent plusieurs heures ou jours avant d'être disponibles et ne contiennent pas les données réellement à jour. En outre, elles occupent autant de fois l'espace nécessaire.
Via son appliance virtuelle, un gestionnaire de fichiers et un orchestrateur maison, Delphix copie les données (et les synchronise en quasi temps réel) en divisant par 10 l'espace de stockage, et avec des performances dopées puisque tout s'exécute en mémoire.
Plusieurs nouveautés au catalogue. Les bases de données Sybase et Postgres ont rejoint SQL Server et Oracle.
Les fonctions avancées de gouvernance des données et de conformité (compliance) permettent de gérer les régressions en cas de besoins, et en quelques minutes. De même, le module « Modernization » titre parti de ces virtualisations pour migrer en toute sérénité d'un environnement vers un autre aussi simplement que le retour en arrière.
Parce que cette virtualisation peut s'appliquer à tout l'environnement et pas uniquement à la base de données, les moteurs SAP et Oracle e-Business Suite sont maintenant intégrés.
Le tout (modules, couches applicatives et moteurs de bases de données) repose sur la plateforme virtuelle de données (Virtual Data Platform) dont le Datavisor sait synchroniser et orchestrer l'ensemble à travers de multiples serveurs physiques ou virtuels, datacenters, clouds publics ou privés. Tandis que le système de gestion de fichiers DxFS prend en compte tout disque classique, flash ou hybride.
La solution fait penser à celle de son concurrent Actifio (très proche d'IBM), contre laquelle Delphix a déposé plainte auprès de la justice américaine pour violation de brevet.
StorPool : Que faites-vous des ressources de stockage inutilisées ?
À l'instar de la virtualisation des serveurs qui a permis d'optimiser l'utilisation de la puissance de calcul et de la mémoire des serveurs, StorPool propose la rationalisation de l'espace du stockage inutilisé à travers le système d'information.
Proposer une solution exploitant les espaces de stockage et la mémoire utilisés des serveurs de l'entreprise (avec mécanisme possible de libération de ces espaces en cas de besoin) ? Une idée intéressante et amusante, qui fait jaillir une palanquée de « Mais. » !
À l'origine de ce concept de « distributed, software-defined », la start-up StorPool créée en 2011 a bénéficié de l'appui financier du fond LaunchHub (destiné à aider l'éclosion de start-up du sud-est de l'Europe).
Lire aussi : De S3 à EFS, le stockage AWS s'adapte à l'IA
StorPool s'accapare les ressources disponibles sur les serveurs : stockage, mémoire, bande passante, entrées/sorties. Le système de stockage distribué écrit sur plusieurs supports simultanément, et obtient -selon la société- des performances bien meilleures qu'un stockage traditionnel.
Pour éviter des incidents ou des charges obligeant à libérer des ressources inopinément, le système copie chaque information sur trois supports de différents serveurs.
StorPool fonctionne sur des serveurs x86 standard favorisant l'extensibilité aisée de l'espace de stockage. Parmi les fonctionnalités évoluées, on retrouve l'auto-réparation ou encore la mise à jour sans interruption.
L'accès aux données se fait aussi simplement qu'un accès à un SAN, et tout serveur ou noud peut y accéder, qu'il partage ou non de l'espace ou des ressources avec StorPool.
Le système sait faire preuve de flexibilité et son interface d'administration autorise l'utilisateur à distribuer le stockage des multiples copies sur divers supports (disque dur, SSD, etc.). Certains types de données peuvent également être systématiquement dirigés vers un type de support prédéfini. Par exemple, il peut s'avérer intéressant dans certaines situations de stocker les données sur le même serveur qu'une application, et sur un type de support adapté à la qualité de service attendue.
Une toute jeune start-up européenne à suivre. Et si le concept parvenait à séduire des investisseurs américains ? Sait-on jamais ?
Sur le même thème
Voir tous les articles Cloud