Silicon.fr L'actualité informatique et high-tech pour décideurs IT

Big Data : Hortonworks planche sur le futur de Hive avec Stinger.next

Les équipes de Hortonworks viennent d'annoncer la disponibilité de Stinger.next. Ce projet vise à améliorer les performances de Hive au sein de Hadoop.

Publié par La rédaction le 4 sept. 2014 | Mis à jour le 2 mars 2021 à 12:50

Lecture
2 min

Imprimer

Depuis le mois d'avril dernier, des équipes de Hortonworks ont travaillé avec la communauté Open Source Hive (soit plus de 140 développeurs) pour préparer le futur de ce logiciel d'analyse de données permettant d'utiliser Hadoop avec une syntaxe proche du SQL. L'objectif de cette initiative, baptisée Stinger.next, est d'être capable de gérer les transactions en temps réel, de prendre en charge l'ensemble de la sémantique SQL et d'afficher des résultats d'une requête en moins d'une seconde.

Pour réaliser cela, le projet a réuni plus de 390 000 lignes de code et a bénéficié du soutien de 44 entreprises qui ont fourni des ingénieurs spécialisés dans l'analytique et les datas, un moteur puissant de requêtes SQL, ainsi qu'un jeu de données à l'échelle du Po. Comme le soulignent nos confrères de GigaOM, c'est la seconde fois que Hortonworks mène un projet pour optimiser Hive. Des travaux avaient eu lieu en 2012, sous le nom Stinger. Ils avaient permis, selon l'éditeur, d'améliorer par un facteur 100 les performances du moteur.

Une roadmap sur les améliorations à apporter

Stinger.next s'inscrit donc dans la continuité de ces travaux et un billet de blog donne les grandes orientations de cette initiative et la roadmap de ces efforts avec la communauté Hadoop. Sur l'échéancier, on distingue 3 phases (comme le montre l'image ci-dessous). Primo, le support des transactions ACID (atomicité, cohérence, isolation et durabilité), attendu d'ici à la fin de cette année. Secundo, au début de l'année prochaine, le projet devrait atteindre l'objectif du temps réel et l'intégration de Spark. Tertio, vers la fin 2105, Stinger.next accueillera des requêtes SQL complètes.

Si le succès est au rendez-vous pour Stinger.next, cela pourrait impacter d'autres fournisseurs qui ont fait le pari de construire leur propre moteur SQL basé sur d'autres technologies que Hive. On peut citer, par exemple, Impala de Cloudera, Big SQL chez IBM, Greenplum pour Pivotal. D'autres projets Open Source sont en cours de développement comme Presto chez Facebook, Apache Phoenix pour Salesforce.com et Apache Drill chez MapR. La communauté Spark travaille également sur des moteurs interactifs avec SparkDB et BlinkDB.

Crédit Photo ©-Ben-Chams-Fotolia.com

Apache vient booster Hadoop avec Spark 1.0

Publié par :
La rédaction

Tags associés :

{ Tribune Expert } - Trois choses à savoir sur les applications IA

Par Lori MacVittie * le 18 déc. 2024

7 min.

EuroHPC prend le virage des AI Factories : les 7 premiers [...]

Par Clément Bohic le 17 déc. 2024

OpenAI : 5 français influents de la startup star de l'IA

Par La rédaction le 16 déc. 2024

NotebookLM, du prototype au produit

Par Clément Bohic le 16 déc. 2024

Pour mieux raisonner, les LLM doivent-ils se passer du langage ?

Par La rédaction le 13 déc. 2024

Livres Blancs

Lenovo

Simplifiez la gestion IT de votre PME grâce au modèle [...]

Découvrez comment Lenovo TruScale révolutionne la gestion informatique des PME. Avec une approche "As-a-Service", [...]

Télécharger

Forrester

La situation en matière de gestion des risques liés à [...]

Comment les processus de gestion des risques liés à la cybersécurité peuvent-ils évoluer malgré le retard [...]

Télécharger

RingCentral

Téléphonie dans Microsoft Teams : Quelle solution [...]

Votre entreprise a décidé d’utiliser Microsoft Teams pour la collaboration et les visioconférences ? Vous n’êtes [...]

Télécharger

Sprinklr

Sprinklr nommé Leader dans The Forrester Wave™: [...]

Forrester a évalué les sept suites sociales les plus importantes selon deux catégories : l'offre actuelle et la [...]

Télécharger

Voir tous les livres blancs

Vos prochains événements

Voir tous les événements

7 novembre 2024

La MasterClass Silicon - NIS2

Organisé par silicon.fr

Inscrivez-vous

4 juillet 2024

La Matinale Silicon : IA & Cybersécurité

Organisé par Silicon

Voir le replay

29 mai 2024

Le grand dîner de gala de la Communauté

Organisé par Silicon

Revivre en images

Voir tous les événements

Inscrivez-vous à la Newsletter pour recevoir les dernières actualités

Abonnez-vous au magazine Silicon et profitez de contenus exclusifs !

Boostez votre expertise professionnelle en accédant aux informations clés de votre domaine.