Big Data : Hortonworks planche sur le futur de Hive avec Stinger.next

Les équipes de Hortonworks viennent d'annoncer la disponibilité de Stinger.next. Ce projet vise à améliorer les performances de Hive au sein de Hadoop.

Publié par La rédaction le 4 sept. 2014 | Mis à jour le 2 mars 2021 à 12:50

Lecture
2 min

Imprimer

Depuis le mois d'avril dernier, des équipes de Hortonworks ont travaillé avec la communauté Open Source Hive (soit plus de 140 développeurs) pour préparer le futur de ce logiciel d'analyse de données permettant d'utiliser Hadoop avec une syntaxe proche du SQL. L'objectif de cette initiative, baptisée Stinger.next, est d'être capable de gérer les transactions en temps réel, de prendre en charge l'ensemble de la sémantique SQL et d'afficher des résultats d'une requête en moins d'une seconde.

Pour réaliser cela, le projet a réuni plus de 390 000 lignes de code et a bénéficié du soutien de 44 entreprises qui ont fourni des ingénieurs spécialisés dans l'analytique et les datas, un moteur puissant de requêtes SQL, ainsi qu'un jeu de données à l'échelle du Po. Comme le soulignent nos confrères de GigaOM, c'est la seconde fois que Hortonworks mène un projet pour optimiser Hive. Des travaux avaient eu lieu en 2012, sous le nom Stinger. Ils avaient permis, selon l'éditeur, d'améliorer par un facteur 100 les performances du moteur.

Une roadmap sur les améliorations à apporter

Stinger.next s'inscrit donc dans la continuité de ces travaux et un billet de blog donne les grandes orientations de cette initiative et la roadmap de ces efforts avec la communauté Hadoop. Sur l'échéancier, on distingue 3 phases (comme le montre l'image ci-dessous). Primo, le support des transactions ACID (atomicité, cohérence, isolation et durabilité), attendu d'ici à la fin de cette année. Secundo, au début de l'année prochaine, le projet devrait atteindre l'objectif du temps réel et l'intégration de Spark. Tertio, vers la fin 2105, Stinger.next accueillera des requêtes SQL complètes.

Si le succès est au rendez-vous pour Stinger.next, cela pourrait impacter d'autres fournisseurs qui ont fait le pari de construire leur propre moteur SQL basé sur d'autres technologies que Hive. On peut citer, par exemple, Impala de Cloudera, Big SQL chez IBM, Greenplum pour Pivotal. D'autres projets Open Source sont en cours de développement comme Presto chez Facebook, Apache Phoenix pour Salesforce.com et Apache Drill chez MapR. La communauté Spark travaille également sur des moteurs interactifs avec SparkDB et BlinkDB.

Crédit Photo ©-Ben-Chams-Fotolia.com

Apache vient booster Hadoop avec Spark 1.0

Publié par :
La rédaction

Tags associés :

sponsorisé

Gestion de crises : les leçons d’un DSI

Gestion de crises : les leçons d’un DSI17:35

SNCF Connect & Tech explore toutes les voies de la rés…23:13

D'une mine à la supply chain, de l'OT à l’industrie 4.…22:33

Champs d'application et exigences NIS220:52

Retour d'expérience : mise en œuvre des exigences par…20:42

Comment simplifier la sécurisation de votre réseau tou…20:23

Sécurité renforcée : comment préparer la conformité à…20:56

Le savoir-faire règlementaire international de Cloudfl…20:32

Se protéger et remédier aux Attaques de Messagerie : U…21:48

[Episode en public] Les leçons de résilience d’OVH29:04

[Énergie] La résilience du réseau et sa mesure d'impact19:43

SASE : La fusion du SD-WAN et du SSE décryptée07:42

Quand la cyber-résilience investit l’espace16:31

Sécurité Multicouche : La clé pour une entreprise rési…16:11

Remettre l’humain au centre du cyber-espace16:55

L’IA, super-pouvoir du cyberespace09:39

Les enjeux de sécurité des médias internationaux de la…14:32

L’IA, un atout pour une continuité de service public p…16:50

Une cyber-résilience à l’aune de l’IA et des régulatio…19:25

Tous les Internets se valent-ils ?10:59

Decathlon : une culture agile à l’international20:08

Comment Carrefour a transformé la crise sanitaire en t…12:48

Comment Groupama s’assure d’être résilient face aux cr…13:48

Comment impulser une culture data dans une grande entr…14:17

Hors-série : La data du futur (Volume 1)08:28

Cegid : la tête dans le Cloud22:16

Hors-série : La data du futur (Volume 2)07:30

La data au service des verres intelligents chez Essilo…09:42

La vision conseil de Deloitte sur la data et l’IA19:04

Data altruisme et IA responsable au Crédit Mutuel Arkéa11:54

[BONUS] La Data Responsable : une vision écologique23:08

Silicon.fr L'actualité informatique et high-tech pour décideurs IT

Big Data : Hortonworks planche sur le futur de Hive avec Stinger.next

Une roadmap sur les améliorations à apporter

Crédit Photo ©-Ben-Chams-Fotolia.com

Loi omnibus : l'allègement du RGPD se précise

Données personnelles et IA : NOYB menace Meta d'une action collective

Data.gouv.fr : de l'UI à la recherche, un défi d'accessibilité [...]

La concision, facteur d'hallucination chez les LLM

Klarna, chantre de l'IA générative, juge être allé trop loin

S’abonner

Les stations de travail dédiées à votre métier

Future of Work – Transformer le support et [...]

Le grand dîner de Gala de la Communauté

La Matinale Silicon - Zéro Trust

La MasterClass Silicon - NIS2

Silicon.fr L'actualité informatique et high-tech pour décideurs IT

Une roadmap sur les améliorations à apporter

Crédit Photo ©-Ben-Chams-Fotolia.com

S’abonner

Partager l'épisode