Apache vient booster Hadoop avec Spark 1.0

Spark 1.0 se veut jusqu'à 100 fois plus rapide qu'Hadoop MapReduce. Une offre dédiée aux applications analytiques de hautes performances.

Publié par La rédaction le 2 juin 2014 | Mis à jour le 28 déc. 2021 à 09:15

Lecture
2 min

Imprimer

Présenté comme le couteau suisse de la pile Big Data Hadoop, Spark est aujourd'hui livré en version 1.0 par la Fondation Apache.

Spark est un outil dédié aux traitements de données à large échelle, qui propose de multiples innovations :

Il affiche des vitesses de fonctionnement très avantageuses par rapport à MapReduce de Hadoop : jusqu'à x10 sur disque et jusqu'à x100 en mémoire.
Les applications Spark pourront être écrites en divers langages de programmation : Java, Scala ou Python.
Spark peut s'intégrer à un cluster Hadoop ou fonctionner de manière autonome et est capable de lire des données depuis HDFS, Hbase ou Cassandra.

Au besoin, Spark est même capable de se connecter à des bases SQL, ce qui en fait un outil particulièrement flexible, à la croisée des chemins entre les bases de données classiques et les solutions dédiées au Big Data.

Une adoption très rapide

Spark est tout indiqué pour créer des applications d'analyse de données sur des jeux massifs d'informations. Il a d'ores et déjà été adopté par certains grands noms, comme Alibaba, la Nasa ou encore Yahoo. La Nasa compte par exemple l'employer dans le cadre de la mise au point de modèles climatiques.

Notez que Spark est aujourd'hui présent dans la plupart des distributions Hadoop. Les offres de Cloudera, IBM, Intel, MapR et Pivotal sont ainsi citées.

Voir aussi
Quiz Silicon.fr - Testez vos connaissances sur le Big Data

Publié par :
La rédaction

Tags associés :

sponsorisé

Gestion de crises : les leçons d’un DSI

Gestion de crises : les leçons d’un DSI17:35

SNCF Connect & Tech explore toutes les voies de la rés…23:13

D'une mine à la supply chain, de l'OT à l’industrie 4.…22:33

Champs d'application et exigences NIS220:52

Retour d'expérience : mise en œuvre des exigences par…20:42

Comment simplifier la sécurisation de votre réseau tou…20:23

Sécurité renforcée : comment préparer la conformité à…20:56

Le savoir-faire règlementaire international de Cloudfl…20:32

Se protéger et remédier aux Attaques de Messagerie : U…21:48

[Episode en public] Les leçons de résilience d’OVH29:04

[Énergie] La résilience du réseau et sa mesure d'impact19:43

SASE : La fusion du SD-WAN et du SSE décryptée07:42

Quand la cyber-résilience investit l’espace16:31

Sécurité Multicouche : La clé pour une entreprise rési…16:11

Remettre l’humain au centre du cyber-espace16:55

L’IA, super-pouvoir du cyberespace09:39

Les enjeux de sécurité des médias internationaux de la…14:32

L’IA, un atout pour une continuité de service public p…16:50

Une cyber-résilience à l’aune de l’IA et des régulatio…19:25

Tous les Internets se valent-ils ?10:59

Decathlon : une culture agile à l’international20:08

Comment Carrefour a transformé la crise sanitaire en t…12:48

Comment Groupama s’assure d’être résilient face aux cr…13:48

Comment impulser une culture data dans une grande entr…14:17

Hors-série : La data du futur (Volume 1)08:28

Cegid : la tête dans le Cloud22:16

Hors-série : La data du futur (Volume 2)07:30

La data au service des verres intelligents chez Essilo…09:42

La vision conseil de Deloitte sur la data et l’IA19:04

Data altruisme et IA responsable au Crédit Mutuel Arkéa11:54

[BONUS] La Data Responsable : une vision écologique23:08

Silicon.fr L'actualité informatique et high-tech pour décideurs IT

Apache vient booster Hadoop avec Spark 1.0

Une adoption très rapide

De France Travail à la RATP, les leçons du "bac à sable" IA de la CNIL

OpenAI met GPT-4.5 en retrait : que retenir de cette parenthèse ?

Gouvernance des communications : qui se distingue sur ce marché [...]

AWS Summit : le RAG, au carrefour des stratégies GenAI

{ Tribune Expert } - La voie vers une véritable IA open source

S’abonner

FFTO : Fiber To The Office ou la haute disponibilité [...]

L'UHD et la Transformation Numérique : Répondre aux [...]

Cybersécurité et digitalisation Comment protéger les [...]

Leader des services de réponse à incident de cybersécurité

Le grand dîner de Gala de la Communauté

La Matinale Silicon - Zéro Trust

La MasterClass Silicon - NIS2

Silicon.fr L'actualité informatique et high-tech pour décideurs IT

Une adoption très rapide

S’abonner

Partager l'épisode