Pour gérer vos consentements :

Apache vient booster Hadoop avec Spark 1.0

Présenté comme le couteau suisse de la pile Big Data Hadoop, Spark est aujourd’hui livré en version 1.0 par la Fondation Apache.

Spark est un outil dédié aux traitements de données à large échelle, qui propose de multiples innovations :

  • Il affiche des vitesses de fonctionnement très avantageuses par rapport à MapReduce de Hadoop : jusqu’à x10 sur disque et jusqu’à x100 en mémoire.
  • Les applications Spark pourront être écrites en divers langages de programmation : Java, Scala ou Python.
  • Spark peut s’intégrer à un cluster Hadoop ou fonctionner de manière autonome et est capable de lire des données depuis HDFS, Hbase ou Cassandra.

Au besoin, Spark est même capable de se connecter à des bases SQL, ce qui en fait un outil particulièrement flexible, à la croisée des chemins entre les bases de données classiques et les solutions dédiées au Big Data.

Une adoption très rapide

Spark est tout indiqué pour créer des applications d’analyse de données sur des jeux massifs d’informations. Il a d’ores et déjà été adopté par certains grands noms, comme Alibaba, la Nasa ou encore Yahoo. La Nasa compte par exemple l’employer dans le cadre de la mise au point de modèles climatiques.

Notez que Spark est aujourd’hui présent dans la plupart des distributions Hadoop. Les offres de Cloudera, IBM, Intel, MapR et Pivotal sont ainsi citées.


Voir aussi
Quiz Silicon.fr – Testez vos connaissances sur le Big Data

Recent Posts

Le Réseau interministériel de l’État, sujet à dépendance

La Cour des comptes appelle à formaliser et à professionnaliser certains aspects du RIE, tout…

11 minutes ago

Etalab en position de faiblesse au sein de la Dinum

La Cour des comptes attire l'attention sur le risque d'affaiblissement d'Etalab, privé, ces dernières années,…

2 heures ago

Une Dinum « balbutiante » sur l’open data et les logiciels libres

Missions historiques de la Dinum, l'ouverture des données publiques et la promotion des logiciels libres…

4 heures ago

Pour son premier LLM codeur ouvert, Mistral AI choisit une architecture alternative

Pour développer une version 7B de son modèle Codestral, Mistral AI n'a pas utilisé de…

24 heures ago

Microsoft x Inflection AI : l’autorité de la concurrence britannique lance son enquête

L’Autorité de la concurrence et des marchés (CMA) britannique ouvre une enquête sur les conditions…

1 jour ago

Thomas Gourand, nouveau Directeur Général de Snowflake en France

Thomas Gourand est nommé Directeur Général pour la France. Il est chargé du développement de…

1 jour ago