Apache Spark est un projet en pleine croissance dans le monde du Big Data. Cette offre est capable de fonctionner sur un cluster de serveurs et permet de traiter les données jusqu’à 100 fois plus rapidement que Hadoop, du fait de l’utilisation de techniques In-Memory.
IBM n’a pas manqué de remarquer cette solution Open Source, que la firme juge comme étant potentiellement « le plus important nouveau projet Open Source de la décennie » dans le secteur du traitement de données.
Big Blue compte donc mettre le paquet sur Spark. Cette offre sera intégrée à ses solutions dédiées aux mondes de l’analytique et du commerce. Elle sera également proposée sur le Watson Health Cloud et déclinée en offre à la demande sur le PaaS Bluemix.
Dans le même temps, plus de 3 500 développeurs et chercheurs d’IBM se pencheront sur des projets relatifs à Spark. 12 laboratoires seront investis dans ces travaux, dont un – situé à San Francisco – dédié spécifiquement à Spark.
La technologie de Machine Learning d’IBM, SystemML, sera également offerte à la communauté Spark sous forme Open Source. Enfin, diverses opérations de formation seront proposées au public, avec comme objectif de former plus d’un million de data scientists et data engineers à Spark, au travers de cours en ligne (MOOC).
À lire aussi :
Le gouvernement britannique s’associe avec IBM sur le Big Data
Des rachats pour IBM et Cisco : ruée vers OpenStack
Apache vient booster Hadoop avec Spark 1.0
Pour développer une version 7B de son modèle Codestral, Mistral AI n'a pas utilisé de…
L’Autorité de la concurrence et des marchés (CMA) britannique ouvre une enquête sur les conditions…
Thomas Gourand est nommé Directeur Général pour la France. Il est chargé du développement de…
Pour dissuader le CISPE d'un accord avec Microsoft, Google aurait mis près de 500 M€…
Pour réduire la taille des mises à jour de Windows, Microsoft va mettre en place…
De l'organisation administrative à la construction budgétaire, la Cour des comptes pointe le fonctionnement complexe…