IA : Nvidia accélère avec RAPIDS
Nvidia veut consolider sa position dominante dans le domaine de l'intelligence artificielle.
C'est la raison pour laquelle, le groupe dirigé par Jensen Huang a présenté Rapids à l'occasion de la GPU Technology Conference (GTC) 2018 qui se tient à Munich. De quoi s'agit-il ?
Une boîte à outils basée sur le Python
Rapids se présente comme une boîte à outils open source pour l'accélération matérielle de CUDA, ayant pour objectif d'aider les data scientists à traiter plus rapidement leurs données.
Rapids se traduit, selon Nvidia, par le traitement des données 50 fois plus rapidement qu'avec des systèmes à processeur unique. De quoi permettre de réduire les temps d'entraînement habituels de quelques jours à quelques heures, voire de quelques heures à quelques minutes, en fonction de la taille des jeux de données.
Développé en l'espace de deux ans, Rapids est basé sur le langage Python et sur Apache Arrow (technologie de données en colonnes en mémoire). Il possède des interfaces similaires à Pandas et Scikit, deux bibliothèques Pythons très répandues d'apprentissage automatique et d'analyse de données.
Nvidia n'a donc pas dévoilé de nouvelle plate-forme GPU (Graphics Processing Unit), ni de nouveau SDK pour l'apprentissage approfondi, mais un ensemble de nouvelles bibliothèques à code open source pour l'analyse accélérée par GPU et l'apprentissage automatique (ML).
Les partenaires se bousculent
Les partenaires sont d'ores et déjà au rendez-vous.
Oracle prend ainsi en charge Rapids sur son infrastructure cloud Oracle via le cloud de Nvidia.
De son côté, séduit, IBM annonce la prise en charge de Rapids dans des environnements sur site, publics, hybrides et multicouches via IBM Cloud, PowerAI sur IBM POWER9, IBM Watson Studio et les services Watson Machine Learning.
Databricks, spécialiste du big data, a aussi annoncé qu'elle utiliserait Rapids pour accélérer les charges de travail d'Apache Spark.
Hewlett-Packard Enterprise, Cisco Systems, Dell Technologies et Lenovo vont également supporter Rapids sur leurs propres systèmes, selon Nvidia.
Nvidia collabore également avec Anaconda, BlazingDB, PyData, Quansight et scikit-learn, ainsi que Wes McKinney, directeur d'Ursa Labs et créateur d'Apache Arrow et de Pandas.
(Crédit photo : @Nvidia)
Sur le même thème
Voir tous les articles Open source