Silicon.fr L'actualité informatique et high-tech pour décideurs IT

En ce moment En ce moment

Après l'edge et le green IT, MLPerf s'ouvre à l'IA générative

Le benchmark MLPerf Training accueille un test fondé sur un modèle GPT-3. Quelles configurations s'en sont le mieux sorties ?

Publié par Clément Bohic le 3 juil. 2023 | mis à jour à 17:30

Lecture
3 min

Imprimer

L'apprentissage par renforcement sur le jeu de Go ? Pas la peine de chercher cet exercice dans la dernière vague du benchmark MLPerf Training. Il a disparu à la faveur d'un test à base d'IA générative. Consistant en l'occurrence à entraîner, sur le dataset C4, un modèle de type GPT-3.

La configuration qui s'en est le mieux sortie sur le critère temps a mis environ 11 minutes pour atteindre l'objectif de perplexité attendu. Présentée par NVIDIA et CoreWeave, elle associe 448 noeuds pourvus chacun de 2 CPU Intel Xeon Platinum 8462Y+ (32 coeurs), 8 GPU NVIDIA H100 SXM5-80, 1 To de RAM et 8 To de stockage (NVMe U.2), avec 8 liens InfiniBand 400 Gb/s pour le compute et un DPU BlueField-2 pour la gestion réseau. Framework utilisé : NeMo Megatron.

Il a fallu un peu plus du double de temps (environ 23 minutes) pour une configuration à peu près moitié moins bien dotée (384 CPU et 1536 GPU du même type). Et un peu moins du quadruple (environ 45 minutes 30) pour une configuration à peu près quatre fois moins bien dotée... Une progression quasi linéaire, donc.

MLPerf : l'IA générative remplace le jeu de Go

La configuration qui l'a emporté sur ce benchmark IA générative s'est aussi distinguée sur l'exercice de classification (modèle ResNet sur ImageNet). Elle a mis un peu moins de 20 secondes, avec le framework MXNet version NVIDIA.

Une autre configuration en Xeon Platinum 8462Y+ (768 CPU, 3072 GPU) atteint les sommets sur le benchmark NLP. Il lui a fallu environ 8 secondes pour entraîner BERT-large sur un dataset issu de Wikipédia.

Les cinq autres benchmarks sont dominés par des configurations en Xeon Platinum 8480C (56 coeurs). La plus « modeste » est à 32 CPU (et 128 GPU), avec, par noeud, 2 To de RAM et 38 To de disque (8 To NVMe + 30 To U.2). Elle a mis un peu plus d'une minute et demie sur l'exercice de recommandation (version modifiée du modèle DLRM sur le dataset Criteo 4TB).
La mieux dotée (192 CPU, 768 GPU ; même quantité de disque et de RAM) a permis d'entraîner RetinaNet sur OpenImages (détection d'objets) en environ 1 min 30 s.

À consulter en complément :

Machine learning : quel sera le benchmark de référence ?
MLPerf s'attaque au coût énergétique du machine learning
IA : 4 certifications pour dynamiser votre parcours
Comment TotalEnergies alimente son usine à IA
L'UE ouvre la voie à des centres de « crahs test » de l'IA

Photo d'illustration © KanawatVector - Adobe Stock

Publié par :
Clément Bohic

Tags associés :

Process mining : l'automatisation est de moins en moins une option

Par Clément Bohic le 28 avr. 2025

10 min.

Déployer l'IA à l'échelle : l'approche d'AXA, entre vision et [...]

Par Philippe Leroy le 24 avr. 2025

Chez Eiffage, l'IA générative au service des métiers

Par Philippe Leroy le 18 avr. 2025

Avec o3 et o4-mini, OpenAI mise sur une chaîne de pensée multimodale

Par Clément Bohic le 17 avr. 2025

De France Travail à la RATP, les leçons du "bac à sable" IA de la CNIL

Par Clément Bohic le 16 avr. 2025

Livres Blancs

Palo Alto Networks

inmac wstore

Il y a des phrases qu’on ne veut plus entendre… [...]

Je ne vois pas qui est dans la salle » ou encore « Je n’ai pas bien entendu tu peux te rapprocher du micro ?». [...]

Télécharger

Voir tous les livres blancs

Vos prochains événements

Voir tous les événements

5 juin 2025

Le grand dîner de Gala de la Communauté

Organisé par silicon.fr

Inscrivez-vous

3 juillet 2025

La Matinale Silicon - Zéro Trust

Organisé par silicon.fr

Inscrivez-vous

7 novembre 2024

La MasterClass Silicon - NIS2

Organisé par silicon.fr

REVIVRE EN IMAGES

Voir tous les événements

Inscrivez-vous à la Newsletter pour recevoir les dernières actualités

Abonnez-vous au magazine Silicon et profitez de contenus exclusifs !

Boostez votre expertise professionnelle en accédant aux informations clés de votre domaine.

Silicon.fr L'actualité informatique et high-tech pour décideurs IT

Après l'edge et le green IT, MLPerf s'ouvre à l'IA générative

MLPerf : l'IA générative remplace le jeu de Go

Process mining : l'automatisation est de moins en moins une option

Déployer l'IA à l'échelle : l'approche d'AXA, entre vision et [...]

Chez Eiffage, l'IA générative au service des métiers

Avec o3 et o4-mini, OpenAI mise sur une chaîne de pensée multimodale

De France Travail à la RATP, les leçons du "bac à sable" IA de la CNIL

Briser les barrières de la sécurité en entreprise

The Forrester Wave™: Cloud Workload Security, Q1 2024

Moderniser vos postes de travail grâce à [...]

Il y a des phrases qu’on ne veut plus entendre… [...]

Le grand dîner de Gala de la Communauté

La Matinale Silicon - Zéro Trust

La MasterClass Silicon - NIS2