MLPerf s'attaque au coût énergétique du machine learning

La mesure de la consommation énergétique fait son entrée sur MLPerf. Les premiers résultats englobent un nombre limité de benchmarks et de systèmes.

Publié par Clément Bohic le 4 mai 2021 - mis à jour à 17:35

Lecture
3 min

Imprimer

Jusqu'où peut monter la consommation énergétique d'un système de machine learning ? À 3564 W, d'après MLPerf. C'est en tout cas la valeur la plus haute qu'on trouve dans la dernière vague de résultats.

Cette vague concerne plus précisément l'une des trois suites de benchmarks qui composent le portefeuille MLPerf. En l'occurrence, celle qui évalue les performances en inférence.

La mesure de la consommation énergétique associée est une nouveauté. Pour cette première, elle était optionnelle. Cela se ressent dans la variété des systèmes mis à l'épreuve : en tout et pour tout, seulement sept qui ne soient pas des cartes de type Jetson, Raspberry Pi, Firefly ou kits de développement Qualcomm.

Six d'entre eux se trouvent dans la catégorie datacenter ; l'autre, dans la catégorie edge. Le seuil des 3564 W est atteint avec un serveur NVIDIA DGX doté de deux processeurs AMD EPYC 7742 et de huit GPU A100 (SXM, 80 Go). Plus précisément sur le benchmark de traitement du langage naturel (jeu de données SQuAD v1.1 ; modèle BERT ; taux de précision ciblé : 99 % en FP32).

Les systèmes de type datacenter sont notamment soumis à une obligation d'ECC sur les mémoires DRAM et HBM. Pour eux, MLPerf rend compte des performances et de la consommation sur cinq autres benchmarks :

Classification d'images (jeu de données ImageNet 2012 224 x 224 ; modèle ResNet50-v1.5, précision ciblée : 99 %)
Détection d'objets (COCO 1200 x 1200 ; SSD-ResNet34 ; 99 %)
Imagerie médicale (BraTS 2019 224 x 224 x 160 ; 3D-UNet ; 99 et 99,9 %)
Reconnaissance vocale (LibriSpeech ; RNN-T ; 99 %)
Recommandation (Criteo Terabyte ; DLRM ; 99 et 99,9 %)

Du SPEC dans MLPerf

Les systèmes de type edge ne sont pas soumis au test « imagerie médicale », mais à un deuxième test de détection d'objets, avec des images 300 x 300 et SSD-MobileNets-v1.

Les résultats sont présentés selon deux catégories « Closed » et « Open ». La première impose d'utiliser, pour la mise à l'épreuve, un modèle équivalent à celui de l'implémentation de référence. La seconde autorise des modifications non seulement du modèle, mais aussi des opérations pré- et post-traitement.

La mesure de la consommation s'appuie sur l'interface PTEDaemon de la SPEC, elle-même à l'origine de plusieurs benchmarks de référence. La liste des capteurs compatibles illustre le chemin qu'il reste pour aboutir à un standard véritablement universel. Et intégrer pleinement la dimension « développement durable » à MLPerf.

MLPerf : trois benchmarks et un consortium

La première incarnation de MLPerf était née en mai 2018. Son objectif : évaluer les performances en entraînement. Trois séries de résultats ont été publiées depuis lors ; la dernière en juillet 2020.

MLPerf Inference avait fait ses débuts en juin 2019. MLPerf HPC - également axé sur l'entraînement, mais avec des systèmes de calcul haute performance - a quant à lui émergé en novembre dernier.

Peu après, le consortium MLCommons s'est constitué pour porter le projet. À son conseil d'administration siègent Alibaba, Facebook, Google, Intel, NVIDIA et l'université Harvard.

Photo d'illustration © KanawatVector - Adobe Stock

sponsorisé

Gestion de crises : les leçons d’un DSI

Gestion de crises : les leçons d’un DSI17:35

SNCF Connect & Tech explore toutes les voies de la rés…23:13

D'une mine à la supply chain, de l'OT à l’industrie 4.…22:33

Champs d'application et exigences NIS220:52

Retour d'expérience : mise en œuvre des exigences par…20:42

Comment simplifier la sécurisation de votre réseau tou…20:23

Sécurité renforcée : comment préparer la conformité à…20:56

Le savoir-faire règlementaire international de Cloudfl…20:32

Se protéger et remédier aux Attaques de Messagerie : U…21:48

[Episode en public] Les leçons de résilience d’OVH29:04

[Énergie] La résilience du réseau et sa mesure d'impact19:43

SASE : La fusion du SD-WAN et du SSE décryptée07:42

Quand la cyber-résilience investit l’espace16:31

Sécurité Multicouche : La clé pour une entreprise rési…16:11

Remettre l’humain au centre du cyber-espace16:55

L’IA, super-pouvoir du cyberespace09:39

Les enjeux de sécurité des médias internationaux de la…14:32

L’IA, un atout pour une continuité de service public p…16:50

Une cyber-résilience à l’aune de l’IA et des régulatio…19:25

Tous les Internets se valent-ils ?10:59

Decathlon : une culture agile à l’international20:08

Comment Carrefour a transformé la crise sanitaire en t…12:48

Comment Groupama s’assure d’être résilient face aux cr…13:48

Comment impulser une culture data dans une grande entr…14:17

Hors-série : La data du futur (Volume 1)08:28

Cegid : la tête dans le Cloud22:16

Hors-série : La data du futur (Volume 2)07:30

La data au service des verres intelligents chez Essilo…09:42

La vision conseil de Deloitte sur la data et l’IA19:04

Data altruisme et IA responsable au Crédit Mutuel Arkéa11:54

[BONUS] La Data Responsable : une vision écologique23:08

Silicon.fr L'actualité informatique et high-tech pour décideurs IT

MLPerf s'attaque au coût énergétique du machine learning

Du SPEC dans MLPerf

Numérique : le poids environnemental des usages français [...]

Autour de Java, la stratégie "green coding" d'AXA passe par le [...]

Écoconception web : les sites les plus performants du CAC 40

IA génératives : qui a l'UI la mieux écoconçue ?

La stratégie "green coding" d'AXA passe par les API

S’abonner

Simplifier l’architecture et améliorer la sécurité

Réunir la connectivité et la sécurité

Le grand dîner de Gala de la Communauté

La Matinale Silicon - Zéro Trust

La MasterClass Silicon - NIS2

Silicon.fr L'actualité informatique et high-tech pour décideurs IT

Du SPEC dans MLPerf

S’abonner

Partager l'épisode