Barcelone veut construire des clusters alliant ARM et GPU

Une petite équipe s'active à Barcelone avec comme objectif de construire des supercalculateurs exploitant des GPU, contrôlés par des composants ARM.

Publié par La rédaction le 21 mars 2013 | Mis à jour le 3 janv. 2022 à 10:09

Lecture
5 min

Imprimer

De notre envoyé à San Jose - Le Barcelona Supercomputing Center (BSC) a profité du GTC 2013 pour faire le point sur ses efforts visant à mettre au point un supercalculateur architecturé autour de GPU et de puces ARM.

Un sujet on ne peut plus chaud. En effet, l'efficacité énergétique est la clé des supercalculateurs. Peu importe la puissance des puces utilisées, puisqu'il est possible de les associer à l'infini au sein de clusters. Ce qui compte, c'est le rapport performance par watt obtenu.

Mais aussi le coût. De fait, en utilisant des processeurs très communs, il est possible d'abaisser sensiblement le prix d'un supercalculateur. Un facteur clé, le rapport performance sur coût étant essentiel.

Quels sont les choix en lice pour créer un supercalculateur ? Alex Ramirez, research manager au BSC dresse une liste :

le multicour avec des processeurs classiques ;
l'utilisation de cours basse consommation ;
la mise en place d'accélérateurs de calcul : Cell, Phi, Tesla, Radeon, etc.

ARM, pour la volumétrie

Côté processeurs, l'ARM est l'architecture la plus commune aujourd'hui. Sous l'impulsion des tablettes (100 millions de ventes en 2012) et des smartphones (750 millions), une montée en puissance en matière de nombre de cours et de fréquence s'est amorcée.

Les chercheurs du BSC ont ainsi mis au point un premier "proof of concept" de cluster ARM - le Tibidabo - comprenant 256 nouds (512 cours) Tegra 2 (2 cours Cortex-A9 à 1 GHz). Au total, la puissance déployée est de 512 gigaflops, avec un rapport performance par watt de 150 mégaflops/watt (ce qui demeure correct).

Ce démonstrateur a permis de confirmer la faisabilité d'un cluster ARM. Il a également montré que « les applications HPC peuvent être portées avec un minimum d'efforts sur l'architecture ARM ».

ARM + GPU : un premier test

Afin d'augmenter l'efficacité énergétique, un second démonstrateur - le Pedraforca v1 - a associé une puce Tegra avec un GPU capable d'exécuter le code Cuda (ce que les GPU des Tegra 2, 3 et 4 ne peuvent faire).

La carte de développement Carma a ici été utilisée (Tegra 3 et Quadro 1000M). 16 cartes ont été reliées entre-elles (soit 64 cours ARM Cortex-A9 à 1,3 GHz et 16 GPU Quadro 1000M). Sur le papier, la puissance est bien là. Malheureusement, la lenteur du bus de la carte mère rend le cluster quasi impossible à exploiter.

Les GPU. en solo

Le Pedraforca v2 adopte une approche radicalement différente. Ici, les GPU des cartes Nvidia Tesla K20 (GPU Kepler), communiquent en direct via des liens Infiniband à 40 Gb/s.

La carte mère ARM (toujours basée sur un Tegra 3) ne sert qu'à alimenter les cartes graphiques, les démarrer et lancer la première tâche. À partir de là, les GPU sont presque totalement autonomes et peuvent ainsi déployer toute leur puissance. « L'utilisation du GPU et du CPU est totalement découplée », indique Alex Ramirez.

À partir du moment où la vélocité du CPU n'entre plus en ligne de compte, l'utilisation d'un processeur basse consommation, comme le Tegra 3, permet de réduire les besoins du cluster et donc d'installer un plus grand nombre de GPU pour une enveloppe énergétique donnée.

Le démonstrateur Pedraforca v2 comprend 64 nouds, soit autant de GPU et une puissance de calcul en double précision culminant à 74,88 téraflops.

Le futur : un équilibre CPU/GPU ou le GPU seul ?

En utilisant un SoC réseau dédié, il est possible d'imaginer faire fonctionner les GPU sur des fonds de panier ne comprenant aucun processeur central 'réel'. Le SoC se chargerait alors d'apporter la gestion du PCI Express, la mise en place des liens réseau et le démarrage des GPU.

Toutefois, Alex Ramirez estime que certaines tâches ne sont pas adaptées aux GPU. « Il y a toujours des applications non 'scalables' qui nécessitent la présence d'un CPU puissant », constate-t-il.

Dans ce contexte, le couple Xeon + Tesla reste aujourd'hui très pertinent (sans surprise, il est aussi très commun au sein des supercalculateurs). Toutefois, l'utilisation d'une puce ARM basse consommation intégrant un GPU compatible Cuda pourrait avoir du sens, ne serait-ce que pour son ratio performance sur watt plus avantageux, ainsi que sa densité.

Le futur du HPC ARM, tel que vu par le BSC, pourrait donc être intimement lié aux prochaines puces Tegra, les Logan et Parker, qui ont été présentées par le CEO de Nvidia lors du GTC 2013 (voir « GTC 2013 : la roadmap Tegra comprend Cuda et Project Denver ! »).

Crédit photo : © Nmedia - Fotolia.com
___

Vous voulez participer à l'aventure du HPC ARM/CUDA ? Le BSC recrute des chercheurs et développeurs capables de l'aider dans ses travaux. Plus de détails se trouvent à cette adresse : https://www.bsc.es/about-bsc/employment/vacancies.

Voir aussi
GTC 2013 : ARM et Android supplantent x86 et Windows
GTC 2013 : Nvidia déporte calcul et visualisation vers le datacenter
GTC 2013 : Nvidia dévoile la roadmap des GeForce
GTC 2013 : la roadmap Tegra comprend Cuda et Project Denver !
GTC 2013 : un support professionnel de Cuda pour Python
GTC 2013 : Nvidia à l'assaut du ray tracing temps réel

Publié par :
La rédaction

Tags associés :

#ARM

sponsorisé

Gestion de crises : les leçons d’un DSI

Gestion de crises : les leçons d’un DSI17:35

SNCF Connect & Tech explore toutes les voies de la rés…23:13

D'une mine à la supply chain, de l'OT à l’industrie 4.…22:33

Champs d'application et exigences NIS220:52

Retour d'expérience : mise en œuvre des exigences par…20:42

Comment simplifier la sécurisation de votre réseau tou…20:23

Sécurité renforcée : comment préparer la conformité à…20:56

Le savoir-faire règlementaire international de Cloudfl…20:32

Se protéger et remédier aux Attaques de Messagerie : U…21:48

[Episode en public] Les leçons de résilience d’OVH29:04

[Énergie] La résilience du réseau et sa mesure d'impact19:43

SASE : La fusion du SD-WAN et du SSE décryptée07:42

Quand la cyber-résilience investit l’espace16:31

Sécurité Multicouche : La clé pour une entreprise rési…16:11

Remettre l’humain au centre du cyber-espace16:55

L’IA, super-pouvoir du cyberespace09:39

Les enjeux de sécurité des médias internationaux de la…14:32

L’IA, un atout pour une continuité de service public p…16:50

Une cyber-résilience à l’aune de l’IA et des régulatio…19:25

Tous les Internets se valent-ils ?10:59

Decathlon : une culture agile à l’international20:08

Comment Carrefour a transformé la crise sanitaire en t…12:48

Comment Groupama s’assure d’être résilient face aux cr…13:48

Comment impulser une culture data dans une grande entr…14:17

Hors-série : La data du futur (Volume 1)08:28

Cegid : la tête dans le Cloud22:16

Hors-série : La data du futur (Volume 2)07:30

La data au service des verres intelligents chez Essilo…09:42

La vision conseil de Deloitte sur la data et l’IA19:04

Data altruisme et IA responsable au Crédit Mutuel Arkéa11:54

[BONUS] La Data Responsable : une vision écologique23:08

Silicon.fr L'actualité informatique et high-tech pour décideurs IT

Barcelone veut construire des clusters alliant ARM et GPU

ARM, pour la volumétrie

ARM + GPU : un premier test

Les GPU. en solo

Le futur : un équilibre CPU/GPU ou le GPU seul ?

Le blocage par défaut des contrôles ActiveX s'étend à Microsoft 365

Pour La Suite Numérique, l'État expérimente une install party

Android suit iOS sur le redémarrage automatique des appareils

Gemini dans Google Workspace : des annonces au galop, une [...]

Windows 11 : le casse-tête des "expériences de Copilot+ PC" en [...]

S’abonner

Briser les barrières de la sécurité en entreprise

Symphony 25 : Sécuriser du code au cloud jusqu'au SOC [...]

Le grand dîner de Gala de la Communauté

La Matinale Silicon - Zéro Trust

La MasterClass Silicon - NIS2

Silicon.fr L'actualité informatique et high-tech pour décideurs IT

ARM, pour la volumétrie

ARM + GPU : un premier test

Les GPU. en solo

Le futur : un équilibre CPU/GPU ou le GPU seul ?

S’abonner

Partager l'épisode