Pour gérer vos consentements :
Categories: Composants

Calcul : les dernières cartes AMD FirePro, Intel Xeon Phi et Nvidia Tesla passées au crible

Les offres d’accélérateurs dédiés au calcul se multiplient. Après l’annonce hier de la carte AMD FirePro S10000, c’est au tour de Nvidia de dégainer avec sa gamme K20, et Intel avec ses Xeon Phi.

Toutes ces cartes se présentent sous la forme d’extensions PCI Express double hauteur. Comparons-en les caractéristiques, en nous concentrant sur les modèles proposant une puissance de calcul sur les nombres flottants en double précision supérieure au téraflops.

La technologie : Nvidia affiche sa maitrise

Commençons tout d’abord par quelques généralités : nombre de cœurs, fréquence de chacun d’entre eux et finesse de gravure :

  • AMD FirePro S10000 : 3584 cœurs, 825 MHz, 28 nm
  • Intel Xeon Phi 5110P : 60 cœurs, 1053 MHz, 22 nm
  • Intel Xeon Phi SE10P/X : 61 cœurs, 1100 MHz, 22 nm
  • Nvidia Tesla K20 : 2496 cœurs, 705 MHz, 28 nm
  • Nvidia Tesla K20X : 2688 cœurs, 735 MHz, 28 nm

Les choix sont ici différents, et tous visiblement très bien assumés.

AMD : c’est la course en avant… Toujours plus de cœurs, afin de proposer une puissance brute maximale. Il faudra une excellente bande passante mémoire pour alimenter le tout, mais le constructeur y a veillé. Reste que la puissance réellement utilisable risque d’être un peu faible. Côté programmation, la firme favorise l’OpenCL. Un choix classique.

Intel : la complexité des cœurs en diminue le nombre, mais permet aussi de proposer une puissance unitaire supérieure. De plus, la finesse de gravure en 22 nm permet de passer le cap du gigahertz de fréquence de fonctionnement. Côté programmation, des outils maison sont utilisés, en attendant la montée de l’OpenMP. Permettra-t-il d’exploiter toute cette puissance ?

Nvidia joue la sécurité, en gardant une bonne marge côté fréquence de fonctionnement. C’est sur un autre plan que le constructeur joue : celui de l’exploitation maximale de la puissance brute offerte. Via des astuces architecturales, mais aussi via Cuda, plus proche du matériel que l’OpenCL. Les scientifiques devraient apprécier.

Mémoire : Intel le mieux équipé, AMD le plus rapide

Passons maintenant à la capacité mémoire et, plus important encore, à sa bande passante :

  • AMD FirePro S10000 : 3 Go 6 Go, 480 Go/s
  • Intel Xeon Phi 5110P : 8 Go, 320 Go/s
  • Intel Xeon Phi SE10P/X : 8 Go, 352 Go/s
  • Nvidia Tesla K20 : 5 Go, 208 Go/s
  • Nvidia Tesla K20X : 6 Go, 250 Go/s

AMD : la firme a été forcée de mettre de la mémoire très rapide pour alimenter les nombreux cœurs des deux GPU présents sur sa carte. Problème, afin de réduire la consommation énergétique de l’ensemble, la capacité mémoire reste faible. Le constructeur atteint ici les limites de l’exercice. AMD nous informe que la carte est en fait pourvue de 6 Go de mémoire vive. Toutefois, deux GPU étant présents, le tout est partagé en 2 x 3 Go. La quantité de mémoire par GPU reste donc en retrait face aux offres de Nvidia.

Intel : bravo au fondeur, qui fournit à la fois une grosse quantité de mémoire et une bande passante appréciable. Reste que ce dernier avantage pourrait rapidement être réduit à néant si le code Xeon Phi s’avérait moins compact ou moins facile à gérer que le code GPU utilisé par ses concurrents.

Nvidia : la capacité mémoire est bonne. Nous n’en dirons pas autant de la bande passante, assez limitée. La firme promet toutefois une gestion avancée des transferts entre cœurs, voire une communication directe entre cartes (y compris séparées par un réseau). De quoi faire la différence ?

La suite en page deux : rapport puissance sur watt, rapport performance prix et conclusion.

Page: 1 2

Recent Posts

Etalab en position de faiblesse au sein de la Dinum

La Cour des comptes attire l'attention sur le risque d'affaiblissement d'Etalab, privé, ces dernières années,…

2 heures ago

Une Dinum « balbutiante » sur l’open data et les logiciels libres

Missions historiques de la Dinum, l'ouverture des données publiques et la promotion des logiciels libres…

3 heures ago

Pour son premier LLM codeur ouvert, Mistral AI choisit une architecture alternative

Pour développer une version 7B de son modèle Codestral, Mistral AI n'a pas utilisé de…

23 heures ago

Microsoft x Inflection AI : l’autorité de la concurrence britannique lance son enquête

L’Autorité de la concurrence et des marchés (CMA) britannique ouvre une enquête sur les conditions…

1 jour ago

Thomas Gourand, nouveau Directeur Général de Snowflake en France

Thomas Gourand est nommé Directeur Général pour la France. Il est chargé du développement de…

1 jour ago

Accord Microsoft-CISPE : comment Google a tenté la dissuasion

Pour dissuader le CISPE d'un accord avec Microsoft, Google aurait mis près de 500 M€…

1 jour ago