Calcul : AMD FirePro, Intel Xeon Phi ou Nvidia Tesla ?
Publié par La rédaction le | Mis à jour le
Nous avons placé côte à côte les AMD FirePro S10000, Intel Xeon Phi 5110P, Intel Xeon Phi SE10P/X, Nvidia Tesla K20 et Nvidia Tesla K20X. Des cartes proposant une puissance de calcul dépassant le téraflops. Comparaison et analyse.
Les offres d'accélérateurs dédiés au calcul se multiplient. Après l'annonce hier de la carte AMD FirePro S10000, c'est au tour de Nvidia de dégainer avec sa gamme K20, et Intel avec ses Xeon Phi.
Toutes ces cartes se présentent sous la forme d'extensions PCI Express double hauteur. Comparons-en les caractéristiques, en nous concentrant sur les modèles proposant une puissance de calcul sur les nombres flottants en double précision supérieure au téraflops.
La technologie : Nvidia affiche sa maitrise
Commençons tout d'abord par quelques généralités : nombre de cours, fréquence de chacun d'entre eux et finesse de gravure :
Les choix sont ici différents, et tous visiblement très bien assumés.
AMD : c'est la course en avant. Toujours plus de cours, afin de proposer une puissance brute maximale. Il faudra une excellente bande passante mémoire pour alimenter le tout, mais le constructeur y a veillé. Reste que la puissance réellement utilisable risque d'être un peu faible. Côté programmation, la firme favorise l'OpenCL. Un choix classique.
Intel : la complexité des cours en diminue le nombre, mais permet aussi de proposer une puissance unitaire supérieure. De plus, la finesse de gravure en 22 nm permet de passer le cap du gigahertz de fréquence de fonctionnement. Côté programmation, des outils maison sont utilisés, en attendant la montée de l'OpenMP. Permettra-t-il d'exploiter toute cette puissance ?
Nvidia joue la sécurité, en gardant une bonne marge côté fréquence de fonctionnement. C'est sur un autre plan que le constructeur joue : celui de l'exploitation maximale de la puissance brute offerte. Via des astuces architecturales, mais aussi via Cuda, plus proche du matériel que l'OpenCL. Les scientifiques devraient apprécier.
Mémoire : Intel le mieux équipé, AMD le plus rapide
Passons maintenant à la capacité mémoire et, plus important encore, à sa bande passante :
AMD : la firme a été forcée de mettre de la mémoire très rapide pour alimenter les nombreux cours des deux GPU présents sur sa carte. Problème, afin de réduire la consommation énergétique de l'ensemble, la capacité mémoire reste faible. Le constructeur atteint ici les limites de l'exercice. AMD nous informe que la carte est en fait pourvue de 6 Go de mémoire vive. Toutefois, deux GPU étant présents, le tout est partagé en 2 x 3 Go. La quantité de mémoire par GPU reste donc en retrait face aux offres de Nvidia.
Intel : bravo au fondeur, qui fournit à la fois une grosse quantité de mémoire et une bande passante appréciable. Reste que ce dernier avantage pourrait rapidement être réduit à néant si le code Xeon Phi s'avérait moins compact ou moins facile à gérer que le code GPU utilisé par ses concurrents.
Nvidia : la capacité mémoire est bonne. Nous n'en dirons pas autant de la bande passante, assez limitée. La firme promet toutefois une gestion avancée des transferts entre cours, voire une communication directe entre cartes (y compris séparées par un réseau). De quoi faire la différence ?
La suite en page deux : rapport puissance sur watt, rapport performance prix et conclusion.