IaaS : la bataille des GPU embraye sur Ampere
Google Cloud est le premier des « trois grands » à intégrer dans son offre commerciale des instances reposant sur 16 GPU Ampere.
Passage en phase commerciale acté pour les VM A2. Après quasiment un an d'expérimentation, elles entrent au catalogue public de Google Cloud.
La gamme comprend cinq types d'instances. Toutes reposent sur des cours de processeur Xeon Cascade Lake. Et surtout, sur des GPU A100. Jusqu'à 16 en l'occurrence, avec la possibilité de leur assortir un maximum de 3 To de SSD local.
Lire aussi : Le FinOps, en filigrane de l'AWS re:Invent 2024
Les VM A2 sont pour le moment disponibles dans trois régions Google Cloud. Dont une en Europe (Pays-Bas). Le coût des GPU s'ajoute à celui des instances et des autres ressources (disques et images, mise en réseau). Ceux associés à des ressources préemptives sont facturés sur le même modèle. Ceux qui ne le sont pas peuvent bénéficier de remises passé une certaine durée d'utilisation mensuelle.
Les prix ci-dessous valent pour les ressources GPU, RAM et CPU à la demande dans la région Pays-Bas (europe-west-4).
On trouve aussi des instances en A100 sur Azure, mais en préversion (depuis novembre 2020). Plus précisément un modèle : la ND96asr, dans la série ND A100 v4. Elle embarque 8 GPU.
Les tarifs qui suivent valent pour la région Europe de l'Ouest. Les premiers sont pour des VM Linux ; les seconds, pour des VM Windows (non pris en charge sur les A2 de Google Cloud).
AWS aussi a lancé une instance sur base A100 en novembre dernier, mais pas en préversion : la p4d. Comme les A2, elle repose sur des Xeon Cascade Lake (fréquence de base : 2,2 GHz ; Turbo : 2,9 GHz en monocour et 3,7 en multicour).
Illustration principale © NVIDIA
Sur le même thème
Voir tous les articles Cloud