IaaS : la bataille des GPU embraye sur Ampere

Publié par Clément Bohic le 22 mars 2021 - mis à jour à 19:01

Google Cloud est le premier des « trois grands » à intégrer dans son offre commerciale des instances reposant sur 16 GPU Ampere.

Passage en phase commerciale acté pour les VM A2. Après quasiment un an d'expérimentation, elles entrent au catalogue public de Google Cloud.

La gamme comprend cinq types d'instances. Toutes reposent sur des cours de processeur Xeon Cascade Lake. Et surtout, sur des GPU A100. Jusqu'à 16 en l'occurrence, avec la possibilité de leur assortir un maximum de 3 To de SSD local.

Les VM A2 sont pour le moment disponibles dans trois régions Google Cloud. Dont une en Europe (Pays-Bas). Le coût des GPU s'ajoute à celui des instances et des autres ressources (disques et images, mise en réseau). Ceux associés à des ressources préemptives sont facturés sur le même modèle. Ceux qui ne le sont pas peuvent bénéficier de remises passé une certaine durée d'utilisation mensuelle.

Les prix ci-dessous valent pour les ressources GPU, RAM et CPU à la demande dans la région Pays-Bas (europe-west-4).

On trouve aussi des instances en A100 sur Azure, mais en préversion (depuis novembre 2020). Plus précisément un modèle : la ND96asr, dans la série ND A100 v4. Elle embarque 8 GPU.
Les tarifs qui suivent valent pour la région Europe de l'Ouest. Les premiers sont pour des VM Linux ; les seconds, pour des VM Windows (non pris en charge sur les A2 de Google Cloud).

AWS aussi a lancé une instance sur base A100 en novembre dernier, mais pas en préversion : la p4d. Comme les A2, elle repose sur des Xeon Cascade Lake (fréquence de base : 2,2 GHz ; Turbo : 2,9 GHz en monocour et 3,7 en multicour).

La rédaction vous recommande

Cloud de confiance : ce que recherche l'administration française

NVIDIA à fond sur l'inférence : quelques éléments à retenir de la GTC 2025

GPT-4.5, un grand point d'interrogation chez OpenAI