Pour gérer vos consentements :

Google Cloud introduit des GPU préemptifs pour limiter les coûts

Google Cloud vient d’introduire des GPU disponibles en mode préemptif, à l’image de ses machines virtuelles préemptives lancées en 2015.

La plateforme cloud de Google présente les VM préemptives comme « des instances de calcul très abordables et à courte durée de vie, adaptées aux tâches par lots et aux charges de travail tolérant les pannes ».

D’une durée allant jusqu’à 24 heures, elles  offrent les mêmes types et options de configuration que les instances de calcul standards.Une manière de diminuer les coûts pour les utilisateurs.

Google Cloud décline cette approche préemptive avec les GPU pour tirer profit des ressources de processeurs graphiques dans des projets de machine learning, d’informatique scientifique ou des entreprises qui souhaitent exécuter des charges de travail d’ingénierie ou de calcul intensives, tout en réduisant les frais.

Avec cette option de calcul accélérée par GPU, Google Cloud s’adresse aux personnes qui cherchent à exécuter des tâches dans les domaines de l’apprentissage automatique, de l’analyse médicale, des simulations scientifiques, du transcodage vidéo et des applications similaires dans le cloud qui nécessitent beaucoup de puissance de traitement.

Cette nouvelle option s’applique aux GPU NVIDIA K80 et NVIDIA P100 actuellement disponibles sur la plateforme Google Cloud.

Google facturera 0,22 USD par heure GPU pour le K80 et 0,73 USD pour le P100. En outre, il sera nécessaire de payer pour une VM. Il s’agira de VM préemptive qui ne pourra pas être stoppée tant que le GPU préemptif sera exploité

En contrepartie, Google peut, à tout moment, stopper une tâche s’il a besoin de ressources (un avertissement démarrant 30 secondes avant l’arrêt d’une tâche est enclenché).

Autre limitation  : l’utilisateur est limité à 24h00 pour une exploitation de GPU préemptif, lit-on dans la contribution blog dédiée.

(Crédit photo : Google Cloud)

Recent Posts

IA générative : l’Autorité de la concurrence pointe de sérieux risques

Dans un avis consultatif, l'Autorité de la concurrence a identifié les risques concurrentiels liés à…

2 jours ago

OpenAI signe un accord de contenu avec Time

OpenAI signe un « partenariat de contenu stratégique » avec Time pour accéder au contenu…

2 jours ago

Atos : David Layani (Onepoint) veut sortir du capital

Au lendemain du rejet de sa proposition de restructuration, David Layani annonce sa démission du…

2 jours ago

Évaluer les LLM, un défi : le cas Hugging Face

Après un an, Hugging Face a revu les fondements de son leaderboard LLM. Quels en…

4 jours ago

Mozilla face au dilemme de la GenAI dans Firefox

Mozilla commence à expérimenter divers LLM dans Firefox, en parallèle d'autres initiatives axées sur l'intégration…

4 jours ago

VMware tente d’orienter vers VCF les déploiements pré-Broadcom

VMware met VCF à jour pour y favoriser la migration des déploiements qui, sur le…

4 jours ago