AWS fait jouer la loi du marché pour ses instances GPU

Face à la pénurie de GPU, AWS propose une option de réservation anticipée d'instances... facturées selon l'offre et la demande.

Publié par Clément Bohic le 3 nov. 2023 | mis à jour à 16:17

Lecture
2 min

Imprimer

Premier arrivé, premier servi ; l'offre et la demande feront le prix. C'est ainsi que fonctionnent les « blocs de capacité EC2 pour ML ».

AWS vient de lancer cette option de réservation* d'instances GPU. Ses principales caractéristiques :

- Réservation jusqu'à 8 semaines en amont
- De 1 à 64 instances
- Pour 1 à 14 jours
- Paiement immédiat ; pas d'annulation ni de modification possible

Un seul type d'instance est pour le moment au catalogue. En l'occurrence, la P5 (192 vCPU, 2 To de RAM, 8 GPU H100-80, réseau 3200 Gbps, 8 x 3,84 To de SSD, bande passante EBS de 80 Gbps), disponible dans la région US East.

Les instances réservées par ce biais sont groupées en clusters au sein d'une même zone de disponibilité (c'est d'ailleurs aussi le cas des VM P4d et Trn1). Elles ne peuvent entrer ni dans le cadre des Savings Plans, ni dans les remises sur engagement. On ne peut pas les partager entre comptes AWS ou au sein d'une organisation.

Pour choisir un autre OS que celui par défaut, il faut utiliser le CLI. Les options : RHEL (0,13 $/heure), RHEL avec haute disponibilité (0,165 $/h), SLES (0,125 $/h) et Ubuntu Pro (0,336$/h).

* Pour les réservations de capacité sur d'autres ressources, la date d'effet est immédiate. C'est une spécificité de ces blocs EC2 « spécial machine learning ». Autre différence : une fois la période de réservation écoulée, les instances s'éteignent (on ne bascule par sur la facturation à la demande).

À consulter en complément :

Box et Google Cloud changent d'angle sur l'IA
L'IA générative : innovation ou enjeu de résilience ?
Comment Dropbox applique le machine learning au nommage des fichiers
Le « cloud souverain européen » d'AWS prend forme

Illustration © Hoda Bogdan - Adobe Stock

Publié par :
Clément Bohic

Tags associés :

#AWS

sponsorisé

Gestion de crises : les leçons d’un DSI

Gestion de crises : les leçons d’un DSI17:35

SNCF Connect & Tech explore toutes les voies de la rés…23:13

D'une mine à la supply chain, de l'OT à l’industrie 4.…22:33

Champs d'application et exigences NIS220:52

Retour d'expérience : mise en œuvre des exigences par…20:42

Comment simplifier la sécurisation de votre réseau tou…20:23

Sécurité renforcée : comment préparer la conformité à…20:56

Le savoir-faire règlementaire international de Cloudfl…20:32

Se protéger et remédier aux Attaques de Messagerie : U…21:48

[Episode en public] Les leçons de résilience d’OVH29:04

[Énergie] La résilience du réseau et sa mesure d'impact19:43

SASE : La fusion du SD-WAN et du SSE décryptée07:42

Quand la cyber-résilience investit l’espace16:31

Sécurité Multicouche : La clé pour une entreprise rési…16:11

Remettre l’humain au centre du cyber-espace16:55

L’IA, super-pouvoir du cyberespace09:39

Les enjeux de sécurité des médias internationaux de la…14:32

L’IA, un atout pour une continuité de service public p…16:50

Une cyber-résilience à l’aune de l’IA et des régulatio…19:25

Tous les Internets se valent-ils ?10:59

Decathlon : une culture agile à l’international20:08

Comment Carrefour a transformé la crise sanitaire en t…12:48

Comment Groupama s’assure d’être résilient face aux cr…13:48

Comment impulser une culture data dans une grande entr…14:17

Hors-série : La data du futur (Volume 1)08:28

Cegid : la tête dans le Cloud22:16

Hors-série : La data du futur (Volume 2)07:30

La data au service des verres intelligents chez Essilo…09:42

La vision conseil de Deloitte sur la data et l’IA19:04

Data altruisme et IA responsable au Crédit Mutuel Arkéa11:54

[BONUS] La Data Responsable : une vision écologique23:08

Silicon.fr L'actualité informatique et high-tech pour décideurs IT

AWS fait jouer la loi du marché pour ses instances GPU

OUTSCALE lance son Kubernetes managé : ce qu'il y a pour commencer

Cloud de confiance : ce que recherche l'administration française

Pourquoi OpenStack rejoint la Fondation Linux

Comment Dropbox a repensé son architecture orientée services

VMware, pari gagné pour Broadcom ?

S’abonner

Cybersécurité et digitalisation Comment protéger les [...]

Leader des services de réponse à incident de cybersécurité

Comment optimiser la consommation énergétique d’un [...]

Comment l'IA améliore la qualité de vos réunions ?

Le grand dîner de Gala de la Communauté

La Matinale Silicon - Zéro Trust

La MasterClass Silicon - NIS2

Silicon.fr L'actualité informatique et high-tech pour décideurs IT

S’abonner

Partager l'épisode