IA : vers une flambée des prix des GPU ?

La demande élevée de puces GPU nécessaires à l'entraînement et au déploiement de l'intelligence artificielle dope les prix.

Publié par Ariane Beky le 16 mai 2023 | Mis à jour le 19 mai 2023 à 21:25

Lecture
2 min

Imprimer

La demande d'accélérateurs d'intelligence artificielle (IA) pour former, tester et exécuter des modèles d'apprentissage automatique (machine learning, ML) augmente.

Un tel engouement impacte les tarifs de processeurs dédiés au traitement graphique (GPU) de terminaux, des ordinateurs aux serveurs pour datacenters, a relevé The Next Platform.

Les GPU peuvent être adaptés aux calculs massivement parallèles qui accélèrent les opérations de traitement qu'implique l'entraînement de grands modèles de langage (LLM).

40 000 $ pièce la carte GPU de qualité serveur

L'inadéquation entre la demande exprimée par le marché et l'offre fait grimper la cote.

Le mouvement entraîne même une « flambée des prix » des GPU de qualité serveur. Certaines puces dédiées, dont des cartes graphiques haut de gamme Nvidia (la version PCI Express des GPU Nvdia H100), peuvent atteindre 40 000 $ pièce sur les places de marché du e-commerce.

Un prix dont s'est fait l'écho dans un tweet John Carmack, programmeur et développeur de jeux vidéo. CNBC relevait à ce propos : « les développeurs utilisent le H100 pour construire de grands modèles de langage qui sont au coeur d'applications d'IA comme ChatGPT d'OpenAI. Exécuter ces systèmes est coûteux et nécessite des ordinateurs puissants pour traiter des téraoctets de données [...] Ils dépendent également d'une puissance de calcul importante pour que leurs modèles d'IA puissent générer du texte, des images ou des prévisions. »

En outre, « l'entraînement de modèles d'intelligence artificielle, particulièrement les plus volumineux comme le modèle de langage pré-entraîné GPT (generative pre-training transformer), nécessite d'activer de concert des centaines de GPU haut de gamme. »

Or, les attentes d'acheteurs en entreprise peuvent surpasser les capacités de production de fournisseurs.

De surcroît, les hyperscalers et d'autres opérateurs cloud rationnent l'accès aux capacités GPU de leurs propres développeurs. Aussi, les prix des GPU Cloud - les instances répondant aux exigences de traitement de tâches parallèles - pourraient à leur tour augmenter.

_{(crédit photo © railwayfx - Adobe Stock)}

sponsorisé

Gestion de crises : les leçons d’un DSI

Gestion de crises : les leçons d’un DSI17:35

SNCF Connect & Tech explore toutes les voies de la rés…23:13

D'une mine à la supply chain, de l'OT à l’industrie 4.…22:33

Champs d'application et exigences NIS220:52

Retour d'expérience : mise en œuvre des exigences par…20:42

Comment simplifier la sécurisation de votre réseau tou…20:23

Sécurité renforcée : comment préparer la conformité à…20:56

Le savoir-faire règlementaire international de Cloudfl…20:32

Se protéger et remédier aux Attaques de Messagerie : U…21:48

[Episode en public] Les leçons de résilience d’OVH29:04

[Énergie] La résilience du réseau et sa mesure d'impact19:43

SASE : La fusion du SD-WAN et du SSE décryptée07:42

Quand la cyber-résilience investit l’espace16:31

Sécurité Multicouche : La clé pour une entreprise rési…16:11

Remettre l’humain au centre du cyber-espace16:55

L’IA, super-pouvoir du cyberespace09:39

Les enjeux de sécurité des médias internationaux de la…14:32

L’IA, un atout pour une continuité de service public p…16:50

Une cyber-résilience à l’aune de l’IA et des régulatio…19:25

Tous les Internets se valent-ils ?10:59

Decathlon : une culture agile à l’international20:08

Comment Carrefour a transformé la crise sanitaire en t…12:48

Comment Groupama s’assure d’être résilient face aux cr…13:48

Comment impulser une culture data dans une grande entr…14:17

Hors-série : La data du futur (Volume 1)08:28

Cegid : la tête dans le Cloud22:16

Hors-série : La data du futur (Volume 2)07:30

La data au service des verres intelligents chez Essilo…09:42

La vision conseil de Deloitte sur la data et l’IA19:04

Data altruisme et IA responsable au Crédit Mutuel Arkéa11:54

[BONUS] La Data Responsable : une vision écologique23:08

Silicon.fr L'actualité informatique et high-tech pour décideurs IT

IA : vers une flambée des prix des GPU ?

40 000 $ pièce la carte GPU de qualité serveur

Cloud de confiance : ce que recherche l'administration française

Pourquoi OpenStack rejoint la Fondation Linux

Comment Dropbox a repensé son architecture orientée services

VMware, pari gagné pour Broadcom ?

Une entreprise française sur deux dépasse son budget Cloud

S’abonner

Leader des services de réponse à incident de cybersécurité

Comment optimiser la consommation énergétique d’un [...]

Comment l'IA améliore la qualité de vos réunions ?

Sécuriser les solutions de communications unifiées et [...]

Le grand dîner de Gala de la Communauté

La Matinale Silicon - Zéro Trust

La MasterClass Silicon - NIS2

Silicon.fr L'actualité informatique et high-tech pour décideurs IT

40 000 $ pièce la carte GPU de qualité serveur

S’abonner

Partager l'épisode