Pour gérer vos consentements :
Categories: CloudDatacenters

IA : vers une flambée des prix des GPU ?

La demande d’accélérateurs d’intelligence artificielle (IA) pour former, tester et exécuter des modèles d’apprentissage automatique (machine learning, ML) augmente.

Un tel engouement impacte les tarifs de processeurs dédiés au traitement graphique (GPU) de terminaux, des ordinateurs aux serveurs pour datacenters, a relevé The Next Platform.

Les GPU peuvent être adaptés aux calculs massivement parallèles qui accélèrent les opérations de traitement qu’implique l’entraînement de grands modèles de langage (LLM).

40 000 $ pièce la carte GPU de qualité serveur

L’inadéquation entre la demande exprimée par le marché et l’offre fait grimper la cote.

Le mouvement entraîne même une « flambée des prix » des GPU de qualité serveur. Certaines puces dédiées, dont des cartes graphiques haut de gamme Nvidia (la version PCI Express des GPU Nvdia H100), peuvent atteindre 40 000 $ pièce sur les places de marché du e-commerce.

Un prix dont s’est fait l’écho dans un tweet John Carmack, programmeur et développeur de jeux vidéo. CNBC relevait à ce propos : « les développeurs utilisent le H100 pour construire de grands modèles de langage qui sont au cœur d’applications d’IA comme ChatGPT d’OpenAI. Exécuter ces systèmes est coûteux et nécessite des ordinateurs puissants pour traiter des téraoctets de données […] Ils dépendent également d’une puissance de calcul importante pour que leurs modèles d’IA puissent générer du texte, des images ou des prévisions. »

En outre, « l’entraînement de modèles d’intelligence artificielle, particulièrement les plus volumineux comme le modèle de langage pré-entraîné GPT (generative pre-training transformer), nécessite d’activer de concert des centaines de GPU haut de gamme. »

Or, les attentes d’acheteurs en entreprise peuvent surpasser les capacités de production de fournisseurs.

De surcroît, les hyperscalers et d’autres opérateurs cloud rationnent l’accès aux capacités GPU de leurs propres développeurs. Aussi, les prix des GPU Cloud – les instances répondant aux exigences de traitement de tâches parallèles – pourraient à leur tour augmenter.

(crédit photo © railwayfx – Adobe Stock)

Recent Posts

Pour son premier LLM codeur ouvert, Mistral AI choisit une architecture alternative

Pour développer une version 7B de son modèle Codestral, Mistral AI n'a pas utilisé de…

8 heures ago

Microsoft x Inflection AI : l’autorité de la concurrence britannique lance son enquête

L’Autorité de la concurrence et des marchés (CMA) britannique ouvre une enquête sur les conditions…

11 heures ago

Thomas Gourand, nouveau Directeur Général de Snowflake en France

Thomas Gourand est nommé Directeur Général pour la France. Il est chargé du développement de…

13 heures ago

Accord Microsoft-CISPE : comment Google a tenté la dissuasion

Pour dissuader le CISPE d'un accord avec Microsoft, Google aurait mis près de 500 M€…

13 heures ago

Vers des mises à jour cumulatives intermédiaires pour Windows

Pour réduire la taille des mises à jour de Windows, Microsoft va mettre en place…

14 heures ago

RH, finances, stratégie… Les complexités de la Dinum

De l'organisation administrative à la construction budgétaire, la Cour des comptes pointe le fonctionnement complexe…

1 jour ago