La demande d’accélérateurs d’intelligence artificielle (IA) pour former, tester et exécuter des modèles d’apprentissage automatique (machine learning, ML) augmente.
Un tel engouement impacte les tarifs de processeurs dédiés au traitement graphique (GPU) de terminaux, des ordinateurs aux serveurs pour datacenters, a relevé The Next Platform.
Les GPU peuvent être adaptés aux calculs massivement parallèles qui accélèrent les opérations de traitement qu’implique l’entraînement de grands modèles de langage (LLM).
L’inadéquation entre la demande exprimée par le marché et l’offre fait grimper la cote.
Le mouvement entraîne même une « flambée des prix » des GPU de qualité serveur. Certaines puces dédiées, dont des cartes graphiques haut de gamme Nvidia (la version PCI Express des GPU Nvdia H100), peuvent atteindre 40 000 $ pièce sur les places de marché du e-commerce.
Un prix dont s’est fait l’écho dans un tweet John Carmack, programmeur et développeur de jeux vidéo. CNBC relevait à ce propos : « les développeurs utilisent le H100 pour construire de grands modèles de langage qui sont au cœur d’applications d’IA comme ChatGPT d’OpenAI. Exécuter ces systèmes est coûteux et nécessite des ordinateurs puissants pour traiter des téraoctets de données […] Ils dépendent également d’une puissance de calcul importante pour que leurs modèles d’IA puissent générer du texte, des images ou des prévisions. »
En outre, « l’entraînement de modèles d’intelligence artificielle, particulièrement les plus volumineux comme le modèle de langage pré-entraîné GPT (generative pre-training transformer), nécessite d’activer de concert des centaines de GPU haut de gamme. »
Or, les attentes d’acheteurs en entreprise peuvent surpasser les capacités de production de fournisseurs.
De surcroît, les hyperscalers et d’autres opérateurs cloud rationnent l’accès aux capacités GPU de leurs propres développeurs. Aussi, les prix des GPU Cloud – les instances répondant aux exigences de traitement de tâches parallèles – pourraient à leur tour augmenter.
(crédit photo © railwayfx – Adobe Stock)
Pour développer une version 7B de son modèle Codestral, Mistral AI n'a pas utilisé de…
L’Autorité de la concurrence et des marchés (CMA) britannique ouvre une enquête sur les conditions…
Thomas Gourand est nommé Directeur Général pour la France. Il est chargé du développement de…
Pour dissuader le CISPE d'un accord avec Microsoft, Google aurait mis près de 500 M€…
Pour réduire la taille des mises à jour de Windows, Microsoft va mettre en place…
De l'organisation administrative à la construction budgétaire, la Cour des comptes pointe le fonctionnement complexe…