NVIDIA s'affirme en boussole des IA génératives

NVIDIA structure son offre et ses partenariats dans le domaine des IA génératives. Quelle forme prend la démarche ?

Publié par Clément Bohic le 22 mars 2023 | mis à jour à 17:17

Lecture
4 min

Imprimer

NVIDIA, une pierre angulaire de l'IA générative ? On pourrait l'affirmer s'il fallait juger à l'aune des relations commerciales que l'entreprise américaine a établies. En tout, celles qu'elle a choisi de mettre en lumière lors de sa conférence GTC.

Parmi les partenaires, il y a Google Cloud. Qui est officiellement le premier CSP à dégainer - en bêta privée, cependant - des instances fondées sur le GPU L4.

* Résultats avec parcimonie des données

Cette carte low profile « basse consommation » (72 W) peut développer, nous annonce-t-on jusqu'à 30 Pflops en FP32 (simple précision). Soit environ trois fois moins que le modèle L40 (300 W). NVIDIA la présente comme une solution « universelle », mais il avance en premier lieu son usage en inférence avec les modèles génératifs. Les autres jonctions avec Google Cloud interviennent en deuxième rideau dans sa communication, qu'il s'agisse de l'intégration du moteur Triton avec GKE ou de la connexion de la bibliothèque Spark-RAPIDS à Dataproc.

Dans le cadre des relations avec AWS, le message porte plutôt sur les possibilité d'entraînement des modèles génératifs. En ligne de mire, les instances EC2 P5, censées être disponibles dans un horizon de quelques semaines. Elles seront les premières instances GPU du groupe américain à tirer parti de la deuxième génération du pilote EFA.

Les instances P5 reposeront sur le GPU H100. Livré depuis l'automne dernier, celui-ci propulse aussi, entre autres, des instances bare metal sur le cloud d'Oracle et une famille de VM Azure lancée la semaine passée en preview. Ainsi que des instances EC2 que teste notamment, à l'heure actuelle, Stability AI. Il est aussi, chez Meta, le socle du supercalculateur Grand Teton. Des plus « petits » fournisseurs, à l'image de Cirrascale et CoreWeave, sont aussi dans la boucle.

AI Foundations : NVIDIA prend ses marques

En matière d'IA générative, NVIDIA a, en particulier, une marque forte : AI Foundations. Elle donne accès à un bouquet de services fondés sur des grands modèles de langage (LLM). Parmi eux, il y a, en accès anticipé, BioNeMo. Il permet d'entraîner et d'exécuter - via UI web ou API - des modèles dans le domaine des sciences de la vie. Le catalogue en comprend plusieurs en source ouverte. Par exemple, AlphaFold2 (de DeepMind) et ESMFold (de Meta) pour la prédiction de la structure des protéines, DiffDock (du MIT) pour l'amarrage moléculaire ou MegaMolBART (made in NVIDIA) pour la découverte de petites molécules.

Autre service à se placer sous la bannière AI Foundations et là aussi en accès anticipé : NeMo. Il donne pour le moment accès à cinq modèles entraînés sur des données publiques. Dont trois dérivés de GPT à 8, 43 et 530 milliards de paramètres, respectivement axés sur la classification de texte, le Q&A et la composition. Pour la traduction, il y a BLOOMZ-T0, modèle communautaire.

NeMo et BioNeMo donnent chacun accès à un bac à sable et à des options de personnalisation des modèles. Il faudra encore attendre, en revanche, pour l'ouverture au public de Picasso, troisième service de la famille AI Foundations. Pour le moment, NVIDIA met l'accent sur ses travaux avec :

- Adobe pour développer des modèles génératifs dont certains seront intégrés, sous la marque Firefly, dans la Creative Suite
- Shutterstock pour exploiter sa base afin d'entraîner des modèles génératifs 3D qui trouveront place à la fois dans sa boîte à outils Creative Flow et dans l'Omniverse de NVIDIA
- Getty Images pour développer, à partir de ses actifs, des modèles auxquels on pourra accéder par API sur Picasso, avec partage des revenus

La gamme AI Foundations repose sur l'architecture DGX Cloud. Cette offre donne accès à des clusters dédiés, à partir de 37 000 $ HT/mois. Le premier à héberger officiellement des instances est Oracle. Azure devrait suivre au troisième trimestre 2023.
NVIDIA fournit une couche de gestion hybride permettant d'y associer le pilotage les ressources DGX sur site.

Illustration principale © Sundry Photography - Adobe Stock

Publié par :
Clément Bohic

Tags associés :

#NVIDIA

sponsorisé

Gestion de crises : les leçons d’un DSI

Gestion de crises : les leçons d’un DSI17:35

SNCF Connect & Tech explore toutes les voies de la rés…23:13

D'une mine à la supply chain, de l'OT à l’industrie 4.…22:33

Champs d'application et exigences NIS220:52

Retour d'expérience : mise en œuvre des exigences par…20:42

Comment simplifier la sécurisation de votre réseau tou…20:23

Sécurité renforcée : comment préparer la conformité à…20:56

Le savoir-faire règlementaire international de Cloudfl…20:32

Se protéger et remédier aux Attaques de Messagerie : U…21:48

[Episode en public] Les leçons de résilience d’OVH29:04

[Énergie] La résilience du réseau et sa mesure d'impact19:43

SASE : La fusion du SD-WAN et du SSE décryptée07:42

Quand la cyber-résilience investit l’espace16:31

Sécurité Multicouche : La clé pour une entreprise rési…16:11

Remettre l’humain au centre du cyber-espace16:55

L’IA, super-pouvoir du cyberespace09:39

Les enjeux de sécurité des médias internationaux de la…14:32

L’IA, un atout pour une continuité de service public p…16:50

Une cyber-résilience à l’aune de l’IA et des régulatio…19:25

Tous les Internets se valent-ils ?10:59

Decathlon : une culture agile à l’international20:08

Comment Carrefour a transformé la crise sanitaire en t…12:48

Comment Groupama s’assure d’être résilient face aux cr…13:48

Comment impulser une culture data dans une grande entr…14:17

Hors-série : La data du futur (Volume 1)08:28

Cegid : la tête dans le Cloud22:16

Hors-série : La data du futur (Volume 2)07:30

La data au service des verres intelligents chez Essilo…09:42

La vision conseil de Deloitte sur la data et l’IA19:04

Data altruisme et IA responsable au Crédit Mutuel Arkéa11:54

[BONUS] La Data Responsable : une vision écologique23:08

Silicon.fr L'actualité informatique et high-tech pour décideurs IT

NVIDIA s'affirme en boussole des IA génératives

AI Foundations : NVIDIA prend ses marques

Les insuffisances de Sesam, SI métier de la DGCCRF

Qu'est-ce que le protocole MCP, qui monte dans l'univers de [...]

La CNIL face aux limites du chiffrement homomorphe

Quelle infrastructure on-premise pour porter une stratégie IA ?

De l'UX à l'AX : penser les interfaces pour les agents IA

S’abonner

Les stations de travail dédiées à votre métier

Future of Work – Transformer le support et [...]

Le grand dîner de Gala de la Communauté

La Matinale Silicon - Zéro Trust

La MasterClass Silicon - NIS2

Silicon.fr L'actualité informatique et high-tech pour décideurs IT

AI Foundations : NVIDIA prend ses marques

S’abonner

Partager l'épisode