HPE tente d'adapter son offre GreenLake aux IA génératives
Une option de cloud privé externe sur base Cray XD et destinée aux grands modèles de langage s'ajoute à la gamme HPE GreenLake.
Renvoi d'ascenseur entre Aleph Alpha et HPE ? Jusqu'ici, le premier était client du second. Il est désormais aussi son fournisseur, dans le cadre de l'offre GreenLake for Large Language Models.
Cette dernière repose sur des supercalculateurs Cray XD, pour le moment hébergés au Canada, chez QScale. De type cloud privé (IaaS + PaaS), elle doit permettre d'entraîner et d'exécuter des LLM. À commencer, donc, par ceux que l'entreprise allemande Aleph Alpha a regroupés sous la marque Luminous.
Ces modèles - propriétaires - sont au nombre de trois. Avec, pour chacun, une déclinaison affinée pour suivre des instructions. Leur particularité : deux d'entre eux sont multimodaux, au sens où ils peuvent traiter à la fois du texte - en cinq langues dont le français - et des images. Ils sont par ailleurs capables d'expliquer les résultats qu'ils produisent.
Lire aussi : 10 chiffres sur LightOn, qui prépare son IPO
Du Cray « spécial IA » en cloud privé
Le portefeuille GreenLake comprend déjà du HPC axé sur l'IA générative, mais dans le cadre d'une offre managée sur site.
Le marché nord-américain a la primauté de l'offre GreenLake for Large Language Models. En l'état, HPE prévoit une extension à l'Europe début 2024. Entretemps, il aura augmenté la capacité disponible. À défaut de tarification officielle, il y a celle de l'API Luminous :
Des multiplicateurs s'appliquent en fonction des tâches (le résumé coûte plus cher que le Q&A, lui-même plus onéreux que la complétion).
Cette API, Software AG en fait officiellement usage depuis peu. En l'occurrence, dans son iPaaS webMethods.io, également doté d'un connecteur ChatGPT.
La relation entre HPE et Aleph Alpha est établie de longue date. La start-up avait déjà participé à l'édition 2022 de la conférence Discover. Elle avait notamment témoigné de son adoption de la plate-forme HPE Machine Learning Development System. Le système qui en résulte figure dans le dernier TOP500, au 88e rang. Baptisé alpha ONE, il repose sur la plate-forme Apollo 6500, avec des serveurs ProLiant en AMD et des GPU NVIDIA A100.
Plus récemment, les deux entreprises ont communiqué sur un cas d'usage des LLM Luminous pour la maintenance prédictive au sein des usines. Ils ont, en particulier, effectué une démonstration de cobot.
À consulter en complément :
RISC-V : la stratégie de l'UE passera par EuroHPC
Supercalculateurs : les 10 systèmes les plus puissants en 2023
Leonardo fait ses débuts : ce qu'il faut savoir sur ce supercalculateur
HPE Ezmeral veut rester dans la course à l'IA
Photo d'illustration © IM Imagery - Adobe Stock
Sur le même thème
Voir tous les articles Workspace