StableLM : les choses à savoir sur ce concurrent de ChatGPT

Stability AI regroupera ses modèles générateurs de texte et de code sous la marque StableLM. Il en a publié une première série.

Publié par Clément Bohic le 20 avr. 2023 | Mis à jour le 27 avr. 2023 à 10:27

Lecture
3 min

Imprimer

Stability AI, ce n'est pas que Stable Diffusion. Cette famille de modèles générateurs d'images lancée en 2022 reste l'emblème de l'entreprise britannique. Mais elle voisine désormais avec StableLM.

Qu'est-ce que StableLM ?

Sous cette bannière, Stability AI entend proposer des modèles générateurs de texte et de code. Il vient d'en publier une première série, au stade expérimental (alpha). Elle se compose de quatre modèles : deux « de base »... et leurs déclinaisons affinées sur davantage de données.

Les modèles StableLM de base

Fondés sur l'architecture GPT-NeoX (transformeurs autorégressifs), ils comptent respectivement 3 et 7 milliards de paramètres.
L'un et l'autre ont été entraînés en FP16 sur 800 milliards de tokens issus d'un jeu de données basé sur The Pile, qu'on doit au collectif EleutherAI.

Les modèles « affinés »

Stability AI a renforcé les modèles de base en exploitant la bibliothèque Hugging Face Transformers et une combinaison de cinq datasets :

Alpaca (made in Stanford ; 52 000 instructions et démonstrations générées par le modèle text-davinci-003 d'OpenAI)
GPT4All (origine Nomic AI ; 400 000 instructions et réponses générées par GPT-4)
ShareGPT52K (sous-ensemble de conversations récupérées sur le service communautaire ShareGPT)
Dolly (produit par Databricks ; 15 000 instructions et réponses générées par des humains sur des domaines d'aptitude d'InstructGPT)
HH (signé Antrhropics ; données destinées à guider le comportement des assistants IA)

L'un et l'autre modèle sont, comme ceux sur lesquels ils se fondent, hébergés sur le hub Hugging Face.

Quelles licences ?

L'ensemble du code publié sur le dépôt GitHub StableLM est sous licence Apache 2.0.

Les modèles de base sont en Creative Commons (CC BY-SA-4.0). Licence qui, dans les grandes lignes, impose de créditer Stability AI et de signaler les modifications qu'on a éventuellement effectuées.

Les modèles « affinés » sont aussi en Creative Commons, mais limités à un usage non commercial (CC BY-NC-SA-4.0).

Comment expérimenter les modèles StableLM ?

Un notebook Python est disponible pour expérimenter les quatre modèles. Officiellement, pour générer du texte (on ne nous parle pas de code).

Par défaut, quatre instances s'exécutent en parallèle pour les modèles de base (deux pour les modèles « affinés »). Chacune pèse environ 10 Go.

Il existe aussi une démo web pour le plus puissant des modèles. Officiellement, qu'en anglais. Dans la pratique, des langues comme l'allemand et l'espagnol ne lui sont pas (tout à fait) inconnues. C'est plus difficile en français...

Bonne réponse sur une question fermée en espagnol.

Le modèle s'emmêle un peu les pinceaux sur une question ouverte en allemand.

Quelle roadmap ?

Stability AI promet des modèles StableLM à 15, 30, 65 et 175 milliards de paramètres. Il vise aussi une intégration avec OpenAssistant pour renforcer sa boucle de feed-back. Et la mise en place d'une passerelle avec le portage C/C++ de LLaMA.

D'où vient la « mascotte » de StableLM ?

Elle a été générée avec Stable Diffusion XL. Instruction : « A Stochastic Parrot, flat design, vector art ».

Illustration principale générée par IA

Publié par :
Clément Bohic

Tags associés :

sponsorisé

Gestion de crises : les leçons d’un DSI

Gestion de crises : les leçons d’un DSI17:35

SNCF Connect & Tech explore toutes les voies de la rés…23:13

D'une mine à la supply chain, de l'OT à l’industrie 4.…22:33

Champs d'application et exigences NIS220:52

Retour d'expérience : mise en œuvre des exigences par…20:42

Comment simplifier la sécurisation de votre réseau tou…20:23

Sécurité renforcée : comment préparer la conformité à…20:56

Le savoir-faire règlementaire international de Cloudfl…20:32

Se protéger et remédier aux Attaques de Messagerie : U…21:48

[Episode en public] Les leçons de résilience d’OVH29:04

[Énergie] La résilience du réseau et sa mesure d'impact19:43

SASE : La fusion du SD-WAN et du SSE décryptée07:42

Quand la cyber-résilience investit l’espace16:31

Sécurité Multicouche : La clé pour une entreprise rési…16:11

Remettre l’humain au centre du cyber-espace16:55

L’IA, super-pouvoir du cyberespace09:39

Les enjeux de sécurité des médias internationaux de la…14:32

L’IA, un atout pour une continuité de service public p…16:50

Une cyber-résilience à l’aune de l’IA et des régulatio…19:25

Tous les Internets se valent-ils ?10:59

Decathlon : une culture agile à l’international20:08

Comment Carrefour a transformé la crise sanitaire en t…12:48

Comment Groupama s’assure d’être résilient face aux cr…13:48

Comment impulser une culture data dans une grande entr…14:17

Hors-série : La data du futur (Volume 1)08:28

Cegid : la tête dans le Cloud22:16

Hors-série : La data du futur (Volume 2)07:30

La data au service des verres intelligents chez Essilo…09:42

La vision conseil de Deloitte sur la data et l’IA19:04

Data altruisme et IA responsable au Crédit Mutuel Arkéa11:54

[BONUS] La Data Responsable : une vision écologique23:08

Silicon.fr L'actualité informatique et high-tech pour décideurs IT

StableLM : les choses à savoir sur ce concurrent de ChatGPT

Qu'est-ce que StableLM ?

Les modèles StableLM de base

Les modèles « affinés »

Quelles licences ?

Comment expérimenter les modèles StableLM ?

Quelle roadmap ?

D'où vient la « mascotte » de StableLM ?

Avec o3 et o4-mini, OpenAI mise sur une chaîne de pensée multimodale

OpenAI met GPT-4.5 en retrait : que retenir de cette parenthèse ?

De France Travail à la RATP, les leçons du "bac à sable" IA de la CNIL

Gouvernance des communications : qui se distingue sur ce marché [...]

MLPerf : la quête de benchmarks IA représentatifs

S’abonner

FFTO : Fiber To The Office ou la haute disponibilité [...]

L'UHD et la Transformation Numérique : Répondre aux [...]

Cybersécurité et digitalisation Comment protéger les [...]

Leader des services de réponse à incident de cybersécurité

Le grand dîner de Gala de la Communauté

La Matinale Silicon - Zéro Trust

La MasterClass Silicon - NIS2

Silicon.fr L'actualité informatique et high-tech pour décideurs IT

Qu'est-ce que StableLM ?

Les modèles StableLM de base

Les modèles « affinés »

Quelles licences ?

Comment expérimenter les modèles StableLM ?

Quelle roadmap ?

D'où vient la « mascotte » de StableLM ?

S’abonner

Partager l'épisode