Stable Code, nouveau « poids léger » chez les LLM codeurs

Première version majeure pour Stable Code, que Stability AI destine à un usage en local. Comment se présente ce modèle ?

Publié par Clément Bohic le 17 janv. 2024 | Mis à jour le 2 avr. 2025 à 16:12

Lecture
4 min

Imprimer

Getting your Trinity Audio player ready...

À la recherche d'un LLM codeur exécutable en local ? Stable Code est option.

Stability AI, qui vient de publier ce modèle, met en tout cas en avant la capacité à l'utiliser « même sans GPU dédié sur des laptops comme le MacBook Air ».

Stable Code 3B outperforms code models of a similar size and matches CodeLLaMA 7b performance despite being 40% of the size.

This makes it ideal for running on edge devices to ensure privacy and drive better dev experiences pic.twitter.com/6Fbmx4PIeY

- Stability AI (@StabilityAI) January 16, 2024

On n'est pas parti de zéro. Il existait déjà une famille Stable Code Alpha. Ouverte en août dernier, elle comprend trois modèles : deux pour la complétion de code (dont un doté d'une fenêtre de contexte étendue de 4k à 16k) et un de type instruct.

Les modèles Stable Code Alpha de base se font sur le LLM généraliste Stable LM. Ils ont subi un premier entraînement non supervisé sur une version « augmentée » du dataset StarCoder (environ 300 milliards de tokens). Puis une deuxième phase sur des langages populaires (C, C++, Go, Java, JavaScript, Markdown, Python ; 260 milliards de tokens). Le modèle instruct a été affiné sur 120 000 paires instruction/réponse.
Les checkpoints des modèles de base sont sous licence Apache 2.0. Ceux du modèle instruct sont sous une licence spécifique qui interdit l'usage commercial.

Stable Code : pas d'usage commercial sans abonnement

La « nouvelle génération » Stable Code ne comprend pour le moment qu'un modèle, à 2,7 milliards de paramètres. Là aussi, la licence exclut les usages commerciaux. À moins de souscrire à l'un des abonnements - Pro ou Entreprise - que Stability AI commercialise depuis quelques semaines (Stable Code n'est pas disponible sur l'API).

Doté d'une fenêtre de contexte de 16k, Stable Code supporte l'autocomplétion au milieu du code et la v2 de FlashAttention. Stability AI, qui l'a entraîné sur son cluster d'instances AWS P4d (256 GPU NVIDIA A100-40), le dit fonctionnel sur 18 langages. Nommément, C, C++, Java, JavaScript, CSS, Go, HTML, Ruby, Rust, Markdown, Shell, PHP, SQL, R, TypeScript, Pyrhon, Jupyter-Clean et RestructuredText.

Exploitant notamment les rotary embeddings, le pipeline d'entraînement a été similaire à celui des modèles Code Llama. Stability AI ne manque d'ailleurs pas de faire la comparaison avec la version 7B sur le benchmark MultiPL-HumanEval.

En complément à StarCoder, Stable Code a travaillé sur un autre sous-ensemble du dataset The Stack : des tickets et des PR GitHub. On l'a aussi formé sur un extrait de Falcon RefinedWeb, sur CommitPackFT et sur des données mathématiques issues en particulier de MetaMathQA.

À consulter en complément :

Comment la communauté s'empare du modèle ouvert de Mistral AI
Transparence des LLM : ce qui coince chez OpenAI & Cie
Le GPT Store a ouvert : quelques clés de compréhension
12 questions que l'UE se pose sur l'IA générative

Illustration © bestforbest - Adobe Stock

Publié par :
Clément Bohic

Tags associés :

sponsorisé

Gestion de crises : les leçons d’un DSI

Gestion de crises : les leçons d’un DSI17:35

SNCF Connect & Tech explore toutes les voies de la rés…23:13

D'une mine à la supply chain, de l'OT à l’industrie 4.…22:33

Champs d'application et exigences NIS220:52

Retour d'expérience : mise en œuvre des exigences par…20:42

Comment simplifier la sécurisation de votre réseau tou…20:23

Sécurité renforcée : comment préparer la conformité à…20:56

Le savoir-faire règlementaire international de Cloudfl…20:32

Se protéger et remédier aux Attaques de Messagerie : U…21:48

[Episode en public] Les leçons de résilience d’OVH29:04

[Énergie] La résilience du réseau et sa mesure d'impact19:43

SASE : La fusion du SD-WAN et du SSE décryptée07:42

Quand la cyber-résilience investit l’espace16:31

Sécurité Multicouche : La clé pour une entreprise rési…16:11

Remettre l’humain au centre du cyber-espace16:55

L’IA, super-pouvoir du cyberespace09:39

Les enjeux de sécurité des médias internationaux de la…14:32

L’IA, un atout pour une continuité de service public p…16:50

Une cyber-résilience à l’aune de l’IA et des régulatio…19:25

Tous les Internets se valent-ils ?10:59

Decathlon : une culture agile à l’international20:08

Comment Carrefour a transformé la crise sanitaire en t…12:48

Comment Groupama s’assure d’être résilient face aux cr…13:48

Comment impulser une culture data dans une grande entr…14:17

Hors-série : La data du futur (Volume 1)08:28

Cegid : la tête dans le Cloud22:16

Hors-série : La data du futur (Volume 2)07:30

La data au service des verres intelligents chez Essilo…09:42

La vision conseil de Deloitte sur la data et l’IA19:04

Data altruisme et IA responsable au Crédit Mutuel Arkéa11:54

[BONUS] La Data Responsable : une vision écologique23:08

Silicon.fr L'actualité informatique et high-tech pour décideurs IT

Stable Code, nouveau « poids léger » chez les LLM codeurs

Stable Code : pas d'usage commercial sans abonnement

AWS Summit : le RAG, au carrefour des stratégies GenAI

{ Tribune Expert } - La voie vers une véritable IA open source

MLPerf : la quête de benchmarks IA représentatifs

Apps mobiles : du nouveau dans les recommandations de la CNIL

Mainframes z17 : les cartes Spyre, au coeur de la promesse IA d'IBM

S’abonner

FFTO : Fiber To The Office ou la haute disponibilité [...]

L'UHD et la Transformation Numérique : Répondre aux [...]

Le grand dîner de Gala de la Communauté

La Matinale Silicon - Zéro Trust

La MasterClass Silicon - NIS2

Silicon.fr L'actualité informatique et high-tech pour décideurs IT

Stable Code : pas d'usage commercial sans abonnement

S’abonner

Partager l'épisode