OpenAI va publier un modèle Open-Weight
OpenAI va publier un modèle Open-Weight personnalisable dans les prochains mois, face à la pression de ses rivaux open source DeepSeek, Llama et Qwen.

Sam Altman, CEO d'OpenAI, a déclaré que la société allait publier son premier modèle Open-Weight depuis GPT-2 dans les mois à venir, car elle fait face à une pression croissante de la part de concurrents qui peuvent être plus facilement personnalisés par leurs utilisateurs.
Les modèles Open-Weight, à poids ouverts, offrent la possibilité de personnaliser les pondérations ou les relations entre les milliards de paramètres définis lors de la formation du modèle, offrant ainsi plus de visibilité et de contrôle que les systèmes fermés.
Ces modèles peuvent généralement être utilisés sur le matériel d'une entreprise, ce qui signifie que le modèle peut gérer les données sensibles d'une entreprise sans qu'elle ne quitte jamais les locaux, un facteur important dans des domaines tels que la banque ou la santé.
Ces offres ne vont pas aussi loin que les modèles open source, qui donnent aux utilisateurs accès au code source d'un modèle et leur permettent de le personnaliser.
Depuis GPT-2, sorti en 2019, OpenAI propose des modèles fermés, mais l'approche est mise sous pression depuis le succès en janvier de la start-up chinoise DeepSeek, qui publie ses modèles et autres données en open source.
Open-Weight ne veut pas dire Open Source
La société mère de Facebook, Meta, et le géant technologique chinois Alibaba ont connu un large succès avec leurs modèles d'IA Open Source Llama et Qwen .
Altman a déclaré que le prochain modèle à poids ouvert aura également des capacités de « raisonnement », une technique conçue pour réduire les erreurs de sortie.
« Nous sommes ravis de publier un nouveau modèle de langage puissant et ouvert avec raisonnement dans les mois à venir », a déclaré Altman dans un message sur X.
Il a déclaré que la société envisageait depuis un certain temps de lancer un modèle à poids ouvert et que « maintenant, cela semble important de le faire ».
Steven Heidel, membre de l'équipe technique d'OpenAI, a répondu que la société va « publié cette année un modèle que vous pourrez exécuter sur votre propre matériel ».
Comme les modèles Open-Weight peuvent être personnalisés et utilisés de manière relativement indépendante, OpenAI effectue des tests pour garantir que le prochain modèle ne puisse pas être utilisé à des fins nuisibles, a déclaré le chercheur en sécurité Johannes Heidecke.
OpenAI a commencé à accepter les candidatures des développeurs pour obtenir un accès anticipé au modèle à poids ouvert et a déclaré qu'il organiserait des événements pour développeurs avec des prototypes précoces dans les semaines à venir à San Francisco, suivi de l'Europe et de l'Asie-Pacifique.
« Nous avons encore quelques décisions à prendre, nous organisons donc des événements pour les développeurs afin de recueillir des commentaires et de jouer plus tard avec les premiers prototypes », a déclaré Altman.
Sur le même thème
Voir tous les articles Data & IA