Silicon.fr L'actualité informatique et high-tech pour décideurs IT

En ce moment En ce moment

Foundry : vers une offre OpenAI sur ressources dédiées

Avec l'offre Foundry, pas encore publique, OpenAI compte donner accès à ses modèles sur des ressources dédiées.

Publié par Clément Bohic le 22 févr. 2023 | mis à jour à 16:42

Lecture
2 min

Imprimer

Des ressources dédiées pour exécuter les modèles d'OpenAI ? C'est le principe de l'offre Foundry, annoncée auprès d'un cercle restreint d'utilisateurs.

En l'état, Foundry donne accès à trois modèles de traitement et de production de langage naturel. Le plus puissant semble être une version « boostée » de Davinci, peut-être fondée sur GPT-4. Son historique peut contenir 32 000 tokens (« morceaux de mots » équivalant à environ 4 caractères). Soit huit fois plus que pour davinci-text-003, l'actuelle référence au catalogue public d'OpenAI.

Foundry ne permet pas encore de personnaliser les modèles proposés. Le contrôle des versions, en revanche, est activé. Un SLA à retenir : 99,5 % de disponibilité pour toutes les instances, avec un support technique par téléphone.

La tarification se fonde sur des unités de compute. Elle suppose un engagement de trois mois minimum.

On l'aura constaté : la facture pourra dépasser le million de dollars par an pour le plus puissant des modèles. Mais avec, donc, des ressources dédiées qu'on pourra probablement exploiter sans limites de requêtes.

À titre comparatif, l'exécution des modèles Davinci de base par l'intermédiaire de l'API OpenAI (endpoint /completions) revient à 0,02 $ par tranche de 1000 tokens. C'est le même prix dans le cadre de l'offre Azure OpenAI Service, avec laquelle Microsoft apporte des garanties supplémentaires en matière d'options d'hébergement, de chiffrement ou encore de gestion des identités.

La version payante de ChatGPT est quant à elle facturée 24 $ TTC par mois.

Illustration principale générée par IA

Publié par :
Clément Bohic

Tags associés :

#FOUNDRY

Déployer l'IA à l'échelle : l'approche d'AXA, entre vision et [...]

Par Philippe Leroy le 24 avr. 2025

4 min.

Chez Eiffage, l'IA générative au service des métiers

Par Philippe Leroy le 18 avr. 2025

Avec o3 et o4-mini, OpenAI mise sur une chaîne de pensée multimodale

Par Clément Bohic le 17 avr. 2025

OpenAI met GPT-4.5 en retrait : que retenir de cette parenthèse ?

Par Clément Bohic le 16 avr. 2025

De France Travail à la RATP, les leçons du "bac à sable" IA de la CNIL

Par Clément Bohic le 16 avr. 2025

Livres Blancs #bigdata

EasyVista

Les enjeux de la supervision du système d’information !

Easyvista a compilé cinq enjeux majeurs de l’observabilité, illustrés par des cas concrets de leurs clients : [...]

Télécharger

Kaspersky

La Threat Intelligence : quand, quoi et comment ?

Comment maximiser les bénéfices de la Threat Intelligence pour votre entreprise. La Threat Intelligence [...]

Télécharger

Voir tous les livres blancs

Vos prochains événements

Voir tous les événements

5 juin 2025

Le grand dîner de Gala de la Communauté

Organisé par silicon.fr

Inscrivez-vous

3 juillet 2025

La Matinale Silicon - Zéro Trust

Organisé par silicon.fr

Inscrivez-vous

7 novembre 2024

La MasterClass Silicon - NIS2

Organisé par silicon.fr

REVIVRE EN IMAGES

Voir tous les événements

Inscrivez-vous à la Newsletter pour recevoir les dernières actualités

Abonnez-vous au magazine Silicon et profitez de contenus exclusifs !

Boostez votre expertise professionnelle en accédant aux informations clés de votre domaine.