Pour gérer vos consentements :
Categories: ChatGPT

Foundry : vers une offre OpenAI sur ressources dédiées

Des ressources dédiées pour exécuter les modèles d’OpenAI ? C’est le principe de l’offre Foundry, annoncée auprès d’un cercle restreint d’utilisateurs.

En l’état, Foundry donne accès à trois modèles de traitement et de production de langage naturel. Le plus puissant semble être une version « boostée » de Davinci, peut-être fondée sur GPT-4. Son historique peut contenir 32 000 tokens (« morceaux de mots » équivalant à environ 4 caractères). Soit huit fois plus que pour davinci-text-003, l’actuelle référence au catalogue public d’OpenAI.

Foundry ne permet pas encore de personnaliser les modèles proposés. Le contrôle des versions, en revanche, est activé. Un SLA à retenir : 99,5 % de disponibilité pour toutes les instances, avec un support technique par téléphone.

La tarification se fonde sur des unités de compute. Elle suppose un engagement de trois mois minimum.

On l’aura constaté : la facture pourra dépasser le million de dollars par an pour le plus puissant des modèles. Mais avec, donc, des ressources dédiées qu’on pourra probablement exploiter sans limites de requêtes.

À titre comparatif, l’exécution des modèles Davinci de base par l’intermédiaire de l’API OpenAI (endpoint /completions) revient à 0,02 $ par tranche de 1000 tokens. C’est le même prix dans le cadre de l’offre Azure OpenAI Service, avec laquelle Microsoft apporte des garanties supplémentaires en matière d’options d’hébergement, de chiffrement ou encore de gestion des identités.

La version payante de ChatGPT est quant à elle facturée 24 $ TTC par mois.

Illustration principale générée par IA

Recent Posts

IA générative : l’Autorité de la concurrence pointe de sérieux risques

Dans un avis consultatif, l'Autorité de la concurrence a identifié les risques concurrentiels liés à…

2 jours ago

OpenAI signe un accord de contenu avec Time

OpenAI signe un « partenariat de contenu stratégique » avec Time pour accéder au contenu…

2 jours ago

Atos : David Layani (Onepoint) veut sortir du capital

Au lendemain du rejet de sa proposition de restructuration, David Layani annonce sa démission du…

2 jours ago

Évaluer les LLM, un défi : le cas Hugging Face

Après un an, Hugging Face a revu les fondements de son leaderboard LLM. Quels en…

3 jours ago

Mozilla face au dilemme de la GenAI dans Firefox

Mozilla commence à expérimenter divers LLM dans Firefox, en parallèle d'autres initiatives axées sur l'intégration…

3 jours ago

VMware tente d’orienter vers VCF les déploiements pré-Broadcom

VMware met VCF à jour pour y favoriser la migration des déploiements qui, sur le…

4 jours ago