L'offre GenAI d'Oracle en cinq points

Passage en phase commerciale acté pour OCI Generative AI. Que contient et que promet cette offre ?

Publié par Clément Bohic le 23 janv. 2024 | mis à jour à 13:12

Lecture
3 min

Imprimer

Une seule famille de modèles ? Une vectorisation limitée à l’anglais ? Pas d’intégration LangChain ? Effectivement, si on se réfère à la documentation d’OCI Generative AI.

Sauf que cette doc – comme les notes de version – n’est pas à jour. Elle présente la bêta du service… dont Oracle vient en fait d’annoncer la disponibilité générale.

Quels modèles sont disponibles ?

Exclusivement des modèles traitant et produisant du texte.

D’un côté, un modèle made in Meta : Llama 2 en version 70B.
De l’autre, des modèles signés Cohere. Deux de la famille Command (version XL à 52B et Light à 6B ; 4k de contexte pour chacun) et deux spécifiques à la vectorisation (Embed v3 et sa déclinaison légère, chacun proposé en version multilingue ou anglais uniquement).

Que peut-on faire avec ces modèles ?

OCI Generative AI permet de consommer ces modèles de fondation « à la demande » (console, CLI, SDK, API et intégration LangChain), en mode cloud public. La facturation se fait au caractère traité. Oracle communique les prix par lot de 10 000 transactions.

– Command XL : 0,020367 €
– Llama 2 : 0,01395 €
– Command Light : 0,00372 €
– Cohere Embed : 0,00093 €

On peut aussi personnaliser ces modèles, puis les exploiter en inférence. Cela se fait sur des ressources GPU dédiées facturées à l’heure. Un cluster de finetuning ne peut pas être utilisé pour l’hébergement et vice versa. Tarification annoncée :

– Command XL : 22,32 €
– Llama 2 : 11,16 €
– Embed : 10,137 €
– Command Light : 6,045 €

Comment personnaliser les modèles ?

Les données d’entraînement doivent être entreposées dans un bucket OCI, en un seul fichier jsonl.

L’affinage peut se faire avec la méthode T-Few. Cela permet de loger, affirme Oracle, jusqu’à 50 modèles par cluster d’hébergement – à condition qu’ils reposent sur le même modèle de fondation et la même version.

Avec la méthode traditionnelle, c’est un seul modèle par cluster d’hébergement. On peut toutefois lui associer plusieurs adresses IP, en conservant un monitoring spécifique à chaque endpoint.

En l’état, pas d’intégration API directe avec des applications externes. Il faut se rendre dans la console OCI (playground de test) pour exécuter les modèles personnalisés et récupérer le code.

Où le service est-il hébergé ?

Oracle laisse miroiter la possibilité d’héberger le service « dans vos datacenters » à travers les régions dédiées OCI. Pour le moment, aux dernières nouvelles, OCI Generative AI est disponible dans une région cloud : celle de Chicago (US Midwest). Il n’a pas de SLA public.

Et ensuite ?

Oracle va s’appuyer sur ce socle pour fournir des agents. Il en propose un premier, en bêta. Sa fonction : mettre en œuvre la technique du RAG (retrieval-augmented generation). Pour récupérer les informations destinées à contextualiser les prompts, il utilise pour le moment OCI OpenSearch. Il est prévu d’étendre le champ à la recherche vectorielle d’Oracle Database 23c et au magasin de vecteurs de MySQL HeatWave.

OCI Generative AI alimentera aussi Fusion Cloud, NetSuite et des applications sectorielles « tel Oracle Health ». On nous annonce le résumé et l’aide à la composition de texte comme premier use cases.

Illustration principale © jetcityimage – Adobe Stock

Publié par :
Clément Bohic

Tags associés :

sponsorisé

Gestion de crises : les leçons d’un DSI

Gestion de crises : les leçons d’un DSI17:35

SNCF Connect & Tech explore toutes les voies de la rés…23:13

D'une mine à la supply chain, de l'OT à l’industrie 4.…22:33

Champs d'application et exigences NIS220:52

Retour d'expérience : mise en œuvre des exigences par…20:42

Comment simplifier la sécurisation de votre réseau tou…20:23

Sécurité renforcée : comment préparer la conformité à…20:56

Le savoir-faire règlementaire international de Cloudfl…20:32

Se protéger et remédier aux Attaques de Messagerie : U…21:48

[Episode en public] Les leçons de résilience d’OVH29:04

[Énergie] La résilience du réseau et sa mesure d'impact19:43

SASE : La fusion du SD-WAN et du SSE décryptée07:42

Quand la cyber-résilience investit l’espace16:31

Sécurité Multicouche : La clé pour une entreprise rési…16:11

Remettre l’humain au centre du cyber-espace16:55

L’IA, super-pouvoir du cyberespace09:39

Les enjeux de sécurité des médias internationaux de la…14:32

L’IA, un atout pour une continuité de service public p…16:50

Une cyber-résilience à l’aune de l’IA et des régulatio…19:25

Tous les Internets se valent-ils ?10:59

Decathlon : une culture agile à l’international20:08

Comment Carrefour a transformé la crise sanitaire en t…12:48

Comment Groupama s’assure d’être résilient face aux cr…13:48

Comment impulser une culture data dans une grande entr…14:17

Hors-série : La data du futur (Volume 1)08:28

Cegid : la tête dans le Cloud22:16

Hors-série : La data du futur (Volume 2)07:30

La data au service des verres intelligents chez Essilo…09:42

La vision conseil de Deloitte sur la data et l’IA19:04

Data altruisme et IA responsable au Crédit Mutuel Arkéa11:54

[BONUS] La Data Responsable : une vision écologique23:08

Silicon.fr L'actualité informatique et high-tech pour décideurs IT