Oracle rejoint la bataille de la recherche vectorielle

Oracle recherche vectorielle

Avec l’IA générative en ligne de mire, Oracle signale à son tour l’intégration de la recherche vectorielle dans son SGBD.

Qui n’a pas sa fonctionnalité de recherche vectorielle ? Nous nous étions récemment fait la réflexion à propos des fournisseurs de SGBD. En mentionnant plus particulièrement MongoDB, Neo4j et Redis. Tous venaient de communiquer à ce sujet, avec un même angle : l’IA générative.

Oracle a fait de même à la faveur du lancement d’une nouvelle version (23c) de sa base de données.

La possibilité de stocker et d’exploiter des vecteurs n’est pas nouvelle : Oracle Database 19c, la précédente LTS, le permet déjà. L’algorithme ESA (Explicit Semantic Analysis), notamment, peut en tirer parti, pour l’extraction de features (non supervisé) et la catégorisation de documents (supervisé).

La nouveauté avec Oracle Database 23c, c’est l’intégration d’un format de données natif et d’un système d’indexation – dont on ne nous précise pas la nature.

Oracle s’appuie sur Cohere pour l’embedding

Il n’y a pas d’outil de vectorisation directement intégré au SGBD. Il en existe cependant un sur OCI. Actuellement en bêta, il est développé avec Cohere, aux côtés d’autres services d’IA générative.

De par sa relative simplicité d’intégration, la recherche vectorielle n’est pas mise en avant dans les points-clés de la documentation d’Oracle Database 23c. Ni sur la page de présentation du produit. Au contraire des améliorations sur les tables blockchain, les procédures stockées JavaScript ou le support du standard émergent SQL/PGQ.

Au-delà de la recherche vectorille, Oracle met l’accent sur l’usage de l’IA dans sa base de données. Cela passe par des améliorations sur XGBoost (bibliothèque d’amplification de gradient), sur les GLM (modèles linéaires généralisés)… et sur la mise à disposition d’une interface en langage naturel. Pour commencer, elle permettra, sur l’UI ou par API, d’interroger des données. À l’avenir, de générer du code dans APEX ou SQL Developer.

À consulter en complément :

MongoDB : au-delà du (multi)cloud, les tendances à la mi-2023
Oracle Database sur Arm : les options dans OCI et au-delà
Bases de données cloud : qui sont les principaux fournisseurs ?

Illustration © AndSus – Adobe Stock