MongoDB : au-delà du (multi)cloud, les tendances à mi-2023
Multicloud, streaming de données, IA générative... L'édition new-yorkaise de la MongoDB.local a donné à voir les angles d'évolution du SGBD.
Les déploiements sur site ? Chez MongoDB, on n'en parle plus beaucoup. Tout du moins en façade. Un événement organisé cette semaine à New York en a donné l'illustration. Jusqu'au résumé que l'entreprise américaine en a fait : tout pour la version cloud, à une exception près.
Cette exception, c'est l'outil MongoDB Relational Migrator. Il n'est pas nouveau (première version publiée en mai 2022), mais vient de passer en phase de disponibilité générale. Son rôle : favoriser la migration depuis des bases relationnelles (Oracle, SQL Server, MySQL et PostgreSQL) vers MongoDB Atlas... « ou un déploiement autogéré ».
Dans l'absolu, l'outil peut automatiser intégralement le processus de création du schéma de destination. Il ne permet pas, pour le moment, de migrer plusieurs applications en parallèle. L'option de déploiement sur Kafka n'est pas ailleurs pas encore considérée comme stable (les installations client et serveur le sont).
Recherche vectorielle et streaming de données
Toujours sur le volet fonctionnel, Atlas a droit, entre autres nouveautés, à une fonction native de traitements des données en flux, disponible en accès anticipé sur demande. La recherche vectorielle est quant à elle en preview publique. Dans le viseur, en particulier, les grands modèles de langage (elle permet d'exploiter la base de données en tant que magasin de vecteurs dans LangChain et LlamaIndex).
MongoDB souligne aussi la prise en charge d'Azure en plus d'AWS pour les composantes Online Archive (tiering sur stockage objet) et Data Federation (combinaison d'Atlas avec ces mêmes ressources de stockage objet). Ainsi que deux options. D'une part, la modification des données après ingestion dans le cadre du traitement de séries temporelles. De l'autre, l'évolutivité indépendante des workloads de recherche (infrastructure supplémentaire décorrélée de la base de données).
MongoDB avance sur Python et Kotlin
Les développeurs auront relevé l'extension du portefeuille de langages pris en charge pour les déploiements IaC via le CDK AWS. C#, Go, Java et Python viennent compléter JavaScript et TypeScript.
Quant au pilote Kotlin officiel de MongoDB, il prend désormais officiellement en charge le développement serveur. Sous la même forme (encapsulation du pilote Java) que le pilote communautaire KMongo, mais avec quelques différences fonctionnelles, comme le support de la sérialisation Kotlinx.
Lire aussi : Comment marier IA générative et données d’entreprise
À noter aussi une des évolutions de l'opérateur Atlas pour Kubernetes (option d'importation de projets et de déploiements en une commande) et la disponibilité générale de PyMongoArrow. Cette bibliothèque permet de charger des résultats de requêtes dans des tableaux Apache Arrow, Pandas et NumPy.
Pour enrichir la fonction de recherche vectorielle, MongoDB a renforcé ses liens avec Google Cloud. Le résultat : la possibilité d'utiliser, sur des données stockées dans Atlas, l'API de vectorisation de Vertex AI. Et, en parallèle, de faire appel aux modèles PaLM pour le traitement du langage.
Illustration principale © greenbutterfly - Adobe Stock
Sur le même thème
Voir tous les articles Data & IA