Encore un élément de plus mis en Open Source dans la corbeille des services autour de l’intelligence artificielle (IA) et plus particulièrement du machine learning (ML). Google a annoncé dans un blog, la mise à disposition d’un outil de visualisation des données, baptisé Embedding Projector. Il s’agit d’une composante du programme plus général de machine learning, nommé Tensor Flow. Ce dernier est utilisé dans plusieurs domaines comme la reconnaissance d’image, la traduction naturelle ou le diagnostic médical.
Or avec l’adoption rapide de l’apprentissage automatique, les scientifiques sont confrontés à un problème d’intégrer des centaines voire des milliers de dimensions au sein des données. Elles nécessitent des outils spécifiques. Et c’est là qu’intervient Embedding Projector, une application web de visualisation de données multidimensionnelles. A noter qu’elle peut tourner indépendamment de Tensor Flow.
Les données nécessaires à l’apprentissage automatique existent dans un format non reconnu par un ordinateur. Il faut donc les convertir en algorithme. Pour cela, Google utilise un vecteur Embedding (structure mathématique d’une instance contenue dans une autre instance, comme un groupe et un sous-groupe), pour intégrer plusieurs dimensions d’une donnée. Embedding Projector permet donc de réaliser une visualisation de cette représentation multidimensionnelle.
Google donne l’exemple du langage naturel en réalisant une cartographie des mots qui se rapprochent d’une requête (dans le cas cité, il s’agit du mot important). Les spécialistes de l’IA peuvent voir en 2D, 3D, zoomer ou tourner des nuages de points et analyser les corrélations réalisées par le système de machine learning. Embedding Projector s’aide de solutions de réduction de dimensionnalité comme PCA ou t-SNE pour faciliter la visualisation.
Cette initiative de Google s’inscrit dans la démarche plus globale des grands acteurs de l’IT dans le domaine de l’intelligence artificielle. La majorité d’entre eux a décidé de placer en Open Source leurs plateformes de machine learning. Même Apple va sauter le pas en autorisant ses chercheurs à publier leurs travaux. Il faudra attendre encore un peu pour que Cupertino cède aux sirènes de l’Open Source.
A lire aussi :
Google veut rendre le machine learning moins discriminant
Comment le Machine Learning aide à débusquer les failles de sécurité
Missions historiques de la Dinum, l'ouverture des données publiques et la promotion des logiciels libres…
Pour développer une version 7B de son modèle Codestral, Mistral AI n'a pas utilisé de…
L’Autorité de la concurrence et des marchés (CMA) britannique ouvre une enquête sur les conditions…
Thomas Gourand est nommé Directeur Général pour la France. Il est chargé du développement de…
Pour dissuader le CISPE d'un accord avec Microsoft, Google aurait mis près de 500 M€…
Pour réduire la taille des mises à jour de Windows, Microsoft va mettre en place…