Pour gérer vos consentements :

Embedding Projector : Google place sa dataviz en Open Source

Encore un élément de plus mis en Open Source dans la corbeille des services autour de l’intelligence artificielle (IA) et plus particulièrement du machine learning (ML). Google a annoncé dans un blog, la mise à disposition d’un outil de visualisation des données, baptisé Embedding Projector. Il s’agit d’une composante du programme plus général de machine learning, nommé Tensor Flow.  Ce dernier est utilisé dans plusieurs domaines comme la reconnaissance d’image, la traduction naturelle ou le diagnostic médical.

Or avec l’adoption rapide de l’apprentissage automatique, les scientifiques sont confrontés à un problème d’intégrer des centaines voire des milliers de dimensions au sein des données.  Elles nécessitent des outils spécifiques. Et c’est là qu’intervient Embedding Projector, une application web de visualisation de données multidimensionnelles. A noter qu’elle peut tourner indépendamment de Tensor Flow.

Voir comment le machine learning apprend

Les données nécessaires à l’apprentissage automatique existent dans un format non reconnu par un ordinateur. Il faut donc les convertir en algorithme. Pour cela, Google utilise un vecteur Embedding (structure mathématique d’une instance contenue dans une autre instance, comme un groupe et un sous-groupe), pour intégrer plusieurs dimensions d’une donnée. Embedding Projector permet donc de réaliser une visualisation de cette représentation multidimensionnelle.

Google donne l’exemple du langage naturel en réalisant une cartographie des mots qui se rapprochent d’une requête (dans le cas cité, il s’agit du mot important). Les spécialistes de l’IA peuvent voir en 2D, 3D, zoomer ou tourner des nuages de points et analyser les corrélations réalisées par le système de machine learning. Embedding Projector s’aide de solutions de réduction de dimensionnalité comme PCA ou t-SNE pour faciliter la visualisation.

Cette initiative de Google s’inscrit dans la démarche plus globale des grands acteurs de l’IT dans le domaine de l’intelligence artificielle. La majorité d’entre eux a décidé de placer en Open Source leurs plateformes de machine learning. Même Apple va sauter le pas en autorisant ses chercheurs à publier leurs travaux. Il faudra attendre encore un peu pour que Cupertino cède aux sirènes de l’Open Source.

A lire aussi :

Google veut rendre le machine learning moins discriminant

Comment le Machine Learning aide à débusquer les failles de sécurité

Recent Posts

Une Dinum « balbutiante » sur l’open data et les logiciels libres

Missions historiques de la Dinum, l'ouverture des données publiques et la promotion des logiciels libres…

4 minutes ago

Pour son premier LLM codeur ouvert, Mistral AI choisit une architecture alternative

Pour développer une version 7B de son modèle Codestral, Mistral AI n'a pas utilisé de…

20 heures ago

Microsoft x Inflection AI : l’autorité de la concurrence britannique lance son enquête

L’Autorité de la concurrence et des marchés (CMA) britannique ouvre une enquête sur les conditions…

22 heures ago

Thomas Gourand, nouveau Directeur Général de Snowflake en France

Thomas Gourand est nommé Directeur Général pour la France. Il est chargé du développement de…

1 jour ago

Accord Microsoft-CISPE : comment Google a tenté la dissuasion

Pour dissuader le CISPE d'un accord avec Microsoft, Google aurait mis près de 500 M€…

1 jour ago

Vers des mises à jour cumulatives intermédiaires pour Windows

Pour réduire la taille des mises à jour de Windows, Microsoft va mettre en place…

1 jour ago