Sortie de bêta actée pour Dataset Search.
Google exploite depuis septembre 2018 ce moteur de recherche d’ensembles de données. Il affirme y avoir fédéré « des centaines de milliers » d’utilisateurs.
Chercheurs, journalistes et data scientists composent pour partie ce public.
L’outil leur permet de trouver un large spectre de contenus (fichiers CSV, collections de tableaux, éléments relatifs au machine learning (comme les paramètres d’entraînement ou les définitions de la structure d’un réseau de neurones, etc.)… pour peu qu’ils soient correctement balisés.
Google base sa découverte de données sur le balisage de schema.org et sur des structures équivalentes représentées au format DCAT (Data Catalog Vocabulary). Il envisage de proposer, en complément, un programme expérimental pour les données structurées basées sur CSVW (CSV on the Web).
Les fournisseurs des ensembles de données doivent, au minimum :
Les autres propriétés sont recommandées. Parmi elles :
Côté utilisateur, le moteur permet de filtrer les résultats par :
À l’occasion de la sortie de bêta, Google annonce la disponibilité d’une version mobile. Ainsi que d’une vue en carte pour les données géographiques.
Le groupe américain déclare travailler sur des fonctions qui lui permettront de mieux comprendre l’utilisation des ensembles de données.
Photo d’illustration via Shutterstock.com
Pour développer une version 7B de son modèle Codestral, Mistral AI n'a pas utilisé de…
L’Autorité de la concurrence et des marchés (CMA) britannique ouvre une enquête sur les conditions…
Thomas Gourand est nommé Directeur Général pour la France. Il est chargé du développement de…
Pour dissuader le CISPE d'un accord avec Microsoft, Google aurait mis près de 500 M€…
Pour réduire la taille des mises à jour de Windows, Microsoft va mettre en place…
De l'organisation administrative à la construction budgétaire, la Cour des comptes pointe le fonctionnement complexe…