Pour gérer vos consentements :

Dataset Search : le nouveau moteur de Google pour les données

Dans le but de faciliter l’accès aux données, Google a lancé un nouveau moteur de recherche répondant au nom de Dataset Search.

Des quantités massives de données existent d’ores et déjà. Seul problème : elles ne sont pas systématiquement présentées dans un format facile à analyser pour les moteurs de recherche.

Des metatags pour faciliter la recherche

L’objectif de la filiale d’Alphabet est de rendre toutes ces informations plus accessibles aux scientifiques, journalistes et autres utilisateurs friands de données. Qu’il s’agisse de satisfaire sa curiosité intellectuelle ou bien d’exploiter ces données pour son travail, Dataset Search doit devenir l’outil de référence en la matière.

A cet effet, la firme de Mountain View fournit des directives aux fournisseurs de jeux de données afin qu’ils décrivent systématiquement leurs données de manière à ce qu’elles soient facilement identifiables par Dataset Search.

Il est ainsi recommandé d’inclure des balises de métadonnées dans les pages Web qui décrivent les données, avec pour informations ceux qui les ont créées, quand elles ont été publiées, comment les données ont été collectées…

Ces informations seront ensuite indexées par le moteur de recherche de Google et combinées avec des informations issues du graphe de connaissances (knowledge graph).

Recours au standard schema.org

L’approche de Google en matière est basée sur le standard ouvert schema.org pour décrire ces informations.

Google incite à utiliser ce système pour décrire les bases de données, comme l’indique le groupe dans un billet de blog : « Quiconque publie des données peut décrire son ensemble de données de cette manière. Nous encourageons les fournisseurs de jeux de données, grands et petits, à adopter cette norme commune afin que tous les ensembles de données fassent partie de cet écosystème robuste. »

Google lance initialement la recherche de données avec du contenu de la NASA, de la NOAA (National Oceanic and Atmospheric Administration), de Harvard Dataverse et du consortium inter-universitaire pour la recherche politique et sociale (ICPSR), entre autres collections universitaires.

Dataset Search devient ainsi le nouveau moteur de recherche de Google spécialisé dans un domaine, rejoignant, entre autres, Google Scholar, Google Books et Google Patents.

(Crédit photo : @Google)

Recent Posts

L’Autorité de la concurrence va-t-elle inculper NVIDIA ?

L'Autorité de la concurrence s'apprêterait à inculper NVIDIA pour des pratiques anticoncurrentielles sur le marché…

1 heure ago

Failles sur les équipements de sécurité : le retex du CERT-FR

Le CERT-FR revient sur les failles dans équipements de sécurité présents notamment en bordure de…

19 heures ago

Silo AI, point d’ancrage européen pour Mistral AI

Mistral AI formalise ses travaux communs avec l'entreprise finlandaise Silo AI, qui publie elle aussi…

22 heures ago

Véronique Torner – Numeum : « Il faut que le numérique bénéficie d’un environnement propice à l’innovation et à la compétitivité»

La présidente de Numeum, Véronique Torner, revient sur la genèse de la tribune du collectif…

23 heures ago

Microsoft x OpenAI : pas de prise de contrôle selon l’UE

Après avoir mené son enquête, la Commission européenne considère qu'il n'y a pas de prise de…

24 heures ago

Atos : les grands axes de l’accord avec les créanciers

Les banques et les créanciers obligataires d'Atos ont trouvé un accord pour restructurer la dette…

1 jour ago