Pour gérer vos consentements :
Categories: CloudSaaS

Document AI : Google Cloud pose un support aux démarches big data

Google accentue sa communication au sujet de Document AI. Sous cette bannière, le groupe américain entend favoriser l’exploitation des données non structurées. Pour cela, il met à contribution plusieurs des outils algorithmiques hébergés sur son cloud.

Dans l’absolu, Document AI n’est pas nouveau. Sa présentation remonte à la Cloud Next ’19. Le contenu de l’offre a toutefois récemment évolué, avec le passage de l’API en v1beta3. Et l’élargissement du catalogue de « processeurs » (outils de traitement) sur lesquels elle se fonde.

Deux de ces processeurs, qualifiés de « génériques », sont en accès public. L’un met en œuvre l’OCR (sur une cinquantaine de langues en manuscrit ; 200 en tapuscrit). L’autre permet de traiter des formulaires.

L’accès aux autres processeurs se fait pour le moment sur demande. Parmi eux, un générique (scission de documents) et deux catégories de « spécifiques », dédiés respectivement à la gestion des emprunts et de la facturation.

Dans ces deux domaines, l’essentiel des documents pris en charge concernent les États-Unis. De manière plus générale, l’anglais est la seule langue que traite actuellement Document AI. Sauf pour l’OCR, donc (fonctionnalité qu’on peut tester ici avec des PDF de 5 pages maximum ; le fichier que nous avons téléversé comprenait des noms, des numéros de téléphone et des adresses postales et électroniques, correctement détectés).

Il est d’autant plus difficile d’interpréter la tarification du service que Google Cloud fait la jonction avec d’autres de ses produits. Par exemple les API Vision et Natural Language, ainsi que le portefeuille AutoML. Ce dernier ouvre la porte à la classification de documents ou encore à l’extraction d’entités.

Les traitements s’effectuent par défaut dans une région Google Cloud aux États-Unis. Il est toutefois possible de basculer vers l’Union européenne.

Photo d’illustration © Jirapong – stock.adobe.com

Recent Posts

Pour son premier LLM codeur ouvert, Mistral AI choisit une architecture alternative

Pour développer une version 7B de son modèle Codestral, Mistral AI n'a pas utilisé de…

2 heures ago

Microsoft x Inflection AI : l’autorité de la concurrence britannique lance son enquête

L’Autorité de la concurrence et des marchés (CMA) britannique ouvre une enquête sur les conditions…

5 heures ago

Thomas Gourand, nouveau Directeur Général de Snowflake en France

Thomas Gourand est nommé Directeur Général pour la France. Il est chargé du développement de…

7 heures ago

Accord Microsoft-CISPE : comment Google a tenté la dissuasion

Pour dissuader le CISPE d'un accord avec Microsoft, Google aurait mis près de 500 M€…

7 heures ago

Vers des mises à jour cumulatives intermédiaires pour Windows

Pour réduire la taille des mises à jour de Windows, Microsoft va mettre en place…

7 heures ago

RH, finances, stratégie… Les complexités de la Dinum

De l'organisation administrative à la construction budgétaire, la Cour des comptes pointe le fonctionnement complexe…

1 jour ago