Google accentue sa communication au sujet de Document AI. Sous cette bannière, le groupe américain entend favoriser l’exploitation des données non structurées. Pour cela, il met à contribution plusieurs des outils algorithmiques hébergés sur son cloud.
Dans l’absolu, Document AI n’est pas nouveau. Sa présentation remonte à la Cloud Next ’19. Le contenu de l’offre a toutefois récemment évolué, avec le passage de l’API en v1beta3. Et l’élargissement du catalogue de « processeurs » (outils de traitement) sur lesquels elle se fonde.
Deux de ces processeurs, qualifiés de « génériques », sont en accès public. L’un met en œuvre l’OCR (sur une cinquantaine de langues en manuscrit ; 200 en tapuscrit). L’autre permet de traiter des formulaires.
L’accès aux autres processeurs se fait pour le moment sur demande. Parmi eux, un générique (scission de documents) et deux catégories de « spécifiques », dédiés respectivement à la gestion des emprunts et de la facturation.
Dans ces deux domaines, l’essentiel des documents pris en charge concernent les États-Unis. De manière plus générale, l’anglais est la seule langue que traite actuellement Document AI. Sauf pour l’OCR, donc (fonctionnalité qu’on peut tester ici avec des PDF de 5 pages maximum ; le fichier que nous avons téléversé comprenait des noms, des numéros de téléphone et des adresses postales et électroniques, correctement détectés).
Il est d’autant plus difficile d’interpréter la tarification du service que Google Cloud fait la jonction avec d’autres de ses produits. Par exemple les API Vision et Natural Language, ainsi que le portefeuille AutoML. Ce dernier ouvre la porte à la classification de documents ou encore à l’extraction d’entités.
Les traitements s’effectuent par défaut dans une région Google Cloud aux États-Unis. Il est toutefois possible de basculer vers l’Union européenne.
Photo d’illustration © Jirapong – stock.adobe.com
Pour développer une version 7B de son modèle Codestral, Mistral AI n'a pas utilisé de…
L’Autorité de la concurrence et des marchés (CMA) britannique ouvre une enquête sur les conditions…
Thomas Gourand est nommé Directeur Général pour la France. Il est chargé du développement de…
Pour dissuader le CISPE d'un accord avec Microsoft, Google aurait mis près de 500 M€…
Pour réduire la taille des mises à jour de Windows, Microsoft va mettre en place…
De l'organisation administrative à la construction budgétaire, la Cour des comptes pointe le fonctionnement complexe…