La GenAI s'affirme dans les stratégies data
Publié par Clément Bohic le - mis à jour à
De la finance au retail, le Tech Show Paris a donné à voir dans quelle mesure les stratégies data englobent l'IA générative et s'en nourrissent.
Du point de vue d'un directeur data, qu'est-ce que l'IA générative ?
Pour Arnaud Grojean, chief data & analytics officer de Carrefour, c'est "un nouveau type de données qu'on va devoir mettre sous gouvernance de façon aussi forte que ce qu'on a fait pour les données structurées". Hugo Hamad, directeur de l'IA chez Decathlon Digital, lui fait écho : "L'aspect gouvernance prend d'autant plus d'importance qu'on attaque des IA évoluées. On parle de datas très variées." "On a besoin d'une gouvernance embarquée sur toute la chaîne de valeur, poursuit l'intéressé. Et automatisée sur le travail des métriques, la levée des alertes, le monitoring, voire, très prochainement, la documentation."
Jusqu'à l'an dernier, la data chez Decathlon était une organisation centrale au service de tous les domaines du digital. Début 2024, un modèle fédéré fut mis en place. "On a dispatché les équipes advanced analytics dans les domaines métiers, explique Hugo Hamad. En central, on met en place l'organisation, les pratiques, les process. Les domaines les appliquent." Le modèle théorique est parfois difficilement applicable dans l'aspect opérationnel, admet-il. Parfois pour des questions budgétaires. Il faudrait, dans l'absolu, recruter beaucoup de profils (data managers, data advisors, data stewards, data owners...). Mais souvent, les domaines dépriorisent ces recrutements : "On va dire au product manager que c'est à lui de prendre l'ownership sur la data ; [...] au data analyst [...] de développer les dashboards d'analyse", etc.
Bpifrance a aussi opté pour une gouvernance fédérée. Son data office central, composé de trois équipes principales (qualité & gouvernance, data design, normes & réglementaire) anime une communauté dont les membres - une centaine - sont issus des métiers. Même approche pour La Banque Postale : la direction data groupe centrale pose des cadres de gouvernance répercutés dans les directions data des métiers. Chez Intermarché, c'est le groupement Les Mousquetaires qui donne les lignes directrices que s'approprient ensuite les entités. Un système qui permet aux unes de bénéficier du savoir-faire d'autres possiblement plus matures, explique Khalil El Mahrsi, head of data science & analytics. "On ne peut pas se positionner en central à la place des compétences métiers", ajoute Julien Tournier, responsable du data management du Crédit Agricole - lequel revendique une "organisation très décentralisée" donnant une "grande autonomie" aux métiers.
La GenAI, des prix du jambon à la CSRD
Arnaud Grojean le souligne : l'IA générative, c'est aussi des opportunités sur la gouvernance de la data. "Pléthore de solutions nous promettent qu'on va pouvoir parler avec la donnée en langage naturel, faire du text-to-SQL ou s'affranchir de faire un data catalog très structuré", note-t-il. Non sans tempérer : "Pour avoir exploré un peu tout ça dans notre contexte, on a du mal à passer les choses à l'échelle. C'est peut-être lié au fait qu'on a un modèle de données complexe, très hétérogène. Pour sortir le chiffre d'affaires d'un magasin sur une journée, c'est une requête SQL qui fait déjà plusieurs centaines de lignes." Pour autant, Carrefour a des cas d'application concrets où la GenAI améliore la qualité des données. Par exemple au niveau des référentiels produits. "Les informations qui arrivent des fournisseurs sont souvent incomplètes, voire fausses", constate Arnaud Grojean. Il poursuit : "On travaille aussi sur le lien entre produits pour assurer la cohérence des prix. Quand on modifie le prix du jambon par 2 [tranches], il faut aussi qu'on modifie le prix du jambon par 4. Ce lien, quand vous le faites avec un modèle de machine learning classique, ça marche bien. Avec un LLM, ça marche beaucoup mieux."
Du côté de Bpifrance, on a développé des cas sur la GED, pour faciliter la recherche de documents. "On travaille aussi sur des données non structurées, chose qu'on ne faisait pas forcément avant, affirme Minh Girey, CDO. Avec la CSRD, c'est utile : on reçoit plein de questionnaires sur pratiquement les mêmes thématiques, mais qu'il faut interpréter."
"On a très vite eu la confiance du Comex, qui nous a [invité à tester la GenAI] début 2023, avance Minh Girey. Bien sûr dans un cadre défini, mais on a eu tout de suite l'occasion d'avoir quelques licences Copilot." Bpifrance en a aujourd'hui 300, dispersées dans les métiers. Une ideation factory fait remonter les idées des collaborateurs jusqu'au Comex par un processus fast track (filtrage juridique, éthique et de conformité). Le dispositif a permis une centaine de PoC. "On a mis en avant les cas d'usage qui vont permettre d'agir sur notre stratégie. On a notamment des ambitions de doublement de l'accompagnement de nos entrepreneurs. Nos chargés d'affaires ont des chatbots pour répondre aux questions plus rapidement et de manière plus pertinente."
Une autre approche du recrutement et de la formation
Bpifrance utilise aussi du LLM pour harmoniser son dictionnaire de données. Ses développeurs ont tous GitHub Copilot. Avec cet outil, "on peut beaucoup plus recruter des jeunes diplômés, qui seront mieux structurés dans leurs démarches", glisse Minh Girey.
La Banque Postale a également développé des initiatives dans le domaine du "personnel augmenté par chatbot", notamment autour de l'information sur les contrats d'assurance et de la réponse aux e-mails de réclamation. Au global, une cinquantaine de cas d'usage sont remontés, sélectionnés en fonction de leur valeur, mais aussi de la disponibilité d'un corpus documentaire... qui parfois relève un tant soit peu du domaine public, pour éviter le traitement de données bancaires sensibles. "On a appris à filtrer beaucoup plus les cas d'usage, résume Clémence Panet-Amaro, directrice data épargne et assurances. Là où il y a plusieurs années, on était dans un mode PoC excessif avec toutes les données qu'on trouvait, on est aujourd'hui beaucoup plus pragmatique." La réglementation (connaissance client, devoir de conseil...) a permis aux banques de disposer d'un asset de données bien organisé et de bonne qualité, ajoute-t-elle en précisant que pour ces entreprises, "la marche à franchir pour être en conformité avec l'AI Act n'est peut-être pas si énorme"...
Julien Tournier n'en dit pas moins. Le Crédit Agricole recense 70 cas d'usage à différents stades d'instructions mais tous voués à un déploiement industriel. Sur la production des documentations réglementaires, c'est 90 % d'efficacité de gagnée, selon Julien Tournier. Sur le développement d'applications, une réduction d'au moins un tiers du temps et des efforts consacrés. Sur la détection des événements clients, "on arrive à anticiper avec 6 mois d'avance, chose qu'on faisait très difficilement il y a quelques années." Quant à l'assistance du personnel à renfort d'IA, elle évite l'impact de la formation longue durée, qui a un coût important pour l'entreprise en plus de se diluer rapidement ("On a à peine le temps d'avoir le bénéfice [du] temps de formation [que les salariés] sont propulsés dans d'autres rôles.").
La GenAI est aussi, pour certains, le moyen de "s'upgrader", pour reprendre le terme qu'emploie Frédéric Lenoir. L'ancien directeur de la stratégie innovation de Natixis Interépargne prend l'exemple des conseillers qui ont l'habitude de l'oral et des freins vis-à-vis de l'écrit.
De la prudence sur les usages externes
Carrefour aussi utilise Copilot pour le code. "On voit les gains que ça peut amener, y compris pour les data scientists", clame Arnaud Grojean. Pour ce qui est des usages externes, la prudence est de mise. "Certains sujets nécessitent un an et demi d'innovation, assure Hugo Hamad. C'est plus simple de traiter des sujets internes qui ne vont pas [toucher le client]."
Au Crédit Agricole, on est plus catégorique. "À date, il existe des risques non maîtrisables en l'état de l'art. Pour l'instant, on n'expose donc pas de la GenAI directement au client", résume Julien Tournier. Son collègue Aldrick Zappellini, CDO groupe, est sur la même ligne : "En l'état, ces systèmes sont dans l'assistance au collaborateur. Sur certaines hallucinations, il y a un risque d'images très important non compatible avec notre rôle de tiers de confiance." Ce en dépit du RAG et des mécanismes d'évaluation mis en place ("On essaye d'avoir des bases de vérité qui permettent d'évaluer les hallucinations sur des échantillons statistiquement représentatifs").
Auchan Retail ne met pas non plus ses clients directement en lien avec ces IA. Utilisées dans les call centers, elles sont corrélées à un turnover réduit de l'ordre de 5 %, a constaté le groupe. Elles ont aussi posé des problèmes, par exemple de propriété intellectuelle. "On a exploré la possibilité de mettre en place des photos de produits générées par IA, explique le CIO Samir Amellal. Au-delà du fait que nos experts ne sont pas forcément convaincus du réalisme [...], il est compliqué pour nous de produire des images qui reproduisent les marques dont on n'est pas propriétaire."
L'IA "traditionnelle", remplacée... parfois
"On a des solutions qui nous permettent d'améliorer l'expérience en magasin, et pas aussi directement qu'on pourrait le croire", poursuit-il. Illustration avec les promotions. "On doit quelquefois gérer des règles de (non-)cumulabilité, d'inclusion et d'exclusion... Parfois, on n'a pas forcément documenté nos outils et nos processus [nous sont] très obscurs. Grâce à l'IA et à d'autres dispositifs comme le process mining, on a pu faire du reverse engineering de ces process pour les comprendre, les simplifier et proposer des expériences de promotions plus intelligibles." Réinterpréter manuellement le processus de promotion aurait pris un an, estime Samir Amellal. Un temps presque divisé par deux dans la pratique.
L'IA générative n'est évidemment pas présente dans tous les cas d'usage d'Auchan Retail. Le RAO réapprovisionnement par ordinateur se fonde sur des systèmes de type prédictif basés sur des LTSM, réseaux de neurones inspirés de l'économétrie classique. Dans les magasins autonomes, la vision par ordinateur est expérimentée pour l'assortiment produit. "Cela nous permettra, à l'avenir, d'aider le client en proposant, via son device, de trouver un produit plus facilement parce qu'on sait où il se trouve. [On pourra aussi] savoir s'il est en rupture grâce aux caméras de surveillance [une tous les 1,6 m², NDLR] et à celles des périphériques utilisés par nos collaborateurs."
La GenAI a parfois relancé des cas d'usage que l'IA "traditionnelle" n'avait pas satisfaits. Chez Intermarché, ce fut le cas de l'extraction d'informations sur les packagings à plat (photos de toutes les faces d'un emballage). "C'est une source pour adresser des problèmes de qualité des données, [car] on a des référentiels avec pas mal de saisies manuelles, et une partie vient des fournisseurs, déclare Khalil El Mahrsi. La complexité technique nous avait fait abandonner le sujet. On l'a repris avec un mix d'algos à l'ancienne et de ChatGPT & Cie. On constate maintenant tous les usages que ça peut servir. Par exemple, il est facile d'y ajouter une brique pour faire des opérations de relift (transformation d'un packaging afin de refléter une nouvelle identité)."
Illustration principale © your123 - Adobe Stock