Silicon.fr L'actualité informatique et high-tech pour décideurs IT

Acme : un boost made in Google pour l'apprentissage par renforcement

Avec le framework Acme, DeepMind (filiale de Google) entend favoriser la mise à l'échelle des modèles d'apprentissage par renforcement.

Publié par Clément Bohic le 5 juin 2020 | Mis à jour le 27 déc. 2021 à 16:17

Lecture
2 min

Imprimer

Le problème de la mise à l'échelle se pose aussi avec l'apprentissage par renforcement.

DeepMind le rappelle en introduction d'un rapport relatif à Acme.

La filiale de Google a développé cette boîte à outils (framework + bibliothèque logicielle) pour répondre à la complexification des algorithmes dans cette branche de l'IA.

Elle a défini une architecture modulaire censée favoriser l'entraînement distribué.

Dans le cadre de l'apprentissage par renforcement, cette distribution consiste à faire interagir les agents avec de multiples instances des environnements à partir desquels ils génèrent des données.

Une simple réimplémentation n'est pas toujours suffisante pour effectuer ce passage à l'échelle.

L'architecture modulaire qu'Acme met en ouvre face à cette problématique implique une séparation claire entre les fonctions d'acteur (« actor ») et de critique (« learner »). Le premier explore l'environnement et en tire des expériences. Le second apprend de ces expériences et adapte la politique que suit l'acteur.

Cette séparation en processus permet de mener l'apprentissage indépendamment de la capacité de collecte de données, les modules communiquant par appels distants. Elle favorise aussi l'exploitation en offline (apprentissage à partir d'un jeu de données fixe).

La boîte à outils contient des agents « prêts à l'emploi ». DeepMind les présente comme des « implémentations de référence » destinées à tirer parti des algorithmes existants. Il s'agit pour le moment de versions monotâches (non parallélisées).

Illustration principale via shutterstock.com

Publié par :
Clément Bohic

Tags associés :

Comment le CISPE propose de décliner le Data Act

Par Clément Bohic le 13 nov. 2024

La GenAI appliquée à la supervision de posture de sécurité : le [...]

Par La rédaction le 13 nov. 2024

Du RAG aux agents, les choix GenAI de Doctolib

Par Clément Bohic le 8 nov. 2024

Le machine learning pour des mots de passe robustes : [...]

Par Clément Bohic le 7 nov. 2024

{ Tribune Expert } - Deux ans de ChatGPT : les prochains [...]

Par Stéphane Distinguin & Diego [...] le 4 nov. 2024

Abonnez-vous à Silicon Magazine !

Recevez le magazine chez vous ou sur votre lieu de travail et accédez à la version numérique à tout moment !

à partir de 120€ par an pour 1 an d'abonnement

J'en profite

Livres Blancs #bigdata

EasyVista

Les enjeux de la supervision du système d’information !

Easyvista a compilé cinq enjeux majeurs de l’observabilité, illustrés par des cas concrets de leurs clients : [...]

Télécharger

Kaspersky

La Threat Intelligence : quand, quoi et comment ?

Comment maximiser les bénéfices de la Threat Intelligence pour votre entreprise. La Threat Intelligence [...]

Télécharger

Thales

Les solutions de gestion des clés de CipherTrust [...]

Les nombreuses collaborations de Thales avec Google accélèrent la capacité des entreprises à migrer les données [...]

Télécharger

Box

Entrez dans l’ère de la collaboration sécurisée et [...]

Découvrez le nouveau livre blanc de Box.

Télécharger

Voir tous les livres blancs

Vos prochains événements

Voir tous les événements

7 novembre 2024

La MasterClass Silicon - NIS2

Organisé par silicon.fr

Inscrivez-vous

4 juillet 2024

La Matinale Silicon : IA & Cybersécurité

Organisé par Silicon

Voir le replay

29 mai 2024

Le grand dîner de gala de la Communauté

Organisé par Silicon

Revivre en images

Voir tous les événements

Inscrivez-vous à la Newsletter pour recevoir les dernières actualités

Abonnez-vous au magazine Silicon et profitez de contenus exclusifs !

Boostez votre expertise professionnelle en accédant aux informations clés de votre domaine.