Acme : un boost made in Google pour l’apprentissage par renforcement

Le problème de la mise à l’échelle se pose aussi avec l’apprentissage par renforcement.

DeepMind le rappelle en introduction d’un rapport relatif à Acme.

La filiale de Google a développé cette boîte à outils (framework + bibliothèque logicielle) pour répondre à la complexification des algorithmes dans cette branche de l’IA.

Elle a défini une architecture modulaire censée favoriser l’entraînement distribué.

Dans le cadre de l’apprentissage par renforcement, cette distribution consiste à faire interagir les agents avec de multiples instances des environnements à partir desquels ils génèrent des données.

Une simple réimplémentation n’est pas toujours suffisante pour effectuer ce passage à l’échelle.

L’architecture modulaire qu’Acme met en œuvre face à cette problématique implique une séparation claire entre les fonctions d’acteur (« actor ») et de critique (« learner »). Le premier explore l’environnement et en tire des expériences. Le second apprend de ces expériences et adapte la politique que suit l’acteur.

Cette séparation en processus permet de mener l’apprentissage indépendamment de la capacité de collecte de données, les modules communiquant par appels distants. Elle favorise aussi l’exploitation en offline (apprentissage à partir d’un jeu de données fixe).

La boîte à outils contient des agents « prêts à l’emploi ». DeepMind les présente comme des « implémentations de référence » destinées à tirer parti des algorithmes existants. Il s’agit pour le moment de versions monotâches (non parallélisées).

Illustration principale via shutterstock.com

NextSlack adopte un peu plus AWS »

Previous « Comment le télétravail menace la sécurité des réseaux

Published by

Clément Bohic

Tags: AcmeDeepMind

4 années ago

ChatGPT

Pour son premier LLM codeur ouvert, Mistral AI choisit une architecture alternative

Pour développer une version 7B de son modèle Codestral, Mistral AI n'a pas utilisé de…

2 jours ago

Microsoft x Inflection AI : l’autorité de la concurrence britannique lance son enquête

L’Autorité de la concurrence et des marchés (CMA) britannique ouvre une enquête sur les conditions…

2 jours ago

Acme : un boost made in Google pour l’apprentissage par renforcement

Recent Posts

Les choix d’OpenAI pour GPT-4o mini

Le Réseau interministériel de l’État, sujet à dépendance

Etalab en position de faiblesse au sein de la Dinum

Une Dinum « balbutiante » sur l’open data et les logiciels libres

Pour son premier LLM codeur ouvert, Mistral AI choisit une architecture alternative

Microsoft x Inflection AI : l’autorité de la concurrence britannique lance son enquête

Acme : un boost made in Google pour l’apprentissage par renforcement

Related Post

Recent Posts

Les choix d’OpenAI pour GPT-4o mini

Le Réseau interministériel de l’État, sujet à dépendance

Etalab en position de faiblesse au sein de la Dinum

Une Dinum « balbutiante » sur l’open data et les logiciels libres

Pour son premier LLM codeur ouvert, Mistral AI choisit une architecture alternative

Microsoft x Inflection AI : l’autorité de la concurrence britannique lance son enquête