Deepmind teste la confrontation et la collaboration des IA

Deepmind, la filiale de Google, a intégré des intelligences artificielles dans des jeux. L'objectif est de voir si elles coopèrent ou se battent.

Publié par Jacques Cheminat le 12 févr. 2017 | Mis à jour le 31 déc. 2021 à 13:26

Lecture
3 min

Imprimer

La question du dilemme est importante dans le domaine de l'intelligence artificielle. Dans une situation donnée, quelle sera le comportement d'une ou plusieurs IA, l'affrontement ou la collaboration ? Deepmind, filiale de Google, s'est penché sur cette question à travers plusieurs tests. Il vient d'en livrer les résultats dans une étude nommée, « Multi-agent reinforcement learning in sequential social dilemnas »

Une IA agressive sans réflexion

Dans leur démonstration, les équipes de Deepmind ont intégré des IA dans deux jeux vidéo. Le premier se nomme « Gathering » où les deux joueurs doivent récolter des pommes depuis un pilier central. Chacun dispose d'un pistolet laser pouvant être utilisé pour éliminer temporairement l'autre joueur et en profité pour récupérer plus de pommes.

Le résultat est sans équivoque : quand le nombre de pommes est en abondance, les IA n'ont pas utilisé leur pistolet laser. Par contre en face d'une pénurie de pommes, les IA se sont neutralisés pour essayer d'en gagner plus. Ce test permet de confronter les IA au fameux dilemme du prisonnier. Celui-ci a été théorisé par Albert Tucker à Princeton en 1950 et définit « une situation où deux joueurs auraient intérêt à coopérer, mais où, en l'absence de communication entre les deux joueurs, chacun choisira de trahir l'autre si le jeu n'est joué qu'une fois ». Deepmind a poussé le test plus loin en modifiant les IA avec une plus puissante et l'autre moins performante. Résultat, la première a choisi d'être plus agressive contre sa concurrente sans se soucier du niveau de pommes disponibles.

Pour les chercheurs, cette technique plus combattive n'est pas nécessairement « la meilleure stratégie ». Ils émettent l'hypothèse que pour l'IA plus avancée le fait de tirer au pistolet laser était « plus stimulant » sur le plan informatique. En effet, l'agent doit pointer son arme vers le joueur et suivre son mouvement, ce qui demande plus de calcul, mais fait perdre du temps pour ramasser des pommes.

Une IA collaborative dans un contexte de meute

L'autre jeu se dénomme « Wolfpack », la meute de loups où les joueurs doivent chasser une proie dans un environnement avec des obstacles. Quand la proie est capturée, l'heureux chasseur gagne des points, mais aussi ceux qui sont à proximité. Résultat : plus les IA sont habiles et performantes, plus elles coopèrent avec d'autres joueurs. Les chercheurs expliquent cette coopération de la même façon que précédemment avec Gathering. L'IA est « stimulée » sur le plan du calcul dans son apprentissage pour collaborer afin de traquer et capturer la proie.

In fine, les experts constatent que le comportement des IA évolue en fonction du contexte et du stimulus informatique. Si les règles du jeu récompensent les réactions agressives, elles seront plus combatives. A l'inverse quand les règles impliquent une collaboration pour gagner des points, les IA sont capables de s'allier. Il est donc impératif pour les spécialistes de Deepmind d'installer les bonnes règles dès le départ.

DNC : DeepMind rajoute les souvenirs à son intelligence artificielle

Deepmind de Google veut en découdre avec StarCraft

Photo credit: Vermin Inc via VisualHunt / CC BY-NC-SA

Publié par :
Jacques Cheminat

Tags associés :

sponsorisé

Gestion de crises : les leçons d’un DSI

Gestion de crises : les leçons d’un DSI17:35

SNCF Connect & Tech explore toutes les voies de la rés…23:13

D'une mine à la supply chain, de l'OT à l’industrie 4.…22:33

Champs d'application et exigences NIS220:52

Retour d'expérience : mise en œuvre des exigences par…20:42

Comment simplifier la sécurisation de votre réseau tou…20:23

Sécurité renforcée : comment préparer la conformité à…20:56

Le savoir-faire règlementaire international de Cloudfl…20:32

Se protéger et remédier aux Attaques de Messagerie : U…21:48

[Episode en public] Les leçons de résilience d’OVH29:04

[Énergie] La résilience du réseau et sa mesure d'impact19:43

SASE : La fusion du SD-WAN et du SSE décryptée07:42

Quand la cyber-résilience investit l’espace16:31

Sécurité Multicouche : La clé pour une entreprise rési…16:11

Remettre l’humain au centre du cyber-espace16:55

L’IA, super-pouvoir du cyberespace09:39

Les enjeux de sécurité des médias internationaux de la…14:32

L’IA, un atout pour une continuité de service public p…16:50

Une cyber-résilience à l’aune de l’IA et des régulatio…19:25

Tous les Internets se valent-ils ?10:59

Decathlon : une culture agile à l’international20:08

Comment Carrefour a transformé la crise sanitaire en t…12:48

Comment Groupama s’assure d’être résilient face aux cr…13:48

Comment impulser une culture data dans une grande entr…14:17

Hors-série : La data du futur (Volume 1)08:28

Cegid : la tête dans le Cloud22:16

Hors-série : La data du futur (Volume 2)07:30

La data au service des verres intelligents chez Essilo…09:42

La vision conseil de Deloitte sur la data et l’IA19:04

Data altruisme et IA responsable au Crédit Mutuel Arkéa11:54

[BONUS] La Data Responsable : une vision écologique23:08

Silicon.fr L'actualité informatique et high-tech pour décideurs IT

Deepmind teste la confrontation et la collaboration des IA

Une IA agressive sans réflexion

Une IA collaborative dans un contexte de meute

Photo credit: Vermin Inc via VisualHunt / CC BY-NC-SA

Cloud et logiciels : le poids économique de la dépendance aux USA

VMware relance une version gratuite d'ESXi

Google Cloud Next '25 : l'inférence, maître mot des annonces infra

Health Data Hub : le gouvernement promet un appel d'offres pour [...]

"Nous avons quitté le cloud" : S3, ultime étape d'un retour sur site

S’abonner

Briser les barrières de la sécurité en entreprise

The Forrester Wave™: Cloud Workload Security, Q1 2024

Moderniser vos postes de travail grâce à [...]

Il y a des phrases qu’on ne veut plus entendre… [...]

Le grand dîner de Gala de la Communauté

La Matinale Silicon - Zéro Trust

La MasterClass Silicon - NIS2

Silicon.fr L'actualité informatique et high-tech pour décideurs IT

Une IA agressive sans réflexion

Une IA collaborative dans un contexte de meute

Photo credit: Vermin Inc via VisualHunt / CC BY-NC-SA

S’abonner

Partager l'épisode