Après les échecs ou le Go : l'IA bat les champions de poker

Une IA dénommée Libratus est parvenue à défaire quatre champions de poker. Une première dans un jeu qui fait intervenir des stratégies à long terme, basées sur la théorie des jeux.

Publié par La rédaction le 1 févr. 2017 | Mis à jour le 28 déc. 2021 à 09:27

Lecture
3 min

Imprimer

Après 20 jours d'affrontements dans un casino de Pittsburgh, une intelligence artificielle (IA) construite par des chercheurs de l'université Carnegie Mellon a officiellement battu quatre joueurs de poker au top niveau mondial. Le cadre du duel entre les hommes et la machine ? Une règle du jeu appelée le Texas Hold 'Em no limit, une forme de poker particulièrement complexe où le succès repose largement sur des paris à long terme, basés sur la théorie des jeux.

Après la supériorité de l'IA sur l'homme au dames, aux échecs, au scrabble, au jeu télévisé Jeopardy! et, tout récemment, au jeu de Go, c'est une nouvelle étape franchie par la machine. Aucun logiciel n'était en effet encore parvenu à prendre le meilleur sur des joueurs au top niveau mondial dans un jeu aussi exigeant que le Texas Hold 'Em, où certaines informations (les cartes retournées sur la table) restent masquées. Un jeu qui requiert une part d'intuition, car il faut aussi deviner les choix de l'adversaire. « La capacité de la meilleure IA à effectuer des raisonnements stratégiques à partir d'une information imparfaite dépasse désormais celle des humains les plus doués en la matière », résume Tuomas Sandholm (au centre le photo ci-dessus), professeur de Carnegie Mellon qui, avec l'aide de son assistant Noam Brown, a conçu l'IA championne de poker.

Libratus corrige ses erreurs

Appelée Libratus (soit 'équilibrer' en latin), l'IA des deux chercheurs dernière a totalisé environ 1,9 million de dollars de gains sur les 20 jours de tournoi, là où ses quatre adversaires humains, qu'elle a affronté en duel dans des parties simultanées, ont tous terminé dans le rouge. Il y a deux ans de cela, Tuomas Sandholm et Noam Brown avaient déjà défié des joueurs de poker de haut niveau. Et leur IA s'était alors inclinée.

Selon les champions de Texas Hold 'Em qui ont affronté Libratus, cette IA a la capacité à équilibrer différentes stratégies, bluffer, miser petit avec une bonne main, modifier sa mise pour désorienter les adversaires, etc. « Il répartit ses mises en trois, quatre, cinq différentes tailles. Aucun humain ne peut faire cela », explique dans les colonnes de Wired Daniel McAulay, un des joueurs ayant affronté la machine.

Pour l'instant, les deux chercheurs n'ont pas révélé comment fonctionnait Libratus, mais ont promis de livrer des détails dans les jours qui viennent. Les quatre adversaires de l'IA - Dong Kim, Jason Les, Jimmy Chou et Daniel McAulay - expliquent que la machine a été modifiée d'un jour sur l'autre, notamment afin de combler les failles qu'ils découvraient dans la stratégie de Libratus. Ce que confirment les chercheurs. « Après chaque jour de jeu, un méta-algorithme a analysé les failles que les joueurs pros avaient identifiées et exploitées dans la stratégie de Libratus », détaille Sandholm. « Il a ensuite priorisé ces failles et un algorithme a comblé les trois principales en utilisant le supercalculateur chaque nuit (qui faisait fonctionner Libratus dans la journée, NDLR). C'est une approche très différente de la façon dont l'apprentissage a été utilisé dans le passé pour le poker. Typiquement, les chercheurs développent plutôt des algorithmes qui tentent d'exploiter les faiblesses de l'adversaire ». Là où Libratus essaie avant tout de corriger les siennes.

IA : on ne joue plus. ou alors à se faire peur

Publié par :
La rédaction

Tags associés :

sponsorisé

Gestion de crises : les leçons d’un DSI

Gestion de crises : les leçons d’un DSI17:35

SNCF Connect & Tech explore toutes les voies de la rés…23:13

D'une mine à la supply chain, de l'OT à l’industrie 4.…22:33

Champs d'application et exigences NIS220:52

Retour d'expérience : mise en œuvre des exigences par…20:42

Comment simplifier la sécurisation de votre réseau tou…20:23

Sécurité renforcée : comment préparer la conformité à…20:56

Le savoir-faire règlementaire international de Cloudfl…20:32

Se protéger et remédier aux Attaques de Messagerie : U…21:48

[Episode en public] Les leçons de résilience d’OVH29:04

[Énergie] La résilience du réseau et sa mesure d'impact19:43

SASE : La fusion du SD-WAN et du SSE décryptée07:42

Quand la cyber-résilience investit l’espace16:31

Sécurité Multicouche : La clé pour une entreprise rési…16:11

Remettre l’humain au centre du cyber-espace16:55

L’IA, super-pouvoir du cyberespace09:39

Les enjeux de sécurité des médias internationaux de la…14:32

L’IA, un atout pour une continuité de service public p…16:50

Une cyber-résilience à l’aune de l’IA et des régulatio…19:25

Tous les Internets se valent-ils ?10:59

Decathlon : une culture agile à l’international20:08

Comment Carrefour a transformé la crise sanitaire en t…12:48

Comment Groupama s’assure d’être résilient face aux cr…13:48

Comment impulser une culture data dans une grande entr…14:17

Hors-série : La data du futur (Volume 1)08:28

Cegid : la tête dans le Cloud22:16

Hors-série : La data du futur (Volume 2)07:30

La data au service des verres intelligents chez Essilo…09:42

La vision conseil de Deloitte sur la data et l’IA19:04

Data altruisme et IA responsable au Crédit Mutuel Arkéa11:54

[BONUS] La Data Responsable : une vision écologique23:08

Silicon.fr L'actualité informatique et high-tech pour décideurs IT

Après les échecs ou le Go : l'IA bat les champions de poker

Libratus corrige ses erreurs

Agents IA : une taxonomie des protocoles au-delà de MCP

Databricks viserait Neon : vers une autre acquisition OLTP [...]

Trois cas d'usage de l'IA à la Cour de cassation

Chatbot Arena : la remise en cause d'un benchmark IA référent

Process mining : l'automatisation est de moins en moins une option

S’abonner

FFTO : Fiber To The Office ou la haute disponibilité [...]

L'UHD et la Transformation Numérique : Répondre aux [...]

Le grand dîner de Gala de la Communauté

La Matinale Silicon - Zéro Trust

La MasterClass Silicon - NIS2

Silicon.fr L'actualité informatique et high-tech pour décideurs IT

Libratus corrige ses erreurs

S’abonner

Partager l'épisode