IA : Apple croit à l'apprentissage par renforcement

Le responsable de l'IA chez Apple pousse les travaux dans l'apprentissage par renforcement au sein de la firme. Et entraîne un algorithme à se souvenir des labyrinthes du jeu vidéo Doom.

Publié par Jacques Cheminat le 29 mars 2017 | Mis à jour le 2 mars 2021 à 15:00

Lecture
3 min

Imprimer

Se souvenir comme un humain est un enjeu crucial pour le développement de l'intelligence artificielle. C'est la thèse avancée par Ruslan Salakhutdinov, directeur de recherche sur l'IA chez Apple. Lors d'une conférence organisée par la revue technologique du MIT, il a donné quelques indications sur les travaux menés par la firme de Cupertino dans le domaine de l'intelligence artificielle.

Focus sur l'apprentissage par renforcement

Dans son discours, le chercheur, qui a rejoint Apple en octobre dernier, se focalise sur un type d'IA connu sous le vocable de 'reinforcement learning' ou apprentissage par renforcement. Celle-ci « fait référence à une classe de problèmes d'apprentissage automatique, dont le but est d'apprendre, à partir d'expériences, ce qu'il convient de faire en différentes situations, de façon à optimiser une récompense quantitative au cours du temps », peut-on lire sur Wikipedia. Les chercheurs utilisent cette méthode pour apprendre de manière répétitive aux ordinateurs des actions et leur permettre de trouver le meilleur résultat.

Apple n'est pas seul dans ces travaux. Google, par exemple, se sert de l'apprentissage par renforcement pour aider ses ordinateurs à adapter les meilleures configurations de refroidissement et d'exploitation de ses datacenters. L'université de Carnegie Mellon, d'où est issu Ruslan Salakhutdinov, s'appuie aussi sur cette technique pour entraîner des ordinateurs à des anciens jeux comme Doom. Mais, selon le dirigeant d'Apple, « ces systèmes spécialisés dans Doom n'arrivent pas à se souvenir correctement des dispositions des labyrinthes, bloquant ainsi toute planification et construction de stratégies ».

Travaux sur Doom

Une partie des recherches de Ruslan Salakhutdinov porte précisément sur Doom, et vise à créer un logiciel basé sur l'IA capable de mémoriser l'agencement virtuel des labyrinthes et des points de référence pour parvenir à localiser des emplacements spécifiques dans ce shoot'em up, en l'occurrence des tours. Ainsi, pendant le jeu, le logiciel peut détecter une torche rouge ou verte et faire correspondre la couleur de cette torche à celle d'une tour. Au final, le logiciel a appris à naviguer dans les labyrinthes pour atteindre la bonne tour. Si le système se trompe, il repart dans le labyrinthe pour trouver le chemin adéquat. « Ce qui est particulièrement remarquable, c'est qu'il se souvienne de la couleur de la torche à chaque passage d'une tour », s'enthousiasme Ruslan Salakhutdinov.

Mais ce type d'IA nécessite « beaucoup de temps d'entraînement et nécessite des énormes capacités de puissance de calcul. Ce qui rend difficile une industrialisation à grande échelle ». Et d'ajouter : « aujourd'hui, c'est encore très fragile ».

Apprendre plus avec moins

Le spécialiste ne s'arrête pour autant pas uniquement à l'apprentissage par renforcement, il souhaite explorer la capacité d'une IA à apprendre rapidement à partir de « quelques exemples et quelques expériences ». Un moyen pour la firme de Cupertino d'avancer un peu plus vite dans le domaine. Plusieurs analystes pointent du doigt le retard d'Apple dans les technologies d'IA par rapport à Google ou Microsoft. Une des raisons avancées est la politique stricte de confidentialité d'Apple, qui limiterait la quantité de données disponibles pour entraîner les ordinateurs.

Face aux GAFA, France IA pose les jalons de son développement

L'IA DeepMind peut-elle réduire la consommation électrique d'un pays entier ?

Crédit photo : Lightspring-Shutterstock

Publié par :
Jacques Cheminat

Tags associés :

sponsorisé

Gestion de crises : les leçons d’un DSI

Gestion de crises : les leçons d’un DSI17:35

SNCF Connect & Tech explore toutes les voies de la rés…23:13

D'une mine à la supply chain, de l'OT à l’industrie 4.…22:33

Champs d'application et exigences NIS220:52

Retour d'expérience : mise en œuvre des exigences par…20:42

Comment simplifier la sécurisation de votre réseau tou…20:23

Sécurité renforcée : comment préparer la conformité à…20:56

Le savoir-faire règlementaire international de Cloudfl…20:32

Se protéger et remédier aux Attaques de Messagerie : U…21:48

[Episode en public] Les leçons de résilience d’OVH29:04

[Énergie] La résilience du réseau et sa mesure d'impact19:43

SASE : La fusion du SD-WAN et du SSE décryptée07:42

Quand la cyber-résilience investit l’espace16:31

Sécurité Multicouche : La clé pour une entreprise rési…16:11

Remettre l’humain au centre du cyber-espace16:55

L’IA, super-pouvoir du cyberespace09:39

Les enjeux de sécurité des médias internationaux de la…14:32

L’IA, un atout pour une continuité de service public p…16:50

Une cyber-résilience à l’aune de l’IA et des régulatio…19:25

Tous les Internets se valent-ils ?10:59

Decathlon : une culture agile à l’international20:08

Comment Carrefour a transformé la crise sanitaire en t…12:48

Comment Groupama s’assure d’être résilient face aux cr…13:48

Comment impulser une culture data dans une grande entr…14:17

Hors-série : La data du futur (Volume 1)08:28

Cegid : la tête dans le Cloud22:16

Hors-série : La data du futur (Volume 2)07:30

La data au service des verres intelligents chez Essilo…09:42

La vision conseil de Deloitte sur la data et l’IA19:04

Data altruisme et IA responsable au Crédit Mutuel Arkéa11:54

[BONUS] La Data Responsable : une vision écologique23:08

Silicon.fr L'actualité informatique et high-tech pour décideurs IT

IA : Apple croit à l'apprentissage par renforcement

Focus sur l'apprentissage par renforcement

Travaux sur Doom

Apprendre plus avec moins

Crédit photo : Lightspring-Shutterstock

Mainframes z17 : les cartes Spyre, au coeur de la promesse IA d'IBM

De Llama 3 à Llama 4 : ce qui change, ce qui reste

OpenAI va publier un modèle Open-Weight

Les insuffisances de Sesam, SI métier de la DGCCRF

Qu'est-ce que le protocole MCP, qui monte dans l'univers de [...]

S’abonner

La meilleure liste de contrôle de Sécurité du code au cloud

VSP One Block, la simplification de la gestion des [...]

Le grand dîner de Gala de la Communauté

La Matinale Silicon - Zéro Trust

La MasterClass Silicon - NIS2

Silicon.fr L'actualité informatique et high-tech pour décideurs IT

Focus sur l'apprentissage par renforcement

Travaux sur Doom

Apprendre plus avec moins

Crédit photo : Lightspring-Shutterstock

S’abonner

Partager l'épisode