Une loi de Moore pour l'IA ?

Le progrès algorithmique dans le domaine de l'IA peut-il se résumer sous la forme d'une « loi de Moore » ? Les travaux d'OpenAI alimentent la réflexion.

Publié par Clément Bohic le 6 mai 2020 | Mis à jour le 3 janv. 2022 à 13:36

Lecture
3 min

Imprimer

Existe-t-il, dans le domaine de l'IA, un équivalent à la loi de Moore ? Les travaux d'OpenAI alimentent la réflexion.

L'association, devenue l'an passé entreprise à « but lucratif plafonné », a cerné trois facteurs principaux de développement de l'intelligence artificielle : les données, les ressources de calcul et l'innovation algorithmique.

Elle s'est intéressée à ce dernier, sous un aspect en particulier : l'« efficacité algorithmique ».

Traditionnellement, cette métrique rend compte de la réduction de la puissance de calcul nécessaire pour atteindre une capacité spécifique.

Pour mieux coller à l'apprentissage automatique, où la difficulté des tâches est plus complexe à évaluer, OpenAI a travaillé à performance de calcul constante. Ses démarches se sont limitées à la phase d'entraînement des modèles.

Principal objet de l'étude : la classification d'images, à partir de la base ImageNet.

Constat : entre 2012 et 2020, la puissance de calcul requise pour atteindre un même niveau d'entraînement a été divisée par deux tous les 16 mois.

Cette valeur se fonde sur le différentiel mesuré entre EfficientNet et AlexNet. Le premier nécessite 44 fois moins de ressources pour arriver au même niveau que le second à l'époque*.

Toujours dans la classification d'images, OpenAI a observé une évolution similaire avec ResNet-50 : puissance requise divisée par deux tous les 17 mois.
Les résultats sont comparables pour la phase d'inférence : doublement tous les 15 mois entre AlexNet et Shufflenet ; tous les 13 mois entre ResNet et EfficientNet.

Jeux et traduction

En s'appuyant essentiellement sur des réimplémentations open source (PyTorch notamment), OpenAI a élargi son analyse à d'autres types de tâches. Entre autres, la traduction.

Les progrès y sont nettement plus rapides que pour les tâches liées à la vision.
Illustration avec Transformer, qui a nécessité 61 fois moins de ressources que Seq2Seq pour traduire un texte anglais en français, sur la base du WMT14.

Même tendance dans le domaine des jeux, avec des mesures toutefois faites à plus faible intervalle.

OpenAI perçoit plusieurs explications à ces progrès. Parmi elles, la normalisation des lots, l'exploitation des connexions résiduelles et la capacité à généraliser à partir de faibles échantillons de données.

En toile de fond, un appel aux parties prenantes du développement de l'IA (chercheurs, économistes, régulateurs.) afin qu'ils intègrent davantage, dans leurs arbitrages, la notion de progrès algorithmique, à court comme à long terme.

Dans cet esprit, OpenAI annonce la publication prochaine d'une première série de benchmarks. Et encourage la communauté à lui en transmettre.

* Il y a des limites à la démonstration, reconnaît OpenAI. Mais dans les deux sens.
D'un côté, l'analyse n'a pas tenu compte des éventuels gains liés à la possibilité d'utiliser du calcul à faible précision ou d'utiliser des noyaux GPU optimisés.
De l'autre, AlexNet a été à l'origine entraîné sur 90 cycles. Or, 62 lui suffisent pour atteindre 99,6 % de sa performance finale.

Illustration principale © Natalia Shepeleva - Shutterstock.com

sponsorisé

Gestion de crises : les leçons d’un DSI

Gestion de crises : les leçons d’un DSI17:35

SNCF Connect & Tech explore toutes les voies de la rés…23:13

D'une mine à la supply chain, de l'OT à l’industrie 4.…22:33

Champs d'application et exigences NIS220:52

Retour d'expérience : mise en œuvre des exigences par…20:42

Comment simplifier la sécurisation de votre réseau tou…20:23

Sécurité renforcée : comment préparer la conformité à…20:56

Le savoir-faire règlementaire international de Cloudfl…20:32

Se protéger et remédier aux Attaques de Messagerie : U…21:48

[Episode en public] Les leçons de résilience d’OVH29:04

[Énergie] La résilience du réseau et sa mesure d'impact19:43

SASE : La fusion du SD-WAN et du SSE décryptée07:42

Quand la cyber-résilience investit l’espace16:31

Sécurité Multicouche : La clé pour une entreprise rési…16:11

Remettre l’humain au centre du cyber-espace16:55

L’IA, super-pouvoir du cyberespace09:39

Les enjeux de sécurité des médias internationaux de la…14:32

L’IA, un atout pour une continuité de service public p…16:50

Une cyber-résilience à l’aune de l’IA et des régulatio…19:25

Tous les Internets se valent-ils ?10:59

Decathlon : une culture agile à l’international20:08

Comment Carrefour a transformé la crise sanitaire en t…12:48

Comment Groupama s’assure d’être résilient face aux cr…13:48

Comment impulser une culture data dans une grande entr…14:17

Hors-série : La data du futur (Volume 1)08:28

Cegid : la tête dans le Cloud22:16

Hors-série : La data du futur (Volume 2)07:30

La data au service des verres intelligents chez Essilo…09:42

La vision conseil de Deloitte sur la data et l’IA19:04

Data altruisme et IA responsable au Crédit Mutuel Arkéa11:54

[BONUS] La Data Responsable : une vision écologique23:08

Silicon.fr L'actualité informatique et high-tech pour décideurs IT

Une loi de Moore pour l'IA ?

Jeux et traduction

Avec o3 et o4-mini, OpenAI mise sur une chaîne de pensée multimodale

De France Travail à la RATP, les leçons du "bac à sable" IA de la CNIL

OpenAI met GPT-4.5 en retrait : que retenir de cette parenthèse ?

Gouvernance des communications : qui se distingue sur ce marché [...]

AWS Summit : le RAG, au carrefour des stratégies GenAI

S’abonner

FFTO : Fiber To The Office ou la haute disponibilité [...]

L'UHD et la Transformation Numérique : Répondre aux [...]

Le grand dîner de Gala de la Communauté

La Matinale Silicon - Zéro Trust

La MasterClass Silicon - NIS2

Silicon.fr L'actualité informatique et high-tech pour décideurs IT

Jeux et traduction

S’abonner

Partager l'épisode