IA : comment lui apprendre à surveiller son langage ?

Comment assurer une éthique pour les modèles qui produisent du langage naturel ? Une expérience sur GPT-3 propose une approche « light ».

Publié par Clément Bohic le 11 juin 2021 | mis à jour à 12:05

Lecture
2 min

Imprimer

Que faut-il pour donner un « cadre éthique » à des modèles d'apprentissage automatique ? Pas autant de ressources qu'on pourrait le penser. En tout cas d'après une expérience dans le domaine de la production de langage naturel.

Les chercheurs qui l'ont menée se déclarent surpris par le peu de données qu'il a fallu pour réaliser un ajustement comportemental significatif. En l'occurrence, l'alignement de plusieurs versions de GPT-3 (de 125 millions à 175 milliards de paramètres) sur une vision du monde considérée comme acceptable.

Le jeu de données utilisé comprend en tout et pour tout 80 paires question/réponse de 40 à 340 mots (poids total : 120 ko). Ces valeurs prédéterminées couvrent huit sujets « sensibles » allant des opinions politiques à l'activité sexuelle en passant par les inégalités.

L'évaluation avec l'API Perspective donne systématiquement de meilleurs scores pour les modèles entraînés sur ce jeu de données. Aussi bien par rapport aux versions de base que celles entraînées, à titre de comparaison, sur un corpus de qualité (livres et articles Wikipédia) mais non ciblé. La démarche est d'autant plus efficace que le modèle compte de paramètres.

Les résultats sont similaires lorsqu'on demande à des humains d'évaluer les performances. Les plus gros écarts se constatent dans les domaines de la violence et de l'éthique du comportement.

Les chercheurs le reconnaissent : il n'existe pas d'éthique universellement valide. Celle qu'ils ont retenue se fonde sur le prisme occidental - notamment le Mouvement des droits civiques américain.
La question du contexte sociétal s'accompagne d'autres limites importantes. Entre autres :

Comment étendre l'expérience à d'autres langues que l'anglais ?
Qui solliciter pour concevoir le jeu de données ?
À qui la responsabilité d'une production de langage non adaptée aux valeurs de l'interlocuteur ?

Illustration principale © Brandon Romanchuk

sponsorisé

Gestion de crises : les leçons d’un DSI

Gestion de crises : les leçons d’un DSI17:35

SNCF Connect & Tech explore toutes les voies de la rés…23:13

D'une mine à la supply chain, de l'OT à l’industrie 4.…22:33

Champs d'application et exigences NIS220:52

Retour d'expérience : mise en œuvre des exigences par…20:42

Comment simplifier la sécurisation de votre réseau tou…20:23

Sécurité renforcée : comment préparer la conformité à…20:56

Le savoir-faire règlementaire international de Cloudfl…20:32

Se protéger et remédier aux Attaques de Messagerie : U…21:48

[Episode en public] Les leçons de résilience d’OVH29:04

[Énergie] La résilience du réseau et sa mesure d'impact19:43

SASE : La fusion du SD-WAN et du SSE décryptée07:42

Quand la cyber-résilience investit l’espace16:31

Sécurité Multicouche : La clé pour une entreprise rési…16:11

Remettre l’humain au centre du cyber-espace16:55

L’IA, super-pouvoir du cyberespace09:39

Les enjeux de sécurité des médias internationaux de la…14:32

L’IA, un atout pour une continuité de service public p…16:50

Une cyber-résilience à l’aune de l’IA et des régulatio…19:25

Tous les Internets se valent-ils ?10:59

Decathlon : une culture agile à l’international20:08

Comment Carrefour a transformé la crise sanitaire en t…12:48

Comment Groupama s’assure d’être résilient face aux cr…13:48

Comment impulser une culture data dans une grande entr…14:17

Hors-série : La data du futur (Volume 1)08:28

Cegid : la tête dans le Cloud22:16

Hors-série : La data du futur (Volume 2)07:30

La data au service des verres intelligents chez Essilo…09:42

La vision conseil de Deloitte sur la data et l’IA19:04

Data altruisme et IA responsable au Crédit Mutuel Arkéa11:54

[BONUS] La Data Responsable : une vision écologique23:08

Silicon.fr L'actualité informatique et high-tech pour décideurs IT

IA : comment lui apprendre à surveiller son langage ?

Databricks viserait Neon : vers une autre acquisition OLTP [...]

Trois cas d'usage de l'IA à la Cour de cassation

Chatbot Arena : la remise en cause d'un benchmark IA référent

Process mining : l'automatisation est de moins en moins une option

Déployer l'IA à l'échelle : l'approche d'AXA, entre vision et [...]

S’abonner

Briser les barrières de la sécurité en entreprise

The Forrester Wave™: Cloud Workload Security, Q1 2024

Moderniser vos postes de travail grâce à [...]

Il y a des phrases qu’on ne veut plus entendre… [...]

Le grand dîner de Gala de la Communauté

La Matinale Silicon - Zéro Trust

La MasterClass Silicon - NIS2

Silicon.fr L'actualité informatique et high-tech pour décideurs IT

S’abonner

Partager l'épisode