Quelques méthodes pour tirer le meilleur des modèles GPT

Comment améliorer les résultats que fournissent les modèles GPT ? Voici quelques bonnes pratiques issues de la documentation d'OpenAI.

Publié par Clément Bohic le 8 juin 2023 | Mis à jour le 13 juin 2023 à 12:45

Lecture
6 min

Imprimer

Extraire efficacement des connaissances ? Il y a la recherche vectorielle pour ça. En tout cas sur l'API d'OpenAI... qui liste d'autant plus logiquement la technique dans son guide de bonnes pratiques pour les modèles GPT.

Ledit guide se structure à l'image des frameworks de MITRE, qui segmentent l'analyse des menaces de sécurité informatique en « techniques » elles-mêmes divisées en « tactiques ». À ceci près que dans la nomenclature d'OpenAI, on parle, au premier niveau, de « stratégies ». Elles sont au nombre de six :

Donner des instructions claires
Fournir des sources
Diviser les tâches
Laisser « réfléchir » le modèle
Exploiter des outils externes
Tester systématiquement les changements

Délimiter, diviser, contextualiser

Sur la partie « Donner des instructions claires », le premier conseil est le plus évident : mettre des détails et du contexte. Parmi les exemples que donne OpenAI, « Écris du code pour calculer la suite de Fibonacci ». Les résultats seront meilleurs avec un prompt de type « Écris une fonction TypeScript pour calculer efficacement la suite de Fibonacci. Commente le code pour expliquer le rôle de chaque fragment et pourquoi tu l'as codé ainsi. »

On peut aussi demander au modèle de jouer un rôle (persona). Parmi les exemples que donne OpenAI, il y a le suivant, à transmettre en utilisant le rôle system : « Quand je demande de l'aide pour écrire quelque chose, tu répondras avec un document qui contient au moins une blague ou un commentaire espiègle par paragraphe. »

Utiliser des délimiteurs - à renseigner éventuellement, là aussi, par l'intermédiaire du rôle system - est une autre possibilité. Le choix peut être assez arbitraire aussi longtemps qu'on est précis dans les instructions. Dans les exemples qu'OpenAI fournit, des balises XML sont mises à contribution, tout comme des guillemets triples et des mots-clés de type « Titre:»/« Résumé: ».

Autre tactique : préciser les étapes requises pour réaliser une tâche. Cela peut donner un message system tel que :
Utilise les étapes suivantes pour répondre aux commandes
Étape 1 - L'utilisateur te fournira du texte entre guillemets triples. Résume ce texte en une phrase avec le préfixe « Résumé : »
Étape 2 - Traduis le résumé de l'étape 1 en espagnol, avec un préfixe « Traduction : »

Spécifier la longueur de réponse souhaitée peut également aider. Les modèles GPT ont toutefois du mal à se caler sur un nombre de mots. Cela fonctionne mieux avec un nombre de paragraphes ou de bullet points.

Apporter sa propre matière

Pour ce qui est de fournir des sources, OpenAI suggère deux éléments. D'une part, demander au modèle de répondre en utilisant un document de référence. De l'autre, associer à ses réponses des citations issues de ce même document. Dans le premier cas, cela peut donner le prompt suivant, communicable au rôle system :
Utilise les articles fournis, délimités par des guillemets triples, pour répondre aux questions. Si la réponse n'est pas dans les articles, écris « Je n'ai pas trouvé de réponse ».

La fenêtre de contexte des modèles GPT est limitée. La recherche vectorielle se prête ici idéalement à la récupération dynamique d'informations pertinentes par rapport aux questions.

Diviser le travail

Dans le cadre de tâches susceptibles d'occasionner des requêtes très variées, on peut mettre à profit les capacités de classification des modèles GPT pour catégoriser ces requêtes. On aura, au préalable, défini « en dur » une liste de catégories assortie des instructions utiles pour traiter les requêtes relevant de ces différentes catégories.

OpenAI donne l'exemple suivant :
On va te fournir des requêtes de service client. Classe chacune dans une catégorie principale et une catégorie secondaire. Réponds au format JSON avec les clés « principale » et « secondaire »
[Liste de catégories principales et secondaires ; et, pour chacune, les instructions associées]

Ce processus peut aussi être appliqué récursivement pour décomposer une tâche. Chaque requête ne contiendra ainsi que les instructions nécessaires pour réaliser l'étape suivante. Par rapport à une requête unique, cela peut faire baisser autant le taux d'erreurs que le coût.

Une autre tactique incluse dans le guide concerne les dialogues impliquant de longues conversations. Elle consiste à résumer ou filtrer l'historique. Là encore en raison de la fenêtre de contexte limitée. On peut faire en sorte que l'opération se réalise de façon asynchrone, en arrière-plan, pendant la discussion. Ou bien la déclencher lorsqu'on atteint un palier. Par exemple, quand une entrée dépasse une longueur donnée. Ou encore sélectionner dynamiquement les parties les plus pertinentes de l'historique - une solution qui passe à nouveau par la recherche vectorielle.

En miroir, on peut aussi résumer les documents fournis aux modèles GPT. Pour rester sur le modèle récursif, on peut procéder par sections à l'aide d'une suite de requêtes, puis concaténer les résultats... et les résumer.

Faire raisonner GPT

Les modèles GPT savent-ils évaluer la solution qu'un étudiant a donnée à un problème de maths ? OpenAI présente un cas dans lequel ils y arrivent... à condition d'avoir d'abord trouvé eux-mêmes la solution.

Pour éviter que le modèle ne révèle son raisonnement à l'utilisateur, OpenAI recommande la technique dite du « monologue intérieur ». Dans les grandes lignes, le modèle va adopter un format spécifique pour les éléments à masquer, puis procéder à un filtrage avant de présenter les résultats.

Solution dérivée : s'appuyer sur une suite de requêtes dont toutes sauf la dernière masquent leur résultat.

GPT et au-delà

Outre la technique de la recherche vectorielle, OpenAI évoque le « réflexe API » pour faire appel à des services externes. Il en donne l'illustration sur une faiblesse bien connue des modèles génératifs : le raisonnement arithmétique. Option alternative : plutôt que de fournir un calcul, demander d'écrire du code qui pourra résoudre le calcul.

Quant à « tester les changements », OpenAI donne principalement une technique permettant aux modèles GPT d'évaluer leurs réponses par rapport à un standard. L'idée de base : donner au modèle des informations auxquelles il devrait faire référence et lui demander de vérifier si c'est bien le cas. Rien n'empêche d'entrer davantage dans les détails, par exemple en faisant vérifier aux modèles s'ils ont au moins une partie de la réponse.

Photo d'illustration © vladdeep - Adobe Stock

Publié par :
Clément Bohic

Tags associés :

#GPT

sponsorisé

Gestion de crises : les leçons d’un DSI

Gestion de crises : les leçons d’un DSI17:35

SNCF Connect & Tech explore toutes les voies de la rés…23:13

D'une mine à la supply chain, de l'OT à l’industrie 4.…22:33

Champs d'application et exigences NIS220:52

Retour d'expérience : mise en œuvre des exigences par…20:42

Comment simplifier la sécurisation de votre réseau tou…20:23

Sécurité renforcée : comment préparer la conformité à…20:56

Le savoir-faire règlementaire international de Cloudfl…20:32

Se protéger et remédier aux Attaques de Messagerie : U…21:48

[Episode en public] Les leçons de résilience d’OVH29:04

[Énergie] La résilience du réseau et sa mesure d'impact19:43

SASE : La fusion du SD-WAN et du SSE décryptée07:42

Quand la cyber-résilience investit l’espace16:31

Sécurité Multicouche : La clé pour une entreprise rési…16:11

Remettre l’humain au centre du cyber-espace16:55

L’IA, super-pouvoir du cyberespace09:39

Les enjeux de sécurité des médias internationaux de la…14:32

L’IA, un atout pour une continuité de service public p…16:50

Une cyber-résilience à l’aune de l’IA et des régulatio…19:25

Tous les Internets se valent-ils ?10:59

Decathlon : une culture agile à l’international20:08

Comment Carrefour a transformé la crise sanitaire en t…12:48

Comment Groupama s’assure d’être résilient face aux cr…13:48

Comment impulser une culture data dans une grande entr…14:17

Hors-série : La data du futur (Volume 1)08:28

Cegid : la tête dans le Cloud22:16

Hors-série : La data du futur (Volume 2)07:30

La data au service des verres intelligents chez Essilo…09:42

La vision conseil de Deloitte sur la data et l’IA19:04

Data altruisme et IA responsable au Crédit Mutuel Arkéa11:54

[BONUS] La Data Responsable : une vision écologique23:08

Silicon.fr L'actualité informatique et high-tech pour décideurs IT

Quelques méthodes pour tirer le meilleur des modèles GPT

Délimiter, diviser, contextualiser

Apporter sa propre matière

Diviser le travail

Faire raisonner GPT

GPT et au-delà

Agents IA : une taxonomie des protocoles au-delà de MCP

Databricks viserait Neon : vers une autre acquisition OLTP [...]

Trois cas d'usage de l'IA à la Cour de cassation

Chatbot Arena : la remise en cause d'un benchmark IA référent

Process mining : l'automatisation est de moins en moins une option

S’abonner

FFTO : Fiber To The Office ou la haute disponibilité [...]

L'UHD et la Transformation Numérique : Répondre aux [...]

Le grand dîner de Gala de la Communauté

La Matinale Silicon - Zéro Trust

La MasterClass Silicon - NIS2

Silicon.fr L'actualité informatique et high-tech pour décideurs IT

Délimiter, diviser, contextualiser

Apporter sa propre matière

Diviser le travail

Faire raisonner GPT

GPT et au-delà

S’abonner

Partager l'épisode