Bard, ChatGPT et leurs limites de raisonnement

Google a doté Bard d'une capacité d'« exécution implicite de code ». Quels sont, en pratique, ses apports face à ChatGPT ?

Publié par Clément Bohic le 12 juin 2023 | Mis à jour le 15 juin 2023 à 10:28

Lecture
5 min

Imprimer

Plutôt que de fournir un calcul, demander d'écrire du code qui pourra résoudre ledit calcul. Ce conseil figure dans le « guide de bonnes pratiques » d'OpenAI pour les modèles GPT.

Google vient d'apporter à Bard une fonctionnalité du même ordre... mais automatisée. Voilà le chatbot officiellement capable de « détecter les tâches computationnelles »... et de générer du code pour appuyer son raisonnement.

Le groupe américain mentionne trois prompts en réponse auxquels Bard va, affirme-t-il, générer du code - et le présenter en complément aux résultats :

Quels sont les facteurs premiers de 15683615 ?
Calcule le taux de croissance de mes économies.
Inverse le mot « Lollipop » [« sucette »] pour moi.

Dans la démo de Google, Bard génère du code Python quand on lui demande d'inverser un mot.

Bard et ChatGPT n'ont pas la même logique mathématique

Testé avec une connexion aux États-Unis (Bard n'est pas accessible depuis la France), le chatbot n'a pas affiché de code en réaction à la question des facteurs premiers. Sa réponse est par ailleurs incomplète.

(On pourra cliquer sur toute image de cet article pour l'agrandir. Ouverture dans un nouvel onglet.)

La réponse de ChatGPT est différente, mais là aussi incomplète.

Sur la deuxième question, Bard génère effectivement des encadrés de type code, mais ces derniers contiennent simplement des formules mathématiques.

ChatGPT ne produit pas de tels encadrés. Et, au contraire de Bard, ne donne pas d'exemple. Il fournit toutefois une formule, plus complexe.

Quand les IA partent... en sucette

L'exercice de l'inversion de mots n'est pas si évident pour Bard et ChatGPT, qui raisonnent par tokens (fragments de mots/phrases).

Dans la pratique, quand on pose à Bard la même question que Google, on n'obtient ni du code... ni la bonne réponse. ChatGPT se trompe aussi.

Bard affiche aussi des encadrés de code - mais là encore, avec simplement des formules mathématiques - lorsqu'on lui demande de factoriser une expression.

Bard affiche parfois le résultat même dans un encart de code. Il a en tout cas procédé ainsi quand on lui a demandé de donner les dix premiers nombres de la suite de Fibonacci en sens inverse. Interrogé en parallèle, ChatGPT a également donné la bonne réponse.

Fantaisies linguistiques

Des encarts de code, Bard en produit aussi en réponse à des problèmes de nature linguistique. Par exemple dans les deux cas illustrés ci-dessous. Le premier : combien de mots (sous-entendu, en anglais) ont au moins trois voyelles consécutives ? Le second : lesquels se terminent par « cly » ?

Sur le premier, les résultats que propose Bard comprennent plusieurs incohérences. Aussi bien une réponse fausse (« zoo ») qu'un mot inventé (« euoi »)... et une fantaisie à propos de « you », qui serait la contraction de « thou » et « art ». ChatGPT n'invente pas de mots, mais ne répond pas non plus correctement.

Le deuxième prompt ne produit globalement pas de meilleurs résultats. Avec Bard, modifier un mot dans l'énoncé (« with » remplacé par « in ») a nettement changé la réponse... néanmoins pas plus pertinente. Le chatbot liste aussi bien des mots qui commencent - et non terminent - par « cly » que des mots qui ne comprennent pas cette syllabe.
ChatGPT interprète quant à lui la question du point de vue phonétique et fournit donc des réponses en « cally ».

Bonus, sans raisonnement mathématique, ni linguistique : qui est roi d'Angleterre ? À nouveau, avec Bard, un mot change tout. Sa réponse est bonne si on utilise le terme « Grande-Bretagne ». Elle ne l'est pas si on utilise le terme « Royaume-Uni » (alors que Charles III en est bien roi).
ChatGPT, lui, donne la bonne réponse... dans son référentiel, qui s'arrête à septembre 2021. Elisabeth II est donc, pour lui, reine d'Angleterre.

Google affirme que cette technique qu'il appelle « exécution implicite de code » a amélioré de 30 % la précision des réponses de Bard sur les « problèmes computationnels » dans ses datasets internes.

À consulter en complément :

10 outils open source sur base GPT pour les développeurs
Quelques méthodes pour tirer le meilleur des modèles GPT
L'IA en est-elle vraiment à un « point d'inflexion » ?
Règlement IA : l'UE face au problème du « temps législatif »
IA : 5 métiers d'avenir à considérer en 2023 et au-delà
RGPD : ChatGPT examiné par la Cnil

Illustration principale générée par IA

Publié par :
Clément Bohic

Tags associés :

#CHATGPT

sponsorisé

Gestion de crises : les leçons d’un DSI

Gestion de crises : les leçons d’un DSI17:35

SNCF Connect & Tech explore toutes les voies de la rés…23:13

D'une mine à la supply chain, de l'OT à l’industrie 4.…22:33

Champs d'application et exigences NIS220:52

Retour d'expérience : mise en œuvre des exigences par…20:42

Comment simplifier la sécurisation de votre réseau tou…20:23

Sécurité renforcée : comment préparer la conformité à…20:56

Le savoir-faire règlementaire international de Cloudfl…20:32

Se protéger et remédier aux Attaques de Messagerie : U…21:48

[Episode en public] Les leçons de résilience d’OVH29:04

[Énergie] La résilience du réseau et sa mesure d'impact19:43

SASE : La fusion du SD-WAN et du SSE décryptée07:42

Quand la cyber-résilience investit l’espace16:31

Sécurité Multicouche : La clé pour une entreprise rési…16:11

Remettre l’humain au centre du cyber-espace16:55

L’IA, super-pouvoir du cyberespace09:39

Les enjeux de sécurité des médias internationaux de la…14:32

L’IA, un atout pour une continuité de service public p…16:50

Une cyber-résilience à l’aune de l’IA et des régulatio…19:25

Tous les Internets se valent-ils ?10:59

Decathlon : une culture agile à l’international20:08

Comment Carrefour a transformé la crise sanitaire en t…12:48

Comment Groupama s’assure d’être résilient face aux cr…13:48

Comment impulser une culture data dans une grande entr…14:17

Hors-série : La data du futur (Volume 1)08:28

Cegid : la tête dans le Cloud22:16

Hors-série : La data du futur (Volume 2)07:30

La data au service des verres intelligents chez Essilo…09:42

La vision conseil de Deloitte sur la data et l’IA19:04

Data altruisme et IA responsable au Crédit Mutuel Arkéa11:54

[BONUS] La Data Responsable : une vision écologique23:08

Silicon.fr L'actualité informatique et high-tech pour décideurs IT

Bard, ChatGPT et leurs limites de raisonnement

Bard et ChatGPT n'ont pas la même logique mathématique

Quand les IA partent... en sucette

Fantaisies linguistiques

À consulter en complément :

Loi omnibus : l'allègement du RGPD se précise

Données personnelles et IA : NOYB menace Meta d'une action collective

Data.gouv.fr : de l'UI à la recherche, un défi d'accessibilité [...]

La concision, facteur d'hallucination chez les LLM

Klarna, chantre de l'IA générative, juge être allé trop loin

S’abonner

Les stations de travail dédiées à votre métier

Future of Work – Transformer le support et [...]

Le grand dîner de Gala de la Communauté

La Matinale Silicon - Zéro Trust

La MasterClass Silicon - NIS2

Silicon.fr L'actualité informatique et high-tech pour décideurs IT

Bard et ChatGPT n'ont pas la même logique mathématique

Quand les IA partent... en sucette

Fantaisies linguistiques

À consulter en complément :

S’abonner

Partager l'épisode