Silicon.fr L'actualité informatique et high-tech pour décideurs IT

Les choix d'OpenAI pour GPT-4o mini

Un modèle GPT-4o mini rejoint le catalogue d’OpenAI. De la conception à l’évaluation, il a fait l’objet d’arbitrages.

Publié par Clément Bohic le 19 juil. 2024 | Mis à jour le 23 juil. 2024 à 11:54

Lecture
3 min

Imprimer

MMLU, encore pertinent pour évaluer les LLM ?

Hugging Face, qui a récemment revu les fondements de son leaderboard, a choisi d’en écarter ce benchmark référent. Motif : il est devenu « trop simple », certains modèles atteignant le niveau de performance de l’humain. Parfois parce qu’ils ont été (sur)entraînés sur des données contenues dans ce benchmark ou sur des données très proches.

Du côté d’OpenAI, on s’appuie toujours sur MMLU. En tout cas pour vanter les performances de GPT-4o mini. Le « petit dernier » de la maison atteint 82 % sur ce benchmark. C’est un peu plus que Gemini Flash et Claude 3 Haiku.

OpenAI fait la comparaison avec ces mêmes modèles pour le raisonnement mathématique (87 % sur MGSM), le codage (87,2 % sur HumanEval) et le raisonnement multimodal (59,4 % sur MMMU). Le benchmark PyLLMs, entre autres, corrobore les indicateurs avancés. GPT-4o mini y apparaît un peu plus moins rapide que Claude 3 Haiku mais un peu plus précis… et surtout nettement moins cher.

GPT-4o mini, multimodal au minimum

En matière de tarification, on franchit effectivement un nouveau palier. Sur l’API, il en coûte 15 centimes par million de tokens en entrée (l’équivalent d’environ 2500 pages de texte) et 60 centimes en sortie. Soit environ 60 % de moins que GPT-3.5 Turbo… dont GPT-4o mini est le successeur désigné.

Ce pricing vaut pour la modalité texte. C’est pour le moment la seule que le modèle peut produire. Il accepte en revanche les images en input (modalité « vision »), au même prix que pour GPT-4o.

16k en sortie

Par rapport à GPT-3.5 Turbo, la fenêtre de contexte s’agrandit (128k contre 16k). La fenêtre d’output aussi (16k contre 4k). Et les connaissances vont jusqu’à octobre 2023 (vs septembre 2021).

GPT-4o mini est disponible sur les endpoints Assistants, Chat Completions et Batch. Il l’est aussi sur ChatGPT Free, Plus et Team, à la place de GPT-3.5. Sa disponibilité sur ChatGPT Enterprise interviendra la semaine prochaine. À terme, le modèle prend en charge les modalités texte, image, vidéo et audio en entrée comme en sortie, promet OpenAI. Le fine-tuning doit arriver « dans les prochains jours ».

On peut tester GPT-4o mini sur Azure OpenAI Studio, en accès anticipé dans le playground. Il y a des restrictions géographiques (ressources en zone West US3 ou East US) et de volumétrie (10 requêtes max par tranche de 5 minutes pour chaque abonnement). Les filtres de contenu sont activés et non modifiables.

À consulter en complément :

OpenAI livre les clés du cadrage de ses modèles

Illustration © sofirinaja – Adobe Stock

Déployer l'IA à l'échelle : l'approche d'AXA, entre vision et [...]

Par Philippe Leroy le 24 avr. 2025

4 min.

Chez Eiffage, l'IA générative au service des métiers

Par Philippe Leroy le 18 avr. 2025

Avec o3 et o4-mini, OpenAI mise sur une chaîne de pensée multimodale

Par Clément Bohic le 17 avr. 2025

De France Travail à la RATP, les leçons du "bac à sable" IA de la CNIL

Par Clément Bohic le 16 avr. 2025

OpenAI met GPT-4.5 en retrait : que retenir de cette parenthèse ?

Par Clément Bohic le 16 avr. 2025

Livres Blancs

Bechtle Comsoft

Moderniser vos postes de travail grâce à [...]

Découvrez comment moderniser efficacement vos postes de travail en intégrant l’intelligence artificielle (IA). Ce [...]

Télécharger

inmac wstore

Il y a des phrases qu’on ne veut plus entendre… [...]

Je ne vois pas qui est dans la salle » ou encore « Je n’ai pas bien entendu tu peux te rapprocher du micro ?». [...]

Télécharger

Abraxio

Baromètre Abraxio 2025 : Maturité du pilotage de la DSI

Stratégie et gouvernance, budget et pilotage financier, portefeuilles et conduite de projets, gestion des [...]

Télécharger

CELESTE

FFTO : Fiber To The Office ou la haute disponibilité [...]

L’utilisation des services cloud et de SaaS (Software as a Service) est devenu un impératif et s’inscrit dans une [...]

Télécharger

Voir tous les livres blancs

Vos prochains événements

Voir tous les événements

5 juin 2025

Le grand dîner de Gala de la Communauté

Organisé par silicon.fr

Inscrivez-vous

3 juillet 2025

La Matinale Silicon - Zéro Trust

Organisé par silicon.fr

Inscrivez-vous

7 novembre 2024

La MasterClass Silicon - NIS2

Organisé par silicon.fr

REVIVRE EN IMAGES

Voir tous les événements

Inscrivez-vous à la Newsletter pour recevoir les dernières actualités

Abonnez-vous au magazine Silicon et profitez de contenus exclusifs !

Boostez votre expertise professionnelle en accédant aux informations clés de votre domaine.