OpenAI dévoile Sora, son nouveau modèle text-to-vidéo

L'inventeur de ChatGPT ajoute un nouveau produit à son catalogue GenAI. Réservé pour le moment à quelques testeurs, Sora est un modèle text-to-vidéo qui impressionne par sa qualité de restitution.

Publié par Philippe Leroy le 16 févr. 2024 | Mis à jour le 2 avr. 2025 à 16:13

Lecture
4 min

Imprimer

Getting your Trinity Audio player ready...

OpenAI a une nouvelle fois secoué la planète GenAI. Après la déferlante ChatGPT, et dans une moindre mesure celle de DALL-E, le nouveau né de la famille OpenAI s'appelle Sora.

« Notre modèle texte-vidéo. Sora peut générer des vidéos d'une durée maximale d'une minute tout en conservant la qualité visuelle et le respect du prompt de l'utilisateur.» explique OpenAI dans un descriptif sur son site, à grand renfort de démonstrations impressionnantes des performances du nouvel outil.

Introducing Sora, our text-to-video model.

Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W

Prompt: "Beautiful, snowy... pic.twitter.com/ruTEWn87vf

- OpenAI (@OpenAI) February 15, 2024

Comment fonctionne Sora ?

« Sora s'appuie sur des recherches antérieures sur les modèles DALL·E et GPT. Il utilise la technique de récapitulation de DALL·E 3, qui consiste à générer des légendes hautement descriptives pour les données d'entraînement visuel. En conséquence, le modèle est capable de suivre plus fidèlement les instructions textuelles de l'utilisateur dans la vidéo générée..» explique OpenAI.

Sora est un modèle génératif de type Transformer à l'instar de DALL-E. Il est aussi capable de prendre une image fixe et de générer une vidéo à partir de celle-ci mais aussi enrichir une vidéo existante avec de nouvelles images.

Prompt: "A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. she wears a black leather jacket, a long red dress, and black boots, and carries a black purse. she wears sunglasses and red lipstick. she walks confidently and casually.... pic.twitter.com/cjIdgYFaWq

- OpenAI (@OpenAI) February 15, 2024

Qui peut utiliser Sora ?

C'est sans doute l'effet déceptif de cette annonce. Contrairement à ChatGPT et DALL-E, l'accès à l'utilisation est réservée à deux catégories d'utilisateurs.

Sora est disponible pour des Red Teams - experts dans des domaines tels que la désinformation, les contenus haineux et les préjugés?-?qui vont tester le modèle de manière contradictoire pour évaluer les zones critiques en termes de dommages ou de risques. D'autre part, des artistes visuels, des designers et des cinéastes vont aussi y accéder pour cerner les attentes des professionnels de la création.

Quand Sora sera-t-il ouvert au grand public ?

OpenAI ne donne aucune date d'ouverture publique et préfère insister sur les gardes fous mis en place avant une large diffusion.

« Nous travaillons avec des Red Teams?-?experts dans des domaines tels que la désinformation, les contenus haineux et les préjugés?-?qui testeront le modèle de manière contradictoire. Nous développons également des outils pour aider à détecter les contenus trompeurs, comme un classificateur de détection qui peut déterminer quand une vidéo a été générée par Sora.» explique OpenAI

Et d'indiquer que les les métadonnées C2PA (Coalition for Content Provenance and Authenticity ). Fondé en 2021, ce consortium, qui compte Microsoft et AWS parmi ses membres, élabore des spécifications techniques pour établir la provenance et l'authenticité du contenu.

La C2PA a livré la version 1.0 de sa norme technique pour la provenance et l'authenticité du contenu en 2021, mise à jour avec la version 1.1 puis 1.2 en 2022. La prise en charge de l'IA générative, de la vidéo et de l'audio en direct font partie des développements à venir.

Quelles sont les limites de Sora ?

OpenAI admet les faiblesses actuelles de son modèle. « Il peut avoir du mal à simuler avec précision la physique d'une scène complexe et ne pas comprendre des cas spécifiques de cause à effet. Par exemple, une personne peut mordre dans un cookie, mais par la suite, le cookie peut ne pas avoir de marque de morsure. Le modèle peut également confondre les détails spatiaux, par exemple en mélangeant la gauche et la droite, et peut avoir du mal à décrire avec précision les événements qui se déroulent au fil du temps, comme suivre une trajectoire de caméra spécifique.»

Comment Sora va-t-il prévenir les dérives liées à son utilisation ?

Outre la collaboration avec les Red Teams ( voir plus haut), OpenAI indique que Sora sera en mesure de « vérifier et rejeter les saisies de texte qui enfreignent nos politiques d'utilisation, comme celles qui demandent une violence extrême, du contenu sexuel, des images haineuses, une ressemblance avec une célébrité ou l'adresse IP d'autrui.»

Image illustration : © OpenAI

Publié par :
Philippe Leroy

Tags associés :

#OPENAI

sponsorisé

Gestion de crises : les leçons d’un DSI

Gestion de crises : les leçons d’un DSI17:35

SNCF Connect & Tech explore toutes les voies de la rés…23:13

D'une mine à la supply chain, de l'OT à l’industrie 4.…22:33

Champs d'application et exigences NIS220:52

Retour d'expérience : mise en œuvre des exigences par…20:42

Comment simplifier la sécurisation de votre réseau tou…20:23

Sécurité renforcée : comment préparer la conformité à…20:56

Le savoir-faire règlementaire international de Cloudfl…20:32

Se protéger et remédier aux Attaques de Messagerie : U…21:48

[Episode en public] Les leçons de résilience d’OVH29:04

[Énergie] La résilience du réseau et sa mesure d'impact19:43

SASE : La fusion du SD-WAN et du SSE décryptée07:42

Quand la cyber-résilience investit l’espace16:31

Sécurité Multicouche : La clé pour une entreprise rési…16:11

Remettre l’humain au centre du cyber-espace16:55

L’IA, super-pouvoir du cyberespace09:39

Les enjeux de sécurité des médias internationaux de la…14:32

L’IA, un atout pour une continuité de service public p…16:50

Une cyber-résilience à l’aune de l’IA et des régulatio…19:25

Tous les Internets se valent-ils ?10:59

Decathlon : une culture agile à l’international20:08

Comment Carrefour a transformé la crise sanitaire en t…12:48

Comment Groupama s’assure d’être résilient face aux cr…13:48

Comment impulser une culture data dans une grande entr…14:17

Hors-série : La data du futur (Volume 1)08:28

Cegid : la tête dans le Cloud22:16

Hors-série : La data du futur (Volume 2)07:30

La data au service des verres intelligents chez Essilo…09:42

La vision conseil de Deloitte sur la data et l’IA19:04

Data altruisme et IA responsable au Crédit Mutuel Arkéa11:54

[BONUS] La Data Responsable : une vision écologique23:08

Silicon.fr L'actualité informatique et high-tech pour décideurs IT

OpenAI dévoile Sora, son nouveau modèle text-to-vidéo

Comment fonctionne Sora ?

Qui peut utiliser Sora ?

Quand Sora sera-t-il ouvert au grand public ?

Quelles sont les limites de Sora ?

Comment Sora va-t-il prévenir les dérives liées à son utilisation ?

Déployer l'IA à l'échelle : l'approche d'AXA, entre vision et [...]

Chez Eiffage, l'IA générative au service des métiers

Avec o3 et o4-mini, OpenAI mise sur une chaîne de pensée multimodale

De France Travail à la RATP, les leçons du "bac à sable" IA de la CNIL

OpenAI met GPT-4.5 en retrait : que retenir de cette parenthèse ?

S’abonner

Briser les barrières de la sécurité en entreprise

The Forrester Wave™: Cloud Workload Security, Q1 2024

Moderniser vos postes de travail grâce à [...]

Il y a des phrases qu’on ne veut plus entendre… [...]

Le grand dîner de Gala de la Communauté

La Matinale Silicon - Zéro Trust

La MasterClass Silicon - NIS2

Silicon.fr L'actualité informatique et high-tech pour décideurs IT

Comment fonctionne Sora ?

Qui peut utiliser Sora ?

Quand Sora sera-t-il ouvert au grand public ?

Quelles sont les limites de Sora ?

Comment Sora va-t-il prévenir les dérives liées à son utilisation ?

S’abonner

Partager l'épisode