Silicon.fr L'actualité informatique et high-tech pour décideurs IT

Stable Video Diffusion, le concurrent de Sora, adapté au rendu 3D

À partir de son modèle image-to-video, Stability AI a conçu un générateur de rendus orbitaux 3D.

Publié par Clément Bohic le 20 mars 2024 - mis à jour à 13:27

Lecture
2 min

Imprimer

Comment créer un modèle générateur d’objets 3D ? Stability AI a exploré plusieurs pistes.

L’entreprise s’est notamment appuyée sur son modèle Stable Diffusion, générateur d’images 2D à partir de texte. Il en a résulté Stable Zero123, publié en décembre.

S’y ajoute désormais Stable Video 3D. Son socle : Stable Video Diffusion. C’est-à-dire un modèle générant des vidéos à partir d’images.

Un générateur 3D basé sur un modèle image-to-video présente plus de capacités de généralisation, constate Stability AI. Autre avantage : la cohérence temporelle en vidéo se traduit par une cohérence spatiale entre vues.

Stable Video 3D : des versions statique et dynamique

Ces vues sont le résultat de la première étape de traitement : Stable Video 3D prend l’image d’entrée et restitue l’objet sous de multiples angles. Les restitutions peuvent être statiques… ou dynamiques, au sens où on fait varier l’élévation et l’azimut. Intervient ensuite la phase de reconstitution 3D (vidéos orbitales). Un procédé proche de la photogrammétrie.

Pour que le modèle maîtrise les variations d’élévation et d’azimut, on l’entraîne en lui communiquant des « trajectoires de caméra » explicites.

Le pipeline de restitution 3D implique, entre autres, l’usage de la fonction SDS assortie de masques et d’optimisations géométriques (symétrie et séparation des échelles).

Stable Video 3D est disponible en deux variantes, qui produisent respectivement des vidéos orbitales statiques et dynamiques. Son usage commercial nécessite une souscription à la licence Stability AI.

Même exigence pour Stable Zero123, dont la version commerciale a la particularité de n’avoir été entraînée que sur des contenus CC-BY et CC0. La version open source a quant à elle été entraînée sur des objets CC-BY-NC.

Stable Video 3D génère 21 frames de 576 x 576 pixels, moyennant une image de même taille en entrée.

À consulter en complément :

Modèles text-to-video : qui voisine avec Sora d’OpenAI ?
LLM et smartphones : l’exemple MobileDiffusion
Dix questions avant de choisir de la GenAI « sur étagère »

Illustration principale © Tada Images – Adobe Stock

La CNIL face aux limites du chiffrement homomorphe

Par Clément Bohic le 26 mars 2025

3 min.

Quelle infrastructure on-premise pour porter une stratégie IA ?

Par Alain Clapaud le 26 mars 2025

De l'UX à l'AX : penser les interfaces pour les agents IA

Par Clément Bohic le 25 mars 2025

Avec les LLM, peut-on concilier qualité et diversité des réponses ?

Par Clément Bohic le 25 mars 2025

IA et copyright : la perspective d'une norme IETF réconciliatrice

Par Clément Bohic le 24 mars 2025

Livres Blancs

Alcatel-Lucent Enterprise

Sécuriser les solutions de communications unifiées et [...]

Ces dernières années, la majorité des entreprises et administrations ont transformé leurs modes de communication, [...]

Télécharger

Toshiba

Optimisez votre gestion documentaire avec la GED

La transition numérique des TPE et PME progresse surement, encouragée par une succession de réglementations [...]

Télécharger

Aruba HPE

Simplifier l’architecture et améliorer la sécurité

Les responsables informatiques doivent s’adapter aux nouvelles réalités. Les clients et les employés s’attendent [...]

Télécharger

Aruba HPE

Un guide pour sécuriser la connectivité des [...]

Protéger tout et tout le monde sur le réseau afin de répondre aux exigences croissantes de vos innovateurs.

Télécharger

Voir tous les livres blancs

Vos prochains événements

Voir tous les événements

5 juin 2025

Le grand dîner de Gala de la Communauté

Organisé par silicon.fr

Inscrivez-vous

3 juillet 2025

La Matinale Silicon - Zéro Trust

Organisé par silicon.fr

Inscrivez-vous

7 novembre 2024

La MasterClass Silicon - NIS2

Organisé par silicon.fr

REVIVRE EN IMAGES

Voir tous les événements

Inscrivez-vous à la Newsletter pour recevoir les dernières actualités

Abonnez-vous au magazine Silicon et profitez de contenus exclusifs !

Boostez votre expertise professionnelle en accédant aux informations clés de votre domaine.