
Tu as déjà vu ces vidéos où la caméra semble plonger à l'infini dans une image, comme si l'univers s'ouvrait en gigogne ? C'est ce qu'on appelle une mise en abyme, et aujourd'hui, grâce à l'IA, tu peux la créer toi-même, sans équipe, sans budget de production hollywoodien, et sans maîtriser le montage vidéo professionnel. Dans cet article, je te guide pas à pas à travers le workflow complet que j'utilise : de la composition musicale jusqu'au rendu final.
La mise en abyme est une figure narrative et visuelle où une image contient une version d'elle-même, qui contient elle-même une autre version, et ainsi de suite. Pense à une poupée russe, ou encore à un tableau qui représente la même scène que celui dans lequel il est accroché. C'est donc un effet de profondeur infinie, à la fois vertigineux et poétique.
Dans le domaine de la vidéo, cet effet se traduit par un zoom infini : la caméra plonge dans une image et révèle une nouvelle scène, qui contient elle-même une porte vers ailleurs. Visuellement, c'est hypnotisant. Narrativement, c'est puissant. Et grâce aux outils IA d'aujourd'hui, c'est à portée de main, même quand on fait tout seul.
Ce qui est fascinant avec la mise en abyme, c'est qu'elle n'est pas qu'un effet visuel. C'est en effet une façon de raconter une histoire dans l'histoire, de créer une profondeur narrative avec très peu de moyens. Un personnage dans les yeux d'un autre personnage. Un monde dans un reflet. Une scène qui se révèle à l'intérieur d'une autre. C'est exactement ce genre de storytelling visuel fort qui fait la différence entre un contenu banal et un contenu mémorable.

Tout commence par l'ambiance sonore. Avant même de toucher aux images, pose-toi donc cette question : quelle émotion veux-tu que ta vidéo provoque ?
Avec Suno, tu peux générer une musique originale en quelques minutes. Le principe est simple : tu rédiges les paroles (en français si tu veux, puis tu les traduis en anglais avec Claude ou ChatGPT pour de meilleurs résultats), tu définis un style musical, et Suno compose pour toi.
Voici quelques conseils issus de ma pratique :
Une fois ta musique créée, télécharge-la en format WAV plutôt qu'en MP3. En effet, la qualité audio est nettement supérieure, et ça se sentira dans le rendu final de ta vidéo.
Étape 2 : générer tes images de référence avec Imagen 3
La qualité de ta vidéo finale dépend directement de la qualité de tes images de départ. C'est pourquoi il faut y accorder du soin : une vidéo, c'est une succession d'images, autant que la première soit excellente.
Pour créer les images qui serviront de point de départ et d'arrivée à ton zoom infini, j'utilise Imagen 3 via Nano Banana (l'outil image de Google Gemini, accessible quasi gratuitement tous les jours). C'est donc l'une des meilleures IA d'image du moment, disponible sans abonnement payant.
Voici la méthode que j'applique :
Un détail qui change tout : demande à Imagen 3 de conserver exactement le même style graphique sur les deux images. Cohérence de palette, de texture, de rendu. C'est ainsi que ta mise en abyme sera visuellement convaincante.
C'est ici que la mise en abyme prend vraiment vie. Pour transformer tes images statiques en vidéos avec un effet de zoom continu, j'utilise Seedance via la plateforme Leonardo.ai.
Seedance est aujourd'hui l'une des meilleures IA vidéo du marché pour ce type d'effet. Elle comprend très bien les instructions complexes et, par conséquent, produit des résultats fluides là où d'autres outils peinent à rendre ce mouvement de caméra correctement.
Comment paramétrer ton zoom infini :
Dans Leonardo, va dans la section Vidéo et sélectionne Seedance avec l'option Image Guidance 2.0 pour garder la cohérence visuelle avec tes images de référence.
Utilise ensuite les champs "Start Frame" et "End Frame" : c'est là que tu uploades tes deux images. Pour la première séquence, tu mets l'image de départ en Start et l'image d'arrivée en End. Pour la deuxième séquence, tu inverses les deux. Ce système crée ainsi des transitions naturelles et automatiques entre tes clips - tu n'as donc pas besoin de truquer le raccord au montage, les images se correspondent déjà.
Voici la structure des prompts que j'ai utilisés - à toi d'y insérer ton propre univers visuel :
Prompt pour la première séquence (image de départ) :
Infinite zoom video, Droste effect, no cuts, no transitions.
Camera pushes in slowly toward the character's eyes.
Inside the iris, a detailed reflection of the second scene
is already visible from the start, small but present.
As the zoom progresses, the reflection inside the iris
grows larger and larger, filling more of the frame,
until the reflection becomes the entire image seamlessly.
One continuous infinite movement, no jump, no cut,
slow and hypnotic.
Prompt pour la deuxième séquence (image d'arrivée) :
Infinite zoom video, Droste effect, no cuts, no transitions.
Camera pushes in slowly toward the character's eyes.
Inside the iris, a detailed reflection of the first scene
is already visible from the start, small but present.
As the zoom progresses, the reflection inside the iris
grows larger and larger, filling more of the frame,
until the reflection becomes the entire image seamlessly.
One continuous infinite movement, no jump, no cut,
slow and hypnotic.
Un point important sur le budget : la génération vidéo consomme beaucoup de tokens. Une vidéo de 8 secondes peut ainsi coûter près de 2 000 tokens. C'est pourquoi il faut bien préparer tes prompts en amont pour éviter les essais inutiles - c'est la clé pour maîtriser tes coûts.

Une fois tes deux clips générés, il reste à les assembler. Tu peux utiliser Canva si tu débutes, ou bien Adobe Premiere Pro pour plus de contrôle sur le résultat final.
L'assemblage est simple : tu enchaînes les clips dans l'ordre. Grâce au système Start/End Frame de Seedance, les raccords sont déjà propres - tu peux même, dans ce cas, te passer entièrement de transitions. Si tu veux néanmoins ajouter un léger effet pour un rendu rétro ou cinématique, c'est possible, mais pas obligatoire.
Ajoute ensuite ta musique Suno en dessous, ajuste les niveaux audio, et exporte ta vidéo. C'est tout.
Ce qui prend du temps dans ce workflow, ce n'est donc pas le montage - c'est la préparation en amont : définir sa vision, préparer ses images, rédiger ses prompts avec précision. Une fois cette base solide, le reste s'enchaîne naturellement et assez vite. C'est d'ailleurs le grand avantage de travailler avec l'IA quand on fait tout seul : une fois qu'on a compris la logique, on peut produire des contenus visuellement très forts sans passer des heures en production.
La mise en abyme n'est plus réservée aux studios créatifs avec des équipes entières. Avec Suno pour la musique, Imagen 3 pour les images, Seedance pour le zoom infini et Canva ou Premiere Pro pour l'assemblage final, tu as donc entre les mains un workflow complet pour créer des contenus qui ont une vraie profondeur - narrative autant qu'esthétique.
L'IA ne remplace pas ta vision. Elle la sert. Tu restes ainsi le directeur artistique de ton projet, et c'est précisément ce qui fait la différence entre un rendu générique et quelque chose qui te ressemble vraiment.
Et toi, quel univers tu aurais envie de mettre en abyme dans ta prochaine vidéo ?

Sois le premier à me laisser un commentaire !