JUST-DUB-IT : Doublage vidéo par diffusion audio-visuelle conjointe

•

Auteur original:Anthony Chen et al.

•

29 janvier 2026

JUST-DUB-IT : Doublage vidéo par diffusion audio-visuelle conjointe

Image générée par Gemini AI

Des chercheurs ont mis au point une approche novatrice pour le doublage de vidéos, reposant sur un modèle de diffusion audio-vidéo à modèle unique, optimisé par un LoRA léger. Cette méthode permet la traduction en temps réel de l'audio et le synchronisme des mouvements faciaux, en générant des vidéos multilingues avec des transitions linguistiques. Le modèle préserve l'identité du locuteur et la synchronisation labiale tout en améliorant la qualité visuelle, surpassant ainsi les pipelines de doublage traditionnels dans des scénarios du monde réel.

JUST-DUB-IT : Avancées dans la Technologie de Doublage Vidéo

Une nouvelle approche du doublage vidéo, appelée JUST-DUB-IT, s'appuie sur un modèle fondamental de diffusion audio-vidéo pour améliorer la qualité et l'efficacité des processus de doublage. Cette méthode innovante répond aux limitations des pipelines spécifiques aux tâches actuelles qui échouent souvent dans des applications réelles.

JUST-DUB-IT utilise une adaptation à faible rang (LoRA) pour le doublage vidéo-à-vidéo, permettant la génération simultanée de l'audio traduit et des mouvements faciaux synchronisés, améliorant ainsi considérablement l'expérience de doublage.

Les principaux avantages incluent :

Des vidéos doublées de haute qualité avec une fidélité visuelle améliorée.
Une synchronisation labiale améliorée, cruciale pour l'engagement des spectateurs.
Une robustesse face aux mouvements complexes et aux dynamiques du monde réel.

Des évaluations comparatives montrent que ce modèle surpasse les pipelines de doublage existants, offrant une expérience de doublage plus cohérente et réaliste.

Sujets connexes :

doublage vidéomodèle uniquediffusion audio-vidéoLoRA légersynchronisation labiale

📰 Source originale : https://arxiv.org/abs/2601.22143v1

Tous les droits et crédits appartiennent à l'éditeur original.

Partager cet article

Twitter Facebook LinkedIn WhatsApp Reddit