AI
Noticias IA

Stream-DiffVSR: Superresolución de Video Streamable de Baja Latencia a través de Difusión Autorregresiva

Source:arXiv
Autor original:Hau-Shiang Shiu et al.
Stream-DiffVSR: Superresolución de Video Streamable de Baja Latencia a través de Difusión Autorregresiva

Imagen generada por Gemini AI

Stream-DiffVSR presenta un marco de difusión condicionado causal para la super-resolución de video, permitiendo un procesamiento en tiempo real que se basa únicamente en fotogramas anteriores. Incluye un desnoisador destilado de cuatro pasos y un módulo de Guía Temporal Autoregresiva, logrando procesar fotogramas a 720p en tan solo 0.328 segundos en una GPU RTX 4090. Este método reduce la latencia en más de 130 veces en comparación con las técnicas más avanzadas actuales, lo que lo hace viable para aplicaciones de baja latencia. Para más detalles, se puede consultar su página del proyecto.

Stream-DiffVSR: Un Avance en Super-Resolución de Video de Baja Latencia

Un nuevo marco, Stream-DiffVSR, ha surgido como una solución para la super-resolución de video (VSR) en aplicaciones sensibles a la latencia. Al centrarse únicamente en los fotogramas pasados, Stream-DiffVSR reduce significativamente los tiempos de procesamiento mientras mejora la calidad perceptual.

Innovaciones Técnicas y Métricas de Rendimiento

  • Un desnoiser destilado en cuatro pasos que acelera los tiempos de inferencia.
  • Un módulo de Guía Temporal Auto-regresiva (ARTG) que proporciona pistas alineadas con el movimiento durante el desruido latente.
  • Un decodificador ligero consciente del tiempo que presenta un Módulo de Procesador Temporal (TPM) para mejorar el detalle y mantener la coherencia temporal.

En una GPU RTX4090, Stream-DiffVSR puede procesar fotogramas de video 720p en solo 0.328 segundos, marcando una mejora significativa sobre métodos anteriores. En comparación con el modelo actual de vanguardia TMP, Stream-DiffVSR muestra una mejora de +0.095 en las puntuaciones de LPIPS mientras logra una reducción de latencia de más de 130 veces.

Implicaciones para el Despliegue en Línea

Las capacidades de Stream-DiffVSR lo posicionan como el primer método de VSR por difusión viable para aplicaciones en línea de baja latencia, potencialmente transformando sectores que dependen del procesamiento de video en tiempo real.

Temas relacionados:

Stream-DiffVSRsuper-resolución de videobaja latenciafotogramas pasadosdesruido latente

📰 Fuente original: https://arxiv.org/abs/2512.23709v1

Todos los derechos y créditos pertenecen al editor original.

Compartir este artículo