AI
Новости ИИ

Stream-DiffVSR: Суперразрешение потокового видео с низкой задержкой с помощью авто-регрессивной диффузии

Source:arXiv
Оригинальный автор:Hau-Shiang Shiu et al.
Stream-DiffVSR: Суперразрешение потокового видео с низкой задержкой с помощью авто-регрессивной диффузии

Изображение создано Gemini AI

Stream-DiffVSR представляет собой основанную на диффузии рамочную систему с причинной условностью для суперразрешения видео, что позволяет обрабатывать данные в реальном времени, полагаясь исключительно на предыдущие кадры. В её состав входят четырехступенчатый дистиллированный денойзер и модуль авто-регрессивного временного управления, что позволяет достигать обработки кадров в 720p всего за 0,328 секунды на графическом процессоре RTX4090. Этот метод снижает задержку более чем в 130 раз по сравнению с существующими передовыми технологиями, что делает его пригодным для приложений с низкой задержкой. Более подробную информацию можно найти на странице проекта.

Stream-DiffVSR: Прорыв в области видео суперразрешения с низкой задержкой

Новая структура, Stream-DiffVSR, появилась как решение для видео суперразрешения (VSR) в приложениях, чувствительных к задержке. Сосредоточив внимание исключительно на прошлых кадрах, Stream-DiffVSR значительно сокращает время обработки, одновременно улучшая восприятие качества.

Технические новшества и показатели производительности

  • Четырехступенчатый дистиллированный денойзер, который ускоряет время вывода.
  • Модуль авто-регрессивного временного управления (ARTG), который предоставляет согласованные с движением подсказки во время латентного денойзинга.
  • Легковесный декодер с учетом временных аспектов, оснащенный модулем временной обработки (TPM), для улучшения детализации и поддержания временной согласованности.

На графическом процессоре RTX4090 Stream-DiffVSR может обрабатывать видеокадры 720p всего за 0.328 секунды, что является значительным улучшением по сравнению с предыдущими методами. В сравнении с текущей передовой моделью TMP, Stream-DiffVSR демонстрирует улучшение на +0.095 в оценках LPIPS при сокращении задержки более чем в 130 раз.

Последствия для онлайн-развертывания

Возможности Stream-DiffVSR делают его первым жизнеспособным методом диффузионного VSR для онлайн-приложений с низкой задержкой, что может преобразовать сектора, зависящие от обработки видео в реальном времени.

Связанные темы:

Stream-DiffVSRсуперразрешение видеоавто-регрессионная диффузиянизкая задержкавременная согласованность

📰 Первоисточник: https://arxiv.org/abs/2512.23709v1

Все права и авторство принадлежат первоначальному издателю.

Поделиться статьей