ExposeAnyone: Персонализированные модели диффузии аудио-в-выражение являются надежными детекторами подделок лиц в режиме ноль-shot.

•

Оригинальный автор:Kaede Shiohara et al.

•

5 января 2026 г.

ExposeAnyone: Персонализированные модели диффузии аудио-в-выражение являются надежными детекторами подделок лиц в режиме ноль-shot.

Изображение создано Gemini AI

Исследователи представили ExposeAnyone — метод самообучения для обнаружения манипуляций с глубокими фейками, который использует диффузионную модель для генерации последовательностей выражений из аудиоданных. Персонализируя модели под конкретные субъекты, метод вычисляет расстояния идентичности для выявления подделок. Данный подход превосходит существующие методы на 4.22 пункта AUC и эффективно обнаруживает сложные видео, сгенерированные Sora2, оставаясь при этом устойчивым к искажениям, таким как размытие и сжатие. Это значительно повышает его реальную применимость в области обнаружения подделок лиц.

ExposeAnyone: Прорыв в обнаружении подделок лиц

ExposeAnyone, самонастраиваемая модель, значительно улучшает обнаружение манипуляций с глубокими подделками, особенно неизвестных вариантов. Этот подход использует диффузионную модель для генерации последовательностей выражений из аудио, что позволяет надежно обнаруживать подделки лиц.

Текущие методы полагаются на контролируемое обучение, что может привести к переобучению. ExposeAnyone использует полностью самонастраиваемую структуру, которая персонализирует модель для конкретных объектов через эталонные наборы данных, позволяя вычислять расстояния идентичности между подозреваемыми видео и эталонными объектами, анализируя ошибки реконструкции диффузии.

Метрики производительности

Эксперименты показали эффективность ExposeAnyone на нескольких наборах данных, включая DF-TIMIT и DFDCP. Ключевые результаты включают:

Улучшение на 4.22 процентных пункта в среднем значении площади под кривой (AUC) по сравнению с предыдущими методами.
Увеличенная способность обнаруживать видео, сгенерированные моделью Sora2.
Высокая устойчивость к распространённым искажениям, таким как размытие и сжатие.

Связанные темы:

ExposeAnyoneперсонализированные моделидетекция подделок лицсамообучающийся подходмодели диффузии

📰 Первоисточник: https://arxiv.org/abs/2601.02359v1

Все права и авторство принадлежат первоначальному издателю.

Поделиться статьей

Twitter Facebook LinkedIn WhatsApp Reddit