AI
Новости ИИ

Надежное обнаружение фейковых новостей с использованием больших языковых моделей в условиях атак с противоречивыми настроениями

Source:arXiv
Оригинальный автор:Sahar Tahmasebi et al.
Надежное обнаружение фейковых новостей с использованием больших языковых моделей в условиях атак с противоречивыми настроениями

Изображение создано Gemini AI

Исследователи разработали AdSent — новую платформу, которая улучшает выявление фейковых новостей, противодействуя манипуляциям с настроением, уязвимости, выявленной в крупных языковых моделях. В исследовании показано, что изменение настроения значительно влияет на точность обнаружения, что приводит к тому, что нейтральные статьи воспринимаются как подлинные. AdSent использует стратегию обучения, не зависящую от настроения, и превосходит существующие модели по надежности и точности на различных наборах данных.

Новая структура улучшает обнаружение фейковых новостей на фоне манипуляций с настроениями

Исследования представили новую структуру, AdSent, разработанную для повышения эффективности механизмов обнаружения фейковых новостей в борьбе с тактиками манипуляции настроениями. Это развитие является ответом на растущую сложность стратегий дезинформации, которые используют большие языковые модели (LLM) для изменения настроений в новостных статьях.

Предыдущие исследования установили, что настроение является важным индикатором для идентификации фейковых новостей, но такая зависимость обнаруживает уязвимости, так как противники могут использовать сигналы настроения для обхода систем обнаружения. Хотя некоторые исследования анализировали противостоящие образцы, созданные LLM, акцент в основном делался на стилистических элементах, а не на манипуляциях с настроениями.

Обзор структуры AdSent

  • Управляемые атаки на основе настроений: AdSent генерирует противостоящие образцы, которые специально нацелены на изменения настроений, предоставляя информацию о том, как колебания настроений влияют на производительность обнаружения.
  • Анализ влияния: Изменения в настроении значительно влияют на производительность систем обнаружения фейковых новостей, при этом нейтральные статьи чаще классифицируются как реальные, в то время как статьи с ненейтральными настроениями часто идентифицируются как фейковые.
  • Стратегия обучения, независимая от настроений: AdSent использует стратегию обучения, которая минимизирует влияние настроения на результаты обнаружения.

Производительность и обобщение

Обширные эксперименты показывают, что AdSent превосходит существующие конкурентные базы по точности и улучшает устойчивость, эффективно обобщая на ранее не виденных наборах данных и различных противостоящих сценариях.

Связанные темы:

обнаружение фейковых новостейэмоциональный контексткрупные языковые моделиманипуляция эмоциямифреймворк AdSent

📰 Первоисточник: https://arxiv.org/abs/2601.15277v1

Все права и авторство принадлежат первоначальному издателю.

Поделиться статьей