在对抗性情感攻击下，使用大型语言模型进行强有力的假新闻检测

•

原作者:Sahar Tahmasebi et al.

•

2026年1月21日

Gemini AI生成的图像

研究人员开发了AdSent，这是一种新框架，旨在通过对抗情感操控来提升假新闻检测的效果，这一脆弱性是大型语言模型暴露出来的。研究表明，情感的改变对检测准确性有显著影响，使得中立文章更容易被误判为真实新闻。AdSent采用了无关情感的训练策略，在各种数据集上展现出比现有模型更强的鲁棒性和准确性。

新框架增强假新闻检测应对情感操控

研究揭示了一个新框架AdSent，旨在增强假新闻检测机制对情感操控策略的有效性。此项发展响应了虚假信息策略日益复杂化的趋势，这些策略利用大型语言模型（LLMs）来改变新闻文章中的情感。

先前的研究已将情感确立为识别假新闻的重要指标，但这种依赖暴露了漏洞，因为对手可以利用情感线索来绕过检测系统。尽管一些研究考察了LLMs生成的对抗样本，但重点主要集中在风格元素而非情感操控上。

大量实验表明，AdSent在准确性上超越现有的竞争基准，并提高了系统的鲁棒性，能够有效地在未见数据集和各种对抗场景中进行泛化。