AI
Noticias IA

Detección sólida de noticias falsas mediante modelos de lenguaje grandes bajo ataques de sentimiento adversos

Source:arXiv
Autor original:Sahar Tahmasebi et al.
Detección sólida de noticias falsas mediante modelos de lenguaje grandes bajo ataques de sentimiento adversos

Imagen generada por Gemini AI

Investigadores han desarrollado AdSent, un nuevo marco que mejora la detección de noticias falsas al contrarrestar la manipulación de sentimientos, una vulnerabilidad expuesta por los modelos de lenguaje de gran escala. El estudio revela que alterar el sentimiento impacta significativamente en la precisión de la detección, favoreciendo a los artículos neutrales como si fueran genuinos. AdSent utiliza una estrategia de entrenamiento independiente del sentimiento, superando a los modelos existentes en robustez y precisión en diversos conjuntos de datos.

Nuevo Marco Mejora la Detección de Noticias Falsas en Medio de la Manipulación del Sentimiento

Investigaciones han revelado un nuevo marco, AdSent, diseñado para fortalecer la efectividad de los mecanismos de detección de noticias falsas frente a tácticas de manipulación del sentimiento. Este desarrollo responde a la creciente sofisticación de las estrategias de desinformación que emplean grandes modelos de lenguaje (LLMs) para alterar el sentimiento en los artículos de noticias.

Estudios previos han establecido el sentimiento como un indicador vital para identificar noticias falsas, pero esta dependencia expone vulnerabilidades, ya que los adversarios pueden explotar las señales de sentimiento para eludir los sistemas de detección. Si bien algunas investigaciones han examinado muestras adversarias generadas por LLMs, el énfasis ha estado principalmente en elementos estilísticos en lugar de en la manipulación del sentimiento.

Descripción General del Marco AdSent

  • Atacas Adversarios Basados en Sentimiento Controlado: AdSent genera muestras adversarias que apuntan específicamente a alteraciones del sentimiento, proporcionando información sobre cómo los cambios en el sentimiento afectan el rendimiento de la detección.
  • Análisis de Impacto: Las modificaciones en el sentimiento influyen significativamente en el rendimiento de los sistemas de detección de noticias falsas, con artículos neutrales clasificados más frecuentemente como reales, mientras que los sentimientos no neutrales son a menudo identificados como falsos.
  • Estrategia de Entrenamiento Agnóstica al Sentimiento: AdSent emplea una estrategia de entrenamiento que minimiza la influencia del sentimiento en los resultados de detección.

Rendimiento y Generalización

Extensos experimentos demuestran que AdSent supera las líneas base competitivas existentes en precisión y mejora la robustez, generalizando efectivamente a través de conjuntos de datos no vistos y varios escenarios adversarios.

Temas relacionados:

detención de noticias falsasmodelos de lenguaje grandemanipulación del sentimientoAdSentrobustez de detectores

📰 Fuente original: https://arxiv.org/abs/2601.15277v1

Todos los derechos y créditos pertenecen al editor original.

Compartir este artículo