AI
Noticias IA

Últimas noticias de IA

¿Están los agentes de IA listos para el lugar de trabajo? Un nuevo estándar genera dudas.

¿Están los agentes de IA listos para el lugar de trabajo? Un nuevo estándar genera dudas.

En un análisis reciente, se está reevaluando la predicción del CEO de Microsoft, Satya Nadella, realizada hace dos años, sobre el potencial de la inteligencia artificial (IA) para reemplazar empleos de oficina. A pesar de los avances en las capacidades de la IA, la esperada sustitución masiva de puestos en sectores como el derecho, las finanzas y la tecnología de la información no se ha materializado como se esperaba. El artículo explora los desafíos y matices de la integración de la IA en estas profesiones, sugiriendo que, si bien la IA puede mejorar la productividad, es poco probable que reemplace por completo el elemento humano que es esencial en el trabajo del conocimiento.

TechCrunch
Escalado de la inferencia NVFP4 para FLUX.2 en GPUs de centros de datos NVIDIA Blackwell

Escalado de la inferencia NVFP4 para FLUX.2 en GPUs de centros de datos NVIDIA Blackwell

NVIDIA se ha asociado con Black Forest Labs (BFL) para mejorar la serie de modelos de texto a imagen FLUX.1. Esta colaboración tiene como objetivo alcanzar capacidades de generación de imágenes FP4, específicamente para la próxima serie de GPUs NVIDIA Blackwell GeForce RTX 50, que se lanzará en 2025. Este avance podría mejorar significativamente el renderizado de imágenes en tiempo real para desarrolladores y creadores que aprovechan gráficos impulsados por inteligencia artificial.

Nvidia.com
CamPilot: Mejora del Control de Cámara en Modelos de Difusión de Video con Retroalimentación Eficiente de Recompensa de Cámara

CamPilot: Mejora del Control de Cámara en Modelos de Difusión de Video con Retroalimentación Eficiente de Recompensa de Cámara

Investigaciones recientes han mejorado los modelos de difusión de video controlados por cámara, abordando las limitaciones en la capacidad de control. El estudio presenta un decodificador 3D eficiente que transforma la representación latente del video y la posición de la cámara en representaciones tridimensionales, optimizando la consistencia a nivel de píxel para lograr una mejor alineación. Este método soluciona deficiencias existentes en los modelos de recompensa y reduce la carga computacional, demostrando su efectividad en los benchmarks RealEstate10K y WorldScore. Para más detalles, visita la [página de CamPilot](https://a-bigbao.github.io/CamPilot/).

arXiv
Escalando Transformadores de Difusión de Texto a Imagen con Autoencoders de Representación

Escalando Transformadores de Difusión de Texto a Imagen con Autoencoders de Representación

La investigación sobre los Autoencoders de Representación (RAEs) indica que son especialmente efectivos en la generación de texto a imagen (T2I) a gran escala, superando a los autoencoders variacionales (VAEs) de vanguardia en diversos tamaños de modelo. Los RAEs presentan una convergencia más rápida, una calidad de generación superior y una mayor estabilidad durante el ajuste fino. Esto sugiere que los RAEs podrían optimizar los marcos de T2I, mejorando así los modelos multimodales que integran la comprensión y generación visual.

arXiv
Robustez demostrable en modelos de lenguaje multimodal grandes a través del suavizado del espacio de características

Robustez demostrable en modelos de lenguaje multimodal grandes a través del suavizado del espacio de características

Se ha propuesto un nuevo enfoque denominado Smoothing en el Espacio de Características (Feature-space Smoothing, FS) para mejorar la robustez de los modelos de lenguaje multimodal grandes (MLLMs) frente a ataques adversariales. FS garantiza un límite inferior certificado en la similitud coseno de características bajo ataques acotados por $\ell_2$. La incorporación del módulo Purificador y Mapeador de Suavidad (PSM) mejora aún más la robustez sin necesidad de reentrenamiento. Los experimentos demuestran que FS-PSM reduce significativamente la Tasa de Éxito de Ataques, pasando de casi 90% a aproximadamente 1%, superando el rendimiento del entrenamiento adversarial tradicional en diversos MLLMs y tareas.

arXiv
Este sistema operativo impulsa silenciosamente toda la inteligencia artificial y la mayoría de los futuros empleos en tecnología de la información.

Este sistema operativo impulsa silenciosamente toda la inteligencia artificial y la mayoría de los futuros empleos en tecnología de la información.

El último artículo de ZDNET destaca que Linux es el sistema operativo predominante para aplicaciones de inteligencia artificial, sin alternativas viables en el horizonte. Actores clave como Canonical y Red Hat son fundamentales en este ecosistema, ofreciendo soporte y herramientas esenciales para el desarrollo de IA. El artículo subraya la necesidad de que las empresas adopten Linux para una implementación y gestión efectivas de la inteligencia artificial.

ZDNet
Una cronología del mercado de semiconductores en EE. UU. en 2025

Una cronología del mercado de semiconductores en EE. UU. en 2025

La industria de semiconductores de EE. UU. experimentó una importante agitación en 2022, caracterizada por cambios en la dirección de empresas clave y un debate en evolución sobre las regulaciones de exportación de chips de inteligencia artificial. Estos acontecimientos subrayan la continua adaptación del sector a las presiones geopolíticas y los avances tecnológicos, lo que está moldeando las estrategias futuras y la dinámica competitiva.

TechCrunch
Alerta de ironía: Se encuentran citas alucinadas en artículos de NeurIPS, la prestigiosa conferencia de IA

Alerta de ironía: Se encuentran citas alucinadas en artículos de NeurIPS, la prestigiosa conferencia de IA

La startup de detección de IA GPTZero analizó 4,841 trabajos presentados en la reciente conferencia NeurIPS en San Diego, revelando que 1,900 de estas presentaciones, lo que equivale aproximadamente al 39%, contenían contenido generado por inteligencia artificial. Esto pone de manifiesto la creciente presencia de la IA en la redacción académica, lo que genera preocupaciones sobre la autenticidad y la originalidad en la investigación. Los hallazgos podrían llevar a la implementación de directrices más estrictas sobre el uso de IA en las presentaciones académicas.

TechCrunch
Estados Unidos y China están colaborando más estrechamente en inteligencia artificial de lo que se podría pensar.

Estados Unidos y China están colaborando más estrechamente en inteligencia artificial de lo que se podría pensar.

Estados Unidos y China están inmersos en una intensa carrera por la supremacía en inteligencia artificial, centrada en los avances en algoritmos, modelos y hardware. A pesar de su rivalidad, la colaboración en la investigación académica sigue vigente, con el intercambio de conocimientos y recursos entre ambas naciones. Esta dinámica presenta tanto oportunidades como desafíos, ya que las preocupaciones por la seguridad nacional aumentan junto con la innovación. El equilibrio entre la competencia y la cooperación podría definir el futuro del desarrollo y la regulación de la inteligencia artificial.

Wired
APPLE: Etiquetado Pseudo-Conservador de Atributos para Intercambio de Rostros Basado en Difusión

APPLE: Etiquetado Pseudo-Conservador de Atributos para Intercambio de Rostros Basado en Difusión

Investigadores han desarrollado APPLE (Etiquetado Pseudo-Atributo Preservante), un nuevo método de intercambio de rostros que mejora la transferencia de identidad mientras mantiene atributos clave como la iluminación y el maquillaje. Al abordar el intercambio de rostros como una tarea de deblurring condicional y emplear un marco de enseñanza-aprendizaje para una mejor supervisión, APPLE ofrece resultados fotorrealistas y establece un nuevo estándar en la preservación de atributos.

arXiv
Hacia la comprensión de las mejores prácticas para la cuantización de modelos de visión y lenguaje

Hacia la comprensión de las mejores prácticas para la cuantización de modelos de visión y lenguaje

Un estudio investiga la efectividad de diversos métodos de cuantización, incluyendo GPTQ y AWQ, en pipelines multimodales que involucran modelos de visión y lenguaje. Los resultados indican que tanto ViT como LLM son fundamentales para el rendimiento, con la cuantización de menor bit en LLM manteniendo una alta precisión. Esta investigación proporciona información valiosa para optimizar la memoria y la latencia en el despliegue de modelos de lenguaje multimodal. El código está disponible en https://github.com/gautomdas/mmq.

arXiv
Detección sólida de noticias falsas mediante modelos de lenguaje grandes bajo ataques de sentimiento adversos

Detección sólida de noticias falsas mediante modelos de lenguaje grandes bajo ataques de sentimiento adversos

Investigadores han desarrollado AdSent, un nuevo marco que mejora la detección de noticias falsas al contrarrestar la manipulación de sentimientos, una vulnerabilidad expuesta por los modelos de lenguaje de gran escala. El estudio revela que alterar el sentimiento impacta significativamente en la precisión de la detección, favoreciendo a los artículos neutrales como si fueran genuinos. AdSent utiliza una estrategia de entrenamiento independiente del sentimiento, superando a los modelos existentes en robustez y precisión en diversos conjuntos de datos.

arXiv